首页 >> 科学研究 >> 学院设备 >> 正文

大数据与内容安全平台

作者:       发布: 2018-05-30      来源:

打印

序号

设备名称

主要性能指标

1

超大规模GPU集群

配备了4块Tesla V100显卡,系统双精度计算峰值可以达到480TFlops,拥有480T的深度学习性能,相当于100个服务器的性能。预装了高性能计算的系统和软件,开机后只要经过简单设置,就可以用Caffe、TensorFlow等做深度学习的训练(比如图像及语音的识别)、又或者是高精度图像的渲染、科学计算等传统HPC应用,不需要自己再去装驱动、配置环境,很适合高校、研究所、以及IT力量相对薄弱的企业。

2

服务器互联交换机

L3交换机,至少48个100/1000BASE-T端口,支持4个10G/SFP+端口,支持40G QSFP+端口,支持SDN openflow

3

企业级虚拟存储系统

Lenovo Storage

V5030是混合存储解决方案,它以Spec-trum

Virtualize™软件为核心,可以提高性能、虚拟化功能和灵活性。Realtime

Compression™和Easy Tier®技术等可选高级特性可显著提高效率和性能。为企业提供高级功能和灵活性的混合磁盘阵列存储系统。它拥有32G缓存4个16GB光纤接口,124块300G 10K 2.5英寸小盘机,可将数据压缩多达80%,从而支持在相同的物理磁盘空间内存储多达5倍的数据。通过HyperSwap技术,简化了传统容灾方案的架构,提升了数据存储的安全。

4

智能语音识别与合成系统

智能语音系统,支持中文的语音到文本的自动转换,中文文本到语音的转换,中文语句的语音合成。音频长度(Input Length)≤60s,采样率(Sampling Rate)支持8KHz和16KHz,采样精度(Bit Depth)16bits。

5

文本语义分析系统

支持中英文语言文本数据的分词,速度:176.91k/s;词性标注,106.14k/s;命名实体识别,运行时内存:21m;、依存句法分析,二阶利用子孙和父子信息;语义角色标注,速度41.1 sent./s;语义依存分析。

6

网络流量回溯分析设备

高性能、高集成度数据包采集和智能分析硬件平台,网络通讯数据包级的高性能实时智能分析,能够实时捕获并保存网络通讯流量,具备对长期的网络通讯数据进行快速数据挖掘和回溯分析能力。单台设备网络流量处理能力不小于160Gbps,支撑特定类型的文件还原功能。

7

商业智能软件

数据处理分析、经典GUI可视化数据、报表

8

数据可视化软件

数据分析,WEB可视化工具

9

互联网舆情分析子系统

可实现对特定人群的特定关键字监测,同时,通过对采集的网页信息进行语义、语境数据分析,可实现特定言论或关键字的传播分析。内置TF/ID F、word2ver、SVM、卷积神经网络等多种分类算法;综合考虑网站的标题、正文、域名、链接关系、图片内容等多种元素,优于纯粹的文本分类;提供了基于TensorFlow的分类算法实现。

10

互联网分析子系统(APP&URL)

(1)对互联网上传播的APP进行深度检测,具备静态API检测、动态沙箱检测以及机器学习检测引擎等能力,采用多种方式提取可以反映Android恶意程序行为的特征,包括敏感权限、敏感API函数调用序列、文件名字符串、So文件名称、文件大小以及文件权限特征。通过XGBOOST进行二分类判断黑白,通过卷积神经网络和K-means聚类进行多分类识别家族,通过异常检测发现未知类型的黑样本,多种算法的结果互相印证。识别结果经验证后可加入样本集迭代训练,实现模型的在线更新。能够识别的恶意APP行为包括恶意扣费、信息窃取、远程控制、恶意传播、资费消耗、系统破坏、诱骗欺诈、流氓行为、钓鱼仿冒等。

(2)对互联网上的URL进行深度检测,识别违法违规网站。具体功能包括数据筛选模块、页面提取模块、模型算法模块、规则管理模块、IP检测模块、ICP检测模块、域名监测模块以及举证模块。能够识别的非法URL种类包括赌博、色情、博彩、仿冒、钓鱼、暴恐、盗版以及其他违法违规网站。