北部湾大学-曙光大数据应用创新中心简介

作者:周彬祥 编辑:张爽 时间:2021-10-20 点击数:

北部湾大学-曙光大数据应用创新中心

 

北部湾大学-曙光大数据应用创新中心结合大数据行业与技术需求,采用分布式结构设计建设,打破信息孤岛,未来将和参与数据中国”百校工程”的各校创新中心进行联网,实现硬件资源、行业应用创新的共享和交互,构建一个物理分离,逻辑统一的“大数据超级平台——Infinity 9000”,发挥运算资源、数据资源、人才聚集的协同优势,提升创新中心及联合体的技术创新与应用能力,服务于高校、服务于北部湾区域、服务于全国。

1、创新中心的建设情况

中心建设遵循校企1:1比例共同建设思路,采用成熟的大数据先进技术,利用高性能的服务器及网络设备建设稳定、高效、可实现集中管控的“大数据应用协同创新系统”,提供大数据教学、科研及行业应用的相关服务。

学校投资500万、曙光共建500万建设大数据平台,与钦州市大数据资源利用重点实验室统一建设投入500万,目前已累计投入1500万元。

创新中心现有大数据平台总的数据存储能力600T,有100个计算节点,提供3000核并行计算能力,GPU提供9984核流处理器,总共10个机柜。

2、科研创新环境

创新中心的科研支撑环境提供有“Xdata生态管理系统”、“Insight智能分析系统”以及“Mining挖掘系统”三大行业级的科研系统。

                   

       Hadoop生态集群可以集成目前市面上各类主流的大数据基础处理技术(工具),同时由多台linux系统主机组成,“Xdata生态管理系统”就是高效的配置、监控这个集群的管理系统。Xdata系统可以训练Java,Scala,Python语言的编程能力;熟练掌握大数据Hadoop生态体系中各个组件的使用;具备有基于Hbase,Hive等数据库、数据仓库的数据挖掘处理能力等;

    “Insight智能分析系统”可以让原本繁琐乏味的数据预处理工作变得简单高效,解决不同数据库、不同类型数据在预处理过程中的苦恼。同时,让枯燥的数据通过丰富的可视化手段进行活灵活现的呈现。Insight系统可以让用户在进行不同实验的数据处理、可视化呈现过程中,真实的去认识数据科学的魅力,训练数据科学的思维,增强对大数据技术的兴趣;

    “Mining挖掘系统”集成了各类主流的机器学习经典算法,可以让不具备深厚算法基础和计算机基础的用户, 在不涉及编程的情况下,采用全流程图形化拖拽操作的方式,快速采用不同的算法进行多次数据挖掘的尝试,省去了数据挖掘中编程、调试的过程,使得数据挖掘的效率得到质的提升。

 

3、生产应用环境

 





I9000系统是一个涉及数据处理全流程的生态平台,提供从数据的提取、处理、存储、应用开发、发布等全流程的完整生态链,并且涵盖生态上各类主流核心组件。I9000系统提供了一个统一的平台,数据科学家、应用程序开发人员和系统操作人员可专注于高价值的任务,而不用花时间在低价值的任务上,例如,维护辅助工具集并将它们以安全的方式与数据源连接。另外,I9000平台还支持数据科学家与应用程序开发人员之间的大规模协作。

 

 

 





I9000系统是基于国际标准研发的,是一个海纳百川的开放平台。它支持多种开放语言架构,如:Java、Python、Scala等;支持多种数据服务,如:MySQL、MangoDB、Oracle等;支持各类部署,如私有云,公有云及混合云等。

 

 

4、相关科研设备设施

图一、中心机房设备设施(一)

图二、中心机房设备设施(二)

说明: ../../Library/Containers/com.tencent.xinWeChat/Data/Library/Application%20Support/com.tencent.xinWeChat/2.0b4.0.9/59ad7bf33a4d047afc63fe61cd93638a/Message/MessageTemp/9e20f478899dc29eb19741386f9343c8/Image/1231511247393_.pic.jpg

图三、科研室设备设施