以”银河超算大数据平台”为大数据计算存储平台,通过“观星台”作为业务分析展示平台。”银河” 采用Hadoop架构,配置NTP服务器,安装CDH、MySql数据库、Flume、 Zookeeper、 Hive、 Spark等组件。
根据高校业务系统的使用情况以及数据中心建设需求,对业务系统数据进行调研和分析,输出《数据质量评估报告》,确定数据治理优先级和具体解决方案。
数据标准包含了高校共享数据中心会涉及的所有基础数据的编码规范,具体有教学管理、行政管理、财务管理、科研管理、资产管理、学生管理等各方面有关的各类基础数据。
数据采集分为结构化数据和非结构化数据通过自主研发的ETL工具对业务数据进行采集、分析、加密和封装。
数据处理包括数据清洗、治理等工作,检查数据一致性,处理无效值和缺失值。对残缺数据、错误数据、重复数据进行治理。
应用服务器调用Hive集群、Hbase集群、Hadoop集群、MySql集群、Redis集群、ElasticSearch集群以及MongoDB集群的数据在前端图标报告进行展示。