随着信息技术的深度发展,数据的重要性日益凸显。“数据是宝贵的资产”这一概念在教育领域被广泛提及。教育部在《关于加强新时代教育管理信息化工作的通知》中也着重强调,以数据为驱动力,提升教育管理数字化、智能化水平,推动教育决策由经验驱动向数据驱动转变。
尽管深刻认识到教育数据的重要性,但数据的应用问题仍在不同程度上困扰着诸多高校。对于还在探索数据应用的高校,在前端的数据治理环节就容易遭遇“卡脖子”问题,各部门建设的业务系统各自为政,“数据烟囱”现象严重,难以实现数据的融合、共享及应用。
对于信息化发展态势较好的高校,也面临数据治理成效裹足不前的问题。由于无法实现全量数据治理,学校只能根据当下的应用需求对局部底层数据进行治理。这种“快餐式”的数据治理方式,导致学校在拓展新的应用时,需要重复、多次进行数据治理,数据质量难以保障,应用分析结果存在误差的风险。
为扫清这些数据问题,高校需要建设一套强大的数据中台系统,在为学校持续积累数据资产的同时,有效消除数据壁垒,实现全量数据的治理和共享,为学校的各类需求快速地提供数据服务。
为充分满足各高校的数据应用需求,安博体育基于在大数据领域积累的技术优势与实施经验,为高校提供教育大数据中台解决方案。旨在帮助学校聚合和治理海量异构数据,打造具有资产价值的全量数据底座,能够持续不断地提供多样化的数据服务,满足学校灵活多变的业务需求。
「整体框架」
安博体育教育大数据中台的整体架构主要包括设计统一的数据服务框架和统一的大数据环境。通过帮助学校构建灵活开放的大数据底座,让学校数据资源的整合共享能力和开放服务能力获得极大提升。
统一的数据服务框架,即建立学校数据服务框架。通过规范“数据共享、数据可视化服务、数据分析服务、应用服务与应用开发”的流程,帮助学校构建符合场景需求的数据服务体系并实施落地。
统一的大数据环境,即建设校本大数据环境。平台既能存储和管理不断涌入的海量数据,又能为学校的数据分析、数据挖掘、智慧校园应用提供基础的大数据计算与存储环境,并进行统一管理和运维。
「建设内容」
数据中台的建设,既要满足学校当下的需求,也要立足于学校未来发展需要,做到更强的“扩容性”。为此,安博体育教育大数据中台立足于“可持续发展”的战略高度,为高校构建了一套完善的数据服务体系,充分满足学校当前和未来对数据的应用需求。
(1) 建立数据治理规范标准体系//
不同学校的数据使用情况存在差异,如果通用一套数据标准,容易导致数据难以被充分利用。安博体育的数据治理以各个学校的实际情况为出发点,同时结合教育部标准和学校实际业务需求,帮助学校建立专属的数据项标准体系,真正做到了量体裁衣,“一校一标”,让数据得以被学校高度利用。
此外,教育大数据中台还利用机器化治理工具辅助数据治理,不仅做到了数据字典自动翻译,还实现标准转换自动映射。平台可通过历史治理经验进行数据项标准自动转换,协助学校完成“校标”的建设,解决数据转换过程耗时长、转换不规范等问题,保障不同项目实施的落地效果。
▲机器化治理平台
(2)全量数据标准化与共享//
安博体育教育大数据中台拥有成熟的数据治理平台,不仅根据教育部标准规定的数据子集进行集成,还将学校现有的所有数据进行全覆盖,实现学校数据全量覆盖及全量共享,扩大数据服务范围。
平台还采用分布式数据交换框架,实现高并发的同构数据、异构数据之间的数据抽取、格式转换、同异步传输、动态部署、可视化管理监控等功能,为学校未来5-10年的应用提供稳定的底层支撑。
(3)全方位数据质量监测//
数据质量的优劣是影响数据分析结果的重要因素之一。在提升数据质量方面,教育大数据中台形成了完善的数据质量监测机制。通过建立覆盖数据检测规则制定、数据质量检测计划制定、数据质量报告生成、异常数据处理的监测机制,全方位保障数据质量。
▲系统质量报告&分析
此外,在数据质量管理方面,平台还支持对表进行质量检查,同时生成数据质量报告,并将数据质量反馈给相关部门,让其清晰了解数据情况。以此形成学校常态化数据治理体系,推进学校数据质量稳步上升。
(4)重构数据共享交换流程//
平台通过帮助学校重构数据共享机制,实现数据的有序流转。采用建立信息资源目录的创新模式,对学校真实可用的数据资源进行清单展示,实现学校各部门数据资源的自助共享,提供如网购般的数据服务体验。
▲资源目录
▲数据交换概览
截至目前,安博体育教育大数据中台相关产品已服务全国500多所知名高校,包括985/211高校50所,本科高校100余所,位居教育行业前列。
其中,北京大学、武汉大学、西安交通大学、复旦大学、中山大学、东南大学、西南大学、暨南大学、中南大学等知名高校均已应用该系列产品。据了解,安博体育数据中台为高校创下每日100倍数据交换量的佳绩,深受高教行业用户青睐。
▲数据总览示意图
此外,平台还拥有行业领先的算法模型训练体系,支持机器学习实践。目前,安博体育已从众多高校的落地经验中形成了多达4233种算法模型组合应用,包括学生画像、成绩预测、精准资助、心理健康分析等,广泛应用于学校学工、就业、财务、教学、诊改等职能处室。其模型准确度也达到了业界标杆水平,如北京师范大学的心理健康模型、西安交通大学的精准资助模型、中国海洋大学的学科分析模型以及陕西铁路职业技术学院的诊改专有模型等,这些算法模型的准确度均取得用户的高度认可。
大数据时代的大幕在教育领域正徐徐拉开,越来越多高校躬身入局,为充分发挥数据效益展开积极探索。在高校构建以数据驱动的现代化教育体系的道路上,教育大数据中台将成为其中重要的助推器。教育大数据中台通过构建从采集、整合、共享到应用的数据生态,形成贯穿全校教学、管理、服务的大数据枢纽,将有效助力高校信息化迎来发展新格局。