随着大数据在社会各行各业产生的影响不断加深,“大数据”+教育的发展与应用也逐渐成为教育研究者、教育工作者以及教育机构关注的焦点。分析与挖掘教育教学过程产生的海量数据资源,将其转化为有意义、有价值的教学信息与知识,是教育大数据的价值所在。
国务院2015年8月31日印发的《促进大数据发展行动纲要》的通知,提出要“推动教育基础数据的伴随式收集和全国互通共享;探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用”;教育部办公厅2015年9月2日印发的关于征求对《关于“十三五”期间全面深入推进教育信息化工作的指导意见(征求意见稿)》意见的通知,指出“要实现学生学习过程、实践经历记录的网络学习空间呈现;依托网络学习空间逐步实现对学生日常学习情况的大数据采集和分析,优化教学模式”。
世界万维网之父蒂姆·伯纳斯·李曾经说过:“数据是宝贵的,它的生命力比收集它的软件系统还要持久。”众所周知,教育教学过程产生的海量数据蕴藏丰富的与教学密切相关的知识与信息,那么,如何将这些含有巨大价值的教育数据资源转换成有意义的教学信息与知识,从而优化学习效果,提升教学质量,促进个性化学习的实现,是目前教育领域内亟待解决的重要问题。
为了能够从零碎的、多源的、低质量的海量教育数据资源中提炼完整的、高质量的、高价值的信息与知识,本研究从大数据的角度出发,以数据收集、数据存储与管理、数据清洗与整合、数据分析和数据可视化的一般大数据分析流程为基础,探讨了原始教育大数据资源经历采集、量化和质量提升的环节转换为有效的教育大数据资产,再经过分析与可视化处理,将教育大数据资产转换成教育大数据价值,最终成功提取教育大数据隐藏的潜在价值。
1、数据收集
近年来,MOOC等网络学习平台的快速发展与普及,使教学与学习方式发生巨大改变,随之而来的海量教育数据的种类也日益广泛,不仅包含课堂教学信息、学生学籍信息、学校管理信息等传统教学数据源,还包括各类网络学习平台、移动学习APP、浏览器等互联网数据源。杨现民等学者认为教育大数据有四大来源:一是教学活动过程中直接产生的数据,二是教育管理活动中采集到的数据,三是科学研究过程中采集到的数据,四是校园活动中产生的数据。
目前大数据在教育领域的应用价值大多数集中于对教育教学过程产生的相关数据的分析与挖掘,因此,需要收集的教育数据主要是与教育教学相关的全部数据,如传统课堂教学数据、在线学习数据、移动学习数据等等。由于数据来源的多样化、复杂化,所收集的数据多是格式不一、大小不等,为了保证数据的一致性与同一性,将数据按照结构化数据、半结构化数据、非结构化数据进行分类。
2、数据存储与管理
为了保证数据的时效性与完全性,将收集到的海量数据进行存储与管理。目前,大多数学校收集的教育数据资源大部分都是异构的,且多数是属于半结构化数据或者非结构化数据,这就给教育大数据的存储与管理带来了困难,传统的结构化数据仓库已经不能满足当前教育数据资源的需求。NoSQL(NotOnlySQL)是基于云计算环境下发展起来的非关系型的数据库,它具有易伸缩性、可扩展性的特征,支持Key-Value存储、列存储、文档、Graph等数据模型,能够很好地利用云计算系统的并行计算技术解决教育数据资源的存储与管理难题。
3、数据清洗与整合
存储在数据库中的海量数据是没有遵循一定数据规则的,数据之间也充满着混乱和矛盾,这样的数据资源如果不经过清洗与整合将会成为无任何价值的数据垃圾,因此,为了防止数据垃圾问题的出现,有必要对数据库中的教育数据资源进行清洗和整合。数据整理过程中,首先需要利用过滤技术对数据集进行过滤,以去除干扰和冗余数据;之后对数据集进行聚类和关联规则的处理,使数据按照一定的标准整合在一起,有规则地存储于数据库中。经过整理和清理的教育数据资源,不仅其数据质量得到了提升,数据的关联性与合规性得到了保障,而且完成了教育大数据资源到教育大数据资产的转化,为数据能够进行高效快速地分析提供了可靠的依据。
4、数据分析
数据分析作为大数据在教育领域应用中最核心的环节,是教育大数据直接产生价值的一部分。通过对教育大数据进行分析可以将存储在数据库中的海量数据转换成有价值、有意义的教学信息与知识,同时还可能会揭示教育教学中蕴含的学习规律。在教育大数据分析方面,常用的关键技术包括学习分析技术和教育数据挖掘两大类,Lián和Pérez在研究教育数据挖掘与学习分析技术之间的异同时指出这两者之间可以运用共同的技术方法对教育教学数据进行分析,从而发现教育教学中存在的问题。教育大数据分析的过程实际上是将教育数据资产转换成教育数据价值的关键性环节,成功实现了从数据世界中提炼出知识与信息,然而其最终呈现在用户面前的分析结果则需要进一步借助可视化技术来完成。
5、数据可视化
通过对教育大数据进行的数据收集、数据存储与管理、数据整理和数据分析等环节而得到的分析结果是机器语言的形式,还不能被教育管理者、教师、学生等相关用户认可和接受,这就需要进行教育大数据分析的最后一个环节,即数据的可视化。利用可视化技术将教育大数据分析得到的结果以图形、表格、图画等可理解的形式呈现给用户,可以辅助教育管理者作出更为科学、智能的教学决策,帮助教师发现存在学习危机的学生,并向其发出学业预警信号、提供适当的教学干预,同时依据学生不同的学习需求为其推荐个性化的学习资源,促进个性化学习的实现。数据可视化环节的完成标志着教育大数据价值的成功提取。
总结
“数据驱动教学,分析变革教育。”通过分析与挖掘教育大数据的潜在价值,推动教育决策的科学化、教学方式的多样化、教学效果的最优化,促进教学质量的提升,实现真正意义上的个性化学习。本研究依据教育大数据分析的一般流程,从大数据视角阐述了海量教育数据资源化、资产化的过程,揭示了教育大数据背后隐含的巨大教学信息与知识,有助于教育大数据潜在价值的分析与挖掘,有利于充分发挥大数据在教育领域内的作用,以促进教学方式的变革,提升教学质量。