大数据时代教育改革“靶向治疗”来了?

2016年03月30日 来源:中国教育报
二维码
用微信扫描二维码
分享至好友和朋友圈

数据的失真失实是大数据时代必须面对的问题

记者:人们经常说:用事实说话,用数据说话。但是,数据等于事实吗?教育大数据和教育事实是什么关系?

江青:教育大数据是对教育客观的逻辑归纳,是对与之相关的未经加工的原始素材进行采集、处理、研究、应用的一系列工作。教育大数据做好了,可以客观反映教育事实,呈现教育现象,给教育改革提供决策参考。

戚万学:数据与事实并非是完全一一对应的,它们可能有一致性,也可能存在相悖的结果。著名的辛普森悖论就启示我们,数据有时候并不能反映事实。教育大数据是从教育实践中搜集的有关教育活动、现象等原始材料,根据使用数据人的目的按一定的形式加以处理,找出其中的内在联系,从而反映教育事实。相比传统“小”数据,教育大数据在大规模在线学习、学习者模型、教学者模型等研究中,体现出更加贴近事实的优势。应该说,随着更多数据的收集、处理和分析,我们对世界的认识将更趋复杂、更加精确。

记者:前不久,“今日头条创始人张一鸣炮轰艾瑞数据失实”的事件引起了人们的关注。怎样才能保证教育数据采集的数据客观、不失实?

江青:应该说,获得相关数据并不是一件容易的事。对于大学阶段的学生而言,数据的收集并不是主要问题。然而,对于中小学阶段的学生而言,挑战却很大,因为有些数据的收集存在法律问题,有的则存在伦理道德(隐私)的问题。

数据收集者的人数和技能也是一个问题。数据的采集需要通过特定的渠道,互联网数据需要用技术手段获取,通常通过网络上的小型文本文件来收集用户的相关信息,但是对于教育部门而言,则需要依赖于全国众多学区和研究者的网络来提炼和确认数据。

戚万学:数据的失真、失实是大数据时代必须面对的问题。对科学研究来说,数据的真实可靠是研究的生命和价值之所在。数据在采集的过程中,会由于教育数据的层次不同而发生变化。根据数据采集手段的不同,可以把教育大数据分为基础层数据(如每年的学校招生情况、教育经费情况等)、状态层数据、资源层数据(非结构化数据)、行为层数据(财务报销、学生写作业等)。这些数据大部分是在教育过程中自动生成并被记录下来的。

与基于有限数据的小数据预测本身存在的不确定性相比,大数据时代的预测精确度要远远超过现在。同时,大数据技术下数据的自然生成、对数据的全样本采集、传感器收取、射频识别等全新采集手段的应用,也都可以保证研究者所获得的信息更加真实。但相比精确度,大数据更加追求的是效率,在海量的数据面前,放弃一些微观层面的精确,会得到宏观层面更高的效率。

核心挑战在于数据分析处理及结果的可视化呈现

记者:在这些数据采集的过程中,如何保护被采集对象的个人隐私?

戚万学:有时候,通知被采集对象会导致一些人为的、刻意的装饰,反而会影响数据的真实性。教育大数据和其他领域大数据的区别在于,它们涉及的更多是教育环境下教师和学生个人发展和专业成长的一些信息,因此,不征得数据采集对象的允许并不意味着数据乱用,在数据运用的过程中,我们要特别注意保护被采集对象的隐私。大数据这种对学生隐私的挑战,需要在数据采集过程中保护被采集人的敏感信息,使其保护自身隐私的权利得以行使。美国联邦政府2014年推出的《在线教育服务指导》提出,只有在满足《学生权利保护修正案》和《家庭教育权利与隐私法》的情况下,学生的数据才能被学校和学区所采集。所以,借鉴美国的做法,我国可以出台涉及教育大数据的隐私安全的相关政策或法律法规。

江青:数据采集的过程会涉及方方面面,对事关隐私的数据当然要考虑当事人的意愿,我们提倡对于收集到的数据进行加工,生产出具体数据产品,而不是直接将教育具体数据对外公开。当然,采集和拥有数据的机构也需要加强法律意识,加强技术保护措施。

记者:对采集到的教育大数据,应该怎样进行科学分析、应用?

戚万学:在教育大数据应用方面,其核心挑战就在于数据的分析处理及结果的可视化呈现等方面。教育大数据是客观的,而分析与应用是主观的,在数据的分析与应用中如何平衡两者的关系是一个十分关键的问题。

对教育大数据进行分析,需要从大量数据中进行提取与挖掘。在这个过程中包括数据的清理、数据选择、数据变换、数据挖掘、模式评估和知识表示等。这些分析环节的每个构成都应成为数据分析研究的重要内容,从而最大限度地保持与还原客观事实。

江青:过去十几年里,教育领域的技术发展陷入了停滞,研发投入远远不够。教育技术未来发展的关键在于数据。美国教育部门对大数据的运用主要是创造了“学习分析系统”,旨在向教育工作者提供学生到底是“怎样”学习的更多、更好、更精确的信息。

教育大数据一定要落地应用。例如,根据不同的需求调用某教育部门各套系统的数据,结合外部其他单位的数据,教育管理部门可以利用大数据优化教育资源配置,提高教育水平,引导学生成长,共享学习资源。教育大数据可以帮助教育管理部门建立“数字教育地图”,助力教育资源布局优化;建立“智慧教育平台”,助力教育成果管理;建立“绩效评价系统”,提升教育科研创新力。



上一页 [1] 2 [3] 下一页