大数据生态:教育大数据生态解析

一直希望与读者们分享多年来在大数据领域学习、采访、总结、归纳的一些要点的SPN睿商在线的资深编辑们,由于大数据还处于前期发展期,因此并不能像一些成熟的硬件产品线那样,给大家相对成熟的理论。因此,我们期望通过更多的大数据行业实践,试图与读者能够更为直观地分享什么是大数据?大数据落地会有哪些具体方向?技术实现如何搭建?同时期望能够得到读者们的真知灼见和意见建议。

本期大数据生态,SPN头条为教育行业增值商的软件服务路,与之相应,本期大数据生态也期望通过北京师范大学教育技术博士高步云在大数据教育领域的一些具体应用的心得,以便更好地和读者探讨目前教育领域的一些基本情况。本文来源于中关村大数据产业联盟的大数据100分论坛。

高步云:

按照年龄的划分规则,我们一般把0-6作为一个阶段,小学到高中作为一个时段,称为K12,高中毕业之后作为一个时段。

按照时间是一种划分,按照商业模式可以划分的更细。但是最重要的划分,按照中国特色,其实是体制内和体制外的划分,也就是我们常说的教育行业vs培训行业。

这是两个不同的领域。在不同的领域里,数据运用的基础、现状和未来发展方向,都不尽相同。

除了补充一下领域划分的背景,还需要探讨一下“场景”和“流程”这两个最基础的问题。

流程其实很简单,就像把大象装进冰箱一样,分三步:

1.数据的获取(含数据整理和存储)

2.数据的分析

3.数据的呈现

每个步骤,在不同的场景下,都是不一样的。

如果把场景设定在 1、公办 , 2、k12这个场景中,很少产生数据。

1.教育领域的原有数据模式简析:

国家教育统计年鉴,各地市州的教育局,各个高校数据,国家教育研究机构的数据;

2.对“官办教育体系”原有数据体系的一些点评:

活性差:时间,粒度粗,没人用,体系不通,数据孤岛严重。

原有的官办数据并不是“学习”数据,而是“教学”管理数据。

在这个领域的数据,即无法保持 “在线”,又缺少“活性”,最后,除了给领导做报告,教育部里做“规划”之外,很少有其他直接提升教学本身应用的有效数据。

如果从这个角度来说,整个中国教育领域,其实是远没有IT化的,也就更谈不到互联网化。信息孤岛严重,各部门数据割裂严重。当然,现在也有一些有益的尝试,我举几个例子:

首先是大家看到中小学生学籍卡管理系统,这就是很大的一个工程。

最早是上海在推,然后是北京推的,后来全国其他各大城市陆续上马。这个学籍卡基本上解决了中小学生转校时,成绩、学籍管理的问题。大家小时候每学期都要拿个小红本,让老师写评语吧。现在很多地方,这个已经电子化了,就算你转学走了,你的考试成绩和评语会被带着走。这对教育领域来说是个很大的进步。尽管在其它行业看起来这没啥难度。

这个小例子,就当做课前秀吧。基本上说明了现在教育领域的数据应用现状。我们最大一个数量的学习者,都被困在数字禁区,有些初高中为了保证成绩,是禁止孩子们用手机等电子设备的。

在这个领域想做出成果,首先还是要体制发生改变。当然,在体制不变的情况下,也有了不少有益的尝试。首先是刚才说的教育管理数据,这部分数据是由上层主管机构在推动的。

再说说和学生学习相关的数据。

从刚才说的三点:获取、分析、呈现,这三个角度来说。

获取的手段现在有所突破,主要的技术是各种传感器整合,有点像物联网,做成系统集成方案就叫 “智慧教室”现在非常热的一个方向。

理论上说,未来的智慧教室,不但能从物理的角度方便大家自动分组——对应协作式学习,自动展示——翻转课堂。其实也就是桌椅板凳组合灵活,电子显示灵活等等,有点工程学的意味。除了这个,最重要的就是各种自从传感器记录学生的行为,并实时分析。

现在台湾有个教授研究的智能椅垫就比较有意思,学生坐在这个垫子上,就会自动记录他的压力分布,从而分析出他是否注意力集中等等。这是一个具体的应用,剩下还在研究的比如和模式识别相关的,通过摄像头和传感器的实施分析,捕捉每个孩子的学习状态。这些数据的分析,就涉及到我研究的课题:学习分析学了。

这个等下再说,咱们继续说数据获取这块,尤其是学习数据获取。

其实智慧教室获得的数据更多是生理数据,而真正的学习交互数据,更多的靠电子教材,电子题库等等。在这方面,苹果的研究已经很成功了。基于ipad的教学小组授课越来越多。我们北师大和人大附中的西山分校就曾经搞过一个苹果实验班。课件直接灌到ipad里,用小车放门口,孩子们进门的时候人手拿一个,现在还只存在教材上。未来如果把 考试、练习,这两个环节打通,把 考 学练,三点一线串起来,那么这个设备对数据的获取和呈现就很棒了。

第三,刚才说了智慧教室,电子教材,最后一点未来应用是可穿戴设备。

说完了数据的获取,咱们再说说数据的分析。

现在学习分析学非常热,其实原理和Netflix生产纸牌屋差不多。对停留时间,反复程度做个简单分析,基本上就能定位一个学习难点。在这里我补充一点学习分析的“场景”依然很重要还是从 “考学练”三字经上说,考试,这个场景是最准确的。学习分析学很热,但是没啥新东西,基本的就是BI以前用过的技术,还有语义分析,机器学习等等。

但是他不同的是背后的学习心理学支撑,以及不同的场景,分析时参数设定也不同。

最后,说说数据的呈现。

呈现这里面最重要的课题是“自适应学习”。其实这是和上面的学习分析学一脉相承的,也是就说,后台分析出来你那块需要加强,那么考学练配套的部分也就自动加强。

考,这一部分还是最容易的,其实之前很多地方已经有这种技术,托福考试的机考某种程度上说也是自适应调整。

练,其次,一般效果是根据之前的数据积累,以及对上一道题的分析,出下一道题。

学,最难,涉及到学生综合素质评测的问题,是个综合结果。

智慧教室的成本目前来说还可以承受,硬件成本其实不高,但是系统集成成本高。设备都是原有哪些,比如电子白板,pad等。

接着说评测系统,这部分软件比较难,而且目前的难点是数据收集,就像我说的,其实我们并不知道在课堂上发生了什么。

目前来看,做考试类大数据应用和设备是最靠谱的。练习其次,学习最难,基本不靠谱。

接下来和大家说说体制外,也就是培训市场的。这里做的最好的是互联网教育机构。他们天生有数据基因,但是从投资人的角度来说,我看“培训”,注意,从这里开始,我都用“培训”二字。培训产业有几个比较确定的判断。

首先是k12碰不得。因为孩子们根本没时间用各种互联网学习平台和学习app。这个领域,搞教育是会比较惨的,但是搞学习服务会比较成功。尤其是本质是“中介”这种商业模式的应用,都会很成功。

从数据这个角度看培训行业,我们认为只有 2C 才有前途,做2B的只能呵呵了,做平台的更是打死也做不过BAT,可以洗洗睡了。所以又衍生了一个结论2B不投。

另外我们认为从数据这个角度看,哪些点有机会呢?

首先是020。线下有实体,线上有2C的应用或者网站,尤其是这两条线还能产生某种形式的互动的话,“那是极好滴”。按照时间轴来分,幼教领域的培训业务,尤其是和数据相关的,并不多,这块其实最重要的是hold住家长。

从培训角度说,幼教是有半径的,小孩子只能就近学习,再优质的资源也没办法,那他们的数据,只能通过线上这一块,由家长和学校互动。

目前,A股上市的全通教育,主营业务“家校通”做的其实就是类似的生意,只不过他没做幼教,但是这个模式是成立的,他们平台上的数据,就非常有价值。

目前我们还没有在幼教这块看到数据资产特别有价值的投资对象。但是,我坚信这块肯定会出来某个公司,而且他们一定是个纯线上的公司,同时是个“重数据”公司。对于课外辅导和培训来说,优质内容还是非常重要的。

在这里,大数据其实有两个切入点,一个是优质课程,一个是模拟考试。

考试部分说过了,课程部分我想在这里说。优质的k12辅导课程,必须是和原有课堂学习不一样的。

我们现在犯得很多错误,是因为我们在照搬以前的经验,而互联网的出现,恰恰是要做出点颠覆性的东西出来,课程,这个领域是我们能遇见到的,最慢变化的领域。

过了k12就是广阔的高等教育,职业教育。在这些领域,我认为职业教育最有可能成长起来,一是他有先天的付费基础,二是用户天生有在线能力。最近复兴资本投了慧科教育(开课吧)2000万美金的A轮,我觉得这个deal是明智的。他们主打泛IT,而且线下根基稳020基础好,同时线上做的很棒,可以说基本符合了我刚才说的选公司标准。而且这样的公司,他们的数据是非常有价值的。

对一个客户的深度开发,会带来后端不断的续费。续单率高,持续收获,多种经营,这样的生意前端就可以玩互联网最擅长的免费,而后考后端赚钱。不管慧科未来会不会成功,这种商业模式的逻辑是成立的。

最后总结一下,在培训这个领域,数据资产,或者说大数据方法,比在教育领域要更有生命力。培训更市场化,也更容易被互联网化,因此也就更容易被数据化。但是反过来,在公办教育领域,机会也是巨大的,这个机会是教育管理的IT化机会,很多不懂教育的厂家会在这波浪潮里面起来,因为他们懂管理。

大数据技术在教育领域中的应用:

3.中国原有培训体系的数据模式简析

公办网络教育,民营在线培训学校,其他非培训类平台积淀的教育资产,新兴的学习终端及其教育资产。

4.国外教育培训行业中数据技术应用的现状

基本面临同样的问题,韩国 megastudy,美国 地平线报告,中国台湾地区 游戏学习;

5.从学术角度来说,未来大数据在教育领域的几个方向及其判断

数据的收集——终端设备的应用,智慧教室,电子书包/电子教材,电子题库/自适应诊断 (学考练-打通——连通主义学习理论),数据的分析——学习分析学,机器学习技术,文本语义技术,大数据聚类,数据的呈现——,学生评价体系,练习,考试;

6.从教学管理的角度

幼教及低领儿童——主要表现为家校互动

K12——学校教学管理及教师管理:目标:将优秀教师的教学能力数字化后,得以复制和推广。

远程教育解决偏远地区师资问题。

高等教育——远程化,mooc化,优秀的人才向最优秀的教学资源剧集(低龄阶段教育的主要目标是公平,高教阶段教育的主要目标是质量)

职业教育——贯通,定制化,一定是用人单位定制化管理教学。

其他中介性质教育,如留学中介业务——携程化,管理模式是鼠标加水泥。

7.从产业角度

小结一下:数据化程度低,各阶段发展不平衡,利益主体多元,复杂 未来趋势:

对中国来讲,先IT化,后互联网化,整体慢慢改,局部可突破。 难点:体制破局、教师改造

最终动力:

学习者本身的需求和习惯养成,新技术带来的真正便利。

上一篇: 民生银行开创大数据之路
下一篇: 如果你的苹果笔记本系统密码忘记了,你可以这样做.