大数据视野下社区数字化学习平台的应用策略研究*
一、前言
随着互联网应用技术的不断发展,数字化学习平台可为社区居民提供大量优质在线教学资源,但在使用过程中也产生了大量结构化和非结构化的教学信息,传统的数据处理方法难以应付管理、服务、研究、评价等教学大数据。目前社区教育信息量的爆炸式增长已经引起了专家与学者的关注,大数据技术在社区教育的研究与实践中发挥着越来越重要的作用。数据处理技术的创新发展成为人们新的视野焦点,如何利用与分析这些数据信息,不仅影响着信息交流、知识传递和学习效果,而且在一定程度上影响着教学决策制定和学习模式优化,并已经成为目前教育工作者和学习者关注的内容[1]。
目前,大数据在社区教育领域的应用还存在着一些问题,数字化学习平台的数据标准还有待完善,数据汇集需要建立统一标准与规范,电大系统、培训机构和中高职所建设的社区在线学习资源没有得到有效整合;现有社区数字化学习平台在系统设计上,对教与学过程的记录不够全面细致;尽管当前传感器、Wifi网络、移动设备等技术手段得到了广泛应用,但现有社区数字化学习平台建设中,对数据采集的支持还不够。
大数据已经对人们的生活、工作和学习产生了深刻地影响。大数据在社区教育的应用意义在于对不同来源和类型的教学数据集合进行分析和研究,发现影响教学的数据信息,为师生解决教学问题提供参考决策。教师通过大数据对学习者学习中产生的海量数据进行分析预测,为学习者推送个性化的学习资源,从而有效地提高学习者的学习效果,以便真正做到孔子所提及的有教无类和因材施教[2]。
为了探究灌装聚合物厚度的影响,我们还模拟了一个灌装厚度很薄(2 mm)的情况。将温度和应力分别比较在图4(b)和图6中,可以看出薄灌装构型的温度和应力的大小和不均匀度均介于未灌装构型和厚灌装构型之间。
本研究将从自适应学习分析技术、精准资源推荐等方面对大数据技术应用进行探究,探讨社区居民通过对数字化学习平台应用过程中遇到的资源建设、服务共享和数据处理等问题及其原因,最后提出利用大数据技术改进和完善社区数字化学习平台的应用策略。
尽管“道”是多义的,但其中有一条主线,即首先将“道”作为“物”,指一种特殊的存在体。它存在于形上领域,由其运动或者说在展开存在的过程中开出了天然现象之“物”。规律、准则或典范都是由这层含义的“道”延伸出来的。
二、大数据的关键技术
2.大数据存储和管理
大数据的特点可以总结为“4V”,即大量(Volume)、高速度 (Velocity)、多样化 (Variety)、价值(Value)。大数据的应用往往占用大量的数据存储容量,计量单位甚至达到EB、ZB、YB,而且计算速度快,生成数据分析结果所需要的时间在秒级范围内。大数据包含网络文档、音频、视频、图片、地理位置等数据集,人们可以通过多种分析技术从大数据中挖掘有价值的信息。下面我们将从技术框架、存储和管理、处理和分析以及计算模式等方面来系统阐述大数据的关键技术。
利用分布式并行编程模型以及分布式计算框架,结合当前流行的机器学习算法,可实现对海量数据的处理和分析,对分析结果进行可视化呈现,利用形象直观的表现形式来显示复杂的资源内容,包括散点图、直方图、时间轴和树图等;分析方法包括查询分析、流分析和复杂分析。
部门预算按照财政要求的“二上二下”四个轮回编制,通常“一上”编制提前半年开始,但预算年度的工作安排一般要到当年末才能确定,这有可能造成部门预算和预算年度工作规划脱节,有必要对部门预算进行适当调整,否则难以落实工作规划。而部门预算调整的实际情况是流程多、审批严,为确保预算年度工作计划的进度,高校往往会边执行边调整预算或者是先执行后调整,最后出现预算批复与预算执行不一致。
大数据技术框架通过Hadoop和Spark构建了一个庞大的技术生态圈如图1。Hadoop是由HDFS和MapReduce组成的分布式文件系统,HDFS用来存储海量数据,MapReduce可提供海量数据计算服务,具体表现为计算节点、集群、机柜和数据中心;数据管理主要是面向结构化数据、半结构化数据和非结构化数据进行管理,Cassandra、MongoDB以及在Postgres等数据库技术可以非常方便地对非结构化数据进行存储和处理;在Spark生态系统上通过机器学习和分布式计算完成统计性分析、数据挖掘、可视化分析等业务计算,流式实时运算Storm也可用于数据管理。使用的分析工具包括日志管理工具Splunk,支持的数据源也是多种类型的,可视化工具Tableau,SPSS主要用于数据建模工作,常用工具语言有java和python。
通常认为大数据由半结构化和非结构化数据组成,其中以非结构化数据居多,采用内容检索、交叉比对、深度挖掘和综合分析等方法对不同类型的数据应用进行处理。针对大数据的存储与管理问题,目前常用的oldSQL、NoSQL与NewSQL等非结构化数据库都可以解决传统数据库难以处理的诸如内容检索、深度挖掘和综合分析等问题。
图1 大数据技术框架
社区数字化学习平台在教学实施过程产生了大量结构化和非结构化的教学数据,而大数据技术的发展成熟,为这些问题提供了多种解决方案。上世纪90年代至本世纪初,随着数据挖掘理论和数据库技术的发展完善,知识管理应用工具大量涌现,如知识管理系统、专家系统等;到了本世纪前十年,随着Web2.0技术的成熟推广,大量非结构化数据的不断产生,给原有的数据处理技术带来巨大的挑战,这也促使了大数据技术快速发展,以谷歌的GFS和MapReduce为代表的并行计算和分布式系统等技术开始进入主流视野;到了2010年以后,各行各业开始广泛应用大数据,越来越多的个人、机构和公司运用大数据进行智能分析决策。2017年上半年有63家大数据创业公司获得了融资,总融资金额超过68亿人民币,其中获得上亿元融资的企业就有17家。教育大数据正在成为教育领域不可忽视的新型驱动力,在教育教学研究与实践中发挥着越来越重要的作用[3]。
根据电气箱的高度,结合机柜的高度,进一步确定电源连接器在商店中的高度以及预留电缆到配电箱的长度,这需要专业技术人员在施工现场进行现成的测量,确保数据的准确性。如果沿着电缆桥架放置,则必须在电缆安装完成后进行下一个过程的构造。首先,在安装电缆之前,应对计算机进行绝缘和遥测,以确保电阻值达到10兆欧。施工只能在确定后开始;此外,手动升降时应将其固定在升降工程中,以防止人身伤害和材料绝缘。破坏层;最后,主电缆悬挂后,中间部分应逐一加固,不应检查电缆是否卷绕,标准卡设置在电缆的开头和末尾。
我们在初中数学课堂教学中非常看重课堂效率和课堂质量,社会在快速发展,教育也在不断变革,传统的初中数学模式已经不能完全适应现在的教育环境。我们需要不断创新教学方式、优化教学模式,此外,培养学生的学习能力也是我们在教学过程中要重视的。教师科学合理的教学模式与学生较强的学习能力相结合才能够真正提高初中数学课堂质效,也能够促进学生的全面发展。
3.大数据处理和分析
1.大数据的技术框架
目前一般用聚类、预测、关系挖掘、文本挖掘等数据挖掘方法和工具采集学习者学习数据,并将采集到的数据包括结构化数据、非结构化数据以及半结构化数据,运用统计分析、内容分析、社会网络分析及语义分析等方法,从大量冗杂的数据中挖掘有用信息。常用的学习分析工具如Course Signals、Blackboard、Desire2Learn 和 Moodle等在线平台都可以运用统计分析法,分析学习者的学习表现。
社区教育的本质是以满足社区居民的需求为根本,以提高社区居民的生活水平和改善社区内经济状况为目的,是社区人力资源智力开发和技能提升的创造性过程。因此,社区教育的人才培养目标具有多层次和多类型的特点,应针对每一位学习者个性化需求而提供教学内容。由于社区学习者的能力水平参差不齐,利用自适应学习工具评估学习者,分析学习者对问题具体的回答,为学习者提供独一无二的内容反馈、线索和学习资源,满足其个性化的学习需求。在培生集团给出的《解码自适应学习》的报告中定义,“自适应学习是一种教育科技手段,它通过自主提供适合每位学习者的独立帮助,在现实中与学习者产生实时互动。”自适应学习一般应用在测试中,根据学习者回答问题的正确与否,及时改变和调整测评的标准。比如英语考试中的GRE和GMAT,测试者在连续做对题目之后就会发现题目越来越难,这就是自适应评估工具在根据测试者的表现及时调整的结果。
4.大数据的计算模式
根据数据的数据结构和计算特征,从大量的数据计算问题和需求中提取抽象特征模型,对数据处理的不同需求和特征维度,形成了多种大数据计算模式,每种模式都提供了对应的大数据解决方案和代表产品(如表1)。
表1 大数据计算模式及其代表产品
大数据计算模式 解决问题 代表产品批处理计算 数据的批量处理 MapReduce、Spark等流计算 流数据的实时计算Pregel、GraphX、Giraph等查询分析计算 大规模数据的存储管理和查询分析Storm、S4、Flume、Streams、Puma、DStream、Super Mario、银河流数据处理平台等图计算 针对大规模图结构数据的处理Dremel、Hive、Cassandra、Impala等
三、大数据在社区教育领域的应用
1.自适应学习
由于实际数据库中,一张主实体表中包含的外键个数一般不会太多,故步骤2)中组合数不会太大。步骤(3-1)中,包含外键的项集不参与连接,该类频繁项集实际意义为该外键对应的实体与主实体属性的联系。
2.学习分析
在社区教育教学中,教学过程的组织结构特征和师生关系密切相关。在社区数字化学习平台上,学习者参与教学活动和构建知识体系受到自身的社会背景、文化背景和知识能力的影响。因此,教师需要把学习对象自身观点、知识的影响限制在一定范围内,对学习者的每个学习环节进行分析和评价。以学习分析为工具,给出行动指导、立足服务的体系结构、信息与服务一揽子解决方案,其根本目的是提升学习质量。学习分析的预测功能是基于教育大数据的预测,其结果具有可参考性,能为目前的教学和后期教学优化提供重要的指导作用[4]。
综上,笔者对生活化学习方法在高中化学学习中发挥的优点进行了阐述,将生活化学习方法运用其中可帮助我们加深对重点难点知识的理解,使抽象的化学知识具体化,使化学知识有效落实到生活中,这对于化学学习质量的提升起到了至关重要的作用。
数字化学习平台从技术层面实现了各种学习行为数据的量化与可视化,通过记录、分类、挖掘和运用学习者学习过程中产生的大量非结构化数据,能够揭示出学习者学习存在的问题和效果;通过监测、跟踪、分析和应用学习者在整个学习过程中形成的数据档案,能够帮助教师理解学习者为了掌握学习内容而进行学习的全过程。
3.精准学习资源推荐
社区教育课程的设计在课程目标设置、教学设计和课程内容安排及实施上,应立足社区实际,关注社区本地化以及给社区带来的教育影响;从课程实施角度看,关注课程实施中居民的学习体验、方式与过程,在教学过程中注重灵活和多样化。社区学习资源的设计和开发还应该关注不同群体的现实需求与发展需要,突出课程开发的层次性和与特色性。因此,社区数字化学习平台需要为学习者提供精准的学习资源推荐系统。
目前学习资源的推荐方法包括基于内容的推荐和基于协同过滤的推荐。它们基本原理是,根据学习者以往浏览较多的学习资源,选择其他类似的学习资源作为推荐结果。例如,现在有一门课程与学习者过去学过的课程内容有相同知识点或者内容类似,则学习者可能就喜欢浏览这门新课程。通常使用学习者模型的向量特征来描述学习者的学习需求,提取课程内容的特征维度,作为学习者模型的内容特征。通过计算学习者模型的匹配度,将匹配度高的课程推送给目标学习者。
四、大数据在社区教育领域的实施策略研究
1.优化学习资源推荐算法,要以社区居民为中心,将社区教育数字化学习资源进行整合和共享。利用现有各类学校的数字化学习信息、学习资源、各类行业培训课程和各县市区社区教育的数字化内容按标准的数据规范统一整合在社区数字化学习平台,形成共建共享的社区教育服务体系。
在优化学习资源推荐算法方面,首先处理好学习者和学习资源之间的关系,为学习者各项隐性和显性行为设置权重。显式(explicit)的行为包括:浏览、点击、收藏、分享、评论、点赞等;隐式(implicit)的行为包括:浏览时长、播放时长、浏览次数等。通过权重设置将对学习者做出更精准、更全面的分析和画像建模,为学习者提供更加优质的多场景学习支持服务,订制更合适的自身学习风格和学习路径。
2.建立安全机制,保护社区居民个人数据隐私。大数据环境下,个人数据作为一项重要资源,其蕴藏的巨大价值日益凸显[5]。基于对学习者学习过程的大数据分析,教师可以获知和挖掘学习者的学习情况、情感状态甚至精神状态,所以保护学习者的隐私已成为必须解决的问题。社区教育大数据涉及大规模的社区学习居民群体,特别是对于大量的未成年和老年学习者而言,隐私保护至关重要。所以,应当从法律上明确和规范公开数据与私有数据的边界,有效保护隐私数据。在明确数据来源和使用责权的前提下,才能有效地开展教育大数据研究与应用。
目前针对隐私保护问题,已经提出了诸如加密、访问控制、匿名化、变换和差分隐私等方法。大数据带来更加便捷的服务,然而其与数据隐私却存在着矛盾的关系。美国佐治亚理工Ling Liu教授提出,在大数据的背景下,我们应该着眼于探索以可用性为导向的隐私保护方法。此外,数据隐私应该包括个人和组织对数据收集、使用和分析,甚至是交易的控制权。
3.建立“学分银行”成果认证制度,健全平台大数据应用评价机制。[6]将社区居民的在线学习信息纳入学分系统,建立社区居民社区学习大数据,对学习者参与学习的内容、时间以及结业成绩进行记录,并与电大系统、职业学院和高等学校等各种教育机构建立“课程互通、学分互认”的学分认证体系,逐步社区学习大数据认证制度。对平台收集获取的学习大数据进行可视化分析,帮助学习者进行大数据学习评估、预测和干预,推动社区教育朝着开放性和个性化的方向发展。
尼尔斯·波尔则创立了量子理论,解决了几百年一直未解决的物质结构问题。物体为什么有导体、半导体、绝缘体之分?物质的磁性是怎样产生的,原子又是怎样的?……这些人类自古以来就在探索的重大问题,在量子理论问世之后不过短短几年时间,就一个接一个地解决了。
[参考文献]
[1]周馨.大数据时代教育数据价值挖掘[J].信息与电脑 (理论版),2013(8).
[2]崔晓鸾,赵可云.大数据在教育领域的研究热点及发展趋势——基于共词分析的可视化研究[J].现代远距离教育,2016(4).
[3]孙洪涛,郑勤华.教育大数据的核心技术、应用现状与发展趋势[J].远程教育杂志,2016(5).
[4]刘凤娟.大数据的教育应用研究综述[J].现代教育技术,2014(8).
[5]姜强,赵蔚,王朋娇,王丽萍.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育,2015(1).
[6]韦书令.社区教育数字化学习平台建设和资源共享研究[J].成人教育,2017(5).
[7]张燕南.大数据的教育领域应用之研究[D].上海:华东师范大学,2016.
[8]肖玉敏,孟冰纹,唐婷婷,吴永和,谢蓉.面向智慧教育的大数据研究与实践:价值发现与路径探索[J].电化教育研究,2017(12).
[9]张正华.大数据时代“MOOCS”对终身教育发展影响的研究[D].天津:天津工业大学,2017.
[10]李媛.大数据时代个人信息保护研究[D].重庆:西南政法大学,2016.
[11]裴莹,付世秋,吴锋.我国教育大数据研究热点及存在问题的可视化分析[J].中国远程教育,2017(12).