面向高职高专的慕课大数据分析及应用
扫描二维码
随时随地手机看文章
引 言
教育部在 2015年年度工作要点中明确提出要 继续加大优质数字教育资源开发和应用力度,探索在线开放课程应用带动机制,加强 慕课 (MOOC)建设、使用和管理。 国家随之确定了 慕课 建设框架,其中涵盖了高职高专等职业教育的内容。国务院参事汤敏老师 2015倡导的 慕课最大的空间和机会实际上是在职业教育 ,鼓励高职优质慕课资源和平台的建设。此举对于完善终身教育体系,提高国民的职业技术和能力,乃至学习型社会的建设都有重要意义。
目前国内MOOC的研究主要包括MOOC平台建设研究、MOOC教学模式研究、 翻转课堂 实现方式研究等。清华大学、北京大学、北京航空航天大学、复旦大学等很多高水平大学都设置了 MOOC,并进行了深入研究。同时,在国家积极倡导 互联网+ 教育 的时代背景下, 更具特色的高职高专院校如何结合自身学科建设特点与优势,发挥 重技能,强能力 的培养特点,提供更优质的开放性远程教育服务是各高职高专院校面临的一项挑战,从大量MOOC 课程建设的尝试中探索自己的 MOOC 之路。
MOOC 不是单纯的教师讲课,而是通过网络技术,将课堂教学、学习体验、师生互动等不同教学环节通过编排完整呈现,从而在线产生大量数据。这些大数据中蕴含了大量的对教育教学具有普遍意义的规律和价值,通过对这些慕课大数据进行挖掘与分析,教师可以有效掌握教学规律、预测教育活动、进行教育管理和决策等。
1 高职高专院校慕课物联网建设
目前, 大多数高职高专院校都有自己的图书馆, 而MOOC 学习需要学生进行登录、学习、进行互动等。将MOOC 的平台建设与学校已有的图书馆平台相结合,充分利用已有资源,进行统一资源平台登录,可有效降低学校建设MOOC 平台的成本,提高资源使用率。MOOC 与图书馆统一物联建设平台如图 1 所示。
统一MOOC 教育平台与图书馆系统,学生通过图书馆统一登录账户登录,通过MOOC 教室进行MOOC 课程在线学习。慕课教育平台包括在线教学、课辅教学、社交媒体(包括微信、QQ 等)、知识分析与综合等,最终形成知识的积累信息。
MOOC 教学平台与大数据分析平台直接相连,将学生学习记录以及图书借阅记录等提交大数据分析平台进行分析。此外,大数据分析平台还包括数据存储、数据清洗和数据预处理、大数据分析与可视化等功能。
学生可以通过客户端、浏览器及移动端等设备,形成一个综合的物联网技术平台。
2 慕课大数据分析
通过MOOC 平台可以获得学校学生对于MOOC 课程学习的有效记录,包括学生的学号、姓名、登录时间、下线时间、学习课程名称,学习课程知识点记录、在线互动内容、在线互动次数、做作业次数、做作业时长、做作业成绩、学生考试课程名称,课程期中考试成绩、期末考试成绩、课程综合成绩、课程成绩排名等内容。由于学生使用的是与图书馆平台进行综合统一登录的平台,还可以获取学生的图书借阅情况,如借阅图书名称、借阅日期、还书日期等。
针对获取的学生学习MOOC 的综合大数据,需要采用大数据分析平台进行处理。图 2 所示为基于分布式集群处理的大数据处理平台架构图。平台采用大数据生态圈的Python, 数据库采用MongDB,存储动态常用分析所用的数据;数据预处理与存储模块包括用于大数据分布式存储的分布式文件系统(Hadoop Distributed File System,HDFS)和 Tachyon 分布式内存管理系统,可对获取的数据进行清洗并提供存储服务;在计算处理方面,采用 UC Berkeley 提出的基于内存计算的Spark。Spark 所有作业都在内存中完成,通过分布式弹性数据集(Resilient Distributed Dataset,RDD),Spark 能够对作业流程进行扫描并根据作业的先后次序进行优化,加快在内存中的运算速度。利用Spark 中的MLlib 和Graphx 提供机器学习、优化和图计算等方面的功能,并辅以 Mahout 和HadoopMapReduce 框架进行其他算法的补充 ;可视化模块以JavaScript 为手段,采用D3 和 Processing 将整个过程中产生的相关结果进行可视化展示。
数据挖掘子系统与数据分析子系统是整个框架的核心, 整个大数据处理平台以Spark 分布式集群为主体,由1 台主节点,8 台子节点组成,其中主节点与子节点机器均为 4 核 Intel Xeon E7-8837,2.67 GHz,16 G 内存,HDFS 存储容量为 2.5 T。
此外,学生还可以在线下根据自身需求选择不同的教学资源、方式、媒介,亦可自行决定课程学习时间,加之网络论坛的辅助和课上网络平台的使用,使得教学更富成效。
3 计算机媒体类课程慕课的应用推广
针对计算机类课程,通过图 1 所示的MOOC 与图书馆统一资源平台,借助大数据分析平台,对于获取的学生的数据结构、操作系统、程序设计基础等课程的学习数据进行综合处理, 得到准确的学生学习喜好模式,及对教师 MOOC 课程水平进行准确分级。
4 结 语
基于这些计算机类课程大数据分析的结论,梳理出计算机媒体处理类课程MOOC 教学的特点,结合MOOC 的独特优势与媒体处理类课程需要大量视频、图像、PPT、音频等综合展示的特色,将其他类课程MOOC 建设模式和大数据分析的结论,灵活迁移到媒体类课程教学中,帮助教师探寻学生的学习规律,调整教学,提高教学效率,提出具体的教学方法改进措施,使得课程的讲授更加灵活、开放、动态,更加具有针对性,方便教师更好地满足学生个性化学习的需求,真正做到因材施教,取得事半功倍的成效,在减少教师负担的同时, 也让学生能够学的更直观,更深入,更扎实。