当前位置:首页 > 物联网 > 《物联网技术》杂志
[导读]摘 要:数据挖掘技术是指一种通过某种方法与策略从一切实际应用数据中将某些人们事先未掌握的、潜在但确实存在 一定利用价值的信息与知识最大成度地提取出来并对其进行加工的技术;数字化校园则是在以互联网为依托的情况下,充 分利用一切可以利用到的信息化策略及相关设备,继而从包括教学环境、教学资源以及教学活动等方面实现校园整体性的数 字信息化管理。文章主要阐述了数据挖掘技术在数字化校园中的应用相关情况。

引言

信息的分析与处理是重要的人类活动之一,但随着当前 社会信息化进程的不断加快,其整个社会的信息量也表现出 成倍的增长趋势,当某一种数据库所包含的数据日益庞大的情 况下,传统或简单的数据统计方法自然也会逐渐表现出诸多的 不适用。尽管眼下的多数数据库系统仍可比较高效地进行数 据的录入、查询以及统计等操作,但对于这些数据可能存在 的某些关联与规则却无法实现理想掌握,在此种情况下也无 法通过现有数据实施未来发展可能性的推断。在这样一个“数 据爆炸”的时代,如果不具备挖掘数据背后隐藏的知识的能 力,势必也会出现“知识匮乏”的现象。当人们意识到此问题 所在之时,其对信息的态度也正在由简单的数据收集型向分析 加工型转变,并期望从同样的数据信息中挖掘出更多可加以利 用的信息,数据挖掘(DM)技术即是在此时代背景中诞生的。 就近些年的情况来看,DM技术的相关研究不仅愈发变得炙手 可热,而且已经在诸如商业、金融业、企业生产以及市场营销 等很多领域获得了实际性的广泛应用,比较之下,其在教育领 域的应用却相对偏少。基于此,笔者特针对DM技术在数字 化校园中的应用进行一定阐述,旨在为DM技术在教育领域 的应用开发提供一定参考价值。

1 DM技术与数字化校园的概念与内涵

1.1 DM技术的概念与内涵

DM技术即是指一种通过某种方法与策略从一切实际应 用数据中将某些人们事先未掌握的、潜在的、但确实存在一 定利用价值的信息与知识最大程度地提取出来并对其进行加工的技术称谓。具体开展DM的方法种类是多样的,但其中 最具代表性的通常包括了分类分析法、关联分析法以及序列 模式分析法等,而经常需使用到的工具则主要包括了 IBM公 司Almaden研究中心开发的QUEST系统,SGI公司开发的 MineSet系统,加拿大Simon Fraser大学开发的DBMiner系 统,SAS Enterprise Miner,IBM Intelligent Miner, Oracle Darwin, SPSS Clementine 以及 Unica PRW 等。在针对具体 应用实际的情况下,通过选用以上DM工具可以帮助人们发现 某些未知的数据含义,进而开发其价值以预测或指导未来可能 发生的情况与需要采取的行为,总之就是为人们的决策行为 提供全方位的数据信息支持。

1.2数字化校园的概念与内涵

数字化校园即是在以互联网为依托的情况下,进而充分 利用一切可以利用到的信息化策略及相关设备,继而从包括教 学环境、教学资源以及教学活动等方面实现校园整体性的数 字信息化管理。由此可见,与传统的校园建设比较而言,通过 对校园实施数字信息化的建设后,不仅将使得校园的发展具备 了更加明显的时代性,而且还能够将学校发展过程中的某些 实际成效及时展现出现,同时也能及时地从中发现可能存在的 管理方面的问题,并对学校在未来一定时间内的发展趋势做 出比较符合实际的预测,最后,在数字化的校园管理模式下, 其校内的相关资源配置将进一步得到优化,这势必也将促进 校园的整体建设可逐步得以完善。

2在数字化校园建设中采用数据挖掘技术的需求分析

2.1学校教学与教学评价方面的需求分析

一方面,教学是学校最核心的任务,那么教学部分的数据挖掘也自然是数字化校园建设的核心部分,现以教学过程 中的课程设置为例,在学校,学生的课程学习是循序渐进的, 而且课程之间有一定的关联与前后顺序关系,在学一门较高 级课程之前必须先修一些先行课程,如果先行课程没有学好, 势必会影响后续课程的学习,另外,同一年级学习同一课程 的不同班级,由于授课教师、班级文化的不同,班内学生的总 体成绩相差有时会很大,利用学校教学数据库中存放的历届学 生各门学科的考试成绩,结合数据挖掘的关联分析与时间序 列分析等相关功能,就能从这些海量数据中挖掘出有用的信 息,帮助分析这些数据之间的相关性、回归性等性质,得出 一些具有价值的规则和信息,最终找到影响学生成绩的原因, 在此基础上对课程设置作出合理安排;另一方面就是教学评 价的数据挖掘,教学评价是对其重要的调节、控制、指导与 推动手段,而且可发挥重要的导向作用,也更是学校教学管理 的重要组成部分,基于此,针对教学评价管理中出现的某些 问题给予科学地解决就显得格外重要,此方面的问题又包括: 影响教学评价的关键因素有哪些?教学评价的指标与关键环节 的合理性如何?在具体的教学评价中的各级得分者的特征如 何?教学评价的可疑数据可通过什么方式给予剔除?通过数据 挖掘后,诸如此类的问题均有望得以明朗化,继而更科学地 实施教学评价以确保可真正扫清教学工作中存在的障碍。

2.2教师结构和专业配制方面的需求

在当前高校扩招的大潮流中,我高职院校也占据了相当 比例,由此所导致的师生比例失调的问题、新增设专业教师的 稀缺问题以及具体每个专业的教师人员结构与专业领域的重组 问题等等,均是迫切需要解决的问题。通常采取的做法自然是 通过一定措施来弓I进新的教师队伍并留住人才,然而在这个过 程中,还包括很多细节的问题:现有的教师哪些即将流失?现 有教师他们的流失概率如何?哪些因素造成了教师的流失?教 师流失对学校会造成什么影响?教师的流失情况有什么差别? 如何制定科学的用人制度?等等问题,通过应用数据挖掘技 术后,便有望在高职院校变被动为主动地科学人用。

2.3学校的科研管理需求

学校所开展的科研项目对于教学内容的革新、教学质量 的提升以及教师学术水平的提高均具有极大的推动作用,同 时,其成效也是衡量经费分配与职称评定的重要参考依据。 在此基础上,改进与完善科研评价制度自然就成为了学校迫 切需要解决的问题,这些问题主要包括:在各类级别期刊上 发表论文的相关教师所具备的特征、各种课题申请者的特点、 未完成科研任务教师的特征、影响教学科研进展与成效的因 素、科研滚动周期的最佳年限、科研工作量应该如何设定以及 科研项目存虚存假的可能性等。而通过DM技术可将这些问题均得以不同程度地解决,如此也必将更加有效地激励教师 科研的执行力与创新水平,整体加快学校科学事业的进展。

2.4数字化图书资源的管理需求

图书馆最大价值化的存在,无疑要全面了解并掌握所有 读者的分类、属性以及特征等方面的情况,同时还需充分掌 握读者在应用图书馆后的满意度情况以及是否有新的需求, 图书所涉及学科的交叉问题等等,这均是当代学校图书馆亟待 解决的问题。而数字挖掘技术正能实现对以上信息的深加工, 继而在对相关数据进行分析后进一步指导图书馆的馆藏建设, 同时还可为学校的学科课程设置提供一定参考价值的科学依 据,最终推动学校图书馆业务与相应管理的全面进步。

其他还比如有在人力资源管理方面、学校的教务管理以 及住校学生生活消费管理等等,其各自存在的问题均可在充分 应用数据挖掘技术的基础上找到相关突破口,最终在整体上 全方位地实现学校各方面资源的优化管理与合理配置,持续 提升学校数字化建设进程的速度。

3数据挖掘在数字化校园中的应用研究

通过了解,数字化校园的数据管理平台是一个集成了学 校多方面应用系统的综合性平台,将所能收集到的所有数据均 储存在学校的数据中心的共享数据库里面。但在储存的过程 中,还需对这些数据进行详尽的分类处理,并充分考虑到其 可能存在的不完整性、模糊性与随机性等,而通过数据挖掘 对这些信息的充分提取与整理,继而生成与之相对应的应用决 策系统,最终为相关领导做出正确的决策提供更为丰富的可 靠的参考信息。数据挖掘在数字化校园中的具体应用结构图 如图1所示。

数据挖掘技术在数字化校园中的应用

如上述介绍以及上图均可以看出,DM技术在校园数字 信息化建设中可说是一项颇具复杂性与繁琐性的特殊工作,因此其具体应用情况的介绍限于篇幅限制,笔者在此仅以学校的 科研管理为例,并应用Clementine挖掘工具进行操作,现对 其相关数据挖掘技术的实际应用情况展开一定剖析。

3.1对不能完成科研任务教师的相关分析

在实际的学校科研项目管理过程中,其中项目进度的管 理是一个比较重要的环节,而与项目进度相关的因素中,又会 存在个别教师可能因多方面原因而出现不能完成既定科研任 务的情况,而只有通过科学的对其实施预测,才能让诸如此 类的问题得以最大程度地解决。其具体的解决思路主要就是 要把这个问题定义为一个分类预测的问题,那么首先需要做的 就是将参与科研项目的教师分为两类,其中一类为已完成科研 任务量者,而另一类则是尚未完成科研任务量者。接着分别从 此两部分教师中选择一定数量的教师,并统计其相关属性数 据继而组成训练数据集,然后再通过应用神经网络与决策树 等办法建立起科研工作量完成情况的实际分类模型,最后再 利用该模型来进行科研任务量完成情况的实际预测,如此便 可获得可能会不能完成科研任务教师的相关信息,为学校后期 的科研计划的制定提供参考依据。

3.2教师不能完成科研任务的实际原因

在了解到可能完不成科研任务的教师后,还更需要对导 致此种情况发生的原因进行必要的分析,进而可在以后保证 其能最大程度地去完成科研任务。此方面的数据挖掘处理具 体来说主要包括两个方面的措施。一方面,可以运用关联分 析的办法,把科研任务量的完成情况看作一个实际目标变量, 而把与之可能相关的某些属性数据作为变量,一起输入系统 后在运用GRI模型展开分析,进而可初步找出具体有哪些属 性可对科研完成的情况造成影响;另一方面,就是应用决策 树的方法来获得科研工作量完成情况的规则集。以具体的某 学校为例,以APRIORI算法为基础来对教师科研任务量完成 情况的影响因素进行分析,设定0.3为最小支持度与最小置信 度,继而对挖掘的结果实施分析,所获得的最终结果为:基 础学科有38%的教师不能按时完成,82%的文科教师可以完 成,75%的年轻教师可以完成,95%的高级教师可以完成等等, 如此一来,便能很清楚地获得对科研任务量完成情况的影响 因素,比既往的方法便捷了很多,同时也显著提高了工作效率。

3.3学校科研管理中对教师的分类

在寻找到影响教师不能完成科研任务量的原因之后,接 下来还必须完成的工作就是要对教师实施明确的分类,继而 便于针对具体情况的不同类教师建议采用不同的策略来最大 程度提升科研任务的完成率。打个比方,我们可以把学校看 为一个企业,而把教师视作企业的客户,因此对教师实施分 类的问题亦即是对企业客户进行细分的问题,通过分类后,自 然更便于将那些特别需要关注的“客户”找出来,继而采取相 应的实际措施来改善部分教师不能按时完成科研任务量的问 题。下面笔者以聚类算法为例对教师细分过程中所采用到的 实际算法应用进行一定说明,本算法主要是采用逐步减少K 值的方式进行尝试。职称与学历等均是影响是否能完成科研 任务的主要因素,因而需将这些相关的数据均作为参数给予 输入,比如先将K值假定为8,接着通过对K值的大小进行 连续调整,最终或许可以发现,比如当K值为4时,其效果 最为理想,然后便可运用决策树对此类与其他类型的因素进 行相同的分析,对每位教师的具体情况实施深入挖掘,最终 分析出导致其不能完成科研任务的所有影响因素。通过此种 在给予分类基础上的实际算法的应用,教师科研工作中所存 在的问题就能很容易被挖掘出来。

4结语

综上所述,对数字化校园的建设而言,数据挖掘技术不 仅是一项迫切需要掌握的全新技术,而且也是一项有着必要性、 重要性与繁琐性的工作项目,因此有必要更加重视其在数字 化校园建设中的作用与效果。与此同时,笔者认为,当代的学 校管理自然也需要现代化的管理方式,数据挖掘技术的诞生与 不断发展,也势必能为校园数字化建设提供更为有利的帮助, 这也是有助于学校实现数字信息化最有利的保证。笔者相信, 在不久的将来,数据挖掘技术将会在校园数字信息化建设中 发挥出更为突出的作用。

20211118_619636282ff41__数据挖掘技术在数字化校园中的应用

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭