JMP鼎力支持2011全国大学生统计建模大赛
扫描二维码
随时随地手机看文章
全国大学生统计建模大赛是由中国统计教育学会主办、面向全国大专院校学生、统计志愿者及相关工作人员的专业赛事。大赛的目的是为了鼓励广大高校师生利用统计方法、建立统计模型、运用计算机技术提高统计分析及应用的能力。本次大赛对培养和发现统计业务骨干,培养大专院校学生及统计工作者的学习意识,增强创新精神,提高在校学生对统计工作的认识和兴趣,建立产学研人才培养机制,加快统计数据的成果转化,更好地为政府和社会公众服务具有重要的意义。
继支持2010年全国统计建模大赛之后,JMP中国区继续鼎力支持2011年度大学生统计建模大赛,不仅为大赛安排了专用的JMP软件供参赛学生及其指导老师免费使用,而且还专门为大赛设立了JMP奖,以鼓励高校师生学好、用活统计分析和建模方法。
本次参赛论文的主题主要是来源于社会、经济、金融和管理科学等方面经过适当简化加工的实际问题,既可以是宏观经济社会问题,也可以是具体企业生产经营中的实际问题,还可以是自行设计的问卷调查、抽样调查等问题。同时要求参赛者在规定的时间内,自行搜集数据,提出问题和假设条件,运用各类统计分析方法建立合适的统计模型,对结果进行分析和检验,并阐明结论及其意义。
由此可见,参赛者需要具备综合应用统计学、计算机学和经济学的素质。工欲善其事,必先利其器。如果在参赛过程中,能够运用一款称心如意的统计科学软件,必定会使统计建模事半功倍。这种理想中的统计科学软件,必须具有便捷的数据收集和数据整理能力、丰富的探索性数据分析工具集和专业的统计建模方法,最好还要有一定的扩展性和兼容性。全球最大统计学软件集团SAS公司的交互式可视化统计发现软件JMP的卓越表现恰巧与这些要求不谋而合,能够帮助参赛者提高工作效率,加强建模的创造性,确保分析结果的正确性,增强论文的可读性和说服力。
便捷的数据收集和数据整理能力
兵马未动,粮草先行。统计建模中的“粮草”就是客观、真实的数据资料。JMP软件中的“试验设计DOE”平台可以帮助参赛者确定满足特定条件的调查对象,需要调查的样本大小,“表、列、行”平台则可以从总体数据集中实现随机抽样、分层抽样,进行自定义的数据筛选,乃至进行各种数据预处理、数据清洗、缺失数据追踪等等。这些工作可以在几秒钟内完成,当遇到海量数据的分析处理时,会很有用。
图一 JMP软件中的部分数据整理功能
探索性数据分析工具集
统计建模的早期阶段特别强调运用创新的方法发现数据中可能隐藏的趋势。一般来说,在这个阶段以直观形象的图形为主的探索性数据分析(EDA: Exploratory Data Analysis)方法会很有用,而这也是JMP的特点之一。JMP软件提供的图形中包括了多维散点图、动态气泡图、图形生成器、地图等多种新颖的可视化图形,能够将饼图、柱状图、折线图等传统图形以动画的形式输出。所有图形和图形、图形和数据表之间动态链接。这些功能可以帮助参赛者更容易地发现数据中隐含的、有价值的信息(比如趋势等),从而得到启迪,产生灵感并进一步进行建模分析。
图二 运用JMP的“地图”功能进行中国大陆CPI信息分析
专业的统计建模方法
统计建模的核心是所用的统计建模方法,这是决定论文质量高低的关键部分之一。JMP软件的完整统计建摸解决方案包括回归模型(多元方差分析、逐步回归、Logistic回归、非线性回归、模拟预测等)、时间序列模型(ARIMA模型、平滑模型、谱密度、传递函数等)、数据挖掘模型(决策树、神经网络等)、可靠性/生存模型(寿命分布模型、加速失效模型、老化模型等)、多元统计模型(主成分分析、聚类分析、判别分析等)等,以适应不同应用场景下不同的统计建模需求。
图三 运用JMP软件对城市房价进行可视化聚类分析
扩展性和兼容性
统计建模的涉及面非常广,需要解决的问题也是多种多样,因此用到的统计分析方法也可能有着不同的实现方式。用户可以将JMP作为“分析枢纽”。除了可以用JMP自带的编程语言JSL自定义个性化的统计分析之外,还可以直接调用现成的SAS或R语言代码进行更为深入和复杂的分析研究。参赛者存储在Excel、Access、SAS、SPSS、R等软件中的数据源也可以直接导入JMP。
统计建模大赛 src="/21ic_image/21icimage/zb-images/147/0941455001308016204.png">
图四 R语言代码可以在JMP软件中直接运行