电子科大把大数据运用到社会科学的研究中
扫描二维码
随时随地手机看文章
日前,电子科技大学大数据研究中心主任周涛教授、高见博士在《物理报道》发表长篇综述论文。《物理报道》是物理科学和交叉科学类最具国际影响力的期刊之一,是国际顶尖级期刊。这篇名为“计算社会经济学”的论文,主要是通过利用采集的大数据,分析全球经济发展状况、区域经济水平、城市空间结构布局和个体社会经济状况等。相比过去而言,改变了传统的“问卷调查、普查”的方式,获取的数据更具有真实性,对政府的决策更有指导意义。
大数据的运用改变社会科学的调查方式
据周涛教授介绍,社会科学的研究非常复杂,其基本单元(人)要比物理学的基本单元(基本粒子)复杂得多。社会科学的研究对象具有极大的不完备性和不确定性,如政策和法律条文,不仅复杂,而且不容易用数值手段来刻画。同时,影响社会发展的因素数不胜数,任何包罗万象的理论都不可能将它们全盘纳入,而单个因素也是不独立不稳定的,受到外部环境和其他因素的影响很多。因此,搜集大量的数据,覆盖足够的面,可以让社会科学调查得到的结果更加真实,为政府决策提供更加科学合理的建议。
但是,此前很多社会学的研究,依赖于问卷调查、普查等方式,这些数据采集的规模相对较小,不具有广泛的代表意义;此外,还存在获取数据的成本较高、时间滞后等劣势。而此次在论文中所推荐的调查方式,则是基于新兴的大数据技术。
高见博士提到,随着大数据和人工智能技术的发展,为社会经济带来了前所未有的机遇和改变。一方面,我们可以用相对较低的成本获取卫星遥感、手机通讯、社交媒体等大规模社会经济数据,其具有实时性强和高时空分辨率等优势。另一方面,机器学习、数据挖掘、网络分析等计算方法的发展,有效提升了定量感知和预测社会经济态势的能力。
新兴交叉学科计算社会经济学应运而生
这篇综述文章可以看作一个新兴的交叉学科——计算社会经济学,它基于大规模的真实数据,用定量化的手段研究社会经济发展中的各种现象,特别是与社会过程有关的经济发展问题,以及与经济发展有关的社会问题。它既可以被看作是社会经济学因为方法论的变革所形成的新分支,也可以被看作是计算社会科学因为研究对象的聚焦所形成的新分支。计算社会经济学特别强调三个关键词:“定量化”,强调用数值而非描述来刻画问题和呈现结果;“真实数据”,强调理论模型必须要服从真实数据,以对真实数据的解释和预测能力为评价准绳;“大规模”,强调尽可能获取能够直接反映全体的数据样本,即全体尺度数据。文章通过介绍大量的研究实例,描摹了社会经济学发展在方法论上正在产生的两大改变。一是为了分析遥感图像、街景照片、社交网络、文本内容这些新型数据,传统的统计分析工具无法满足需求,必须高度依赖于人工智能,特别是数据挖掘和机器学习的先进技术,例如深度学习算法。二是我们可以通过建立利用全体尺度的数据预测少量高价值数据的模型,从而可以推断出全体尺度上的高价值信息。
例如,科学家对卢旺达856名手机用户的家庭经济情况进行了详细的调查,然后通过机器学习方法,建立了利用手机数据预测家庭经济情况的模型,从而以很高的精度直接从手机数据中推测卢旺达150多万家庭的经济情况。这种结合全体尺度易获得数据,少量难以获得的高价值数据和机器学习算法,去推断全体尺度难以获得的高价值数据,是计算社会经济学研究中很有代表性的一种新方法,体现了社会科学和计算机科学理念和方法的深度融合。总体而言,社会经济学将会和数据科学、人工智能结成方法论上的深度联盟。周涛表示,长远来看,这种由大数据和人工智能发展所驱动的新理念和新方法论,毫无疑问会成为未来社会科学主流的方法论,并且将不可逆转而深刻地改变整个社会科学!