当前位置:首页 > 芯闻号 > 充电吧
[导读]我们的人生轨迹可能受家庭、社会、时代影响,也因大大小小的决定被改变。我们无法预知的未来,AI 可以准确地预测吗? 来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的 160

我们的人生轨迹可能受家庭、社会、时代影响,也因大大小小的决定被改变。我们无法预知的未来,AI 可以准确地预测吗?

来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的 160 个研究小组参与了“脆弱家庭挑战赛”(Fragile Families Challenge),通过建立统计和机器学习模型,试图预测、衡量美国各地儿童、父母及其家庭的人生轨迹,寻求上述问题的答案。

当地时间 2020 年 3 月 30 日,这一挑战赛的研究成果在线发表于《美国国家科学院院刊》,论文题为 Measuring the predictability of life outcomes with a scientific mass collaboration(通过科学合作探究人生轨迹的可预测性),合著者多达 112 位。

来自 4000 余个家庭的大样本数据集

实际上,探究人生轨迹,更像是一个社会学问题。这不仅仅是预测未来那么简单,它在提供家庭援助、了解社会僵化程度、改善相关政策方面都有一定的参考意义。

这一研究基于一个名为“脆弱家庭与儿童健康研究”(Fragile Families and Child Wellbeing Study)的高质量出生队列数据集—;—;由社会科学家 15 年来收集的大样本数据集,包含来自 4000 多个家庭的 1.3 万个数据点。

研究人员对出生于 1998-2000 年间美国大城市的儿童进行了研究,其中未婚父母所生儿童的占比较大。不难看出,这一纵向研究的目的也在于了解出生在未婚家庭的孩子的生活。

具体来讲,随着孩子年龄的增长,相关数据总共收录了 6 个阶段的情况—;—;小孩刚出生时、1 岁、3 岁、5 岁、9 岁和 15 岁。

值得一提的是,每个年龄段数据收集的范围不同。比如,孩子刚出生时,仅仅收集父母的调查访谈信息;孩子 9 岁时,需要对父母、孩子的主要照顾者(如果不是父母的话)、老师和孩子自己都进行调查访谈,进而收集信息(如下图)。

此外,针对不同年龄段,研究人员对数据的关注方向不一。

例如,孩子刚出生时,对母亲的采访主要涉及儿童健康与发展、父母关系、父亲身份、父母对婚姻的态度、与家人的关系、环境和政策因素、健康状况、人口特征、教育程度、就业及收入情况;而在孩子 9 岁时,对孩子本人的采访主要涉及的话题有父母关系、父母的要求及督促孩子的情况、与兄弟姐妹的关系、日常生活、在校情况、青少年犯罪倾向、任务完成和行为表现及健康、安全状况。

脆弱家庭挑战赛

实际上,这一名为“脆弱家庭挑战赛”的项目可以说是一款游戏—;—;游戏开发者是项目组织者,玩家是参与进来的各个研究团队。

而游戏设定是,项目组织者不公开上述家庭中孩子们 15 岁时的数据,各个研究团队可利用任意的 AI 模型高能玩法准确预测孩子们 15 岁时的人生发展。开发者为玩家提供了 6 种衡量维度,如孩子们的平均学习成绩、孩子们的毅力、家庭经济水平、孩子的主要照顾者的工作和接受培训情况等,玩家需要预测其中的至少一个维度。

如下图,这一研究的背景数据包括来自 4242 个家庭的孩子刚出生时、1 岁、3 岁、5 岁和 9 岁时的共 12942 个变量。而训练数据即是孩子们 15 岁时的 6 种人生轨迹。

实际上,这一游戏设计思路正是计算机科学领域常用的一种研究设计方法「共同任务法」。

雷锋网了解到,项目组织者收到了来自全球 68 所大学的 457 份申请,最终这一项目由全球 160 个研究小组协同开展。挑战赛于 2017 年 3 月 5 日至 2017 年 8 月 1 日展开,参与者只要将预测结果上传至挑战赛官网即可。


脆弱家庭挑战赛官网

在脆弱家庭挑战赛结束后,组织者将 160 个团队的结果进行分析比较,发现各团队使用了不同的数据处理、统计学习等技术来生成预测,虽然各个团队得到的预测结果之间相差不大,但各预测结果普遍与真实情况差距较大,即便是最准确的预测结果也与训练数据的实际情况存在不小的差距。

如下图,研究团队对家庭经济水平、孩子们平均学习成绩的平均预测准确度在 0.2 上下浮动,而对其他几种维度的预测准确度平均约 0.05(雷锋网注:值越接近 1,吻合程度越高;越接近 0,则吻合程度越低)。

当然不可否认的是,各团队对部分预测也是准确的,比如具体某个孩子的学习成绩。

目前看来,我们可以回答文章开头的那个问题了—;—;AI 并不能很准确地预测人生轨迹。

这一结论对 AI 模型在刑事司法、儿童保护服务等场景的应用带来了启示,同时社会学家、数据科学家今后也应谨慎使用 AI 预测模型。正如普林斯顿大学和哥伦比亚大学 “脆弱家庭与儿童健康研究”首席研究员 Sara McLanahan 所说:结果令人大开眼界,要么运气在我们的生活中扮演着重要角色,要么我们作为社会科学家在研究中忽略了一些重要变量。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭