为何说预测是机器智能的本质
扫描二维码
随时随地手机看文章
机器学习和智能都植根于预测,这是巧合吗?
当我们的技术体现了智能的本质时,我们正在接近一个紧要关头吗?或者说我们仍然处于长期的错误观念之中?如果它确实是一个由许多部分组成的系统的本质,是什么把预测提升到至关重要的地位?
以色列历史学家哈拉瑞(Yuval Noah Harari)建议我们研究历史,以放松对过去的控制,“研究历史不会告诉我们应该选择什么,但至少它给了我们更多的选择”。如果你在人工智能行业中绘制一个路线图,那么调查这些选项是有意义的。通过追踪马库斯·胡特、谢恩·莱格、杰夫·霍金斯和杨立昆的工作,我们就能深入了解为什么机器学习能强烈吸引着我们。杨立昆曾说:预测是智慧的本质
技术塑造了我们对智能的解释
历史上,每个时代的主导技术都塑造了我们对智能以何种方式工作的解释。古希腊的水力技术与“体液”的流动原理有着异曲同工之妙,“体液”决定了我们的身体状态和心智功能。机械时代放大了人类是机器的观念,包括大脑中的运动也未能幸免。进入电力和通讯时代后,大脑变成了一个电话总机,进入计算时代后,大脑又成了一个信息处理器。
在这个人工智能时代,许多人认为预测和学习是智能的本质。预测和学习也是机器学习的主要功能性组成部分,这是这个时代的主要技术。
因此,为什么预测是智能的本质的一个可能的解释是,我们的工具是预测的引擎。在这个历史背景下,事物的本质不在于预测的价值,更多的是在于关于跳出我们的工具去进行思考的困难。无可否认,这段历史很有趣,但这不是对这一想法的一种毁灭性的控诉,不论是从内部原因来说还是就事物的本质来说。预测很可能确实是智能的本质,当我们的技术达到我们智慧的本质的水平时,我们正在不断靠近这个巨大的里程碑。为了权衡这个观点,我们需要更直接地解决这个问题。
一种狭隘的智能
为了识别本质,我们需要分析一些重要的方面。要从这一概念抽离出不同的目标、目的、属性和本质,此时此刻所值得强调的是智能的概念所带来的非凡的自由。
当威廉·加尔文探究《智能的崛起》(The Emergence of Intelligence)时,他发现本质并不总是与预测联系在一起。“对大多数观察者来说,智能的本质是聪慧,是解决新问题的一种多功能性。”虽然他表达了对远见和预言的重要性的个人倾向性,但他的调查包含了一系列互补的行为,如探索、创造力和多功能性。
“我们永远不会同意对智能的普遍定义,因为它是一个开放的词,就像意识这个词一样。”威廉·加尔文说,他总结道,找到一个关于智能的单一定义这样的任务是徒劳的。
事实证明,那些追求机器智能的人并没有因此而却步。尽管它可能并不满足所有人的需求和不同的目的,但一个社区可能会围绕一个简化的概念而团结起来。这些基本的选择可能会反过来将智能的基本属性带入到大众视野之中。这就是我们接下来要看到的。
机器智能的定义
谢恩·莱格和马库斯·胡特对社区将目光集中在机器智能定义上提供了一大助力。他们承认在开发一个高度抽象但又普遍的概念的过程中遇到了困难。然而,他们目标明确,就是要让机器智能成为一个自主的目标搜索系统,最后他们克服了这个挑战。
莱格和胡特通过一项关于智能的专家意见的调查,得出了他们的定义。考虑到他们对于概念的通用性的追求,他们寻求的是一种包含自然智能和人工智能的定义。根据他们的目标,智能的基本特征被提取进了一个普遍的定义中:智能是衡量一个代理人在广泛的环境中实现目标的能力。
从历史的角度来看,我们不仅是在用我们的技术的概念来思考智能,我们也在以一种非常明确的方式来思考。如果这个循环令人不安,莱格和胡特也承认会有这种问题。
然而,他们的结论是通过将他们的研究结果与专家对包括自然智能在内的智能所给出的定义相关联,并表明他们的工作与普遍最优学习代理的理论一致而得出的,“我们所做的远远超出了仅仅重申基本的强化学习理论”。
然而,这仍然存在一个问题:为什么预测是智能的本质。机器智能是一种由功能部件组合而成的系统。将其中一个部分表示为不可缺少的部分可能看起来很奇怪:大概,所有组成这个系统的部件都是不可或缺的。是什么把预测提升为这一切的本质?
预测是机器智能的本质
在一个系统的上下文中,本质的意义可以被更好地理解为“缺失的环节”,即解决这个难题的元素。在他的通用人工智能理论中,马库斯·胡特通过“普遍归纳、概率规划和强化学习的思想的统一”,着手解决机器智能的问题。顺序决策理论和索洛莫诺夫的普遍归纳理论的结合,为在已知和未知环境中的理性代理提供了理论依据。
马库斯·胡特,提出通用人工智能的十年
值得注意的是胡特有关价值的陈述。在成功的标准中,他的理论抓住了上面讨论的智能的非正式定义,这理论植根于一个归纳推理的理论。在另一篇文章中,我研究了归纳法如何驱动人工智能理论和方法。
在机器智能的理论中,我们已经深入理解了为什么预测是一种本质的东西。归纳推理是一个预测过程,解决了理性的代理人如何在未知的环境中实现他们的目标的问题。
机器学习是一种归纳推理的过程,从具体的例子中得出一般结论,预测是机器学习的本质。这一解释与历史期望没有偏离,二者如出一辙。莱格和胡特认为他们的方法是“明显的功能性”方法。重要的是目标和代理人可衡量的表现。他们为意识、情感和创造力等无法衡量的方面可剥离开来而兴高采烈。类似于任何拟人化的同情或对自然智能的诉求,他们对创造一个“人造人”毫无兴趣。
另一些人则认为,只有通过一种自然智能的逆向工程,人工智能才会被实现。在他们的世界观中,预测是智能的本质?在他的《人工智能的未来》(On Intelligence)一书中,杰夫·霍金斯提出,预测提供了一种重要的智能衡量方法,以理解的概念为框架。引用Searle所熟悉的“中文房间”思想实验(在上面讨论的功能观点中没有实际意义的问题),霍金斯解释说,理解包含了记忆的方面。智能需要内在的表征和经验的处理。(中文房间(Chinese room)又称作华语房间,是由美国哲学家约翰·希尔勒(John Searle)在1980年设计的一个思维试验以推翻强人工智能(机能主义)提出的过强主张:只要计算机拥有了适当的程序,理论上就可以说计算机拥有它的认知状态以及可以像人一样地进行理解活动。)
杰夫·霍金斯,《人工智能的未来》(On Intelligence)
在霍金斯的理论中,预测是根据对将要发生的事情的预期来评估。人类的大脑皮层是由数百万列组成的,每一列都由一组神经元组成。(再一次,回想起我们的工具的摆动,这提醒了霍金斯,一个训练有素的工程师,想到了一个硅芯片的架构)。
这些结构的一致性暗示了一个单一的算法或原则,在这些结构中,这些列构成了预测的单元。在这个记忆预测框架中,预测是智能的本质。即使在这个预测记忆框架内,预测作为本质的想法也很难确定。虽然人们永远活在未来,但正在进行中的功能应当更恰当地描述为“繁荣”,而不是“预测”。我们不断地评估我们对世界的内在解释,而不是那些相对稀少的、意想不到的观察。
加里·马库斯等批评人士认为,霍金斯的模型过于简单化,只对大脑中已知的一些机制进行了抽象化描述;他指出,许多其他方面仍然是一个谜。(这并不是说马库斯是主流机器学习的倡导者,他相信“机器学习有一种偏见,那就是假定一切都是学来的”)。其他研究人员,如杰夫·迪恩和德米斯·哈萨比斯,似乎更赞同霍金斯在自然中的灵感,如果他们没有必要为他的想法的可行性或可实现性而鼓掌。
正如人们所预料的那样,智能的复杂性和设计解决方案所需要的不可避免的妥协创造了断层线。这就导致了社区之间的冲突,就像最近在杨立昆、尤夫·戈德堡和其他代表深度学习和NLP(自然语言处理)社区的代表人物之间的公开辩论中一样,副标题是“for fucks sake, DL people, leave language alone and stop saying you solve it”。当我们把现实看做一个客观的仲裁者时,智能的本质就变得越来越不清楚了。最终,要理解为什么预测是智能的本质,我们需要诉诸于公众舆论和业内最有影响力的人。
一个问题变成了一个迷因
在这个故事的大部分都关于,无论是在追求机器智能还是研究自然智能的过程中,预测是否是智能的本质的问题是一个相对模糊、实用的考量,然后这个问题变成了一个迷因。这种转变可以通过一系列的事件来追溯。机器智能作为归纳推理的愿景在深度学习中应用后,成为了一种非常成功的方法。这一方法的先驱,如杨立昆,约书亚·本吉奥和杰弗里·辛顿,经过几十年的研究后,因为后来所发生的事情,他们成为了极为有影响力的预言家。
在注意力不集中的情况下,复杂的问题必然会被简化,并被剥夺它们的历史价值。为了向大量的新受众进行教育和推广他们的研究议程,复杂的问题被简化为一种适合于推文、声音片段和演讲稿的形式。
当迷因变成教条
像杨立昆这样的人工智能明星站起来发表宣言时,在整个行业中都产生了反响。比如在2015年,杨立昆说:“预测是智能的本质,而这正是我们想要做的”。而杨立昆想要做的是影响和约束许多人的思想领导和研发议程。
杨立昆认为人工智能问题的关键在于“不确定性下的预测”,这与上面讨论的功能观点有相似之处。在2016年神经信息处理系统大会的主题演讲中,预测学习的中心角色——学习预测模型——被强调为取得进展的必要步骤。主要的技术难题是“世界只是部分可预测的”。
杨立昆,2016年神经信息处理系统大会
正如杨立昆勾勒出的路线图,预测框架会带来一系列的挑战,即使是在那些与预测无关的领域。例如,常识被描述为,“不论有什么可用信息,都能预测过去、现在或未来的任何信息。”
正如上面所讨论的霍金斯的预测-记忆二象性,功能框架可能从预测转移到其他技术,例如表示、记忆或推理。但为什么要把拒绝成功?这是锤子法则,就是把一切都看成是钉子。当作为事物的本质时,预测不仅是描述性的,而且是衡量的标准,而且是对解决方案本身的规定。当一个对此崇拜的社区对其进行规定的时候,这个问题就不再被质疑了。它成了真理。
为什么预测是智能的本质
主流技术对我们如何理解世界和我们自己有着巨大的影响。纵观历史,液压、蒸汽机和计算机等技术已经塑造了我们对智能的解释。这种强大的力量今天仍在继续。机器学习是一种概念框架,它解释了为什么预测是智能的本质。
像智能这样的复杂概念在它被工程化之前就必须被简化。仅仅是属性和成功标准的一个子集便可以被抽象出来以适应需求。虽然一个单一的定义不能满足所有人,但是一个实践型的社区可能会围绕这个简化的概念而团结起来。对于一个社区来说,围绕着机器智能作为一个自主的、目标搜索的系统的愿景便可达成共识。通过设计,这种智能的定义是在机器智能如何被实现和测量的预期中精心塑造的。
在这个架构框架中,归纳推理这一预测过程,为理性的代理人如何在未知的环境中实现他们的目标提供了一个解决方案。预测也是机器学习的本质,这是一个归纳推理的过程。
这种简化和专注虽然有效,但也具有内在的争议性。智能的复杂性提供了强调许多目的、理论和架构的自由。因此,人工智能是一种非常多样化的研究和技术集合,其中许多研究和技术都与主流观点相左。
然而,有力量便有话语权。机器学习,尤其是深度学习,已经成为最成功和最具统治力的技术,这掩盖了人工智能其他的每一个方面。就像智力的概念被缩减为一个简化的、实用的定义一样,在许多人看来,人工智能已经被简化为机器学习,后又进一步简化为深度学习。在这种世界观中,预测确实是本质。
成功也带来了力量和影响力。经过几十年的研究,深度学习的先驱们被提升到了先知的地位。他们的声明成为了推文、配乐和演讲稿中不加选择的素材;他们的研究议程和路线图为整个行业奠定了基础。
考虑到这些概念的可理解性,机器智能的任何功能缺口都可能被认为是一个预测的问题。如果你的路线图根植于预测的本质,那么锤子法则就表明了这是一个预测问题。当你以一种规定性的方式对一个崇拜它的行业提出质疑时,这个问题就不再被质疑了,它变成了真理。
预测是智能的本质,它将一直存在,直到更主流的技术告诉我们其他的东西。