不一样的AI:硅谷如何把AI这道热菜炒成冷饭?
扫描二维码
随时随地手机看文章
注:【 图片来源:FILI PIEKNIEWSKI'S BLOG 所有者:FILI PIEKNIEWSKI 】
在20世纪80年代,有一个神奇的地方叫硅谷。没有人知道那里即将发生什么奇妙的事情,也没人知道那里的人未来会赚多少钱。这一切都与计算机有关,它创造了奇迹,彻底改变了世界。计算机发挥着各种用途,它革新人们的办公方式、提供游戏丰富人们的娱乐,还改变我们沟通、购物和使用银行系统的方式。但在当时,它们笨拙、缓慢,并且很昂贵。除非计算机的速度和数量能再有所突破,否则这些事情就无法实现。那时,广传着一条摩尔定律——从20世纪70年代起,集成电路中的晶体管数量每18个月就会翻一番。这条定律成立如果成立,未来将是一片光明。市场期待计算机有更多新用途,财富也滚滚而来。
到20世纪90年代中期,这条定律起作用了。计算机的速度越来越快,软件也变得越来越复杂,所以每年都要进行升级才能跟上进度。新一代CPU的速度明显快于旧版。而新一代软件产品的速度虽然明显慢于旧版,但性能变得更加强大了。总的来说,通过定期升级硬件,软件的运行速度可以和以前一样,甚至更快,但性能比之前的更好。大多数增益是由于时针速度的提高(1990年代初,时针频率是33Mhz,到2000年可达1Ghz),因此,并不需要为了提升计算能力而进行重写,在新计算机中一切都运行得很快。
到了90年代末期,一种新的处理器问世了——图形处理单元(GPU)。这种新处理器与常规CPU的不同在于:它们的芯片里有许多小内核并行运作,优化后可以用来进行3d图形渲染。最初,它们作为额外的加速器出售(3dfx voodoo),但很快就与普通显卡集成(Nvidia - Riva TNT)。游戏的画质变好了,运行也快多了。硅谷大亨们又大赚了一笔。
注:【 图片来源:FILI PIEKNIEWSKI'S BLOG 所有者:FILI PIEKNIEWSKI 】
但到了2000年,情况开始有所不同。互联网泡沫破裂导致很多人亏损钱财。此外,提高时针速度的旧策略也开始碰壁:为了提高开关速度,电路的工作电压必须保持在相对较高的状态。然而,这样恰巧会让芯片升温,随后的速度增益会受到散热功能的限制。机不可失,为了让这场盛宴继续下去,CPU制造商开始增加芯片中执行核心的数量。但是,为了保留新处理器的并行性,大部分软件都要重写。这时候,随着一代又一代的更新,新芯片的发展速度已经不再震撼人心。
更糟糕的是,大部分事物已经不需要突飞猛进的发展速度了。大部分软件堆栈已经成熟,应用程序已经固化,人们不再需要每年都换一个新的CPU或2倍的内存。一切都已经饱和。如今大部分办公室的工作都可以在35美元的Raspberry Pi上完成。就连游戏领域的游戏机也基本饱和了。这些游戏机的售价低于成本价,初始投资通过游戏中的隐藏费用收回。游戏机为绝大多数人提供了方便、易用的界面和令人满意的游戏体验。这对硅谷来说是个难题,事情的发展开始放缓。
到了2000年中期,智能手机这项便利的发明让硅谷看到了一线希望。尽管PC市场开始明显放缓,但这智能手机这个新生儿却生机勃勃,并在2007年至今推出的各种型号的iphone中达到顶峰。人们对智能手机进步的关注点并不在于CPU的速度,而是电量的使用(电池寿命)和传感器/屏幕的质量。在过去10年里,手机相机和屏幕确实取得了巨大进步,但除了一个关键参与者——Apple公司以外,硅谷大亨们并没有赚的盆满钵满。相反,硅谷更专注于软件方面的业务,比如Uber、Netflix等利用新平台腾飞的服务公司。
可惜智能手机革命的火焰不会永远燃烧,这一点在一开始就非常明显。到2018年时,大多数人已经意识到自己用不着每隔一年就花1000美元来买一部新的手机,就像之前的PC电脑一样,旧型号的设备运行新程序一般都没有问题。这就导致Apple公司的股票在2018年秋季遭受重创,估值远低于1T美元。市场不断衰竭,硅谷需要新的血液。这些能够与90年代PC革命相匹敌的东西,将使全新的应用程序成为可能,并对新产业造成冲击和破坏。这将重新点燃对芯片的需求——需要更高级的计算能力。
到2012年,两个潜在的机会出现了:区块链和人工智能(AI)。区块链(2010年最初以比特币的形式出现)旨在通过删除分类账(银行)来完全取代金融系统,并提供一种建立远程交易的自认证手段。另外,构建区块链的方式还需要强大的计算能力,以计算所谓的共识机制。这就是硅谷所希望的:一个新的、高利润的应用领域,此外还需要大量新芯片来满足计算需求。
AI出现在硅谷时,大约是2012年。当时一个不知名的加拿大人Geoff Hinton与他的学生一起,在连接模型和神经网络的秘密空间中研究了30年,利用植入GPU的深度神经网络秒杀了ImageNet目标分类竞赛的对手。就像区块链一样,这项技术可以开启应用程序的新纪元,同时,还需要大量的新芯片。硅谷的许多人很快看到了它的潜力,资金开始源源不断地流入。
自上世纪90年代开始,神经网络就进入了漫漫寒冬,神经网络学者们则一直蛰伏在大学研究室。然而,他们很快就注意到了这个契机。然后,他们就开始被邀请参加硅谷各种会议。多层感应器的新化身AI一鸣惊人,在短段时间不断给人类制造惊喜:对象识别和分割,语音识别以及机器翻译。这些功能日益完善,很快就被Google和Facebook等拥有大量数据的公司所采纳。但这些惊喜所带来的兴奋很快就烟消云散。
科学家们都训练有素,擅长在拨款提案中做出不太靠谱的承诺,现在他们有了一个更加心仪的客户:风险投资家。这些人喜欢听关于美好未来的故事,而这些故事可能会彻底改变世界。他们的废话检测能力比政府资助机构低得多,只要科学家们在NIPS会议上发表的一篇论文,就足以规劝他们放弃必要的调查。然而在AI领域,这些美好的故事只需要添加一些想象力就能提升到新高度,甚至能和一些著名的科幻电影媲美,让我们仿佛身处关键的拐点。当AI达到这个奇点,它的能力将会超出我们的想象。这一切让我们生怕错过这个千载难逢的时机。
曾经,即使是上述的政府机构也会成为AI承诺下的受害者,每次都会导致资金冻结,故称为“AI寒冬”。但是,硅谷买下来这个故事,并且举办了史上最大的AI盛宴。他们在AI这件事上从未犹豫过。研发中心、非营利性实验室和初创企业开始迅速壮大起来,哪怕刚从大学毕业的深度学习科学家们没有任何从业经验。初创公司开始蓬勃发展,并向人们承诺在机器人、自动驾驶汽车、无人机等各个领域创造奇迹。而所有问题的解决方案都与深度学习有关,在更多的数据和更大的GPU上训练更深层次的网络。它的工作方式非常神奇,需要更多数据和计算支撑。于是,盛宴开始!
然而,到了2018年,开始有人意识到事情可能不会朝着预想的方向发展。大多数“真实世界”的目标识别或分割基准开始显示出明显的收益递减迹象。经过对大量数据和极其强大的机器的训练,这些模型在性能上只显示出有限的提高,在某些情况下性能根本就没有提高。科学家们没有大量生产产品,而是写了很多论文,研究了新技术令人惊讶的局限性。
在深度学习本应带来科技革命的所有方向中,唯一一个不断带来惊喜的领域只有一个——游戏。因为游戏可以在计算机上实现,并且产生的数据比在现实世界的应用程序中获得和标记的数据要多几个数量级。在许多情况下,仅仅训练玩游戏的智能体就可能花费数十万美元(仅仅是电力和计算硬件)。但是同样的情况在实际生活中并不适用,因为带标签的数据非常昂贵,而且经常甚至不能完全代表当前问题。在AI狂热中,被逐渐遗忘的 Moravec 悖论变得比以往任何时候都更加明显。虽然深度学习使许多新事物在计算机感知的广阔领域成为可能,但它甚至没有触及AI的基本问题。
自动驾驶汽车的研发是AI进步的试金石。到2016年,硅谷的许多人都相信这项技术已经准备就绪,并将成为深度学习的关键支柱之。毕竟,汽车已经可以在不受干预的情况下行驶数英里。总部位于硅谷的汽车制造商特斯拉甚至开始将这一还未正式上线的功能出售。
到了 2019 年初,这些公司开始放缓脚步,因为出现几起关于销售 vaporwave 的诉讼。与此同时,对于许多自动驾驶汽车公司而言,2018 年是艰难的一年,因为相继出现了亚利桑那州 Uber AV 车祸致死案和特斯拉的几起自动驾驶致死事故。此时,即使是硅谷里的人也开始慢慢地认识到,一辆完全自主驾驶的汽车,像出租车一样载着大家到处走,仍然是一个非常遥远的未来。汽车里仍然会装置电脑,从这个意义上说,硅谷赢了,但这与早期的梦想相去甚远。
2018年,硅谷的另一个大赌注面临严重打击:比特币,区块链的重要产品,价值暴跌超过80%。人们亏损很多钱,对加密货币的热情一落千丈。深度学习和区块链都是非常有趣的技术,它们使以前不可能的事情成为了可能。谷歌图片搜索比以前好用多了,机器翻译目前已经足够让你在异国他乡找到路,尽管离翻译诗歌还很远。这些改善似乎都不足以让硅谷下大赌注。因为这些都不像90年代的电脑狂潮那样有利可图。
至于AI,这个炒作周期与之前的并没有太大差别。我们让电脑做一些似乎只有受过教育的成年人才能做的事情,但后来意识到,这些电脑无法处理婴儿或动物认为理所当然的事情。只要我们继续落入同样的陷阱,AI(通用人工智能)将仍然是一个白日梦。
很难预测未来,但至少目前看来,这两种押注都是死胡同。或许就像Google和Facebook等互联网公司崩溃后出现的情况一样,当前炒作周期的终结将催生出类似于区块链或所谓的人工智能领域的头奖。但就像那样,只有极少数人会赢,而很多人会输得很惨。