“改变”宇宙之前,GPT-3 最先改变的可能是 OpenAI
扫描二维码
随时随地手机看文章
GPT-3 是人工智能研究实验室 OpenAI 的最新成果。它是有史以来规模最大的语言模型,引发了一系列关于人工智能将如何快速改变众多行业的讨论。
但是,很少有人去讨论 GPT-3 是如何改变 OpenAI 本身的。在创建有史以来最成功的自然语言处理系统的过程中,OpenAI 已逐渐从一个非盈利性人工智能实验室演化成一家出售人工智能服务的公司。
由于纠缠在两个相互矛盾的目标之间,该实验室处于一种不稳定的状态。一方面要开发有利可图的人工智能服务,另一方面又要探索人类级别的人工智能并造福所有人。在这之间寻求平衡是 OpenAI 成立的特殊使命。
OpenAI 构架的变化2019 年 3 月,OpenAI 宣布它将从非营利实验室转变为 “盈利设限”公司。这种模式为从投资者和大型科技公司筹集资金开辟了道路,投资方被告知他们的回报将以投资额的 100 倍为上限(这上限够诱人!)。
为什么会发生这样的架构变化?该公司在一篇网站告示中宣布,此举旨在 “迅速增加我们在算力和人才方面的投资以平衡实现公司使命所需要的支出。”
“算力和人才”是这里的关键词。
人才和算力成本是人工智能研究的两个核心挑战。从事 OpenAI 这类研究的人才库非常有限。鉴于对人工智能商业化的兴趣日益浓厚,大型科技公司之间在为自己的项目招募人工智能研究人员时存在激烈的竞争。这引发了一场军备竞赛,每家科技巨头都给出更高的薪水和津贴以吸引人工智能研究人员。
Google 和 Facebook 抢走了 3 位深度学习鼻祖中的 2 位,即 Geoffrey Hinton 和 Yann LeCun。备受尊敬的人工智能专家 Ian Goodfellow(同时也是对抗式生成网络 GAN 的发明者)就职于 Apple,另一位人工智能天才 Andrej Karpathy 在 Tesla 工作。
OpenAI 对科学研究仍然有浓厚的兴趣,但是随着大多数人工智能人才被吸引到可以提供丰厚薪水的公司,非营利性人工智能实验室发现要填补他们的职位空缺越来越难,除非他们能够提供类似水平的薪水。根据 2018 年的报道,只有少数 OpenAI 的研究人员每年能获得超过 100 万美元的收入,而报告称另一家人工智能研究实验室 DeepMind 在 2018 年向 700 名员工支付了超过 4.83 亿美元的薪水。
深度学习算法是人工神经网络的主要组成部分,而其算力需求是导致人工智能成本进一步增加的主要原因。在能够胜任实际任务之前,神经网络必须对利用大量案例进行训练,这一过程需要昂贵的计算资源。近些年 OpenAI 参与了一些非常昂贵的人工智能项目,包括通过机械手臂玩转 Rubik 魔方,通过扮演游戏对手击败 Dota2 冠军,以及一组人工智能扮演不同角色玩 500 万次捉迷藏游戏。
据估计,训练 GPT-3 至少需要 460 万美元。需要明确的是,训练深度学习模型并不是一个纯粹的一次性的过程。反复的试验、意外的错误和超参数调整可能会使成本增加数倍。
OpenAI 并不是第一个采用商业模式的人工智能研究实验室。面对类似的困境,DeepMind 在 2014 年接受了 Google 提出的 6.5 亿美元的收购提议。
OpenAI 领导层的变化在联合创始人之一 Sam Altman 的领导下,OpenAI 开始向投资者开放市场化营销,他辞去了备受推崇的创业加速器 Y Combinator 的总裁一职并成为 OpenAI 的首席执行官。
在 Altman 之前,Greg Brockman 是该组织的代表。Brockman 是 OpenAI 的联合创始人兼 CTO,同时也是一位经验丰富的科学家和工程师。
在科技投资领域,声誉和产品管理能力比科学天才更受重视,而 Altman 正是那种受投资者信任,并能把资金交给他管理的人。在 Y Combinator 任职期间,他帮助创立了许多成功的公司,包括 Airbnb 和 Dropbox。
2019 年 5 月,在接受知名科技媒体 TechCrunch 采访时,Altman 说:“我们从未取得任何收益,目前也没有赚钱的计划。也许某一天我们会赚到钱,但我们并不知道如何做。”
但这并没有妨碍投资者对 OpenAI 大笔投资。微软相信 Altman 会以某种方式找到使投资获利的方法,因此他们在 7 月向该公司提供了 10 亿美元的投资。
OpenAI 任务的改变但是,技术投资公司和类似 OpenAI 这样的科学研究实验室是存在根本上的冲突的。
OpenAI 的既定使命是确保能够 “构建安全的通用人工智能(AGI)并向全世界分享这项技术来惠及全人类”。
但是根据专家估计,要想实现 AGI 这个崇高的目标至少需要几十年的时间,而科技投资者的耐心极少能有那么久。如果几年之内其投资无法得到回报,他们将会变得懈怠。对于这一点只需要看看著名的 Boston Dynamics(波士顿动力公司),尽管在 YouTube 上发布的机器人视频像病毒似的疯狂传播,但筹资者已经几度易手。
那么,OpenAI 如何能够在保持 AGI 研究的同时获得资助者青睐?
“OpenAI 正在开发一系列功能越来越强大的人工智能技术,这需要大量资金以支撑算力。想要覆盖这些成本最显而易见的方法是制造出一个产品,但这将意味着我们工作重心的转移。我们选择了折中的方法,我们打算推出部分 “准 AGI”技术,而微软成为我们将这些 “准 AGI 技术”商业化的首选合作伙伴,”OpenAI 在宣布获得 Microsoft 投资的博客公告中写道。
相关链接:
https://openai.com/blog/microsoft/
但是有明显迹象表明,OpenAI 至少部分地成为了一家产品公司。
GPT-3 的商业版本2020 年 5 月,Microsoft 宣布与 OpenAI 合作并专门为 OpenAI 建设世界前五名级别的超级计算机,由此 Microsoft 可以充分挖掘 OpenAI 的才能来创建 Altman 所说的 “我们的梦想系统”。超级计算机一方面将帮助 OpenAI 训练其深度学习模型,另一方面还将为 Microsoft Azure 云计算平台的其他客户提供服务。
此后不到两周,OpenAI 在 arXiv(论文预印本网站)上发表了第一版的 GPT-3 论文。与之前的 GPT-2 不同,GPT-3 不会向公众发布。OpenAI 选择了商业发布,开发人员可以通过应用程序编程接口(API)购买对 GPT-3 的访问权限。
OpenAI 的 API 公告于 6 月 11 日发布,一些开发人员可以获得相关技术的早期访问权限。
这使 GPT-3 与微软认知服务(Microsoft Cognitive Services)十分相似,后者是一个基于黑盒子的人工智能云平台,通过 API 接口向开发人员提供计算机视觉、自然语言处理和其他人工智能类功能,同时无需提供后台运行的模型的实际细节。
这至少将帮助 OpenAI 返还 Microsoft 投资的一部分,同时 Microsoft 也将从双方合作中受益并更深入地应用该项技术,能够将其与 Bing,Office 365,Outlook.com 和 Teams 等产品集成。
GPT-3 的商业发布使 OpenAI 与成为人工智能产品公司更近了一步,而与非盈利性人工智能科学研究的初衷越发偏离。
淡化人工智能警告在开发出 GPT-2 后,基于对 “技术的恶意应用”(例如散布垃圾邮件和虚假新闻)的担忧,OpenAI 团队决定不向公众发布。取而代之的是采用了分阶段的方法,先发布了一个较小版本的人工智能模型并进行了评估,之后才发布了较大的模型。
虽然当时的作者认为性能良好的语言模型不会造成假新闻的泛滥,但他也支持在发布技术之前先认真地思考一下这种技术可能带来的后果。
GPT-3 比 GPT-2 大三个数量级。在深度学习的语言模型中,关键问题之一是记忆广度。随着神经网络生成的文本变长,人工智能开始失去连贯性。实验表明,较大的神经网络通常具有较长的记忆广度,这意味着 GPT-3 中被误用的可能性比 GPT-2 要大得多。
但是这次 OpenAI 并没有为 GPT-3 可能成为制造垃圾邮件机的和虚假新闻的武器而大声疾呼。相反,OpenAI 高管们试图淡化有关 GPT-3 的警告。7 月,Sam Altman 在一条推文中删除了 “ GPT-3 宣传”。
Altman 的评论大部分是正确的,因为人工智能在达到人类智力水平之前还有一段路要走。GPT-3 的许多实验表明,尽管取得了令人着迷的进步,但语言模型仍然难以解决一些体现智能的基本任务。
尽管如此,Altman 的言论依然可以表明公司高管向投资者保证一切都在控制之中。
作为产品公司的 OpenAIGPT-3 自发布以来受到了技术界的广泛好评。许多开发人员和企业家都发布了 GPT-3 自动生成内容的推文,例如诗歌、模因(文化的基本单位,与基因在生物进化过程中所起的作用相类似)、推文和网站模型。
一位开发人员甚至设法用 GPT-3 生成 Python 代码用来搭建深度学习模型。
GPT-3 具有明显的优势,并有可能成为人工智能业务的转折点。深度学习的主要限制之一在于它是狭义的人工智能系统。它在特定的任务上可以表现很好,但推广到其他领域中就表现不佳了。想要创建一个新的深度学习应用程序,就必须从零开始训练模型或运用迁移学习对新任务的预训练模型进行参数微调。
这种限制阻碍了人工智能服务作为平台的发展。尽管 GPT-3 仍然属于狭义的人工智能领域,但事实证明,它在许多没有学习样本的训练中依然能够运行。这就意味着你无需重新调整参数,它也能适应新的应用程序。
这种功能已经催生了许多运用人工智能模型创造新服务的点子。Debuild.co 就是这样一个通过 GPT-3 创建 Web 应用程序的公司。
帮助租户研究潜在房东的公司 Augrented,正在探索通过 GPT-3 撰写法律告示或其他简单的英语声明,帮助租户捍卫自己的权利。
OthersideAI 也在运用 GPT-3 向用户提供创意工具。
GPT-3 最终可能会成为一个新平台,在此平台上将创建新的业务和生态系统。这对于 Altman 是成功的,但是它会使 OpenAI 成为一个产品 / 服务公司,这与发布开源人工智能模型并让开发人员用它来做自己的事情是完全不同的。
现阶段的 OpenAI 需满足客户需求,扩展其基础架构,处理合规性问题等。随着人工智能模式成为初创公司生死攸关的力量,OpenAI 还必须能够应对开展深度学习业务所带来的特定挑战。OpenAI 仍有许多问题需要处理,如消除有害偏差,解决模型衰减等等。这些都是成本极其高昂的任务,处理 1750 亿参数的深度学习模型尤为如此。
与此同时,OpenAI 在需要弄清如何解决这些事情的同时,还需保持盈利。
尽管 Altman 是一位非常成功的企业家,他也无法单打独斗。随着 OpenAI 进一步涉足产品管理领域,它将需要 Microsoft 的更多帮助。
OpenAI 已经在依靠 Microsoft 的云架构来训练和运行其模型,但不久的将来,它可能需要这家技术巨头来协助处理合法性、客户支持、安全隐私、产品扩展等其他问题。
OpenAI 的未来旧金山 OpenAI 总部
OpenAI 的故事描绘出了科学人工智能研究面临的挑战。目前,人们普遍认为更大的深度学习模型将发展出更先进的人工智能系统。这意味着人工智能研究实验室需要大量资金吸引人才来训练他们日益庞大的深度学习模型。
目前,唯一愿意提供资金的是那些大型高科技公司,但投资者同样希望获得投资回报,这就迫使研究实验室不得不利用部分资源来创造有利可图的产品。如此一来,大型公司可能会完全将实验室纳入自己的商业目标。
在 Google 收购 DeepMind 之后,我们已经看到了这种趋势:人工智能实验室必须将资源同时分配给 AGI 研究部门和致力于创造可盈利产品的 “应用人工智能”部门,但是该公司尚未实现收支平衡。
至于 OpenAI,它现在还发展的很好。越是困于将人工智能服务商业化,不忘初心就越难。它是会坚持维持研究人类智力水平的人工智能的透明性、坚持开放源代码性质,还是会倾向于通过生产商业实体,并将其研究作为公司的机密和知识产权予以严密保护?它是会坚持 “以人为本”,还是以满足投资者(及未来所有者)作为其主要关注点?
时间会证明一切。
相关报道:
https://bdtechtalks.com/2020/08/17/openai-gpt-3-commercial-ai/