谷歌在人工智能领域的发展
扫描二维码
随时随地手机看文章
自发布AI First战略后,谷歌在人工智能道路上越走越坚定。不仅有Google Assistant智能助手,还在秋季发布会上发布了包括手机、耳机和智能音箱等多款AI硬件,构建AI生态。在特斯拉CEO马斯克等不断发出AI威胁论下,谷歌则表示,专注AI的前沿研究和解决实际问题。
近几年,Google每年都会举行APAC(亚太区年度媒体会议)。作为从Mobile First战略转移到AI First的科技巨头,此次媒体会议的焦点自然是人工智能,“Made with AI”。
谷歌大脑(Google Brain)负责人Jeff Dean表示,谷歌在人工智能领域最终目标是三点:利用人工智能和机器学习让谷歌的产品更加实用(Making products more useful);帮助企业和外部开发者利用人工智能和机器学习进行创新(Helping others innovate);为研究人员提供更好的工具,以解决人类面临的重大挑战。
AI+软件+硬件
目前,机器学习在谷歌的大部分产品中都有应用。如Google Photos云端相片集,利用图像识别技术,可以提供人脸检测和照片自动分类;Google Lens基于图像识别和OCR技术,能实时识别用智能手机拍摄的物品并提供与之相关的内容;Google Maps可以通过街道、街景的数据获取更多有关地区详细的情况,还可以了解停车难易程度;Gmail 和 Inbox 在收到邮件后,智能系统会给用户提供回复建议(Smart Reply);YouTube 中的自动字幕(Auto capTIons)则是通过机器学习给超过10亿的视频自动加上字幕;Google Translator利用神经网络机器翻译(Neural Machine TranslaTIon)。
Google Assistant是2016年5月19日推出的一款语音助手,核心是语音识别。Google Assistant 工程总监Pravir Gupta表示,该产品基于 Google 在机器学习、自然语言处理和搜索领域的经验之上。
在这些产品中,谷歌翻译或许是中国用户能够使用最多的。Jeff指出,过去的翻译系统使用更简单的统计翻译模型,由 50 万行代码组成。2016年,神经网络机器翻译系统(GNMT:Google Neural Machine TranslaTIon)正式应用到谷歌翻译中。Jeff称,该系统仅由 500 行 TensorFlow 代码组成。使用新的系统后,翻译准确性得到了很大改进,“堪比过去十年取得的成果”。Jeff提到,目前翻译效果提升最明显的是日英互译。
不过,谷歌不是最早在翻译中运用神经网络机器翻译系统的企业。2016年的百度机器翻译技术开放日上,百度技术委员会联席主席、自然语言处理部技术负责人吴华博士表示,百度早在一年多前(2015年)就率先发布了世界上首个神经网络的机器翻译系统(NMT),克服了传统方法将句子分割为不同片段进行翻译的缺点,充分利用上下文信息,对句子进行整体的编码和解码,从而产生更为流畅的译文。
吴华当时称,谷歌翻译强在基于统计的机器翻译上,但是在基于神经网络的机器翻译上,百度要领先。此外,谷歌翻译以英语为中心,百度翻译以中文为中心。
构建生态很重要的一点便是要让其中各成分有机融合。谷歌也正在努力让硬件、软件以及 AI 相互结合。今年秋季发布会上,谷歌发布了九款硬件产品,包括智能音响Google Home Mini / Google Home Max,笔记本Pixelbook,智能手机Pixel 2和Pixel 2 XL,Google Pixel Buds耳机,这些新硬件都与AI有关,整合了谷歌的智能语音助理 Google Assistant,凸显了谷歌在AI领域从软件到向硬件领域的野心。
其中,Google Home还具有语音配对功能(Voice Match),通过机器学习能识别不同的语音,可使最多六个用户连接到同一台 Google Home。Google Home Max 还运用了AI 技术 Smart Sound,可依据所处位置自动调整声音品质。谷歌首款无线蓝牙耳机Pixel Buds还可便捷地接入Google翻译,运用语音识别和翻译技术,进行实时翻译。
与华为、iPhone X 智能手机采用双摄像头不同,谷歌的Pixel 2/2 XL结合了机器学习和计算摄影技术来分析图像,将主体与背景分离。虽然只使用一枚摄像头,也具备人像模式功能,在拍摄人像时可柔和虚化背景。通常,这需要多镜头的专业相机。
除了内部产品使用AI,谷歌也为企业及开发者提供三种创新工具:TensorFlow,云机器学习 API (Cloud Machine Learning APIs) 以及张量处理器 (Tensor Processing Unit, TPU) 电脑芯片。
Google 在 2015年发布了人工智能系统TensorFlow并宣布开源,之后TensorFlow成为了开源社区GitHub上最受欢迎的机器学习工具。除了TensorFlow,其他的深度学习工具还有Caffe, CNTK,Theano等。而在中国,2016年9月,百度也宣布其深度学习开源平台PaddlePaddle在Github及百度大脑平台开放。
面对这些竞争,Jeff在媒体交流会上回应称,每个平台都有各自优点和缺点,针对不同的人群,这样的竞争是好的。“Tensorflow开源软件基于Apache 2.0许可证,无论是大企业还是初创企业,每个人都可以利用它做自己想做的事情。这可能是Tensorflow成功的原因之一。我们看到一个很健康的生态系统,我们也从其他的开源平台当中学到了很多,不断改善Tensorflow平台,让这个平台更好。”
专注现实和研究问题
机器学习是谷歌在人工智能领域的工作重心。谷歌认为,编写能使计算机自主学习如何变得智能的程序,要比直接编写智能程序更好。但是,随着机器变得越来越智能,机器会不会哪天真的有意识,进而取代人类?特斯拉CEO 埃隆·马斯克(Elon Musk)和英国著名物理学家霍金都对AI发出过警告。
而Jeff认为,这些担心太远了,“我们在部署安全的AI系统的时候也可以利用其中很多的技术,我觉得这可能会是短期我们最需要关注的领域。现在的一些担心还为时过早。我们现在应该着眼于解决眼前的问题。”这也是上文提及的谷歌AI三大目标之一:解决人类面临的重大挑战(solving humanity’s big challenges)。
目前,谷歌正在利用机器学习解决如医疗保舰能源和环境保护问题等问题。例如,谷歌医疗成像团队产品经理与印度、泰国和美国的一些医院合作开发一种工具,可以通过机器学习帮助诊断糖尿病所引起的眼部疾玻在保护鸟类方面,研究员Victor Anton 收集了 5 万个小时的音频并将其转换成谱图,通过 TensorFlow 更加快速高效地分析这些音频,识别谱图中的鸟鸣声。
对于AI带来的失业问题,Jeff则表示,过去两百年的技术发展都会遇到这样的问题,他对此持乐观态度,“每次技术有了新的发展,代替了人力劳动,我们就会有一个新的、有意思的专业领域驾驭这个技术。我们会有新的工作,目前我们可能想象不出来。谁能够想到社交媒体会出现?发生以前是想象不到的。”
不担心竞争对手 继续在中国招人
Google 母公司Alphabet董事长、谷歌前CEO埃里克·施密特(Eric Emerson Schmidt)在人工智能与全球安全峰会上对新美国安全中心的保罗·沙雷说:“我认为,我们(美国)在未来5年内将继续保持领先地位,然后,中国将迅速赶上来。”
埃里克的这一观点源于中国政府发布的《新一代人工智能发展规划》,规划提出,到2020年,中国人工智能总体技术和应用与世界先进水平同步;到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平;到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
面对中美AI竞赛问题,Jeff表示,目前全球很多公司对机器学习以及AI感兴趣,很多政府非常清楚AI的潜力,分阶段、务实地进行研究,建立生态系统。“中国政府倡导AI,并制定政策;美国政府可能不像中国这么有组织,但是我们(美国)也有很多在公司、学术界发生的研究,也有生态系统。”
机器学习和AI不仅影响着计算科学,还涉及到各行各业。因此,在世界范围内,一些政府和公司都在招募相关人才,这也直接带来了人才储备的竞争。另一方面,还涉及到AI人才的培训问题。Jeff称,“我相信随着时间推移,会有更多人有这样的相关技能,他们可以通过这个技能解决很多问题。”
谷歌如何看待百度之类的竞争者?Jeff表示,谷歌主要关注下一代前沿研究问题,雇佣人才,并为他们提供最好的计算机硬件去解决实际的、有意思的问题。“我们并不担心竞争对手,我们关心的是我们自己的研究”,他还补充称,谷歌也将在上海、北京持续招聘AI相关人才。
在2016年乌镇的围棋峰会上,Google首次对外承认在中国招人组建AI团队。相关的招聘岗位有机器学习软件工程师、机器学习技术主管、机器学习研究员、云端机器学习产品经理等。不过招聘信息上并未显示招聘人数,谷歌方面表示,没有具体统计过中国地区AI员工数量。