细数2018年全球AI突破性技术
扫描二维码
随时随地手机看文章
2018年人工智能技术已在多方面实现突破进展,国内外的科技公司都在不断尝试将人工智能应用于更多领域,不论科技巨头还是初创企业,都在致力于不断创新,推动技术进步,接下来我们就来看看十项中外人工智能领域富有突破性的技术。
基于神经网络的机器翻译
入选理由:翻译是“自然语言处理”的最重要分支,也是比较难的一支。早年间,机器翻译还被视作 “低级翻译”被嘲讽,如今神经网络的机器翻译准确性大大提高,堪比专业人工翻译。我们熟知的谷歌翻译、微软语音翻译以及搜狗语音识别等都是基于此项技术。
技术突破:机器翻译是科研人员攻坚了数十年的研究领域,其技术核心是一个拥有海量结点的深度神经网络,可以自动的从语料库中学习翻译知识。
今年3月,微软宣布其研发的机器翻译系统首次在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破,将机器翻译超越人类业余译者的时间,提前了整整7年。
重大意义:基于神经网络的机器翻译,直接改善了之前逐词直译的效果,升级为以整个句子为单位进行翻译。
基于多传感器跨界融合的机器人自主导航
入选理由:机器人的终极目标是为人类提供智能化的服务,其中自主导航是近年来人类一直想要攻克的技术壁垒,臻迪(PowerVision)通过声呐、视觉等多传感器融合,使其水下机器人能实现自主导航及智能识别,在智能机器人领域内取得了突破性进展。
技术突破:随着机器人的应用场景及作业任务越来越复杂,单一传感器难以满足应用需求。而多传感器的信息融合对硬件资源依赖程度比较高,臻迪(PowerVision)基于自身在机器人行业深耕细作多年所积累的各类传感器、惯性导航、运动控制、相机、视觉检测/识别、SLAM等核心技术,以及深度学习的深入研究,通过嵌入式端一体化集成平台的系统架构及优化设计,突破了移动平台硬件资源的限制,使水下机器人更加准确、智能、全面地感知目标,并具备对水下目标进行锁定、检测、识别、跟随的能力。
重大意义:通过导航控制、声呐、视觉技术与深度学习的结合实现了机器人在全局环境中的定位及自主导航,以及智能化应用,为人类探索更为广阔的水下应用提供了强有力的技术保障。
DuerOS对话式人工智能系统
入选理由:DuerOS3.0能够为用户带来了划时代的自然对话交互,包括情感语音播报、声纹识别等能力在内的自然语言交互技术的全面升级。
技术突破:DuerOS是百度度秘事业部研发的对话式AI操作系统,拥有10大类目的250多项技能。DuerOS包括了从语音识别到语音播报再到屏幕显示的一个完整交互流程,以及背后支撑交互的自然语言理解、对话状态控制、自然语言生成、搜索等等核心技术,这些技术支撑着应用层和能力层的实现。
重大意义:DuerOS率先开启AI时代商业化,将为生态合作伙伴从产品、内容与推广三大方面提供完整的应用方案支持,加速AI设备落地。
移动AR技术
入选理由:未来AR与AI需要相互加持,可以将AR比喻成AI的眼睛。
技术突破:集成了众多计算机科技和图形图像学技术,包括实时渲染技术、空间定位追踪、图像识别、人机交互、显示技术、云端存储、数据传输、内容开发工具等领域。
重大意义:随着苹果 ARKit、谷歌 ARCore 的发布,移动AR在两大移动平台上均意义重大。这也意味着,全球 5 亿台支持 AR 功能的移动设备正在吸引所有的公司入局,这些公司正在将数据与 API 相结合,为用户创造新的 AR 体验。
生物特征识别技术
入选理由:行为识别技术应用于安防,为安全又上了一道锁。
技术突破:店铺安装摄像头已经是一件非常普遍的行为,但普通的摄像头只能纪录店铺内人们的行为,如果发现盗窃需要通过观看监控记录人工排查,耗时费力。
重大意义:通过行为识别技术,能够第一时间发现犯罪分子,预测犯罪行为,有效保护店铺安全。
机器人流程自动化
入选理由:机器人流程自动化能够帮助甚至代替人类负担大量简单且单一、重复而繁重的工作,并且效率更高、零失误。
技术突破:机器人流程自动化(RPA)是通过使用高性能认知技术实现业务的自动化和工作的效率。人类只需在操作界面上编写需要人工完成的工作流程,即可处理各种业务,如浏览器,云,以及各种软件。
重大意义:机器人流程自动化能够大幅提升企业的工作效率,减少人员投入,帮助企业降低成本,让人类释放生产力,腾出双手去做价值更高的事情。
像素级声源定位系统PixelPlayer
入选理由:从视觉和听觉信号角度实现声源分离,开辟研究新途径。
技术突破:在进行音乐编辑时,一般是利用均衡器将音乐中的低音部分调出来,而麻省理工学院计算机科学和人工智能实验室的研究人员发现了更好的解决方案。他们所研发的新系统PixelPlayer。
PixelPlayer能够通过结合声音和图像信息,机器学习系统能以无监督的方式从图像或声音中识别目标、定位图像中的目标,以及分离目标产生的声音。当我们给定一个输入视频,PixelPlayer可以联合地将配音分离为目标组件以及在图像帧上定位目标组件。PixelPlayer 允许在视频的每个像素上定位声源。
重大意义:PixelPlayer能够过滤伴奏、识别音源,不仅能帮助人类处理音乐,还能够帮助机器人更好地理解其他物体所产生的环境声音。
兼顾高精度学习和低精度推理的深度学习芯片
入选理由:这个芯片可以涵盖了目前已知的最佳训练和最好推理,能够保持所有处理器组件能够得到数据和工作。
技术突破:该深度学习芯片是IBM正在研究的项目之一。IBM将这个芯片的目标利用率定在90%。这将是一个质的突破,为了实现这一突破,IBM的研发团队做了两项创新。
重大意义:该芯片可以执行当前所有的三种主要深度学习AI:卷积神经网络(CNN)、多层感知器(MLP)和长-短期记忆(LSTM)。这些技术共同主导了语言、视觉和自然语言处理。
智能代理训练平台
入选理由:智能代理技术使计算机应用趋向人性化、个性化。它能够以主动服务的方式完成的一组操作的机动计算实体,不需要人的即时干预。
技术突破:智能代理技术具有解决问题所需的丰富知识、策略和相关数据,能够进行相关的推理和智能计算,智能代理还可以在用户没有给出十分明确的需求时推测出用户的意图、兴趣或爱好,并按最佳方式代为其完成任务,并能自动拒绝一些不合理或可能给用户带来危害的要求;智能代理还从经验中不断自我学习,能够根据环境调整自身的行为,从而提高处理问题的能力。
重大意义:Unity以使机器学习研究人员获得最强大的训练场景为使命,为快速增长的AI爱好者群体探索深度学习提供了一个研究平台。
入耳式人工智能
入选理由:耳机从外变成了智能穿戴设备,可以无限延续使用时间和场景。
技术突破:苹果在今年即将推出的AirPods 2中加入了Siri唤起、内置芯片等等,可以收集行走步数、心率数据和体温等等,还可以通过内置陀螺仪捕捉用户头部移动状况甚至定位位置,当然也可以通过麦克风接受命令,再通过扬声器进行反馈。
重大意义:智能耳机让智能助理更接近随身随行,苹果、谷歌的涉足,必将带起一波耳中AI的风潮。