阿里云人工智能小Ai已超越了深度学习的范畴?
扫描二维码
随时随地手机看文章
在了解阿里云人工智能机器人小Ai的基本运作过程后,笔者认为小Ai的算法其实已经不仅是深度学习,而是在深度学习之上的更高阶算法,并就此向阿里云人工智能科学家闵万里求证,得到的回复:是的。
小Ai算法高阶在哪里?
尽管阿里云方面没有透露关于小Ai更多算法方面的信息,只说小Ai主要基于神经网络、社会计算(social compuTIng)、情绪感知等原理工作,善于洞察本质和实时预测,并能理解人类情感。
但是小Ai挑战歌王预测难点有三:首先,这是在7个歌手之间的混战,并非AlphaGo与李世石之间的两人对弈;其次,唱歌是情感理解加艺术欣赏,不同的唱法、变声、假声等无常法也无定论,现场演唱更是即兴创作;再次,最终结果是湖南卫视节目组、电视观众、500位大众评审、7位歌手共同创造的结果,其中充满了巨大的随机性。
简单的理解,用于AlphaGo围棋对弈、语音识别、图像识别等的深度学习算法,主要解决的是单目标优化问题,而小Ai要挑战的本质上是多目标优化问题,这从根本上就“迫使”阿里云选择更高阶的算法。闵万里告诉记者,小Ai本身是一个基于概率的决策优化过程,在决策过程中需要多组变量输入,其中的部分变量是通过深度学习优化得来。
之前,小Ai的算法已经被阿里云成功用于浙江省交通厅的路况预测,而能解决城市管理和宏观经济问题的人工智能算法都属于多目标优化算法。西方已经在城市综合管理和宏观政策制定等领域长期采用了多目标优化算法,包括模拟退火算法、遗传算法等。闵万里透露,小Ai并没有采用现成的多目标优化算法,而是自己开发的算法体系。
小Ai凭什么?
那么,小Ai凭什么能够实现高阶算法呢?这必须要提到小Ai之父、阿里云人工智能科学家闵万里。
14岁被中科大的少年班录取,闵万里19岁赴美攻读物理学硕士,2004年获得芝加哥大学统计学博士,先后在IBM Watson研究院及Google担任研究员,2013年加入阿里云负责人工智能项目小Ai。
闵万里说在IBM Watson研究院的经历让他受益匪浅。IBM最早提出智慧城市战略,也是最早看到未来趋势。2005年,IBM把PC硬件业务卖给联想后,开始自己的转型。这个转型的过程,最缺的就是海量数据分析能力,因此补充了很多相关研究项目,包括海量数据分析、关键信息提取、预测建模、机器学习等,闵万里也借此接触了一线实战案例。
之后到了Google,闵万里比较具体地负责移动端广告精准推送优化研究,主要是对海量数据进行研判,这其实已经非常接近今天小Ai要解决的问题了。移动端广告精准推送优化是互联网广告最核心的技术,需要通过大数据分析和机器学习等提升广告的精准推送,从而提高广告的点击率。
移动端广告精准推送优化数据分析包括:研判用户当前上下文网页的内容;研判用户所在地理位置——驾车状态下推送短广告、饭馆里推送复杂广告;研判用户对于推送广告的喜爱程度等。这些都属于多情景变量下的实时决策问题,与小Ai要挑战的歌王预测场景极为类似。
闵万里长期从事机器学习理论研究与应用算法研发,在脑电波(EEG)解析、高维数据挖掘、随机过程理论、时间序列分析、网络流理论等领域获得多项国际专利。他于2011年发表的道路交通流预测研究,是该领域全球五年来被引用次数最多的论文之一。
2013年,有猎头找到闵万里,希望游说他加入阿里云。当时猎头说了一句话,中国有这样一家公司,数据总量比亚马逊、eBay、Paypal加起来还多。“这一句话就已经可以说明一切了,做大数据就要来阿里。”
小Ai的研发过程
从2012年开始,阿里云研发了后来被称为“MaxCompute”的海量数据处理计算引擎,当时叫做ODPS,这是小Ai非常重要的计算基础设施。
ODPS是阿里集团30多个事业部唯一的大数据处理平台,在2015世界Sort Benchmark排序比赛中,ODPS用377秒完成了100TB的数据排序,打破了此前Apache Spark创造的1406秒纪录,创造了4项世界纪录。如今,MaxCompute可在6小时内处理100PB数据、相当于1亿部高清电影。
值得一提的是ODPS的实时计算系统StreamSQL,后来在阿里云数据加平台被称为“StreamCompute”,可日均处理万亿消息、PB级的数据以及千万级的每秒查询率QPS,适用于根据用户实时行为数据(浏览、成交、收藏等)调整推荐商品的实时推荐系统等。
阿里云方面说,小Ai的学习速度是人类的1万倍,人类需要10万小时成为某一领域的专家,小Ai只需要10小时。这其实就是基于MaxCompute和StreamCompute等阿里云大数据分析的实战平台,“阿里云的大数据分析是经过了实战检验,这是与其它平台不一样的地方。”这个平台经历了阿里上万名工程师的实战,其中包括7次双十一的考验。
在研发MaxCompute等计算平台的同时,阿里云人工智能小组还在开发深度学习、社交网络情感分析、语意分析、优化算法等人工智能算法体系。到2015年的时候,阿里云的人工智能算法在阿里各个业务场景下实现了成熟的应用,之后被抽象成通用的模块再嫁接到MaxCompute上。
“所以阿里云的人工智能模块带有明确的可应用场景,不是闭门造车。也不是我们憋了4年,就为做这件事(挑战《我是歌手》)。这其实是在阿里整个业务生态中,慢慢成长起来的。”闵万里说。
小Ai的算法体系
阿里云于2012年就开始人工智能领域的技术研发和储备。在参加湖南卫视《我是歌手》比赛之前,小Ai已经积累了不少实战经验,比如帮助光伏电厂预估发电产能减少能耗、帮助水利监管部门预测水库水位以预防灾害发生、帮助金融机构客服人员接电话、帮助阿里音乐预测音乐黑马等等。
小Ai团队除了工程师、科学家之外,还有多位阿里音乐和专业人士作为教练,学习了几百万首歌提升音乐品味和鉴赏能力。小Ai基于阿里音乐数据库,自动学习音频的重要特征后形成对歌曲的多维度评价,包括音高、能量、语谱、基频等,通过特征来训练小Ai对音频及受欢迎程度之间的关联性思维,不过目前小Ai还没有遍历韩文等外文歌曲。
那么小Ai是如何现场预测比赛结果的?小Ai从历史赛事和海量资料中寻找影响比赛结果的变量因子,训练出一个实时动态模型进行预测,包括歌曲、歌手、粉丝、现场氛围、网友讨论等维度,每种维度都通过机器学习提取海量特征。这些特征有静态的,也有跟随比赛而动态变化的,需要现场实时计算。
闵万里透露,小Ai眼里的歌手是无数标签的集合,比如李玟就有女歌手、70后、华裔、美国、偶像、性感、奥斯卡、R&B、Soul、粉丝量等标签。而现场影响评委喜好的因素非常多,小Ai需要找到这些影响因素的每一个信息变量,包括歌手演唱相关的曲风、流派、编曲、帮唱嘉宾、舞蹈、歌手颜值等现场热数据,以及场外的各种冷数据信息。再把这些信息通过一定逻辑叠加在一起,形成整体决策机制。
总结来说,小Ai要做的是去观察一切可能影响投票结果的因子,整个过程是在全空间、连续、动态地场景中,“理解人类的喜好”、“洞察人类的思考”。
与微软小冰的区别
作为同样主打“情感算法”的微软小冰,闵万里表示微软小冰与人类的一问一答对话很容易带入上下文情境,之后就可以用语言学等相关的模型进行建模和分析。而小Ai要同时理解7个歌手的混战以及音乐欣赏等超越语言的内容,这是小Ai的不同之处。
闵万里举例小Ai的算法难点,比如上一次的孙楠退赛完全出乎意料,小Ai也不可能预料到这样的事件,这对当时的模型训练造成了很大的困扰。在现场比赛的时候,什么状况都有可能发生,不管最后小Ai预测的结果如何,都是一次成功的尝试。
此外,在商业模式方面,小Ai看起来也不如微软小冰有一个比较容易的商业化路线,现在微软正把小冰变成整个微软产品与服务的人工智能基础设施。与当前盛行的深度学习算法相比,小Ai的多目标优化算法似乎也难于看到一个清晰的商业化前景。
对于商业化模式问题,闵万里说阿里有一个战略:Happiness(幸福)和Health(健康),也就是幸福指数与健康指数。小Ai的音乐和艺术欣赏能力,既跟幸福指数相关也与健康指数相关,仅仅实现这一点就已经是巨大的技术成就了。此外,小Ai的能力可以很容易泛化到商业领域,之前已经在交通管理、能源管理、天气预测等成功应用。
《我是歌手》第四季总决赛中小Ai的实时预测尝试得到了广泛关注,IBM也提前为小Ai发来了祝愿。更为重要的是,本次预测是多目标优化算法的一次挑战,可以说也是在中国首次被公众体验。
从此,人工智能揭开了新篇章。