阿里布局AI第二个60年:阿里云+新实体经济数据
扫描二维码
随时随地手机看文章
阿里的野心是庞大的,自他建立阿里达摩院的计划就可以知道。阿里关注现在,发展未来。马云曾说,就算阿里巴巴不在了,阿里达摩院会依然存在。今年,可以算是人工智能技术的第二个60年的开始,阿里早就开始了布局。
2017年是全球人工智能第二个60年的开始。与十几年前的人工智能相比,今天人工智能更多是数据驱动。以前的人工智能是人工编写的专家系统、由“人工”指导实现智能,系统处理的水平不会超过程序本身;而现在的人工智能则是数据指导的智能,每天都在进步的程序已经开始超越人类的极限,这就是人工智能的“奇点效应”。人工智能的第二个60年,谁能掌握更多的源自现实和实体经济数据,谁就是人工智能新60年的赢家。
在2016年10月的阿里云栖大会上,马云提出了“新实体经济”说。“新实体经济”以消费者为核心,通过新技术平台把数以亿计的消费者与企业直接连接起来,从而实现个性化、定制化的生产制造与商品流通。“新实体经济”的出现,一方面推动了线下数据的全面上网,另一方面把线上数据与线下数据结合起来形成了新型的大数据,尤其是得以结合产业和工业数据,这才是人工智能在现实商业世界中的突破口。
2017年3月29日,在2017年第一场阿里云栖大会深圳峰会上,阿里云总裁胡晓明宣布阿里云正在开启新的征途:通往智能之路。
阿里在人工智能布局已久阿里对人工智能可以说是志在必得。2017年2月21日,美国权威科学杂志《麻省理工科技评论》(MIT Technology Review)发布2017年全球十大突破性技术榜单。阿里巴巴分别入选“强化学习”和“刷脸支付”两大突破性技术榜单,同列入榜单的还有Google、微软、IBM等科技巨头。
《MIT科技评论》认为,中国的人脸识别技术精度已达到金融交易的级别,刷脸支付进入成熟期。主导这项技术研发的阿里巴巴关联公司蚂蚁金服,旗下支付宝在2015年发布9.0版本时,就引用人脸识别技术用于用户登陆、实名认证、找回密码、支付风险校验等场景,迄今已有近1.2亿用户使用。阿里在“强化学习”领域的技术成果,也与自身商业实践相关,比如强化学习技术在阿里双11推荐场景中将手机用户点击率提升了10-20%。
“强化学习”与“刷脸支付”只是阿里人工智能布局的冰山一角。阿里对人工智能的总体态度,阿里云总裁胡晓明在2016年8月的阿里云栖大会·北京峰会上表达的非常清楚:“拥有了数据的积累,机器将替代人类的智商。我们认为人类一定会进入数据时代,我们认为人类一定会进入到人工智能的时代。”
总体来说,阿里在人工智能方面的布局可以分为四个层面:一是在自身业务场景中锻炼和孵化人工智能技术;二是通过阿里云对外输出以及获得企业使用阿里人工智能技术的反馈;三是通过合作伙伴的生态进一步扩大人工智能的应用场景与获取各类商业大数据;四是与科研机构合作更为前期的前瞻性人工智能技术,比如与中科院合作的量子计算。
“强化学习”与“刷脸支付”就是阿里自身业务场景中锻炼和孵化人工智能技术代表,人工智能技术还在支撑着手淘每天上亿用户在手机上的商品选择、信息浏览、个性化推荐等任务,尤其是要做到千人千面即每一个用户打开的手淘都是个性化界面,这是对人工智能技术极大的挑战。而这些经过了实践检验的技术,经由阿里云对外整体输出,这就是去年8月推出的阿里云人工智能“大脑”ET,以及2016年1月推出的大数据“数加”平台。
阿里云首席科学家周靖人表示,ET的背后使用了阿里云多项人工智能的技术,特别是自然语言识别、实时视频分析、语音识别及语音合成、人机交互、知识图谱等,但更为重要的是利用了大数据技术。阿里云的一站式大数据平台“数加”,打通数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条,是阿里人工智能的基础。
周靖人强调,人工智能和大数据相辅相成、相互依赖、相互促进。阿里巴巴集团兼阿里云CTO张建锋也在去年表示,不论是人工智能还是其他前沿技术,都离不开高质量的数据、强大的计算平台和高效的算法平台,只有三者结合才能真正取得突破。
新实体数据打开“NASA”之门
2017年3月9日,阿里巴巴集团在杭州召开首届技术大会,动员全球两万多名科学家和工程师投身“新技术战略”:即阿里巴巴的“NASA”的计划——面向未来20年组建强大的独立研发部门,建立新的机制体制,为服务20亿人的新经济体储备核心科技。
虽然阿里到目前为止并未透露将如何实施“NASA”计划,但可以肯定的是数据特别是新实体数据将是打开“NASA”之门的钥匙。马云在首届阿里技术大会上说,沃尔玛过3万亿销售额时有230万人,阿里实现37000亿交易额时参与员工加起来不到1万人。阿里用1万人做到了沃尔玛60年230万人做的事情,这既是新技术的力量,也是新数据的能量。
胡晓明在2017云栖大会深圳峰会上介绍说,去年7月份上汽和阿里走到了一起,共同发布首辆搭载YunOS Auto操作系统的互联网汽车。该互联网汽车上路7个月,已经带来将近117亿轨迹点的定位,可以看到用路线轨迹绘制的地图正在让中国的地图定位越来越精准。同时,所有上路的汽车还在不断收集路况与PM2.5的数值,尝试创造新的数据价值。
在2017云栖大会深圳峰会上,阿里云还正式发布了ET工业大脑和ET医疗大脑。在工业领域,将人工智能技术应用到工业生产的复杂度更高。单从数据而言,一台民用涡轮风扇发动机的转速就能达30,000转/分钟,不同型号涡轮发动机转动次数也不同,这相当于1分钟内就可以产生海量不同标准的数据。
目前ET已经入驻国内大型能源巨头协鑫光伏的切片生产车间。ET工作的第一步是将标准化车间所有端口的数据传入工业大脑,随后通过人工智能算法对所有关联参数进行深度学习计算,精准分析出与良品率最相关的60个关键参数并搭建参数曲线,在生产过程中实时监测和控制变量。目前,通过ET工业大脑的帮助,协鑫光伏的生产良品率已经提升1个百分点,每年可节省上亿元的生产成本。
ET医疗大脑的研发则大量采用深度学习技术,通过海量的数据作为示例来训练机器完成特定任务,例如由计算机通过学习病例数据来提升医术。经过一年多的研究训练,人工智能ET已具备多项医疗能力,可在患者虚拟助理、医学影像、精准医疗、药效挖掘、新药研发、健康管理等领域承担医生助手的角色。
浙江德尚韵兴的科学家是超声甲状腺结节智能诊断算法的研发者,他们利用深度学习处理超声影像,同时加入旋转不变性等现代数学的概念。借助计算机视觉技术,这套算法可以对甲状腺B超快速扫描分析,圈出结节区域并给出良性与恶性的判断。一般来说,人类医生的准确率为60%-70%,而当下算法的准确率已经达到85%。这套算法现在被集成到ET医疗大脑当中,并在多家医院进行试点。
ET还被应用到了城市治理方面。杭州城市数据大脑正在试点阶段,通过视觉数据分析、移动数据分析、公交信息数据分析等,ET去指挥红绿灯的配置方案。调整后,杭州部分路段的交通畅通率提升了11%。同样,广州用互联网+信号灯数据把城市变成更通畅。通过阿里云的人工智能技术和地图技术,帮助广州市把拥堵指数降低了19%。在广州,现有接近1200个路口在使用ET大脑。
由于可以24小时不睡觉,同时处理成千上万项任务,ET的学习进步速度大大超过人类。而来自新实体经济中的大数据,就是ET进化的奇点。
阿里云机器学习PAI:高效的算法平台在数据、技术与算法中,阿里已经在超大规模计算操作系统、移动操作系统、金融级分布式数据库、机器学习平台等核心基础技术领域持续投入近10年,而通过ET工业、医疗与城市大脑和互联网汽车等,阿里正在积累新实体经济数据。
在算法平台方面,阿里云2017云栖大会深圳峰会上正式发布机器学习平台PAI2.0,以更丰富的算法库、更大规模的数据训练和全面兼容开源的平台化产品,让人工智能技术变成开发者只需要托拉拽就能可视化完成开发的普惠性技术。
周靖人介绍,阿里云机器学习平台PAI 2.0包括了丰富的算法,除数据预处理、特征选择、文本分析外,还很好的支持了离线训练与在线预测的结合。在深度学习方面,PAI 2.0支持TensorFlow 、CAFFE、MXNET框架,开发者可以根据自己的喜好选择最合适的人工智能开发框架。同时PAI 2.0也支持各种数据源,包括非结构化、结构化的数据等,提供一站式的服务。
里云为PAI 2.0提供了强大的计算资源,包括CPU、GPU、FPGA等,可根据每个人工智能的需求来选择合适的硬件。同时,阿里云PAI 2.0机器学习平台支持超大规模训练,可以分析PB级大量的数据,也支持千亿的特征,可以训练万亿级的样本。
阿里在2015年发布了PAI 1.0平台,该平台具有处理超大规模数据的能力和分布式的存储能力,同时支持超大规模的建模以及GPU计算。此外,该平台还具有社区的特点,包括实验结果可共享、社区团队相互协作等。
介绍,PAI平台通过可视化交互的界面降低了技术门槛,使用者可以轻松实现数据挖掘的工作,而无需太多经验;其次,其内嵌的算法,都是经过阿里内部多年的淬炼,在性能和准确率上都有较大的提升;最后是数据智能,该平台提供了从元数据到模型部署整套流程,通过提供基本的组件,使用者可以搭建各个垂直场景下的解决方案。
阿里云+新实体数据+机器学习平台PAI,这是通往智能之路的三驾马车。有了这三驾马车,阿里决战人工智能第二个60年,就有了充分的底气。当然“罗马不是一天建成的”,在更远期的阿里“NASA”计划中,量子计算与量子通信等尖端科技,正在一点一点成为现实。