人形机器人推进商业化:进入家装必须迈过的“四个门槛”
扫描二维码
随时随地手机看文章
随着华人力量在人工智能研究领域的崛起,越来越多的华人科学家投身于人工智能技术商业化的进程中。
近日,优必选科技宣布悉尼大学教授陶大程即将加盟公司,并担任优必选“人工智能首席科学家”。同时,在机器人运动控制方面,清华大学教授赵明国也将担任优必选“人形机器人首席科学家”。陶大程、赵明国以及优必选创始人周剑在北京接受了包括《第一财经日报》在内的媒体采访,对于人形机器人商业化等一系列有趣的问题进行了探讨。
进入家庭的四个门槛
优必选在人形机器人方面的战略是,2018年完成大扭矩、高爆发力伺服舵机研发商业化,并推出系列化双足家庭服务机器人。同时考虑在三年内推出人形家庭服务机器人操作系统,并推出基于商业化目的的类人家庭服务机器人。
周剑认为,人类的需求不是特定的,也许有人会需要真人一样的、有情感依赖的机器人陪伴在身边,如果是单身的话,想象空间就很大了。这样的机器人5~8年之内商业化是有可能的。未来人形机器人在运动控制和人工智能上将无限接近人。
“我们跟亚马逊一起讨论了很久,亚马逊认为未来的人机交互的发展,消费中心一定是人形机器人。”周剑提到,2017年优必选的主要收入来源有四块,销售收入将达到10亿到15亿元人民币。其中之一就是和亚马逊合作开发的机器人。
陶大程从软件的角度解析了人形机器人四个方面的研究内容。他指出,人形机器人最关键的东西是视觉输出。我们每天所获取的信息超过70%、80%都是从眼睛来的,所以首先是要进行图像处理,如何将获取的图像变得更加清晰。看清楚之后,就是机器识别,作为家庭服务机器人,首先要认识家里每一个成员,这样才能对他们建立用户画像,然后把家庭成员的信息归总起来。要想完成稳定的图像处理和机器视觉,离不开两个非常关键的基础方面的研究,即深度学习和多视角学习。
他表示,机器人在家里到处走,要进行实时场景的解析,如何精确地实现室内导航,要有很多基础技术的支持。理解了环境,下面很重要的事情就是认知人、理解人的行为,这是运动的人脸识别系统。人是有情感的,你可以很友善,也可以很愤怒。这对于机器人来说就需要理解人的表情。理解了人的情绪、人的行为,下面就要知道如何检测和识别物体。
陶大程认为,人形机器人最终面向家庭的商业化还是要降低成本,而最大的问题就是要估计人的姿态,如果给机器人装很多摄像头和传感器必定会提高成本,如何利用单幕摄像机来获取想要的数据就是需要研究的问题。其团队最近的一个研究成果就是从Youtube下载的视频进行计算。
此外,还有一个关键问题是模型压缩。人形机器人运动过程当中有很多计算的开销、电能的开销,再加上人工智能的开销,就导致它要有一个很大的电池,这在很多场景中是很难克服的,因此要把大的模型变成小的模型。
5年内或迎来突破专注双足机器人运动控制技术研究的赵明国教授认为,在基本功能达到之后,就可以不断迭代,真正产生一个符合需求的产品。在两到三年之内,机器人“抓取”的功能一定能到位。
以“抓取”这个功能为例,家里各式各样的瓶子很多,酒杯、矿泉水瓶、暖水瓶等等,可能在机器人看来都是一样的,但如何精准地把这些物体识别出来,就是需要人工智能技术和运动控制技术相互配合的场景。
赵明国还谈到,真正的人形机器人是有四肢、大脑及躯干的机器人,只是它的外形不见得是第一步就完成的。先完成整体躯干的部分,可以运动了,有了AI的概念了,然后再做更加真人化的皮肤、材料、各种传感器,这时候触感、温度各方面才会有进步。
“未来5年结合驱动技术、控制技术,以及人工智能的发展,一定会迎来人形机器人在家庭应用中新的突破点,也会迎来产业应用的突破。”赵明国表示。
开发一款机器人,硬件和软件技术如何更好地融合是关键性问题。那么,从开发程序上来看,到底是有了硬件再去开发软件,还是二者能同时进行?
赵明国认为,机器人运动一定要先有良好的平台,所以落地的顺序应该是齐头并进,既要实现大型的伺服舵机商业化,另外相应的软件也要同步发展。但是一开始一定要把伺服舵机落实下来。
此外,陶大程也对记者表示,自己从事深度学习已经很长时间了,深度学习的弱点是在没有大量数据进行训练的时候,效果可能不会太好。比如说,在座的男士都是短头发,女士都是长头发,但我出去不能说长头发都是女的,短头发都是男的。
他认为,人类对大脑的理解还是非常粗浅的,深度学习实际上也沿袭了层级结构。我们已经看到了突破性的成果,但还是有一个过程,就像我们不能教5岁的小朋友微积分一样,需要渐进式地推进。
另外,陶大程也指出,深度学习是一个潮流,但是并不代表应该放弃原始的学习。统计学习和深度学习未来必将有机地结合在一起,解决我们的需求。