图像识别让机器人拥有眼睛可以像人类一样看世界
扫描二维码
随时随地手机看文章
图像识别、AI、无人驾驶、机器人等未来趋势技术,被一班年轻大学生“玩”出新高度。作为国际性的大学生机器人赛事,第十七届全国大学机器人大赛2018 RoboMaster机甲大赛日前圆满落幕,本届大赛共吸引了全世界近200支战队和近万名学生参加,经过近5个月激烈比赛,广州本地高校华南理工大学“华南虎”战队,凭借过硬的实力成为卫冕冠军。
每届机甲大赛的最大亮点就是体现高端制造业发展趋势,今年图像识别的应用成为决胜的重要因素之一。目前,图像识别是除语音识别外,人机交互的重要手段之一。苹果、微软、谷歌、英特尔、华为等企业都纷纷致力于让机器具备深度学习能力,让图形识别更智能,让计算机、机器人“看”世界。
今年的RoboMaster(以下简称RM)机甲大赛类似于手机游戏《王者荣耀》的模式,被称为《王者》的机器人版。一支团队分为英雄机器人、步兵机器人、工程机器人、空中机器人、哨兵机器人共5个角色,其中,步兵机器人有三个,其他角色机器人均有一个。对战双方通过机器人之间的协同工作、射击等进行对抗,最后“击毁”对方基地或基地血量高者胜利,而且每局限制在7分钟之内。
机甲大赛的科技含量在于参赛战队需要操作团队亲自研发的机器人,从一个细小的零件开始,焊接、装拼、核心主板装嵌、无人机改装、写程序、调试……到最后完成和操控一支机器人队伍。近日,全媒体记者来到位于华南理工大学五山校区的机器人实验室,里面放置着零件焊接的机器、无数的装配工具、排线、电路板等,还有用于写程序的电脑。
要制作如此高比赛级别的机器人,过程是漫长的,经历无数次反复制作与测试。例如步兵机器人顶端是一个云台,包含了子弹发射器,底部是四个轮子组成、能灵活转向的“车辆”。队员李佩佩表示,目前这款参加比赛的步兵机器人,不是团队做出来的“唯一”步兵机器人,“之前有机器人已经做出来了,因为只有做出实物,并且达到较为完整的程度,才能进行测试。虽然比如今这辆更加小巧和灵活,但由于车速以及稳定性没有后者快与良好,所以被放弃了”。一台步兵机器人从机械加工到电控“上电”,完成出来大概半个月时间。据介绍,制造出一台英雄机器人大概需要6位成员共同完成。整个战队中,工程与英雄机器人复杂性相对较高,其中,英雄机器人的难点在需要快速“取弹”,这是比赛决胜因素之一,“我们的优势就在于英雄机器人取弹快,一次性能取两个弹药箱,时间在2~3秒之间。”队员李佩佩说。
卫冕“秘籍”:
视觉研发 帮助机器人自动瞄准更精确尽管RM大赛每年的规则都有所更新,今年采用的技术和零件明年不能用,但是由于大赛有一项固定规则就是射击,因此打击、识别、发射等项目都是一众强队钻研的方向。
根据赛制,发射出的子弹必须打在对方机器人身上规定的裁判系统位置才算有效——让对方扣掉血量。射击技术的一个核心是机器人射击子弹的弹道要稳定与精准,RM官方对子弹的射速有上限规定,每个具备射击能力的机器人的子弹发射口都有一个测速的装置,假如检测到子弹超速就会扣掉血量。所以,参赛队伍都会尽量在限速的情况下做到高速。
视觉组成员杨泽霖对此解释道,比如RM官方的限速是25米/秒,团队就要做到每颗子弹的速度均是24~25米/秒,并且一颗子弹都不超过上限。另外,子弹不能卡住“枪管”,若是卡住了就全场都不能发弹了——这亦是众多队伍遇到的难题之一。杨泽霖介绍,今年的机器人采用了较多的气动结构,相比用电机而言,前者取弹速度更快,而且也加入了众多的自动辅助技术,例如使用相机自动对位,相比人工对位,前者更加稳定、准确和快速。据了解,上届赛事中仅有极个别队伍采用了自动瞄准技术,到了本届比赛,这一技术已成机器人的“标配”。据视觉组队员杨泽霖表示,团队机器人身上装载的摄像头能自动识别对方,自动跟随过去,这也是图形识别技术的应用。
机器人拥有“眼睛”视觉测试需要反复多次调试
据了解,华工战队今年主要将图像识别运用到了各机器人的自动瞄准、步兵机器人激活大小能量机关、工程和英雄机器人自动取箱、补给机器人自动给子弹这4个方面,“今年所有机器人都加载视觉识别程序,例如补给站机器人就是自动识别并跟机器人对接进行补弹的”,视觉组队员解释,图像识别技术使机器人的速度和稳定性有很大提升。
然而,为机器人装上摄像头,写入自动图像识别程序后,让它能准确地识别图像并不简单。“因为实际环境与工业试验环境是两回事”,视觉组成员成斌告诉全媒体记者,团队有一个独立的视觉实验室进行机器人视觉测试,测试并非一两次就能完成,需要多次反复调试。因为实际场景的光照强度、光照方向、曝光时间和增益等,都会影响机器人的视觉“能力”。例如在赛场上复杂的光线或者突如其来的光照,都会给机器人战队的视觉系统带来困难。视觉组队员表示,他们需要做足够多的实验测试,模拟实际环境较为充分,“我们会模拟不同的光线情况,将众多的实际情况考虑进去”。
据了解,目前团队所研究的识别技术,优势在于延时低、转换回来的坐标较为精准,这让机器人打击的准确率很高。
让机器像人类一样观察和理解世界未来:除了图像 还有视频识别
作为机器视觉系统的重要组成部分之一的图像处理应用,相当于人的大脑对系统获取的图像,做出正确判断。除了在摄像头中加入图形识别功能外,据了解,今年华工战队的机器人换上了麒麟970,这个人工智能移动计算平台最大的特点之一是AI场景识别,因为除了CPU外,更拥有具有独立神经处理单元(NPU),AI运算相比CPU处理能效提升50倍,性能提升25倍。据了解,从去年全球科技厂商苹果在iPhone X上使用了具备神经网络引擎的A11仿生处理器后,目前,众多科技厂商的高端处理器都带有了“深度学习”能力,并且集中“火力”在图像识别上。高通、英特尔、谷歌、英伟达等都专门开发针对图像识别的平台。
图像识别,被认为是人工智能科技领域中,除语音交互外,人机交互中的重要手段之一,例如目前消费者们经常在中高端手机产品上看到的人脸识别技术,就是图像识别功能之一。另外,目前众多智能终端拥有AI拍照功能、相册筛选等等,同样是图像识别发挥着重要的作用。
根据科技行业最新的消息称,日前,谷歌抛出了新的黑科技:视频内容识别。通过这一技术,能够识别视频当中的各种动物、物体、风景等内容,例如你要在视频当中搜索一只狗,搜索引擎很快就能为用户找出视频中包括狗的画面。业界解释,其中可以通过图像识别的原理来理解视频识别。实际上,国内有物联网团队亦致力于这一方面,正把图形识别、视频识别的研究用于在城市交通监测当中。
记者观察
科技技术有应用场景,才得以深入发展以及发掘新的研究方向。“华南虎”战队的指导老师、来自华南理工大学机械与汽车工程学院讲师张东认为,只有通过动手实践,知识才能真正掌握,成为有价值有意义的知识。
作为国际性的机器人赛事,机甲大赛并非仅有刺激性与观赏性。纵观整个比赛的机器人竞技模式,除了不同角色的机器人本身拥有不同“含金量”的技术外,更重要的是团队合作、整体战术,以及考验不同角色机器人之间的协同。业内专家表示,多机器人的协同控制在学术圈是研究热点。今年3月在平昌冬奥会闭幕式的“北京八分钟”表演中,我国新松的24台人工智能机器人控制着“冰屏”与24名轮滑演员,配合地面投影不断变幻曼妙舞姿,当中讲求的就是多机协同、人机协同——如果有一台机器人稍有延迟或动作偏差,整个演出都会失败。