没有了深度学习,机器人只是一堆废铁
扫描二维码
随时随地手机看文章
事实上,在国内人工智能还处于非常初级的阶段。
昨天,网易发布的《2016全球人工智能发展报告》显示,美国、英国和中国占有全球人工智能企业数量的65.73%,而中国以15745件专利居全球人工智能专利数排名第二。
从谷歌阿法狗大战李世石到优必选机器人春晚群舞,“人工智能”这个词渐渐被大众熟知,各种以机器人命名的公司、长相各异的无人机和摆在商场里给孩子当摇摇车玩的VR产品,给人描绘出一副好莱坞科幻式的乌托邦生活。
从本月12日开始的双创周活动,再次炒火了深圳的创业文化,库克也专程赶来,你们的深圳又在朋友圈刷屏了:“深圳再次吸引了世界的眼光”、“世界上最聪明的头脑都在赶往深圳”好像要告诉全世界,这才是宇宙的中心。
这两天借着参展机会,去主会场溜达两天。不出所料,现场展出最多的产品是机器人、无人机和AR/VR眼镜。从外观上看,似乎这些产品都很酷炫,为了搞清行业发展水平并找出几家能让人惊叫的产品,我挨个跟人请教了各家产品的性能和产业化方向。
得出的结论是,好像没你们说的那么牛逼啊。。。
我看见的更多是三五岁小童把玩唱《小苹果》的“小曼”爱不释手——比不会唱歌的玩具挖掘机好玩多了;也看见当时火爆一时的送餐机器人,不知道她怎么在现如今狭小餐厅里穿梭的;还看见被观众团团围住巡逻机器人“小明”无法避障,左右为难,当我问旁边技术员,巡逻机器人如何识别小偷和业主时,他笑着对我呵呵。
众所周知,人工智能的核心是机器学习,当然现在更主流的是深度学习,通过数据训练出模型,并使用模型发出预测。这是机器的基本“教化”原理。借助海量大数据对其进行神经网络训练,让一坨冰冷的金属或塑料具备了智慧,说起来挺爽的,那么问题就来了,这里面涉及到三个层面的问题。
首先,什么是大数据?哪些大数据有利用价值?如何对这些大数据进行分拣处理?我们需要把什么东西塞进机器人大脑?这是人工智能的前提吧,如果没有运营商海量的四川话、弗兰话等各式方言的大数据库供给,科大讯飞的语音识别还如何识别?只听得懂普通话的机器人“小萌”如何能听得懂说河南话的主人。
其次,机器如何获取指令?这就涉及到人机交互这样老生常谈的一个问题了。常用的有语音识别、图像识别以及文字识别,机器通过识别语音、图像或者文字来对计算中枢发出计算指令。有人会说,这很简单啊,就是说句话让它能听懂呗!其实并不那么简单,单拿中文来说,整个中国有不下上百种方言吧,没种方言发音标准不一样吧,每个人的吐字不一样清晰吧,要让他听懂,其实很难,不是一般的难!
当然,最后还得说说最核心的模型搭建或者叫网络神经训练。神经训练就是让机器得到指令后,经过计算得出结果,并输出指令的过程。高中数学老师老教我们,如果A=1,则……;如果A=2,则……,这种根据变量得出不同结果的模型是最基础的算法。
举个栗子,昨晚看完双创展,在软产工作的徒弟小何约我吃饭,这次她又迟到了。我把过往跟小何约饭的经历在脑海中重现一下,看看跟她约饭的次数中,迟到占了多大的比例。我利用这来预测她这次迟到的可能性。如果这个值超出了我心里的某个界限,那我选择等一会再出发。假设我跟小何约过5次,她迟到的次数是1次,那么她按时到的比例为80%,80%是我跟她约饭的我是否按时出发的标准线,如果小何在5次迟到的次数中占了4次,也就是她按时到达的比例为20%,由于这个值低于我的红线,因此我选择推迟出门的时间。这种模型就是机器的灵魂,而算法也就当然成了关键,所以做搜索引擎公司具有天然的算法优势、不管是特斯拉上的无人驾驶还是手机度娘界面上的新闻推送。
由各种人机交互识别技术,对机器发出指令,机器根据已有的网络神经(计算模型)计算出一个结果,然后对机器硬件发出执行指令,这是机器人工作的基本原理。
复习了一遍机器学习的基本原理后,反观你们所展出的机器人,喊一声“小花”——唤醒机器、唱首歌——录制好的《小苹果》就开始唱了,巡逻机器人用得是摄像头避障,后面没有人脸图像大数据库支撑,捕捉到的数据将无从匹配,它就变成了一个移动摄像机了,请问现如今三步一台阶的小区,“小花”如何给你巡逻呢?!
现在层出不穷的机器人,根据用途不同,大致可分为工业机器人、娱乐型机器人、陪伴型机器人还有保姆式机器人,除了工业机器人手臂能重复简单机械的工作,需要与人交互的机器人很难单独达到功用,当然很重要一方面是人很难对一个不完全智能的东西维持长久的新鲜感,比如只会执行唱歌、跳舞和简单对话机器人,你可能三天就会不再对她有兴趣。
当然,人工智能技术积累已经到了窗口期,不管目前发展状况如何,前景是光明的。私以为,单就机器人来说,在目前的技术积累下,要大面积产业化还有些困难,唯一有希望的就是将目前人工智能技术与智能硬件的结合,不能全智能化的时候,我们将已有技术与现有硬件结合,提高现有硬件的各方面性能,是目前人工智能市场化的最好选择。
拿驾驶来说,如果将计算机视觉技术与汽车结合,行驶在马路上的汽车感应到前方可能出现危险时,给驾驶员发出警示。或者语音识别植入到汽车控制中枢中,在高速行驶的汽车上,通过语音对汽车发出导航,这样是不是更安全一些,当然,很多汽车厂商已经在这方面试水,有的已经成熟,这也是人工智能目前产业化的一个范例。
《星球大战》里面场景终会出现,只不过,现在说“保姆式机器人”,我只能说:呵呵。