搜索“神灯” 全息投影+人工智能=全新搜索
扫描二维码
随时随地手机看文章
近日,百度推出的“神灯搜索”吸引了外界关注——摩擦手机智能边框,发出语音指令,搜索结果通过全息影像呈现在手机屏幕上方,并支持用户进行多轮语音交互。
在之前上映的《复仇者联盟2:奥创世纪》中,钢铁侠在复仇者联盟总部,与其创造出来的人工智能贾维斯对话,该人工智能的展示方式便是全息影像。
近日,百度推出的“神灯搜索”吸引了外界关注——摩擦手机智能边框,发出语音指令,搜索结果通过全息影像呈现在手机屏幕上方,并支持用户进行多轮语音交互。
也许“阿拉丁搜索”看起来还有点遥远,6月6日爱眼日当天,百度宣布与清华大学联合研发创新搜索服务,通过触摸与语音,让盲人也可以同普通人一样来获取互联网中的海量信息,向搜索“神灯”迈出了坚实一步。
“神灯”可为你做什么?
场景一:如果你对着手机说:“什么样的早餐能在3分钟内做好啊?”一个法国大厨模样的帅哥从手机里“蹦”了出来,悬浮在手机上方说:“咱们可以做法式吐司,首先,咱们来打鸡蛋……”如果你希望帅哥的形象再大一些,用手指触摸他,就可以放大、缩小了。
场景二:如果你问“最近有什么好看的电影?”可爱的帕丁顿熊竟然“跳”出来了,告诉你现在它最火,并且可以自动为你播放预告片,当你说“嗯,就看这个吧”,它又会马上提示出最近的影院,帮你选座订票。
预定餐厅时,你可以看到自己选择的窗边位,甚至直接在空中点菜,并自动提供行车路线载入地图程序。
场景三:对于孩子们来说,直接问“蝴蝶宝宝长什么样子?”便可以看到一棵绿色小树的全息影像展现,而蝴蝶宝宝就在树上安睡,最终变成蝴蝶,在空中飞起来,带孩子进入科幻世界。
在与更多的品牌合作后,用户可以更直观地订外卖、选车、选玩具,在你不想打字或者不方便打字时,只要大声说:“我要查快递、我要停车、我要买机票、我要看小说、我要唱K……”就会得到各种服务。
通过全息投影,可在手机屏幕上方显示头像。
“迷你”全息投影
好吸引
百度的“神灯”搜索概念一经宣布,便引起了业界关注,然而是真是假,一时众说纷纭。近日,记者从百度内部人士方面了解到,“神灯”搜索并非玩笑,但何时正式发布,目前并没有时间表。事实上,2014年4月1日,百度曾在愚人节发布了一个概念性的“筷搜”产品,时隔半年后的百度世界大会上,健康生活智能设备“百度筷搜”正式与大家见面。
从目前概念中透露出的信息来看,“全息投影”,无疑是该全新搜索技术中最吸引的部分。很多用户听闻后开心地惊呼:“太好啦,以后想谁就喊谁‘出现’,不会寂寞啦!”
事实上,全息投影已经越来越多出现在我们的生活里。2015春晚,歌手李宇春借助3D全息投影技术分身4次,四个“李宇春”变幻莫测,让人难分真假,叹为观止。
不过,记者了解到,目前,大部分全息投影应用都在比较大的场景下,如:舞台、博物馆、地产模型展示等方面。而“迷你化”对于全息投影来说具有难度,尤其是通过手机边框投影。
另外,全息投影要想达到一定的亮度和体积,需要的投射功率会很大,这就对手机电池有很高的要求。
全息投影能让你与具有立体感的“对象”聊天。
人工智能强势布局
与此同时,要想如“神灯”一样做到“有求必应”,背后的人工智能技术亦是关键。
据了解,百度“大脑”是通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,成为目前世界上最大规模的深度神经网络,目前已具备2~3岁儿童智力水平。基于人工智能深度学习等技术打造的“对象识别方法和装置”专利技术也可以保证“神灯搜索”里所提及的多轮语音交互的实现。
在2014年,谷歌、百度、Facebook和IBM等科技公司在人工智能领域强势布局,并将这些技术应用到具体的产品和服务中。谷歌去年初收购DeepMind公司后推出了新的“模拟神经网络”,可以模仿人类大脑进行归纳整理等逻辑推理,甚至可以自行处理任务。
不过,在科技界中,特斯拉CEO Eron Musk(埃隆·马斯克)和霍金的“人工智能恶魔论”引发了激烈争论:当越来越聪明的“虚拟人工助手”来到我们身边,究竟是更像天使,还是更像恶魔?还要等待未来的检验。
语音交互 新型搜索第一步
“有事您说话!”新型的搜索,特别强化了语音交互的重要性。百度董事长兼首席执行官李彦宏曾经预测:“未来五年,使用语音和图像来表达需求的比例将超过50%”。
在语音交互这一方面,微软、苹果、谷歌Google Now等都已实现重要进展。国外有Nuance语音技术公司,苹果iPhone手机的虚拟语音助手Siri、谷歌的语音搜索服务、微软的必应;国内则是百度、科大讯飞等企业。
不过,“语音识别”的功能性对于类似“神灯”搜索这样的智能交互来说,意义重大。百度首席科学家吴恩达曾透露,通过使用“神经元系统”以及“数据燃料”,百度人工智能帮语音识别提高了准确性,语音识别可以很好地处理背景噪音,使手机离得比较远也能很好地识别用户讲出的话。
记者采访了解到,现阶段,一些模糊不清的词汇还是难以辨别,也不能通过语境理解用户的真正意图。拿“我要吃饭”这一句话来说,在中文里可能就有“我要点餐、我要吃夜宵、我要填饱肚子、我饿了”等的衍生表达。
“语音搜索”虽然现在已经实现了,但是要实现后续的多轮对话,一方面需要更加出色的语音智能交互技术,另一方面也需要背后人工智能技术以及整合服务等方面的强力支持。比如,在Siri搜索“我要吃饭”,它会从大众点评上获取信息为你推荐最近的餐馆,点击进去会有餐馆的简介和地理位置,但只限于信息的获取。