商汤科技用人工智能改造传统行业挖掘蓝海市场
扫描二维码
随时随地手机看文章
商汤科技作为为人工智能技术的重要一员,商汤科技徐立丝毫不敢懈怠。专注于计算机视觉和深度学习原创技术,成为国内最大的新锐人工智能公司,他表示我们进入了软件的摩尔定律时代,软件性能通过人工智能快速增长,用人工智能改造传统行业挖掘蓝海市场。
今日人工智能时代完全变了,第四次工业革命尚未真正开始,很多人已开讲。“全球进入了一种未卜先知时代,这与抗日剧中喊八年抗战马上要开始一样。”徐立说。
作为人工智能公司商汤科技联合创始人兼CEO,徐立感受着创业的苦与乐,以及时代的喧嚣和嘈杂。一方面,商汤科技专注于计算机视觉和深度学习原创技术,飞速发展,自主建立了原创深度学习平台Parrots和深度学习超算中心,成为国内最大的新锐人工智能公司,估值超过20亿美金。
另一方面,各路人马齐齐杀到这一领域。国内外巨头公司无不分出人马研发人工智能,竞争日趋激烈。从2015年开始,只要一个论坛主题词中出现人工智能几个字,场场爆满。
在这样环境中,近三年人脸识别、自然语言处理和机器深度学习等等人工智能型公司纷纷创立。商汤科技是其中一员。2014年创立,经过三年发展,商汤科技将人脸识别、图像识别、自动驾驶、人机交互、医疗图像、人工智能芯片等多项人工智能核心技术实现应用落地。
2017年7月,商汤科技宣布完成4.1亿美元B轮融资,创下当时全球人工智能企业单笔融资纪录,同时也成为全球估值最高的人工智能独角兽企业。
但是,商汤科技徐立丝毫不敢懈怠。新一轮融资后,他希望在包括无人驾驶、智慧医疗、深度学习芯片、增强现实平台等方面加大研发投入以及人才引入,开拓更多技术应用场景,深化人工智能商业生态,以原创技术赋能更多行业。
视频分析大风口移动互联网时代,每个人手机都会拍照很多照片,录制短视频。商汤科技联合创始人之一杨帆注意到一个现象,这些照片和视频二次价值转化很小,其最重要的价值体现在拍完、分享那一刻,之后大多数人很少再次翻阅、利用这些照片。但是,它们占据了大量的手机存储空间。“这是很矛盾的。” 杨帆说。
基于这种洞察,商汤科技为手机厂商提供了一个智能相册解决方案,即利用人脸识别聚类技术,按照不同人像进行归类,实现“一人一相册”,轻松解决手机中成百数千张照片分类管理的难题。该方案还能找到手机中照片最多的那个小孩,从大概率来说,“那是用户自己的小孩,系统会将该照片推荐给手机用户做屏保”,其余照片或者可以存储到云端,或者利用其它技术处理,实现照片的二次价值转化。
这是一个并不复杂的实际应用案例。再往下发展,随着AI技术进步,杨帆相信可以从照片和视频中挖掘更价值。
商汤科技研发的智能相册、美颜和滤镜功能,有些已应用到华为和小米手机上。借助此类方式,商汤科技的技术已经悄无声息影响到很多人。
11月2日,最新发布的OPPO旗舰手机R11s上,应用了商汤科技提供的AI智慧美颜技术和 “面部识别”人脸解锁功能。
通俗来讲,这类应用后面的实现方式与人脸定位、AI特效增强相关,算法的选择尤其关键。
技术落地经历了一个有意思过程。杨帆最早预设各类场景,抽象出106点来。最初从5个点,2个眼睛、1个鼻子、2个嘴角,接着衍生出21个定位点。接下来是38个点,最后是106个点位。
理论上来说,点位越多越准确。操作时要兼顾人工标注数据成本,一张106点的标注图,成本要5-10元。从标注十万张照片起步,5个点位全部标出来,训练出一个5点模型,再进化,将21点算法等融合到标注工具,然后就可做到更快、更低成本标注。
最后,商汤倡导的106点标注得到非常广泛的应用,积累到百万级别数据时,可以通过类似方法去以较低成本标注240个点。
类似技术成熟后,为商汤打开了进入短视频和直播业务通路。商汤正在进入一个技术进步带来数据积累,进而做到产业化落地的正向循环。
商汤想解决计算机识物之后,真正把视频理解发挥到一个真实应用场景当中。现在,视频分析能力可以认出人的身份,周围的桌子、凳子和沙发,还有颜色。再进一步发展下去还有很大可能性。
比如,搜索引擎公司现在只是基于文本,如果对于整个视频理解能做到文本搜索水平,未来可以成为视频搜索引擎。当然这只是商业上想象的一部分。
按照徐立和团队设想,人工智能对当前互联网主要的商业领域电商、搜索和游戏都将产生影响,另外,还外对安防、智能驾驶等等领域赋能,未来前景广阔。