谷歌AI新功能挑战Zoom:视频会议除了说话声 再无尴尬背景声
扫描二维码
随时随地手机看文章
新冠疫情肆虐全球,让在家办公成为了常态,也让视频会议成为了日常需求。Zoom成为了全球视频会议市场的最大赢家。
Zoom去年年底日用户峰值还只有1000万人,今年4月底已经达到了3亿人,一个季度增长了三十倍。今年以来,Zoom股价从68美元一路飙高到目前的220美元价位,市值超过了620亿美元。市场调查机构Datanyze的数据显示,Zoom在美国视频会议的市场份额高达36.3%,随后则是视频会议应用GoToWebinar和思科Webex。
相比之下,谷歌、微软、苹果等传统巨头此前几乎没有发力这一领域。他们要么没有重视开发这一需求产品,要么相关产品不够简洁专注。巨头的缺失也让视频会议市场带来了竞争空间,成为了新贵们争夺的领地。
但谷歌和微软两大巨头已经盯上了这块变大的蛋糕,近期先后在Google Meet和Microsoft Teams产品上推出了系列新功能,希望吸引自己原本巨大的用户基础。Zoom产品的功能缺失就成为了两大巨头的发力重点,背景降噪就是其中之一。在这一方面,两大巨头雄厚的人工智能实力将提供坚实的技术支持。
微软5月份就表示,近期会在Teams推出无关背景声的降噪功能。不过,Google Meet还是比微软更早一步,他们本周就推出了强力背景降噪Cloud De-Noiser。目前已经在G Suite的网页端推出,随后会在iOS和Android升级。AI模式可以识别所有语言的声音。谷歌表示,Meet今年4月底的日会议参与用户已经达到了1亿人。
打开这一功能之后,除了你的说话声,其他背景声音通通消失。视频会议就只有会议应该有的声音,再也不用担心令人尴尬的声音干扰你的视频会议了。用户在视频会议时再也不用担心自家狗狗的叫声打扰会议,也不用对持续不断的键盘打字声感到烦躁,不用担心吃饭的吧唧声。当然,也不会再听见马桶冲水的声音。但De-Noiser功能也会智能保留一些可能有益于会议的自然背景声音,例如说话者的深呼吸声和笑声。这项功能已经在内部测试和优化了一年多时间,今年1月开始在谷歌全公司内侧。
Cloud De-Noiser的功能背后是谷歌基于云端的机器学习算法。算法会智能过滤掉各种背景干扰声。谷歌G Suite产品管理总监拉查佩尔(Serve Lachapelle)在演示视频中,先后让薯片塑料袋、圆珠笔等各种杂乱的背景声音消失。虽然在强力降噪模式下,他原本的说话声音变得有些沉闷,但依然清晰可辨,完全不影响视频会议的工作效率。
拉查佩尔表示,自己在谷歌瑞典办公室工作,和谷歌硅谷总部存在着时差,经常在吃饭时间和总部同事开视频会议。去除各种吃饭时候的尴尬声音,是他们一年半之前开始研发De-Noiser功能的主要动力。G Suite团队就各种背景声音打造了AI模型,解决了迟滞问题。他们用自己上千次的视频会议数据,对模型进行不断训练,更好地辨别人声和背景声。
拉查佩尔从事视频会议相关产品功能已经有25年时间,效力谷歌也已经有13年时间。2017年谷歌收购一家创业公司Limes Audio,招纳了一批音频工程师。此外,谷歌人工智能部门Google Brain和Google Reserch也提供了技术帮助。谷歌在声音识别和增强领域已经进行了数年研发,有了大量的技术积累。