人工智能如何推进媒体融合
扫描二维码
随时随地手机看文章
在日前召开的首届Techo开发者大会上,腾讯杰出科学家、多媒体实验室总经理刘杉表示,在万物互联的5G时代,媒体的智能化已经成为不可阻挡的趋势和发展方向,人工智能技术成为媒体融合重要的技术手段和工具。
腾讯杰出科学家、腾讯多媒体实验室总经理 刘杉
刘杉在演讲中介绍了当前互联网流量的来源分布,并预计2022年超过82%的互联网流量将来自于视频或者包含视频的应用,而这一增长趋势蕴涵着巨大的商业价值。
视频编解码技术听起来专业难懂,可是它的应用却与人当下的感官体验有着亲密连接。比如大众日常接触的腾讯视频、微视、微信、QQ等与视频密切相关的产品,还是其他互联网公司每天产生的视频内容,都是以压缩的形式传播的。而视频压缩即视频编解码,它的效率,直接影响到一个产品或者一套解决方案的效率、成本、品质,甚至是成败。视频编解码技术经过30年的演进,架构变得更加复杂,承载的技术更加丰富,而这些技术的演变都使得压缩效率不断提升。
尽管压缩效率非常重要,但并不是所有人都在使用压缩效率最高的编解码格式,因为不同的应用场景对视频编解码器的需求侧重有所不同。刘杉表示,在质量、延迟和带宽或者成本之间寻找一个最优平衡点是腾讯多媒体实验室努力的方向和目标。
以云游戏为例,在线游戏行业千亿市场,但云游戏商业化面临的现实挑战是它的高成本。云游戏是以云计算为基础的游戏方式,刘杉表示对其成本结构进行拆解后发现,云游戏最大一块成本来自于带宽 34%,其次是GPU 27%。“视频编码器的优化将有助于大大降低云游戏的带宽成本,推动云游戏商业化,”刘杉表示,“腾讯多媒体实验室已经和正在使用的视频编解码器优化策略。比如,启用更高效率编解码格式,对硬件编码器进行优化,针对不同游戏场景优化编码工具集使用,同时支持多格式软件硬件编码器并根据内容和分辨率进行切换,动态编码码率策略,ROI编码和网络自适应编码技术,硬件解码渲染一体化等。”
无论视频流量的持续增长还是云游戏的商业化,当前都正面临着一个历史性风口浪尖,即5G。刘杉认为,5G网络提供给我们超强的带宽,超低的延迟,使得更多的应用触手可及。在5G的影响下,媒体内容的生产、获取和传播方式都在发生变化。“无论是4K/8K,还是VR/AR/MR/点云,这些在过去因为受限于网络带宽的应用,在5G的推动下可能会迎来突破。而5G的低延迟特性还将触及医疗和其他一些倚赖高速连接和互动的领域,例如远程手术和自动驾驶等。此外,刘杉认为,在万物互联的5G时代,媒体的智能化已经成为不可阻挡的趋势和发展方向,人工智能技术成为媒体融合重要的技术手段和工具。
截至目前,腾讯多媒体实验室约70个技术提案已被 VVC 采纳,多人在标准组织中担任重要职务,并将王者荣耀推入标准测试序列。作为国际行业标准不可忽视的影响者和领导者。腾讯多媒体实验室专注于多媒体和相关领域的前沿技术探索、研发和产品落地,包含音视频编解码、网络传输和实时通信,基于信号处理和深度学习的多媒体内容分析、理解、处理和质量评估,沉浸式媒体(VR、AR、点云等)系统设计和端到端解决方案;同时负责国际国内行业标准制定,包含多媒体数据压缩,网络传输协议,多媒体系统和开源平台等