一站式智能语音识别方案将大幅提高工作效率
扫描二维码
随时随地手机看文章
(文章来源:站长之家)
全球实时音视频开创者声网Agora宣布推出一站式智能语音识别解决方案,将通过AI智能降噪、声纹检测、语音识别等技术,进行在线实时语音识别,帮助平台更智能、高效的识别语音中存在的涉黄、涉政、广告等违法违规信息。净化平台内容质量,降低监管风险,提升用户体验。
一段时间以来,网络音频行业乱象频出。今年 6 月,国家网信办针对网络音频乱象问题启动专项整治行动, 26 款音频平台因传播历史虚无主义、淫秽色情等内容被采取约谈、下架、关停等处罚。
一方面,随着移动互联网的发展,UGC内容生产数量越来越庞大,ASMR、娇喘等色情擦边球内容频频出现在语音聊天室、直播、短视频等平台上;另一方面,相对于图文和视频,音频审核本身在技术上也更具难度,这大大增加了平台方的内容审核压力。因此,在国家网信办强监管的大背景下,借助更高效、便捷的语音鉴黄方案加强内容审核成为众多社交、音视频平台的刚需。
无论传统语音审核还是人工审核方案,一直以来各平台都在积极寻找更高效的内容审核方式。在传统审核方案的对接模式中,企业想要同时上线直播、鉴黄等功能,需要分别对接CDN厂商、RTC厂商和内容审核厂商,并且额外支付CDN拉流成本,通过三步才能拿到内容审核结果,步骤繁琐、时间成本高且面临故障风险。而单纯使用人工鉴黄虽然对新型问题有较强的灵活性,但也面临人员流动性大、质量效率不稳定等运营成本。
声网Agora的一站式智能语音识别解决方案,将上述传统语音审核和纯人工语音审核进行了优化升级,通过自建的全球虚拟实时通信网络SD-RTN™,整合目前业界TOP3 智能语音识别服务商,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,提供市面上最高效、便捷的智能语音识别技术。
同时,声网也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外SDK、无需自己对接CDN厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。
在目前流行的众多K歌平台,直播、语音聊天室中,为了追求内容效果,用户在UGC内容创作时普遍都会使用背景音乐或音效来营造氛围,这对平台进行语音识别增加了难度。对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案融合声网Agora语音引擎与AI音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高30%以上。
在语音识别过程中,对于有语义的声音,系统先将语音识别转成文字,然后再对文字内容进行识别;而对于无语义的声音,例如娇喘、ASMR中的色情擦边球等,则可以通过声纹检测来进行识别,再通过内容安全引擎判断是否包含涉黄违法内容。这样“双管齐下”的方式,可以避免娇喘等无语义声音的特殊性带来的审核漏洞。
声网通过深度学习语音识别技术与在线实时语音分析,智能识别语音环境中的广告、涉黄、涉政、暴恐、谩骂等不良信息,保障语音聊天室、娱乐直播等语音应用绿色安全。未来,声网还会联合更多业界知名智能语音识别服务商,为企业持续提供高效、严格的内容审核机制,促进网络生态健康发展。