一站式智能语音识别方案将大幅提高工作效率

时间：2020-05-22 13:12:01

关键字：语音识别智能语音音频音视频

手机看文章

扫描二维码
随时随地手机看文章

[导读] （文章来源：站长之家）全球实时音视频开创者声网Agora宣布推出一站式智能语音识别解决方案，将通过AI智能降噪、声纹检测、语音识别等技术，进行在线实时语音识别，帮助平台更智能、高效的识

（文章来源：站长之家）

全球实时音视频开创者声网Agora宣布推出一站式智能语音识别解决方案，将通过AI智能降噪、声纹检测、语音识别等技术，进行在线实时语音识别，帮助平台更智能、高效的识别语音中存在的涉黄、涉政、广告等违法违规信息。净化平台内容质量，降低监管风险，提升用户体验。

一段时间以来，网络音频行业乱象频出。今年 6 月，国家网信办针对网络音频乱象问题启动专项整治行动， 26 款音频平台因传播历史虚无主义、淫秽色情等内容被采取约谈、下架、关停等处罚。

一方面，随着移动互联网的发展，UGC内容生产数量越来越庞大，ASMR、娇喘等色情擦边球内容频频出现在语音聊天室、直播、短视频等平台上；另一方面，相对于图文和视频，音频审核本身在技术上也更具难度，这大大增加了平台方的内容审核压力。因此，在国家网信办强监管的大背景下，借助更高效、便捷的语音鉴黄方案加强内容审核成为众多社交、音视频平台的刚需。

无论传统语音审核还是人工审核方案，一直以来各平台都在积极寻找更高效的内容审核方式。在传统审核方案的对接模式中，企业想要同时上线直播、鉴黄等功能，需要分别对接CDN厂商、RTC厂商和内容审核厂商，并且额外支付CDN拉流成本，通过三步才能拿到内容审核结果，步骤繁琐、时间成本高且面临故障风险。而单纯使用人工鉴黄虽然对新型问题有较强的灵活性，但也面临人员流动性大、质量效率不稳定等运营成本。

声网Agora的一站式智能语音识别解决方案，将上述传统语音审核和纯人工语音审核进行了优化升级，通过自建的全球虚拟实时通信网络SD-RTN™，整合目前业界TOP3 智能语音识别服务商，为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务，提供市面上最高效、便捷的智能语音识别技术。

同时，声网也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务，企业无需部署额外SDK、无需自己对接CDN厂商、更无需支付拉流成本，就可同时上线直播（实时音视频）和鉴黄（实时语音识别）功能，帮助企业大幅节省接入成本，真正做到一站式方便接入。

在目前流行的众多K歌平台，直播、语音聊天室中，为了追求内容效果，用户在UGC内容创作时普遍都会使用背景音乐或音效来营造氛围，这对平台进行语音识别增加了难度。对于语音识别中常见的噪声、背景音等音质问题，声网的一站式智能语音识别解决方案融合声网Agora语音引擎与AI音频降噪算法，可提供去除背景音、环境音之后的高音质音频源，在原来算法的基础上将不良信息的识别率有效提高30%以上。

在语音识别过程中，对于有语义的声音，系统先将语音识别转成文字，然后再对文字内容进行识别；而对于无语义的声音，例如娇喘、ASMR中的色情擦边球等，则可以通过声纹检测来进行识别，再通过内容安全引擎判断是否包含涉黄违法内容。这样“双管齐下”的方式，可以避免娇喘等无语义声音的特殊性带来的审核漏洞。

声网通过深度学习语音识别技术与在线实时语音分析，智能识别语音环境中的广告、涉黄、涉政、暴恐、谩骂等不良信息，保障语音聊天室、娱乐直播等语音应用绿色安全。未来，声网还会联合更多业界知名智能语音识别服务商，为企业持续提供高效、严格的内容审核机制，促进网络生态健康发展。