当前位置:首页 > 芯闻号 > 充电吧
[导读]百度硅谷实验室(SVAIL)周一上线了网页应用 SwiftScribe,基本的功能是把音频资料转录成文字。在一篇博客文章中,项目主管 Tian Wu 说他们解决了一个重要的“痛点”:消耗大量时间的逐字听写转录。

百度用人工智能技术做了新产品。

百度硅谷实验室(SVAIL)周一上线了网页应用 SwiftScribe,基本的功能是把音频资料转录成文字。在一篇博客文章中,项目主管 Tian Wu 说他们解决了一个重要的“痛点”:消耗大量时间的逐字听写转录。

SwiftScribe 目前还处在内测阶段,并未开放,不过你可以通过一个演示示例了解它是怎么工作的。SwiftScribe 支持上传时长 1 个小时以内的 wav 或 mp3 文件,目前只接受英文。接下来它需要花点时间生成文字,官方说法是,1 分钟的录音需要不到 30 秒、1 小时的录音需要 20 分钟左右。

接下来你会在网页上看到转录好的文字,但这并不意味着转录结束。文本不会区分大小写、没有标点符号,更没有分段,你需要在文本框中手动编辑,然后再做导出。这个过程也会被百度记录,就像所有的人工智能学习过程一样,它用来帮助算法纠正错误,提高准确率。

文本框底部有一排工具栏,播放按钮开启,一个高亮的标识会跟随语音标出阅读的进度,方便你停下来查看这个单词对应的语音。这个工具栏还有变速、标记的功能。

这个过程就相当于用机器算法取代了速记员、听写员的工作。“SwiftScribe 会在广泛的领域内带来积极影响,提高生产力,包括医疗机构、法律、商业和媒体。”Tian Wu 在博客中说,专业领域的人工听写效率低,1 小时的录音往往需要花费 4-6 个小时,每分钟语音的成本在 1 美元,SwiftScribe 能把完成工作的时间平均缩短 40%。

Tian Wu 在接受采访时表示,他们以后还会增加对视频文件的语音识别支持,也会添加自动插入标点符号等功能。

语音识别并不是什么新鲜事物,你手机里的各种语音助理比如 Siri、 Cortana 都基于此,用户关心的唯一问题可能是到底识别的准确性有多高。

按照 Tian Wu 的介绍,SwiftScribe 基于他们的最新研究成果 Deep Speech 2。2014 年百度的首席科学家吴恩达刚刚入职百度不久,就带着一个 10 人的团队开发 Deep Speech,一套语音识别系统。

当时的研究重点在怎么提高嘈杂环境下的英语语音识别准确率。百度收集了 9600 个人 7000 小时的语音样本,添加了 15 种噪声,把样本扩充到 10 万小时。吴恩达说这套系统的错误率比同期的微软 Bing Speech、Google Speech API 等竞争对手低 10%。

2015 年,硅谷人工智能实验室又发表论文公布了 Deep Speech 2 ,这个系统开始学习汉语,也提高了对不同英语口音识别的能力。

到 2016 年,百度利用 Deep Speech 技术推出基于 Android 的语音输入应用 TalkType,强调输入法对“语音优先”。同一年,Deep Speech 2 还入选了《MIT 评论》评出的“ 2016 年十大突破技术”,入选的理由是“语音识别技术让智能手机变得更易操作”。

可以确定的是,百度之后还会花费更多的精力、更多的钱来支持人工智能的研究,这是李彦宏反复提及的最新故事。

上个月的财报电话会议上,李彦宏说会压缩百度糯米和百度外卖的补贴和营销费用、公司的未来在人工智能领域:“人工智能是改变互联网和传统工业的一个巨大机会。”

与之对应的是,百度 2016 年的营收涨了 6.3%、净利润少了三分之二。这是百度自成立以来,年度净利润首次下跌。而百度总收入中,依然有九成以上来自广告业务。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭