胸戴墨案AI录音笔实际测评之录音转写能力测评
扫描二维码
随时随地手机看文章
在“智能硬件”栏目里,笔者对胸戴墨案AI录音笔从硬件方面进行过详细介绍。此次,笔者将对它最重要的录音转写能力加以测评,一起来了解下吧。
——收声效果
收声效果对于录音笔而言十分重要,在使用过程当中笔者能够明显感受到其收声效果相比较手机降噪效果更佳,表现在听感上就是录出来的声音较为纯净,背景噪音受到压制,人声获得放大。
墨案AI录音笔有较为明显的通过放大人声音量来压制噪音的倾向,为了让大家更直观了解到其与手机收声的差异,我们使用某国产安卓旗舰手机和录音笔同时录制一段音频。
得到的音频波形图如下所示:
手机收声波形
录音笔收声波形
以上波形图记录反映的是音频分别在手机、录音笔终端在同一时间段被录制下的信息,可以明显看到录音笔的收声在全过程相比较于手机收声实现了全面压制。
——闹市实测
经常出席发布会或者是常常参与街头采访的朋友们常常会遭遇极度恶劣的收声环境,这对于录音笔实时转换文字的功能实现也是一个较大的考验。
为了这次测试体验,笔者来到了所在城市郑州市最喧闹、最混乱、最拥挤的路口——二七广场前的马路路口。
来得早不如来得巧,本就喧闹的该地,又恰逢二七塔整修,增添了施工器械传来的隆隆噪音,伴随着人声、车辆来往鸣笛、商铺喇叭等各种声音的繁杂交织,我们检测了一下其噪声分贝:
实测环境噪声达到了70.4分贝
笔者所读的文本为大家所熟悉的《再别康桥》。可以看到在这样恶劣的环境下,其所实时转制的文本仅出现了个别的文本错误。全文一共194个汉字,墨案AI录音笔仅将“榆荫”错误识别成“语音”,这样来看,总体正确率是有保障的。
——会议场景模拟
对于一些天天要做会议记录的上班族,如果在拿不到会议发言稿情况下或者老板完全脱稿即兴讲话,全程记录会议讲话是一件很痛苦的事情。
笔者模拟了一般会议的场景,由笔者手持录音笔,阅读会议讲稿的发言者距离笔者大概有一到两米的距离。
左为对方所阅读的文本,右为录音笔所转写、记录的内容(错漏之处笔者已经标注),即使是在录音笔未佩戴于发言者的会议场景下,其仍能够对通常的会议讲话内容进行低错误率的准确识别。
——智能音箱音频转写
除了对现场人声的转录,笔者还好奇墨案AI录音笔对于音箱、电视等设备终端放出音频的记录、转换。笔者将录音笔握持于某品牌智能音箱一米处,该音箱外放音量适中。
笔者令智能音箱随机播放了一篇科技新闻报道。可以看到,墨案AI录音笔对于智能音箱这种机器合成人声的转换记录也同样准确,种种数据、数字甚至百分号等十分重要的信息都记录完整,完美通过了测试。
——英文转写
目前墨案AI录音笔所支持的方言有粤语、上海话、四川话、湖北话、湖南话、河南话、浙江话、东北话、山东话、天津话、陕西话、山西话、贵州话、云南话、甘肃话、维语等十六种,另外支持英语这一门外语。
由于笔者方言讲得并不地道,这里便选择英语作为普通话之外的测试项目,所阅读文本为:
“I love you,You love me,We're a happy family.With a great big hug,And a kiss from me to you.Won't you say you love me too?I love you,You love me,We're best friends.”
可以看到墨案AI录音笔对于英语的掌握能力是相当强力,只出现了一个单词的错误识别和开头的首字母大小写错误,后续的断句、标点符号都十分准确。
——场景识别
目前墨案AI录音笔支持通用、政法庭审、医学、出行、新零售、演讲、远场等多种场景,在切换到相应场景之后,语音转换过程当中会调用相关领域的语料,减少错误识别。
——远场拾音
墨案AI录音笔拥有为远场拾音的算法优化,官方称已经实现了全向声源定位。
如图所示,相隔6米,墨案AI录音笔仍旧实时捕捉、转换了我们两个人的隔空对话。
——续航
墨案AI录音笔以Type-C端口为充电端口,搭载300毫安时电池,其输入功率是5v 150mA,充电过程所需的可能会长一些。所以这里笔者主要测试其续航成绩。
这里笔者使用墨案AI录音笔连续录音(未开启文字转换)长达36分钟,可以看到电量从90%降至84%。如此来看,坚持10个小时的音频录制是毫无问题的。
从以上测评结果可以看出,不管是闹事,还是中文抑或英文,抑或是场景识别,胸戴墨案AI录音笔均展现出了王者地位。所以,如果你对这款录音笔比较感兴趣,不妨尝试入手。