最快!使用ESP32的语音到文本转换
扫描二维码
随时随地手机看文章
ESP32 + INMP441麦克风+ SD卡+ Deepgram API =语音到文本只需3秒!即时记录、存储和转录。现在就试试!
最快!使用ESP32板的语音到文本转换
语音转文本技术改变了许多项目的游戏规则。从在智能家居中实现免提控制到为残疾人创建无障碍解决方案,将口语转换为文本的能力打开了无限的可能性。无论你是在构建语音激活的自动化系统、在旅途中抄写笔记,还是将语音识别集成到聊天机器人中,语音转文本都可以简化用户交互,并将你的想法变为现实。借助ESP32开发板和Deepgram语音到文本API,您可以无缝高效地实现这一目标,使其成为创新物联网项目的必备功能。
为什么选择ESP32进行语音转文本?
ESP32是一款多功能微控制器,内置Wi-Fi和蓝牙,是物联网应用的理想选择。它的双核处理器和充足的内存使它可以毫不费力地处理语音到文本转换等复杂任务。通过利用Deepgram语音到文本API,我们可以实现实时语音识别,同时保持ESP32的处理需求最小化。
它是如何工作的
ESP32通过INMP441麦克风捕获音频输入,并将录制的音频存储在SD卡上。存储的音频文件然后从SD卡读取并发送到Deepgram语音转文本API。API处理音频数据并返回转录文本,然后可用于各种应用程序,如家庭自动化、笔记记录,甚至聊天机器人交互。
硬件设置
连接INMP441麦克风:
•将INMP441的I2S引脚(WS、SD和SCK)连接到ESP32 Dev Board的相应引脚上。
•确保正确的电源和接地连接。
连接INMP441麦克风:
•我的麦克风,esp32
GND -> GND
VDD -> 3.3v
Sd -> d35
SCK -> d33
w -> d22
L/ r -> 3.3v
连接SD卡模块:
将SD卡模块连接到ESP32 (MOSI、MISO、SCK和CS)的SPI引脚上。
将8GB SD卡插入模块。
连接SD卡模块:
SD卡模块ESP32
GND -> GND
Vcc -> VIn
味噌-> d19
Mosi -> d23
SCK -> d18
CS -> D5
在PCB上组装硬件(我们为触发器添加了一个额外的按钮)
如何创建Deepgram API密钥
要使用Deepgram语音转文本API,您需要一个API密钥。按照以下步骤创建一个:
注册一个Deepgram账户:
•访问Deepgram的网站并创建一个免费帐户。
•注册一个Deepgram账户:
•有了这个新帐户,你可以获得200美元的免费积分
•然后点击“创建API密钥”
•给它一个名字,然后你就能得到API密钥,复制并保存它
安装所需的库
打开Arduino IDE,安装以下库:
•ESP32 Core for Arduino(通过Board Manager版本3.4.0)
•HTTPClient用于向Deepgram API发送HTTP请求(内置库)
•ArduinoJson解析JSON响应从API(需要安装)
连接图
本文编译自hackster.io