语音识别在树莓派语音控制家庭自动化
扫描二维码
随时随地手机看文章
“Ok 谷歌做我的家庭作业”——如果这个命令有效,我们的童年将会很简单,不是吗?但是有些事情是要我们自己来做的,当然,我们不会设计一些东西来帮你完成作业。然而,我们都承认用语音指令做事很有趣!!这就是为什么我们已经建立了语音控制的家庭自动化项目,如使用Arduino的Alexa控制的家庭自动化和使用ESP32的谷歌助理家庭自动化。
所以,在这个项目中,我们将建立一个基于树莓派的语音控制家庭自动化系统,它可以根据我们的语音命令来监听、响应和控制交流负载。我们已经直接在树莓派上进行了语音识别,所以我们可以直接将麦克风连接到树莓派上并对着它说话。这就避免了对手机等外部设备的需求。此外,该系统可以一直保持开启状态,等待特定的语音命令。在这里,我们已经编程Pi响应关键字“hello”之后,我们可以控制我们的灯打开或关闭。您还可以在此处查看其他基于物联网的家庭自动化项目。
首先,谷歌或其他语音助手是如何理解我们的话语并做出回应的?首先,当你说话时,你在空气中制造振动。这种能量通过麦克风转换成电信号,这种电信号是模拟信号,如果直接给计算机,它就不能理解,因为计算机只能理解数字信号。因此,我们必须使用模数转换器(a /D转换器)将模拟信号转换为数字信号。然后,它过滤数字化的声音信号,去除噪音,并使用复杂的自然语言处理系统。最后,根据算法在系统中运行,得出最优输出。在我们的项目中,我们将在树莓派上使用谷歌语音API,它利用机器学习算法将我们的语音转换为文本,然后我们将使用Espeak将文本转换为语音,以便我们的Pi响应我们的命令。
组件的要求
•覆盆子π
•麦克风
•扬声器
•继电器
•跳线
语音控制家庭自动化电路图
我们使用3.5 mm插孔公连接器连接扬声器和USB麦克风连接树莓派。灯泡与继电器模块的连接很简单,灯泡的一端连接到交流电源(中性),交流电源的相位连接到继电器的“NO”。继电器的公共端子连接到灯泡的另一个端子。
在这个项目中用于构建上述电路的组件如下图所示。
USB麦克风
有不同类型的麦克风,即动态,带状,电容,晶体,驻极体电容等。当声波撞击隔膜时,它来回移动,导致两个平行板之间的距离发生变化。当电容器之间的距离增大/减小时,电容减小/增大,可以看到电流的变化。这些电流的变化与输入(声波)成正比。这些电流被允许流向串联连接的电阻器,输出与电阻器并联收集。
在我们的项目中,我们使用的USB麦克风可以进行这种(A/D)精确操作,并且它还具有内置放大器,因此无需使用外部前置放大器电路。因此,通过使用USB麦克风,我们可以直接将它与计算机连接,在我们的例子中,与树莓派连接。
连接USB麦克风与树莓派
我们需要找到麦克风是否连接到树莓派。在lx终端上使用以下命令进行检查。
输入命令,您将看到以下对话框。
从那里,通过控制方向键(向上/向下方向键)访问UI。使用F6从给定列表中选择麦克风,并使用方向键设置录音音量。
要测试麦克风,请使用lx端子并记录您的剪辑。使用以下命令开始录音。记录将保存在test.wav文件中。
要播放test.wav文件,请在终端输入以下命令。
这样,您可以检查麦克风是否连接并与树莓派正常工作。
扬声器
扬声器的工作原理与麦克风相同,但方向相反。麦克风将声波转换为电信号,而扬声器将电信号转换为声波。圆锥体、电磁线圈和永磁体是扬声器的主要组成部分。永磁体固定在一端,而电磁铁可移动。电磁铁放在永磁体的前面。电磁铁附着在一个由柔性材料(纸或塑料)制成的锥体上,用来放大振动。当电磁铁被加电时,它会被永磁体吸引或排斥。当电磁铁来回振动时,与其相连的锥体也会产生振动,从而产生声音。声音的音高取决于振动的频率,而音量则取决于振动的幅度。在这里,我们将使用3.5毫米插孔引脚连接扬声器到我们的树莓派。下面显示的扬声器有一个AUX选项,您可以使用任何扬声器与树莓派。
树莓派上语音识别所需的库
在开始编码之前,我们需要安装一些库来简化编码。Espeak库用于在树莓派上将文本转换为语音,speech Recognition库用于在树莓派上执行语音到文本。PyAudio库需要从USB麦克风获取数据。下面的命令用于下载必要的库。
使用以下命令测试espeak。如果安装正确,你会听到“hello world”。
树莓派语音识别程序
完整的语音识别程序与Pi可以找到在本页的底部,一个解释的代码如下。我们首先导入语音识别模块和其他需要的模块,这些模块用于将语音转换为文本和将文本转换为语音。在导入这些模块之后,我们必须导入GPIO模块,它控制树莓派的引脚。
下面给出的代码是一个函数,它处理我们所说的短语的听力。这个程序一直等待,直到用户输入(语音)。当用户说某事时,它将该信息存储在“audio”变量中并返回该信息。
下面的代码是一个接受audio1变量的函数。它使用谷歌语音API识别我们的声音,然后在屏幕上以字符串格式打印我们的语音。
在main函数中编写的代码用于处理短语的收听,然后使用语音到文本模块将其转换为文本,然后使用Espeak给出反馈。
下面给出的if和elseif条件用于检查文本变量中的字符串是“ light on ”还是“ light off ”。如果文本变量中的字符串是亮的,那么If函数就满足了。
if函数内的代码用于将高值发送到引脚名称led (pin 27)。在将高值发送到引脚后,我们使用espeak将文本转换为语音,这被用作反馈。如果文本变量内的字符串为off,则If条件不满足,导致程序检查elseif条件。如果满足了elseif条件(如果变量“ text ”中的字符串被删除),程序将进入在elseif条件中编写的代码。elseif函数内部的代码用于向名为led (pin 27)的引脚发送低值。该引脚连接到继电器以控制任何所需的交流负载,类似于我们在Blynk家庭自动化和Adafruit IO家庭自动化项目中所做的。
下面给出的代码是首先运行的代码。当python解释器运行模块时,它将__name__变量设置为值“ __main__ ”。下面的代码处理侦听和比较“text”变量。下面给出的代码充当使主程序处于待机模式的代码,直到树莓派侦听到触发短语。当树莓派捕获触发短语时,它允许程序输入主代码,这是在另一个名为main()的函数中定义的。
通过Pi上的语音命令控制交流负载
在空闲状态下,树莓派继续检查触发代码的短语。在我们的例子中,我们的触发短语将是“hello”。我们以这样一种方式编写代码:当用户说出触发短语hello时,它将触发代码的其余部分。该程序将进一步运行,它处理音频的侦听和执行命令(根据它侦听的命令打开/关闭灯)。
完整的工作过程也显示在本页底部的视频中。如果用户说出预定的短语,将满足开/关灯的功能,并运行内部代码,输出将根据命令打开或关闭灯泡。在树莓派执行打开或关闭的动作后,我们可以听到扬声器以音频形式的反馈。在听到触发短语之后的第一个短语时,树莓派将再次回到其初始状态并等待触发命令,相同的过程一次又一次地重复。通过这种方式,我们可以将使用树莓派的语音控制系统添加到我们的项目库中。它可能与google home mini不一样,但拥有我们自己的语音控制设备是件好事,它甚至可以以语音的形式给出反馈。
本文编译自iotdesignpro