基于物联网的Cortex-A53智能云镜系统的设计与实现

时间：2021-10-21 13:17:08

关键字：物联网图灵语音云 Cortex-A53

手机看文章

扫描二维码
随时随地手机看文章

[导读]摘要：各类家居智能产品是继智能手机后的一个新的科技概念，通过软硬件结合的方式对传统物品进行改造，进而让其拥有智能化功能。将图灵机器人和百度语音云相结合，提出一种基于物联网技术实现智能云镜系统的设计方案。利用百度语音平台进行语音识别和接收反馈等，利用图灵机器人对待处理的文本信息进行语义理解和知识管理。本系统选择 Cortex-A53处理器进行研究和设计，采用PC机下的Linux系统作为主机开发环境，实现自由交流。

0 引言

随着物联网概念的提出和技术的发展，及人们对于物联网的热衷和市场的走向，各类智能产品已慢慢占据了日常家居产品市场，丰富了人们对于智能产品的选择 [1]。越来越多的贴近生活的智能产品正在涌现，将云计算技术应用于智能家居产品设计中，也是物联网技术深入居民日常生活的印证 [2]。本文设计与实现的智能云镜系统正是顺应以上趋势把科技融入生活的样品，高度体现了科技以人为本的理念。

1 硬件设计

1.1 微处理器

系统微处理器选择 64 位四核 ARM Cortex-A53 处理器系列的 BCM2837 芯片。该处理器是 ARMv8 架构 ARM Cortex-A50 系列产品，其可扩展性使 ARM 的合作伙伴能够针对智能手机、高性能服务器等各类不同市场需求开发系统级芯片。Cortex-A53 处理器不仅是功耗效率最高的 ARM 应用处理器，也是全球最小的 64 位处理器。能够支持所有最新的 ARM GNU/Linux，支持各类音频、视频和以太网接口等。

1.2 LCD 显示屏

7 英寸通用 LCD 电容式触摸显示屏分辨率可达 800×480，可支持常用的系统镜像，如 Raspberry Pi，Banana Pi 和 Banana Pro 等。另外，该显示屏支持背光控制，更节省电能。本系统的设计与实现采用静态加载对 LCD 屏驱动的支持，需要在 Linux 内核编译时进行配置。选中设备驱动选项 “Device Drivers －>”进入设备驱动配置界面，选中“Graphics support”进入图形支持选项。进入“Support for frame buffer devices”配置界面选择“LCD init in kernel”选项加入内核编译就可使内核实现对 LCD 屏驱动的支持，为系统显示设备提供编程接口。LCD 驱动配置界面如图 1 所示。

基于物联网的Cortex-A53智能云镜系统的设计与实现

1.3 原子镜

原子镜又称单向玻璃或单面镜，是一种对可见光具有高反射比的玻璃。透过玻璃的观察面可以清晰观察另一侧，而在玻璃的被观察面只能看到反射的镜像。原子镜之所以能产生以上单面反光的效果，是因为镜的两面处于不同光度的环境。本系统利用 LCD 屏幕和原子镜的叠加实现“智能云镜” 的外观显示。

1.4 WiFi 模块

ESP8266 芯片可实现串口转 WiFi 功能，ESP8266 是一款超低耗通用非同步 WiFi 数据收发器，内置 TCP/IP 协议栈，支持多路 TCP Client 连接。支持丰富的 Socket AT 指令，透传时的数据最大传输速率为 460 800 bit/s，传输可靠性好。本系统利用该 WiFi 模块实现网络服务，利用互联网上传或接收信息。

1.5 LM393 双电压比较器

LM393 是双电压比较器集成电路。输出负载电阻能衔接在可允许电源电压范围内的任何电源电压上，不受 Vcc 端电压值的限制。此输出能作为一个简单的对地 SPS 开路（当不用负载电阻没被运用），输出部分的陷电流被可能得到的驱动和器件的 β 值所限制。当达到极限电流（16 mA）时，输出晶体管将退出且输出电压将很快上升。本系统利用比较器确认启用录音功能的时间，当用户发出的声音超过指定分贝时即表示向系统发出语音命令。本系统还使用了 LM386 功模块、麦克风、红外传感器和继电器等硬件设备。

2 软件设计

本系统是一款基于物联网技术，利用云平台实现的人机交互智能云镜系统，摒弃了传统镜子功能的单一性。设计方案基于 WiFi 无线通信技术实现物联网联动，开发了 GUI 客户端程序。用户可根据个人的生活习惯或喜好，在照镜子的同时和镜子交流。系统内置了感知组件，可根据用户的语音和手势动作完成指令控制操作。例如，向它提出各种问题，获得日期、天气、新闻、菜谱等常用信息；让它像朋友一样聊天、讲笑话等。系统还包含了音乐播放和灯光控制功能，利用语音识别等方式进行控制，实现了一物多用。本系统选择 Linux 操作系统作为开发环境，结合百度语音云和图灵机器人开发实现。

2.1 百度语音云

语音识别是指与机器进行语音交流，让机器明白你说什么。中国物联网校企联盟形象地把语音识别比作为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术 [3]。语音合成是通过机械、电子方法产生人造语音的技术。TTS 技术（又称文语转换技术）隶属于语音合成，它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂、流利的汉语口语输出技术 [4]。

百度语音是语音技术、自然语言处理、智能搜索三方面的完美融合。以更自然的交互方式对用户所说语言进行更准确地识别，只有对用户需求准确理解，才能为用户提供更满意的结果。系统集成语音识别、语义理解、深度问答、知识推理、多轮对话、智能摘要、情感分析、语言生成、语音合成等功能，能够满足用户的多种复杂需求。

2.2 图灵机器人

图灵机器人是在人工智能的核心能力基础上为开发人员提供云计算和大数据平台的在线服务和开发接口，提供机器人和人的文字交互，实现前端业务逻辑的自定义 [5]。图灵机器人能用准确、简洁的自然语言回答用户用自然语言提出的问题，以方便人们快速、准确地获取信息。随着技术的进步，问答机器人目前已能够处理常识性、开放性问题及聊天问候等。问答机器人能够给用户提供非常智能化和人性化的服务，为用户带来极大方便和美好体验。

在本系统中可实现机器人昵称、性别、年龄等身份属性设置，同时在自有平台或产品上完成知识库的新增、删减、更改编辑以及批量导入等操作。此外还能够为每一位使用者分配一个独立机器人。主要涉及的功能包括聊天对话、问答百科、生活百科、知识库、新闻资讯、成语接龙、故事大全、菜谱大全、笑话大全、天气查询和日期查询等。

3 系统实现

3.1 功能模块设计

首先通过 LM393 双电压比较器来检测周围环境声音的强度，当声音强度达到预设值时，系统启动，开始录音。录音结束后，通过 post 方式向百度语音平台请求语音识别服务，然后接收反馈数据。本系统通过对识别结果的分析做出相应的响应，然后将处理后的文字信息上传到图灵平台，实现智能语音的目的。

系统对图灵平台处理后的数据进行分析，并发送到百度语音平台，请求语音合成服务，再驱动声卡程序播放合成的声音。语言合成功能是在无需本系统处理命令的情况下（如聊天等）将百度语音合成的文字转交给图灵处理，图灵处理完成后再交给百度语音进行合成，待接收到合成后的语音时即可用系统的扬声器播放出来。

3.2 主要实现代码

图灵平台部分代码如下：

基于物联网的Cortex-A53智能云镜系统的设计与实现

3.3 系统外观和内部结构图

系统外观和内部结构如图 2、图 3 所示。

基于物联网的Cortex-A53智能云镜系统的设计与实现

4 结语

本文主要介绍了在 Linux 操作系统下使用 Cortex-A53 处理器设计实现的智能云镜系统。本系统具有良好的交互性，体现了物联网感知层的特定含义。系统实现了文字、音频、红外等信息的采集和处理。基于物联网技术把图灵平台与百度语音巧妙结合，使一面普通的镜子有了“生命”，可以跟用户自由交流。