基于物联网的Cortex-A53智能云镜系统的设计与实现
扫描二维码
随时随地手机看文章
0 引 言
随着物联网概念的提出和技术的发展,及人们对于物联 网的热衷和市场的走向,各类智能产品已慢慢占据了日常家居 产品市场,丰富了人们对于智能产品的选择 [1]。越来越多的贴 近生活的智能产品正在涌现,将云计算技术应用于智能家居产 品设计中,也是物联网技术深入居民日常生活的印证 [2]。本文 设计与实现的智能云镜系统正是顺应以上趋势把科技融入生 活的样品,高度体现了科技以人为本的理念。
1 硬件设计
1.1 微处理器
系统微处理器选择 64 位四核 ARM Cortex-A53 处理 器系列的 BCM2837 芯片。该处理器是 ARMv8 架构 ARM Cortex-A50 系列产品,其可扩展性使 ARM 的合作伙伴能够针 对智能手机、高性能服务器等各类不同市场需求开发系统级 芯片。Cortex-A53 处理器不仅是功耗效率最高的 ARM 应用 处理器,也是全球最小的 64 位处理器。能够支持所有最新的 ARM GNU/Linux,支持各类音频、视频和以太网接口等。
1.2 LCD 显示屏
7 英 寸 通 用 LCD 电 容 式 触 摸 显 示 屏 分 辨 率 可 达 800×480,可支持常用的系统镜像,如 Raspberry Pi,Banana Pi 和 Banana Pro 等。另外,该显示屏支持背光控制,更节省 电能。本系统的设计与实现采用静态加载对 LCD 屏驱动的支 持,需要在 Linux 内核编译时进行配置。选中设备驱动选项 “Device Drivers ->”进入设备驱动配置界面,选中“Graphics support”进入图形支持选项。进入“Support for frame buffer devices”配置界面选择“LCD init in kernel”选项加入内核编 译就可使内核实现对 LCD 屏驱动的支持,为系统显示设备提 供编程接口。LCD 驱动配置界面如图 1 所示。
1.3 原子镜
原子镜又称单向玻璃或单面镜,是一种对可见光具有高 反射比的玻璃。透过玻璃的观察面可以清晰观察另一侧,而 在玻璃的被观察面只能看到反射的镜像。原子镜之所以能产 生以上单面反光的效果,是因为镜的两面处于不同光度的环 境。本系统利用 LCD 屏幕和原子镜的叠加实现“智能云镜” 的外观显示。
1.4 WiFi 模块
ESP8266 芯片可实现串口转 WiFi 功能,ESP8266 是一 款超低耗通用非同步 WiFi 数据收发器,内置 TCP/IP 协议栈, 支持多路 TCP Client 连接。支持丰富的 Socket AT 指令,透 传时的数据最大传输速率为 460 800 bit/s,传输可靠性好。本 系统利用该 WiFi 模块实现网络服务,利用互联网上传或接收 信息。
1.5 LM393 双电压比较器
LM393 是双电压比较器集成电路。输出负载电阻能衔接 在可允许电源电压范围内的任何电源电压上,不受 Vcc 端电压值的限制。此输出能作为一个简单的对地 SPS 开路(当不用负 载电阻没被运用),输出部分的陷电流被可能得到的驱动和器 件的 β 值所限制。当达到极限电流(16 mA)时,输出晶体管 将退出且输出电压将很快上升。本系统利用比较器确认启用录 音功能的时间,当用户发出的声音超过指定分贝时即表示向系 统发出语音命令。 本系统还使用了 LM386 功模块、麦克风、红外传感 器和继电器等硬件设备。
2 软件设计
本系统是一款基于物联网技术,利用云平台实现的人机 交互智能云镜系统,摒弃了传统镜子功能的单一性。设计方 案基于 WiFi 无线通信技术实现物联网联动,开发了 GUI 客户 端程序。用户可根据个人的生活习惯或喜好,在照镜子的同时 和镜子交流。系统内置了感知组件,可根据用户的语音和手势 动作完成指令控制操作。例如,向它提出各种问题,获得日期、 天气、新闻、菜谱等常用信息 ;让它像朋友一样聊天、讲笑话 等。系统还包含了音乐播放和灯光控制功能,利用语音识别等 方式进行控制,实现了一物多用。本系统选择 Linux 操作系统 作为开发环境,结合百度语音云和图灵机器人开发实现。
2.1 百度语音云
语音识别是指与机器进行语音交流,让机器明白你说什 么。中国物联网校企联盟形象地把语音识别比作为“机器的听 觉系统”。语音识别技术就是让机器通过识别和理解过程把语 音信号转变为相应的文本或命令的高技术 [3]。语音合成是通 过机械、电子方法产生人造语音的技术。TTS 技术(又称文 语转换技术)隶属于语音合成,它是将计算机自己产生的、或 外部输入的文字信息转变为可以听得懂、流利的汉语口语输出 技术 [4]。
百度语音是语音技术、自然语言处理、智能搜索三方面 的完美融合。以更自然的交互方式对用户所说语言进行更准确 地识别,只有对用户需求准确理解,才能为用户提供更满意的 结果。系统集成语音识别、语义理解、深度问答、知识推理、 多轮对话、智能摘要、情感分析、语言生成、语音合成等功能, 能够满足用户的多种复杂需求。
2.2 图灵机器人
图灵机器人是在人工智能的核心能力基础上为开发人员 提供云计算和大数据平台的在线服务和开发接口,提供机器 人和人的文字交互,实现前端业务逻辑的自定义 [5]。图灵机器 人能用准确、简洁的自然语言回答用户用自然语言提出的问题, 以方便人们快速、准确地获取信息。随着技术的进步,问答 机器人目前已能够处理常识性、开放性问题及聊天问候等。问 答机器人能够给用户提供非常智能化和人性化的服务,为用户 带来极大方便和美好体验。
在本系统中可实现机器人昵称、性别、年龄等身份属性 设置,同时在自有平台或产品上完成知识库的新增、删减、更 改编辑以及批量导入等操作。此外还能够为每一位使用者分配 一个独立机器人。主要涉及的功能包括聊天对话、问答百科、 生活百科、知识库、新闻资讯、成语接龙、故事大全、菜谱大 全、笑话大全、天气查询和日期查询等。
3 系统实现
3.1 功能模块设计
首先通过 LM393 双电压比较器来检测周围环境声音的 强度,当声音强度达到预设值时,系统启动,开始录音。录 音结束后,通过 post 方式向百度语音平台请求语音识别服务, 然后接收反馈数据。本系统通过对识别结果的分析做出相应 的响应,然后将处理后的文字信息上传到图灵平台,实现智能 语音的目的。
系统对图灵平台处理后的数据进行分析,并发送到百度 语音平台,请求语音合成服务,再驱动声卡程序播放合成的声 音。语言合成功能是在无需本系统处理命令的情况下(如聊天 等)将百度语音合成的文字转交给图灵处理,图灵处理完成 后再交给百度语音进行合成,待接收到合成后的语音时即可 用系统的扬声器播放出来。
3.2 主要实现代码
图灵平台部分代码如下:
3.3 系统外观和内部结构图
系统外观和内部结构如图 2、图 3 所示。
4 结 语
本文主要介绍了在 Linux 操作系统下使用 Cortex-A53 处 理器设计实现的智能云镜系统。本系统具有良好的交互性, 体现了物联网感知层的特定含义。系统实现了文字、音频、红 外等信息的采集和处理。基于物联网技术把图灵平台与百度语 音巧妙结合,使一面普通的镜子有了“生命”,可以跟用户自由 交流。