当前位置: 首页 > 范文大全 > 公文范文 >

基于语音识别的智能书架设计与实现

时间:2022-03-22 09:14:47  浏览次数:

摘要摘要:针对书房中书籍过多而引发的查閱书籍点位难、耗时长等问题,提出一种基于语音识别的智能书架,利用语音识别与匹配代替人工查找,并通过控制中心控制步进电机进行定位与推送,实现智能书架的设计。该智能书架由语音识别终端、STC89C52控制中心以及步进电机执行结构组成。实施现场主要由语音识别终端识别语音指令,并对控制中心传输识别结果,然后控制步进电机执行定位以及推出功能。应用结果表明,该书架在家庭、办公室等环境下进行语音识别查找书籍,具有较高的实时性和识别准确率,并且人机交互友好,解决了查阅书籍耗时长等问题。

关键词关键词:智能书架;语音识别;步进电机;书籍定位

DOIDOI:10.11907/rjdk.162740

中图分类号:TP319

文献标识码:A文章编号文章编号:16727800(2017)005005703

0引言

随着智能自动化技术的迅速发展[14],智能化研究越来越受到人们关注,在日常生活中的应用需求也日益增多[56]。在书房、办公室等场所中,书籍一般是由人工查找并取出的,在一定程度上影响了人们查阅书籍的时效性。如果能设计一种识别语音查找并推出书籍的书架,将解决人们在书房中对书籍定位难、查找耗时长等问题。

在图书查阅过程中,书籍定位是较为常见的问题之一。针对这类问题,张郁松等[7]以物联网图书馆智能书架的结构化、通用化设计为目标,利用超高频(UHF)射频识别(RFID)技术,设计了一种具有实时检测与定位功能的智能书架,较好地提高了书架工作效率;舒远仲等[8]基于改进的RFID室内定位技术设计了一款应用于图书馆中的智能书架系统,将书架定位到每一层,精确到书架的最小单元格,并且降低了系统的复杂度和成本,较为有效地提高了读者借阅效率和馆员工作效率。

随着射频技术的不断发展,图书馆等场所中对图书的定位方式有很大改善,但是由于条件限制,语音识别定位书架在图书馆等禁止喧哗场所禁止使用。在可喧哗环境下,如家庭、办公室等场所中,语音识别可作为简单易用、无需接触、无需携带外部设备的定位方法,具有较好的应用前景。本系统首先将书籍信息存储到可扩展标记语言(XML)中,然后通过语音识别将语音信息与文本信息进行匹配,最后将定位结果发送至控制中心,通过电机执行动作完成推出书籍功能。

1硬件平台架构

本系统采用UPAtom510平台作为系统的语音识别终端,同时采用STC89C52单片机[9]作为系统的控制中心。由于系统功能需求,开发平台需要扩展外部设备。因此,除选用UPAtom510平台和STC89C52单片机外,还需外接话筒、TB6600步进电机驱动模块与42BYGH47401A步进电机,作为整个系统的硬件平台架构。

系统采用UPAtom510平台作为识别终端,该平台是北京博创科技有限公司针对嵌入式系统和微机原理课程研发的教学与实验平台。目前在UPAtom510上已经成功移植了Ubuntu、WinCE和Windows XP等操作系统。根据系统功能需求,在该平台上搭建了Ubuntu操作系统,并使用QT开发工具完成了人机交互界面的开发。UPAtom510平台底板如图1所示。

电机选用42BYGH47401A步进电机[1011],该电机为两项四线步进电机,电流1.5A,输出力矩0.55Nm。此模块有两种用途:书籍定位以及将书籍从书架中推出,方便用户取书。

本系统采用TB6600步进电机驱动器,它具有如下特性:输入电压为DC9~42V,可以驱动42BYGH47401A步进电机正常转动;含有拨码开关,针对不同电流要求,具有不同选择;模块上集成大面积散热片,具有较好的散热效果,可满足实际应用需求。

智能书架的硬件连接仿真结果如图2所示,智能书架的模拟三视效果如图3所示。

2系统框架设计

本系统的框架设计主要利用话筒采集语音信息,并将语音传递给UPAtom510平台,UPAtom510平台经过语音识别后,将书籍位置信息发送给STC89C52单片机,单片机根据书籍位置信息给电机驱动器发送控制命令,电机驱动器控制电机转动,带动整个智能书架运行。书架在书籍定位后将书籍推出,使得该书架具有智能化、人性化的特点。系统框架如图4所示。

3语音识别方法设计

目前,常见的电子产品中的语音识别均由单片机(MCU)或数字信号处理(DSP)作为硬件平台来实现。这一类语音识别[1217]产品主要采用孤立词识别,一般有如下两种方案:一种是使用隐马尔科夫统计模型(HMM)框架设计的非特定人群识别,另一种是基于动态规划(DP)原理的特定人群识别。这两种方法在应用上各有优缺点。

采用HMM框架完成语音识别的优点是使用时不需采集用户语音信息和训练特征,可直接识别语音指令,具有较好的稳定性。但该方法在前期需对大量语料库进行采集,成本较高;DP方法的优点是训练过程简单,无需提前采集大量样本,成本较低,应用较为广泛。但该方法稳定性不佳,给客户带来不便。本文针对这些问题进行了相应改进,较为有效地提高了稳定性和识别准确率。

(1)端点检测算法。端点检测准确性是对孤立词识别性能产生影响的重要因素之一 。测试结果表明,60ms的端点误差就使识别率下降了3%。市场中投入使用的语音识别芯片系统由于各种因素的影响,端点监测的准确性较差。因此,为了提高端点检测精准度,提出了两级端点检测方案,称为FRED(Framebased Readl_time Endpoint Detection)算法。

首先,对语音信号的输入,根据其能量和过零率(ZCR)的变化进行端点检测,去掉静音后得到输入语音的时域。然后,对端点检测的结果进行频谱特征提取。最后,根据输入语音频谱的快速傅氏变换(FFT)的分析结果,计算出能量分别在高、中、低频段的分布特性,并向前后两端扩展搜索包含语音端点的帧。FRED算法利用语音的本质特征进行端点检测,在复杂环境下适应能力较好,抗干扰能力强,端点检测精度较高。

(2)模拟匹配算法。动态时间归整(DTW)是基于动态规划(DP)思想,出现较早、较为经典的一种算法,为使其适应发音长短不一的现象,并得出语音识别判决的依据,使用DTW方法将模板和语音的特征序列进行匹配,并对比这两种特性的失真。

假设在储存词条模板,其中一条包含M帧倒谱特征R={r(m);m=1,2,∧,M},识别的特征序列中包含N帧倒谱特征T={t(n);n=1,2,∧,N}。在r(i)和t(i)之间定义帧局部失真D(i,j),D(i,j)=|r(i)-t(i)|2,通过DP过程,寻找最适合的匹配结果,即搜索路径中累计失真最小的路径。采用对称形式DTW:其中S(i,j)是累积失真,D(i,j)是局部失真。当DP过程运算到固定结点(N,M)时,可得出该模板动态匹配的归一化距离,识别结果即该归一化距离最小的模板词条:x=argmin{S(N,Mx)}。为了提高DTW算法的识别性能和模板的稳健性,提出了双模板策略,即x=argmin{S(N,M2x)},希望通过两个较为稳定的模板保持每一个词条较高的识别性能。

本文根据上述算法,利用QT开发环境,采用C++语言对算法进行编码,并移植到UPAtom510平台中进行语音识别。

4步进电机设计

本文设计的智能书架需要两个步进电机,其中一个用于书籍定位,另一个用于书籍推出,其中推出书籍的电机初始位置在第一本书籍之后。定位的电机用于带动滑道,滑道带动另一个电机到达指定书籍,到达后推动电机转动,推出书籍,最后将电机复位,回到初始状态。

书架带动滑道的齿轮周长要求与书架中所有书籍的预留位置宽度综合相等,这种设计可保证耗时短、耗電少、方便计算。当书籍语音识别定位到第1本书籍时,定位电机不转动,推出书籍的电机转动,推出第1本书籍,推出后归位;当书籍语音识别定位到其它书籍,如第5本书籍时,定位电机转动5周后,推出书籍的电机转动,推出第1本书籍,推出后推出电机归位,最后定位电机归位。

5智能书架运行测试

为了验证本文智能书架的实用性,选取实际应用环境对系统进行测试。智能书架测试实物如图5所示。

针对书籍数量为8本的智能书架不同位置的书籍进行了测试。测试数据如表1所示。

由表中数据可知,语音识别准确率基本达到90%以上,查找书籍时间在人们可以接受的范围内,与传统书架相比定位快、耗时短,具有一定实用价值。

6结语

本文采用UPAtom510平台、STC89C52单片机等相关外部设备设计了一种适用于家庭、办公室等环境下的基于语音识别的智能书架,在书籍查找中,利用语音识别完成准确定位,并应用步进电机完成书籍的查找和推出,较为有效地解决了日常生活中查找书籍定位难、耗时长等问题。实际应用测试表明,本文设计的智能书籍在特定环境下实施书籍查找与推出,具有较好的稳定性和识别准确率,可满足实际应用需求。由于本系统只适用于可喧哗环境,对查找书籍环境要求较为苛刻,下一步将针对图书馆等安静环境下的智能书架设计作进一步研究。

参考文献参考文献:

[1]嘉春乔.电气自动化控制在智能建筑中的运用[J].电子测试, 2016,2(4):144145.

[2]陈雨.智能无功补偿技术在电力自动化中的应用分析[J].电子测试,2016,2(4):150151.

[3]李忠.智能楼宇中通信自动化系统应用思考[J].电脑知识与技术,2016,12(12):250251.

[4]刘继雷.智能技术在电子工程自动化控制中的应用[J].电子技术与软件工程,2016 (18):167.

[5]邹昌伟,王林.面向嵌入式的协程与脚本化机制[J].计算机应用,2014,34(5):14111422.

[6]李新友,许涛,刘蓓.计算机核心配置自动化系统设计与实现[J].计算机应用,2013,33(10):28592860.

[7]张郁松,杜景林.基于超高频RFID的图书馆智能书架方案研究与设计[J].图书馆杂志,2014,133(12):87103.

[8]舒远仲,张丽,朱玄华,等.基于RFID的图书馆智能书架系统的研究与设计[J].计算机工程与设计,2013,34(6):22182222.

[9]程丽娜,陈杨阳.基于C51单片机智能灭火机器人的设计与研究[J].机器人技术与应用,2012(3):3940.

[10]胡命杰.船舶步进电机位置精度优化控制仿真研究[J].计算机仿真,2015,32(8):397398.

[11]徐国顺,张超.基于独立电力系统实时仿真平台的同步电机仿真模型[J].电机与控制应用,2016,39(6):45.

[12]杨立东,谷宇,张明.语音信号特征选择优化提取仿真研究[J].计算机仿真,2016,33(2):410411.

[13]商雄伟,张志祥,邱舒婷.一种通用的限定领域智能语音导学系统设计方法[J].计算机工程, 2016, 42(6):301303.

[14]金志敏.基于超高频RFID技术的图书馆智能书架与图书定位系统[J].大学图书情报学刊,2013,31(2):4041.

[15]张晓丹,黄丽霞,张雪英.关于在噪声环境下语音识别优化研究[J].计算机仿真,2016,33(8):173175.

[16]宋丽亚,赵国栋,张鹏.关于连续语音识别率优化仿真研究[J].计算机仿真,2016,33(3):396399.

[17]闵华松,李美升,魏洪兴,等.工程机械智能控制器设计[J].信息与控制,2011,40(2):256257.

责任编辑(责任编辑:黄健)

推荐访问: 书架 语音识别 智能 设计