智能语音机器人系统的设计与实现(源码)【字数:9622】
目 录
第1章 前言 1
1.1课题研究背景 1
1.2国内外研究现状 1
1.3运行环境 2
1.4课题研究内容 2
1.5课题研究目的与意义 3
1.5.1 研究目的 3
1.5.2 研究意义 3
1.6全文组织结构 3
第2章 智能语音机器人的系统分析 4
2.1智能语音机器人的可行性分析 4
2.2智能语音机器人的现状分析 4
2.2.1 语音智能终端应用 4
2.2.2 智能语音应用现状 5
2.3智能语音机器人的需求分析 4
2.3.1 功能需求分析 5
2.3.2 非功能需求分析 6
第3章 智能语音机器人的系统设计 7
3.1智能语音机器人的总体结构 7
3.2语音识别模块设计 9
3.3信息交互模块设计 9
3.4语音合成模块设计 13
第4章 智能语音机器人系统具体实现 14
4.1语音录入模块实现 14
4.2语音识别模块实现 14
4.3信息交互模块实现 16
4.4语音合成模块实现 18
*51今日免费论文网|www.jxszl.com +Q: @351916072@
4.5语音播放模块实现 19
第5章 智能语音机器人系统测试 21
5.1语音识别模块测试 21
5.2 信息交互模块测试 22
5.3语音合成模块测试 22
第6章 总结与展望 24
6.1 总结 24
6.2 展望 24
参考文献 26
致 谢 28
第1章 前言
1.1课题研究背景
人工智能时代正在到来,人工智能逐渐被人们认为是下一个互联网类行业中具有颠覆性和前瞻性的技术。从其更细化的范围中看,智能语音处理作为一项重要的技术,其应用领域非常广泛,可以使用于多种场景。智能语音界面交互有可能会成为未来交互的新形势,语音操作界面交互的方式可能会代替现在的图形界面交互。
从GUI(Graphical User Interface)到VUI(Voice User Interface) [1] 。
1.2国内外研究现状
上个世纪五十年代初,美国的贝尔实验室(Bell Labs),制作了一台自动数字识别的机器,名为“Audrey”,数字09他都能识别。
时间到了上个世纪六十年代初,日本的几个实验室在语音识别领域取得了巨大的进展,制作出了语音识别的专用硬件。一直到七十年代,语音识别的研究重心依然是单个词语的语音识别。
二十世纪七十年代在美国国武部研究所的赞助下,可以识别整句的系统“Harpy”在卡内基梅隆大学诞生了。
二十世纪八十年代,日本电气股份有限公司、贝尔实验室在识别算法取得了巨大的突破,提出了二阶动态规划算法、分层构造算法和帧同步分层构造算法。同时,连续语音的识别进步迅速,模板匹配的方法逐步被替代统计模型,语音识别系统的基础模型成为了隐马尔科夫模型(HMM) [2]。 在1984年,IBM在五千个词汇量级的语音识别率能达到95%。
二十世纪九十年代,IBM建立里第一个听写系统“IBM Speech Server Series (ISSS)” [2]。97年IBM公司第一个语音听写产品ViaVoice上市,你只要对着麦克风喊出要输入的语句,其能够自动判断而且会帮你生成字符。
二十一世纪初,辛顿(Hinton)提出深度置信网络(DBN),促使了深度神经网络(Deep Neural Network,DNN)研究的发展,深度学习又开始受到欢迎。之后辛顿和他的学生默罕默德(D. Mohamed)将深度神经网络应用于语音的声学建模,在小词汇量连续语音识别数据库TIMIT上获得成功 [4]。同年,微软的Win7系统开始集成语音功能。
2011年初,微软公司开发的深度神经网络模型在语音搜索任务上获得成功 [5],科大讯飞也开始将深度神经网络应用到中文的语音识别领域,10月苹果的手机助手Siri诞生。
2012年,谷歌用在安卓 4.1 和 Nexus 手机上智能语音助手Google Now 出现在世人面前。
2013年,Google公司发布Google Glass,苹果也加大了对iWatch的研发投入,穿戴式语音交互设备成为新热点 [6]。
2014年11月,亚马逊智能音箱Echo发布,通过Alexa进行语音控制,可以为执行各种任务,控制各种系统。同年微软的小冰和小娜发布,小冰可以通过第三方平台接入,小娜则搭载在微软的Lumia手机上。
原文链接:http://www.jxszl.com/jsj/jsjkxyjs/368958.html