jetsontk1嵌入式终端的声源定位后端系统设计与开发(附件)【字数:12707】
目 录
第一章 绪论 1
1.1 课题背景 1
1.2 课题目的及意义 1
1.3 课题技术现状 2
1.4 本文主要工作及论文结构 3
1.5 小结 3
第二章 声源定位系统的需求分析与功能设计 4
2.1 系统的基本任务 4
2.2 系统整体需求分析 4
2.3 后端系统的功能需求分析 5
2.4 系统的总体功能设计 5
2.5 小结 5
第三章 声源定位后端系统模块详细设计与实现 6
3.1 后端系统整体框架概述 6
3.2 声音的采集与预处理模块 7
3.2.1 USB数据采集卡V5.0介绍 8
3.2.2 声音的采集 10
3.2.3 声音的预处理 10
3.3 时延
*51今日免费论文网|www.jxszl.com +Q: ^351916072*
估计模块 12
3.3.1 基于相位数据的时延估计算法 12
3.3.2 基于高阶谱的时延估计算法 12
3.3.3 基于自适应滤波的时延估计算法 13
3.3.4 基于相关分析的时延估计算法 13
3.4 定位算法模块 15
3.4.1 电压差法(双麦克风序列) 15
3.4.2 双曲线算法(三麦克风序列) 16
3.4.3 正方形法(四麦克风序列) 17
3.5 系统的实现 18
3.6 小结 18
第四章 声源定位系统基于CUDA的优化 19
4.1 CUDA简介 19
4.2 CUDA模型 19
4.2.1 CUDA编程模型 19
4.2.2 CUDA线程模型 20
4.3 基于CUDA的快速傅立叶变换 21
4.4 CUFFT库 22
4.5 小结 22
第五章 声源定位系统的测试 23
5.1 功能测试方案 23
5.2 声音采集与预处理模块的测试 23
5.3 时延估计模块与定位算法模块的测试 26
5.4 前后端级联的测试 26
5.5 系统性能测试 27
5.6 小结 27
结 论 28
致 谢 29
参 考 文 献 30
第一章 绪论
1.1 课题背景
随着经济水平和科学技术的发展,各种新产品、高科技不断的产生,生活变得更加便利。而声音自古以来便是人们用来相互提醒和了解外界的关键媒介,所以对声音信号的研究伴随着声学的不断发展而一直在进行着。这些年来,由于多媒体进军大众,基于声音、视频信号的交叉对人们来说,越来越不可替代。
随着各类电子设备产品的技术不断提高,已经越来越趋于智能化。而语音通讯范围有两种不可缺少的技术,一是对语音的增强,二是对声源的定位。在声源定位技术中,使用最普遍的就是基于麦克风阵列的方法。系统采用麦克风阵列[1]采集声源信号的信息,然后对其进行模数转换,通过一系列定位计算就能获得声源所在地的坐标信息。目前,基于麦克风阵列应用[2]的声源定位技术有很多:(1)人机交互:目前,机器人技术不断完善,已能做一些简单的工作。所以,许多人希望智能化机器人能够帮人类完成一些日常事务,比如照顾老年人和残疾人的生活,解除他们的烦闷这些事。然而,人们应该怎么去命令机器人去做这些事情呢?最简单的无外乎就是直接和机器人“说话”。当人们说话时,机器人能够自动识别,并判定声源的位置,从而提供服务。要达到这种级别,便得对机器人的听觉系统[3]做一番功夫,其中要用到的核心技术便是声源实时定位技术[4]和语音识别技术[5];(2)军事领域 :在战争时,声源定位技术在反偷袭方面应用的比较多,不仅可以用来探测敌方迫击炮发射的方位,而且对反狙击也能有较高的精度,从而减少伤亡。(3)视频、电话会议系统 :目前许多视频会议系统采用了这种技术,使用声源定位技术不但能迅速找到当前说话的人的位置,并且系统可以主动的将麦克风对准说话的人的方位,过滤掉其他地方的噪声,这大大提高了视频会议系统的真实性,给人以舒适的感觉;(4)助听器 :基于麦克风阵列的助听器能够凭借声源的位置,自动的对齐声源的方位,不但可以降低环境中的噪音,同时也优化了助听器的性能;(5)智能手机去噪:现在,许多智能手机都开始采取麦克风阵列技术来降低噪声,通过麦克风阵列对信号进行处理,降低环境噪声,对说话人的声音进行语言加强。
1.2 课题目的及意义
在20世纪后期,便有许多应用于研究语音信号处理的事例,都是基于麦克风阵列的,到了20世纪末,一个新的研究热门是基于麦克风阵列的语音信号处理算法。
声源定位技术的研究涉及到了多个领域范畴,包括模式辨认、信号处理、数模转换、神经网络学等多个方面。因此,要想对其有个深入研究,就得学习一些或复杂或简单的知识。当然,与付出相对应的,收获也是非常大的。声源定位技术前景非常普遍,这在上一章中已有简单介绍。比如,在现有的银行监控系统或者是博物馆监控系统中,采用声源定位的技术可以使摄像头、红外线指向声源处,这大大提高了安保的安全性,有效的提高了监控效率。还有网络会议,电视电话会议和多媒体教室等领域也会用到声源定位技术,这会使摄像头指向说话人,大大提高了虚拟会议的真实性,方便了人们之间的交流。
原文链接:http://www.jxszl.com/dzxx/txgc/78149.html