"景先生毕设|www.jxszl.com

jetsontk1嵌入式终端的声源定位后端系统设计与开发(附件)【字数:12707】

2022-11-07 14:07编辑: www.jxszl.com景先生毕设
摘 要摘 要声源定位技术是一项包含多个领域的高技术课题,不仅包括声音信号的采集、AD信号转换、还包括数字信号的预处理、电子学等。从这涉及的范畴可知,这个课题的研究涉及到了许多或复杂或简单的理论知识,需要综合许多方面的知识和技术才能取得好的研究成果。近些年来,随着诸多军事和民用方面的需要及声音处理技术和信息感知技术的进展,导致声源定位技术发展的越来越迅速,应用范畴越来越广。本系统采用的是基于麦克风阵列声源定位的方法,使用2个到4个麦克风接收信号,通过系统处理,可以使摄像头指向声音的来源地。这个系统是小组完成,一人负责后端设计与开发,一人负责前端设计与展示,本人负责开发实现后端部分。后端系统部分主要负责声音的采集与预处理模块、时延估计模块和定位算法这3个模块。声音的接收部分使用麦克风序列采集声音信号,然后通过USB数据采集卡对其进行模数转换;预处理部分主要用两种方法对数字信号进行处理,分别是低通滤波和加窗分帧。时延估计部分采用广义互相关函数算法,在这模块中同时又用到了CUDA并行化的快速傅里叶变化及反变换,用来对时域和频域的相互转换,这大大优化了系统性能。定位算法部分用到了电压差技术和双曲线算法技术。关键词声源定位;麦克风阵列;TDOA定位算法;CUDA优化;jestson-tk1
目 录
第一章 绪论 1
1.1 课题背景 1
1.2 课题目的及意义 1
1.3 课题技术现状 2
1.4 本文主要工作及论文结构 3
1.5 小结 3
第二章 声源定位系统的需求分析与功能设计 4
2.1 系统的基本任务 4
2.2 系统整体需求分析 4
2.3 后端系统的功能需求分析 5
2.4 系统的总体功能设计 5
2.5 小结 5
第三章 声源定位后端系统模块详细设计与实现 6
3.1 后端系统整体框架概述 6
3.2 声音的采集与预处理模块 7
3.2.1 USB数据采集卡V5.0介绍 8
3.2.2 声音的采集 10
3.2.3 声音的预处理 10
3.3 时延

 *51今日免费论文网|www.jxszl.com +Q: ^351916072
估计模块 12
3.3.1 基于相位数据的时延估计算法 12
3.3.2 基于高阶谱的时延估计算法 12
3.3.3 基于自适应滤波的时延估计算法 13
3.3.4 基于相关分析的时延估计算法 13
3.4 定位算法模块 15
3.4.1 电压差法(双麦克风序列) 15
3.4.2 双曲线算法(三麦克风序列) 16
3.4.3 正方形法(四麦克风序列) 17
3.5 系统的实现 18
3.6 小结 18
第四章 声源定位系统基于CUDA的优化 19
4.1 CUDA简介 19
4.2 CUDA模型 19
4.2.1 CUDA编程模型 19
4.2.2 CUDA线程模型 20
4.3 基于CUDA的快速傅立叶变换 21
4.4 CUFFT库 22
4.5 小结 22
第五章 声源定位系统的测试 23
5.1 功能测试方案 23
5.2 声音采集与预处理模块的测试 23
5.3 时延估计模块与定位算法模块的测试 26
5.4 前后端级联的测试 26
5.5 系统性能测试 27
5.6 小结 27
结 论 28
致 谢 29
参 考 文 献 30
第一章 绪论
1.1 课题背景
随着经济水平和科学技术的发展,各种新产品、高科技不断的产生,生活变得更加便利。而声音自古以来便是人们用来相互提醒和了解外界的关键媒介,所以对声音信号的研究伴随着声学的不断发展而一直在进行着。这些年来,由于多媒体进军大众,基于声音、视频信号的交叉对人们来说,越来越不可替代。
随着各类电子设备产品的技术不断提高,已经越来越趋于智能化。而语音通讯范围有两种不可缺少的技术,一是对语音的增强,二是对声源的定位。在声源定位技术中,使用最普遍的就是基于麦克风阵列的方法。系统采用麦克风阵列[1]采集声源信号的信息,然后对其进行模数转换,通过一系列定位计算就能获得声源所在地的坐标信息。目前,基于麦克风阵列应用[2]的声源定位技术有很多:(1)人机交互:目前,机器人技术不断完善,已能做一些简单的工作。所以,许多人希望智能化机器人能够帮人类完成一些日常事务,比如照顾老年人和残疾人的生活,解除他们的烦闷这些事。然而,人们应该怎么去命令机器人去做这些事情呢?最简单的无外乎就是直接和机器人“说话”。当人们说话时,机器人能够自动识别,并判定声源的位置,从而提供服务。要达到这种级别,便得对机器人的听觉系统[3]做一番功夫,其中要用到的核心技术便是声源实时定位技术[4]和语音识别技术[5];(2)军事领域 :在战争时,声源定位技术在反偷袭方面应用的比较多,不仅可以用来探测敌方迫击炮发射的方位,而且对反狙击也能有较高的精度,从而减少伤亡。(3)视频、电话会议系统 :目前许多视频会议系统采用了这种技术,使用声源定位技术不但能迅速找到当前说话的人的位置,并且系统可以主动的将麦克风对准说话的人的方位,过滤掉其他地方的噪声,这大大提高了视频会议系统的真实性,给人以舒适的感觉;(4)助听器 :基于麦克风阵列的助听器能够凭借声源的位置,自动的对齐声源的方位,不但可以降低环境中的噪音,同时也优化了助听器的性能;(5)智能手机去噪:现在,许多智能手机都开始采取麦克风阵列技术来降低噪声,通过麦克风阵列对信号进行处理,降低环境噪声,对说话人的声音进行语言加强。
1.2 课题目的及意义
在20世纪后期,便有许多应用于研究语音信号处理的事例,都是基于麦克风阵列的,到了20世纪末,一个新的研究热门是基于麦克风阵列的语音信号处理算法。
声源定位技术的研究涉及到了多个领域范畴,包括模式辨认、信号处理、数模转换、神经网络学等多个方面。因此,要想对其有个深入研究,就得学习一些或复杂或简单的知识。当然,与付出相对应的,收获也是非常大的。声源定位技术前景非常普遍,这在上一章中已有简单介绍。比如,在现有的银行监控系统或者是博物馆监控系统中,采用声源定位的技术可以使摄像头、红外线指向声源处,这大大提高了安保的安全性,有效的提高了监控效率。还有网络会议,电视电话会议和多媒体教室等领域也会用到声源定位技术,这会使摄像头指向说话人,大大提高了虚拟会议的真实性,方便了人们之间的交流。

原文链接:http://www.jxszl.com/dzxx/txgc/78149.html