正在进行安全检测...

发布时间:2023-11-19 10:52:09   来源:文档文库   
字号:
术 SCtENOE&TECHN0LOGY . 匝圆 基于麦克风阵列声源定位的发展历程及关键技术 蒋婷’ 刘建平 (1.武警工程大学研究生管理大队;2.武警工程大学通信工程系 西安 7  0086) 要:回顾了基于麦克风阵列的声泺定位系统的发展历程,对声源定位关键技术进行了讨论,分析了现有算法并对各算法的优缺点进行 比较,文章的最后对麦克风声源定位技术的难点进行了概述,为进一步研究麦克风阵列信号处理奠定基础。 关键词:麦克风阵列 关键技术 信号处理 中图分类号:TM9 37 文献标识码:A 文章编号:1 672—3791(2011)12(b)一0093—02 1发展历程 早在20世纪70、80年代,就已经开始将 麦克风阵列应用干语音信号处理的研究 成,不能直接用于1 80。范围内的定位,往往 是利用多个阵列组合定位,但增加了系统 复杂度和实现成本,而且在麦克风阵列的 基于时延估计(TDOA)的声源定位法在 运算量上优于其他方法,实时性好,可以在 实际中低成本实现,但也有不足之处:其一 中,进入90年代以来,基于麦克风阵列的语 音信号处理算法逐渐成为一个新的研究热 点【。1 985年Flanagan将麦克风阵列引入到 大型会议的语音增强中,并开发出很多实 际产品。l987tgSilverman将麦克风阵列引 入到语音识别系统,1992年又将阵列信号 处理用于移动环境下的语音获取,后来将 其应用于说话人识别。1995年Flanagan在混 响环境下用阵列信号处理对声音进行捕 获。1996年Silverman ̄tlBrandstein开始将其 应用于声源定位中,用于确定和实时跟踪 说话人的位置【2】。目前麦克风阵列系统已有 许多应用,其中在民用上包括视频会议、语 音识别、车载系统环境、大型场所的会议记 录系统以及助听装置等;军用上包括声纳 系统对水下潜艇的跟踪及无源定位直升机 和其他发声设备上。在国外,很多著名的公 司和研究机构,如IBM,BELL等,正致力于 麦克凤阵列的研究和产品,而且已经有了 些初期产品进入市场[31。这些产品已经应 用到社会生活的各个场合并体现出了极大 的优越性。遗憾的是,在国内,到目前为止 还没有自主产权的麦克风阵列产品。因此, 研究我国自主的基于麦克风阵列的语音处 理算法和技术具有重要的意义。我国一些 企业、研究所和高校做了大量的相关工作, 但是目前对声源定位的研究才算刚刚起 步。 2声源定位关键技术 基于麦克风阵列的声源定位是指用麦 克风拾取声音信号,通过对麦克风阵列的 各路输出信号进行分析和处理,得到一个 或者多个声源的位置信息,其使用的关键 技术有以下几个方面。 2.1模型的建立 麦克风阵列的阵元按一定的方式布景 在空间不同的位置上组成阵列,阵列能够 接收空间传播信号,经过适当的信号处理 提取所需的信号源和信号属性等信息。阵 列按阵元在空间分布形式的不同,可以分 为任意离散阵、直线阵、平面阵、圆弧阵和 均匀圆阵。不同的阵列模型有各自的优缺 点,可以用来处理不同的实际情况。 均匀直线阵由于结构简单,并且同时 间序列的均匀采样完全对应,可以采用绝 大多数基于时间序列的算法,因此受到很 大的重视,应用也十分广泛。然而均匀直线 阵列也有很多局限性,不适合多波束的形 算法处理中也需要进行切换。 是估计时延和定位分成两阶段来完成,因 平面阵虽然可以在整个平面对目标进 此在定位阶段用的参数已经是对过去时间 行测向,但对于低空甚至是超低空飞行的 的估计,这在某种意义上只是对声源位置 目标来说,由于在Z轴方向没有基元,测向 的次最优估计;其二是时延定位的方法比 精度受到限制。 较适合于单声源的定位,而对多声源的定 均匀圆阵是阵元均匀分布在一个圆环 位效果就不好;其三在房间有较强混响和 上的圆形阵列,方向增益基本一致,可以 噪声的情况下,往往很难获得精确的时延, 提供360。的方位信息,但其对应一个二维 从而导致第二步的定位产生很大的误差; 空间,在时域无法找到对应的采样定理, 其四是由于阵列结构和系统采样率等条件 会给算法实现带来麻烦,并且由于其圆对 的限制,其定位精度远远不能与超分辨类 称性,均匀圆形阵列对相干声源的解算能 算法相比。 力比较弱。但因其不需扇区切换,处理较 任何一种算法都不可能适用于所有情 为容易。 况,我们在不断完善算法,优化其性能的同 三维阵列结构较复杂,可以选择的算 时,应根据不同的应用环境来选择最佳算 法不是十分丰富,实现成本较高,但是对整 法,从而达到最佳效果。 个三维空间定位性能好,适用于需要对整 个三维空间定位的系统。 3麦克风阵列处理的难点 在利用麦克凤阵列进行声源定位时, 采用多个麦克风构成一个麦克风阵 必须已知各个麦克风阵元之间的相对位置 列,在时域和频域的基础上增加一个空间 关系。不同的阵型结构对算法精度的影响 域,对接收到的来自空间不同方向的信号 也非常大,因此需针对不同的应用环境选 进行空时处理,这就是阵列麦克风信号处 择与之相对应的阵列结构。特别是对多个 理的核心思想。阵列信号处理理论的完善 声源目标进行定位时,过小的阵列口径会 和发展,促进了基于阵列麦克风的信号处 极大地影响阵列的应用范围。因此,要根据 理理论的发展。很多用于阵列信号处理的 不同的应用需求选取不同的阵列模型。 新算法、新技术和新体系,都可以用于阵列 2.2算法的选取 麦克风。可以说,阵列信号处理理论的发展 麦克风阵列接收的声音信号本身就是 为阵列麦克风的研究带来了新的契机 1 复杂的信号,因此声源定位算法必须能够 基于麦克风阵列的语音信号处理是阵 适应信号的各种特性。不同的声源信号,采 列信号处理的一种,但它又不同于传统的 取的定位算法也可能不同:例如,在对说话 阵列信号处理,其主要技术难点如下。 人进行定位时,由于拾取到的语音信号没 3.1麦克风阵列模型的建立 有经过调制,也没有载波,阵列之间的时延 麦克风主要用于处理语音信号,同时 和相位差与信号源的频率关系密切,此时 阵列麦克风的拾音范围都有限,因此,声源 麦克风阵列处理的信号应该看做是一个宽 大都位于麦克风阵列近场范围内。这使得 带信号,而传统的定位算法是对窄带而言 传统阵列处理,如雷达、声纳等,所用的平 的。下面就两种经典的算法进行比较。 面波前远场模型不再适用,必须使用更为 MUsIC算法的基本思想是将任意阵列 精确的球面波前模型㈨。球面波前模型必须 输出的协方差矩阵进行特征分解,得到相 考虑由于传播路径不同所带来的幅度衰减 互正交的信号子空间和噪声子空间,然后 的不同,即除了信号的到达方向外,还需要 利用两者的正交性进行DOA估算。MUSIC 考虑声源与阵列之间的距离。所以,进行麦 算法对波达方向的估计性能很好,可以高 克风阵列研究,必须建立适用于麦克风阵 分辨地准确表现各信号的波达方向,如果 列的近场模型。 参与运算的数据长度足够长或信噪比足够 3.2阵列宽带信号的处理 高,且信号模型准确的话,MusIC算法可以 传统的阵列处理的信号一般是窄带信 得到任意精度的波达方向估计值。但是 号。阵元之间接收到的信号的时延和相位 MUSIC算法是以信号子空间和噪声子空间 差主要由载波确定。在麦克风阵列处理中, 能够准确得到为前提,如果信噪比低或样 信号没有经过调制,也没有载波由于语音 本数不够,MUSIC算法的分辨率会大幅下 信号的最高频率和最低频率之比很大,这 降。 (下转95页) 科技资讯SCIENCE&TECHNOLOGY INFORMATION 
术 SClENCE&TECHNOLOGY 3.2数据分析 由PLC分别采集温度传感器和压力传感 器的参数值,并通过标准RS232接口送至 WinCC人机界面。根据文献,测试数据处理 采用线热源模,可知导热系数仅与加热泵功 率Q,测试时间 ,地埋管进出水口的温度 …t,有关,其他的参数均为常数,Q和S可以 根据实际情况取得,所以我们只需要测量 …t即可。所以,根据测得的72h~96h的进 出口温度及加热功率等数据,在MATLAB软 件利用最小二乘法进行分析,计算出土壤的 图3 热响应测试系统监控界面 导热系数。 数据采集控制和分析系统包括PLC系 变频运行,以控制地埋管内水达到稳流状 统、WinCC人机界面、MATLAB分析软件, 态。PLC上标准RS232通讯口与上位机Win 4结语 如图2所示为其结构框图。 CC通讯连接,完成数据的上传。 基于PLC的地源热泵热响应测试系统, PLC是可编程逻辑控制器的简称,它是 不仅可以应用于工程实际测量,还可以用 为工业.控制应用而设计制造的综合了计算 系统软件设计 来土壤热物性参数进行研究,测试仪引入 机技术、自动控制技术和通信技术的一种 3.1上位机软件设计 了PLC可编程控制器和WinCC模块实现了 新型的、通用的自动控制装置。PLC以其功 上位机监控软件(人机界面)的开发基 对测量和实验状态的监控,测试仪的结构 能强、可靠性高、使用灵活方便、易于编程 于西门子公司的SIMAT IC WinCC组态软 紧凑,测试功率范围广,可视化程度高,操 以及适于在工业环境下应用等一系列优 件,该软件功能强大,包括所有SCADA功能 作方便,使用安全,测试精度高。 点,而成为工业控制领域中最常用的工业 在内的客户机/le务器系统,使用Microsof 控制设备。将PLC应用于本测试仪中,作为 SQL Server 2000作为其组态数据和归档 参考文献 核心控制器,使测试仪可靠性强、精度高。 数据的存储数据库,也可以通过标准接口 1】刁乃仁,方肇洪.埋管式地源热泵技术 PLC系统由西门子的CPU 224 ̄1模拟 方便地和其他应用程序交换数据。 M】.北京:高等教育出版社,2006. 量模块EM235组成。开关量I/O端口的输入 热响应测试系统监控界面如图3所示。 2】乔卫来,等.地埋管热响应测试及数据 端口用于采集故障输入信号,输出端口用 数据采集和控制系统的winCC人机界面, 分析方法[].流体机械,2010,30(6):60~ 于控制循环水泵的启停和电加热水箱中电 通过标准RS232通讯口与可编程控制器 63. 加热器的启停,以及与固态继电器联合使 PLC相连接,实时显示采集的压力、流量和 3】赵军,段征强,宋著坤.基于圆柱热源模 用控制加热器的输出功率;在可编程控制 温度值,并在计算机中连续存储温度数据, 型的现场测量地下岩土热物性方法【J】. 器PLC主机上扩展了模拟量模块,模拟量模 根据数据分析的需要,每5rin记录一次即 太阳能学报,2006,27(9):934~936. 块具有4路A/D功能和1路D/A功能,A/D用 可;同时,将用户在人机界面上控制电加热 4]余传辉.地下土壤导热系数计算方法及 于通过压力传感器和温度传感器采集地埋 器按预设功率加热、循环水泵按预设频率 结果分析[D】.长春:吉林大学,2006. 管换热器的进水侧水温、回水侧水温以及 运行,并将控制命令传送给可编程控制器 5】周亚素.土壤导热系数的现场测试方法 进水侧和回水侧的管内水压值。D/A用于 PLC,可编程控制器PLC按上位机的命令进 J】.东华大学学报(自然科学版),2008, 控制循环水泵的变频器输出频率,使电机 行输出,控制变频器和加热器工作。 34(4):482~485. (上接93页) 内等较封闭的环境中,除了环境噪声和其 参考文献 导致相同的时间延迟却有不同的相位差, 他声源的影响外,声源本身在室内的混响 [1]Mumolo E,Nolich M,Menegatti E,et 阵元之间接收到的信号的时延和相位差由 也会对准确定位造成影响。 a1..A multi agent system for audio- 信号源的特性来决定。麦克风接收到的语 video tracking of a walking person in 音信号频率一般在300Hz~3000Hz之间,阵 结语 a structured environment[Cl//Proceed- 列之间的时延和相位差与信号源的频率关 麦克风阵列信号处理是数字信号处理 ings of Workshop on Multi agent 系密切。因此,麦克风阵列处理的信号可以 的一个新领域,具备许多传统阵列信号处 Robotic Systems trends and industrial 看成是一个宽带信号,这使得阵列处理更 理无法比拟的优势,是目前国内外的研究 applications,Padova,Italy,2003. 加困难。 热点。但其在低信噪比或强混响的环境下, 2】Valn J M,Michaud F,Rouat J.Robua 3.3非平稳信号的处理 很多算法的性能都不是很理想,如TDOA, localization and tracking of simulta- 传统的阵列处理的接收信号一般为平 时延的估计精度会受到采样频率的限制。 neous moving sound sources using 稳信号,而麦克风阵列中的接收信号为非 尽管许多方法试图通过插值来提高估计精 beamforming and particle filtering[J]. 平稳的语音信号。语音信号可以看成是在 度,但是这样的插值只提供了一种平滑的 Robotics and AutonoNOus Systems 20ms~40ms的时间内是近似平稳的,即语 方法,并没有提高时间分辨率。所以期待能 Journal,2007,55(3):216~228. 音信号具有短时平稳性。结合上面的宽带 有一种更加精确的时延估计方法,使得 3】张贤达.现代信号处理IN].清华大学出 情况,麦克风阵列处理一般先把接收信号 TDOA估计不受采样频率的限制。对于实际 版社,2003. 经过一个短时傅立叶变换,求出其短时谱, 的定位系统而言,稳健的时延估计将为下 [4]S.Doclo,Multi-microphone noise re— 然后在频域进行处理。每一频率对应一个 步精确的定位奠定基础。 duction and derverberation techniques 相位差。麦克风阵列的信号处理是将宽带 庞大的运算量也限制了许多算法在实 for speech applications,Ph.D.Thesis, 信号在频域上分成多个子带,对每一个子 时定位系统中的应用,如music算法,如何 ESAT,Katholieke University LeUven, 带应用传统的窄带处理,从而得到接收信 提高在低信噪比环境下的性能与定位系统 Belgium,Chapter 9,Near-Field Broad- 号的空间谱。 的抗噪声能力,在复杂度与性能之间取得 band Beamforming,2003:217~232. 3.4混晌的影响 折衷,将是下一步的研究工作。相信随着研 5】胡航.语音信号处理[M】.哈尔滨工业大 传统的阵列信号处理中,噪声和信源 究的不断深入,麦克风阵列信号处理也必 学出版社,2000. 通常是不相干的.而麦克风阵列多位于室 定会具备越来越广阔的应用前景。 科技资讯SCIENCE&TECHNOLOGY INFORMATION 95 

本文来源:https://www.2haoxitong.net/k/doc/87b3eb7331d4b14e852458fb770bf78a65293a8d.html

《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式