查看原文
其他

interNoise 2020 | 多声源的成像定位和识别。

普信®声学院 Prosynx 2023-02-13


导读

Lucas Carneiro、Alain Berry(希尔布鲁克大学声学研究所, 麦基尔大学音乐媒体和技术跨学科研究中心)提出了多声源的成像定位和识别方法与工程应用。

 

该研究成果已作为会议论文『Sound source localization and diagnosis from multiple acoustic images』发表在第49届国际噪声控制工程大会(interNoise 2020)上。


总括

基于麦克风阵列的声学成像系统被广泛应用在声源的识别和定位。尽管声波的辐射是三维的并且与路径有关,但是这些系统大多数在空间上是固定的:他们都无法实现多声源的识别,识别的准确度也有一定偏差。在先前发表的文章中,提出了一种使用广义互相关(GCC)波束成形和算法获得高质量的声学图像的方法,主要是使用图像分割原理和自动图像指标提取进行无监督声源定位。现在,本文提出了一种方法和系统,基于现有的技术和计算机视觉领域的方法,以便于实现无故障、空间定位精度高和对多目标的未知声源的声学图像的声源识别。该方法通过了数值和实验验证。结果表明,随着声源数量的增加仍可以准确的获取声源和其位置,同时,也可以对全方位、指向和点声源实现识别和区分。


背景

运动重构(SFM)是一种摄影测量技术,广泛用于地球科学和计算机图形学,以从最初以2D方式获得的图像中三维重建伪影。由于声波不具有与光波相同的特性,因此到目前为止,SFM原理尚未广泛用于三维声源的定位和重建。然而,它也可以表明大多数声学图像是可以投影的。因此,可以从一对立体成像中获取等极性线。做出其他一些假设,并正确处理从多个位置获得的图像,SFM技术可用于重构声源的三维位置和捕获位置。


之前有许多研究人员讲述了如何使用球形麦克风阵列和球形波束成形投影生成声学图像。在目前的成果中,GCC-PHAT(the generalized cross-correlation phase-alignment beamformer)被证明是效果最好的一种:对于声学条件反差较大的情况下,获得的声源定位在最大可能性上是最佳的。由于采用了并行计算,因此使用现代硬件在本质上是一种有效的数字处理。


创新

本文提出了一种基于遗传算法的优化方案,该方案使用几何准则来正确优化球形阵列上的麦克风分布。获得的声学图像倾向于呈现较大的主瓣宽度(MLW)和较小的旁瓣水平(SLL)。

 

本文还提出了基于图像分割原理的无监督声源定位法,同时需要结合自动图像指标计算。在声学图像上使用了两种分割方法:Otsus方法和Bradleys方法。定义了最佳参数,并为优化的麦克风阵列获得了最佳性能。更重要的是,演示了协方差椭圆的计算,该协方差椭圆成功地转换了点声源、单向声源、扩展声源和定向声源的定位不确定性。

 

在下文中,给出了这些方法的简要描述。可以参考参考文献来获取详细信息。重点介绍了如何组织和微调方法,以便在声学成像中利用SFM技术的强大功能。

 

但是,为了部署SFM,需要事先解决声学成像对应问题:在一个图像中获得的声源需要正确地与在任何其他图像中获得的声源相关联。图像对应是在计算机图形学中广泛研究的问题,但其在声学图像中的应用是新的。本文提供了对此问题的解决方案的详细讨论。

 

最后,提出了AISFM(Acoustic imaging structure from motion)技术。实现多声源的三维空间定位和识别技术,并且可以实现很高三维声场重建(在实验测试情况下可达到0.2m,数值仿真可实现0.1m的误差)。本文提到的技术以及形成了整套系统及产品并申请了相关专利。


研究内容-主要方法


麦克风阵列样式


图1:球形麦克风阵列。(a) 麦克风阵列分布(b)原型


图1(a)以球形坐标表示麦克风的位置。图1(b)显示了使用球形支架的原型的实现,该球形支架带有直径为30 cm的螺纹孔,并且麦克风安装在长度为7.5 cm的铝棒上。麦克风阵列的总直径为40厘米。

 

声学成像是从具有1°分辨率的等距矩形网格生成的。超声波计用于使用GCCAM仔细检查声学成像上的源振幅。红外指向器(Infrared targets)安装在阵列的顶部,方便获取6个自由度(DOF)位置信息,如下所述。在数值模拟中,麦克风根据具有平坦频率响应和64 dB信噪比(SNR)的标准麦克风来建模。


本文对麦克风阵列定位误差,幅度和相位失配以及球体散射效应对声学成像质量的影响进行了敏感性分析。结论是,这些因素均未对所获得的声学成像产生关键的负面影响。

 

声学成像分析

此部分主要是图像分割法,其主要用于通过二值化从边缘图像和背景图像中分离出声像的主瓣:主瓣由暗的连接区域表示,其余部分保持白色。找到通常从GCC-PHAT-GM图像获得的每个主瓣的最大值(位于较暗的连接区域),并将其定位归因于声源。可以使用先前计算的定位从GCC-AM图像中恢复此源的幅度pRMS。


图2:声学图像分析步骤


运动声学成像


图3:运动声学成像原理图


最后,值得注意的是,AISFM方法的收敛对异常声源很敏感。但是,可以使用最小观察标准来检测离群值并将其从声像对应问题的解决方案中排除。

 

声像对应


图 4:使用通过运动信息的声像对应


研究内容—实验验证


图 5:具有5个声源和15个麦克风阵列位置的消声室内声场布置


图6. 仿真和实验数据的结果展示。以dB为单位的相对分贝值以黑色显示,以dB为单位的绝对分贝值以绿色显示。


图7. 声源定位结果图


应用及展望

在这项工作中,在数值计算和实验上证明并成功验证了AISFM方法的可行性。结果表明,该方法可以最大程度地重构声源并捕获位置定位。理论上表明,该方法可以使用协方差椭圆处理声源属性,例如扩展性和指向性。

 

正如文章中作者所言,声学成像技术是目前研究的热点问题。声源的识别与定位问题也一直是振动噪声控制中一大难题,声学成像技术是针对此类问题时最高效的、准确的方式,该技术的大力发展与应用将会解决更多工程上的硬骨头,难点问题。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存