两级参考点匹配位置指纹声源定位方法

doi:10.3785/j.issn.1008-973X.2019.06.020

两级参考点匹配位置指纹声源定位方法

王硕朋^,, 杨鹏^,, 孙昊, 刘迈

Fingerprint-based sound source localization method using two-stage reference points matching

WANG Shuo-peng^,, YANG Peng^,, SUN Hao, LIU Mai

通讯作者: 杨鹏，男，教授. orcid.org/0000-0003-3006-2184. E-mail： yphebut@163.com

收稿日期: 2018-05-7

Received: 2018-05-7

作者简介 About authors

王硕朋（1987—），男，博士生，从事听觉定位研究.orcid.org/0000-0001-7591-6874.E-mail：wangsp87921@hotmail.com , E-mail：wangsp87921@hotmail.com

摘要

提出一种两级参考点（RPs）匹配方法来减少位置指纹声源定位（SSL）过程中临近参考点搜索的计算量. 离线采样阶段：通过K均值聚类算法将数据库划分为一定数目的子库，并采用一种距离检测方法对离群点进行剔除. 在线定位阶段：通过第一级临近子库匹配完成对参考点搜索范围的缩减；在临近子库内进行第二级参考点匹配得到临近参考点；完成声源目标（TP）定位. 实验结果表明，采用两级参考点匹配算法可以在保证定位精度的前提下有效提高位置指纹声源定位方法的定位效率.

关键词： 声音位置指纹 ; 临近参考点 ; K均值聚类算法 ; 两级参考点（RPs）匹配

Abstract

A two-stage matching method was proposed for computation reduction of adjacent reference points (RPs) searching in fingerprint-based sound source localization (SSL). In offline sampling phase, the K-means clustering method was adopted to divide the database into a certain number of sub-databases and the outliers were eliminated by the distance-based detection method. In online positioning phase, searching space was compressed by the first stage sub-database matching; then adjacent RPs were obtained through the second stage RPs matching in the adjacent sub-database; the auditory target point (TP) location estimation was accomplished. The experimental results show that the two-stage RPs matching algorithm can effectively improve the positioning efficiency of fingerprint-based sound source localization on the premise of ensuring the positioning accuracy.

Keywords： sound-position fingerprint ; adjacent reference points (RPs) ; K-means clustering method ; two-stage RPs matching

PDF (1145KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

王硕朋, 杨鹏, 孙昊, 刘迈. 两级参考点匹配位置指纹声源定位方法. 浙江大学学报(工学版)[J], 2019, 53(6): 1198-1204 doi:10.3785/j.issn.1008-973X.2019.06.020

WANG Shuo-peng, YANG Peng, SUN Hao, LIU Mai. Fingerprint-based sound source localization method using two-stage reference points matching. Journal of Zhejiang University(Engineering Science)[J], 2019, 53(6): 1198-1204 doi:10.3785/j.issn.1008-973X.2019.06.020

声源定位是音频信号处理领域的重要研究内容之一，在智能机器人、盲点探测和水下侦查等领域有广泛的应用^[1-3]. 此外，由于基于麦克风阵列的声源定位属于宽带短时平稳信号的空间谱估计问题，其研究成果可被移动通信、声呐侦查和雷达探测等研究领域所借鉴. 传统声源定位方法主要分为3类：基于高分辨率谱估计的方法^[4]、基于可控波束形成的方法^[5]和基于时延（time delay of arrival，TDOA）估计的方法^[6]. 这些方法可将声源与阵列结构的空间几何关系转换为空间谱、空间波束或到达时间差等信息，并通过对这些信息的估计完成声源定位. 传统几何定位方法需预知模型参数，属于参数化定位方法范畴. 其中，时延估计定位法因其计算复杂度低、实时性好且硬件成本低，被广泛应用于声源定位和跟踪中^[7-8]. 然而，在多径信号和环境噪声的影响下，时延估计的精度一般较低，这是室内环境中基于时延估计的参数定位方法性能不佳的主要原因.

作为一种非参数定位方法，基于位置指纹的声源定位方法（sound source localization，SSL）可依据环境感知思想，通过建立位置指纹库进行室内定位. 该方法可以有效减少几何模型声源定位方法在室内应用中因模型参数测量误差和环境干扰导致的定位误差. 与基于几何模型的参数化定位方法相比，位置指纹定位方法无须预知传感器空间位置，且对定位环境的复杂性没有特别要求，具有更好的环境适应性^[9-10].

研究表明，位置指纹定位方法的定位精度受参考点（reference points，RPs）密度^[11-12]影响较大. 因此，通常需要在离线采样阶段构建大规模的定位数据库来满足定位精度需求. 与此同时，在在线定位阶段，定位算法需要占用大量计算资源完成定位，使得位置指纹声源定位方法的定位效率降低，很难应用于移动机器人听觉定位、室内异常声源定位和发声者定位等对实时性要求较高的场景^[13]. 为提高位置指纹定位方法的定位效率，Khalajmehrabadi等^[14]采用了基于插值的稀疏数据库恢复方法来减少初始参考点数量，从而提高离线采样效率. 但是，由于插值生成的虚拟参考点仍需参与临近参考点匹配，该方法并未明显改善在线定位效率较低的情况.

有选择的进行目标点（target point，TP）和参考点的匹配可以减少在线匹配的计算量，因此可通过将搜索范围收缩到目标点周围参考点来减少非临近参考点的匹配量，提高匹配效率. 很多研究者考虑将数据库分块，然后选择最可能包含临近参考点的子库进行搜索来降低运算量^[15]. 文献[16]介绍了多种基于坐标栅格划分的数据库分块方法，这些方法可有效提升位置指纹定位的效率和稳定性. Liu等^[17]在坐标栅格划分方法的基础上提出了一种基于最小包围圈的方法来实现栅格大小的灵活定义. 但是，坐标划分方法受主观判断影响较大，存在数据库分区方式不统一和分区导致参考点失配后定位误差增大的问题. 聚类分析是一种以样本特征相似性为基础，对数据集进行自动划分的无监督学习算法. 聚类分析方法可将特征相似的参考点自动地划分到同一个子库. 相比坐标划分方法，特征聚类划分方法与临近参考点的选取规则更趋一致^[18].

为提高位置指纹声源定位方法的定位效率，本文提出一种两级参考点匹配方法来提高临近参考点的搜索速率. 首先通过离线采样阶段的特征空间聚类分析将定位数据库划分为一定数目的子库，然后在在线定位阶段通过两级匹配过程对参考点匹配量进行缩减完成临近参考点快速搜索.

1. 基于位置指纹的声源定位

如图1中四麦克风（M0，M1，M2，M3）声源定位系统所示，基于位置指纹的声源定位过程包含用于数据库构建的离线采样阶段和用于位置估计的在线定位阶段两部分. 图中（ ${x_n},{y_n}$）和（ $f_n^1,$ $f_n^2, \cdots ,f_n^M$）分别表示第n个参考点的坐标和定位特征，其中M为特征总数； ${f^1},{f^2}, \cdots ,{f^M}$为待测点信号特征， ${{l}}=(\hat x,\hat y)$是定位结果.

图 1

新窗口打开| 下载原图ZIP| 生成PPT

图 1 基于位置指纹的声源定位（SSL）技术示意图

Fig.1 Illustration of fingerprint-based sound source location （SSL） technique

1.1. 离线采样阶段

离线采样过程一般分为3步：1）根据定位区域环境和定位需求确定参考点的坐标；2）遍历每个参考点坐标并释放定位信号，同时通过声源定位系统完成信号采集和位置相关特征提取；3）将参考点二维坐标及其特征关联形成一组样本，也称作位置指纹：

(1) ${{{S}}_n}{\rm{=}}[{{{L}}_n},{{{F}}_n}],\begin{array}{*{20}{c}} {} \end{array}n=1,2, \cdots ,N.$

式中： ${{{S}}_n}$对应第n个参考点的位置指纹，N为参考点总数； ${{{L}}_n}=[{x_n},{y_n}]$和 ${{{F}}_n}=[f_n^1,f_n^2, \cdots ,f_n^M]$分别表示第n个参考点的坐标和特征向量. 其中 ${f^m}$表示特征向量的第m个特征值，M为特征值的总数. 本文选择声达时间差 $ \Delta{{T}}$作为位置特征，因此 ${{F}}=\Delta{{T}}$. 采集每个采样点的指纹数据建立位置指纹数据库，定义为

(2) ${{D}}{\rm{=}}{[{{{S}}_1},{{{S}}_2}, \cdots ,{{{S}}_N}]^{\rm T}}.$

1.2. 在线定位阶段

采用加权K-最近邻算法（weighted K-nearest neighbor，WKNN）进行位置估计. 首先，信号采集系统捕获待定位声源声音信号并提取特征向量 ${{F}}{\rm{=}}[{f^1},{f^2}, \cdots ,{f^M}]$. 然后，将待定位目标与指纹数据库D中的参考样本进行特征空间匹配，即通过计算目标点和数据库中各参考点特征空间的相似程度，选择相似度最高的参考点作为邻近参考点的过程. 2个特征向量间的相似程度，可以用两者之间的距离表示：距离近，则相似程度高；距离远，则相似程度低. 最后，依据临近参考点通过加权定位算法估计待测点坐标：

(3) ${{l}}=\sum\nolimits_{i=1}^k {{\omega _i}} \times {{{L}}_i}.$

式中：k为临近参考点的个数： ${{{L}}_i}=({x_i},{y_i})$为第i个临近参考点的坐标，其所对应的权值 ${\omega _i}$采用逆距离加权的方式计算：

(4) ${\omega _i} = \frac{{{{({d_i} + \varepsilon )}^{ - 1}}}}{{\sum_{j = 1}^k {{{({d_j} + \varepsilon )}^{ - 1}}} }}.$

其中，d_i和d_j分别表示第i个和第j个临近参考点与目标点在特征空间的欧氏距离， $\varepsilon $是一个小的随机值，用于避免式（4）中出现分母为0的情况.

2. 两级参考点匹配法

在传统的位置指纹定位方法中，待定位信号需要通过与数据库中的所有样本进行一一匹配完成临近参考点搜索. 位置指纹定位方法定位精度的提升通常依赖于增加定位区域的参考点密度. 然而，增加参考点数量将导致在线阶段参考点匹配运算复杂度的提高和定位效率的降低. 针对传统指纹定位中存在的这一矛盾，本文的改进如下：在离线采样阶段数据库建设完成后，将整个数据库划分为一定数量的子库. 在在线定位过程中，通过搜索临近子库来缩小匹配范围，从而用较小的匹配计算量完成临近参考点的搜索.

数据库划分通常采用坐标空间分区方法，坐标空间分区方法可有效减少参考点匹配运算量，且容易实现^[16]. 如图2所示，分别采用对角线方式和中位线方式对矩形的定位服务区内的参考点（白色圆点）进行坐标空间划分，不同的分区方式对数据库的划分结果不同. 此外，以图2中测试点（红色圆点）的临近参考点搜索为例（实际参考点为虚线圆圈内部参考点），待测点一旦处于不同分区的交界处，临近参考点的选择就会出现错误，导致待测点位置估计误差变大.

图 2

新窗口打开| 下载原图ZIP| 生成PPT

图 2 基于坐标空间的数据库划分方法

Fig.2 Database partition methods based on coordinate space

2.1. 数据库划分和离群点剔除

相对于坐标划分方法，特征聚类方法可以一定程度保证数据集划分结果的重复性，而且特征聚类划分方法与临近参考点的选取规则更趋一致，均为特征空间相似性. 目前聚类分析的主流方法有很多，其中K均值聚类算法以其简单、快速和高效处理大规模数据等诸多优点，成为应用最广泛的聚类方法之一^[19]. 考虑到单个房间内声场特征较为均匀，而且麦克风在类正方形定位区域4个顶点处的布置使得子库中参考点之间特征区别明显，采用特征空间的K-means算法容易获得较好的分类效果，并且具有较高的效率.

采用K均值聚类对位置指纹数据库进行特征空间划分的一般过程为如下. 首先，从数据库D的所有样本中随机选择K个参考点作为初始聚类中心 $[{{{\mu }}_1},{{{\mu }}_2}, \cdots ,{{{\mu }}_K}]$. 而剩余的参考点则根据其与各聚类中心的相似性，被分配到相应的聚类，最终得到 ${{D}}=\{ {{{c}}_1},{{{c}}_2}, \cdots ,{{{c}}_K}\} $. 然后，聚类中心通过 ${{{\mu }}_i}={{\sum {_{{{S}} \in {{{c}}_i}}{{S}}} } / {\left| {{{{c}}_i}} \right|}}$更新为当前聚类中所有参考点的平均值. S表示聚集到 ${{{c}}_i}$的样本. 重复样本分配和聚类中心的更新过程，直至聚类中心停止更新. 基于K均值聚类算法的定位数据库划分过程如下.

输入：数据库 ${{D}}{\rm{=}}{[{{{S}}_1},{{{S}}_2},, \cdots ,{{{S}}_N}]^T}$；　　　　聚类数目K；

过程：

1：从D中随机选取K个样本作为初始聚类中心： $[{{{\mu }}_1},{{{\mu }}_2}, \cdots ,{{{\mu }}_K}]$；

2：while flag>0do

3：初始化聚类中心变化标记：flag=0；

4： ${{{c}}_i}=\emptyset\; (i=1,2, \cdots ,K)$；

5： for j= $1,2, \cdots ,N)$ do

6：计算 ${{{S}}_n}$和各聚类中心 ${{{\mu }}_i}(i=1,2, \cdots ,K)$的距离： ${d_{ij}}={\left\| {{{{S}}_j} - {{{\mu }}_i}} \right\|_2}$；

7：根据距离最近的聚类中心确定 ${{{S}}_j}$的聚类标记： ${\lambda _j}=\arg {\min _{i \in \left\{ {1,2, \cdots ,K} \right\}}}\;{d_{ji}}$；

8：将样本S_j划入相应的聚类： ${{{c}}_{{\lambda _j}}}={{{c}}_{{\lambda _j}}} \cup {{{S}}_j}$；

9： end

10： for i= $1,\;2,\;\cdots $，K do

11：计算新的聚类中心： ${{{\mu '}}_i}=\displaystyle\frac{1}{{\left| {{{{c}}_i}} \right|}}\displaystyle\sum {_{_{_{{S}\in c_i }} {}}} {{S}}$

12： if ${{{\mu '}}_i} \ne {{\mu }}$

13：更新聚类中心 ${{{\mu }}_i}$为 ${{{\mu '}}_i}$；

14： flag=flag+1；

15： else

16：保持当前聚类中心 ${\mu _i}$不变；

17： end

18： end

输出： ${{D}}=\{ {{{c}}_1},{{{c}}_2}, \cdots ,{{{c}}_K}\} $

考虑到数据库中可能存在因噪声和测量误差导致的离群参考点，在聚类结束后，采用基于距离的离群点检测方法对离群点进行剔除^[20]. 其基本过程如下：对于给定的数据集 ${{{c}}_i}$，指定一个距离阈值r来定义合理的邻域；对其中每个对象S，考察其r-邻域内其他对象的个数，如果 ${{{c}}_i}$中大多数对象都远离S，则S被视为离群点.

2.2. 两级临近参考点匹配

如图3所示，两级临近参考点匹配方法步骤：首先，根据目标点特征F与各子库中心 ${{{\mu }}_i}$在特征空间的距离 ${\rm Dis}{_i}$完成临近子库的匹配. 其中，目标点与第i子库 ${{{c}}_i}$的中心 ${{{\mu }}_i}$之间的特征空间欧氏距离可通过下式计算：

图 3

新窗口打开| 下载原图ZIP| 生成PPT

图 3 临近子库搜索过程

Fig.3 Adjacent sub-database searching process

(4) ${\rm Dis}{_i}{\rm{=}}{\left\| {{{F}} - {{{\mu }}_i}} \right\|_2},\begin{array}{*{20}{c}} {} \end{array}i=1,2, \cdots ,K.$

目标点临近子库 ${{{c}}_{\rm a}}$通过以下方式进行选择：

(5) ${{ c}_{\text{a}}} = {{ c}_{\arg \min }}_{i \in {{\left\{ {1,2, \cdots ,K} \right\}}{\text{Dis}}}{_i}}.$

如图4所示，根据目标点特征F与临近聚类 ${{{c}}_{\rm a}}$中的每个样本特征值 ${{F}}_{\rm a}^j$之间的距离 ${\rm dis}{_j}$选择临近参考点. 目标点与临近聚类 ${{{c}}_{\rm a}}$中各参考点之间的特征空间距离由下式给出：

图 4

新窗口打开| 下载原图ZIP| 生成PPT

图 4 子库内临近参考点（RPs）搜索过程

Fig.4 Adjacent reference points（RPs）searching process in sub-database

(6) ${\rm dis}{_j}{\rm{=}}{\left\| {{{F}} - {{F}}_{\rm a}^j} \right\|_2},\begin{array}{*{20}{c}} {} \end{array}j=1,2, \cdots ,{n_{\rm c}}.$

式中： ${{F}}_{\rm a}^j$为 ${{{c}}_{\rm a}}$中第j个参考点的特征向量， ${n_{\rm c}}$为 ${{{c}}_{\rm a}}$中元素的个数. 临近参考点集合 ${{{D}}_{\rm a}}$可通过下式进行选择：

(7) ${{ D}_{\text{a}}} = {{ D}_{\text{a}}} \cup { S}_{\rm arg\,min}{_{_{j \in \left\{ {1,2, \cdots ,n_{\rm c}} \right\}}}}{_{{\rm dis}_{j}}}.$

由于参考点匹配过程的计算量远大于在线定位过程中的其他部分，同时在在线定位过程中除参考点匹配外的其他部分的计算量基本相当，本文仅考察传统全局线性匹配方法和两级匹配方法之间的复杂性差异. 线性匹配的复杂度为O（N），基于两级搜索方法的匹配过程的平均复杂度为O（N/K）. 与全局线性匹配方法相比，两级参考点搜索方法可将参考点匹配过程的复杂度降低到前者的1/K.

3. 实验验证

验证实验在一个普通研究室中进行. 室内噪音约为40～60 dB，没有对定位环境作隔音和消噪等特殊处理. 如图5所示：定位区域是一个长约6 m、宽约5 m的矩形平面；麦克风安装在定位区域的4个顶点，距离房间地面的高度约为135 cm，四通道麦克风阵列由BSWA TECH公司的MPA201全向型麦克风组成；采集卡的型号为NI公司的NI9215A，采样频率设置为100 kHz，采样周期为1 s；声源为型号为sony SRS-X11的蓝牙音响，其形状近似为正方体，发声单元由布置在其3个侧面的同型号扬声器组成. 考虑到该音箱尺寸较小，且在水平方向具有直线对称性，本文算法不考虑其指向性.

图 5

新窗口打开| 下载原图ZIP| 生成PPT

图 5 听觉定位系统和实验场景

Fig.5 Auditory localization system and experimental scene

如图5所示，定位参考点通过栅格地图形成，参考点之间的距离为0.593 m. 位置指纹数据库由72个参考点组成，另外13个测试点用于实验验证.

3.1. 聚类分区数目对定位精度的影响

对指纹数据库分区数目为1~6的两级参考点匹配声源定位方法的定位结果进行比较，其中分区数目为1表示无分区定位，即全局线性匹配定位的情况.

如图6所示：当分区数目N_p=2、3、4时，在定位效率逐步提高的前提下，定位精度相比全局线性匹配略有改善. 这主要是因为本文根据聚类结果，通过离群点检验的方法剔除定位数据库中测量误差较大的离群点，提高了数据库样本的准确性. 但是，当子库划分数量增加到5时，定位效果开始出现明显的恶化；当分区数目N_p=6时，平均误差δ已经超过0.18 m，而最大误差达到了0.278 0 m. 此时，61.5%的测试点定位精度无法满足0.20 m的定位需求. 子库划分数量的增加可有效提高定位效率，但当子库数量达到一定数量时，子库之间的区分不再明显，聚类效果将随子库数量的增加逐步下降，使得测试点的临近参考点被划分到不同子库的概率增加，造成临近参考点匹配错误的情况. 由此可见，子库划分数目不可无限制增加，对数据库进行过多的分区将导致定位效果的恶化.

图 6

新窗口打开| 下载原图ZIP| 生成PPT

图 6 子库数目对定位的影响

Fig.6 Effect of subset number on positioning

3.2. 和坐标分区方法对比

如表1所示，在子库数目为4时，对基于坐标划分和特征聚类划分2种数据库划分方式的定位结果进行对比. 表中N_AM为平均匹配次数，T_AM为平均匹配时间，δ_MA为平均绝对误差，σ²为平均误差方差. 在在线阶段，两者在参考点匹配过程中的平均匹配量和匹配用时基本相当，在线定位效率相比传统线性匹配方式均有大幅度改进. 其中，基于特征聚类划分方式将在线参考点匹配量降低了69.86%，坐标划分方式则为69.03%. 基于特征聚类的定位方法可达到0.0813 m的平均误差，而基于坐标划分的定位方法的平均定位误差为 0.1214 m. 由此可见，基于特征聚类划分的位置指纹定位方法在定位精度上的优势明显，同时该方法相比传统全局线性参考点匹配方法定位精度也略有提升. 相比传统线性匹配方式，坐标划分方式的平均误差方差增加了约42.0%，而特征聚类划分方法则将平均误差方差降低了约43.4%. 采用数据库特征聚类划分方式，系统在定位区域不同位置的定位能力更趋于一致. 需要指出的是：在离线阶段的子区域划分所需的运算量比较中，基于特征聚类的数据库划分方式较坐标划分方式复杂程度更高，但该部分处于对实时性要求不高的离线采样阶段，不对在线定位效率造成直接影响.

表 1 不同数据库划分方式对定位效果的影响对比

Tab.1 Comparison for influence of different database partition methods on positioning effect

数据库划分方式	N_AM	T_AM / s	δ_MA / m	σ²/m²
无分区	72.0	0.027 1	0.094 5	0.006 9
坐标划分	22.3	0.008 4	0.121 4	0.009 8
特征聚类划分	21.7	0.008 1	0.081 3	0.003 9

新窗口打开| 下载CSV

为进一步分析分区方式对不同参考点影响存在差异的原因，对2种数据库划分方法对各参考点的影响进行分析. 如图7所示：对于坐标划分方法，在4、9和10号测试点处出现了误差增加的情况，其他测试点和全局线性匹配定位方式的定位结果基本相当. 部分点定位效果恶化的原因是测试点处于不同子库的交界处，造成其在临近参考点的选择上出现了比较大的错误；特征聚类划分方法在5号测试点处的定位误差增加，其他点和全局分类的方法基本一致. 主要是因为该点位于3个聚类子库的交界处，其对应的临近参考点被划分到了不同的子库，因而造成了比较大的定位误差.

图 7

新窗口打开| 下载原图ZIP| 生成PPT

图 7 子库数目为4时不同划分方式对定位的影响

Fig.7 Effect of different partitioning methods on positioning with sub-database number of four

相较而言，基于特征聚类划分方法的两级定位算法提供了一种更稳定的参考点快速匹配策略. 此外，坐标划分方法受经验的影响较大，选择不同的划分方式将导致不同的定位结果，而采用特征空间聚类划分方法时，在确定子库数目后，数据库的划分结果基本相同.

两级参考点匹配方法可以在保证定位精度的前提下通过减少所需匹配的参考点数量来提高在线定位效率. 与此同时，这种方法对定位效果的提升是有限的，对数据库进行数量过多的划分将不可避免地带来临近参考点的失配从而导致定位精度的降低.

4. 结　语

本文提出了一种基于特征聚类的两级参考点匹配方法来提高位置指纹声源定位方法的效率. 在离线阶段，采用K-means聚类算法将定位数据库划分为一定数量的字库；在在线阶段，通过临近子库的搜索缩小临近参考点的搜索范围，提高了匹配效率. 与传统全局线性参考点匹配方法相比，该方法可以将临近参考点匹配过程的计算量减少69.86%，并进一步将室内声源定位的定位精度提升了13.97%. 但是，特征聚类划分方法对定位效果的提升不是无限度的，子库划分数量过多将导致声音位置指纹定位方法定位精度的恶化. 接下来进一步通过理论和仿真分析及不同环境下的实验针对特征聚类划分方法的有效参数及其设定方法展开研究.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

RASCON C, MEZA I

Localization of sound sources in robotics: a review

[J]. Robotics and Autonomous Systems, 2017, 96 (10): 184- 210

[本文引用: 1]

[2]

SUN Y X, CHEN J J, YUEN C, et al.

Indoor sound source localization with probabilistic neural network

[J]. IEEE Transactions on Industrial Electronics, 2018, 65 (8): 6403- 6413

DOI:10.1109/TIE.2017.2786219

[3]

NIU H Q, GERSTOFT P.

Source localization in underwater waveguides using machine learning

[J]. Journal of the Acoustical Society of America, 2016, 140 (4): 3232- 3232

[本文引用: 1]

[4]

HUANG Q H, ZHANG L, YONG F.

Two-step spherical harmonics ESPRIT-type algorithms and performance analysis

[J]. IEEE/ACM Transactions on Audio Speech and Language Processing, 2018, 26 (9): 1684- 1697

[本文引用: 1]

[5]

KUMAR L, HEGDE R M

Near-field acoustic source localization and beamforming in spherical harmonics domain

[J]. IEEE Transactions on Signal Processing, 2016, 64 (13): 3351- 3361

DOI:10.1109/TSP.2016.2543201 [本文引用: 1]

[6]

ALAMEDA-PINEDA X, HORAUD R

A geometric approach to sound source localization from time-delay estimates

[J]. IEEE/ACM Transactions on Audio Speech and Language Processing, 2014, 22 (6): 1082- 1095

[本文引用: 1]

[7]

方文浩, 邢占元, 文祥计, 等

基于智能手机TDOA估计的被动声源定位方法与系统实现

[J]. 仪器仪表学报, 2016, 37 (4): 952- 960

DOI:10.3969/j.issn.0254-3087.2016.04.030 [本文引用: 1]

FANG Wen-hao, XING Zhan-yuan, WEN Xiang-ji, et al

Passive acoustic source target positioning method based on smart phone platform TDOA estimation and system implementation

[J]. Chinese Journal of Scientific Instrument, 2016, 37 (4): 952- 960

DOI:10.3969/j.issn.0254-3087.2016.04.030 [本文引用: 1]

[8]

李晓飞, 刘宏

机器人听觉声源定位研究综述

[J]. 智能系统学报, 2012, 7 (1): 9- 20

DOI:10.3969/j.issn.1673-4785.201201003 [本文引用: 1]

LI Xiao-fei, LIU Hong

A survey of sound source localization for robot audition

[J]. CAAI Transactions on Intelligent Systems, 2012, 7 (1): 9- 20

DOI:10.3969/j.issn.1673-4785.201201003 [本文引用: 1]

[9]

万群, 郭贤生, 陈章鑫. 室内定位理论、方法和应用[M]. 北京: 电子工业出版社, 2012: 8-14.

[本文引用: 1]

[10]

CHEN Z, LI Z L, WANG S W, et al.

A microphone position calibration method based on combination of acoustic energy decay model and TDOA for distributed microphone array

[J]. Applied Acoustics, 2015, 95: 13- 19

DOI:10.1016/j.apacoust.2015.02.013 [本文引用: 1]

[11]

HE S N, JI B, CHAN S H G.

Chameleon: survey-free updating of a fingerprint database for indoor localization

[J]. IEEE Pervasive Computing, 2016, 15 (4): 66- 75

DOI:10.1109/MPRV.2016.69 [本文引用: 1]

[12]

CHEN L N, LI B H, ZHAO K, et al.

An improved algorithm to generate a Wi-Fi fingerprint database for indoor positioning

[J]. Sensors, 2013, 13 (8): 11085- 11096

DOI:10.3390/s130811085 [本文引用: 1]

[13]

DAWES B, CHIN K W

A comparison of deterministic and probabilistic methods for indoor localization

[J]. Journal of Systems & Software, 2011, 84 (3): 442- 451

[本文引用: 1]

[14]

KHALAJMEHRABADI A, GATSIS N, AKOPIAN D

Structured group sparsity: a novel indoor WLAN localization, outlier detection, and radio map interpolation scheme

[J]. IEEE Transactions on Vehicular Technology, 2017, 66 (7): 6498- 6510

DOI:10.1109/TVT.2016.2631980 [本文引用: 1]

[15]

YOOK D, LEE T, CHO Y

Fast sound source localization using two-level search space clustering

[J]. IEEE Transactions on Cybernetics, 2016, 46 (1): 20- 26

DOI:10.1109/TCYB.2015.2391252 [本文引用: 1]

[16]

ILANGO M R, MOHAN D V

A survey of grid based clustering algorithms

[J]. International Journal of Engineering Science and Technology, 2010, 2 (8): 3441- 3446

[本文引用: 2]

[17]

LIU W, FU X, DENG Z L.

Coordinate-based clustering method for indoor fingerprinting localization in dense cluttered environments

[J]. Sensors, 2016, 16 (12): 1- 26

DOI:10.1109/JSEN.2016.2552300 [本文引用: 1]

[18]

ABUSARA A, HASSAN M S, ISMAIL M H

Reduced-complexity fingerprinting in WLAN-based indoor positioning

[J]. Telecommunication Systems, 2017, 65 (3): 407- 417

DOI:10.1007/s11235-016-0241-8 [本文引用: 1]

[19]

杨慧琳, 黄智刚, 刘久文, 等

基于核模糊C均值指纹库管理的WIFI室内定位方法

[J]. 浙江大学学报: 工学版, 2016, 50 (6): 1126- 1133

[本文引用: 1]

YANG Hui-lin, HUANG Zhi-gang, LIU Jiu-wen, et al

WIFI fingerprinting localization based on kernel fuzzy C-means Ⅱ clustering

[J]. Journal of Zhejiang University: Engineering science, 2016, 50 (6): 1126- 1133

[本文引用: 1]

[20]

LIU H, YANG B, PANG C. Multiple sound source localization based on TDOA clustering and multi-path matching pursuit [C] // ICASSP’17. New Orleans: IEEE, 2017: 3241-3245.

[本文引用: 1]

Localization of sound sources in robotics: a review

2017

... 声源定位是音频信号处理领域的重要研究内容之一，在智能机器人、盲点探测和水下侦查等领域有广泛的应用^[1-3]. 此外，由于基于麦克风阵列的声源定位属于宽带短时平稳信号的空间谱估计问题，其研究成果可被移动通信、声呐侦查和雷达探测等研究领域所借鉴. 传统声源定位方法主要分为3类：基于高分辨率谱估计的方法^[4]、基于可控波束形成的方法^[5]和基于时延（time delay of arrival，TDOA）估计的方法^[6]. 这些方法可将声源与阵列结构的空间几何关系转换为空间谱、空间波束或到达时间差等信息，并通过对这些信息的估计完成声源定位. 传统几何定位方法需预知模型参数，属于参数化定位方法范畴. 其中，时延估计定位法因其计算复杂度低、实时性好且硬件成本低，被广泛应用于声源定位和跟踪中^[7-8]. 然而，在多径信号和环境噪声的影响下，时延估计的精度一般较低，这是室内环境中基于时延估计的参数定位方法性能不佳的主要原因. ...

Indoor sound source localization with probabilistic neural network

2018

Source localization in underwater waveguides using machine learning

2016

Two-step spherical harmonics ESPRIT-type algorithms and performance analysis

2018

Near-field acoustic source localization and beamforming in spherical harmonics domain

2016

A geometric approach to sound source localization from time-delay estimates

2014

基于智能手机TDOA估计的被动声源定位方法与系统实现

2016

基于智能手机TDOA估计的被动声源定位方法与系统实现

2016

机器人听觉声源定位研究综述

2012

机器人听觉声源定位研究综述

2012

... 作为一种非参数定位方法，基于位置指纹的声源定位方法（sound source localization，SSL）可依据环境感知思想，通过建立位置指纹库进行室内定位. 该方法可以有效减少几何模型声源定位方法在室内应用中因模型参数测量误差和环境干扰导致的定位误差. 与基于几何模型的参数化定位方法相比，位置指纹定位方法无须预知传感器空间位置，且对定位环境的复杂性没有特别要求，具有更好的环境适应性^[9-10]. ...

A microphone position calibration method based on combination of acoustic energy decay model and TDOA for distributed microphone array

2015

Chameleon: survey-free updating of a fingerprint database for indoor localization

2016

... 研究表明，位置指纹定位方法的定位精度受参考点（reference points，RPs）密度^[11-12]影响较大. 因此，通常需要在离线采样阶段构建大规模的定位数据库来满足定位精度需求. 与此同时，在在线定位阶段，定位算法需要占用大量计算资源完成定位，使得位置指纹声源定位方法的定位效率降低，很难应用于移动机器人听觉定位、室内异常声源定位和发声者定位等对实时性要求较高的场景^[13]. 为提高位置指纹定位方法的定位效率，Khalajmehrabadi等^[14]采用了基于插值的稀疏数据库恢复方法来减少初始参考点数量，从而提高离线采样效率. 但是，由于插值生成的虚拟参考点仍需参与临近参考点匹配，该方法并未明显改善在线定位效率较低的情况. ...

An improved algorithm to generate a Wi-Fi fingerprint database for indoor positioning

2013

A comparison of deterministic and probabilistic methods for indoor localization

2011

Structured group sparsity: a novel indoor WLAN localization, outlier detection, and radio map interpolation scheme

2017

Fast sound source localization using two-level search space clustering

2016

... 有选择的进行目标点（target point，TP）和参考点的匹配可以减少在线匹配的计算量，因此可通过将搜索范围收缩到目标点周围参考点来减少非临近参考点的匹配量，提高匹配效率. 很多研究者考虑将数据库分块，然后选择最可能包含临近参考点的子库进行搜索来降低运算量^[15]. 文献[16]介绍了多种基于坐标栅格划分的数据库分块方法，这些方法可有效提升位置指纹定位的效率和稳定性. Liu等^[17]在坐标栅格划分方法的基础上提出了一种基于最小包围圈的方法来实现栅格大小的灵活定义. 但是，坐标划分方法受主观判断影响较大，存在数据库分区方式不统一和分区导致参考点失配后定位误差增大的问题. 聚类分析是一种以样本特征相似性为基础，对数据集进行自动划分的无监督学习算法. 聚类分析方法可将特征相似的参考点自动地划分到同一个子库. 相比坐标划分方法，特征聚类划分方法与临近参考点的选取规则更趋一致^[18]. ...

A survey of grid based clustering algorithms

2010

... 数据库划分通常采用坐标空间分区方法，坐标空间分区方法可有效减少参考点匹配运算量，且容易实现^[16]. 如图2所示，分别采用对角线方式和中位线方式对矩形的定位服务区内的参考点（白色圆点）进行坐标空间划分，不同的分区方式对数据库的划分结果不同. 此外，以图2中测试点（红色圆点）的临近参考点搜索为例（实际参考点为虚线圆圈内部参考点），待测点一旦处于不同分区的交界处，临近参考点的选择就会出现错误，导致待测点位置估计误差变大. ...

Coordinate-based clustering method for indoor fingerprinting localization in dense cluttered environments

2016

Reduced-complexity fingerprinting in WLAN-based indoor positioning

2017

基于核模糊C均值指纹库管理的WIFI室内定位方法

2016

... 相对于坐标划分方法，特征聚类方法可以一定程度保证数据集划分结果的重复性，而且特征聚类划分方法与临近参考点的选取规则更趋一致，均为特征空间相似性. 目前聚类分析的主流方法有很多，其中K均值聚类算法以其简单、快速和高效处理大规模数据等诸多优点，成为应用最广泛的聚类方法之一^[19]. 考虑到单个房间内声场特征较为均匀，而且麦克风在类正方形定位区域4个顶点处的布置使得子库中参考点之间特征区别明显，采用特征空间的K-means算法容易获得较好的分类效果，并且具有较高的效率. ...

基于核模糊C均值指纹库管理的WIFI室内定位方法

2016

... 考虑到数据库中可能存在因噪声和测量误差导致的离群参考点，在聚类结束后，采用基于距离的离群点检测方法对离群点进行剔除^[20]. 其基本过程如下：对于给定的数据集

${{{c}}_i}$

，指定一个距离阈值r来定义合理的邻域；对其中每个对象S，考察其r-邻域内其他对象的个数，如果

${{{c}}_i}$

中大多数对象都远离S，则S被视为离群点. ...

〈

〉