mems惯性传感器论文（65周年陈锐志）

mems惯性传感器论文（65周年陈锐志）(1)

本文内容来源于《测绘学报》2022年第7期（审图号GS京（2022）0495号）

基于数据与模型双驱动的音频/惯性传感器耦合定位方法

陈锐志¹

mems惯性传感器论文（65周年陈锐志）(2)

,钱隆¹,牛晓光²

mems惯性传感器论文（65周年陈锐志）(3)

,徐诗豪¹,陈亮¹, 裘超²

1. 武汉大学测绘遥感信息工程国家重点实验室, 湖北武汉 430079;2. 武汉大学计算机学院, 湖北武汉 430072

基金项目：国家重点研发计划(2016YFB0502201);国家自然科学基金(61872431)

摘要：北斗卫星导航系统已于2020年实现全球覆盖。在开阔的室外环境, 北斗可提供厘米级的定位服务, 正向着更泛在、更融合、更智能的综合时空体系迈进。目前高精度室内定位技术处于百花齐放、百家争鸣的状态, 尽管苹果支持的超宽带技术在市场中拥有优势, 但是5G、音频和蓝牙测角等可支持所有大众手机的技术在市场中也具备竞争力。室内定位目前主要面临部署成本高、定位精度低、信号覆盖范围小和系统泛化能力差等难题。多源融合定位技术是解决这些难题的重要途径之一, 特别地, 融合低成本惯导定位源和高精度射频/音频定位源是目前具备实用价值的融合定位组合。行人航迹推算(pedestrian dead reckoning, PDR)定位源具有抑制积分误差累积的优势, 但是由于用户手机握持姿态的复杂性和手机惯性传感器硬件的差异性, 其在相对定位精度、手机泛化能力和多握持姿态支撑等方面也存在劣势, 此外, 受步频的影响, PDR定位源的位置更新率低于2 Hz。为了实现低成本、高精度和广覆盖的室内定位解决方案, 本文提出了一种数据与模型双驱动的多源融合定位新范式, 其中数据驱动的PDR部分通过构建神经网络模型, 训练加速度传感器和陀螺仪测量值特征, 学习速度变化矢量, 推算高精度行人航迹, 模型驱动部分为将数据驱动输出的相对航迹与高精度定位源输出的观测量通过扩展卡尔曼滤波, 实现融合定位输出。试验结果表明, 基于数据驱动的PDR方法可提供20 Hz的位置更新率, 与高精度音频定位源融合, 可实现0.23 m的动态定位精度。

关键词：室内定位智能手机音频信号行人航迹推算多源融合

mems惯性传感器论文（65周年陈锐志）(4)

mems惯性传感器论文（65周年陈锐志）(5)

引文格式：陈锐志, 钱隆, 牛晓光, 等. 基于数据与模型双驱动的音频/惯性传感器耦合定位方法[J]. 测绘学报，2022，51(7)：1160-1171. DOI: 10.11947/j.AGCS.2022.20220169

mems惯性传感器论文（65周年陈锐志）(6)

CHEN Ruizhi, QIAN Long, NIU Xiaoguang, et al. Fusing acoustic ranges and inertial sensors using a data and model dual-driven approach[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(7): 1160-1171. DOI: 10.11947/j.AGCS.2022.20220169

阅读全文：m

引言

人们有86.9%的时间是在室内度过^[1^]，80%的信息都与室内位置关联^[2^]。随着城市化的不断加速，室内空间的面积总和飞速增加，高精度室内定位技术对人们未来的生活起着至关重要的作用，是推动未来人工智能应用的核心支撑之一。高精度室内外无缝定位技术是支撑新型基础设施建设和国家战略需求的重要核心技术。我国北斗卫星导航系统已于2020年7月31日实现全球覆盖，正向着更泛在、更融合、更智能的综合时空体系迈进。综合时空体系更泛在的目标是融合其他非卫星定位技术，把北斗定位能力从室外拓展到室内，实现高精度的室内外无缝定位。在开阔的室外环境，北斗已实现厘米级的高精度定位。因此，实现高精度的室内定位技术已成为实现高精度室内外无缝定位的主要挑战。基于位置的服务(location based service，LBS)的大量需求与应用已经从室外转向了室内。因此, 高精度室内定位技术具有重要的社会价值和广阔的应用前景。

在市场需求和谷歌、苹果和百度等国内外互联网巨头的推动下，室内高精度定位技术在“十三五”期间得到迅猛发展。这些技术中最具代表性的是谷歌推出的Wi-Fi RTT测距技术和苹果推动的UWB定位技术^[3^]。此外，还有音频定位技术、5G定位技术、蓝牙测角技术和视觉定位技术等。

Wi-Fi RTT定位技术是由IEEE802.11协议工作组Task Group mc提出的基于测量终端到周围基站距离的Wi-Fi通信协议的定位技术。该技术通过Wi-Fi终端与基站交互，利用定位信号的往返传播，消除终端和基站的钟差，实现高精度测距和1~2 m精度定位^[4^-6^]。利用该技术定位时需要标定和改正由系统硬件造成的终端-基站的系统测距偏差，目前市场上只有谷歌系列手机支持该功能。该技术与智能手机的内置惯性传感器融合，可以实现优于1 m的定位精度。

UWB定位技术是苹果手机支持的一种距离感知和定位技术^[7^]。小米^[8^]和三星^[9^]也在其手机上推广这一技术。目前该技术在智能手机上只支持距离和方向感知，还没有实现完善的定位系统。在理想室内环境下，UWB具备10 cm测距精度和40 cm定位精度的能力^[10^]。其定位模式包括双向测距(two way ranging，TWR)和到达时间差(time difference of arrival，TDoA)两种。TWR定位模式与Wi-Fi RTT定位模式相似，其优点是不需要时间同步，缺点是用户数量受限制。TDoA定位模式可以克服用户数量受限的缺点，但其代价是基站间需要高精度时间同步(亚纳秒级)。TDoA的定位模式可细分为下行TDoA和上行TDoA。下行TDoA采用广播模式，由终端定位，上行TDoA由终端发射信号，服务器端定位，其优点是用户终端功耗比下行TDoA模式更低，适用于标签等位置跟踪设备。UWB是目前成熟度最高的高精度定位技术。

音频定位技术是一种通过测量声波传播时间来计算信号发射端和接收端之间距离的定位技术，其工作模式与全球卫星导航系统(GNSS)定位相同，都是广播模式，具有成本低、精度高、兼容性好等特点，为基于消费级智能手机的室内定位提供了新的可能。音频定位技术可利用智能手机的内置麦克风，在无须改变现有手机的硬件的前提下，实现高精度定位。该技术具有精确测距、精准定位和广域覆盖的优点，具备12 cm的测距精度、50 cm的定位精度和50 m的信号覆盖等能力^[11^-14^]。

5G技术引入的大规模天线阵列、超密集组网等创新技术引发了大量基于5G信号的定位研究，主要包括基于上行信号的测距测角定位、基于接收信号强度的指纹定位和基于5G专用定位信号定位等研究方向。现有的5G定位研究以基于毫米波频段为主，缺乏基于已广泛商用部署的sub-6 GHz频段的相关研究。此外，目前能够取得米级到亚米级定位精度的5G定位研究大多限于仿真或者室外条件，实验室环境下5G技术可支撑亚米级的测距精度和1~2 m的定位精度^[15^]。而对于实际室内场景下的5G定位研究仍然非常有限，基于实际商用5G信号可大规模应用的5G室内定位方法依旧缺乏。

蓝牙测角技术是通过天线阵列测量信号到达或发射方向的定位技术。蓝牙5.1协议引入了高精度测角功能，使得该技术成为一项可支持大众手机和低功耗的定位技术，可广泛用于手机导航、资产跟踪和智慧医疗等领域。蓝牙测角技术可以用于2D或3D定位，其定位精度取决天线阵列的安装高度，从分米级到米级。当天线阵列安装高度低时，其定位精度高，但信号覆盖范围小。因此，蓝牙测角技术不适合地下停车场等矮层高环境。克服多路径干扰以及传统算法存在的计算复杂度较高等问题是其面临的挑战。

视觉定位在自动驾驶和室内机器人等算力强大的平台上已经得到广泛推广。同时定位与地图构建(simultaneous localization and mapping，SLAM)技术是高精度视觉定位的主流技术，但由于对定位平台的算力要求很高，在智能手机和可穿戴设备等移动平台上还难以实现。基于单张照片的智能手机视觉定位技术也能够实现0.3 m的定位精度。视觉定位技术对定位环境的光照条件要求高，在夜间或光照不足的环境下难以应用。此外，视觉定位技术对定位终端的算力要求高，巨大的计算量很难保证低功耗。

高精度室内定位市场目前处于百花齐放、百家争鸣的状态。尽管在苹果支持下，UWB技术在这场激烈的竞争中拥有一定的优势，但5G、音频和蓝牙测角等可支持所有大众手机的技术会让这场竞争更加精彩。室内定位技术目前主要面临定位精度低、成本高、信号覆盖范围小、定位系统泛化能力差等难题。多源融合定位是这些问题的主要解决方案之一，特别是融合低成本惯性传感器与上述高精度定位技术，形成低成本、高精度和广覆盖的解决方案。惯性传感器是多源融合技术的核心定位源，对智能手机而言，这是一种无处不在、无时不有、成本最低、功耗最低和数据输出频率最高的定位源。其优势在多源融合方案里不言而喻。但由于受漂移误差影响，常规惯导积分会带来累积误差的飙升，因此，基于步子探测(step detection)的PDR方法在行人导航定位中广泛采纳。PDR利用分析行人走路的动态信号特征计算步数，再利用步行方向递推行人的位置，这样抑制积分误差累积^[16^]。但是，由于用户手机握持姿态的复杂性和手机惯性传感器硬件的差异性，常规PDR在定位精度、手机泛化能力和多握持姿态支撑等方面有很多不足。

本文提出的基于数据驱动的PDR方法是一种基于深度学习的室内定位新方法，该方法能够从大型数据集中提取高级特征表示(速度矢量)并且不依赖于几何积分理论^[17^-19^]。通过采集大量行人行走的惯性传感器数据与真实轨迹并制作成神经网络的输入特征与标签，训练出一个拟合行人行走步态特征的网络模型。该模型以惯性传感器数据作为输入，回归出行人的速度增量，再通过积分推导出行人的运动轨迹。相比于传统惯性导航算法和传统PDR算法，基于数据驱动的PDR解决了双积分问题，抑制了低廉惯性传感器导致的误差飞速累积的问题，同时释放了行走时的各种约束。此外，通过将误差参数添加至神经网络框架并进行训练，可以预测运动变换及其方差，从而推断预测结果的不确定性，进而为后续的融合算法提供了不同预测段的置信度指标。最后，通过结合不确定性和地磁稳定性检测算法，对神经网络PDR进行航向校正，得到更为精准的定位轨迹。

基于数据驱动的PDR与高精度定位技术通过扩展卡尔曼滤波融合，实现一种数据与模型双驱动的多源融合新范式。

1 基于数-模结合的多源融合定位架构

如图 1所示，基于数-模结合的多源融合定位架构涵盖数字部分与模型部分。该架构用于用户终端定位。数字部分的核心内容是一个基于深度学习的PDR神经网络，而模型部分的主要内容是一个耦合PDR神经网络和高精度音频测距的拓展卡尔曼滤波器。

mems惯性传感器论文（65周年陈锐志）(7)

图 1 数模驱动多源融合定位架构Fig. 1 The architecture of data and model dual-driven positioning by fusing multiple measurements

图选项

(1) 数据驱动部分。借助智能手机或标签内置的加速度计与陀螺仪的数据估计终端移动速度v=[vxvyvz]^T。这部分将由一种基于深度学习的数据驱动方法实现。

(2) 模型驱动部分。将速度矢量与基于声波的精确测距结果相结合，利用扩展卡尔曼滤波估计用户的位置、航向与速度。

由于惯性传感器具有功耗低和数据更新频率高的特点，在定位智能手机和可穿戴设备方面应用广泛。然而，低成本惯性传感器(加速度计、陀螺仪和磁力计等)的测量结果容易受到漂移误差的影响，如当加速度直接被二次积分以计算位移时，误差几乎呈几何级数增长。以惯性传感器的测量值作为输入，笔者采用了基于深度学习的方法估计行人的运动轨迹^[20^-22^]。这是一种数据驱动的PDR方法，它与使用步子探测的模型驱动方法全然不同^[16^]。

2 基于数据驱动的行人航迹推算模型构建

PDR依靠惯性传感器对行人的位置轨迹进行推算跟踪。传统PDR主要使用步长模型公式估算步长、陀螺仪和磁力计估算方向，然后推算每一步的位置。由于步长模型需要根据行人特征进行参数调整，而且方向估算需要限制手机的拿持姿态，这导致传统PDR无法在通用场景下使用。如图 2所示，数据驱动PDR基于数学推断将概率神经网络覆写为不确定性神经网络^[23^]，使用经过预处理的海量惯性传感器数据与真实轨迹，训练出一个适应不同姿态、不同行人的神经网络模型。该模型由惯性传感器数据驱动，输出相对位置和不确定性。由于PDR存在航向上的累积误差，通过使用磁场稳定性检测算法，结合神经网络输出的不确定性，在适当的时候进行自动校正。

mems惯性传感器论文（65周年陈锐志）(8)

图 2 数据驱动PDR结构Fig. 2 The structure of data-driven PDR model

图选项

2.1 基于四元数的归一化预处理

在将惯性传感器数据输入神经网络之前，需要对数据进行预处理以降低数据的复杂度，以便网络更好拟合行人行走模型。通过9轴传感器数据，使用文献[24]提出的基于梯度下降的算法解算出姿态四元数后，利用姿态四元数将加速度和角速度从传感器坐标系转换到导航坐标系下。传感器坐标系下的向量a_IMU可以通过式(1)转换为导航坐标系下的a_INS

mems惯性传感器论文（65周年陈锐志）(9)

(1)

式中，q^－表示四元数的共轭。

由于每条运动轨迹的初始坐标系都不相同，而大部分实际定位应用场景需要的是绝对的全球坐标。因此，需要找到每个序列导航坐标系和全球坐标系的旋转关系。通过四元数和姿态角，可以计算出导航坐标系到全球坐标系的旋转关系。

四元数仅能用于对向量进行旋转，而不能计算自身旋转的角度，因此需要将其转换为欧拉角。手机姿态角的定义的顺序是〈z,x,y〉，即航向角、俯仰角和横滚角。因此按这个顺序把四元数转变成欧拉角。导航坐标系和全球坐标系的Z轴是一致的，只存在水平面上Y轴的差别。因此取欧拉角与姿态角的航向角差值，将运动轨迹从导航坐标系转换到全球坐标系。

2.2 基于深度神经网络的行人航迹推算

传统PDR算法基于陀螺仪和加速度计数据进行二次积分得到位移量，存在较为严重的误差累积问题，本文采用轻量级深度神经网络解决传统惯性导航的误差无限累积问题，利用ResNet18残差神经网络框架学习惯性传感器数据惯性跟踪^[20^-22^]。

传统惯性导航系统的物理模型基于牛顿机制，低成本的惯性传感器有较高的噪声，而且航迹推导具有极强的连续性，因而在航迹推算过程中误差会飞速累积。建立在估计步长和步长方向上的模型(如PDR)包含隐式运动模型，会因对象的步行习惯或使用环境的改变而失效(例如坐下)。总之，基于零速更新(zero velocity update，ZUPT)的惯性导航和基于步阶的PDR类导航都会受到运动动力学和传感器连接假设的限制，而深度学习方法能够根据行人步行的周期性质提取高级特征表示(速度矢量)并且不依赖于几何理论。同时，基于ResNet18架构的深度学习框架在一定程度上降低了计算复杂度，为部署至智能终端提供可能性。

本文采用滑动窗口的方法，提高神经网络预测的输出率，通过使用固定大小的滑动窗口，惯性传感器数据将被分为独立的序列。序列的窗口大小n为200帧(1 s)，滑动窗口步长为10帧。速度矢量由每个序列的深度神经网络预测，并通过合并链接模块生成位置，当前位置更新为之前的200帧。利用重叠窗口进行预测更新，输出频率将提升至20 Hz，再通过低通滤波器进一步处理速度矢量得出的位置，以平滑重建预测的轨迹。

本文采用公开标准数据集及自采数据集作为训练集和测试集，在训练阶段随机旋转每个窗口的特征与标签，增强数据的航向无关性。训练目标为最小化数据集提供的估计值和真实值之间的均方误差，通过ADAM优化器训练得到最佳参数，学习率可定为1e^-5，批次大小定为256。在GPU上训练完毕之后，能够直接在本地终端和移动设备上应用模型推算行人航迹。

2.3 基于EP框架的不确定性网络

深度神经网络导航一般通过预估值与真实值的均方误差进行评估，然而在实际部署时无法获得真值轨迹，导致无法评估网络预测的准确度(即使该次预测偏差很大)。因此本文研究了深度学习惯性导航的不确定性，该不确定性表示深度神经网络模型输出的置信度，不确定性估计可以量化信任模型预测的程度。通过将误差参数添加至神经网络框架并进行训练，可以预测运动变换及其方差，从而推断预测结果的不确定性，进而为后续的融合算法提供不同预测段的置信度指标。将残差网络航迹推算框架拓展至贝叶斯模型，并基于数学推断将概率网络覆写为不确定性网络，从而以无监督的方式快速估计惯性导航的不确定性。

网络预测的总不确定性被定义为σ_total=varp(y|x)(y)，并根据不确定性来源被分为数据不确定性σ_data和模型不确定性σ_model，数据不确定性表示网络对于输入数据的抗噪性能，模型不确定度表示网络对于预测的置信程度。

不确定估计方案基于贝叶斯置信网络，借助期望传播(expectation propagation，EP)框架，利用假设密度滤波(assumed density filtering，ADF)方法经由数学推理对ResNet18通用的网络层进行了覆写，不确定性网络层定义如下。

定义1：对于任一网络层z(i)=f(i)(z(i－1);θ(i))，其不确定性传播层基于式(2)近似

mems惯性传感器论文（65周年陈锐志）(10)

(2)

不确定性网络使初始化为1e^-3量级的噪声方差能够在网络中向前传播，概率化深度模型的网络层，最终网络将得到均值及方差。对于单次传播，均值μ代表网络预测值，方差v代表初始噪声前向传播的最终输出，即为数据不确定性。

对于模型不确定性，网络通过蒙特卡洛采样输出期望及方差，固定激活层ReLU后的dropout层为training模式，参数将进行随机丢弃。初始化噪声方差，与测试数据一起进行传播，得到若干组采样预测值μ及对应方差υ。通过定义2评估网络对于输出的置信度(即模型不确定性)。

定义2：网络经过若干次如定义1的传播和蒙特卡洛采样，可得若干组预测值及方差，记为μ_i、υ_i，模型不确定度计算见式(3)，其中var代表方差计算。

mems惯性传感器论文（65周年陈锐志）(11)

(3)

经由蒙特卡洛采样，数据不确定性可表示为若干次采样预测值的均值，进而网络的总不确定度σ_total计算如下，其中mean表示均值计算

mems惯性传感器论文（65周年陈锐志）(12)

(4)

mems惯性传感器论文（65周年陈锐志）(13)

(5)

直观地，数据不确定性即为噪声在网络中的传播结果，且在网络层中与输入数据互相影响。模型不确定度在丢弃参数的情况下可视为对网络预测稳定性的测试。网络总不确定性的计算流程如图 3所示，采用不确定性网络框架，避免了贝叶斯网络的计算繁杂性，并可在不影响网络结构及输出且无监督的情况下给定网络预测的置信度指标，从而为后续融合算法提供参考。

mems惯性传感器论文（65周年陈锐志）(14)

图 3 不确定性估计的计算流程Fig. 3 The flowchart of uncertainty estimation

图选项

2.4 基于地磁的轨迹校正

由于神经网络预测的轨迹存在航向上的累积误差，并且该误差无法通过模型消除，因此需要结合地磁信息校正轨迹。磁场信息中的航向角在直行时与身体方向有一定相关性。航向角与时间无关，不受累计漂移的影响，它是一个绝对量，可以用来校正PDR轨迹。为了获取稳定的航向角信息，需要设计一个磁场稳定性检测算法筛选出稳定可用的航向角。而神经网络输出的不确定性则用于筛选出可用的行人身体方向。

当环境中的磁场处于稳定时，即只存在一个稳定的磁场合向量，磁力计的三维磁向量应该随着惯性传感器的姿态变化而变化。当惯性传感器姿态变化和磁向量变化不匹配时，说明有强磁体影响，磁场环境不稳定。为了计算惯性传感器与磁向量之间的姿态差值，首先使用陀螺仪计算惯性传感器的姿态变化，并把它表示成四元数形式q_i；然后利用该四元数将磁向量m_i转化为mi 1q；最后计算mi 1和mi 1q的向量差的模，作为匹配度su。匹配度越大，说明惯性传感器与磁向量的姿态差大，磁场不稳定。

同时，磁场强度也可以反映磁环境的稳定性。将磁场强度的滑动标准差std作为确定磁场稳定性的条件之一。滑动窗口的大小设置为200帧(1 s)。将磁场的稳定性定义为式(6)

mems惯性传感器论文（65周年陈锐志）(15)

(6)

当平均滑动标准差和平均匹配度小于某个阈值时，磁场完全稳定，则sti设置为1。sti的范围为0~1，表示从不稳定到稳定。

通过直行序列，可以得到行人的身体方向与全球坐标系的水平旋转关系。而航向角又表示惯性传感器坐标系与全球坐标系的水平旋转关系。由于行走时人体处于一个周期运动状态，因此直行航向角几乎都围绕一个值波动。直接取直行航向角的平均值，发现它能很好地反映直行时的惯性传感器水平朝向。用各直行序列平均航向角和平均神经网络PDR方向的差值代表磁场信息与身体方向的关联量c_i。

选取稳定的磁场环境和低不确定性的直行序列上的关联量作为锚点c_a。如果不改变拿持手机的姿势，每个直行序列关联量应该只会在小范围内波动。当波动大于一定阈值时，可以认定手机与人之间的相对水平姿态关系发生了较大改变，此时需要更新c_a。之后利用c_a计算直行序列的校正角φ_i

mems惯性传感器论文（65周年陈锐志）(16)

(7)

式中，sti为磁场的平均稳定性。最后通过将神经网络PDR预测出的轨迹旋转该校正角φ_i，即可实现对轨迹的自适应校正。

3 基于EKF的数模融合定位模型构建

与存在诸多限制的单数据源定位方法相比，将不同维度和属性的数据紧耦互补通常能实现更佳的定位精度和稳定度。基于数据驱动的PDR算法已在短时间内给出了细粒度的相对动态信息，因而仅需辅以全局观测信息，便可借助数学表达式构建模型，提供绝对坐标系下的位置服务。由于音频TDoA是一种高精度、高隐私、高安全的定位技术，且其具有兼容大众智能手机与支持无限并发用户数量等特点^[11^]，因此本文以PDR和TDoA数据为例，给出了一类泛用的基于EKF框架的融合定位模型。

3.1 系统模型与观测模型

将数据驱动PDR采用的坐标系称为本地坐标系L系(x^L, y^L, α^L)，并选取东北天坐标系作为绝对坐标系G系(e^G, n^G, α^G)，其中α表示航向，则系统待估状态向量可描述为

mems惯性传感器论文（65周年陈锐志）(17)

(8)

式中，(e_k, n_k)为k时刻下目标在G系下的东/北坐标；θ_k为L系相对于G系呈右手系的航向夹角，包含定位服务启动瞬间两坐标系的初始偏角及传感器的累计误差偏角。通常，室内行人的手机握持平均高度为1.2 m，且高程变化相对于平面坐标变化对结果产生的影响更弱，因而系统状态仅考虑了二维平面坐标。在PDR数据的驱动下，系统的状态转移为

mems惯性传感器论文（65周年陈锐志）(18)

(9)

式中，Wk为均值为0、方差为Q_k的过程噪声；Δx_k与Δy_k分别为PDR于k－1历元至k历元间在本地坐标系下的横纵方向输出位移增量。

参照文献[12]，本文的音频TDoA估计采用了时分多址与频分多址策略，形成了音频Chirp信号网络。每经过约1 s的时间间隔，终端可解算出包含至少2个TDoA在内的观测数据，通过几何关系，观测方程可写为

mems惯性传感器论文（65周年陈锐志）(19)

(10)

式中，V_k为均值为0、方差为R_k的观测噪声；m为本历元估计的TDoA个数；

mems惯性传感器论文（65周年陈锐志）(20)

Si分别对应第i个音频基站的预测观测与G系坐标；c表示T温度下的声音传播速度。之后，将f(*)和h(*)分别围绕

mems惯性传感器论文（65周年陈锐志）(21)

Fk=∂f/∂X_k和观测矩阵Hk=∂h/∂X_k，则本轮迭代的位置可估计为

mems惯性传感器论文（65周年陈锐志）(22)

(11)

式中，K_k为Kalman增益；P_k为误差协方差；Z_k为当前历元的真实观测。

由于音频TDoA观测数据更新率仅为1 Hz，而PDR驱动的数据更新率可达20 Hz，因此只在TDoA更新的历元执行量测更新，其余历元只需执行状态更新。

3.2 模型初始化

模型初始化对于滤波而言至关重要，它影响到算法能否快速收敛及后续定位的准确性。本文将观测信息与简易粒子滤波器相结合计算终端的平面坐标初值。观测信息中蕴含的坐标数据通常给出了终端可能所处的区域范围，在该范围内均匀分布一定数量的粒子，通过重采样操作，能够以较少的迭代次数估计较高精度的初值。给定粒子属性[e^Gn^G]^T，则粒子集被初始化为

mems惯性传感器论文（65周年陈锐志）(23)

(12)

式中，e_min、e_max、n_min,n_max为初始观测信息划定的区域边界；l=1, 2, …,N，N为粒子数目。音频TDoA估计误差整体服从正态分布^[11^]，因此根据预测残差ε，每个粒子的权重可写为

mems惯性传感器论文（65周年陈锐志）(24)

(13)

式中，Z₀和

mems惯性传感器论文（65周年陈锐志）(25)

^[25^]得到新的粒子集后，便可对其进行平均处理得到初值估计

mems惯性传感器论文（65周年陈锐志）(26)

(14)

3.3 模型参数动态调整

系统状态中的航向夹角范围为(－2π, 2π]。根据工程经验，在给定系统初始误差协方差矩阵P₀=I_3×3及观测信息(TDoA或飞行时间(time of flight，ToF))质量在两倍中误差优于1 m的前提下，要想使航向夹角迅速收敛，可在滤波前期适当提升观测信息的基本权重并放大过程噪声，如Rk⁰=1,Qk=diag(0.5, 0.5, 5)。当预测残差基本波动在较小数值的附近时，可认为系统趋于稳定。此时适当降低观测基本权重并缩小过程噪声，如Rk⁰=2,Qk=diag(0.05, 0.05, 0.1)，有助于增强模型稳健性以抵抗部分观测粗差。另外，动态改变观测权重的策略也将进一步地优化模型。本文采用伪Huber函数调整每一个观测数据对应的观测噪声，公式为

mems惯性传感器论文（65周年陈锐志）(27)

(15)

式中，

mems惯性传感器论文（65周年陈锐志）(28)

i个对角线元素；

mems惯性传感器论文（65周年陈锐志）(29)

i个TDoA的预测残差；k₀为方差膨胀阈值，通常与观测数据在稳态下的一倍中误差相关。最后，数据驱动PDR模型的不确定性因子也可在探测到地磁突变等因素引起的姿态异常更新时，及时给出调整状态与观测权重的指导。

4 试验数据与分析

4.1 试验描述

本节首先描述数据驱动的PDR数据集构建和其定位性能试验，然后在两个测试场景下分别设计了两组试验评价融合定位方法。其中一个小范围场景如图 4(a)所示，该测试场景是武汉群光中心写字楼里的一间办公室，试验区域约为147 m²，部署4个音频基站；而另外一个大范围场景是德清国际展览中心1号展厅，试验区域约为4688 m²，部署32个音频基站。基站间通过433 MHz无线模块进行同步。试验用手机型号为华为Nova 7(HarmonyOS 2)和小米Mi 10 Ultra(Android 10)，手机搭载的运动传感器(加速度计、陀螺仪)采样率为200 Hz，音频信号的采样率为48 kHz。在小范围场景试验中，静态试验的参考真值由SNDWAY SW-80G激光测距仪测量提供；而在大范围场景试验中，轨迹标志点的参考真值由Leica Nova TS60全站仪测量提供。在这两个测试场景下，动态试验均为试验人员握持试验手机沿设定的轨迹移动，本文方法的性能通过比较融合定位输出的位置与真实轨迹的吻合程度来衡量。此外，本文将室内定位市场上常用的UWB技术引入小范围测试场景，用于对比在没有数据驱动的背景下，即仅使用纯观测条件下，两种技术采用相同轨迹的定位效果。

mems惯性传感器论文（65周年陈锐志）(30)

图 4 试验场景和结果Fig. 4 Experimental sites and results

图选项

4.2 数据驱动PDR数据集构建与性能测评

数据集是数据驱动行人航迹推算的根本基石，本文通过高精度光学运动跟踪系统和激光雷达SLAM系统采集运动序列的真实速度与方向，利用智能手机采集IMU数据，对两者进行时间同步后用于训练行人航迹推算模型。为了反映日常使用中的各种情况，本文征集10名志愿者采集了包括平端、置于口袋(口袋较为紧，手机紧贴大腿)、置于手提包及置于手推车等不同手机姿态的IMU数据，并包括停止、缓走、正常行走及快走等运动状态。数据集总行程达144 km，总时间为41 h。在训练阶段，混合部分公开数据集一同训练。

为了验证数据驱动PDR的定位性能，本文采集了室内典型运动场景下的数据，然后用数据驱动PDR生成相应的运动轨迹。图 5包含3种典型轨迹，分别为手机放裤兜中多转弯行走、大范围平端行走及直线180°转弯的平端来回行走。同时与现有的两种基于数据驱动的模型进行比较。如图 5所示，IONet和RONIN存在航向漂移的问题，航向误差会导致定位误差越来越大。而本文提出的数据驱动PDR通过对不同姿态分别训练，并利用地磁信息对轨迹进行相对航向校正，在不同手机姿态下都能保持较高的定位精度。

mems惯性传感器论文（65周年陈锐志）(31)

图 5 数据驱动PDR轨迹Fig. 5 Trajectory of data-driven PDR

图选项

4.3 定位初始化试验

本试验评价了数模融合定位模型的初始化性能，在大范围测试场景中分别选取向东、向南和向西这3个方向的直线轨迹，给定默认初始化航向角为90°，试验当本地坐标系与绝对坐标系之间的初始偏角分别为0°、90°和180°时(两坐标系初始偏角范围对称，偏角-90°与90°情况类似)，本文模型的收敛性能。如图 6(a)所示，蓝色圆圈实线为PDR模型更新时刻的轨迹结果，红色加号实线为TDoA观测更新时刻的轨迹结果，当初始偏角为0°时，此时初始化航向角即为绝对坐标系下的真实航向角，在开始移动后的一个观测历元内收敛。如图 6(b)所示，当初始偏角为90°时，在开始移动后的4个观测历元内收敛。如图 6(c)所示，当初始偏角为180°时，此时初始化航向角与真实航向角偏差最大，在开始移动后的6个观测历元内收敛。通过这组试验，本文模型均能在步行约5 m(6 s)内，实现航向估计状态量的收敛。

mems惯性传感器论文（65周年陈锐志）(32)

图 6 定位模型初始化试验轨迹结果Fig. 6 Trajectory of positioning model initialization experiments

图选项

4.4 定位试验

4.4.1 静态定位试验

本节在小范围试验场景下对融合定位方法的静态精度进行评估，如图 4(c)所示，在该试验区域中设置15个静态试验点，使用SNDWAY SW-80G激光测距仪量测的位置作为真值基准，试验人员使用手机分别在试验点上采集约30 s的数据，图中蓝色加号标记为各试验点位上融合定位结果。融合定位方法误差统计结果见表 1。

表 1 定位误差统计结果Tab. 1 Positioning errors statistical results

试验类别		均值/m	均方差/m	方差/m²	中位数/m	95th/m	最大值/m	最小值/m
静态	小范围音频	0.326	0.351	0.130	0.305	0.509	0.709	0.049
动态	小范围UWB	0.170	0.239	0.167	0.129	0.480	0.776	0.000
	小范围音频	0.199	0.245	0.141	0.187	0.441	0.673	0.002
	小范围融合	0.163	0.206	0.125	0.138	0.375	0.722	0.000
	大范围融合	0.226	0.286	0.174	0.199	0.578	0.925	0.000

表选项

4.4.2 动态定位试验

本节试验对融合定位方法的动态精度进行评估，并在小范围场景下对单一UWB动态定位，单一音频定位和本文数模驱动融合定位结果进行对比。试验人员自然握持手机，沿预先设置的轨迹匀速行走并记录实时PDR模型输出数据和音频TDOA数据。对于UWB对比试验，本文采用QORVO公司的DWM1001模块作为UWB信号收发终端，根据官方提供的双向测距例程^[26^]，由试验人员握持定位标签，沿同样预先设置的轨迹匀速行走并记录实时UWB距离观测值。

图 4给出了动态定位试验轨迹结果，红色五角星代表音频定位基站，红色虚线为参考轨迹真值，黄色虚线为动态定位试验轨迹，黄色加号标记为动态定位输出结果。图 4(a)和(b)分别为单一高精度定位源UWB和音频在更新频率为1 Hz下的定位输出结果，由图可以看出，在不使用惯性传感器数据的条件下，音频能够实现与UWB类似的定位精度。但是单一高精度定位源的动态轨迹虽然总体上能够同参考轨迹保持吻合，但是受更新频率和实际观测条件的限制，在转弯和定位信号覆盖较差的区域，位置估计容易产生较大的偏差。图 4(c)展示了数模驱动融合定位的动态轨迹，由图可以看出，在保持单一高精度定位源定位精度的基础上，对上述动态定位精度较差的区域实现了提升。图 4(d)则展示了在较为空旷的室内场景下的定位效果。动态定位误差通过将试验轨迹切割为多段直线轨迹，然后分别统计各历元定位结果同对应参考轨迹的误差来评估定位精度。动态定位试验的累积分布函数(cumulative distribution function，CDF)结果如图 7(a)所示，统计数值结果见表 1。由统计结果可以看出，本文所构建的数模融合定位系统可同时兼容静态与动态，小范围与大范围场景，实现了RMSE优于0.4 m以及更新频率高于20 Hz的总体定位性能。由于大范围场景下的音频信号解算过程更为复杂且多变，因而相对于小范围场景的定位精度有所下降，但仍然保持着小于1 m的误差水平。此外，图 7(b)给出了模型参数动态调整的结果，由图中可以看出本地坐标系与绝对坐标系航向夹角估计在经历短暂的初始化过程后，以±3°的平均误差抑制了航向角的发散。数模驱动多源融合定位模型在保持高精度定位源定位精度优势的基础上，极大提升了定位更新频率，使得系统可用性得到了拓展。

mems惯性传感器论文（65周年陈锐志）(33)

图 7 数模融合定位误差CDF及航向夹角估计θFig. 7 The data and model driven fusing positioning error CDF and heading angle difference estimationθbetween L and G coordinate system

图选项

5 结论

本文提出了一种基于数据与模型双驱动的室内多源融合定位新方法。在数据驱动部分，构建一种基于深度学习的PDR神经网络，训练加速度计和陀螺仪观测量特征，学习行人步行速度矢量，精准推算行人航迹。传统PDR方案是以每步为单位，统计人的步频和步长，PDR的位置更新频率是在1.5~1.8 Hz，基于数据驱动的PDR可以学习人体迈步的全过程，以20 Hz速度矢量输出，实现高频PDR位置更新，充分发挥惯性传感器数据更新率高的优势。在模型驱动部分，通过扩展卡尔曼滤波，紧密耦合高精度音频测距观测量与PDR神经网络输出的高频速度矢量，以20 Hz的位置更新率，实现23 cm的定位精度。与传统的纯模型驱动融合定位方法相比，该方法在定位更新率、定位精度和定位稳定性等方面，都具有明显优势。

作者简介

第一作者简介：陈锐志(1963-), 男, 教授, 博士生导师, 研究方向为室内定位、卫星导航和位置服务。E-mail: ruizhi.chen@whu.edu.cn通信作者：牛晓光, E-mail: xgniu@whu.edu.cn

初审：张艳玲

复审：宋启凡

终审：金君

资讯

mems惯性传感器论文（65周年陈锐志）

最新推荐

热门推荐