不平衡数据分类算法介绍与比较（论文推荐王志忠）

《测绘学报》

构建与学术的桥梁拉近与权威的距离

不平衡数据分类算法介绍与比较（论文推荐王志忠）(1)

具有不确定性平差算法

王志忠^1,2, 陈丹华², 宋迎春¹

1. 中南大学地球信息科学与物理学院, 湖南长沙 410083; 2. 中南大学数学与统计学院, 湖南长沙 410083

收稿日期：2016-10-12；修回日期：2017-02-27

基金项目：国家自然科学基金（41574006）

第一作者简介：王志忠(1963—), 男, 博士, 博士生导师, 研究方向为测量数据处理.E-mail: wzz8713761@163.com

通信作者：宋迎春, E-mail: csusyc@csu.edu.cn

摘要：观测不确定性常常影响参数估计的有效性。将不确定度作为参数融入平差模型，可以有效地降低不确定性的影响。本文提出有界不确定性误差约束下，随机误差与不确定性误差平方和最小的平差准则，并给出了一个不确定性平差模型迭代算法。通过仿真实例，对不确定性最小二乘法与总体最小二乘法进行了比较。结果显示：在一定程度上，不确定性最小二乘方法的估计结果要略优于总体最小二乘方法，且在不确定性较大时，该方法有较好的适用性。

An Algorithm in Adjustment Model with Uncertainty

WANG Zhizhong^1,2, CHEN Danhua², SONG Yingchun¹

Abstract: The uncertainty of observation often affects the validity of parameter estimation, and the effects of uncertainty can be reduced effectively by incorporating uncertainty into the adjustment model as an observation error parameter. An adjustment criterion is proposed under the bound constrain of uncertainty, in which the sum of squares of random error and uncertainty error should be minimized, and provided an iteration algorithm to solve the adjustment model. With simulation examples, the estimation results of uncertainty least-square method are compared with that of total least-square method. The results show that the estimation results of uncertainty least-square method are better than that of total least-square method to a certain extent and more applicable when uncertainty is greater.

Key words: adjustment model adjustment criterion uncertainty total least-squares estimation prior information

测绘数据获取过程中，常存在复杂的不确定性^[1]，它通常以不确定信息形式表现出来。它比一般的噪声更复杂，其分布、均值和方差等统计特性不清楚^[2]，描述非常困难。不确定度是对不确定性的一种度量，它可以用方差、均方差、误差区间、误差椭圆、误差椭球来表示^{[3, 4]}。在测绘数据处理领域，应用不确定度理论，研究不确定度评定方法，寻找减小不确定度的算法等已成为研究热点^[5-10]。文献[11—13]对测量不确定度理论进行了研究，拓展了测量平差数据处理的理论与方法。整体平差算法也可以看成是对于不确定性平差算法的一种探索，它在一定程度上减弱了不确定性因素的影响^[14-18]。由于不确定性的统计信息(如均值和方差等)和概率分布函数无法确定，人为地确定它们的统计性质本身就在增加新的不确定性，从而影响参数估计的可靠性^[19-20]。

利用先验信息来抑制不确定性是不确定性观测数据平差的有效方法，但是，测绘工程中基于先验信息的平差算法比较复杂^[21]。文献[22]直接将不确定度作为一个参数融入函数模型中，建立min-max平差准则，即让残差中的最大不确定性达到最小，从而使得参数解中的不确定性达到最小化，在算法中对不确定度进行抑制，引入岭参数对模型进行求解，得到了较好的效果。本文在该方法的基础上，基于随机误差和不确定性误差平方和最小的新平差准则，提出了一种新的迭代求解算法，简化了文献[22]中的算法，同时也避免了迭代不收敛的情况。

1 不确定性平差模型及平差准则

考虑更广一类平差模型，即不确定性平差模型

不平衡数据分类算法介绍与比较（论文推荐王志忠）(2)

(1a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(3)

(1b)

式中，A为n×m维设计矩阵；X为m维未知参数向量；L为n维观测向量；e为n维随机误差向量，E(e)=0；ΔA和ΔL分别是A和L的不确定性误差；α和β是A和L的不确定度；‖ΔL‖₂=ΔL^TΔL；‖ΔA‖₂=eA^Te_A，这里e_A=vec(ΔA)，表示ΔA的拉直变换。

文献[23—24]研究的污染误差模型仅考虑模型误差和随机误差，且模型误差没有有界假设(式(1b)中α=0，β= ∞)，模型误差包括未顾及的系统误差和未发现的粗差，文献[24]中将其表示为均值移动误差，与随机误差不同；文献[25]研究的总体平差模型中只考虑随机误差和系数矩阵误差，且系数矩阵误差没有有界约束(式(1b)中α= ∞，β=0)；文献[22]认为经典平差模型L=AX e中，“真”系数矩阵应为A ΔA，“真”观测值应为L ΔL，不确定性误差ΔA、ΔL带有先验信息，可由不等式约束‖ΔA‖₂≤α、‖ΔL‖₂≤β、描述，文献[22]没考虑随机误差。因此，本文提出的不确定性平差模型(1) 可认为是更广泛的一类平差模型，下面还将说明本文结果在特定情况下可得出文献[25]的主要结果。

不确定性误差的有界性可看成是A和L已知的先验信息。不确定性往往不具有统计性质，可以用区间来评定。文献[22]中，分别用以A、L为圆心，α、β为半径的圆来描述A、L的不确定性，本文沿用此种方法；在文献[22]中，采用min-max准则对有界不确定性平差模型进行解算，该准则的缺点是不能用观测信息和先验有界信息估计不确定误差ΔA和ΔL，同时，未知参数X的估计结果中不含不确定度β，即不确定误差ΔL对平差解算结果没有影响。为了解决这个问题，本文建立了在有界不确定性误差约束下随机误差和不确定性误差平方和最小准则，简称为不确定性最小二乘准则，即

不平衡数据分类算法介绍与比较（论文推荐王志忠）(4)

(2a)

s.t.

不平衡数据分类算法介绍与比较（论文推荐王志忠）(5)

(2b)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(6)

(2c)

参照文献[13]中对带线性不等式约束平差模型的简单算法及文献[25—26]中解算总体最小二乘问题的Euler-Lagrange逼近法，本文引入Lagrange乘子，结合库恩-塔克条件，对上述二次规划问题进行求解。

应用广义Lagrange法构造如式(3) 所示的目标函数

不平衡数据分类算法介绍与比较（论文推荐王志忠）(7)

(3)

式中，λ、μ≥0、u≥0都是Lagrange乘子。不确定性最小二乘估计由库恩-塔克条件确定，即

不平衡数据分类算法介绍与比较（论文推荐王志忠）(8)

(4a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(9)

(4b)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(10)

(4c)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(11)

(4d)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(12)

(4e)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(13)

(4f)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(14)

(4g)

式中，⊗表示Kronecker积；μ≥0；u≥0。将式(4a)、式(4b)和式(4d)代入式(4g)，整理得到

不平衡数据分类算法介绍与比较（论文推荐王志忠）(15)

(5)

式中，

不平衡数据分类算法介绍与比较（论文推荐王志忠）(16)

。

由式(4a)、式(5) 可得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(17)

(6)

由式(5) 可得到法方程式

不平衡数据分类算法介绍与比较（论文推荐王志忠）(18)

(7)

将式(4c)和式(6) 代入式(7) 整理得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(19)

(8)

式中

不平衡数据分类算法介绍与比较（论文推荐王志忠）(20)

(9)

由式(8) 变形得到

不平衡数据分类算法介绍与比较（论文推荐王志忠）(21)

(10)

将式(6) 代入式(4d)得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(22)

(11)

将式(6) 代入式(4b)得到

不平衡数据分类算法介绍与比较（论文推荐王志忠）(23)

(12)

由式(11) 和式(12) 可知，不确定性ΔL和ΔA在解

不平衡数据分类算法介绍与比较（论文推荐王志忠）(24)

给定条件下由Lagrange乘子和确定，可以分以下4种情况讨论。

(1) μ>0，u>0。由式(4e)和(4f)得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(25)

(13a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(26)

(13b)

由式(13) 解方程组得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(27)

(14a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(28)

(14b)

将μ和u代入式(11) 和式(12) 可得到不确定性ΔL和ΔA。

(2) u>0，μ=0(μ < 0视为μ=0)。有

不平衡数据分类算法介绍与比较（论文推荐王志忠）(29)

，由式(12) 解方程得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(30)

(15)

不确定性ΔL和ΔA可表示为

不平衡数据分类算法介绍与比较（论文推荐王志忠）(31)

(16a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(32)

(16b)

式中，u由式(15) 确定。

(3) μ>0，u=0(u< 0视为u=0)。由式(7) 解方程得

不平衡数据分类算法介绍与比较（论文推荐王志忠）(33)

(17)

不确定性ΔL和ΔA可表示为

不平衡数据分类算法介绍与比较（论文推荐王志忠）(34)

(18a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(35)

(18b)

式中，μ由式(17) 确定。

(4) μ=0(μ< 0视为μ=0)，u=0(u< 0视为u=0)，不确定性ΔL和ΔA可表示为

不平衡数据分类算法介绍与比较（论文推荐王志忠）(36)

(19a)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(37)

(19b)

利用式(10) 求解

不平衡数据分类算法介绍与比较（论文推荐王志忠）(38)

非常复杂，只能用迭代法求解。下面分析式(10) 迭代求解

不平衡数据分类算法介绍与比较（论文推荐王志忠）(39)

收敛性问题。令

不平衡数据分类算法介绍与比较（论文推荐王志忠）(40)

(20)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(41)

对求偏导，并结合式(9) 可得到

不平衡数据分类算法介绍与比较（论文推荐王志忠）(42)

(21)

式中

不平衡数据分类算法介绍与比较（论文推荐王志忠）(43)

(22)

由式(4a)和式(5) 可得到

不平衡数据分类算法介绍与比较（论文推荐王志忠）(44)

(23)

将式(23) 代入式(22) 和式(9) 得到

不平衡数据分类算法介绍与比较（论文推荐王志忠）(45)

(24)

不平衡数据分类算法介绍与比较（论文推荐王志忠）(46)

(25)

将式(24) 和式(25) 代入式(21) 得到

(26)

注意到‖μ^*‖≤1和范数性质，由式(26) 可得到

(27)

文中目标函数(21) 是凸规划问题，最小二乘估计解一定存在，故

不平衡数据分类算法介绍与比较（论文推荐王志忠）(47)

和

不平衡数据分类算法介绍与比较（论文推荐王志忠）(48)

都有界。从以上证明过程看出式(27) 成立与μ≥0和u≥0的取值无关，只要很小就有

(28)

此时，迭代算法是收敛的。

在上述不确定性平差模型中，若假设β=0，α→ ∞，即为总体最小二乘模型，由(4e)有μ=0，μ^*=1，再由式(15) 有，u= ∞，u^*=0。式(8) 简化为

(29)

与文献[25]中式(3.3.27) 一致。

2 不确定性平差模型解算方法

不确定性平差问题求解采用不确定性最小二乘逼近法。

输入：系数矩阵A，观测值L，不确定度α和β，精度要求为ε。

输出：不确定性最小二乘解，不确定误差解以及二范数，随机误差解，总的误差平方和。

step 1：选定初始值V⁽⁰⁾=0,μ⁽⁰⁾=0,u⁽⁰⁾=0，置k=0。

step 2：计算。

step 3：计算

令。

step 4：如果μ>0,u>0，则置μ(k 1)=μ,u(k 1)=u。

如果u>0μ，=0，则计算

置μ(k 1)=0,u(k 1)=max(u^*, 0)；

如果μ>0，u=0，则计算

置μ(k 1)=max(μ^*, 0),u(k 1)=0；

如果μ=0,u=0

置μ(k 1)=0,u(k 1)=0。

step 5：计算

step 6：计算

step 7：当时，计算结束，否则，置k=k 1，转step 3。

step 8：输出，μ=μ(k 1)，u=u(k 1)，由式(11) 计算，式(12) 计算，式(6) 计算。

迭代过程可参考文献[25]，不同的是本文考虑了Lagrange乘子，并且在迭代过程中取μ=max(0,μ),u=max(0,u)，该方法保证了迭代的收敛速度；同时，文献[25]中还根据文献[27]的研究，提出了一种瑞利商加速算法，有兴趣的读者可以结合本文的迭代方法做进一步研究。在本文的实例中本算法已有较好的收敛性。

3 不确定性平差模型解算与分析

为了检验算法的有效性，本文以2D仿射变换的数学模型为例进行模拟分析。建立如下的2D仿射变换不确定性平差模型

式中，(a_s,b_s)和(a_t,b_t)分别为旧坐标系和新坐标系中的坐标观测值列向量；为坐标变换参数；是未知的不确定性误差。

假定变换参数的真实值为X=[0.8 -0.521]，无误差的观测数据，即坐标真实值如表 1所示。

表 1 无误差观测数据Tab. 1 Observations without errors

表选项

考虑到观测误差的存在，利用Matlab数学软件，随机生成服从N(0, 0.193 8) 的相对误差序列，即保证相对误差以99%的概率落在[-50%, 50%]的区间内，不确定度α=4.77、β=9.90，由此得到绝对误差，由真实值加上绝对误差计算得到带不确定性的观测数据，见表 2。虽然从模拟数据中生成了不确定性误差ΔA、ΔL，但算法认为它们是未知的。本文采用总体最小二乘方法(total least-squares, TLS)和不确定性最小二乘方法(uncertainty least-squares, ULS)进行参数求解，并分析和比较两种方法的效果。

表 2 带不确定性观测数据Tab. 2 Observations with uncertainty

表选项

总体最小二乘方法求得的结果为=[0.71 -0.39 1.74 1.29]，估计值与真实值之间的误差用2-范数表示为=0.409 1；经过4次迭代，得到不确定性最小二乘估计的结果为，估计值与真实值之间的误差为=0.379 9，不确定性最小二乘估计的结果与真实值更为接近，两种方法得到新坐标系下的坐标估计见图 1。

图 1 TLS与ULS拟合结果Fig. 1 TLS and ULS fitting results

图选项

不确定性最小二乘准则，即有界不确定性误差约束下随机误差和不确定性误差平方和。

为检验不确定性最小二乘方法的适用性，本文对上述实验独立重复进行1000次，得到该方法优于总体最小二乘方法的概率为0.531。同时，经本文研究发现，不确定性的大小对实验结果有一定影响。在不同的相对误差下，重新计算α、β的大小，进行上述试验，得到不确定性最小二乘方法优于总体最小二乘方法的概率p、不确定性最小二乘估计结果的误差error与β取值大小的关系见表 3及图 2。从图 2可以看出，不确定性越大，不确定性最小二乘方法优于总体最小二乘方法的概率越高。

图 2 ULS估计结果性质Fig. 2 Character of ULS estimate results

图选项

表 3 ULS估计结果优良性与不确定性大小的关系Tab. 3 The relationship between ULS estimate results and uncertainty

表选项

4 结论

在测量数据的获取过程中，经常存在不确定性，影响参数估计的可靠性。目前的测量平差方法是基于“观测值的不确定性就是随机性”这一基本假设的，实际测量工程中有许多不同于随机误差的不确定性因素。扩展误差理论与测量平差方法处理测量数据中的不确定度，必须对观测中不确定性因素进行数值化、参数化，把它们融入平差模型中，这需要有理论和方法上的突破。

本文将不确定性作为参数融入函数模型中，将不确定信息转化为先验约束信息，利用残差中不确定性传播规律，建立了一种有界不确定性误差约束下随机误差和不确定性误差平方和最小的平差准则，并用迭代算法得到了不确定性平差模型的解算方法，称为不确定性最小二乘方法。本文通过仿真实例求解，对总体最小二乘方法和不确定性最小二乘方法的估计结果进行了比较，认为在一定程度上，不确定性最小二乘方法的估计结果要优于总体最小二乘方法，并且在不确定性较小时，该方法有较好的估计精度。

【引文格式】王志忠，陈丹华，宋迎春。具有不确定性平差算法[J]. 测绘学报，2017，46(7)：834-840. DOI: 10.11947/j.AGCS.2017.20160522

不平衡数据分类算法介绍与比较（论文推荐王志忠）(49)

更多精彩内容：

不平衡数据分类算法介绍与比较（论文推荐王志忠）

最新推荐

热门推荐