随着国家能源资源高效开发和利用战略决策的实施,节能逐渐成为缓解能源供应矛盾的重要手段,降低电能在传输、分配和销售过程中的损耗与损失,是供电企业的重要工作之一。但目前台区线损异常、窃电等问题仍普遍存在,绝大部分的异常辨别主要依赖于人工,故针对目前供电台区的线损异常识别和关联用户精准定位等工作还有待完善。

现阶段,大多仅考虑运用数据挖掘方法对用户侧异常进行成因分析,并未涉及台区线损异常与配网侧用户负荷的映射关系,因此,在实际工程中存在一定局限性。随着智能电网发展的不断深入,监测终端的用户负荷数据也越来越复杂,传统的数据分析算法逐渐难以满足数据处理的要求,需要进一步探讨研究。

问题拆分

包括:对台区用户的线损数据 进行归一化处理得到中间样本集合,并对中间样本集合进行聚类得到多个聚类簇;将样本数量最 大的聚类簇划分为标准簇并将标准簇的相关线损数据划分至标准库,将不属于标准库的线损数据划分为异常数据;根据异常数据的分布连续性划分异常时间段,将异常时间段内的异常数据划分至异常库并计算异常库对应的用户线损数据 与用电量的关联度;将异常库内的强关联度的用 户线损数据作为异常用户线损数据,利用TOPS IS方法计算异常用户线损数据的综合评价指标; 筛选出综合评价指标最大的异常用户线损数据, 定位为异常用电用户。本发明实现了对线损率异常的准确辨识和精准定位。

问题解决

1 .一种基于混合指标的台区线损处理方法,其特征在于,包括: 对台区用户的线损数据进行归一化处理得到中间样本集合,并对中间样本集合进行聚类得到多个聚类簇; 将样本数量最大的聚类簇划分为标准簇并将标准簇的相关线损数据划分至标准库,将 不属于标准库的线损数据划分为异常数据; 根据异常数据的分布连续性划分异常时间段,将异常时间段内的异常数据划分至异常库并计算异常库对应的用户线损数据与用电量的关联度; 将异常库内的强关联度的用户线损数据作为异常用户线损数据,利用TOPSIS方法计算 异常用户线损数据的综合评价指标; 筛选出综合评价指标最大的异常用户线损数据,定位为异常用电用户

线损指标图(混合指标的台区线损处理方法及系统)(1)

2 .根据权利要求1所述的方法,其特征在于,所述对台区用户的线损数据进行归一化处 理得到中间样本集合,并对中间样本集合进行聚类得到多个聚类簇,包括: 基于GSA‑SC算法确定最佳聚类数; 利用二分K‑means 聚类分析方法根据所述最佳聚类数对中间样本集合进行聚类。

3 .根据权利要求2所述的方法,其特征在于,所述基于GSA‑SC算法确定最佳聚类数,包 括: 计算单个样本的轮廓系数s,计算公式为:

线损指标图(混合指标的台区线损处理方法及系统)(2)

4 .根据权利要求1所述的方法,其特征在于,所述将样本数量最大的聚类簇划分为标准 簇并将标准簇的相关线损数据划分至标准库,将不属于标准库的线损数据划分为异常数据,包括: 选取标准簇的样本最小值和样本最大值,将样本最小值和样本最大值除以归一化系数 得到的最小线损值和最大线损值分别作为标准库的数据下限和数据上限。

5 .根据权利要求1所述的方法,其特征在于,所述根据异常数据的分布连续性划分异常 时间段,将异常时间段内的异常数据划分至异常库并计算异常库对应的用户线损数据与用 电量的关联度,包括: 计算异常库中各用户的线损数据与用电量的依赖性指标和欧式距离; 根据各用户的线损数据与用电量的依赖性指标和欧式距离构建关联度函数; 对所述关联度函数做同向化处理,选取依赖性指标和欧式距离具有正向线性关系的函 数段作为具有强关联性的目标函数段。

6 .根据权利要求5所述的方法,其特征在于,所述计算异常库中各用户的线损数据与用 电量的依赖性指标和欧式距离,包括: 计算依赖性指标的公式为:

线损指标图(混合指标的台区线损处理方法及系统)(3)

线损指标图(混合指标的台区线损处理方法及系统)(4)

9 .一种基于混合指标的台区线损处理系统,其特征在于,包括: 数据聚类单元,用于对台区用户的线损数据进行归一化处理得到中间样本集合,并对 中间样本集合进行聚类得到多个聚类簇; 数据划分单元,用于将样本数量最大的聚类簇划分为标准簇并将标准簇的相关线损数 据划分至标准库,将不属于标准库的线损数据划分为异常数据; 关联计算单元,用于根据异常数据的分布连续性划分异常时间段,将异常时间段内的 异常数据划分至异常库并计算异常库对应的用户线损数据与用电量的关联度; 综合评价单元,用于将异常库内的强关联度的用户线损数据作为异常用户线损数据, 利用TOPSIS方法计算异常用户线损数据的综合评价指标; 异常定位单元,用于筛选出综合评价指标最大的异常用户线损数据,定位为异常用电 用户。

线损指标图(混合指标的台区线损处理方法及系统)(5)

10 .根据权利要求9所述的系统,其特征在于,所述数据聚类单元包括: 第一计算模块,用于基于GSA‑SC算法确定最佳聚类数; 第二计算模块,用于利用二分K‑means 聚类分析方法根据所述最佳聚类数对中间样 本集合进行聚类。

,