今天我们来讨论下分布估计相关的部分,主体思路是构建三个模块:分布估计,相似度估计和放松标记,我来为大家科普一下关于智能财税以什么为核心?以下内容希望对你有帮助!
智能财税以什么为核心
今天我们来讨论下分布估计相关的部分,主体思路是构建三个模块:分布估计,相似度估计和放松标记。
分布估计输入两个分类本体以及它们的实例。然后利用机器学习技术计算每对概念的联合概率分布。由于联合概率分布包含4种, 这样一共需要计算多个概率(可以假设本体为,,那么就一共就需要4|||个)。分布评估使用一组基本学习器和一个元学习器。
相似度估计利用输入的联合概率分布,并借助相似度函数,计算概念对之间的相似度,输出两个分类本体之间的概念相似度矩阵。
放松标记模块利用相似度矩阵以及领域特定的约束和启发式知识,寻找满足领域约束和常识知识的映射,输出最终的映射结果。
其中需要计算P(A,B)的值,A∊且B∊(,都是分类本体),这个联合概率分布式同时属于A和B的实例数与全体实例总数的比值。通常这个比值是无法计算的,因为不可能知道全体实例。因此,必须基于现有的数据来估计P(A,B),即利用两个本体的输入实例,注意,两个本体的实例可以重叠,但是没有必要必须那样。
作者:Hawk Zhang
,