在日常生活中,我们总是免不了与各行各业的客服人员交流,有时对于其推广的服务,我们欣然接受;而有时是真的不需要;当然,偶尔也会出现实则需要,但因其产品功能等达不到自己的要求而拒绝。过往,用户的需求都是通过人工来留存处理,但这样对企业来说,效率低且成本高,有没有可能借助更高效的技术来对用户需求进行自动归纳与处理?
答案是:必须有!
近日,作业帮公开了发明专利“一种挖掘用户需求的数据处理方法、装置及电子设备”,可以通过对用户需求的大概定位,通过聚类分析提高备选语句的质量和浓度,利用核心词权重在每个分类内排序,提高后续归纳工作的效率和效果,使用户需求的挖掘更加系统化。
专利摘要显示:本发明属于数据信息处理技术领域,特别适用于在线服务中的数据信息处理,更具体的是涉及一种挖掘用户需求的数据处理方法、装置及电子设备。 方法包括:
- 定位用户对话内容中表达否定意愿的语句,以该语句为中心进行对话内容的扩展;
- 对扩展后的对话内容进行聚类分析,确定每个分类中的核心词的权重;
- 基于核心词的权重确定各个分类的主题,即用户需求。
其中,提到使用聚类分析模型对短句进行聚类分析,所述聚类分析模型采用Biterm Topic Model算法。
Biterm Topic Model (BTM)是一个基于单词共现的主题模型,它通过建模单词共现模式(比如 biterms)来学习主题。
在作业帮此专利中,提到“聚类分析模型在对短句进行聚类过程中,Biterm Topic Model 算法会对每个分类中包含的单词计算在该分类下的权重。基于核心词的权重确定各个分类的主题,即用户需求。”
其实,在Biterm Topic Model的应用目前已不鲜见,比如有国外相关领域研究者采用这种方法来识别推文的主题等。
,