本文内容来源于《破解SCI 论文写作奥秘》,我来为大家科普一下关于sci论文常用数据集?下面希望有你要的答案,我们一起来看看吧!

sci论文常用数据集(材料类SCI论文的用词)

sci论文常用数据集

本文内容来源于《破解SCI 论文写作奥秘》。

文中,作者将大数据与SCI 论文进行有机结合,通过自然语言处理技术,得到SCI论文的各部分的用词频率统计情况,以期对材料类科研工作者的SCI 论文写作提供一定的帮助。

具体的处理步骤如下:

(1)将PDF格式的论文转换为txt格式;

(2)去除噪声信息(如论文页面边角信息、页眉、引文等);

(3)文献按 Introduction、 Experiment、 Results and discussion、 Conclusions 分块;

(4)自然语言处理技术进行处理;

(5)标注词性及去除错误;

(6)得到词频统计情况。

---------------------------------------------------------------------

Experiments 部分

---------------------------------------------------------------------

(1)过去分词(高频词 频次)

shown 235 observed 162 obtained 97

,