本文内容来源于《破解SCI 论文写作奥秘》,我来为大家科普一下关于sci论文常用数据集?下面希望有你要的答案,我们一起来看看吧!
sci论文常用数据集
本文内容来源于《破解SCI 论文写作奥秘》。
文中,作者将大数据与SCI 论文进行有机结合,通过自然语言处理技术,得到SCI论文的各部分的用词频率统计情况,以期对材料类科研工作者的SCI 论文写作提供一定的帮助。
具体的处理步骤如下:
(1)将PDF格式的论文转换为txt格式;
(2)去除噪声信息(如论文页面边角信息、页眉、引文等);
(3)文献按 Introduction、 Experiment、 Results and discussion、 Conclusions 分块;
(4)自然语言处理技术进行处理;
(5)标注词性及去除错误;
(6)得到词频统计情况。
---------------------------------------------------------------------
Experiments 部分
---------------------------------------------------------------------
(1)过去分词(高频词 频次)
shown 235 observed 162 obtained 97
,