看到这篇文章,我认为你准备入门机器学习算法岗,或者已经入门希望通过阅读论文来提高自己机器学习领域非常火热,新的模型、技术不断更新非常快,要求我们在平时的工作和学习过程中,会需要去阅读一些论文,跟踪某个领域的最新动态,今天小编就来聊一聊关于如何正确有效写笔记?接下来我们就一起去研究一下吧!
如何正确有效写笔记
看到这篇文章,我认为你准备入门机器学习算法岗,或者已经入门希望通过阅读论文来提高自己。机器学习领域非常火热,新的模型、技术不断更新非常快,要求我们在平时的工作和学习过程中,会需要去阅读一些论文,跟踪某个领域的最新动态。
大家都有的疑问就是:如何高效的阅读机器学习论文?对于这个问题,网上也有很多的答案,文章后面会附上一些我看过觉得比较好的文章或者视频。
我为什么要来说这个问题呢?因为我之前看过的一些回答,大多是比较厉害学校出来的硕士、博士研究生,起点相对比较高,可能对部分同学来说有挑战。我是一个比较普通高校的本科毕业生,所以大部分做机器学习的同学基础都会比我更好,我的方法可能更加适合基础差一点的同学。
第一个问题,我想读论文,论文从哪里来?
1.顶会
机器学习领域,每年都会有比较多的会议,选择你关注领域的顶会,花点时间去探索一下。下面列了一些顶会,这部分顶会每年的paper足够你读很久了。
计算机视觉:CVPR、ICCV、ECCV、ACCV
自然语言处理:ACL、EMNLP、NAACL
机器学习:AAAI、ICML、ACM MM、KDD
2.arXiv.org
说到论文,就不得不提arXiv.org。简单来说,arXiv是预发布的paper,就是论文在正式发表前,为了让同行可以更快看到自己的文章,就会把论文发布到这个平台。
一般情况下,发表过的论文大部分都可以在这里免费下载到。
3.google学术
啥都不说,你只要能访问!搜就完事。
4.大牛整理好的
前面的几个来源都需要你自己动手去找,所以网上也有很多大牛分享了自己的读过以后觉得比较值得读的一些文章列表,这个在github或者搜索引擎搜索一下就出来了。
第二个问题,如何选择适合论文?
现在你已经知道去哪里找论文了,所以要说一说如何选择适合自己的论文?
1.按照研究领域
无论是工作还是学习,我们的专业方向都相对比较固定,所以我们主要找本专业领域相关的文章。
例如:我最近工程需要涉及图像分割,那么我就在google scholar里面根据image segmentation搜索一下,先找到最近几年的被引数较高的paper,能下载的就下载下来准备读一读。
这里有两个关键词:最近几年、被引数。机器学习领域比较新的DNN方法也是15年以后才比较火热的,论文看最近几年的就行了;被引数代表这篇论文可能在某些方面到大家比较多认可,也值得一读。
2.根据论文找论文
研究工作都是基于前人的基础上进行的,所以文章中都会提到参考的论文,如果很多文章都会提到同一篇论文,那么这篇论文你一定是要去找来认真读一读的。
例如:CV方向为例,特征提取大家都提到resnet、mobelnet、inceptionnet,目标检测大家都提到:SSD,YOLO,Faster-RCNN,图像分割都提到:U-Net,PSPNet,Deeplab等,这些经典论文是一定要下载下来看看的。
第三个问题,怎么读论文?
好了,现在你想读的paper已经下载好了,可能有个10多20篇,那要怎么开始读呢?是一篇一篇读,一个字一个字的扣,还是?
1.确定一篇文章值不值得去读?
拿到一篇paper,我们要做的第一件事就是确定文章值不值得读。
摘要很关键,从摘要里我们就能够基本知道一篇文章的主要内容,比如:
- 研究的内容?检测、分割、分类等
- 做出的贡献?提出新模型、优化算法、公开数据集等
通过阅读摘要,我们能看出一篇文章值不值得细读。你如果要问,什么样的论文值得读?其实只要你读过多几篇论文,就可以很快通过摘要来判断要不要继续读下去了。
2.读论文的顺序?
读论文的顺序每个人都有自己的方法,比较多人的方法就是:
粗略读:
- 先读摘要,理解论文主要是干什么工作,背景是什么。
- 然后,看结论,作者在工作中取得哪些成绩。
- 回过头来,看作者是通过什么方法去得到他的最终结果的。
完成上面这个步骤,你略读了一篇文章说了什么,会决定要不要继续精读。
精读:
- 带上问题精读,这个放在下一段。
3.带着问题读论文
阅读论文的目的是什么?我认为阅读论文的目的主要是解答疑惑,就是通过读paper进行自我答疑的过程。
提问题是高效阅读论文很关键的一步,让阅读更有针对性。
例如:粗略读的过程,我会提出的问题:
- 文章的领域是什么?
- 文章有哪些贡献,作了什么工作?
我得到了答案比如是这样的:
- 作者研究了计算机视觉领域的目标检测问题
- 作者提出一种新的网络模型,在数据集上达到了SOTA的效果。
那么在精读的过程中,我就会有这些问题:
- 模型结构是什么样的?结合了哪些技术?
- 新模型新在什么地方,为什么有效?
- 对比其他表现比较好的模型,优势是什么?速度快、还是精度高?
- 训练结果是怎么出来的?训练集是什么?参数怎么设置?Loss怎么计算?
最后:
- 论文的缺点在哪些地方,哪些方面还有提升空间?
最重要的事,读论文一定要记笔记,否则就白读了!
怎么记?
读完一篇文章后,我们要把对文章的理解记下来。当我们下次需要用到这篇文章的时候,不需要再去翻论文,看自己的笔记就够了。
文献管理
文献管理软件有很多,自己平时用Mendeley比较多,免费、功能够用、跨平台
,