最近人工智能非常火爆,大有取代一切工作的可能,作为高度重复性的生物研究生,我们自然也会心里犯嘀咕,是不是也得学点人工智能,深度学习。当然了解深度学习的一些算法对我们生物研究本身也很重要,毕竟现在已经到了各种组学时代,随着各种数据的不断开拓,可以预见未来深度学习等将成为我们和PCR一样的工具。

今天我们一起来了解一些深度学习的入门背景。


从神经网络到深度学习

所以要理解深度学习必先了解神经网络:

深度学习框架和算法区别交流(生物僧也可以懂的)(1)

上面就是一个神经网络,这个我们生物僧很懂,神经元有各种树突轴突,然后之间有连接,其中每个圆圈代表神经元。

每条线表示神经元之间的连接。我们可以看到,上面的神经元被分成了多层,层与层之间的神经元有连接,而层内之间的神经元没有连接。最左边的层叫做输入层,这层负责接收输入数据;最右边的层叫输出层,我们可以从这层获取神经网络输出数据。输入层和输出层之间的层叫做隐藏层。

那么如何计算神经网络那?


深度学习框架和算法区别交流(生物僧也可以懂的)(2)

需要首先将输入向量的每个元素的值赋给神经网络的输入层的对应神经元,然后依次向前计算每一层的每个神经元的值,直到最后一层输出层的所有神经元的值计算完毕。最后,将输出层每个神经元的值串在一起就得到了输出向量。

神经网络的训练


神经网络的训练是反向传播算法,反向传播算法的本质是将错误回传,修改参数。

卷积神经网络


目前最火爆的是卷积神经网络,更适合图像、语音识别任务的神经网络结构——卷积神经网络(Convolutional Neural Network, CNN)。说卷积神经网络是最重要的一种神经网络也不为过,它在最近几年大放异彩,几乎所有图像、语音识别领域的重要突破都是卷积神经网络取得的,比如谷歌的GoogleNet、微软的ResNet等,打败李世石的AlphaGo也用到了这种网络。

深度学习框架和算法区别交流(生物僧也可以懂的)(3)

我们可以发现卷积神经网络的层结构和全连接神经网络的层结构有很大不同。全连接神经网络每层的神经元是按照一维排列的,也就是排成一条线的样子;而卷积神经网络每层的神经元是按照三维排列的,也就是排成一个长方体的样子,有宽度、高度和深度。

卷积这个词大家不懂没有关系,说的直白一点,卷积的含义,可以理解成提取某一特征,也就是说只看某一方面,比如100个人各种各样,我们只看每个人的性格,这也就是用性格对每个人做了一个卷积,如果我们把100个人分成10个组,只看每个组的卷积,这样就可以有效的合并样本和周围样本的信息。

深度学习框架和算法区别交流(生物僧也可以懂的)(4)

卷积神经网络在处理图像上展现了强大的力量。

而处理自然语言等序列问题时候,循环神经网络和递归神经网络则展现了强大的力量。这里就不再一一展示了。

TensorFlow 简介

tensorflow是用数据流表示计算的一种方式,这个跟咱们生物里面一个一个实验室的屋子一样,先做PCR,然后酶切,然后转化,这些过程都是流程化的,数据也可以流程化,在一个节点内进行计算,类似于反应,然后在节点的连接之间,好比把产物送到不同的实验室屋子里面。

TensorFlow是深度学习非常有用的计算框架。

一些使用深度学习的生物信息学文章举例:

Deep Learning based multi-omics integration robustly predicts survival in liver cancer.

Chaudhary K, Poirion OB, Lu L, Garmire LX.

Clin Cancer Res.

Reconstructing cell cycle and disease progression using deep learning.

Eulenberg P, Köhler N, Blasi T, Filby A, Carpenter AE, Rees P, Theis FJ, Wolf FA.

Nat Commun. 2017

Deep learning and 3D-DESI imaging reveal the hidden metabolic heterogeneity of cancer.

Inglese P, McKenzie JS, Mroz A, Kinross J, Veselkov K, Holmes E, Takats Z, Nicholson JK, Glen RC.

Chem Sci. 2017

(整理自网络)

,