近日,一则重磅消息轰炸了学术界,DeepMind公司正式宣布,他们利用旗下的人工智能系统AlphaFold,成功预测出了地球上几乎所有的蛋白质结构。很多人不了解这一成果的重要性,所以社会上对于这则新闻的关注度不够。这也很正常,毕竟学术成果的意义往往要经历很长时间才能传导到社会。地球所有蛋白结构的精准预测,其意义不亚于爱因斯坦开创相对论,这标志着一个新的纪元来临。

用ai创造全新的蛋白质结构(人类再一次败给AI)(1)

蛋白质的结构为什么这么重要?人类乃至地球一切生物的正常运转,都依赖于不同类型蛋白质的正常工作,可以说没有蛋白质就没有地球生物。这也就是为什么前段时间人们在外星上发现了氨基酸后,会如此兴奋地认为我们找到了生命的起源。因为氨基酸就是生产蛋白质的原料。

据统计,人类98%的疾病都与蛋白质有关,大到癌症、新冠肺炎,小到伤寒感冒,如果能搞定蛋白质,那么几乎人类的所有疾病都能得到很好的救治。例如癌症之所以难以治疗,就是因为癌细胞上的蛋白质可以帮助癌细胞逃脱人体免疫系统的攻击,所以很多抗癌药物就针对这些蛋白质进行设计。

再比如,新冠病毒在人体内的繁殖离不开一种叫做3CL蛋白酶的蛋白质,现在辉瑞的特效药就是把这种蛋白质破坏,让新冠病毒无法繁殖。搞定蛋白质是人类生命科学追寻的终极目标,也几乎是解决人类一切疾病的最终方式。

用ai创造全新的蛋白质结构(人类再一次败给AI)(2)

但是当科学家们真正开始着手搞定蛋白质时,大部分时候却倒在了第一步上,也就是弄清楚蛋白质到底长啥样。只有弄清楚了蛋白质长啥样,才能明白它到底在生命体中扮演什么样的角色,才能针对蛋白质的结构设计合适的药物来治疗疾病。

可问题在于蛋白质的结构实在过于复杂。一个小的蛋白质由几百个原子构成,大的蛋白质甚至由上万个原子构成。这些原子之间的排列组合分为了一级结构、二级结构、三级结构,这些原子结构之间的角度哪怕就偏差了1度,蛋白质发挥的功能可能就截然不同。因此,解析蛋白质结构甚至开创出了一个新的科学领域——结构生物学。

过往的结构生物学家解析蛋白质通常利用X光衍射,这种方法的效率非常低,而且只有极少数的蛋白质才能用这种方法解析出来,解析一个蛋白质结构通常要几年时间。

用ai创造全新的蛋白质结构(人类再一次败给AI)(3)

后来人们开发出了大名鼎鼎的冷冻电镜,冷冻电镜将蛋白质结构解析的速度大幅提升,但解析一个蛋白质最快也要差不多半年。冷冻电镜的问题也非常多,首先冷冻电镜价格十分昂贵,一台冷冻电镜的价格要几千万,这不是一般科学家都能用上的设备。同时,蛋白质解析对于科学家的技术要求非常高,全球能用冷冻电镜解析蛋白质结构的科学家也就几十人,像我国的施一公院士就是这几十人中的翘楚。所以一旦研究清楚一种重要蛋白质的结构,往往就能在《自然》《科学》《细胞》等国际顶级学术期刊上发表论文。

半年才解析一种蛋白质,全球一年能解析的蛋白质数量就算有100种,这对于疾病的研究而言,实在是杯水车薪。为什么呢?因为仅仅人类一种生物,所具有的蛋白质种类就差不多有10万种,按照现在的解析速度,人类差不多要1000年才能弄清楚我们自身的所有蛋白质。这大概就等于我们从宋朝开始研究,一直研究到现在吧,更别说完全搞定地球上其他病毒病菌的蛋白质了。

用ai创造全新的蛋白质结构(人类再一次败给AI)(4)

传统实验的方式研究蛋白质困难重重,于是人们就在想,能不能通过计算机来计算出蛋白质的结构呢?当时学术界的普遍观点是不可能!因为蛋白质中原子排列的可能性多达10的500次方种,就是将全球所有的超级计算机加在一起,也很难精确地计算出一个大一点的蛋白质结构。

但就在这时候,人工智能横空出世。2016年,DeepMind公司研发出阿尔法狗(AlphaGo),首次在围棋上击败了围棋大师李世石,世人第一次见证了人工智能、机器学习的厉害。这么厉害的人工智能仅仅用于围棋实在太小儿科了,DeepMind公司于是马不停蹄地开发出了AlphaFold系统,利用机器学习预测蛋白质结构。

用ai创造全新的蛋白质结构(人类再一次败给AI)(5)

AlphaFold一出世便震惊世人,它所预测的蛋白质结构几乎与实验得到的结果没有区别,而且仅仅用了一年不到的时间,便将人类所有的蛋白质结构预测出来了,这一成果去年还被列为了全球十大科研进展的榜首。今年,DeepMind公司再一次发力,一口气将世界上其他生物的大部分蛋白质也解析出来。这些蛋白质结构现在被汇集成了一个数据库,科学家只需要像使用百度搜索一样,很轻易地就能得到自己想要的蛋白结构了。

现在,药物研发的第一个阻碍已经完全化解。未来DeepMind公司还将利用人工智能自动生成新型药物的分子结构,新的纪元已经开启了。但是中国的DeepMind在哪里呢?

————

我是复旦博士科研小糖糖,关注我,了解更多生活新知、科普知识和科技资讯解读!

,