文 | 《中国科学报》记者 张晴丹
一篇论文,从初稿到终稿,她写了有20多版。化学专业出身,却天天抱着一本厚厚的计算机书籍“死磕”。
她就是华东师范大学化学与分子工程学院博士生熊谢微。7月4日,熊谢微为第一作者的研究在Nature子刊《自然—机器智能》(Nature Machine Intelligence)在线发表。这是我国科研人员首次在试管中用DNA构造出了卷积人工神经网络,也是迄今为止规模最大、功能最复杂的人工化学分子智能反应网络。
熊谢微本科就读于一所“双非”院校,然后保送到985高校,并在博士毕业前完成这项“漂亮的”研究工作,她是如何做到的?
“烧脑”的研究
大脑很像一部精密的生物计算机,它靠几百上千亿个神经元相互连接,形成纵横交错的网络,去完成很多高度复杂的计算任务。
有科学家认为,在神经大脑进化之前,生物之所以有感知、模式识别、记忆、决策、运动控制等技能,其实是源于细胞内分子之间的复杂化学反应网络。
“我们的灵感也来源于此,想通过研究分子如何‘思考’,从而在无生命的系统中重建这些能力。”论文通讯作者、华东师范大学化学与分子工程学院教授裴昊告诉《中国科学报》。
在这篇论文中,DNA计算机是一种生物形式的计算机,是以溶液形态实现计算功能的“液态电脑”;同时,他们设计的分子电路可以执行卷积神经网络计算,具备对分子图谱信息分类能力。
要设计一个分子计算机,除了需要专业知识的支撑外,也是非常需要想象力的。
“有时候我在想一个分子设计,就会一整天都在想,刷牙、吃饭、走路时在琢磨,连做梦都不放过,真的毫不夸张,简直是绞尽脑汁。”熊谢微告诉《中国科学报》。
整个课题都极具挑战性,又涉及到多学科间的合作。幸而当时得到了华东师范大学副教授朱通的助力,他是这篇文章的共同一作。“朱老师的团队负责机器学习部分,我们这边负责DNA分子电路的设计构建以及后期实验部分。”熊谢微介绍。
实验部分有着庞大的工作量,光靠熊谢微一人无法完成。她请了一位师兄和两位师妹一起,帮忙做大批量DNA序列的设计及计算性能测试,这涉及到几百条DNA链。
熊谢微(中)和两位师妹在实验室制备分子电路的过程。受访者供图
在很长一段时间里,每天很早就能看到一排人坐在实验室操作台前,制备分子计算机,一坐就是一整天。
这个课题做了近4年,横跨熊谢微的硕士和博士阶段,期间遇到过很多困难,也经历了反复失败,终于还是完成了。
“我们所构建的神经元网络,相较于目前已有的DNA计算机有了很大突破,因为我们很好地扩展了整体电路规模,包括新型的网络架构,以及它能执行的功能,都是目前来说最优的。”熊谢微表示。
该分子网络包含512个分子物种,涉及数千种化学反应,可产生数百种分子产物,是迄今为止规模最大、功能最复杂的人工化学分子智能反应网络。
不过,与人类大脑的复杂度相比,它还是“小儿科”。熊谢微说,“这是一项十分‘烧脑’的研究,今后还有很长的路要走。”
从初稿到终稿,写了20多版
当实验工作进入尾声时,还有两座山丘需要翻越——数据分析和文章撰写。
前期工作中庞大的数据量,需要他们在数据分析方面下大功夫。不过,在熊谢微看来,这点困难跟后面的论文撰写比起来,根本不算什么。
写论文初稿时,熊谢微的英文表达比较中式,无法准确表述研究的亮点。为了克服这个缺点,她熬更守夜地看相关论文,学习别人的语言组织方式。
数十篇发在Nature、Science上关于人工智能神经网络的论文,被熊谢微拿来“硬抠”,逐字逐句地学句式表达。
“要如何向别人更好地展示我们的idea,完美呈现这个计算机的计算能力呢?”课题组就这个问题进行过很多次讨论,光是PPT,熊谢微就做了不下30个。
每次讨论完都会迸发出新的想法,大家也在竭力推着这个工作往更好的方向发展。熊谢微需要对每一次的讨论进行总结,并对文章做出相应的修改。
“做到这样,差不多可以结束了吧!”每当熊谢微如此暗自思忖时,结束的哨音却迟迟不来。“讨论然后修改,再讨论再修改……那段时间陷入到反复修改稿子的‘魔咒’里。”
文章从初稿到终稿,中文版、英文版,她写了有20多版。
但改得多了,不免令人感到烦躁。好在这种情绪只存活了半天,天生乐天派的熊谢微很快就能调节好心态。
“前面既然已经改了十稿、十五稿,再多改几稿又有什么呢?何况好不容易走到现在,那就把它做到更好,投到更好的期刊上面,被更多人认可。”只要熊谢微下定了决心,便不再去纠结,她向来韧劲十足,一条路坚持走到黑。
“其实,现在再回看第一版文章时,简直没法看!”熊谢微说。论文经过不断“打磨”后,终于完成了蜕变。
论文得到了上海交通大学樊春海院士的悉心指导,他是生物传感、DNA纳米技术与DNA计算及存储领域知名科学家。“这个地方应该如何体现会更好、这样说更能说服别人……樊院士会在文章旁边认真批注,这些都是帮助我们这篇文章升级的‘宝贵财富’。”裴昊说。
因为多学科交叉,被拒稿两次
万事俱备,只差一投。但是,应该投哪儿呢?课题组成员犯了难,毕竟这是一个高度交叉学科背景下的研究成果。
几经商量之下,他们投了Nature子刊Nature Nanotechnology。结果遭遇拒稿。编辑反馈的内容里对课题组所做的工作感到“印象非常深刻”,但认为研究主题与期刊定位并不匹配。
随后,课题组投到Nature子刊Nature Chemistry,再次遭遇拒稿,编辑的反馈内容与上一个如出一辙。
连续被拒两次,多少让人有点沮丧。“裴老师安慰我说,每个期刊都有自己的明确定位,我们的工作其实也得到了他们的肯定,只是他们有对自己期刊标准的考量。”熊谢微说。
这个工作除了涉及到DNA纳米技术、生物、化学外,还涉及机器学习方面。所以,课题组在重新找准文章的定位后,决定投Nature Machine Intelligence,估计这个期刊会感兴趣。果然,这一次再投,终于溅起了绚烂的水花。
“编辑非常喜欢我们的研究,文章很快送审,大约一个月后就收到了审稿意见。审稿人对这项研究表示欣赏,但对于跨学科的一些表达方式提出了意见,希望我们重视表达精准性的问题,让不同学科都能精准get到文章所要表达的意思。”熊谢微说。
遵照审稿人意见,课题组再次对文章进行“精雕细琢”,最终论文被接收并发表。
“要知道,选择跨学科交叉研究课题需要极大勇气,能做出成绩,在Nature子刊上发表的并不容易。熊谢微又是在硕博连读期间完成这么漂亮的工作,并在博士毕业前发表,这些都非常了不得。”裴昊表示。
做科研,要有“品味”
能接触DNA计算领域,樊春海院士是裴昊的引路人。
“当时我从他那里博士毕业后,他把我推荐到DNA纳米技术奠基人、美国纽约大学化学系杰出教授Nadrian Seeman那里去做博士后。所以我对DNA计算方面的研究情有独钟,回国任教后迅速成立课题组计划开展相关研究。”裴昊说。
这是一个非常有前景的领域,但因为学科高度交叉,需要研究者掌握多个学科的知识。
熊谢微本科学习材料化学,本科阶段在实验室做的是无机材料合成方面的工作,对于DNA纳米技术、化学测量学、分子生物学、机器学习及人工智能领域等知之甚少,所以前期吃尽了苦头。
熊谢微 受访者供图
她需要学习好几个专业的知识,前期打基础异常艰难。“当时读文献的速度非常慢,读着读着就跑出来新的知识点,让我一头雾水,我就得停下来查阅这个知识点,直到弄明白了才能接着往下学。”熊谢微说。
为了啃下计算机科学这块硬骨头,熊谢微花了很长时间恶补。据裴昊回忆,在那段时间经常看到熊谢微抱着一本厚厚的机器学习书籍,学起来几乎废寝忘食。
“樊院士总说做科研需要有‘品味’,一定要做挑战性大、前沿的研究。”裴昊说,这给了大家坚持下去的动力和勇气。
课题启动之初,裴昊问熊谢微:“这个课题你敢做吗?有信心做成吗?”其实当时他心中是有疑虑的,毕竟这是一个高难度的大课题。结果,熊谢微的回答很坚定:“我肯定可以!”事实证明,她的确做到了。
回想这一路走来,熊谢微感慨“一切都是命运最好的安排”。
当年高考发挥失常,熊谢微刚好压着一本线进入一所“双非”学校学习材料化学。因不满现状拼命学习,她连年保持专业第一的成绩,最终获得了保送资格。之后,她经历了戏剧化的择校之路。
“在报夏令营时,因为年轻气盛,在想报的学校写明非985、211不要时,我还是抱着侥幸心理想碰碰运气,任性地只填了那两个学校,结果不出意料都没有通过筛选。”熊谢微说。
错失夏令营后,到了推免阶段。出于对上海这座城市的喜爱,熊谢微报了上海交通大学和华东师范大学,两场面试都顺利完成,但能收到谁的橄榄枝呢?她自己心里也没底。
她盘算,先收到哪个,就去哪个。结果,华东师范大学的offer先到。当她填完这个学校的推免系统,一切尘埃落定后,大概过了一个多小时,上海交通大学的录取通知也来了。
当被问及是否后悔没多等一等时,熊谢微摇摇头说,“上海交通大学大概率录取我的会是无机化学专业,并不是我的兴趣点。而我在裴老师课题组是开启新征程,在一个新兴领域挑战不可能。裴老师尊重我们的科研思维,给了一定的宽度和广度去施展才华,拓展思想的极限。几年下来,感觉自己真的成长得特别快,收获太多,所以我一点都不后悔!”
论文链接:
https://www.nature.com/articles/s42256-022-00502-7
,