nature发布的125个问题(Nature通讯走向进化的生物工程)(1)

导语

过去几十年中,人们在生物工程领域取得了革命性的进展,甚至能够设计、创造具备特定功能的生命系统。然而,当前设计理论忽略了生命系统区别于其它工程对象的根本属性——可进化性,这限制了生物工程的进一步发展。近日发表于Nature Communications的文章提出一种进化型(evotype)的设计理论框架,综合考虑基因变异、功能表达以及自然选择这三种因素的相互作用,将生命系统的进化潜力具象化,并讨论了刻画及塑造进化型的工具。进化型的概念不仅能够应用于生物领域,还可能对自适应技术提供启发。

nature发布的125个问题(Nature通讯走向进化的生物工程)(2)

论文题目:

Towards an engineering theory of evolution

论文地址:

https://www.nature.com/articles/s41467-021-23573-3

进化型的定义及作用

进化型是生命系统进化倾向的集合,类似于基因型(genotype)及表现型(phenotype)分别是生命系统基因和特征的集合。与传统设计中将设计目标作为设计过程终点不同,进化型设计框架考虑了生命系统的可进化性,将设计目标(design type)作为系统一系列潜在进化方向的起点。

对进化型的设计可以使生命系统具备进化稳定性(系统表达的功能不受进化影响)或可进化性(系统可朝指定表现型进化或环境适应能力强)。研究者可以通过序列空间中围绕设计目标的景观图描述基因变异、功能表达及自然选择的相互作用,从而对进化型进行设计。

nature发布的125个问题(Nature通讯走向进化的生物工程)(3)

图1. 进化型及其关键部分。

a.进化型被具象为围绕设计目标的景观图,fitneity(适应度与效用值的组合)作为平面序列空间的垂直轴,变异概率分布以不同的灰度叠加于序列空间网格。b.投影至序列空间的变异概率分布,表示以设计目标为起点,通过变异探索给定序列空间的可能性。c.将功能空间视为离散(顶部),左侧序列空间网格具有进化稳定性,右侧序列空间网格具有可进化性。将效用值空间投影至一维序列空间,曲线下的颜色表示与该序列空间相关的功能。d.将适应度与效用值合成得到fitneity关于序列空间的曲线

基因变异

基因变异及重组并不是随机的,变异的类型及概率受生化过程约束,因此系统潜在进化方向也受限。可以用变异操作集(variation operator set)描述潜在进化方向,该集合包含了生物系统中所有可能发生的变异。集合中的每种变异操作都有相应的概率分布,以描述设计目标发生该变异时到达给定序列的概率。集合中所有变异的概率分布叠加后形成完整概率分布。

基因变异的控制手段十分丰富,可以通过添加、移除或调节变异操作以调整变异概率分布,也可以利用基因位点特异重组对基因变异进行大规模控制。结合各种生化手段,最终可能达成变异操作集的精准设计,从而生成复杂的基因变异组合。

功能表达

功能表达指基因型到功能空间(function space)的映射,功能(function)指设计者指定的属性或行为,可以是颜色、尺寸等物理特征,也可以是多种属性的组合。基因型通过基因表达及发育产生表现型,尽管过程中的随机性及约束导致两者并不存在明确的对应关系,但该映射仍存在一定的统计结构。而表现型所表达的特征会影响到功能,故从基因型到功能空间的映射,即功能表达,是进化型的重要部分。

效用(utility)描述了生命系统达成指定功能的程度,传统设计的设计过程就是将设计目标的效用值最大化的过程。但在进化型的设计框架中,设计目标周围的景观图结构也很重要,需要关注当序列空间变化时,效用值的变化是否剧烈,这决定了系统的进化稳定性及可进化性。

尽管当前对于功能表达的理解有限,但仍有些许一般性的规律适用于设计各类生命系统,包括主流表现型、冗余、模块化/规则化/层次化、环境鲁棒性、参数空间设计等。

自然选择及人工选择

选择为原本随机的基因变异指引了方向,使其爬向适应度高峰。对于生物系统,选择分为自然选择与人工选择(即设计过程),前者影响繁殖适应度,后者影响效用,了解适应度与效用两者的相互作用对进化型设计很重要。如果效用和适应度之间存在冲突,那么自然大部分情况下会排斥人为设计,如果两者高度关联,则设计相对稳定。

因此生物工程师的目标就是将设计目标的fitneity(关于适应度与效用的函数,具体函数形式视情况而定)最大化。若需提升进化稳定性,则可限制自然选择的影响,使得fitneity在序列空间中分布平缓;若需提升可进化性,则要使适应度和效用高度相关,使得序列空间中出现峰值。

进化型的总结与展望

在以进化的视角设计生命系统时,需同时考虑基因变异、功能表达以及自然选择三种因素的相互作用,并利用现有手段刻画、塑造进化型。然而,进化型的数据量随着系统复杂度增加而急剧增长,急需同时测量细胞多样特征的实验方法以及有关数据采样的理论,而另一种与此平行的需求则是开发足够全面的计算模型,以促进对于进化过程机理性的理解,从而指导进化的设计。

nature发布的125个问题(Nature通讯走向进化的生物工程)(4)

图2.塑造景观图以设计生命系统

张澳 | 作者

邓一雪 | 编辑

商务合作及投稿转载|swarma@swarma.org◆ ◆ ◆

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

,