多组学分析定义线粒体蛋白功能:多组学分析定义线粒体蛋白功能(1)

撰文 | 望夜

线粒体是真核细胞代谢和产能的中心。目前认为,线粒体很可能源于一种远古变形菌与真核祖先的一次内共生事件【1】,并演化至今。如今,线粒体中仍然带有其原核祖先的基因组残留,如人源线粒体可编码13种蛋白,而其他组分蛋白则由核基因组编码,它们可能是在超过10亿年的漫长进化中逐渐由线粒体基因组迁移或添加到核基因组中去的。

经过数十年的系统研究,科学家现已建构出线粒体核心蛋白组分,并将这些蛋白的功能障碍与超过150种不同疾病联系起来。但是仍有数百种线粒体蛋白的特征缺乏认识或完全未知,同时约有40%的线粒体相关疾病的分子机制未知,严重阻碍这些疾病的诊断和药物开发,使相关病人长期处于无药可用的状态。

为建立一个完整的人源线粒体功能谱,2022年5月25日,华盛顿大学医学院的David J. Pagliarini课题组与Morgridge研究所的Joshua J. Coon课题组合作在Nature杂志发表题为Defining mitochondrial protein functions through deep multiomic profiling的研究文章,利用基于质谱的多组学技术分析超过200株经CRISPR介导的单倍体HAP1细胞敲除株,获得细胞对线粒体扰动的深度分析并提供蛋白功能的机制认知。

多组学分析定义线粒体蛋白功能:多组学分析定义线粒体蛋白功能(2)

本文使用的方法基于Pagliarini课题组此前发表的一种整合系统生化方法【2】,通过改进高通量定量质谱使其应用于酿酒酵母中线粒体未知蛋白(MXP)的功能研究【3】。在本文中,作者进一步优化该方法,并用于203株人源HAP1细胞株的分析,它们均已通过CRISPR-Cas9系统敲除掉核染色体中的线粒体蛋白编码基因,包括50个编码MXP,及66个编码功能被部分揭示的哨兵蛋白,后者大多对应某项人类疾病。

作者监测每个细胞株的生长速率,并使用高分辨率质谱进行分析,总计进行约3200次气相色谱-和液相色谱-质谱分析(图1),产生出约8.3m的定量数据。对每一个细胞株,作者鉴定出8433种蛋白、3563种脂质和218种代谢物。通过对多组学数据进行简单分子中心分析,可以验证蛋白已知的生物学功能并提示其潜在的新功能。例如,敲除脯氨酸从头合成中的关键酶ALDH18A1必然导致脯氨酸不足;但当敲除线粒体NAD激酶NADK2时,也会导致相似的脯氨酸缺乏。类似地,脂质数据显示,缺乏TAZCPT2的细胞中无意外地分别出现心磷脂和酰基肉碱的改变;但在线粒体融合调节蛋白MFN2缺失及线粒体接触位点和嵴组织系统成员(MICOS)或PPTC7敲除的细胞中,也观察到类似改变。上述发现强调线粒体膜与脂质代谢过程中的互作应予以重视。

多组学分析定义线粒体蛋白功能:多组学分析定义线粒体蛋白功能(3)

图1 本研究的实验流程概览

蛋白质组数据还可用于发现新生物学机制。一个最突出的例子就是对推测的锌离子转运蛋白SLC30A9的分析。作者发现,敲除SLC30A9导致线粒体中核糖体和氧化磷酸化蛋白大量丢失。近期的冷冻电镜研究显示线粒体核糖体存在罕见的锌离子结合基序,参与稳定结构及其与亚基的互作【4】。相对应地,作者发现在SLC30A9敲除细胞株中,全部6种线粒体DNA编码的氧化磷酸化亚基蛋白的含量均显著下降,其作用等效于线粒体核糖体哨兵蛋白MRPS22敲除。作者进一步通过免疫杂交验证上述分析结果。结合前期研究基础【5-6】,作者断定SLC30A9是一个锌离子相关转运蛋白,在线粒体核心生理过程中发挥关键作用。

由于许多诊断为线粒体功能紊乱的病人常出现辅酶Q或线粒体复合物ICI)缺失,作者接下来重点关注数据中与两者相关的蛋白。首先是辅酶Q相关缺失,作者锁定PIGY上游开放阅读框(PYURE),近期研究发现其参与线粒体修复【7】,但其余信息未知。作者发现,PYURE敲除株中的二氢乳清酸水平提高,这需要辅酶Q将其转化为乳清酸。有趣的是,当作者检索CI缺失的相关蛋白时,PYURE也位列榜首,提示其可能参与桥接相关生理过程。

为进一步确定PYURE与这些代谢过程的联系,作者接着分析PYURE敲除细胞株的全蛋白组结果,发现三种辅酶Q相关蛋白(COQ3、COQ5、COQ7)和三种CI组装因子(AF3、AF5、AF8)明显下降。另有一些CI亚基也出现减少,尤其是参与组成辅酶Q结合的CI Q模块的亚基。此外,作者还在HEK293细胞中验证了上述作用,同时排除上述现象是由位于PYURE同一多顺反子上的PIGY驱动的可能。进一步地,作者回顾此前研究结果【5】,发现PYURE仅与AF5和COQ5两种蛋白互作,而后两者又与AF8及其他辅酶Q蛋白互作,它们都属于S-腺苷甲硫氨酸依赖的甲基转移酶(SAM-MT)家族,提示PYURE通过其Trm112样结构域选择性地结合该家族的某些成员。通过免疫共沉淀和差示扫描荧光,作者确认PYURE可以直接结合AF5,且结合位点位于其Trm112样结构域;进一步还确认PYURE结合AF5并不影响其底物结合位点或催化能力,而是通过稳定其结构从而延长其半衰期。因此,作者认为PYURE通过相互连接的CI和辅酶Q通路结合并稳定SAM-MTs,提议将其重命名为NDUFAFQ。

接下来,作者希望探求PYURE是否存在与线粒体相关疾病间的联系。作者找到一位出生时患有代谢性酸中毒的儿童,但其父母及另一个孩子则未患病。作者通过无偏的全外显子测序分析,锁定PYURE第二个外显子中的一个移码突变是唯一可能的遗传因素,患者的一个等位基因出现突变。由于无法直接获得患者的细胞,作者通过工程学手段将将该突变引入HAP1细胞中,发现带有该突变的细胞十分接近PYURE敲除株的情况,即辅酶Q和CI相关蛋白出现大量丢失;而且纯化后的PYURE突变体对AF5的亲和力明显降低。作者因此认为该PYURE突变很可能就是这一疾病表型的分子病因。这个例子说明,MITOMICS数据可以为线粒体中孤儿蛋白的功能解析和寻找某些罕见病病因提供助力。

MITOMICS数据还能提供什么信息?作者认为可用于为MXP蛋白确定功能。作者利用适于高维度数据可视化的t-领域嵌入分析(t-SNE)对数据进行深度分析,发现氧化磷酸化和线粒体核糖体相关蛋白的集群,其中还包括天冬氨酸、磷脂酰胆碱及一些未知蛋白,如MXP C16orf91、C18orf21、GTPBP8,暗示这些蛋白以某些尚未阐明的方式参与相关通路。进一步延伸这种关联推定分析,作者鉴定出一系列MXP的功能,如DHRS4可桥接线粒体和过氧化物酶体中的脂代谢,C14orf159在丙酰辅酶A代谢中起作用,等等。此外,作为补充,作者还对集群外的离散点进行分析。主要是针对那些仅在某一种敲除株中变化显著的分子(包括蛋白、脂质和代谢物),发现多个基因-分子间的相互关系,例如MXP RAB5IF与TMC01间存在强相关性。蛋白质组数据显示,在RAB5IF敲除株中TMC01显著且特异性地减少,并经western blot确认;TMC01敲除株中,RAB5IF也同样减少。

目前RAB5IF与TMC01的确切功能仍然是模糊的。近期研究显示TMC01是一种线粒体蛋白【8】,也是一种内质网(ER)易位子【9】或一种ER通道,通过外排防止ER出现钙离子过载【10】。但本文作者在RAB5IF敲除株响应thapsigargin时未能观察到钙离子释放出现变化。RAB5IF近期被注释为线粒体呼吸链组装因子【11】,但作者未能在敲除株中观察到呼吸链蛋白的减少。尽管存在上述差异,比较公认的是TMC01的突变会导致脑面胸发育异常(cerebrofaciothoracic dysplasia),又称颅面畸形、骨骼异常和智力低下综合征(CFSMR)【12】。而由于前述RAB5IF与TMC01的强相关性,作者推测RAB5IF的突变可能也会导致一些病因不明的CFSMR。

通过分析前述报道中病因未名的家族的测序数据【12】,作者鉴定出11个差异纯合区域,其中就包括位于20号染色体上的RAB5IF所在区域。测序显示RAB5IF第一个外显子存在一个纯合的无意突变c.75G>A(p.Trp25*),该突变可能会导致蛋白过早被截短;而患者家中其他5位无症状的成员则不带有该纯合突变,但有两位唇/腭裂的家庭成员在该位点存在杂合突变。为进一步分析该突变的疾病发生,作者使用患者样品建立起成纤维细胞培养物,确认细胞中RAB5IF和TMC01缺失。向上述细胞中转入野生型RAB5IF-GTP明显恢复TMC01的表达水平。由此确证,RAB5IF的缺陷是导致该类病人临床表现的病因。

回顾本文,作者通过基于质谱的多组学分析手段深入研究线粒体相关蛋白的新功能,获得系列发现:PIGY上游开发阅读框(PYURF)是一个S-腺苷甲硫氨酸依赖的甲基转移酶伴侣,可同时支持呼吸链复合物I组装和辅酶Q合成,其突变可能导致一种此前未知的多系统线粒体障碍。确认SLC30A9是一种锌离子转运蛋白,并建立起其与线粒体中核糖体和氧化磷酸化完整性的联系。确认RAB5IF是第二种突变后可导致脑面胸发育异常的基因。本文所获得的数据可为目前尚缺乏有力实验证据支持的多种线粒体孤儿蛋白提供可能的生物学功能提示,发现线粒体功能障碍时丰富的细胞特征可用于线粒体疾病的遗传诊断。上述数据现在可通过MITOMICS.app进行在线交互(资源网址https://www.mitomics.app)。

原文链接:

https://doi.org/10.1038/s41586-022-04765-3

制版人:十一

参考文献

1、 Lane, N. & Martin, W. The energetics of genome complexity. Nature 467, 929–934 (2010)

2、 Sung, A. Y., Floyd, B. J. & Pagliarini, D. J. Systems biochemistry approaches to defining mitochondrial protein function. Cell Metab. 31, 669–678 (2020)

3、 Stefely, J. A. et al. Mitochondrial protein functions elucidated by multi-omic mass spectrometry profiling. Nat. Biotechnol. 34, 1191–1197 (2016)

4、 Greber, B. J. & Ban, N. Structure and function of the mitochondrial ribosome. Annu. Rev. Biochem. 85, 103–132 (2016)

5、 Floyd, B. J. et al. Mitochondrial protein interaction mapping identifies regulators of respiratory chain function. Mol. Cell 63, 621–632 (2016)

6、 Gopalakrishna, S. et al. C6orf203 is an RNA-binding protein involved in mitochondrial protein synthesis. Nucleic Acids Res. 47, 9386–9399 (2019)

7、 Arroyo, J. D. et al. A genome-wide CRISPR death screen identifies genes essential for oxidative phosphorylation. Cell Metab. 24, 875–885 (2016)

8、 Zhang, Z. et al. Molecular cloning, expression patterns and subcellular localization of porcine TMCO1 gene. Mol. Biol. Rep. 37, 1611–1618 (2010)

9、 McGilvray, P. T. et al. An ER translocon for multi-pass membrane protein biogenesis. eLife 9, e56889 (2020)

10、 Wang, Q. C. et al. TMCO1 is an ER Ca2 load-activated Ca2 channel. Cell 165, 1454–1466 (2016)

11、 Moutaoufik, M. T. et al. Rewiring of the human mitochondrial interactome during neuronal reprogramming reveals regulators of the respirasome and neurogenesis. iScience 19, 1114–1132 (2019)

12、 Alanay, Y. et al. TMCO1 deficiency causes autosomal recessive cerebrofaciothoracic dysplasia. Am. J. Med. Genet. A 164A, 291–304 (2014).

(可上下滑动阅览)

转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。

,