自 COVID-19 大流行开始以来,蛋白质一直在悄悄地接管我们的生活。 我们一直生活在病毒所谓的“尖峰”蛋白的心血来潮中,这种蛋白已经发生了数十次突变,从而产生了越来越致命的变种。 但事实是,我们一直被蛋白质统治。 在细胞层面,它们几乎负责一切。
蛋白质是如此基础,以至于 DNA——使我们每个人都独一无二的遗传物质——本质上只是一长串蛋白质蓝图。 对于动物、植物、真菌、细菌、古细菌甚至病毒来说都是如此。 正如这些生物群随着时间的推移而进化和变化一样,蛋白质及其组成部分也是如此。
伊利诺伊大学研究人员的一项新研究发表在 Scientific Reports,绘制了超过 3.8 亿年的蛋白质结构域(蛋白质分子的亚基)的进化历史和相互关系。
“了解在进化过程中结构域如何以及为什么在蛋白质中结合可以帮助科学家理解和设计蛋白质在医学和生物工程应用中的活性。 例如,这些见解可以指导疾病管理,例如利用 COVID-19 病毒的刺突蛋白制造更好的疫苗,”Carl R. Woese 基因组研究所附属作物科学系教授 Gustavo Caetano-Anollés 说。伊利诺伊州生物学,该论文的资深作者。
Caetano-Anollés 有 研究了COVID突变的演变 自大流行的早期阶段以来,但该时间表仅代表他和博士生 Fayez Aziz 在当前研究中所从事的工作的一小部分。
研究人员汇编了所有分类群(包括高等生物和微生物)的数百个基因组中编码的数百万个蛋白质序列的序列和结构。 他们关注的不是整个蛋白质,而是结构域。
“大多数蛋白质由多个域组成。 这些是具有特殊功能的紧凑结构单元或模块,”Caetano-Anollés 说。 “更重要的是,它们是进化的单位。”
在将蛋白质分类到域中以构建进化树后,他们开始着手构建一个网络,以了解在数十亿年的进化过程中域是如何在蛋白质之间发展和共享的。
“我们建立了一个时间序列网络,描述了域如何积累以及蛋白质如何通过进化重新排列它们的域。 这是第一次将这种“域组织”网络作为进化年表进行研究,”Fayez Aziz 说。 “我们的调查显示,有一个巨大的不断发展的网络描述了蛋白质中的域如何相互结合。”
网络的每个链接都代表特定域被招募到蛋白质中的时刻,通常是为了执行新功能。
“仅凭这一事实就强烈表明域招募本质上是一股强大的力量,”Fayez Aziz 说。 年表还揭示了哪些域贡献了重要的蛋白质功能。 例如,研究人员能够追踪负责环境感知以及次级代谢物或用于细菌和植物防御的毒素的域的起源。
分析表明,域在蛋白质进化的早期就开始结合,但也有网络爆炸式增长的时期。 例如,研究人员描述了 1.5 亿年前域组合的“大爆炸”,这与多细胞生物和真核生物(包括人类在内的具有膜结合核的生物)的兴起相吻合。
生物大爆炸的存在并不新鲜。 Caetano-Anollés 的团队之前报道了新陈代谢的大规模和早期起源,他们最近在 追踪代谢网络的历史.
描述蛋白质进化拼凑的大爆炸的历史记录提供了理解蛋白质组成的新工具。
“例如,这可以帮助确定为什么结构变异和基因组重组经常发生在 SARS-CoV-2 中,”Caetano-Anollés 说。
他补充说,这种理解蛋白质的新方法可以通过剖析病毒疾病的起源来帮助预防流行病。 它还可以通过在爆发时改进疫苗设计来帮助减轻疾病。
参考:“蛋白质域组织网络的演变”,M. Fayez Aziz 和 Gustavo Caetano-Anollés,8 年 2021 月 XNUMX 日,科学报告。
DOI: 10.1038/s41598-021-90498-8
这项工作得到了美国国家科学基金会和美国农业部的支持。
作物科学系位于伊利诺伊大学农业、消费者和环境科学学院。