剑桥大学的科学家开发出了一种蛋白质图谱,描述了它们在人体细胞内的行为。该工具可用于寻找与蛋白质行为异常相关的疾病的起源,例如痴呆症和多种癌症。
该图谱发表在《自然通讯》杂志上,研究人员借此发现了细胞内负责一系列重要身体功能的新蛋白质。研究小组重点研究了细胞中一种名为凝聚物的液滴状部分,它是蛋白质聚集和自我组织的枢纽。这些枢纽也是疾病过程开始的关键部位。
该论文提供了预测结果,因此全球各地的研究人员可以探索他们感兴趣的蛋白质目标和任何周围的凝聚系统。
领导这项研究的托马斯·诺尔斯 (Tuomas Knowles) 教授说:“通过该模型,我们发现了生物学中无膜区室的新成分,并发现了其功能背后的新原理。”
细胞由精心组织的分子组成,它们自我组织的一种方法是聚集在凝聚体中。这种聚集体非常微小,位于细胞内。这些凝聚体是使活细胞运转的基本机制的一部分。
到目前为止,我们还没有一份关于哪些蛋白质结合形成哪些凝聚物的综合图谱,但在我们的工作中,我们提供了第一张这样的图谱。”
托马斯·诺尔斯教授
指导细胞内蛋白质的规则尚不完全清楚,因此研究小组决定建立这幅图谱来预测哪些蛋白质在凝聚物内相遇。
“这项研究的动机是希望了解蛋白质凝聚物的全部复杂性,并比科学家迄今为止的研究更深入,”这项研究的第一作者,错误折叠疾病中心的博士后研究员卡迪·利斯·萨尔博士说。
研究人员使用了大型数据库,例如 StringDB 和 BioGRID,其中包含有关细胞许多方面的数据,以及有关单个凝聚物的更深入的案例研究。
尽管信息复杂、庞大且难以比较,但人工智能的强大功能让科学家能够整合这些数据。以前的研究主要关注少数几种蛋白质,而该图谱可以描绘出细胞的全貌。
“通过这个图谱,我们可以预测细胞中每种蛋白质的确切位置以及与哪些其他蛋白质相互作用,”Saar 评论道。“我们希望这能为研究人员创造机会,并为干预与异常凝聚物形成相关的疾病开辟新的可能性。”
人工智能发现模型细胞中存在以前从未观察到的蛋白质。如果现在在实验室中发现这些蛋白质,那么这是一个很好的指标,表明人工智能是准确的。
“在我们的研究中,我们发现凝聚物中存在以前从未见过的蛋白质。这些蛋白质参与人体的重要功能,例如脂肪的分布、细胞内肌动蛋白的产生以及新蛋白质的产生。在我们用作训练集的先前研究中,没有检测到这些蛋白质。
“我们希望这些数据能够让我们对凝聚物的生物学作用以及凝聚物形成背后的生物物理驱动因素有新的发现。”