机器学习现在正在帮助研究人员分析陌生细胞的组成,这可能会导致在癌症和其他严重疾病的治疗中产生更加个性化的药物。
滑铁卢大学的研究人员开发了 GraphNovo,这是一个新程序,可以更准确地了解细胞中的肽序列。肽是细胞内的氨基酸链,是与 DNA 或 RNA 一样重要且独特的构建模块。
在健康人中,免疫系统可以正确识别不规则或外来细胞(例如癌细胞或有害细菌)的肽,然后针对这些细胞进行破坏。对于免疫系统陷入困境的人来说,免疫疗法的前景是致力于重新训练他们的免疫系统来识别这些危险的入侵者。
“科学家想要做的是对正常组织和癌组织之间的这些肽进行测序,以识别差异,”Cheriton 计算机科学学院的博士生毛泽平说,他在李明博士的指导下开发了 GraphNovo。
对于以前可能从未分析过的新疾病或癌细胞来说,这种测序过程尤其困难。虽然科学家在分析以前研究过的疾病或生物体时可以利用现有的肽数据库,但每个人的癌症和免疫系统都是独一无二的。
为了快速构建陌生细胞中的肽谱,科学家们一直在使用一种称为从头肽测序的方法,该方法使用质谱法快速分析新样本。此过程可能会使序列中的某些肽不完整或完全缺失。
利用机器学习,GraphNovo 通过用肽序列的精确质量填充这些间隙,显着提高了识别肽序列的准确性。这种准确性的飞跃可能会给各个医疗领域带来巨大好处,特别是在癌症治疗和针对埃博拉和 COVID-19 等疾病的疫苗研发方面。由于滑铁卢大学致力于技术与健康之间的结合,研究人员取得了这一突破。
如果我们没有足够好的算法,我们就无法建立治疗方法。目前,这一切都还只是理论上的。但很快,我们将能够在现实世界中使用它。”
毛泽平,切瑞顿计算机学院博士生