成都超算中心最新成果:蛋白质结构预测模型国产化
蛋白质(Protein)是生物构成的重要基本物质,由各种氨基酸组成,其排列方式和位置的差异使得其种类极其繁多、结构复杂,而这复杂的特性也就注定了研究蛋白质的路径困难重重。
面对数量庞大,结构复杂的蛋白质种类,为了能更快、更精准地预测出蛋白质结构,国家超算成都中心(以下简称:成都超算中心)联合百度,依据国际公认的开源项目Alphafold2,研发出国产化DCU蛋白质预测模型,从而让人类有机会从更深层次诠释生命体的构成和运作变化规律,全面揭示生命运行、发展机制,激发生物科学、药物研发、合成生物学等方面的发展,为我国生命科学发展带来了更多新的可能。
面对海量的蛋白质结构信息,传统实验方法至今仅能解出10万个蛋白质结构,但由于氨基酸序列多达10亿,传统方法解出一个蛋白质的结构需要耗时数月甚至数年时间,时间成本巨大。为弥补传统实验方法的不足,加速生命科学发展,实现核心技术自主可控,自2021年,成都超算中心与百度合作,基于百度飞桨螺旋桨PaddleHelix平台,依据国际公认的开源项目Alphafold2,进行了蛋白质结构预测推理计算的国产化开发,自主研发出国内特有的DCU生物计算-蛋白质结构预测Alphafold2模型。
该项目负责人表示:“在传统的研究中,解析蛋白质结构及互作分析,需要进行X-射线衍射、冷冻电镜、酵母双杂等实验,工作量大,过程繁琐。成都超算中心搭载的Alphafold2解决了蛋白质结构精准预测的难题,加快了生物学研究。”
在Alphafold2模型中,平时需要花费数月、数年的才能完成的事情,只需要几天就可以完成。Alphafold2不仅加快了基础研究效率,还为后续深入的研究工作提供了丰富的数据资料。
此外,为实施农业科技增值行动,提高粮食生产的科技含量,四川农业大学农学院联合成都超算中心进行了小麦bHLH转录因子PGS1调控种子发育影响产量的分子机制解析,为将来培育高产高质小麦材料提供理论依据和备选基因。
成都商报-红星新闻记者 彭祥萍
(责任编辑:欧云海)