如果请你为一场超算竞赛设计考题,你会出什么题?
2025 ASC世界大学生超级计算机竞赛给出的题目是——任务一(AlphaFold3赛题):要求参赛队伍基于组委会提供的氨基酸序列,在不同计算平台上运行和优化AlphaFold3结构预测代码;
任务二:RNA甲基化修饰位点检测,要求参赛队伍对RNA分子上一种特殊的化学修饰(m5C)的位点检测的计算流程和性能进行优化。
其中,AlphaFold是2024年诺贝尔化学奖的获奖成果,通过人工智能技术给蛋白质结构预测带来了革命性的飞跃;mRNA疫苗技术是2023年诺贝尔生理学或医学奖获奖成果,核苷碱基修饰的发现促成了mRNA疫苗诞生。
1月15日,2025 ASC世界大学生超级计算机竞赛在北京启动,人工智能如何改变科技进步和产业变革的范式?又对未来人才培养带来了哪些机遇与挑战?光明网记者采访了相关领域专家。
AI驱动生命科学研究新范式
众所周知,AI成为2024年诺贝尔奖最大的赢家。有一个AI大模型,它能准确预测人体中上亿个蛋白质的结构,而且,其精准性达到了冷冻电子显微镜的观测水平——它就是Alphafold,谷歌旗下公司DeepMind创建的基于深度学习的人工智能测序式模型。
中国科学院北京基因组研究所研究员刘肇祺指出,“在技术革命的推动下,生命科学研究已经进入一个需要依赖计算数据驱动的全新阶段。”
他以肿瘤治疗为例指出,“从传统的治疗手段,比如手术切除、放化疗、到靶向治疗和免疫治疗,癌症病人的死亡率在一定程度上持续降低。这些治疗手段的不断进步,实质上源自于观测技术和测序技术的革新,导致了我们对癌症机制认识维度的不断提升来决定的。新一代的测序技术产生了海量的癌症多组学数据,为我们更加深入地观察和理解肿瘤提供了前所未有的视角和机遇。”
蛋白质设计新技术让人类有能力去挑战任何类型的靶点,为人类攻克各类疾病带来希望。在这个过程中,深度学习和人工智能起到了引领性的作用,AlphaFold的诞生改变了传统的认知,颠覆了以往靠蛋白质结晶那种费时费力的科研范式。
据统计,已知氨基酸顺序的蛋白质分子有1.8亿个,但三维结构信息被彻底看清的还不到0.1%。同时,设计蛋白质并非易事,假设要设计一个由100个氨基酸组成的蛋白质,每一种氨基酸又有20种可能,那么氨基酸序列总数高达20的100次方。
AlphaFold3 的出现代表了人工智能科学向前迈出的重要一步。百图生科技术副总裁张晓明表示,过去生命科学领域积累了海量的多组学未标注数据。随着大模型的出现,有了预训练方式,让我们得以对这些未标注数据进行挖掘,带来了从模型训练到蛋白质设计的范式变化。
他也提到,生命科学+AI具有广阔的发展空间,但是从基础大模型到产业最终落地,中间还有很长的路要走,这条路充满挑战。
“AI+X”对未来人才培养的启示
“AI for Science铺天盖地,虽然大学里有人工智能的课程,但只是简单的模型、算法,跟实际应用差别很大,可能有巨大的鸿沟。”ASC竞赛组委会委员刘羽告诉记者,在“AI+X”的背景下,教育领域存在知识老化的问题,对高校提出了很大挑战。
ASC竞赛可以搭建一个学习交流的平台,让同学们知道在学校里学的基础知识,比如AI背后的数学逻辑是怎么起作用的,又是怎么和产业界和科学界结合起来的。“无论在科研上,还是在实际的工业生产和应用上,ACS起到了推动应用落地的作用。”
刘羽强调,人工智能很重要,落地方向很多,但是万变不离其宗的是它的基础——数学、物理。“如果只看到现在人工智能辉煌灿烂的成果,而忽视了科学的‘地基’,那么它在面向应用的时候可能是不牢固的,只知其一不知其二。”
他建议同学们应加强基础科学的学习,而不仅仅是挂在口头的“人工智能”。要把人工智能背后底层的数学物理知识扎牢扎实,走到哪里都不怕。
张晓明认为,现在企业里解决的问题,已经与行业和国际接轨,需要快速学习行业前沿问题,并在此基础之上提出更底层的创新,才能在竞争中占据一席之地。从企业视角来看,快速学习能力、勇于创新的精神,以及对交叉学科的认知探索,会成为下一代科技领军人物比较强的特质。
麦肯锡最新报告显示,到2030年,中国对AI专业人才的需求预计将达到600万,而人才缺口可能高达400万。AI人才培养的重要性不言而喻。作为全球规模最大的超算竞赛,ASC以科技竞赛为手段、以前沿应用为导向,持续推动青年人才培养。
作为ASC25总决赛东道主,青海大学计算机学院院长翟季冬教授表示,ASC竞赛有几个重要特点,包括强实践、强交叉、强创新。他认为,此次大赛总决赛选址青海大学,将对青海绿色算力发展起到促进作用,也是对青海大学计算机人才培养的认可和激励。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。