4OSud3LswzY tech.huanqiu.comarticle苹果发布轻量AI模型SimpleFold,大幅降低蛋白质预测计算成本/e3pmh164r/e3pmtmdvg【环球网科技综合报道】9月25日消息,据海外科技媒体 9to5Mac报道,苹果公司研究团队对外发布轻量级蛋白质折叠预测人工智能模型SimpleFold。该模型创新性采用流匹配方法,替代传统模型中多序列比对等复杂模块,在保障预测性能的同时,显著降低计算成本,为更多科研团队开展蛋白质相关研究创造有利条件,有望进一步推动药物研发与新材料探索进程。蛋白质折叠预测是生命科学领域的重要研究方向,精准的预测结果能为疾病机理研究、药物设计等提供关键支撑。此前,谷歌DeepMind公司的AlphaFold2、RoseTTAFold等模型虽在预测精度上取得突破,但由于依赖多序列比对、三角更新等计算密集型特定架构,模型的训练与推理过程需投入大量计算资源,较高的硬件门槛限制了其在更广泛科研场景中的应用。为解决这一痛点,苹果研究团队将目光投向流匹配技术。据悉,流匹配方法源自扩散模型,与传统扩散模型需通过逐步去噪生成目标结构不同,它能直接从随机噪声中一次性生成蛋白质目标结构,有效跳过多个去噪环节,不仅大幅减少计算量,还显著提升生成速度。目前,这一技术已在文本生成图像、3D建模等领域成功应用,其高效性得到充分验证。 为全面检验SimpleFold的性能,研究人员构建了参数规模从1亿到30亿不等的多个模型版本,并在CAMEO22和CASP14两大权威基准测试中展开评估。这两项测试覆盖模型泛化性、鲁棒性(即系统或过程在面临干扰、不确定性或异常输入时,维持功能稳定运行的能力)及原子级精度等关键维度。结果显示,SimpleFold在性能上稳定优于同类流匹配模型ESMFold,且整体表现可与顶尖蛋白质折叠预测模型媲美。具体数据表明,不依赖昂贵多序列比对和三角注意机制的SimpleFold,在CAMEO22测试中性能达到AlphaFold2、RoseTTAFold2的约95%;而参数规模更小的SimpleFold-100M版本,在保持高效计算特性的同时,性能超过ESMFold的90%。这一成果不仅验证了SimpleFold的优异性能,更证明了通用架构模块在蛋白质预测领域的可行性与竞争力。(纯钧)1758766410005环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:林梦雪环球网175876641000511[]//img.huanqiucdn.cn/dp/api/files/imageDir/80d28ea0fab693ffccc9603adfad2d59u1.png{"email":"linmengxue@huanqiu.com","name":"林梦雪"}
【环球网科技综合报道】9月25日消息,据海外科技媒体 9to5Mac报道,苹果公司研究团队对外发布轻量级蛋白质折叠预测人工智能模型SimpleFold。该模型创新性采用流匹配方法,替代传统模型中多序列比对等复杂模块,在保障预测性能的同时,显著降低计算成本,为更多科研团队开展蛋白质相关研究创造有利条件,有望进一步推动药物研发与新材料探索进程。蛋白质折叠预测是生命科学领域的重要研究方向,精准的预测结果能为疾病机理研究、药物设计等提供关键支撑。此前,谷歌DeepMind公司的AlphaFold2、RoseTTAFold等模型虽在预测精度上取得突破,但由于依赖多序列比对、三角更新等计算密集型特定架构,模型的训练与推理过程需投入大量计算资源,较高的硬件门槛限制了其在更广泛科研场景中的应用。为解决这一痛点,苹果研究团队将目光投向流匹配技术。据悉,流匹配方法源自扩散模型,与传统扩散模型需通过逐步去噪生成目标结构不同,它能直接从随机噪声中一次性生成蛋白质目标结构,有效跳过多个去噪环节,不仅大幅减少计算量,还显著提升生成速度。目前,这一技术已在文本生成图像、3D建模等领域成功应用,其高效性得到充分验证。 为全面检验SimpleFold的性能,研究人员构建了参数规模从1亿到30亿不等的多个模型版本,并在CAMEO22和CASP14两大权威基准测试中展开评估。这两项测试覆盖模型泛化性、鲁棒性(即系统或过程在面临干扰、不确定性或异常输入时,维持功能稳定运行的能力)及原子级精度等关键维度。结果显示,SimpleFold在性能上稳定优于同类流匹配模型ESMFold,且整体表现可与顶尖蛋白质折叠预测模型媲美。具体数据表明,不依赖昂贵多序列比对和三角注意机制的SimpleFold,在CAMEO22测试中性能达到AlphaFold2、RoseTTAFold2的约95%;而参数规模更小的SimpleFold-100M版本,在保持高效计算特性的同时,性能超过ESMFold的90%。这一成果不仅验证了SimpleFold的优异性能,更证明了通用架构模块在蛋白质预测领域的可行性与竞争力。(纯钧)