我国AI药物筛选获重大突破:千亿级分子库实现秒级检索
我国AI药物筛选重大突破!GalaxyVS平台实现千亿级分子库秒级检索,将传统数月筛选压缩至数十秒,突破药物研发'双十'困境。
据媒体报道,国家超级计算天津中心首席科学家孟祥飞与清华大学智能产业研究院兰艳艳教授共同领衔的AI生物医药团队,正式发布了面向超大规模药物发现的人工智能虚拟筛选平台——GalaxyVS。
该平台依托新一代天河超算系统,在全球范围内首次实现了对近千亿级可合成化合物空间的秒级虚拟筛选,将传统需数月甚至数年的药物早期筛选过程压缩至数十秒。
长期以来,创新药物研发面临“双十”困境——耗时超十年、投入超十亿美元。其中,从海量化合物中筛选出能靶向特定蛋白的活性分子尤为关键。
传统实验筛选成本高、周期长,常规分子对接方法计算效率有限且假阳性率较高。随着可合成化合物库迈入千亿乃至万亿级规模,现有虚拟筛选技术在算法、算力、存储和工程化能力上均面临严峻挑战。
项目团队核心成员、国家超级计算天津中心李培顺博士介绍,GalaxyVS以清华大学智能产业研究院团队前期发表于《科学》杂志的DrugCLIP模型为基础,将蛋白口袋与小分子映射到统一向量空间,把传统依赖逐一对接的蛋白—配体匹配问题,转化为可大规模并行执行的高维向量快速检索问题,从而从根本突破了传统分子对接在速度和规模上的限制。
在算力层面,GalaxyVS充分发挥了新一代天河超算的大规模并行能力。团队基于YH-Torch智能计算框架,对DrugCLIP模型进行国产异构算力适配与深度优化,替换传统CUDA/GPU依赖,使近千亿级分子编码从算法设想真正落地为可稳定运行的超算工程。
在检索环节,系统引入磁盘原生图索引框架,并结合定制化内存预加载机制,有效解耦共享存储瓶颈与计算执行过程,为超大规模虚拟筛选提供了关键吞吐能力。
实测数据显示,系统利用千级DSP节点完成全模式生物物种约400万个靶点口袋的高效编码,并在2万多个计算节点上开展超大规模分子检索。
单次检索千亿分子库可在数十秒内完成,平均单个靶点口袋检索用时不到1秒。系统日吞吐量约达16万亿次分子对接,比当前国际最先进的超算纪录高出六个数量级。
未来,GalaxyVS有望进一步拓展至跨物种蛋白—配体互作图谱构建、大规模开放数据集建设以及AI驱动药物发现基础设施构建,推动药物研发从经验试错走向数据驱动、从局部筛选走向全局探索、从单一模型走向系统工程。

- 1价值2000元补偿,《洛克王国》主策划道歉!打感情牌还是诚恳反思?
- 230年后重新回归!《遗忘传说》重置版首次开放试玩
- 3开放世界ARPG《龙之剑:觉醒》举办答疑活动
- 4AI外挂不读内存不会被封?腾讯重拳出击:封号10年、永久拉黑
- 5这可能是国产MMO最接近“角色扮演”本源的一次
- 6相爱相杀十年!《贪玩蓝月》和《传奇》迎来世纪和解
- 7《王者荣耀世界》S1赛季来了!新英雄实装,性转功能上线,看点满满
- 89年老网游宣布停更,17万玩家请愿开发续作!呼吁最后更新日登录游戏
- 9原价128元永久畅玩!《暗黑破坏神4》宣布国服免费领延长至8月4日
- 10这款游戏众筹14年,累计筹集超10亿美元,却仍旧处在测试阶段?

