在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战,如同在没有地图的荒野中寻找路径。
10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的一次关键转折,有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革。
据悉,Genos的相关成果已发表于国际学术期刊GigaScience。
文章截图(https://doi.org/10.1093/gigascience/giaf132)
广度、深度、效率兼具,一款真正具有生产力的基因组大模型
要读懂“生命之书”,首先需要一本完整的“字典”。
基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。
基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。
如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。
为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。
更重要的是,Genos在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合021科学基础模型后,准确率更是高达98.3%,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平(SOTA),证明了其卓越且全面的能力。
共有、共为、共享,让前沿科技触手可及
一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。目前,全球基因组学领域尚无一款能够被开发者和研究者直接部署、用于下游应用的百亿级人类基因组基础大模型。而Genos的发布,则填补了这一空白。它是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为无限的下游应用创新提供了坚实的地基。
今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos与生俱来的核心理念。
发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台依据MIT开源协议公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。
另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。
目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。
在临床应用领域,Genos模型与华大已发布的GeneT深度思考模型结合,能为遗传疾病诊断提供专家级的多模态解读。而在个人健康领域,目前Genos模型已整合进BGE平台,将赋能个人基因组报告解读,把复杂的生命代码翻译成每个人都能读懂的、个性化的健康“说明书”。
值得一提的是,Genos的诞生,源自一次大胆的跨界融合与人才培养实践。该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,正推动生命科学研究从“数据挖掘”迈向“智能涌现”的新纪元。也正是这种跨界碰撞,为Genos的颠覆性创新注入了最核心的动力。
此次Genos的发布,标志着一个新时代的开启:一个基因组智能分析的时代,一个人人都能读懂自己生命天书的时代,正加速到来。为持续推动模型迭代,华大生命科学研究院近期还联合国内外多家单位共同发起了“十万长读长大人群联盟(Long100K Genomes Consortium)”和“百亿细胞计划(10BC)”两项大科学计划。其中,“十万长读长大人群联盟”将依托最新的Cyclone长读长测序技术,完成10万人的“端粒到端粒”级别完整基因组测序,为基因组大模型提供高质量的训练数据。而“百亿细胞计划”则将依托Stereo-Cell超高通量细胞组学技术,完成百亿细胞测序,助力基因和细胞的融合大模型开发。从基因组到多组学,一个更强大的生命科学基础模型正在孕育之中。
为你推荐
资讯 第12批国家药品集采开始信息预填报,共涉及76个产品
5月15日,国家组织药品联合采购办公室发布《关于开展国家组织药品集中带量采购相关药品信息预填报工作的公告》,标志着第12批国家组织药品集中带量采购开始拉开帷幕。
2026-05-16 17:30
资讯 药品试验数据保护9问?为什么中药不适用于数据保护制度? 国家药监局发布 《药品试验数据保护实施办法》
数据保护是指,符合条件的化学药品和生物制品获批上市时,国家药监局对申请人提交的自行取得且未披露的试验数据和其他数据实施保护,给予最长不超过6年的数据保护期。数据保护期...
2026-05-15 18:16
资讯 博腾股份首个欧洲基地遭诺华单方面节约
5月13日,博腾股份(300363 SZ)发布《关于对外投资进展及重大风险提示的公告》,根据公告,其位于斯洛文尼亚的研发生产基地遭到诺华公司(Novartis)的单方面解约,诺华单方要...
2026-05-15 14:43
资讯 甘李药业先后两款胰岛素产品在欧盟获批
5月14日晚间,甘李药业发布公告称,甘李药业股份有限公司及其欧洲全资子公司甘李药业欧洲有限责任公司(Gan&LeePharmaceuticalsEurope GmbH)于近日收到欧盟委员会(EuropeanCo...
2026-05-15 12:00
资讯 2026年度国家医保基金飞行检查正式全面启动
5月14日,国家医保基金飞行检查湖南现场启动会暨警示教育会在长沙召开,这标志着2026年度国家医保基金飞行检查正式全面启动。国家医保局党组成员、副局长黄华波出席会议并讲话。
2026-05-15 08:29
资讯 泰格医药实控人被立案,还拖累了哪些上市公司
5月12日晚间,国内CRO龙头企业泰格医药(300347 SZ;3347 HK)发布公告称,公司实际控制人叶小平、曹晓春收到中国证监会《立案告知书》,二人因涉嫌持股变动相关信息披露违法...
2026-05-14 18:11
资讯 诺贝尔化学奖获得者创办的AI制药公司 Isomorphic Labs 完成21亿美元B轮融资
据国外媒体消息,由谷歌DeepMind孵化、AI制药企业Isomorphic Labs完成21亿美元(约合人民币142 5亿元)B轮融资。
2026-05-14 13:29
资讯 CDE:2025年度药品审评报告
2025 年受理 16130 件技术审评类药品注册申请,以药品类型统计,中药注册申请 2723 件,化学药品注册申请10587 件,生物制品注册申请 2820 件。
2026-05-14 11:54
资讯 欧洲肥胖大会:诺和诺德Wegovy在所有绝经阶段的女性中均实现了显著减重
丹麦当地时间5月12日,诺和诺德公布数据显示,Wegovy(诺和盈)在女性肥胖症患者不同生育生命阶段中均达成了显著且一致的减重效果,涵盖绝经前阶段、绝经期和绝经后阶段[1]。绝...
2026-05-13 12:59
资讯 伊米诺康完成 2.5 亿元 A 轮融资 加速打造全球领先全人源抗体发现平台
本轮融资由维梧资本领投,高脉元航跟投,老股东熙诚金睿、泰煜投资大比例超额追加投资,资金将重点用于核心技术迭代、平台商业化落地与创新能力升级。
2026-05-13 09:58
资讯 减重之后怎么办?礼来ECO最新数据将行业视线推向“长期维持”
2026年5月13日,礼来公布SURMOUNT-MAINTAIN和ATTAIN-MAINTAIN两项后期临床研究详细结果。
2026-05-13 09:53
资讯 147亿,A股医药板块有史以来最大的年度亏损
147亿,A股医药板块有史以来最大的年度亏损。近日,A股疫苗明星企业智飞生物(300122 SZ)发布的2025年年报公布了这一“成绩”。这也是智飞生物上市以来首个亏损。
2026-05-12 20:21
资讯 恒瑞医药与BMS达成总交易额可达约152亿美元的战略与许可合作
本次合作协议共包含 4 项恒瑞肿瘤学及血液学项目、4 项 BMS 免疫学项目,以及双方依托恒瑞研发引擎与多元创新技术平台共同研发的 5 项创新项目,值得注意的是,这13在研...
2026-05-12 13:40
资讯 徐和平教授荣膺国际视觉与眼科研究协会(ARVO)金质会士(FARVO Gold)荣誉称号
近日,国际视觉与眼科研究协会(The Association for Research in Vision and Ophthalmology, ARVO)在美国丹佛召开的2026年年会上正式公布了本年度金质会士(ARVO Gold Fellow,FARVO)评选结果。
2026-05-12 13:35
资讯 中国生物技术发展中心:细胞组分及衍生物治疗新技术临床研究备案指引(第1版)
本指引适用于在我国境内开展的非以药品注册为目的的细胞组分及衍生物治疗新技术临床研究,本指引所指的细胞组分及衍生物治疗新技术不依赖完整活细胞,是指利用人自体或异体干细...
2026-05-12 10:05
资讯 迈瑞遭证监会监管六问
5月8日,中国证监会对外公布最新一期《境外发行上市备案补充材料要求》(2026年4月27日—2026年5月8日),国际司共对7家企业出具补充材料要求,其中包括已于2025年11月10日向港交...
2026-05-10 19:21







