早在2000年,人类基因组序列草图还在制作中时,遗传学家们就开始对人类基因数目进行估算。近20年后,拥有真实数据的他们仍然无法就这一数量达成一致,这一知识差距阻碍了他们在发现与突变相关疾病上的努力。直至最近,科学家们又发布了最新数据:他们认为人类共有超过2.1万个蛋白质编码基因。
最新结果使用了数百份人体组织样本的数据,并于5月29日发布在BioRxiv预印本服务器上。它包含了近5000个以前未被发现的基因,其中近1200个携带了制造蛋白质的指令(carry instructions for making proteins)。总的来说,与先前估计的约2万个蛋白质编码基因数目相比,本次统计有所上升,总数为超过2.1万个。
DOI: https://doi.org/10.1101/332825
然而,许多遗传学家并不确信,所有新提出的基因都将经得起严密的审查。他们的批评也凸显了识别并定义新基因的难度之大。
领导本次基因数目统计的生物学家Steven Salzberg说:“人们在这方面已经努力了20年,但我们仍然没有答案。”
最终答案?
2000年,随着基因组学界对人类基因数量的争论, Ewan Birney(目前为英国Hinxton欧洲生物信息学研究所[EBI]所长)发起了基因竞赛。他在每年一度的遗传学会议上于一个酒吧里进行了第一次投注,这次比赛最终吸引了1000多名参赛者和3000美元的奖金。对基因数量的押注从超过312,000个到略低于26,000个不等,平均约为40,000个。之后,估计的范围在缩小,大致范围在19000到22000之间,但仍然存在分歧。
Source: M. Pertea & S. L. Salzberg
基因计数可以根据被分析的数据、使用的工具和剔除假阳性的标准而变化。最新的统计使用了更大的数据集和不同于先前的计算方法,以及更广泛的基因定义标准。
Salzberg的研究小组使用了来自基因型组织表达( GTEx )项目的数据,该项目对数百具死尸的30多个不同组织的RNA进行了测序(RNA是DNA和蛋白质之间的中介)。为了鉴定编码蛋白质的基因和那些在细胞中不编码但仍起重要作用的基因,他们组装了GTEx的9000亿个微小RNA片段,并将其与人类基因组对齐。
然而,仅仅因为一段DNA表达为RNA,并不一定意味着它就是一个基因。所以这个小组试图用各种标准滤除噪音。例如,他们将研究结果与其他物种的基因组进行了比较,认为远亲生物共享的序列很可能由于进化而得以保留(因为它们具有功能性),而且很可能是基因。
最终,研究小组留下了21,306个蛋白质编码基因和21,856个非编码基因,远远超过两个最广泛使用的人类基因数据库(由EBI维护的GENCODE基因组包括19,901个蛋白质编码基因和15,779个非编码基因以及由美国国家生物技术信息中心管理的数据库RefSeq列出的20,203个蛋白质编码基因和17,871个非编码基因)。
前RefSeq负责人Kim Pruitt认为,造成这种差异的原因一部分是由于Salzberg团队分析的大数据量;另外一个主要的区别是,GENCODE和RefSeq都依赖人工处理——人为查看每个基因的证据并做出最终决定,而Salzberg的小组则完全依靠计算机程序来筛选数据。
“如果人们喜欢我们的基因列表,那么也许几年后我们将成为人类基因的仲裁者。” Salzberg说。
何为基因的定义标准?
需要指出的是,许多科学家仍坚称,他们需要更多的证据才能确信这份清单的准确性。协调GENCODE人工注释的EBI计算生物学家Adam Frankish说,他和他的团队已经扫描了Salzberg团队鉴定的大约100个蛋白质编码基因。据他们评估,其中只有一个似乎是真正的蛋白质编码基因。
Pruitt的团队成员研究了Salzberg小组的十几个新的蛋白质编码基因,但没有发现任何符合RefSeq标准的基因。有些与基因组中似乎属于侵入我们祖先基因组的逆转录病毒的区域重叠;另一些属于其他重复性延伸(repetitive stretches),很少被翻译成蛋白质。
但是Salzberg认为一些重复序列可以被认为是基因。ERV3–1就是一个例子,它出现在RefSeq中,并编码在结直肠癌中过表达的蛋白质。同时Salzberg也承认,他团队名单上的新基因将需要他们自己和其他人的验证。“
最令人困惑的是基因定义的变化和不精确。生物学家过去认为基因是编码蛋白质的序列,但后来发现一些非编码RNA分子在细胞中有重要作用。这一基因判定的标准争议也解释了Salzberg计数和其他计数之间的一些差异。
重要意义
准确统计所有人类基因对于揭示基因与疾病之间的联系非常重要。Salzberg指出,不计其数的基因经常被忽视,即使它们含有致病突变。但是仓促地将基因添加到主列表中也会带来风险。一个错误的基因将会转移遗传学家对真正问题的注意力。
Pruitt补充道:”生物学是复杂的。数据库与库之间的基因数量不一致对研究人员来说仍然是个问题,人们还在寻求一个最终的答案。“
参考文献:
New human gene tally reignites debate
来源:生物探索
作者:Tierna
来源:生物探索 作者:Tierna
为你推荐
资讯 病毒“突变”不等于更强生存力——华山张文宏教授团队发现:敏感性下降,往往伴随适应性下降
玛巴洛沙韦敏感性降低的突变发生率仍然极低(0 05%),未发现典型的I38T耐药突变。
2026-01-24 12:22
资讯 箕星药业宣布成功完成D1轮2.87亿美元融资,推进口服GLP-1药物开发
1月22日消息,箕星药业有限公司(Corxel Pharmaceuticals Limited)宣布已成功完成D1轮融资,募集资金高达2 87亿美元。
2026-01-23 18:00
资讯 基因启明完成亿元天使轮融资,加码iNKT细胞疗法研发与临床转化
本轮融资由人合资本独家投资。融资资金将重点用于推进公司核心iNKT细胞药物的临床试验进程,同时加速新管线的研发拓展与技术平台升级。
2026-01-23 14:05
资讯 商务部、国家发改委、国家卫健委、国家医保局等9部门印发促进药品零售行业高质量发展的意见
鼓励符合监管要求的实体医疗机构、互联网医院与药品零售企业依托电子处方流转平台进行处方流转。鼓励建设非医保药品自费处方电子流转平台,规范和完善相关药学服务。
2026-01-23 11:04
资讯 诺和诺德聚焦零售药店体重管理服务,启动“零售科学减重生态联盟”
1月22日,诺和诺德在福州举办超越·共盈——诺和诺德零售生态伙伴大会,大会汇聚连锁零售药店管理层、临床专家、资深药师、行业智库、零售生态合作伙伴等多方力量,正式启动零...
2026-01-22 21:53
资讯 优赫得在华获批治疗既往接受过一种含曲妥珠单抗治疗方案的局部晚期或转移性HER2阳性成人胃或胃食管结合部腺癌患者
基于DESTINY-Gastric04 III期试验结果,与雷莫西尤单抗+紫杉醇相比,优赫得®可为患者带来具有显著统计学差异和临床意义的总生存期(OS)改善,两年OS率实现翻倍
2026-01-22 17:53
资讯 传奇生物CAR-T细胞药物 Carvykti(西达基奥仑赛)2025年销售额18.87 亿美元,同比增长 95.9%
强生2025年全年收入达到941 93亿美元,同比增长6%,净利润268 04亿美元,同比增长90 6%,调整后净利润262 15亿美元,同比增长8 1%。
2026-01-22 16:48
资讯 从收费难题到医保立项:机器人诊疗迎来普及拐点
2025年12月5日,国家医保局向各省医保局下发了《手术和治疗辅助操作类医疗服务价格项目立项指南(征求意见稿)》,用于在医保体系内部征求意见。
文/梁瑜 2026-01-21 16:48
资讯 英矽智能6600万美元授权一款具有穿透血脑屏障的潜在在研抗炎药物
1月20日,英矽智能发布公告称,与深圳衡泰生物科技有限公司就 ISM8969 项目达成共同开发合作协议。
2026-01-21 15:42
资讯 国家医保局规范手术和治疗辅助操作类医疗服务价格,手术机器人有了系统明确收费指引
近日,国家医保局编制印发《手术和治疗辅助操作类医疗服务价格项目立项指南(试行)》,将已有价格项目规范整合为37项,覆盖医学3D重建、生物3D打印、术中显微成像、手术路径导...
2026-01-21 15:12
资讯 GSK22亿美元收购间接获得中国创新药资产
1月20日,GSK(葛兰素史克)宣布与RAPT Therapeutics达成最终收购协议,根据协议条款,葛兰素史克将以每股58 00美元的现金价格收购RAPTTherapeutics全部已发行普通股,对应股...
2026-01-21 14:33
资讯 182家单位入围2025年人工智能医疗器械创新任务揭榜挂帅,都有哪些项目
近日,工信部办公厅 与国家药监局综合和规划财务司公布2025年人工智能医疗器械创新任务揭榜挂帅入围单位。
2026-01-21 10:32
资讯 上海医药iNKT细胞注射液获批临床试验
1月20日,上海医药集团股份有限公司发布公告称,下属上海医药集团生物治疗技术有限公司自主研发的“B023细胞注射液”收到国家药品监督管理局核准签发的《药物临床试验批准通知书...
2026-01-20 16:49
资讯 蚂蚁阿福升级PC端,面向医生群体上线 DeepSearch功能
今日,蚂蚁阿福升级其 PC 端,并上线DeepSearch(深度搜索)功能打造中国版“Open Evidence”,免费为医生、医学生及基层医疗工作者等泛医学人士提供专业服务。蚂蚁阿福 PC...
2026-01-20 15:56









