ChatGPT医学问答力压人类医生?JAMA发布研究报告

医疗健康 来源:医谷网
2023
05/10
15:32
医谷网 医疗健康

今年4月,《美国医学会杂志》(JAMA)刊发了一项研究成果:通过在线盲测,ChatGPT在提供医疗咨询服务上方面,其回答质量和同理心等都高于现实世界中的人类医生。

篇幅、回答质量、同理心等,ChatGPT均高于人类医生

美国加州大学圣地亚哥分校的研究人员从社交媒体问答网站Reddit有关医学问答的“AskDocs”子论坛上随机抽取了2022年10月期间195个由执业医生做出回答的医学问题,并在2022年12月22日和23日提交给ChatGPT生成回答。之后,3名在儿科、老年医学、内科、肿瘤学、传染病和预防医学等领域持有执业证的专家团队对问题、医生的回答和ChatGPT的回答进行阅读,并对2种回答中哪个回答更好、回复质量如何、是否具备同理心等3个方面基于李克特量表进行审查、评分。值得一提的是,审查人员是在无法知晓答案来自医生还是ChatGPT的基础上进行的盲评。

结果表明:

(1)在回复的篇幅上,医生的回复平均文字长度为52个字节,而ChatGPT为211个字节。

ChatGPT显得更“详细”。

(2)在回复质量上,ChatGPT的回答质量被评为好或非常好的比例高达78.5%,而医生这一比例为22.1%;相当于ChatGPT对医生形成了3.6倍的优势。同时,ChatGPT的回答总体上优于“好”,平均评分高达4.13;医生的回答被整体评估为略优于“可接受”,平均评分为3.26;医生的回答中有高达27.2%被评估为低于可接受的质量(得分< 3);ChatGPT这一比例为2.6%。

(3)在同理心方面,ChatGPT平均评分为3.65,医生为2.15。整体上医生的得分比ChatGPT低了41%。同时,ChatGPT的回答被评为具有同理心或非常具有同理心的比例为45.1%,高于医生的4.6%,相当于ChatGPT在同理心方面相对于医生取得了9.8倍的优势。

同时,这项研究还提供了几个例子供参考。

一名患者在论坛上提问题:漂白剂溅到眼睛后是否有失明的风险。医生的回应为“听上去没有大碍”,然后给出了中毒中心的电话号码;ChatGPT先是给予了关切,然后对“不太可能失明”的结果提出了七个建议和鼓励。

一名患者表示,打喷嚏时手臂疼痛,这是否为需要警惕的征兆?ChatGPT首先回答基本上不用担心,接着给出了详细的解释,最后表示当疼痛严重或持续时间较长时,建议咨询专业医疗人员。

还没完全准备好

虽然这项实验中,ChatGPT似乎表现的比人类医生更好,但其回答的准确度还需要验证。宾夕法尼亚大学医学教授Davidididididid Asch博士强调,ChatGPT应被视为医生的补充,人工智能还没有完全准备好,“我担心错误的信息会被放大。”

在今年2月同样发表于JAMA的一份报告显示,使用ChatGPT获取医疗咨询答复,还存在着一定的风险。

在这项研究中,研究人员根据现行指南对脑血管疾病三级预防保健建议和临床医生的治疗经验,向ChatGPT设立了25个问题,涉及到疾病预防概念、风险因素咨询、检查结果和用药咨询等。每个问题均提问3次,ChatGPT若3次回答内容基本一致,且与医疗专业评审人员给出的答案大体相似,则评为“合理”,若与评审员答案不一致则评为“不合理”,若ChatGPT自身3次回答内容不一致,则为“不靠谱”。

结果显示,ChatGPT的合理概率为84%(21/25),虽然这一概率看起来不低,但放在实际个体中,错误的建议对患者而言是极有风险的。例如,对于“我应该做什么运动来维持健康?”这一问题,ChatGPT推荐了有氧、举重等运动,但这并不准确,因为对某些患者而言这两项运动对身体是有害的、不安全的。

因此,如果作为辅助临床工作、加强患者教育、减少医患沟通壁垒等的辅助类工具,ChatGPT是很有帮助的,但药取代医生,目前还是不现实的。

标签

为你推荐

新版《人体生物监测质量保证规范》国家标准明日实施(附全文)资讯

新版《人体生物监测质量保证规范》国家标准明日实施(附全文)

市场监管总局(国家标准委)批准发布了《人体生物监测质量保证规范》国家标准,该标准由国家疾病预防控制局组织起草,自3月1日起正式实施。

2026-02-28 14:04

全球首个罕见病AI诊断系统启动全国多中心验证研究资讯

全球首个罕见病AI诊断系统启动全国多中心验证研究

2月28日,上海交通大学医学院附属新华医院在国际罕见病日系列活动现场,启动DeepRare真实世界临床验证全国多中心研究。

2026-02-28 10:54

因美纳多组学赋能合作伙伴,推动癌症研究突破资讯

因美纳多组学赋能合作伙伴,推动癌症研究突破

在AGBT大会上,研究人员发布使用因美纳多组学解决方案取得的最新研究发现

2026-02-27 12:11

因美纳推出TruPath Genome,树立基因组洞察新标准资讯

因美纳推出TruPath Genome,树立基因组洞察新标准

2026年2月24日,因美纳(纳斯达克股票代码:ILMN)宣布推出TruPath™ Genome,为遗传病研究领域的高质量、全面的全基因组洞察树立新标准。

2026-02-27 12:04

济川药业引入国产非激素类创新药为湿疹治疗添新解资讯

济川药业引入国产非激素类创新药为湿疹治疗添新解

济川药业(股票代码:600566)宣布与泽德曼医药正式签署合作协议,济川药业将获得泽德曼医药泽立美®本维莫德乳膏在中华人民共和国(不含香港、澳门特别行政区和台湾地区)的独...

2026-02-27 11:54

因美纳发布NovaSeq X创新升级路线图: 数据质量、读数产出、速度与灵活性全面提升资讯

因美纳发布NovaSeq X创新升级路线图: 数据质量、读数产出、速度与灵活性全面提升

读数产出提升40%至350亿、最高可达Q70质量分值、更快周转时间与“交错启动”等升级将陆续面向所有NovaSeq X测序仪推出,推动精准医疗发展,并为客户带来持续叠加价值

2026-02-27 11:42

礼来ACHIEVE-3完整数据公布:orforglipron在头对头研究中优于口服司美格鲁肽资讯

礼来ACHIEVE-3完整数据公布:orforglipron在头对头研究中优于口服司美格鲁肽

2026年2月26日,礼来正式公布了ACHIEVE-3研究的完整数据。该研究结果同步发表于国际权威医学期刊《柳叶刀》。

2026-02-27 11:38

​刘金峰已任国家中医药管理局局长资讯

​刘金峰已任国家中医药管理局局长

国家卫健委官网最新信息显示,刘金峰已任国家卫生健康委员会副主任、党组成员,国家中医药管理局局长、党组书记。

2026-02-27 11:01

【出海必看】产品自我认证全指南:低成本完成CE/UKCA合规资讯

【出海必看】产品自我认证全指南:低成本完成CE/UKCA合规

在讨论产品认证时,通常会遇到两个问题:“我应该自我认证我的设备吗?” 如果是,“我该从哪里开始?”

2026-02-26 16:12

诺和诺德大幅下调司美格鲁肽价格资讯

诺和诺德大幅下调司美格鲁肽价格

近日,诺和诺德宣布,将将大幅下调美国的司美格鲁肽药物官方标价(批发采购成本)其中减重版司美格鲁肽Wegovy降幅度50%,降糖版Ozempic降幅约35%。

2026-02-26 13:37

新版《鼓励进口服务目录》发布,生命健康领域有哪些?资讯

新版《鼓励进口服务目录》发布,生命健康领域有哪些?

2月25日,商务部等七部门联合发布新版《鼓励进口服务目录》,目录主要包含研发设计服务、节能环保服务、环境服务、咨询服务、其他专业服务和医疗与健康服务六大板块。

2026-02-26 11:29

长春高新一项拟用于改善特发性原因导致儿童小阴茎的临床试验获批资讯

长春高新一项拟用于改善特发性原因导致儿童小阴茎的临床试验获批

2月24日晚间,长春高新(000661 SZ) 发布公告称,旗下核心子公司金赛药业自主研发的GenSci141软膏(双氢睾酮软膏) 正式获得国家药监局临床试验批准通知书。

2026-02-25 22:32

“童颜针”预灌装剂型获批资讯

“童颜针”预灌装剂型获批

2月24日,国家药监局发布医疗器械批准证明文件送达信息显示,上海汇悦妍生物科技有限公司全资子公司和妍(上海)医疗器械有限公司申报的“注射用聚左旋乳酸微球填充剂”成功获得...

2026-02-25 14:03

CDE:新药全球同步研发中基于多区域临床试验数据进行获益-风险评估的指导原则(试行)资讯

CDE:新药全球同步研发中基于多区域临床试验数据进行获益-风险评估的指导原则(试行)

前是中国审评机构评价MRCT所遵循的主要依据。中国审评机构鼓励申办者基于ICH E17指导原则开展MRCT,加速全球新药在中国市场的同步研发进程,并促进全球新药在中国的同步申报、...

2026-02-25 10:59

李强主持召开国务院常务会议,研究推进银发经济和养老服务发展有关工作资讯

李强主持召开国务院常务会议,研究推进银发经济和养老服务发展有关工作

会议指出,我国银发经济潜力很大,要完善支持举措、强化政策落实,促进养老事业和养老产业发展,为应对人口老龄化提供有力支撑。

2026-02-25 10:09

基石药业PD-1在英国获批新适应症资讯

基石药业PD-1在英国获批新适应症

2月24日,基石药业发布公告称,公司PD-1产品舒格利单抗的新适应症申请已获英国MHRA批准,单药用于治疗肿瘤细胞PD-L1表达≥1%、无表皮生长因子受体(EGFR)敏感突变或ALK、ROS1基...

2026-02-24 16:47

9.5亿美元里程碑付款,前沿生物两款小核酸药物授权GSK资讯

9.5亿美元里程碑付款,前沿生物两款小核酸药物授权GSK

2月23日晚间,前沿生物发布公告称,已与全球领先生物制药企业葛兰素史克(GSK)签署独家授权许可协议,葛兰素史克将获得两款小核酸(siRNA)管线产品在全球范围内的独家开发、生...

2026-02-24 13:49

达芬奇5手术系统进入创新医疗器械特别审查程序资讯

达芬奇5手术系统进入创新医疗器械特别审查程序

新一代手术机器人加速落地中国临床

2026-02-15 12:28

葛丽鹤(Belén Garijo)将出任赛诺菲首席执行官资讯

葛丽鹤(Belén Garijo)将出任赛诺菲首席执行官

赛诺菲董事会于2026年2月11日召开会议,决定不再续任韩保罗(Paul Hudson)的董事职务。

2026-02-13 16:34

独家生产品种纳入国家基本药物目录应当经过单独论证,新版《国家基本药物目录管理办法》发布资讯

独家生产品种纳入国家基本药物目录应当经过单独论证,新版《国家基本药物目录管理办法》发布

国家基本药物工作协调机制由国家卫生健康委、国家发展改革委、工业和信息化部、财政部、商务部、市场监管总局、国家医保局、国家中医药局、国家疾控局、国家药监局和中央军委后...

2026-02-13 16:05