ChatGPT医学问答力压人类医生?JAMA发布研究报告

医疗健康 来源:医谷网
2023
05/10
15:32
医谷网 医疗健康

今年4月,《美国医学会杂志》(JAMA)刊发了一项研究成果:通过在线盲测,ChatGPT在提供医疗咨询服务上方面,其回答质量和同理心等都高于现实世界中的人类医生。

篇幅、回答质量、同理心等,ChatGPT均高于人类医生

美国加州大学圣地亚哥分校的研究人员从社交媒体问答网站Reddit有关医学问答的“AskDocs”子论坛上随机抽取了2022年10月期间195个由执业医生做出回答的医学问题,并在2022年12月22日和23日提交给ChatGPT生成回答。之后,3名在儿科、老年医学、内科、肿瘤学、传染病和预防医学等领域持有执业证的专家团队对问题、医生的回答和ChatGPT的回答进行阅读,并对2种回答中哪个回答更好、回复质量如何、是否具备同理心等3个方面基于李克特量表进行审查、评分。值得一提的是,审查人员是在无法知晓答案来自医生还是ChatGPT的基础上进行的盲评。

结果表明:

(1)在回复的篇幅上,医生的回复平均文字长度为52个字节,而ChatGPT为211个字节。

ChatGPT显得更“详细”。

(2)在回复质量上,ChatGPT的回答质量被评为好或非常好的比例高达78.5%,而医生这一比例为22.1%;相当于ChatGPT对医生形成了3.6倍的优势。同时,ChatGPT的回答总体上优于“好”,平均评分高达4.13;医生的回答被整体评估为略优于“可接受”,平均评分为3.26;医生的回答中有高达27.2%被评估为低于可接受的质量(得分< 3);ChatGPT这一比例为2.6%。

(3)在同理心方面,ChatGPT平均评分为3.65,医生为2.15。整体上医生的得分比ChatGPT低了41%。同时,ChatGPT的回答被评为具有同理心或非常具有同理心的比例为45.1%,高于医生的4.6%,相当于ChatGPT在同理心方面相对于医生取得了9.8倍的优势。

同时,这项研究还提供了几个例子供参考。

一名患者在论坛上提问题:漂白剂溅到眼睛后是否有失明的风险。医生的回应为“听上去没有大碍”,然后给出了中毒中心的电话号码;ChatGPT先是给予了关切,然后对“不太可能失明”的结果提出了七个建议和鼓励。

一名患者表示,打喷嚏时手臂疼痛,这是否为需要警惕的征兆?ChatGPT首先回答基本上不用担心,接着给出了详细的解释,最后表示当疼痛严重或持续时间较长时,建议咨询专业医疗人员。

还没完全准备好

虽然这项实验中,ChatGPT似乎表现的比人类医生更好,但其回答的准确度还需要验证。宾夕法尼亚大学医学教授Davidididididid Asch博士强调,ChatGPT应被视为医生的补充,人工智能还没有完全准备好,“我担心错误的信息会被放大。”

在今年2月同样发表于JAMA的一份报告显示,使用ChatGPT获取医疗咨询答复,还存在着一定的风险。

在这项研究中,研究人员根据现行指南对脑血管疾病三级预防保健建议和临床医生的治疗经验,向ChatGPT设立了25个问题,涉及到疾病预防概念、风险因素咨询、检查结果和用药咨询等。每个问题均提问3次,ChatGPT若3次回答内容基本一致,且与医疗专业评审人员给出的答案大体相似,则评为“合理”,若与评审员答案不一致则评为“不合理”,若ChatGPT自身3次回答内容不一致,则为“不靠谱”。

结果显示,ChatGPT的合理概率为84%(21/25),虽然这一概率看起来不低,但放在实际个体中,错误的建议对患者而言是极有风险的。例如,对于“我应该做什么运动来维持健康?”这一问题,ChatGPT推荐了有氧、举重等运动,但这并不准确,因为对某些患者而言这两项运动对身体是有害的、不安全的。

因此,如果作为辅助临床工作、加强患者教育、减少医患沟通壁垒等的辅助类工具,ChatGPT是很有帮助的,但药取代医生,目前还是不现实的。

标签

为你推荐

诺和诺德聚焦零售药店体重管理服务,启动“零售科学减重生态联盟”资讯

诺和诺德聚焦零售药店体重管理服务,启动“零售科学减重生态联盟”

​1月22日,诺和诺德在福州举办超越·共盈——诺和诺德零售生态伙伴大会,大会汇聚连锁零售药店管理层、临床专家、资深药师、行业智库、零售生态合作伙伴等多方力量,正式启动零...

2026-01-22 21:53

镁信健康二次递表港交所冲刺港股IPO资讯

镁信健康二次递表港交所冲刺港股IPO

成立于2017年8月的镁信健康,定位为医药多元支付基础设施服务商

2026-01-22 17:58

优赫得在华获批治疗既往接受过一种含曲妥珠单抗治疗方案的局部晚期或转移性HER2阳性成人胃或胃食管结合部腺癌患者资讯

优赫得在华获批治疗既往接受过一种含曲妥珠单抗治疗方案的局部晚期或转移性HER2阳性成人胃或胃食管结合部腺癌患者

基于DESTINY-Gastric04 III期试验结果,与雷莫西尤单抗+紫杉醇相比,优赫得®可为患者带来具有显著统计学差异和临床意义的总生存期(OS)改善,两年OS率实现翻倍

2026-01-22 17:53

术理创新完成数亿元B+轮融资,非侵入式脑机接口产业化提速资讯

术理创新完成数亿元B+轮融资,非侵入式脑机接口产业化提速

本轮融资由国家中小企业发展基金、东方富海领衔投资,老股东积极跟投

2026-01-22 17:25

传奇生物CAR-T细胞药物 Carvykti(西达基奥仑赛)2025年销售额18.87 亿美元,同比增长 95.9%资讯

传奇生物CAR-T细胞药物 Carvykti(西达基奥仑赛)2025年销售额18.87 亿美元,同比增长 95.9%

强生2025年全年收入达到941 93亿美元,同比增长6%,净利润268 04亿美元,同比增长90 6%,调整后净利润262 15亿美元,同比增长8 1%。

2026-01-22 16:48

凯因科技主动撤回培集成干扰素α-2注射液乙肝适应症的上市申请资讯

凯因科技主动撤回培集成干扰素α-2注射液乙肝适应症的上市申请

1月20日,凯因科技发布公告,主动撤回培集成干扰素α-2注射液乙肝适应症的上市申请。

2026-01-22 11:21

科塞尔医疗与美敦力公司达成深度战略合作资讯

科塞尔医疗与美敦力公司达成深度战略合作

深化本土源力 | 聚力新境、共促创新普及

2026-01-21 17:47

从收费难题到医保立项:机器人诊疗迎来普及拐点资讯

从收费难题到医保立项:机器人诊疗迎来普及拐点

2025年12月5日,国家医保局向各省医保局下发了《手术和治疗辅助操作类医疗服务价格项目立项指南(征求意见稿)》,用于在医保体系内部征求意见。

文/梁瑜 2026-01-21 16:48

英矽智能6600万美元授权一款具有穿透血脑屏障的潜在在研抗炎药物资讯

英矽智能6600万美元授权一款具有穿透血脑屏障的潜在在研抗炎药物

1月20日,英矽智能发布公告称,与深圳衡泰生物科技有限公司就 ISM8969 项目达成共同开发合作协议。

2026-01-21 15:42

国家医保局规范手术和治疗辅助操作类医疗服务价格,手术机器人有了系统明确收费指引资讯

国家医保局规范手术和治疗辅助操作类医疗服务价格,手术机器人有了系统明确收费指引

近日,国家医保局编制印发《手术和治疗辅助操作类医疗服务价格项目立项指南(试行)》,将已有价格项目规范整合为37项,覆盖医学3D重建、生物3D打印、术中显微成像、手术路径导...

2026-01-21 15:12

GSK22亿美元收购间接获得中国创新药资产资讯

GSK22亿美元收购间接获得中国创新药资产

1月20日,GSK(葛兰素史克)宣布与RAPT Therapeutics达成最终收购协议,根据协议条款,葛兰素史克将以每股58 00美元的现金价格收购RAPTTherapeutics全部已发行普通股,对应股...

2026-01-21 14:33

182家单位入围2025年人工智能医疗器械创新任务揭榜挂帅,都有哪些项目资讯

182家单位入围2025年人工智能医疗器械创新任务揭榜挂帅,都有哪些项目

近日,工信部办公厅 与国家药监局综合和规划财务司公布2025年人工智能医疗器械创新任务揭榜挂帅入围单位。

2026-01-21 10:32

上海医药iNKT细胞注射液获批临床试验资讯

上海医药iNKT细胞注射液获批临床试验

1月20日,上海医药集团股份有限公司发布公告称,下属上海医药集团生物治疗技术有限公司自主研发的“B023细胞注射液”收到国家药品监督管理局核准签发的《药物临床试验批准通知书...

2026-01-20 16:49

蚂蚁阿福升级PC端,面向医生群体上线 DeepSearch功能资讯

蚂蚁阿福升级PC端,面向医生群体上线 DeepSearch功能

今日,蚂蚁阿福升级其 PC 端,并上线DeepSearch(深度搜索)功能打造中国版“Open Evidence”,免费为医生、医学生及基层医疗工作者等泛医学人士提供专业服务。蚂蚁阿福 PC...

2026-01-20 15:56

可突破血脑屏障,FDA受理非小细胞肺癌创新药上市申请资讯

可突破血脑屏障,FDA受理非小细胞肺癌创新药上市申请

近日,美国生物医药公司Nuvalent宣布,美国FDA已受理其为zidesamtinib递交的新药申请(NDA)

2026-01-20 11:41

国内首张海外版药品价格证明开出资讯

国内首张海外版药品价格证明开出

1月13日,北京药企获得了中国药品价格登记系统开出的国内第一张海外版药品价格证明。

文/通讯员 何一凡 记者 张煜 2026-01-20 09:23

核药创新再破局!远大医药TLX591-CDx国内NDA获受理资讯

核药创新再破局!远大医药TLX591-CDx国内NDA获受理

远大医药(0512 HK)再度传来核药重大利好——公司用于诊断前列腺癌的创新放射性核素偶联药物(RDC)TLX591-CDx向国家药监局递交的新药上市申请(NDA)已获受理。

2026-01-19 21:29

eCTD验证软件更新V1.1.0版,3月1日起,V1.0版及配套操作手册将不再适用资讯

eCTD验证软件更新V1.1.0版,3月1日起,V1.0版及配套操作手册将不再适用

本次更新内容主要包括新增原料药申请验证规则,调整PDF文件书签、超链接和文件大小验证规则、完善部分文字描述等。

2026-01-19 14:18

阿斯利康获得西比曼靶向GPC3细胞疗法剩余50%的全球权益资讯

阿斯利康获得西比曼靶向GPC3细胞疗法剩余50%的全球权益

1月16日,西比曼生物科技宣布与阿斯利康达成协议,后者将收购西比曼在中国对C-CAR031的开发和商业化权益的50%份额,由此阿斯利康将获得C-CAR031在全球范围内开发、生产和商业化...

2026-01-19 13:19

2025年国民经济数据:16—59岁人口85136万人,占全国人口的比重为60.6%;60岁及以上人口32338万人,占全国人口的23.0%资讯

2025年国民经济数据:16—59岁人口85136万人,占全国人口的比重为60.6%;60岁及以上人口32338万人,占全国人口的23.0%

全年出生人口792万人,人口出生率为5 63‰;死亡人口1131万人,人口死亡率为8 04‰;人口自然增长率为-2 41‰。

2026-01-19 11:41