ChatGPT医学问答力压人类医生?JAMA发布研究报告

医疗健康 来源:医谷网
2023
05/10
15:32
医谷网 医疗健康

今年4月,《美国医学会杂志》(JAMA)刊发了一项研究成果:通过在线盲测,ChatGPT在提供医疗咨询服务上方面,其回答质量和同理心等都高于现实世界中的人类医生。

篇幅、回答质量、同理心等,ChatGPT均高于人类医生

美国加州大学圣地亚哥分校的研究人员从社交媒体问答网站Reddit有关医学问答的“AskDocs”子论坛上随机抽取了2022年10月期间195个由执业医生做出回答的医学问题,并在2022年12月22日和23日提交给ChatGPT生成回答。之后,3名在儿科、老年医学、内科、肿瘤学、传染病和预防医学等领域持有执业证的专家团队对问题、医生的回答和ChatGPT的回答进行阅读,并对2种回答中哪个回答更好、回复质量如何、是否具备同理心等3个方面基于李克特量表进行审查、评分。值得一提的是,审查人员是在无法知晓答案来自医生还是ChatGPT的基础上进行的盲评。

结果表明:

(1)在回复的篇幅上,医生的回复平均文字长度为52个字节,而ChatGPT为211个字节。

ChatGPT显得更“详细”。

(2)在回复质量上,ChatGPT的回答质量被评为好或非常好的比例高达78.5%,而医生这一比例为22.1%;相当于ChatGPT对医生形成了3.6倍的优势。同时,ChatGPT的回答总体上优于“好”,平均评分高达4.13;医生的回答被整体评估为略优于“可接受”,平均评分为3.26;医生的回答中有高达27.2%被评估为低于可接受的质量(得分< 3);ChatGPT这一比例为2.6%。

(3)在同理心方面,ChatGPT平均评分为3.65,医生为2.15。整体上医生的得分比ChatGPT低了41%。同时,ChatGPT的回答被评为具有同理心或非常具有同理心的比例为45.1%,高于医生的4.6%,相当于ChatGPT在同理心方面相对于医生取得了9.8倍的优势。

同时,这项研究还提供了几个例子供参考。

一名患者在论坛上提问题:漂白剂溅到眼睛后是否有失明的风险。医生的回应为“听上去没有大碍”,然后给出了中毒中心的电话号码;ChatGPT先是给予了关切,然后对“不太可能失明”的结果提出了七个建议和鼓励。

一名患者表示,打喷嚏时手臂疼痛,这是否为需要警惕的征兆?ChatGPT首先回答基本上不用担心,接着给出了详细的解释,最后表示当疼痛严重或持续时间较长时,建议咨询专业医疗人员。

还没完全准备好

虽然这项实验中,ChatGPT似乎表现的比人类医生更好,但其回答的准确度还需要验证。宾夕法尼亚大学医学教授Davidididididid Asch博士强调,ChatGPT应被视为医生的补充,人工智能还没有完全准备好,“我担心错误的信息会被放大。”

在今年2月同样发表于JAMA的一份报告显示,使用ChatGPT获取医疗咨询答复,还存在着一定的风险。

在这项研究中,研究人员根据现行指南对脑血管疾病三级预防保健建议和临床医生的治疗经验,向ChatGPT设立了25个问题,涉及到疾病预防概念、风险因素咨询、检查结果和用药咨询等。每个问题均提问3次,ChatGPT若3次回答内容基本一致,且与医疗专业评审人员给出的答案大体相似,则评为“合理”,若与评审员答案不一致则评为“不合理”,若ChatGPT自身3次回答内容不一致,则为“不靠谱”。

结果显示,ChatGPT的合理概率为84%(21/25),虽然这一概率看起来不低,但放在实际个体中,错误的建议对患者而言是极有风险的。例如,对于“我应该做什么运动来维持健康?”这一问题,ChatGPT推荐了有氧、举重等运动,但这并不准确,因为对某些患者而言这两项运动对身体是有害的、不安全的。

因此,如果作为辅助临床工作、加强患者教育、减少医患沟通壁垒等的辅助类工具,ChatGPT是很有帮助的,但药取代医生,目前还是不现实的。

标签

为你推荐

动力微官斩获数千万元天使轮融资,专注 iPSC “即用型” 再生组织产业化资讯

动力微官斩获数千万元天使轮融资,专注 iPSC “即用型” 再生组织产业化

融资资金将重点用于两款核心产品 ——iPSC 来源心肌组织片与皮肤组织片的研发推进,加速 “即用型” 再生组织从实验室走向临床应用的进程。

2026-01-04 19:23

中国最高人民法院就司美格鲁肽化合物专利作出有利判决资讯

中国最高人民法院就司美格鲁肽化合物专利作出有利判决

据诺和诺德官网消息,2025年12月31日,中国最高人民法院就司美格鲁肽化合物专利相关知识产权作出有利判决。对于最高人民法院支持北京知识产权法院关于维持司美格鲁肽化合物专利...

2026-01-04 16:00

奥浦迈14.51亿元收购澎立生物资讯

奥浦迈14.51亿元收购澎立生物

2026年1月1日,奥浦迈发布公告称,2025 年12 月31日,公司收到中国证券监督管理委员会出具的《关于同意上海奥浦迈生物科技股份有限公司发行股份购买资产并募集配套资金注册的...

2026-01-04 09:50

未名医药股权案二审改判:撤销职务侵占罪,刑期罚金大减资讯

未名医药股权案二审改判:撤销职务侵占罪,刑期罚金大减

近日,淄博市中级人民法院对未名医药股权纠纷案作出二审判决。

文/蔡真 2026-01-04 09:21

首批国产四价HPV疫苗正式上市资讯

首批国产四价HPV疫苗正式上市

12月30日,由国药集团中国生物所属成都生物制品研究所和中国生物研究院(新型疫苗国家工程研究中心)联合自主研发的国内首个四价人乳头瘤病毒疫苗(汉逊酵母)(爱薇佳),成功...

2026-01-03 22:44

蔡磊发布致渐冻症病友的新年公开信:历史已被改写,渐冻症必然被攻克,为了生命,决不投降资讯

蔡磊发布致渐冻症病友的新年公开信:历史已被改写,渐冻症必然被攻克,为了生命,决不投降

2026年1月1日,蔡磊发布新年公开信,题为历史已被改写,渐冻症必然被攻克。

2026-01-02 10:48

辅酶Q10和褪黑素备案产品可用剂型增加,并增加新的辅料资讯

辅酶Q10和褪黑素备案产品可用剂型增加,并增加新的辅料

12月31日,市场监管总局发布《辅酶Q10和褪黑素保健食品原料备案产品增补剂型和辅料》的公告。

2025-12-31 17:12

长效生长激素大幅降价资讯

长效生长激素大幅降价

12月7日,国家医保局正式发布《国家基本医疗保险、生育保险和工伤保险药品目录(2025年)》,长效生长激素特宝生物的怡培生长激素注射液(益佩生)和金赛药业的金培生长激素注射...

2025-12-31 14:32

罗永浩自曝患ADHD多年资讯

罗永浩自曝患ADHD多年

12月31日凌晨,罗永浩发布微博回应科技春晚迟到 40 分钟,称因为 ADHD(注意缺陷与多动障碍)的关系,发布会没有一场是彩排过的,全是没有彩排直接上去硬讲。幻灯片从来没有...

2025-12-31 11:12

北京市医疗健康领域支持人工智能产业创新发展若干措施(2026-2027年)资讯

北京市医疗健康领域支持人工智能产业创新发展若干措施(2026-2027年)

建立人工智能医疗伦理审查制度,加强算法透明性和患者隐私保护监管;联合药监部门探索“监管沙盒”机制,为创新产品提供容错空间,确保产业安全有序发展。

2025-12-31 10:46

上海扩大服务消费,应用细胞治疗、脑机接口等先进治疗手段,推进创新技术、创新药械临床使用资讯

上海扩大服务消费,应用细胞治疗、脑机接口等先进治疗手段,推进创新技术、创新药械临床使用

上海市商务委员会等16部门印发《关于进一步扩大上海服务消费的若干措施》。

2025-12-31 10:39

英矽智能在港交所正式上市资讯

英矽智能在港交所正式上市

12月30日,AI制药公司英矽智能在港交所正式上市,

2025-12-30 15:35

全球首款口服胰岛素上市申请未获成功资讯

全球首款口服胰岛素上市申请未获成功

12月29日,国家药监局公布药品通知件送达信息,合肥天汇生物科技有限公司申报的重组人胰岛素肠溶胶囊位列其中。一般而言,拿到药品通知件,有可能是药品上市申请“不予批准”,...

2025-12-30 11:20

北大人民医院牵头发布首个外科领域“AI医生”应用标准资讯

北大人民医院牵头发布首个外科领域“AI医生”应用标准

12月29日,北京大学人民医院与蚂蚁健康联合组建的“医学人工智能创新联合研究中心”正式揭牌成立。

2025-12-30 10:40

远大医药优敏速获批,成为中国唯一严重过敏院外急救肾上腺素鼻喷剂资讯

远大医药优敏速获批,成为中国唯一严重过敏院外急救肾上腺素鼻喷剂

远大医药(0512 HK)发布公告,公司近期布局的全球首款用于紧急治疗I型过敏反应(包括严重过敏反应)的肾上腺素鼻喷雾剂Neffy®(优敏速®)已获国家药监局颁发药品注册证书。

2025-12-29 19:03

中华人民共和国危险化学品安全法,2026年5月1日起施行资讯

中华人民共和国危险化学品安全法,2026年5月1日起施行

2025年12月27日第十四届全国人民代表大会常务委员会第十九次会议通过。

2025-12-29 16:54

首个国产CTLA-4单抗获批资讯

首个国产CTLA-4单抗获批

近日,信达生物发布公告,宣布达伯欣(伊匹木单抗N01注射液,细胞毒性T淋巴细胞相关蛋白4(CTLA-4)单抗,研发代号:IBI310)获得中国国家药品监督管理局(NMPA)批准上市。

2025-12-29 16:30

我国首个核医疗示范基地在苏州启用资讯

我国首个核医疗示范基地在苏州启用

12月27日,我国首个核医疗示范基地,在苏州大学附属第二医院(核工业总医院)浒关院区正式建成启用。

2025-12-29 11:32

AI健康应用“蚂蚁阿福”今日发布声明:健康问答结果中没有广告,也不存在商业排名资讯

AI健康应用“蚂蚁阿福”今日发布声明:健康问答结果中没有广告,也不存在商业排名

今日,AI健康应用“蚂蚁阿福”发布官方声明,明确表示,阿福的问答结果中没有任何广告推荐、不存在商业排名,也不受其他商业因素干扰,用户可以放心使用。

2025-12-29 11:13

脑机接口等8款产品纳入优先审批高端医疗器械目录(2025版)资讯

脑机接口等8款产品纳入优先审批高端医疗器械目录(2025版)

​12月26日,国家药监局发布优先审批高端医疗器械目录(2025版)。

2025-12-27 21:39