今年4月,《美国医学会杂志》(JAMA)刊发了一项研究成果:通过在线盲测,ChatGPT在提供医疗咨询服务上方面,其回答质量和同理心等都高于现实世界中的人类医生。
篇幅、回答质量、同理心等,ChatGPT均高于人类医生
美国加州大学圣地亚哥分校的研究人员从社交媒体问答网站Reddit有关医学问答的“AskDocs”子论坛上随机抽取了2022年10月期间195个由执业医生做出回答的医学问题,并在2022年12月22日和23日提交给ChatGPT生成回答。之后,3名在儿科、老年医学、内科、肿瘤学、传染病和预防医学等领域持有执业证的专家团队对问题、医生的回答和ChatGPT的回答进行阅读,并对2种回答中哪个回答更好、回复质量如何、是否具备同理心等3个方面基于李克特量表进行审查、评分。值得一提的是,审查人员是在无法知晓答案来自医生还是ChatGPT的基础上进行的盲评。
结果表明:
(1)在回复的篇幅上,医生的回复平均文字长度为52个字节,而ChatGPT为211个字节。
ChatGPT显得更“详细”。
(2)在回复质量上,ChatGPT的回答质量被评为好或非常好的比例高达78.5%,而医生这一比例为22.1%;相当于ChatGPT对医生形成了3.6倍的优势。同时,ChatGPT的回答总体上优于“好”,平均评分高达4.13;医生的回答被整体评估为略优于“可接受”,平均评分为3.26;医生的回答中有高达27.2%被评估为低于可接受的质量(得分< 3);ChatGPT这一比例为2.6%。
(3)在同理心方面,ChatGPT平均评分为3.65,医生为2.15。整体上医生的得分比ChatGPT低了41%。同时,ChatGPT的回答被评为具有同理心或非常具有同理心的比例为45.1%,高于医生的4.6%,相当于ChatGPT在同理心方面相对于医生取得了9.8倍的优势。
同时,这项研究还提供了几个例子供参考。
一名患者在论坛上提问题:漂白剂溅到眼睛后是否有失明的风险。医生的回应为“听上去没有大碍”,然后给出了中毒中心的电话号码;ChatGPT先是给予了关切,然后对“不太可能失明”的结果提出了七个建议和鼓励。
一名患者表示,打喷嚏时手臂疼痛,这是否为需要警惕的征兆?ChatGPT首先回答基本上不用担心,接着给出了详细的解释,最后表示当疼痛严重或持续时间较长时,建议咨询专业医疗人员。
还没完全准备好
虽然这项实验中,ChatGPT似乎表现的比人类医生更好,但其回答的准确度还需要验证。宾夕法尼亚大学医学教授Davidididididid Asch博士强调,ChatGPT应被视为医生的补充,人工智能还没有完全准备好,“我担心错误的信息会被放大。”
在今年2月同样发表于JAMA的一份报告显示,使用ChatGPT获取医疗咨询答复,还存在着一定的风险。
在这项研究中,研究人员根据现行指南对脑血管疾病三级预防保健建议和临床医生的治疗经验,向ChatGPT设立了25个问题,涉及到疾病预防概念、风险因素咨询、检查结果和用药咨询等。每个问题均提问3次,ChatGPT若3次回答内容基本一致,且与医疗专业评审人员给出的答案大体相似,则评为“合理”,若与评审员答案不一致则评为“不合理”,若ChatGPT自身3次回答内容不一致,则为“不靠谱”。
结果显示,ChatGPT的合理概率为84%(21/25),虽然这一概率看起来不低,但放在实际个体中,错误的建议对患者而言是极有风险的。例如,对于“我应该做什么运动来维持健康?”这一问题,ChatGPT推荐了有氧、举重等运动,但这并不准确,因为对某些患者而言这两项运动对身体是有害的、不安全的。
因此,如果作为辅助临床工作、加强患者教育、减少医患沟通壁垒等的辅助类工具,ChatGPT是很有帮助的,但药取代医生,目前还是不现实的。
为你推荐
资讯 共建多元支付,加速创新可及:镁信健康与辉瑞中国达成战略合作
双方将依托长期合作基础,以多元支付为基石,以数据洞察和AI技术为引擎,加速前沿创新药落地中国,全方位提升患者用药可及性与健康服务体验,助力构建多层次医疗保障体系。
2026-05-21 17:57
资讯 拜耳可申达(非奈利酮片)在中国获批用于LVEF≥40%的心力衰竭成人患者
拜耳宣布中国国家药品监督管理局(NMPA)批准高选择性非甾体类盐皮质激素受体拮抗剂可申达(非奈利酮片)用于射血分数(LVEF)≥40%的心力衰竭成人患者,以降低心血管死亡、因心...
2026-05-21 17:51
资讯 冯慧宇教授:从“活下去”到“活得好”,重症肌无力迈入精准治疗时代
作为深耕重症肌无力领域数十年的临床专家,她用一个个真实的患者故事,揭示了这个有着 300 多年历史的古老疾病在当代诊疗中的核心痛点,并分享了对创新药发展和患者全程管理的...
文/张蓉蓉 2026-05-21 15:48
资讯 2026年“家庭健康促进计划-健康同行1+1公益项目” 在西安医学院正式启动
5月18日,由中国妇女发展基金会主办,陕西省妇联、陕西妇女儿童发展基金会、西安医学院协办,默沙东公益支持的“家庭健康促进计划-健康同行1+1公益项目西安高校健康跑暨2026启动...
2026-05-21 15:37
资讯 爱尔眼科补交税款及滞纳金5.24亿元
5月20日,爱尔眼科(300015 SZ)发布公告称,其根据国家税收法律法规相关要求进行自查后,需补缴税款3 48亿元,并支付滞纳金1 76亿元,合计金额达5 24亿元。目前,上述税款...
2026-05-21 15:36
资讯 复宏汉霖引进第三代口服EGFR-TKI产品
近日,复宏汉霖宣布与江苏正大丰海制药有限公司及其旗下江苏创特医药科技有限公司达成战略合作。根据约定,复宏汉霖将获得由江苏创特自主研发的口服小分子三代表皮生长因子受体...
2026-05-21 11:28
资讯 冠脉支架国家集采第二轮接续采购在天津开标,27个产品拟中选
5月20日,国家组织冠脉支架集中带量采购第二轮接续采购在天津开标。共15家企业的30个产品参与投标,投标企业全部中选,27个产品获拟中选资格。
2026-05-20 21:05
资讯 因美纳发布年度企业责任报告,持续提升基因组学可及性,加速拓展全球影响力
报告重点介绍了公司在推动基因组学公平可及方面取得的持续进展,以及为全球患者、社区和医疗系统带来可衡量的影响
2026-05-20 18:14
资讯 罗欣药业因生产劣药被处罚186万元
5月18日,山东省药监局发布的行政处罚信息显示,罗欣药业因生产销售不符合国家药品标准的注射用阿奇霉素,被处以没收药品609支、没收违法所得6 8万元并处罚款180万元,罚没款合...
2026-05-20 16:01
资讯 集采心脏支架临床使用超千万
2020年,心脏支架成为首批国家组织高值医用耗材集中带量采购品种,国内外企业的10个临床主流产品中选,普遍降至1000元以下,我国心脏支架基本告别“万元时代”。
2026-05-20 13:46
资讯 我国启动首个128通道全植入式脑机接口系统多中心临床试验
5月18日,我国正式启动首个128通道全植入式脑机接口系统多中心临床试验,这项试验由首都医科大学附属北京天坛医院担任组长单位。
2026-05-19 21:08
资讯 国产口服小分子GLP-1减重适应症完成III临床试验,即将申报NDA
5月18日,成都闻泰医药科技股份有限公司宣布,公司自主研发的每日一次口服小分子GLP-1受体激动剂VCT220片,在中国超重或肥胖受试者中的关键Ⅲ期临床试验取得积极顶线结果,计划...
2026-05-19 18:07
资讯 辐联科技完成超 10 亿人民币融资,加速核药临床开发与全球同位素产能布局
本轮融资由全球医疗健康投资机构维梧资本领投,辐联科技战略合作伙伴 SK Biopharmaceuticals 以及成为资本、红杉中国、佳辰资本、楹联健康基金、Plaisance、Sky9、TSG 资本等多家优质机构跟投。
2026-05-19 18:02
资讯 重磅,哪些药械产品纳入白名单,各省要在2026年9月底前统一建立定点零售药店职工医保个人账户支付白名单制度
5月19日,国家医保局官网发布《国家医保局办公室 财政部办公厅关于进一步加强定点零售药店职工基本医疗保险个人账户使用监督管理的通知》,提出要建立定点零售药店职工医保个...
2026-05-19 10:52
资讯 3D打印、能量器械、影像引导、手术器械臂、远程医疗,全国首家!湖南省发布辅助操作类医疗服务价格
湖南省医疗保障局5月14日发布《关于规范整合手术和治疗辅助操作类医疗服务价格项目的通知》,打通了新技术、新设备进入临床应用的关键一公里。
2026-05-18 21:43
资讯 欧洲肥胖大会最新研究:口服减重药orforglipron为长期体重管理提供新思路
5月12至15日,欧洲肥胖大会举行。多国专家反复强调一个事实:肥胖不是简单的意志力问题,而是一种受遗传、代谢、激素、行为和环境等多重因素影响的慢性疾病。
2026-05-18 17:26
资讯 创新医疗器械鼻中隔可吸收钉固定器获批
近日,国家药品监督管理局批准了合肥启灏医疗科技有限公司“鼻中隔可吸收钉固定器”创新产品注册申请。该产品由固钉器和固定钉组成,适用于鼻中隔手术时对合软组织,并连接组织...
2026-05-18 15:55









