哈佛醫学院近期在《科学》(Science)期刊发表了一篇关於大型语言模型在醫療診斷上表现的最新研究。該研究透过嚴謹的雙盲測試与臨床推理評估,客觀比较了 AI 系统与人類醫師在病歷判读上的差異。數據顯示,最新型 AI 模型在處理複雜臨床资訊时,特別是在高壓且资訊繁雜的急診室環境中更勝一籌。不过研究人員仍強调,他們的研究結果並不意味著人工智慧系统已经準備好自主行醫,也不代表醫生可以从診斷过程中被移除。
AI 在急診室的早期決策点上更勝一籌
研究團队让 LLM 模型在標準的急診環境中,对不同階段的患者进行評估,从早期分診到后期入院決定。在每个階段,模型僅被賦予当时可用的资訊——这些资訊直接来自真实的电子病歷——並被要求产生可能的診斷結果,並提出下一步治療建议。而在现实世界急診室病例的早期決策点上,該模型在診斷準確性方面与主治醫師持平或更勝一籌——这一結果甚至让研究人員都感到驚訝。
研究強调:AI 仍无法自主行醫,醫生角色仍重要
不过,研究人員強调,他們的研究結果並不意味著人工智慧系统已经準備好自主行醫,也不代表醫生可以从診斷过程中被移除。
报告中也指出 AI 的快速发展对臨床醫学的科学和实踐仍具有重大意義。儘管將人工智慧应用於臨床決策支援有时被視为一項高风险措施,但更廣泛地使用这些工具可能有助於降低診斷错誤、延誤和就醫困难造成的人力和经濟成本。
这篇文章 哈佛醫学院最新研究:AI 在急診室診斷決策優於人類醫生 最早出现於 链新聞 ABMedia。
相关快讯