全球首次 醫(yī)聯(lián)MedGPT真實世界測試結(jié)果出爐,獲業(yè)內(nèi)人士高度認(rèn)可
隨著AI技術(shù)的高速發(fā)展,AI大模型逐漸滲入各行業(yè),互聯(lián)網(wǎng)醫(yī)療領(lǐng)域也受到AI技術(shù)的影響,開始步入新的發(fā)展階段。近期,由國內(nèi)領(lǐng)先互聯(lián)網(wǎng)醫(yī)院醫(yī)聯(lián)自主研發(fā)的MedGPT順利完成真實世界測試,其診斷結(jié)果與三甲醫(yī)院醫(yī)生醫(yī)學(xué)一致性達(dá)到96%。與此同時,谷歌Med-PaLM與臨床醫(yī)生進(jìn)行醫(yī)學(xué)問題回答測試,其中92.6%的長篇答案符合科學(xué)共識,與臨床醫(yī)生生成的答案(92.9%)相當(dāng)。
據(jù)了解,醫(yī)聯(lián)自主研發(fā)的MedGPT是國內(nèi)首款醫(yī)療大語言模型,首次突破了AI醫(yī)生無法與真實患者連續(xù)自由對話的難點,能夠在疾病的預(yù)防、診斷、治療、康復(fù)四個重要環(huán)節(jié)全面實現(xiàn)智能化。此次醫(yī)聯(lián)率先完成了其旗下醫(yī)療AI大模型產(chǎn)品MedGPT 的真實世界測試,向我們證實了MedGPT的準(zhǔn)確性與可靠性。
6月30日,120多位真實患者和10位來自四川大學(xué)華西醫(yī)院的主治醫(yī)師以及MedGPT共同參與了這場評測研究。根據(jù)相關(guān)人員的介紹,患者進(jìn)入診室后,將與醫(yī)助溝通自身病情,醫(yī)助通過線上文字輸入的方式將患者主訴傳達(dá)給真人醫(yī)生與AI醫(yī)生并協(xié)助醫(yī)患完成多輪溝通,在收集足夠的決策因素后,真人醫(yī)生與 AI 醫(yī)生為患者開具檢查單或診斷,患者直接在舉行測試的醫(yī)院完成檢查;在獲得檢查結(jié)果后,患者進(jìn)行復(fù)診,并由AI醫(yī)生及真人醫(yī)生提供臨床診斷及治療方案。
通過上述評測流程,在條件基本保持一致的情況下,真人醫(yī)生與AI醫(yī)生互不干涉,獨立診斷,隨后由來自北大人民醫(yī)院、中日友好醫(yī)院、阜外醫(yī)院和友誼醫(yī)院的7位專家教授針對評測形成的91份有效病例進(jìn)行審核,并且針對AI醫(yī)生的問診準(zhǔn)確性、診斷準(zhǔn)確性、治療建議準(zhǔn)確性、輔助檢查方案準(zhǔn)確性、數(shù)據(jù)分析準(zhǔn)確性、提供可解釋信息、自然語言問診與交互這7個評價維度的打分。
經(jīng)過多維度評測打分后,真人醫(yī)生綜合得分為 7.5分,AI 醫(yī)生綜合得分為 7.2分。換句話說,AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達(dá)到了96%,這充分證實了醫(yī)聯(lián)MedGPT具有較高的準(zhǔn)確性,值得被患者信賴。
對此,業(yè)內(nèi)專家表示,目前醫(yī)聯(lián)推出的MedGPT是AI技術(shù)在醫(yī)療領(lǐng)域應(yīng)用落地的重要一步,對于行業(yè)發(fā)言而言也屬于里程碑的存在。值得一提的是,出現(xiàn)診斷不明的情況,如果隨意給出治療手段,將會導(dǎo)致更大的錯誤。而MedGPT在診斷不明的情況下,并沒有堅持給患者實施治療手段,這一點是值得肯定和鼓勵的。
此外,北大人民醫(yī)院的主任醫(yī)師薛峰表示,MedGPT問診詳細(xì),可以很好地與患者進(jìn)行有效溝通,在常見病領(lǐng)域還可以起到對患者科普知識的作用,其實用性和準(zhǔn)確性已經(jīng)超出預(yù)期。盡管目前AI醫(yī)生暫時還有不足,但未來隨著AI技術(shù)的突破,將在醫(yī)學(xué)多模態(tài)能力上發(fā)揮更大的價值。
綜上所述,作為一家國內(nèi)領(lǐng)先的數(shù)字醫(yī)療企業(yè),醫(yī)聯(lián)推出的MedGPT已經(jīng)在真實世界評測研究中交出了一份亮眼的成績單,助推數(shù)字醫(yī)療的應(yīng)用落地進(jìn)程以及整個醫(yī)療行業(yè)的可持續(xù)發(fā)展。