挑戰真醫生?AI醫生剛剛上路
“一位醫生能夠握住病人的手,向他分享自己的情緒,這在很多時候是價值非凡的。AI也許能夠輸出表達同情的文本,但無法輸出人性?!?br />
無論從模型質量還是患者隱私的角度,監管層都應將大模型的數據庫納入監管。醫療數據的品質關系到AI醫療決策的安全性,現階段的大模型產品依然依賴人類醫生的貢獻。
即使只是以輔助決策的身份介入,AI也會為復雜的中國醫患關系平添波瀾。比如,當醫生建議與AI不同時,患者可能會懷疑醫生“另有考慮”,從而惡化互信關系。
根據相關規定,以輔助診斷產品申請三類證是醫療大模型最有可能走的審批道路。若按此規定,醫療大模型就必須經國家藥監局審批,并開展臨床試驗。
責任編輯:曹海東
2019年6月21日,廣州,某行業展會展出的應用在醫療領域的智能機器人。
它展現出了真人醫生一樣的問診素養。
“您說的甲狀腺結節四年前是怎么發現的?當時有什么癥狀?這四年來結節有沒有變大或其它癥狀?您是否定期復查?最近一次復查什么時候?”
這些連珠炮似的提問,令從醫十余年的李惠感到驚訝。因為提問來自一款醫療大語言模型(下稱“大模型”)MedGPT,又稱AI(人工智能)醫生。李是一位腎內科副主任醫師。
就在2023年6月底,李惠與9位來自心內科、消化內科、呼吸內科、內分泌科、腎臟內科、骨科、泌尿外科等科室的醫生,聯手挑戰MedGPT。后者于2023年5月推出,號稱國內首款醫療大模型。
這場在成都的一家醫院舉行的測試,也被業內譽為人類與AI在醫學領域的一次公開比拼。
最終經過7位專家的評審,真人醫生綜合得分為7.5分,AI醫生綜合得分為7.2分。AI醫生與三甲主治醫生在比分結果上的一致性達到了96%。
考慮到大模型不斷自我學習成長的能力,眼前的成果難免令人對AI醫生的應用前景浮想聯翩。據南方周末記者不完全統計,2023年5月以來,國內已至少有醫聯、商湯科技、京東健康、聯影智能、上海聯通等企業相繼發布了醫療AI大模型。7月27日,谷歌亦發布全球首個全科醫療AI大模型Med-PaLM M。
不過,在醫療大模型投入應用前,從診斷的準確性和可解釋性,到醫療數據的來源,再到AI醫生與真人醫生的關系,許多倫理問題仍待厘清。
醫療大模型亟須人機一致性測試
和大火的ChatGPT一樣,MedGPT的界面也是一組簡潔的對話框,可見對話與問答功能是其核心所在。在一則現場問診視頻中,患者與MedGPT、真人醫生的對話氣泡分別用藍色和綠色表示。但即使不借助顏色,二者之間也有著顯見的差別。
問診中,病人自訴腰疼,AI會追問,左側還是右側?“如果是單側疼痛,也有可能是腎周感染,但更要考慮結石或腫瘤?!崩罨莞嬖V南方周末記者,AI在不能查體的情況下,能通過對話彌補一部分差距。
從文本上看,人類醫生的表述更加口語化也更簡潔。MedGPT則透露著機器特有的耐心和客氣。它的回復往往以“您好!感謝您的配合”開場,接著是長篇大段的解答,有時也會連續發問。
“問診比較詳細,它對于每個細節都很注重,作為臨床醫生的補充是非常有幫助的?!弊鳛樵u委的北京阜外醫院心內科主任醫師楊躍進表示,“但詳細有時候意味著重點不突出,有些問題就需要一查到底,未來還需要繼續凝練?!?/p>
“我們沒想到一致性得分會這么高,大家都很興奮很滿意?!被ヂ摼W醫療企業醫聯MedGPT項目負責人王磊表示。
從最近層出不窮的新品發
登錄后獲取更多權限
校對:胡曉