ChatGPT進醫院,醫生給打多少分

導讀 原標題:ChatGPT進醫院,醫生給打多少分文 |《財經》記者實習生 田芷綺 記者 辛穎編輯 | 王小基于ChatGPT研發的工具已經開始進入醫院...

原標題:ChatGPT進醫院,醫生給打多少分

文 |《財經》記者實習生 田芷綺 記者 辛穎

編輯 | 王小

基于ChatGPT研發的工具已經開始進入醫院幫助醫生分擔工作了。

2023年5月,在一位三甲醫院主任醫師的診室,啟用了一項新工具,在問診時打開語音記錄,機器人會幫他撰寫出一份問診記錄。

這款和ChatGPT一樣基于大語言模型研發的問診記錄機器人,“已經進入十余家醫院的診室,幫助醫生節省時間。”北京左醫科技有限公司首席執行官(CEO)張超介紹。

上述主任醫生隨后給了這款機器人90分的評價,還是有一些錯誤,“比如醫生沒有詢問患者的月經婚育史,最終的問診記錄上卻有這一項,需要手動刪除。”

一篇題為《ChatGPT:出院總結的未來》的文章指出:ChatGPT未來有望成為初級醫生的得力助手,其潛在應用領域之一是生成出院總結。該研究由英國倫敦圣瑪麗醫院外科和腫瘤科的Sajan B Patel和Kyle Lam完成,已發布于2023年3月《柳葉刀_數字醫療》(The Lancet Digital Health)上。

盡管還存在實際應用中的缺陷和問題,但研究者的目光已經聚焦在未來如何更好地采用這項技術,而不是遲疑于未來醫院是否不會采用它。

以后還用加班寫病例嗎?

4月,一路狂飆的ChatGPT全球訪問量再創新高,達到17.6億次。互聯網上ChatGPT的名字已經無處不在。人們使用它來寫小說、論文、甚至 Python代碼和法庭判決等,醫療系統自也不例外。

在醫療保健領域,使用聊天機器人早已不是新鮮事,此前便已將其應用于分診等領域,但下一代聊天機器人的目標是通過其生成功能進一步推動該領域的發展。如在醫生們早就叫苦不迭的文書負擔方面。

2018年來自美國的一份報告稱,醫生花在撰寫醫院文書以及行政上的時間“令人難以置信”。70%的醫生表示,每周花10個小時或更多時間在文書工作和行政任務上近,三分之一的醫生表示,每周20個小時或更多時間。

在中國,這也是年輕的住院醫師加班的主要原因之一。丁香園曾發布一項調查顯示,有50%以上的住院醫師,平均每天用于寫病歷的時間達四小時以上。

尤其是撰寫出院總結,對大多數醫生都是頗費心力的工作。權衡出院總結與臨床承諾時,出院總結總是被排在后面,導致患者出院延遲或出院總結信息不充分,這不僅會給本就捉襟見肘的初級醫生隊伍帶來壓力,而且還會為二級照護向一級照護過渡的過程中帶來潛在的患者安全問題。

上述《柳葉刀》的研究發現,使用ChatGPT減輕文書負擔一個典型的應用。由于出院總結已經創建出一套標準化的模板,因此通過對于模版的學習,ChatGPT很容易輔助該流程進入自動化。

研究人員通過輸入必要的患者基礎信息,生成一篇完整的出院總結,從而評估ChatGPT在醫院基礎文書上的靈敏性和準確度。

在簡單地輸入不到兩句話后,幾秒的時間內ChatGPT就生成了一篇包含患者基礎信息、入院原因、醫院總結和后續護理建議在內,完整度較高的出院總結。

顯示頁

ChatGPT對簡單出院總結請求的響應

這一研究結果表明,ChatGPT能夠處理和編寫簡單的患者信息,其準確率接近或超過一份傳統方式撰寫的出院總結的及格水平。

ChatGPT還可以提高出院總結的質量,之前的文獻表明,通過傳統方式撰寫的出院總結往往會遺漏細節。

同時,未來的迭代可能允許從患者的電子健康記錄中自動抓取數據以獲得基礎信息,從而省略了還醫生需要手動輸入這個環節。或許可以成為輔助醫生進行文書工作的重要數字工具。

一旦這項工作形成了成熟的自動化流程,醫生就有了更多時間為患者提供服務的時間。

可以看出,盡管ChatGPT提供了巨大的希望,但至少目前,它還不能離真正地脫離醫生,頂多算是一個有效的助理。

我們會信任一個機器人看病嗎?

患者到一個醫院看病,最重要的是對醫生的信賴。那么,我們會信任一個機器醫生嗎?

在上述《柳葉刀》的文章中,研究團隊也擔心患者對新技術的接受程度。當流程自動化,患者可能會對機械化、流水線式的醫療護理產生抵觸情緒。

對患者和醫生而言,使用AI最大的風險在于出錯。盡管在家中向聊天機器人詢問一些微不足道的問題可能不會產生什么后果,但有關藥物變更或跟進的信息不正確或不充分會極大地影響治療。

2022年9月,發布在福布斯上的文章《人工智能在醫療保健領域仍有很長的路要走》談到,在處理患者的護理數據時,人工智能可能會出現問題——也就是由于非常小、非常分散或非常不準確的數據集而產生的偏差。

一位國內問診病例生成AI的項目負責人就遇到類似的問題,“機器會忽略一些關鍵信息,當患者描述的一些癥狀,和核心內容相關性不強,就會被機器判定為不重要,就沒有出現在最終結果中。”

因此,“有醫生對機器人的評價只給60分,因為,這些被忽略的細節,可能會是確診的關鍵,這也往往是一些經驗豐富的醫生才能抓住的重點。”上述項目負責人對《財經》說。因此,有必要通過試點,收集各方意見,最終改進服務效率和質量。

還有,ChatGPT依賴于所接收到的數據,因此仍然需要手動輸入重要信息。張超認為,目前最大的問題是,因為生成式文本有一定創造性,在問診病例中,還會多出來一些患者沒有描述的癥狀,需要醫生手動刪除,因此一定需要醫生人工審核。

研究人員寄望于未來的迭代,可能允許從患者的電子健康記錄中自動抓取數據,而無需再手動輸入簡要信息。然而,這種做法在數據治理方面存在重大問題還需要解決。

總之對各種復雜功能的探索都在計劃中。5月25日,醫聯發布了基于醫療大語言模型——MedGPT,計劃推出機器人全流程看病,通過線上不斷向患者提問以獲取更多信息,問診結束后,開具醫學檢查項目,基于病史、病情和檢查結精確確診,并給出后續的治療方案和定期隨訪。這款產品預計將在今年底進行臨床實驗,并招募患者入組。

甚至連培養醫生的臨床工作也能由機器人分擔。美國一家企業Hippocratic AI推出產品,通過模擬不同類型的病人與醫生進行對話,為醫學生模擬臨床環境。這些模擬患者不僅具有不同疾病、性格、情緒和疾病史,還能為醫生的臨床技能診斷,提供反饋評價。

盡管還存在實際應用中的缺陷和問題,ChatGPT還是展示出下一代聊天機器人在語言模型學習方面的強大能力,當我們打開ChatGPT的對話框,進行人工智能的訓練時,自動化的趨勢就已經勢不可擋。

責編 | 張雨菲

本文為《財經》雜志原創文章,未經授權不得轉載或建立鏡像。如需轉載,請添加微信:caijing19980418

免責聲明:本文由用戶上傳,如有侵權請聯系刪除!