人工智能新系統可聞“咳”辨病
咳嗽是很多呼吸系統疾病的症狀表現。由美國谷歌公司科研人員領導的團隊最近開發出一種利用人工智能(AI)分析咳嗽,進而幫助檢測健康狀況的新系統,未來或可用於診斷新冠、結核病等疾病。
該系統是一種基於機器學習的工具,經過對海量人類聲音片段的訓練,實現對咳嗽和呼吸等噪聲的檢測,以診斷相關疾病和評估肺部功能狀況。這一系統的創新之處在於使用海量未標記的數據訓練模型以及可微調執行多項任務的能力。相關論文近期已發表在預印本網站arXiv上。
此前很多類似的AI檢測工具在前期訓練時都需要有標記的聲音數據,即人們的咳嗽聲錄音須與發聲者的健康信息相匹配。比如,一些聲音片段會被標記為該人在錄製時患有支氣管炎,便於AI學習識別。但在醫學領域,這樣有標記的訓練數據非常匱乏。
谷歌的新系統採用了一種被稱為“自我監督學習”的方法,僅使用未標記的數據就可以成功訓練出AI疾病檢測模型。研究人員從社交媒體平台優兔上的公開視頻中提取了超過三億個咳嗽、呼吸、清喉嚨等短聲音片段來訓練模型,使其可用於檢測多任務,如新冠、結核病以及是否吸煙等。由於模型經過了廣泛和多樣的人類聲音訓練,其檢測結果也是可推廣的。
據悉,新系統名為HeAR,其新穎之處在於其訓練所用的海量資料集,以及它可以被微調以執行多種不同任務。研究團隊表示,現在判斷HeAR是否會成為商業產品還為時過早。研究人員將HeAR模型用於檢測COVID-19、肺結核和個人是否吸煙等特徵。由於該模型是在如此廣泛的人聲上進行訓練的,要想對其進行微調,研究團隊只需要向其提供非常有限的帶有這些疾病和特徵的資料集。由於HeAR模型的原始訓練資料非常多樣化,具有不同的音質和人類來源,這也意味着其訓練結果具有普遍性和可靠性。
聲學已經存在了幾十年,健康聲學(或叫做音訊組學)很有前途,現在有了人工智能和機器學習,就有能力同時收集和分析大量資料。將聲音作為追蹤健康的生物標誌物,這不僅在疾病診斷方面有巨大的潛力,而且在疾病篩查和監測方面也有巨大的潛力。因為我們不能每周都重複掃描或活檢,因此,聲音可以作為疾病監測的一個非常重要的生物標誌物,而且它還具有非侵入性、成本低等優勢。
月 比