咳嗽幾聲，Google 的 AI 就知道我有沒有病？ - 大酷樂

今天小編分享的科技經驗：咳嗽幾聲，Google 的 AI 就知道我有沒有病？，歡迎閲讀。

AI 的特點在于超強的學習能力，聊天、繪畫、寫作、作曲，就沒有它不會的。

你為 AI 焦慮到頭秃，Google 倒希望 AI 幫你照顧好自己的身體。

這次，AI 的學習材料變成了咳嗽聲。

基于 YouTube 等平台無版權的公開視頻，Google 收集了 3 億條 2 秒左右的音頻數據，包括咳嗽、抽鼻子、打噴嚏和呼吸困難的聲音，然後訓練了一個 AI 基礎模型：HeAR。

HeAR 可以通過你的聲音，了解你的健康狀況，甚至能在疾病的早期給出診斷。

Google 沒有讓 HeAR 在實驗室束之高閣，已經和印度 AI 醫療初創公司 Salcit Technologies 展開合作。

Salcit 有自己的 AI 模型 Swaasa（梵語裏意為「呼吸」）以及 app，在一些情況下可以替代傳統的肺活量測試，用户提交 10 秒的咳嗽樣本，就能檢測某些呼吸道疾病。

HeAR 拓展了 Swaasa 的技能，又延續了 Swaasa 的精神。兩者的強強聯合，首先用在基于咳嗽聲的結核病早期檢測。

為什麼是結核病？首先，HeAR 有這個能力，訓練材料裏，咳嗽聲就占了大概 1 億條。

其次，結核病的情況比較特殊，可以治愈，但每年有數百萬病例未被診斷，耽誤了病情，原因無非是醫療落後，患者沒有條件。如果不治療，結核病的死亡率高于 50%。

這就能體現 AI「聽診」的好處了——與血液測試、成像等相比，聲音是更容易獲得、成本也更低的信息，可以直接通過智能手機上的麥克風和 AI 軟體收集、分析。

不過，在更廣泛地落地前，HeAR 還有一些問題需要解決，包括音頻樣本的背景噪音過多。

除了 Google，還有一些大廠和初創公司，也在嘗試讓 AI「聽見」疾病。

2021 年，301 醫院、北京大學第一醫院等聯合發起呼吸健康研究，華為在其中扮演了重要角色。

擁有華為 WATCH 4 系列、WATCH GT 4 等智能手表的用户，可以在華為創新研究 app 選擇加入呼吸健康研究，錄制咳嗽音，采集生理數據，實現肺部感染風險篩查。

「咳幾聲」，怎麼就能知道肺部有沒有感染？肺部感染的患者，咳嗽的爆發音、頻譜衰減和其他人不同，所以能被區分開來。

背後默默提供支持的，是海量專業的模型數據，以及環境音識别、高精度咳嗽識别和呼吸健康篩查評估三重算法。

另外，AI 也正在通過我們説話的聲音，深入我們的内心世界。聲音會因為精神健康而改變，有研究可循。

抑郁症患者講話通常更單調、更平淡、更柔和，音高範圍和音量較小，有更多停頓，也會更頻繁地停下來。焦慮症患者則會因為身體緊張，往往説得更快，呼吸更加困難。

基于微軟雲服務 Microsoft Azure 的美國初創公司 Canary Speech，可以捕捉并處理 40 秒的對話語音，追蹤壓力、情緒等，從而檢測健康狀況。

人類可能會自欺欺人地説「我很好」，但算法不會騙人，而是觀察你的表達方式，根據語氣詞、停頓等，做出客觀的評估。AI 不僅關注你説什麼，更關注你怎麼説。

美國國立衞生研究院的願景則更為廣闊，有些「兼濟天下」的意思。

研究人員計劃到 2026 年，創建一個大型的開源語音數據庫，訓練 AI 診斷疾病，最終開發一個 app，幫助全科醫生将患者轉診給專家，将服務輻射到農村等醫療欠缺的地區。

他們知道聲音裏有大量的信息——説話低聲、緩慢的人可能患有帕金森病，口齒不清是中風的征兆，抑郁症也能在聲音中找到端倪。

不過，收集的語音還是有優先級，包括五種疾病：神經系統疾病、聲音障礙、情緒障礙、呼吸系統疾病、自閉症和言語遲緩等兒科疾病。

某種程度上，從手表、手環、戒指等可穿戴設備到 AI「聽診」，技術都是在将人類的感官數字化，并且功能越發豐富，更加關注身體的綜合狀況。

你做冥想了嗎，你的心血管如何了，月經周期怎麼樣，運動圓環合上了嗎 ......

首款 Apple Watch 于 2015 年發布，距今已有 10 年，我們漸漸習慣，讓身邊的智能設備，随時、安靜、非侵入性地檢測身體。

而語音是一個更日常的場景，用我們的手機就可以實現互動。不過，語音數據的偏見性、準确性、隐私問題，以及算法的黑盒本質，也讓很多研究人員擔心語音檢測的負面影響。

可能未來的某一天，Siri、小愛同學等語音助理，會這樣提醒我們：親，今天咳嗽了幾次，心情跌到谷底幾次，呼吸急促了幾次 ...... 這是科技的進步，還是現實版的《美麗新世界》？