腦機接口新突破!讓重度語言障礙男子愉快地說話唱歌

由 科技導報 發佈於 科技

'25-06-13

來源:中國科學報
編譯:文樂樂

一名患有嚴重語言障礙的男子,藉助大腦植入裝置,能夠富有表現力地說話和歌唱。該裝置可以將他的神經活動轉化爲話語,不僅能實現語調變化,強調他選擇的單詞,還能讓他以3個音調哼唱一串音符。

該系統被稱爲腦機接口(BCI),使用人工智能解碼參與者說話時的腦電活動。該裝置是第一個不僅能再現一個人的意圖,還能複製自然語言特徵的BCI。而音調、音高、重音等自然語言特徵有助於表達意思和情感。

植入運動皮層的電極有助於記錄和語言相關的大腦活動

圖片來源:Kateryna Kon

在一項研究中,一種模仿參與者聲音的合成聲音,在他的神經活動發出說話意圖信號的10毫秒內就說出了他的話。這項6月11日發表於《自然》的研究成果標誌着對早期BCI的重大改進。早期BCI通常在3秒內輸出語音,或者僅在用戶模擬完整個句子後才能生成語音。

“這是語音BCI領域的聖盃。”荷蘭馬斯特裏赫特大學的Christian Herff說,“這是真實、自發、連續的講話。”

這項研究的參與者是一名45歲男子,在患上一種運動神經元疾病——肌萎縮側索硬化症後,失去了清晰說話的能力。這種疾病會損害控制肌肉運動的神經,包括說話所需的神經。雖然他還能發音和說話,但說得很慢,也不清楚。

在症狀出現5年後,這名男子接受了手術,在控制運動的大腦區域插入256個硅電極,每個長1.5毫米。論文作者之一、美國加利福尼亞大學戴維斯分校的Maitreyee Wairagkar和同事訓練了深度學習算法,能夠每10毫秒捕捉一次大腦中的信號。團隊的系統實時解碼了該男子試圖發出的聲音,而不是他想要表達的具體詞語或基本音素——構成單詞的語音亞單位。

“我們並不總是用語言表達想法。我們還有感嘆詞,以及一些詞彙表裏沒有的富有表現力的發音。爲了實現這一點,我們採用了這種完全不受限制的方法。”Wairagkar解釋說。

該團隊還通過訓練人工智能算法,根據病人生病前的採訪錄音,將合成聲音個性化,使其聽起來像病人自己的聲音。

研究人員要求參與者嘗試發出“啊”“哦”“嗯”之類的感嘆詞,並說出虛構的單詞。BCI成功產生了這些聲音,表明它可以在不需要固定詞彙的情況下生成語音。

使用這款BCI,這名男子可以拼寫單詞、回答開放式問題,並使用解碼器訓練數據庫之外的一些單詞說出想說的話。他告訴研究人員,聽到合成聲音說話讓他“感到高興”,感覺就像他的“真實聲音”。

在其他實驗中,BCI能夠識別出參與者是想把一個句子說成疑問句還是陳述句。該裝置還能判斷他在一句話中想強調哪些詞語,並相應調整合成聲音的語調。“我們正在引入人類語言中所有這些重要的元素。”Wairagkar說,以前的BCI只能產生單調的語音。

瑞士日內瓦大學的Silvia Marchesotti說,該裝置的功能“對於患者的日常使用至關重要”。“從某種意義上說,這是一種範式轉變,可以真正帶來一種現實生活中的工具。”

相關論文信息

https://doi.org/10.1038/s41586-025-09127-3


友情鏈接




中國科協之聲

中國科協官方公衆平臺。傳播科協聲音,凝聚價值共識,弘揚創新文化,展示科協形象。





Scroll to Top