月 16 日消息,科技媒體 TechSpot 昨日(8 月 15 日)發(fā)布博文,報道稱斯坦福大學(xué)研究團(tuán)隊首次實現(xiàn)了將人類內(nèi)心語言直接轉(zhuǎn)化為語音的腦機(jī)接口技術(shù)。
該系統(tǒng)通過植入電極陣列,記錄癱瘓患者運(yùn)動皮層的神經(jīng)活動,并運(yùn)用機(jī)器學(xué)習(xí)模型解碼想象中的語音,準(zhǔn)確率最高達(dá) 74%。
以往的腦機(jī)接口多基于檢測說話時的大腦信號,而斯坦福團(tuán)隊則突破性地讓參與者只需默想詞語即可被系統(tǒng)識別,能夠?qū)⑷藗兡X海中想象的語言直接轉(zhuǎn)化為實際語音。
這項技術(shù)首次實現(xiàn)了不依賴口腔或聲帶動作,僅憑“內(nèi)心語音”完成交流,對神經(jīng)技術(shù)領(lǐng)域具有里程碑意義。
圖源:Emory BrainGate Team
本次試驗招募了四位因漸凍癥或腦干中風(fēng)導(dǎo)致重度癱瘓的患者。部分受試者只能通過眼睛移動來表達(dá)“是”或“否”。
醫(yī)生在他們的大腦運(yùn)動皮層(控制說話動作的核心)植入了微型電極陣列,隨后患者分別嘗試發(fā)聲和默默想象特定詞語,系統(tǒng)實時記錄和分析他們的神經(jīng)活動。
科研團(tuán)隊利用機(jī)器學(xué)習(xí)模型,針對語音最基本的音素進(jìn)行識別訓(xùn)練,再將這些音素組合成完整的詞語和句子。
結(jié)果顯示,盡管想象語音產(chǎn)生的神經(jīng)信號較弱,但仍具有可辨識的特征,系統(tǒng)最高解碼準(zhǔn)確率達(dá)到 74%,這意味著即使患者完全無法發(fā)聲,也能通過思維實現(xiàn)高效溝通。
技術(shù)負(fù)責(zé)人表示,這項成果讓科學(xué)家首次清晰了解純思維狀態(tài)下的語音神經(jīng)活動。對于嚴(yán)重言語障礙者而言,基于“內(nèi)心語音”解碼的腦機(jī)接口有望讓交流變得更自然、更輕松。
另有專家指出,嘗試說話對于部分癱瘓患者來說既耗體力又可能帶來呼吸障礙,直接解碼默語能極大改善他們的交流體驗。
團(tuán)隊在研究過程中的也發(fā)現(xiàn)了隱私方面的挑戰(zhàn):系統(tǒng)有時會檢測到參與者未主動想表達(dá)的內(nèi)容。對此,研究人員設(shè)計了“心理密碼”機(jī)制,只有在腦中默念特定密碼后,解碼器才會啟動。測試中,“chitty chitty bang bang”這一口令能在 98% 的情況下阻止無意解碼。