2018年5月18日,北京大學心理與認知科學學院羅歡研究員課題組與浙江大學丁鼐教授課題組合作的研究“Prior Knowledge Guides Speech Segregation in Human Auditory Cortex ”發(fā)表于Cerebral Cortex雜志。該研究揭示了先驗知識如何幫助人類區(qū)分多重語音流。羅歡課題組的博士研究生王原野和丁鼐課題組博士研究生張劍鋒為本研究的共同第一作者,羅歡研究員和丁鼐教授為共同通訊作者。
雞尾酒會效應是聽覺領域的一個經典現象。當人們身處喧囂的酒會現場,依然可以分辨出是否有人在呼喚自己的名字。這種將多重語音流分離開來的過程通常被認為需要兩種線索,即自上而下的線索和自下而上的線索。自下而上的線索包括語音流中不同的音調,音色等。這一部分已經被充分研究過,并且得到了相對穩(wěn)定一致的結論。而自上而下的線索,比如先驗知識,則仍缺乏足夠的實證證據。本研究就試圖探究先驗知識對于多重語音分離的作用。在實驗中,為了能夠充分排除自下而上的線索,本研究選取同一位女性朗讀的不同的故事A和故事B并將其分割成多個片段,通過將這兩種刺激在同一聲道中疊加起來作為混合語音。在實驗過程中,混合語音中需要被注意的刺激先播放2秒。實驗分為兩種條件:啟動組和非啟動組。啟動組中被試首先被呈現一次需要注意的語音,即具有了關于需要注意語音的先驗圖式,接下來再收聽混合語音。非啟動組中被試則直接收聽混合語音。被試的任務在兩組中是一致的,即判斷需要注意的語音中是否存在1.5秒的空白(圖1)。本研究采用腦磁圖(magnetoencephalogram, MEG)技術考察了十六名健康被試的樣本,試圖探究大腦如何利用先驗知識來區(qū)分多重語音流。
圖1.實驗任務流程。
通過神經解碼(neural decoding) 計算,本研究得到的結果顯示,無論被試是否具有需要被注意的刺激語音的先驗知識,大腦都會較好的追蹤處理需要被注意的刺激。然而在有先驗知識的情況下,大腦對于不需要被注意的語音刺激的追蹤會顯著變弱。即大腦會通過壓制對于非注意刺激的加工來更好的區(qū)分兩種刺激。
接下來本研究通過時間響應函數(temporal response function, TRF)和溯源分析(source localization)的計算得到這一過程主要發(fā)生在聽覺皮層,并且從混合刺激出現的 100ms就開始了,全過程持續(xù)約600ms,且僅發(fā)生在1-8hz的低頻頻段。
綜上腦成像研究的結果表明,人類通過先驗知識來區(qū)分多重語音流的過程主要發(fā)生在聽皮層,并且于早期便開始,一直持續(xù)600ms左右。這一過程主要是通過抑制對于非注意語音刺激的加工來完成。這為理解自上而下的線索對于雞尾酒會效應的影響提供了重要的實證證據,也為聽皮層的功能探索提供了新的線索。
本研究得到了國家自然科學基金面上項目的資助。
Wang, Y. , Zhang, J. , Zou, J. , Luo, H. , & Ding, N. . (2018). Prior knowledge guides speech segregation in human auditory cortex. Cerebral Cortex.
2019-11-20