人機交互-語音交互的人類感知機制

聲音的產生


肺中的空氣受到擠壓形成氣流,氣流通過聲門(聲帶)沿着聲道(由咽、喉、口腔等組成)釋放出去,就形成了聲音。

人的發聲過程包括兩個步驟

  1. 首先聲門、聲帶產生不同頻率的聲音;
  2. 然後聲道對聲源起到調製作用。

以上過程如下圖所示:

氣流、聲門可以等效爲一個激勵源,聲道可以等效爲一個時變濾波器,由此產生了語音。

 

語言的本質


組成有聲話語的小微語言元素叫作音素,它是語言中最小的單位,一旦改變,單詞或者表達就會跟着變化。音素的物理表達就是“通話”,但語音信號不只是一系列拼接的聲音,像摩爾斯電碼。我們的發聲器官以難以置信的速度和精心的編排在變換着共振結構。

有時,共振是混亂的噪聲在聲道收縮時產生的,例如S的發音。一個音素的聲學表達不僅是不固定的,而且在現實中會受到前一個和下一個預期的音素影響———這種現象稱之爲協同發音。當說話者根據當前情況和聽者的需求調整自己的話語時,其他的變化就會產生。由此導致的語音信號反映了這些在複雜且快速變化的信號中運動的發音器官和聲源。下圖展示了一個簡短話語的語音譜圖。

音調(tone)是衆多語言語音系統的構成要素,如漢語普通話的四聲。雖然印歐語系裏多數語言屬於非音調語言,但在單詞層面之上每一種語言都普遍運用音調傳達信息。語音系統在音序、音節和音調之上的更高一層結構,是韻律或稱韻律模式(Prosody or prosodic pattern), 它包括節奏、強弱模式和跨越音節和單詞的音調變遷,等等。韻律同樣是人類語言中令人着迷的部分,它跟音樂與詩歌關係密切。通過話語的韻律所傳遞的語義和情感信息,是人類語言的一個重要緯度,而且是詞彙或書面語及語法難以記錄表達的緯度。達爾文在其1871年的著作 The Descent of Man 中就指出過,語言韻律與情感表達密切相關,它本身又提示語言進化的起源。

 

語音的感知


聲波經過外耳和中耳到達內耳,耳蝸將聲波刺激轉變爲電信號,從而將電信號沿神經傳導通路傳至神經中樞。在這個過程中,完成了將聲波的機械刺激轉變爲電信號並傳至相應聽覺神經。隨後聽覺中樞的神經元對傳來的電信號進行綜合分析,形成聽覺。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章