計算機速成課 第三十六集 自然語言處理

1. 背景:

  • 編程語言的詞彙量一般很少,而且非常結構化,代碼只能在拼寫和語法完全正確時,編輯和運行
  • 人類語言叫「自然語言」,有大量的詞彙,不同的詞義,不同的口音
  • 讓計算機擁有語音對話的能力,這個想法從構思計算機就有了
  • 「自然語言處理」因此誕生,簡稱 NLP,它是結合了計算機科學和語言學的一個跨學科領域
  • NLP 早起的一個基本問題是怎麼把句子切成一塊塊,數據塊越小越容易處理

2. 詞性

  • 名詞、代詞、冠詞、動詞、形容詞、副詞、介詞、連詞和感嘆詞
  • 子類
    • 單數名詞 VS 複數名詞
    • 副詞最高級 VS 副詞比較級

3. 短語結構規則

  • 電腦也需要知道語法,因此開發了「短語結構規則」來代表語法規則

4. 分析樹

  • 給語言制定的一系列的規則,用這些規則可以做出「分析樹」
  • 作用:給每個單詞標了可能是什麼詞性,也標明瞭句子的結構

5. 語音識別

  • 計算機從聲音中提取詞彙,這個領域叫做「語音識別」
  • 貝爾實驗室在 1952 年推出了第一個語音識別系統,綽號 Audrey,自動數字識別器
  • 1962 年的世界博覽會上,IBM 展示了一個鞋盒大小的機器,能識別 16 個單詞
  • 1971 年,DARPA 啓動了一項雄心勃勃的五年籌資計劃,之後誕生了卡內基梅隆大學的 Harpy
  • Harpy 是第一個可以識別 1000 個單詞以上的系統

6. 譜圖

  • 橫軸是時間,縱軸是不同頻率的振幅,顏色越亮,那個頻率的聲音越大
  • 這種從波形到頻率的轉換,是用一種算法實現的,這個算法叫做「快速傅立葉變換 FFT」
  • 舉例:和立體聲系統的 EQ 可視化器類似
  • 譜圖是隨着時間變化的

7. 音素

  • 構成單詞的聲音片段
  • 英語大概有 44 種音素
  • 語音識別軟件知道這些音素,所以本質上變成了音素識別

8. 語音合成

  • 用途:讓計算機輸出語音,很像語音識別,不過反過來把一段文字,分解成多個聲音,然後播放這些聲音
  • 早期語音合成技術,可以清楚聽到音素是拼在一起的
  • 舉例:
    • 1937 年,貝爾實驗室的手動操作機器
    • 如今,Siri, Cortana, Alexa 好了很多,但還不夠像人
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章