一、什麼是自然語言
自然語言:人類溝通所使用的語言叫自然語言
人工語言:人工發明的語言,如Python、Java等計算機語言叫人工語言
這裏的自然語言處理:分爲文本處理和語音處理兩個部分
二、自然語言處理六大模型
1.語音識別
即輸入語音,輸出內容文本。
2.語音合成
即輸出內容文本,輸出對應的語音。
3.語音轉換
語音分離(Speech Separation):即將一段輸入語音分離爲多段語音。例如多個人一起說話的語音,可以將其內容分離開。
聲音轉換(Voice Conversion):將語音轉換爲另外一個風格的語音(另一個人說話),類似柯南的變聲器。
4.語音分類
語者辨認(Speaker Recognition):判斷說話的人是誰。
關鍵字檢測(Keyword Spotting):檢測語音句子中是否出現關鍵字(用於語音助理的喚醒詞,要求模型小,省電)。
5.文本處理
翻譯(Translation):將一種語言翻譯成另一種語言。
摘要(Summarizetion):提取一段長文本的摘要內容。
聊天機器人(Chat-bot):提供自動聊天功能。
問答機器人(Question Answering):自動客服等。
語法剖析(Syntactic Parsing):分析一段文字的語法。
6.文本分類