什麼是語言?什麼是自然語言?


轉載來源:https://blog.csdn.net/R1uNW1W/article/details/79683747

一、什麼是語言?

語言(英文名:Language)是人類最重要的交際工具,是人們進行溝通交流的主要表達方式。人們藉助語言保存和傳遞人類文明的成果。語言是民族的重要特徵之一。一般來說,各個民族都有自己的語言。漢語,法語,俄語,西班牙語,阿拉伯語,英語是世界上的主要語言,也是聯合國的工作語言。漢語是世界上使用人口最多的語言,世界語和英語是世界上使用最廣泛的語言。據德國出版的《語言學及語言交際工具問題手冊》說,現在世界上查明的有5651種語言。在這些語言中,約有1400多種還沒有被人們承認是獨立的語言,或者是正在衰亡的語言。

語言是人們交流思想的媒介,它必然會對政治、經濟和社會、科技乃至文化本身產生影響。語言這種文化現象是不斷髮展的,其現今的空間分佈也是過去發展的結果。根據其語音、語法和詞彙等方面特徵的共同之處與起源關係,把世界上的語言分成語系。每個語系包括有數量不等的語種,這些語系與語種在地域上都有一定的分佈區,很多文化特徵都與此有密切的關係。語言是指生物同類之間由於溝通需要而制定的具有統一編碼解碼標準的聲音(圖像)訊號。

語言又是符號系統,語言是人類的創造,只有人類有真正的語言。許多動物也能夠發出聲音來表示自己的感情或者在羣體中傳遞信息,但這只是一些固定的程式,不能隨機變化。

表達方式

語言就廣義而言,是一套共同採用的溝通符號、表達方式與處理規則,符號會以視覺、聲音或者觸覺方式來傳遞。嚴格來說,語言是指人類溝通所使用的語言-自然語言。一般人都必須通過學習才能獲得語言能力,語言的目的是交流觀念、意見、思想等。語言學就是從人類研究語言分類與規則而發展出來的。研究語言的專家被稱呼爲語言學家。當人類發現了某些動物能夠以某種方式溝通,就誕生了動物語言的概念。到了電腦的誕生,人類需要給予電腦指令。這種“單向溝通”就成了電腦語言。

性質

語言是人與人之間的一種交流方式,人們彼此的交往離不開語言。儘管通過圖片、動作、表情等可 以傳遞人們的思想,但是語言是其中最重要的,也是最方便的媒介。然而世 界各地的人們所用的語言各不相同,彼此間直接交談是困難的,甚至是不可能的。即使是同一種語言,還有不同的方言,其差別程度也不相同。有的方言可以基本上相互理解,有的差別極大,好像是另一種語言,北京人聽不懂廣東話就是一個很好的例子。

不僅在不同的地區,有不同的語言和方言,就是在同一地區,不同的社會階層,不同年齡的人之間都會有特殊的詞彙來表達其獨特的感情,使另一 階層或不同年齡的人難以理解。如美國的黑人,他們雖然也使用英語,但是他們說的英語也有自己的特點,甚至被稱爲黑人英語。

在一種語言環境中掌握某種語言後,雖然也可以學會另一種或幾種其他語言或方言,可是原語言或方言的口音很難完全改變,總會留下一定程度的原來所操語言的口音。熟悉語言的人往往就能從這些細微的差別中區分出說話人的家鄉所在地及其身分和職業特徵。

語言是文化的一個重要組成部分,甚至可以說沒有語言也就不可能有文化,只有通過語言才能把文化一代代傳下去。語言是保持生活方式的一個重要手段,幾乎每個文化集團都有自己獨特的語言。

語言是在特定的環境中,爲了生活的需要而產生的,所以特定的環境必然會在語言上打上特定的烙印。另外,語言是人們交流思想的媒介,因此,它必然會對政治、經濟和社會、科技,乃至文化本身產生影響。語言這種文化現象是不斷髮展的,其現今的空間分佈也是過去擴散、變化和發展的結果,所以,只有擺在時空的環境裏才能全面地、深入地瞭解其與自然環境及人文環境的關係。

定義

語言的定義:以語音爲物質外殼,由詞彙和語法構成並能表達人類思想的符號系統。

特性

語言的特性有:創造性、結構性、意義性、指代性和社會性與個體性。

結構

語言的結構:音位、語素、詞、短語、句子、全文。

種類

語言的種類:對話語言、獨白語言、書面語言、內部語言。

就大腦來說,語言分“腦語”和“嘴語”,腦語就是我們時時在大腦裏產生稱作“思考”或“思想”或“思維”的東西,腦語被嘴表達出來就叫“嘴語”。腦語和嘴語並不是一個東西,第一、腦語和嘴語在表達時失真;第二、嘴語不是腦語的唯一表達方式,因爲腦語還可以通過肌肉羣來表達:就是我們的行爲。語言是一個人能力的重要表述部分。

語言分爲“第一語言”和“第二語言”。

一個人從小通過和同一語言集團其它成員(如父母、親屬、周圍的人們)的接觸,自然學到並熟練運用於交際和思維過程中的語言。本族語言或母語一般說都是個人的第一語言,也是主要語言。

人出生後,首先掌握和使用的語言,叫第一語言。第二語言專指本國內非本族語。在全世界裏,第二語言往往是和第一語言同時被使用的。

用途

語言的功能主要分爲社會功能和思維功能兩方面,其中社會功能包括信息傳遞功能和人際互動功能。

語言是思維工具和交際工具,它同思維有密切的聯繫,是思維的載體和物質外殼以及表現形式。語言是符號系統,是以語音爲物質外殼,以語義爲意義內容的,音義結合的詞彙建築材料和語法組織規律的體系。語言是一種社會現象,是人類最重要的交際工具,是進行思維和傳遞信息的工具,是人類保存認識成果的載體。語言具有穩固性和民族性。

語言是人類的創造,只有人類有真正的語言。許多動物也能夠發出聲音來表示自己的感情或者在羣體中傳遞信息但是這都只是一些固定的程式, 不能隨機變化。只有人類纔會把無意義的語音按照各種方式組合起來,成爲有意義的語素,再把爲數衆多的語素按照各種方式組合成話語,用無窮變化的形式來表示變化無窮的意義。

人類創造了語言之後又創造了文字。文字是語言的視覺形式。文字突破了口語所受空間和時間的限制,能夠發揮更大的作用。

文字

對於文字的發明,古人更加認爲是一件了不起的大事。《淮南子》裏說:“昔者倉頡作書而天雨粟,鬼夜哭。”最能表示文字的神力的是符號,這是跟口語裏的咒語相當的東西。一般的文字也都沾上迷信的色彩,有字的紙不能亂扔,要放在有——“敬惜字紙”標籤的容器裏,積聚起來燒掉。文字裏邊當然也有避諱,嘴裏不能說的名字,紙上也不能寫;必得要寫就得借用同音字,或者缺一筆。語言雖然可以作文字的基礎,但語言畢竟不等於文字,儘管各國科學界和宗教界做出很大努力,然而世界上還有一半的語言沒有相應的文字。

特徵

符號性和系統性

首先,語言是社會約定俗成的表達觀念的符號,符號的本質是社會的。它在某種程度上要逃避社會上某一些小集體,小圈子的意識。這是語言最主要的特徵。語言是一種社會契約,一個社會接受一種表達手段而排斥另一種表達手段其實都是社會上的集體意識的習慣。或者可以說,沒有好壞之分,關鍵是使用那一種表達方式。

語言符號是一種包含着兩面性的實體。一方面語言是表示事物的名稱的,所以任何語言都是概念的映像,即具有所指性;另外,語言要依託聲音,這種媒介來表達所指,所以說語言也是聲音的映像,聲音是語言的另一個側面,也就是說語言具有能指性。

任意性和線條性

所謂的任意性是指語言符號和文字能指和所指之間是一種任意的連接關係(是不可論證的),即使有的可以論證,但是在普遍意義上來講,還是不可論證的關係。這就是世界上的語言爲什麼各式各樣的原因之一。

所謂的線條性是指語言的能指是依託聲音來完成的,所以他只能在一維的聲音的空間裏傳播,而不能突破聲音的範圍和能力,所以說在分析語言的時候語言使能在橫向上依照詞語出現的先後順序來完成,這也造就了語言使用和表達的侷限,但是語言的聲音性,決定了語言的線性是不可消除的必然結果。

不變性和可變性

語言是一個處在不斷地運動變化發展之中的體系,這個體系中的各個要素既有一定的穩定性,也有一定的變動性,穩定性是語言系統的已存在的前提,也是語言自身被大規模研習使用的必備條件,而變動性不僅僅是作爲一個系統,語言內部的不斷衍生、發展的規律所致,而且也是語言的傳承性的表現。任何事物都是不斷的運動變化發展的,新事物不斷地產生,舊事物不斷地消亡。語言也是這樣,語言系統的變化雖然不是很明顯,速度並不是很快,但是受到使用的推動以及社會、文化等等很多因素的影響,語言本身在不斷的向着經濟、簡練、實用、包容力、表現力強的趨勢發展。

語言內部的各個組成部分都有着不同方式、不同形態的變化,而且變化的多少快慢也是不一樣的,但是在以往的研究中,我們逐漸掌握了越來越多的規律來解釋、預測語言的變化。這不但體現了人們對於語言學的關注、探索取得了很多的成就同時也昭示了語言學的變化性還是有據可依,有律可循的。

傳承性和交際性

語言從某種意義上來看,是人類文化得以傳承和儲存的有效載體。因此,它在自身的發展當中,逐步體現出很強的傳承性和交際性。

所謂傳承性,是指語言以自己的風格特色吸引或者促使人們在生活生產中自覺不自覺地通過語言這個工具直接或者間接影響着相關的人羣,或者波及其他更廣泛的區域。達到傳承的效果。另外,語言在人類社會發展當中,不僅在人與人之間,古代人與現代人之間,中國人與外國人之間儲存了文明的精華信息,承擔文明發展的橋樑,同時,也由於語言本身的強大交際性功能,更顯示出獨特的交際功能,在豐富的交際中應對各種變化,產生更加有表達力的語言,產生更多的基於生活生產實際的意義。

表徵

語言表徵就是語言材料所負載的信息在頭腦中存在的方式。語言的表徵具有層次性。

加工

語言加工就是對輸入的語言信息進行編碼、轉換、存儲、提取的過程。語言的加工可分爲自動加工和受控制加工、系列加工和平行加工、模塊化加工和交互作用式加工。

生理機制

  1. 語言的發音機制:呼吸器官,喉頭和聲帶,口腔、鼻腔和咽腔。

  2. 語言活動的中樞機制:布洛卡區、威爾尼克區、角回。

  • 布洛卡區病變引起的失語症通常稱爲運動性失語症或表達性失語症。

  • 威爾尼克區病變會引起接受性失語症,這是一種語言失認症。切斷或損傷威爾尼克區與布洛卡區聯繫起來的神經纖維束-弓形束,也將產生同樣的效果。

  • 角回實現口語和書面語言的轉換。角回損傷將會引起語義性失語症。

  1. 語言在大腦兩半球的一側優勢與語言活動。(割裂腦的研究),研究證實語言活動主要是大腦左半球的功能,但大腦右半球在語言理解中也有重要作用。

語音知覺

  1. 語音的物理性質:音高、音強、音長與音色。

  2. 音位是在一種語言中能夠區別意義的最小的語音單位。音位分元音和輔音。研究音位的區別特徵有助於解釋人對語音的感知。影響語音知覺的各種因素有:語音類似性,語音強度,噪音掩蔽,語境,句法、語義的作用。

  3. 影響詞彙理解的因素:單詞的部位信息、正字法規則、字母長度或筆畫數量、字形結構、字詞的使用頻率、語音的作用、語境的作用、語義的作用。

  4. 影響句子理解的因素:句子的類型、詞序、語境、句法分析和語義分析。

  5. 影響話語理解的因素:推理、語境、圖示作用。

語言起源

大致可以分爲神授說和人創說,勞動創造說。

二、什麼是自然語言?

自然語言通常是指一種自然地隨文化演化的語言。英語、漢語、日語爲自然語言的例子,而世界語則爲人造語言,即是一種爲某些特定目的而創造的語言。 不過,有時所有人類使用的語言(包括上述自然地隨文化演化的語言,以及人造語言)都會被視爲“自然”語言,以相對於如編程語言等爲計算機而設的“人造”語言。這一種用法可見於自然語言處理一詞中。自然語言是人類交流和思維的主要工具。 自然語言是人類智慧的結晶,自然語言處理是人工智能中最爲困難的問題之一,而對自然語言處理的研究也是充滿魅力和挑戰的,也是各國人表達的方法其中之一。

簡介

自然語言通常是指一種自然地隨文化演化的語言。英語、漢語、日語爲自然語言的例子,而世界語則爲人造語言,即是一種由人蓄意爲某些特定目的而創造的語言。 不過,有時所有人類使用的語言(包括上述自然地隨文化演化的語言,以及人造語言)都會被視爲“自然”語言,以相對於如編程語言等爲計算機而設的“人造”語言。這一種用法可見於自然語言處理一詞中。自然語言是人類交流和思維的主要工具。

發展

隨着計算機和互聯網的廣泛應用,計算機可處理的自然語言文本數量空前增長,面向海量信息的文本挖掘、信息提取、跨語言信息處理、人機交互等應用需求急速增長,自然語言處理研究必將對我們的生活產生深遠的影響。

自然語言處理是人工智能中最爲困難的問題之一,而對自然語言處理的研究也是充滿魅力和挑戰的。隨着計算機和互聯網的廣泛應用,,也隨之衍生出了一系列的產品。相對而言,截止到2012年,國外在該領域的研究投入和成果都相對領先於國內,尤其漢語天然就相對於其他語種更爲複雜,更爲難以分析。

特點

自然語言處理髮展的4個特點:

  1. 基於句法—語義規則的理性主義方法受到質疑,隨着語料庫建設和語料庫語言學的崛起,大規模真實文本的處理成爲自然語言處理的主要戰略目標;

  2. 自然語言處理中越來越多地使用機器自動學習的方法來獲取語言知識;

  3. 統計數學方法越來越受到重視;

  4. 自然語言處理中越來越重視詞彙的作用,出現了強烈的“詞彙主義”的傾向。

VB

在Visual Basic中 自然語言是指人類語言。是描述算法的一種方法。

缺陷

與自然語言相對的是邏輯語言。自然語言是人腦與人腦的交際工具 ,邏輯語言是人腦與電腦的交際工具。認知科學認爲,思維和認知是知識的邏輯運算,任何計算化的自然語言分析都主要依賴邏輯語言對這種分析的表述。研究心智表現及其運算的認知科學理論追求的是心智研究的物質體現,這最終將導致語言學研究進入自然科學研究。自然語言的高度形式化描寫對計算機程序的機械模仿至關重要,但理解力模仿不同於機械模仿,它們之間的區別非常類似自然語言中形式操作與意義操作之間的不同。機械模仿涉及的是形式性質,而理解力模仿涉及的卻是準語義性質。現階段計算機以機械模仿爲主並通過邏輯語言與人類的自然語言對話。

現代邏輯作爲分析自然語言的工具,認爲自然語言的缺陷有:

  • 表達式的層次結構不夠清晰;
  • 個體化認知模式體現不夠明確;
  • 量詞管轄的範圍不太確切;
  • 句子成分的語序不固定;
  • 語形和語義不對應。

從自然語言的視角衡量邏輯語言,其不足有:

  • 初始詞項的種類不夠多樣;
  • 量詞的種類比較貧乏;
  • 存在量詞的轄域在公式系列中不能動態的延伸;
  • 由於語境的缺失而使語言傳達信息的效率不高。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章