學英語儘量不要從背詞彙表開始

一、基本聽懂需要認識多少比率詞彙?

根據語言學家各種測試,要基本聽懂/讀懂一般非專業英語內容,生詞量必須小於2%——也就是說100個單詞裏,你只有2個以下的單詞不認識[1]。 這2%僅僅是最低要求,而且是對於老美老英母語者來說;而對於一般非母語者日本緬甸人等的測試結果,即使98%的單詞你都認識,也常常還不能聽懂/讀懂[2]。

二、中國學生詞彙量夠嗎?

既然對於非母語者認識98%的詞彙都不夠,咱就把99%定爲一個比較理想的目標。那需要掌握多少詞彙量纔夠呢?

不同的美劇用詞難度廣度其實都不一樣:比方《Friends》用詞就比較簡單:九季一共大概93萬個單詞,一共有13250個詞位(lexeme - 就是把runs, running都算成是一個詞run);而《the Big Bang Theory》就難上一個級別:前五季(第六季因爲還在播,哥還沒加入統計)一共大概22萬個單詞,詞位有約11892個。

如何計算多少詞涵蓋99%的內容呢?比方你認識"I"這個單詞,它在《Friends》中用了35000次,也就是說相對93萬詞,你只要懂一個I就懂了約3.7%的內容;以此類推,要聽懂99%的內容,6079個詞位就可以涵蓋;而對於《the Big Bang Theory》,要涵蓋99%內容需要9007個劇本詞彙。

一般中國學生的詞彙量大概有多少呢?我把中國學生從小到大有可能背到的人教版中學課本、高考單詞、四六級大綱、王玉梅俞敏洪託福、GRE紅寶書、再要你命3000,統計了下:一共有13000多個詞位——很多人說背完GRE單詞就有20000個單詞了,其實沒有那麼多,四六級、託福有很多重複單詞。

大家會說即使只有一萬三千個聽《Friends》也是小菜啊,姐姐我GRE Verbal 165分,應該閉着眼睛都能聽明白《Friends》。且慢,前面的計算有一個關鍵問題:這6079個/9007個詞彙是美劇所用的詞彙,而你掌握的詞彙未必包含這些劇本中的詞彙。對於聽衆詞彙能覆蓋多少美劇的內容,除了詞彙量,還有一個很關鍵問題就是該聽衆的“詞頻結構”。

三、中國學生的詞彙結構合理嗎?

單單說詞彙量沒有意義,比方你背了半本《牛津高階字典》號稱坐擁10萬詞彙量,但如果你專門挑別人根本不用的冷僻詞背,你看書聽美劇依舊一頭霧水。語言學有個理論是高頻詞一定會比低頻詞先掌握("High-frequency and wide-range words are generally learned before lower-frequency and narrower-range words.")其實這個假設不適用於大部分中國學生,大部分中國學生掌握詞彙都不是通過和英語的自然接觸掌握的,而是背誦詞彙書來的,裏面很多詞不常用。而實際應用中的大量高頻詞,並不在中國學生常用詞彙書裏面。不少中國學生通過紅寶書把minaret等生僻詞背得爛熟,卻連rinse這樣日常用詞都不知道。

按照按聽衆的詞彙而不是按照劇本詞彙來計算能聽懂多少纔有意義:先把劇中聽衆懂的詞挑出來,然後累加它們出現的頻率,看看佔全劇詞彙量多少比率,也就是能聽懂多少——這個纔是規範研究的方法:

對於《Friends》來說,背完中學到GRE的13000個單詞,可以大概認識裏面大概97-98%的單詞。(計算機顯示可以涵蓋93%的《Friends》的內容,我因爲沒有剔除《Friends》3萬~4萬的人名,所以這個比率應該會更高到97-98% )—— 中國學生就是GRE Verbal 滿分,也未必能輕鬆搞定《Friends》啊:

1. 有2%-3%的詞你完全不認識。作爲一箇中國觀衆,很多中學到GRE的單詞相對於《Friends》來說,算是“白背了”,比方“accumulate、accustom、acid、adapt、adhere、adverse”等等一堆書面用詞,;而《Friends》當中常用的比方"freak、ass、dude、sweetie、massage、stripper、nap、aisle...”在中學到GRE詞彙中並沒有出現。

2. 有些詞儘管你認識,但搖身一變和別的詞組合一下你就不認得了:你可能知道freak是古怪的人,Chandler 有次說RossThe guy's a freak就是這個意思,但是freak out的意思就完全不同了,意思是突然變得很情緒化,美劇中常常可以聽到I'm not freaking out(我沒有生氣);有些詞意思很多,你可能只知道一個:比方freak除了變態之外,還有對某事特別着迷的意思,某次Phoebe嘲笑Monica是"an unbeliable control freak"就說她愛控制別人,不是說她是變態,我有時候會告訴別人I'm kind of a neat freak,意思是我有點小潔癖。

上面1.體現的是詞彙頻率結構低效;2. 體現的是詞語能力不足——這些都是單單通過背單詞書掌握詞彙禍害的啊~

中國學生的英語單詞結構(這裏假設僅僅通過背單詞書獲得),哥親自驗證過它的低效——即使是對於書面英語來說也是不理性。哥選擇同等詞彙量的別的詞彙表,比方BNC[3]詞頻top 13k、古登堡高詞頻[4]、谷歌高詞頻等和中國的高中到GRE詞彙表相比較,用幾本暢銷書比方《哈利波特》、《喬布斯自傳》等和經典教科書比方羅素的《西方哲學史》作爲樣本,發現幾乎每一本書,中國學生詞彙表的涵蓋量都是最低的。(只有一本心理學暢銷書打敗了古登堡高頻詞表——可能古登堡文本都很古舊的原因)。

順便說下,我2013下半年的計劃之一就是在水木EnglishWorld版貼出中國學生中學到GRE詞彙中缺少的常用高頻詞(用計算機先優選各種詞頻表,再人工篩選)。

四、母語者的詞彙狀況如何?

無障礙看美劇最理想的是擁有母語者那樣的詞彙狀況(量和結構)。可能有同學馬上不服氣說,鐵牛哥難道你沒聽說美國中西部農民只有4000單詞卻足以應付大多數複雜社會需求,哥對於在n多場合聽到中國學生津津樂道這個不知道是哪個培訓機構流出來的段子實在是跪服。

其實英美母語者的詞彙量要遠遠大於中國同學的想像:芝加哥大學的兩位研究人員Mary Jean Schulman和Robert J. Havighurst對美國中西部社區各個社會階層的人做過詞彙量測試,就是來自最低社會階層的E組詞彙量也達到了28,800,而中上層的詞彙量超過了4萬[5]。研究者用不同的方法測試,結果會有不同,比方ROBIN GOULDEN(1990)的測試母語者的詞彙量是2萬左右,但是主流的說法是在2萬至2.5萬之間 (Crystal 1997). ——這個結果可以秒殺用GRE冷僻詞放到母語者而自豪的中國烤雞族。也就是說一個勤奮刻苦的中國學生把能背的主流詞彙書都背完,在詞彙量上離母語者還是有很大距離;更不用說詞彙結構了。

無論理論上還是實踐中都可以確切地說英美母語者可以輕鬆無字幕搞定美劇。哥經歷過很多次旁邊不同背景的老美老英給我講解看不懂的地方,《House》這樣的專業醫療劇每一集也能吸引近2千萬的觀衆。

五、到底需要多少詞彙量呢?

語言學家用BNC這樣詞頻從高到低排序的合理詞彙表測試,讀懂小說最低入門門檻詞彙量是8~9千,而聽懂美劇是6~7千[6]。這個標準用的是相對於母語者的98%的涵蓋標準,其實對於非母語者要求會高很多,尤其當是詞彙結構低效時。

有同學會說那我背別的詞彙書怎麼樣?比方劉毅的那套從基礎詞彙到20000貌似很流行啊,其實哥也做過測試,並不比別的主流詞彙書來的效率高。可以告訴大家的是,**語言學家在掌握詞彙方法VLS(Vocabulary Learning Strategies)上常年關注和推薦的是通過自然語言情境掌握(natural context)。也就是說如果你擴大詞彙的方式是多讀英美報刊、多看電影、多和老外聊天、多寫英文信,不僅語言應用能力會提升、能獲得語言之外的知識樂趣、擴大詞彙量...更重要的是你的詞彙結構會更高效。也就是說通過這樣方式掌握詞彙,高頻詞會比低頻詞更早掌握。尤其對於中高級學習者,大量用英語,是突破英語各個方面能力的最佳途徑。 **

英鐵牛

註釋:
[1]"It was calculated that 98% text coverage (1 unknown word in 50) would be needed for most learners to gain adequate comprehension."
[2] "As Carver indicates, even 98% coverage does not make comprehension easy. Kurnia (2003), working with a non-fiction text, found that few L2 learners gained adequate comprehension with 98% coverage."
[3] BNC是全球最大的語料庫之一,收集了發生在英語世界的母語者使用英語的記錄,包括書面和口語的真實記錄。
[4] Project Gutenberg是一個收集了大量版權在公共領域的在線書庫。
[5] Relations between Ability and Social Status in a Midwestern Community. IV: Size Of Vocabulary
[6] "A vocabulary of 8,000 to 9,000 words is needed to read a novel, and even then, 1 word in
50 will be unfamiliar. ... 6,000–7,000 families for dealing with spoken text." I.S.P. Nation(2006)

母語人士詞彙量的圖表(來源testyourvocab)

1W詞彙量不過是國外8-9歲小孩的平均水平,你們顫抖了嗎?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章