|
詞涯八千
一個人能運用的語言不超過八千個
語言不會任意改變造成溝通斷絕,還有另外一個因素:人類基本語言符號的認知能力。每個人對自己語言的辭彙有甚麼樣的掌控能力?簡單的說,一個人能夠運用多少個必須刻意學習的字詞?我們認為一個人能掌控的字詞數目不是無限大,而是有涯邊盡頭,一般不超過八千,所以說「詞涯八千」
。每個人所能掌握運用的語言基本符號不超過八千個,這就使語言的變化有個制約,限制代溝的寬度。
「詞涯八千」的理據是古往今來的作者的用字遣詞數目。中央研究院謝清俊教授統計過二十五史電腦檔案的文字,我列出成書年代、各本書所用的字種數目以及書名,並且加入字典所收字數來比較。甲骨文的三千字是大約的可辨認的數目,其他是電腦統計得出數量。
公元5世紀以前
1300BC 3,000 甲骨文
93BC 5,122 史記
5 5,340 訓纂篇(字典)
83 5,833 漢書
100 9,353 說文解字(字典)
289 4,388 三國志
4世紀 12,824 字林(字典)
445 6,161 後漢書
488 5,842 宋書
6-7世紀
514 4,962 南齊書
543 22,726 玉篇(字典)
554 5,417 魏書
636 4,973 梁書
636 4,033 陳書
636 4,032 北齊書
636 4,161 周書
648 5,997 晉書
656 5,592 隋書
659 5,376 南史
659 5,572 北史
10-13世紀
945 6,346 舊唐書
974 5,109 舊五代史
997 26,430 龍龕手鑑(字典)
1008 26,194 廣韻(字典)
1039 31,319 類篇(字典)
1060 6,771 新唐書
1067 30,000 集韻(字典)
1072 3,909 新五代史
14-18世紀
1344 4,071 遼史
1344 5,264 金史
1345 7,389 宋史
1370 5,854 元史
1615 33,179 字匯(字典)
1671 33,549 正字通(字典)
1716 47,035 康熙字典(字典)
1739 7,124 明史
現代
1915 48,000 中華大字典(字典)
1927 8,080 清史稿
1959 49,965 大漢和辭典(字典)
1968 49,905 中文大辭典(字典)
1986 54,678 漢語大字典(字典)
二十五史各本書所用的總字數從十幾萬到四百多萬字,而所用字種只有幾千,上限是八千,即使同一時代的字典已經收入幾萬個字,每本書所用的字也只是幾千而已。圖一以藍色畫出字書收字總數,以紅色顯示各本史書所用的字種數目。紅色都不超過八千的上限。我還從過去英文的兩百本著作用電腦算出每個作家在每本書裡所用的字,如果不包含過去式、多數詞尾等的語形變化,其數目也很少超過八千,因此我們提出「詞涯八千」,來解釋人類語言認知能力。
人能夠從有限的語言基本符號衍生出許許多多複合詞、詞組、句子和篇章,這是人運用語言的能力,讀者或聽者不用刻意個別學習。但是,人所能掌握運用的基本詞語符號數量有限,不能任意擴大,語言也就不能任意改變,代溝的寬度也就有了制約。
|