[轉貼]電腦裏沒有的漢字不要用

轉貼:

本文於2003年6旬上發表在國家語委的論壇上,從技術角度對人名用字問題提
出個人看法。這期間媒體報道了國家要對人名用字制定規範,許多人士紛紛表達
自己的見解。

                    電腦裏沒有的漢字不要用
                            劉衛民

    最近許多人在談論人名用字的規範問題。規範是對一些社會行爲的引導、約
束和限制。規範來自政治傾向、文化背景和技術特徵方面的考慮。取名時對前二
者一般都能自我約束。不好想象中國人會起名叫“王反華”、“李漢奸”。有沒
有人叫張小婾呢?婾音yu,愉快的意思,這名字不錯。可是別忘了,婾還音tou,
意同偷,那不是張小偷嗎?我有個同事叫龔德信,南方人,在當地這名字不錯。
可是到了北京就壞了,大家都知道“德性”是什麼意思。可以取名王水手,但不
好叫“王氵扌”,因爲氵和扌不是獨立的漢字,也沒有單音節的讀音。我不知道
有沒有叫“陸瓩”的。“瓩”也沒有單音節的讀音,一般讀成“千瓦”,
它是電力單位。這樣一來“陸瓩”就成了陸千瓦了,功率還不小。
    政府要不要對取名用字的政治傾向和文化內涵進行規範,我沒有發言權,可
聽聽社會科學界人士的意見。我想從技術方面談些看法。
    取名用字規範問題的提出主要來自技術方面。現在社會生活的方方面面都離
不開電腦。手裏拿的、脖子上掛的手機是個小電腦,到銀行取錢是跟電腦打交道,
工作人員只是操作界面。電腦壞了什麼事也辦不成。電腦滿足了人的慾望提供了
極大的方便,也約束了人的行爲。事實上是電腦要約束人們取名用字的自由。說
得明白點,電腦裏沒有的字你別用!
    電腦裏到底有多少漢字呢?以DOS爲基礎的漢字系統至今還只能使用國家標準
GB2312-80中規定的6763個漢字。在這種系統中連老總理朱鎔基(或朱鎔基)先生
的名字都不能正常輸入和顯示。據說目前遍佈全國的證券交易系統就是這樣的。
還在使用早期電腦的地方,用的大概都是這種系統。在上個世紀八十年代,世界
各地的計算機系統,特別是軟件系統的狀況,再加上國內的實際情況,我們的漢
字只能在94*94=8836個碼位內安排。GB2312就是在這種技術環境下的產物。當然,
這種系統是不能充分滿足社會生活各方面需要的。經過二十年來多方面的努力,
後來有了GBK字符集,制定了GB1300國家標準。Windows95及其升級系統採用這一
標準,能夠處理包括6763個簡體字在內的21003個漢字。使用這種系統一般不會在
用字方面遇到麻煩。如果一定要在21003個漢字以外取名,這種系統當然滿足不了
要求。
    能不能把電腦中的漢字數量繼續增加呢?按照GB1300的方案,漢字的碼位空
間是126*190=23940。這裏除了21003個漢字、884個符號以外,只剩下2053個供
局部和臨時使用的碼位。從此看出,在這種體系結構之下大量擴充漢字是不可能
的。現在的體系結構是兩個字節表示一個漢字。要擴充漢字必須採用多字節(比
如4字節)結構,這在技術上不是簡單的事情,而且涉及投資和廠商的問題。進
一步擴充漢字不僅要使操作系統能構處理多字節漢字,更重要的是大量應用程序
特別是數據庫系統怎麼辦的問題。
    早在2000年媒體就報道過,沒有兩萬七千字的電腦到2001年都要“下崗”。
當時我對這一報道很不理解。我知道,2000年國家正在制定擴充漢字的標準GB
18030,增加6530個4字節代碼的冷僻字,加上現有的21003個總共是27533個。
標準是制定了,字庫、輸入和顯示的問題都可以解決,但是如何在通用計算機系
統,特別是數據庫系統中加以應用,我一直拭目以待。2000年我曾協助北京齊通
公司在他們的電腦終端產品中實現了21003個雙字節簡繁體漢字的輸入,還實現
了6530個4字節冷僻漢字的輸入。由於配用齊通終端的計算機系統的應用軟件不
能處理多字節漢字問題,這6530個漢字至今還沒有用上。
    以上說的是通用電腦系統,特別是處理數據的數據庫系統,再擴充漢字將是
很困難的事情。人的姓名是數據庫系統中的重要內容。因此,我的意見是,電腦
裏沒有的字就別用。
    至於大量報刊、雜誌、書籍出版物排版印刷所用的漢字系統與上面所說的電
腦通用系統相比有它自身的特點,不必限定在兩字節的條件下,可以處理更多的
漢字。也就是說,出版物中可以超出21003個漢字,達到27533個甚至更多,並不
會像數據處理系統那樣困難。不過在輸入21003個以外的漢字時,現有的通用系
統就無可奈何了,應當使用專用的輸入終端設備。
    我還想說一下,電腦裏有的漢字也不能隨便用。
    首先,沒有單音節讀音的不規範漢字和偏旁部首不要用,儘管它佔據一個碼
位,在電腦裏同普通漢字有同等地位。
    其次,不知道讀音的漢字不要用。這21003個漢字中許多讀音無從考查,例
如“仩”,至今我還沒有查到讀音。我查遍了有八萬漢字的“中華字海”,最後
還有五百多個電腦漢字查不到讀音。我深切企盼哪位文字專家能給予指教,幫我
搞清全部21003個漢字的讀音。
    第三,這裏有一個特例,起名字千萬別用繁體“裏”字。現在普遍使用的
Windows漢字系統中有兩個代碼對應這個字,一個是D159,另一個是FD9F。如果
有人叫劉裏外,數據庫裏存的是劉裏(D159)外,當調用他的材料時輸入的是卻
是劉裏(FD9F)外。電腦是認死理的,這兩個裏外不是一個人,於是什麼事都辦
不成,跟操作人員吵架也沒有用。如果不瞭解計算機內部的技術詳情,這種麻煩
將伴隨劉裏外先生的一生。我不知道計算機系統裏還有沒有同類問題。這種特例
也說明了取名選字不能太任意。
    第四,除了技術問題以外哪些字不能用,這不是我的話題。
                                            2003.6.6

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章