當代中國最貴的漢字是什麼? 最貴的漢字 拆字 合字 不拆不合

最貴的漢字

“你說,當代中國最貴的漢字是什麼?”,有一天同事忽然問我。

“【諾】,因爲一諾千金”,我脫口而出。

“不對。”

“【字】,一字千金?”

同事搖頭。

“愛?”

“這個是無價的,不算。”

“人才。不是說 21 世紀最貴的是人才嗎?”

“一個字,你這不算。你咋不說家書抵萬金呢?”

“算了,不猜了。”,我腦海裏爲數不多的幾個字轉了一圈,沒有一個符合的。

我有些疑惑地看着他,表示放棄。

“答案是拆。”

“拆?”

“對。拆,拆遷的拆。”

說完,同事笑了笑。笑中帶着三分世俗,六分狡黠,還有一分淒涼。

"拆,財。一拆,財就有了。"

不過,我卻糊塗起來,“那麼這個拆,是和你有關係呢?還是和我有關係呢?”

“都有關係”,同事頓了頓,“也都沒有。”

“和我倆有啥關係,我們把房東的房子拆了周遊世界?”

"No,我們今天來拆點別的。不拆房子。"

“不拆房子,那拆什麼?”

“拆字。”

“字?”

“對。字,漢字的字。”

拆字

“漢字,知道吧?”,同事繼續說着。

“廢話。小學生都知道的問題。”

“漢字的三要素知道嗎?”

“音形義。”

“你知道如何用程序實現兩個形近字的判斷嗎?”

“你是沒關注老馬吧,他前兩天剛寫了一篇 NLP 形近字的實現算法。”

“那篇算法我看了,一般般吧。有些場景不適應。”

“比如?”

“比如【明】與【冐】,結構不同,偏旁不同。但是他倆像不像?”

真實文化限制了我的想象力,在震驚了 0.9 秒之後,我立刻反駁。

“說的輕巧,說的你能解決這個問題一樣?”

同事笑了笑,“難也不難。這就涉及到今天的主角,拆字。”

“哦。願聞其詳。”

“我們可以把漢字拆開最基本的組成部分,比如【明】可以拆成【日】【月】,【冐】也是類似的。然後去比較每一個部分是否相同,用來計算相似度。”

“這倒是挺不錯”,我不禁點頭稱讚,“那麼問題來了,這種拆字程序要多久才能實現呢?”

同事笑了笑,“在下不才,這兩天下班期間寫好了一個拆字程序。”

“秀啊,你給拆一個秦時明月漢時關我瞅瞅。”

同事小手一敲,結果輸出 手乀禾日寸日月冂一一水又日寸丷天

“可以可以。除了 NLP 形近字,你這程序還有啥用?”

“用處挺多的,不過最主要的是帥。比如這張我用拆字結合雲圖自動生成的圖片。”

技術總會過時,但是帥,卻是一輩子的事情。

“你知道這個圖,是由哪一句話拆分得到的嗎?給你個提示,出自一首詞。”

合字

想到同事給出的難題,最近日夜難寐,到底要怎麼解呢?

正所謂,天下大勢,合久必分,分久必合。

既然漢字能拆分,那麼,能不能合併呢?

於是花了兩天時間,寫了一個漢字的合併程序。

可以把 手乀禾日寸日月冂一一水又日寸丷天 合併爲 秦時明月漢時關

同事看了後,覺得挺有趣。

“你這個怎麼實現的,有點意思。”

“不難,和漢字的拆分邏輯反過來就行。”

“比如日月合併的時候,你如何判斷是明還是冐呢?”

“我做了一個字頻統計,單個漢字字頻高的優先。當然有時候這並不合適,最好還是結合 n-gram 的方式,提高上下文正確率。”

“不錯。匹配算法呢?”

“FAST-Forward 算法,和以前開源的敏感詞類似。”

“可以可以。那麼,我一開始給你的謎面你解開了嗎?”

不拆不合

“運氣好,解開了。”

“怎麼做到的?”

“我在晚上找到了全宋詞,不過想到你出的題目肯定是常用的詩詞,所以第一步縮小了範圍。”

“然後呢?”

“我把你圖片裏的部首合併,漢字窮舉。然後做檢索。找到之後,把內容正向拆分對比,運氣不錯找到了。”

“思路不錯。是不是發現拆分用來做驗證碼也挺不錯的。”

“是的,比起傳統驗證碼會被機器學習的風險,這個識別的成本相對較高。”

“字拆分用來融入到解密遊戲也不錯,類似《文字遊戲》之類的,招你做技術研發也不虧。”

同事笑了笑,嘆息道:“我最近在想,有時候不是什麼事情都要有用吧。技術總會過時,文化卻源遠流長。拆也好,財也好,有了固然好,沒有也無妨。”

我一時不知道說什麼,看着昨晚程序解開的謎底,那裏有一行字。

怒髮衝冠,憑欄處、瀟瀟雨歇。擡望眼,仰天長嘯,壯懷激烈。三十功名塵與土,八千里路雲和月。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章