这900字,占了大藏经字数的90%,您有不认识的吗? 赵居士是位技术牛人,他开发了一个网上阅藏平台(http://cbeta.),可以在线阅读大藏经并查阅工具书。该平台的最大优点是可以直接看简体,因为它有一个目前最好的繁简转换器。 为什么不直接用Word的繁简转换器呢?因为Word做得太烂,不敢用,用过的人都知道。繁简转换分两步,先把异体字合并到正体字,再把正体字转成简体字。转换程序并不难写,最难的是梳理异体字、通假字的关系,需要一个一个搞清每个字的来龙去脉。这件事难住了Word,它不是工程师能解决的,需要有文字专家和工程师密切配合。可能也因为Word觉得这事不重要,不值得认真做。 但对佛子们来说,繁简转换太有用了。于是赵居士一狠心,花了两三年时间,自己做出了最好的繁简转换器。作为技术牛人,他可以轻松搜出经中出现过的所有字并统计每个字的出现次数,因而工作效率比文字专家还高。但巨大的工作量仍然是难以想象的。以一人之力做出这么庞大的系统,我佩服得五体投地。 赵居士用他的平台顺手统计了一下,cbeta共有2.3亿字(除大正藏外还有很多藏外文献),其中出现频率最高的600个简体字(繁简相同字)占15278万字,频率最高的300 繁体字占5479万字,这900字共占2.077亿字,90%。下表就是这些字(按频率排序)。大家看有没有不认识的? 600个简体字 不一是有之者法如大三 二故生佛此所以也云人 中明心若得十其而相行 名四即何上言等曰非已 道自知作世能菩亦下五 我身第切子善因至天智 在成可他正性分界出彼 地本空今前文初受方事 六王入僧同住皆又然意 山多日元依解修起巳色 未真八欲乃及教念德七 定或常便果通宋根提尊 比次卷阿令去由清戒的 合甲用具丘持苦利藏摩 光乘理汝慧年量南力外 百答取但九立波安句信 唯字家金千月思化耶了 反引水妙神境死足和重 想那眼向白先卍品食示 就音求俱婆既施陀宗破 尼沙度小物位深捨主功 般寺衣各流舍己增土迦 老供集喜居海命尚妄更 槃堂甚香情坐疑共涅西 使往女普止夫除士悉要 古竟高手罪必福到祖悟 失耳蜜指少州火伽梵部 且乙漏凡照平矣寂口座 始夜疏順益偈喻目慈惟 精石遍新染犯莫公劫林 好差首直最病障微昧悲 律趣殊印形似造斯校忍 母邪城帝乎告久加面假 男譬支略花近太敬弟放 治惑周全退俗吾布于密 底都勤父北遂像木息辨 曾落伏被打玄魔志奉只 路看永迷毘含味末究半 原易某表熟塔倒雨聚昔 磨哉散建威右覆感遊河 授望制鬼宿草恒章唐却 祇遮象愚杖畏青幻雪里 牛超序旨鼻露待述容代 无典室宣致嘉任承特存 你忽影端悔丈舌氏吉越 珠忘什害瞋朝徒乞良江 恩春童守互恐宜遇置眠 拈喝笑殿列慢田峰君演 疾翻左拜垢院仁毛回源 察器服臣侍浮遣嗣弗消 留野版娑固檀寒救怖并 逸毒兼羯姓步契友玉注 仰泉交盛降工偏拄掌恁 收叉熏肉融推民亡美休 孔仙呵速泥再弘堪巧官 段客嚩秋尸恭例毗洞接 期勒希骨付臥登呼徹改 菴夏毀孤活勿免患咸助 奇垂唱竺送劣逆科展夷 曲黑拂池延皇默畜敢房 300个繁体字 無為於說諸見師時來經 眾薩謂緣處應淨羅種義 與後問別門則觀當宮論 識釋聖復現從聞實滅離 隨禪覺異業難斷語樂間 體過聲續盡華國餘長勝 發學寶爾惡麼雖會著轉 證須顯嚴願開結圓廣數 萬頭對攝脫內還雲舉諦 歸惱風滿記請報將總執 進塵傳訶愛動遠邊終約 禮龍兩稱達習養猶護煩 彌頌變類極輪書譯親東 興樹靜漢虛觸貪聽豈賢 這壞機註壽誦礙剛剎獨 許屬計頂錄莊靈雜陰議 裏殺箇尋號並誰違蘊墮 設葉絕儀標藥讚決補隱 馬黃際氣虗迴沒畢亂歡 蓮輕財歲夢徧獄燈鉢繫 參囉歎漸蓋細齊癡臨濟 幾雙堅頓權據窮節編陽 況縛慮勸點舊調獲呪辯 飲焉資兒憂優億關圖懷 燒曇場謹寧個厭歷簡積 乾車陳橫懺麗辭連領鏡 闍巖縱貴維讀鳥導園話 棄樓講誠詣視運飯勞顛 飛擇鐵張遺慶載揚減諍 臺勢熱憶戲損電題峯謗 2019年7月30日星期二 |
|