青青草国产成人av片免费/香港三级日本韩国三级专线/国内自拍在钱/天堂国产女人av
論壇
排行
專題
Collection
學院設施
登錄
加入學院
搜索
本版
用戶
每日簽到
任務中心
勛章中心
發帖際遇
貝殼夢
PassWord
RoseTta
海龜湯之謎
邏輯訓練場
百科學院
反切碼
回復
反切碼
樓主:
165855
|
查看:
9197
|
回復:
24
查看:
9197
|
回復:
24
[密碼學習]
反切碼
簡潔模式
165855
發表于 2021-12-26 22:09:57
|
2021-12-26 22:20編輯
|
發自
安卓客戶端
本發明涉及漢字編碼領域,特別是順應漢字的形與音拆字取碼的反切碼漢字編碼法。
在計算機漢字輸入方面,目前廣泛應用的“五筆字形”,其在使用過程中有以下缺陷一是不按漢字構成拆分,不符合傳統拆字習慣,有些拆分不符合筆順規范。如“爸”,本應一分為二,拆為“父巴”,卻一分為三,拆為“八乂巴”。“革”字本應一分為三拆為“廿口十”,卻一分為二拆為“廿”加一個自造字根(革字的下部)。“犭”本是一傳統部首,卻人為地取前二筆為一自造字根。“回”本應先寫“冂”,次寫“口”,最后封筆寫“一”,卻拆為“口口”,在語文教學中,這叫倒筆。這種拆分既違背傳統拆字習慣,也不利于語文教學和維護祖國語言文字的純潔;二是使用鍵盤輸入字根時,既不管字根本來的讀音,又人為地為鍵盤字母另行定義,如將“王五一”三個不同音的字均賦予G鍵名,致使原本互不一致的大量字根(約193個)讀名與鍵盤字母名稱之間求同譯轉,增加了記憶的難度;三是編碼規則較繁,不易掌握,難學易忘。
另外有一類和英文鍵名掛鉤的編碼,將漢字部件的形態與英文字母形態求同,如“命”,取碼為“AOP”。這種編碼也與人們認字習慣相背離。
最近面世的一碼輸入法,是一種順應漢字的形與音拆字取碼的漢字編碼,如“香”讀xiāng,拆為XHR(xiāng禾日),但一般人對不知讀音的字(如“緙”)無法定碼。
本發明的目的之一是克服上述缺陷,為廣泛的人群提供一種符合人們認字習慣、規則簡單、操作方便、易學易記的漢字輸入法。
在辭書檢索方面,現在的辭書,大多是按讀音歸類排序,按部首檢索。其弊端是按讀音歸類,造成了多音字的肢解,更主要的是不知讀音的字不能查找。按部首檢索,查一個字得先判斷屬哪一部(有些字判斷部屬較難),再數部首筆畫數找到部首,再數字的筆畫數找到那個字,然后才是依據頁碼翻頁。
一碼輸入法的漢字編碼,由于憑借漢字讀音取碼,不能用于辭書檢索。
本發明的目的之二是用本編碼作辭書檢索,直接翻頁,一步到位,可以避免現在的辭書在翻頁前通常的繁瑣查找過程。
本發明的目的是按下述技術方案實現的順形拆分;順音取碼;字、詞編碼長度不大于四碼,不足四碼者,用二次分解法和反切法截取識別碼補位以分離同碼字。
本發明和現有技術相比具有以下優點一是順應漢字構成拆分漢字,符合傳統拆字習慣,適應語文教學,有利于祖國語言文字的純潔。
二是按漢字部件讀音取碼,利用計算機鍵盤英文字母鍵位作漢語拼音字母鍵位,不人為地為鍵盤字母另行定義,使文字輸入工作操作簡易,避免了原本互不一致的大量字根讀名與鍵盤字母名稱之間求同譯轉,沒有記憶的負擔。
三是用獨創的二次分解法、反切法拆分取碼,使規則簡單,易學易記。
四是本編碼用于辭書檢索,漢字查找可以直接翻頁,一步到位。
下面結合實施例對本發明作進一步說明本發明是一種順應漢字的形與音拆分取碼的漢字編碼法,包括順形拆分;順音定碼;字、詞編碼長度不大于四碼,不足四碼者,用二次分解法和反切法截取識別碼補位以分離同碼字。
上述二次分解法是先作第一級分解,將兩件字與三件字分解成部件,或將兩字詞、三字詞詞條分解成單字,取主碼后,再作第二級分解,將部件或詞條里的單字拆分以便截取識別碼。
兩件字以偏旁部件或筆畫部件為前件的兩件字,先作第一級分解,將字分解成兩個部件取主碼后,再作第二級分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識別碼;以成字部件為前件的兩件字,先作第一級分解,將漢字分解出兩個部件取主碼后,再作第二級分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識別碼。
三件字先作第一級分解,將字分解成三個部件取主碼后,再作第二級分解,將第三件拆分,取第三件之末件作為識別碼。
兩字詞先將詞條作第一級分解,按兩字讀音的音首第一個字母定主碼,然后再作第二級分解,將兩字切分,用兩字前后反切法補上識別碼。
三字詞先將詞條作第一級分解,按三字讀音的音首第一個字母定主碼,然后再作第二級分解,將第三字切分取最后一件定為識別碼。
上述反切法是一種對兩件字或兩字詞切分反取的方法。
前件為偏旁部件或筆畫部件的兩件字,先作第一級分解,將字分解成兩個部件取主碼后,再作第二級分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識別碼;前件為成字部件的兩件字,先作第一級分解,將字分解出兩個部件取主碼后,再作第二級分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識別碼,兩字詞第一次按詞條兩個字的讀音取主碼后,再將兩字分別作第二次拆分,然后用前字取首、后字取尾的兩字反切法截取識別碼。
實施例一.順形拆分1.按漢字構成拆分漢字由三種部件構成現成漢字;偏旁部首;基本筆畫。本方案基本順應漢字構成拆分。頂,形聲字,從頁丁聲,本方案拆為。‘丁頁’(兩個成字部件)。信,會意字,從人從言。本方案拆為‘亻言’(一個偏旁部件,一個成字部件)。人,象形字,象側面站立的人形,象人的手臂與腿,本方案拆為‘丿ㄟ’(兩個筆畫部件)。
2.按漢字書寫筆順拆分。如“式”字,不拆為“弋工”二字,應按書寫順序拆為“一工 ”;“脊”字,起筆應按國家規定的筆順規范先寫“人”字的兩邊,拆為 人月”。“丑”,拆為“刀二”,不拆為 ”。
3.隨字取形部件取形以印刷體規范漢字為準。如“周”字,是“冂土口”,而不是“冂吉”。“或”字第五畫是挑,不是橫。“舍”,是“人干口”,而不是“人舌”。
有的筆畫在不同字里會發生不同變化,則根據不同變化隨字取形。如“乂”(yi),在“父”字里“乂”拆為“丿ㄟ”,而在“風”字里則應取為“丿丶”。
本編碼視傳統的變形體為相似形,并約定一些形體為相似形。如“看”字,“丿”起,起始件為“手”,應拆分為“手目”。“拜”字,應拆分為“手三十”。 是“卜”的相似形。歪尾 等同“羊”。 承襲辭書傳統,視作“小”的同一部首。將“親殺茶”等字的末件視作“木”;將“木”字的后三筆約定為“小”。
以上詳見附錄二、三的有關相似形的說明。附錄中未列又不屬基本保持原貌的傳統變形體者,均不作相似形處理。如“斤”字,最后一筆無鉤,是“丿丿一丨”,不是“丿丿丁”。“邦”,應拆分為“三丿阝”,而不是“豐”和“阝”;“壽”字則是“三丿寸”,不是“豐寸”。“判”則拆為“半”和“刂”。
4.取大不取小部件容量取大“三”,應拆分為“一二”兩件,不拆分為“一一一”三件。“鴻”,拆為“江鳥”;不拆作“氵工鳥”三個部件。“典”,拆為“冂共”;不拆作‘冂廿一八’四件。
部件級別取大漢字由三種部件構成現成漢字;偏旁部首;基本筆畫。依次排比級別,成字部件最大,偏旁部件次之,再次是筆畫部件。夂,拆取為“丿又”,不取為“クㄟ”。
5.中分取整如“巫”,拆為“一丨從一”;“坐”,拆為“從土”;“乖”,拆為“千北”“小”字的兩邊,視作“八”字被中分,“小”拆作 八”。取整時應注意筆形結構,如“乘”字腰中的兩邊合起來是一個“北”字,而收尾的緊密靠連的“丿ㄟ”兩筆不同于兩筆離散而有間隔的“八”,故“乘”字應拆作“乖丿ㄟ”,不是“乖八”。
6.上下結構靠上不靠下
“克”字中的“口”應上靠,拆為“古兒”,不拆成“十兄”;“天”字,拆為“二人”,不拆為“一大”。
7.左右結構靠后不靠前“拆”,拆為“扌斥”,不拆為“折丶”;“樹”拆為“木對”,不拆為“權寸”。“湖”拆為“氵胡”,不拆為“沽、月”。“彬”拆為“木、杉”,不拆為“林、彡”。
8.取常不取偏構字部件取簡體字、正體字,不取繁體字、異體字。繁體部件字、異體部件字應拆零分解。如“覆”字的下部“復”為“復”的繁體字,故“復”應拆零成“彳、復”兩個部件取碼;“蔥”,取“卄匆心”,不取“卄忽”,“忽”是“匆”的異體字。
構字部件不取古字如“番”,取“丿米田”,不取“采田”。“采”(biàn)為“辨”的古字,現在不用。“釋”,取作“丿米又丨”。
成字部件取現代漢語通常用字(范圍基本以GB2312的6763個漢字為準),不取生僻字。生僻字拆零分解,如“菌”字,拆為“艸冂禾一”,不拆為“艸囷”。“囷”(qūn)是生僻字,古指谷倉。“搋”,拆為“扌丿丿虎”,不拆為“扌虒”。“虒”(讀sī)字是生僻字。二.順音定碼按所取部件的普通話的讀音,取音首第一個字母為該部件的代碼,多音的表音部件則隨字定音。扁,常讀biǎn,又讀piān(扁舟),在‘蝙’字里取biǎn,代碼為‘B’;在‘篇’字里則取piān,代碼為‘P’。
“句”,一讀jù,一讀gōu(人名句踐讀gōu),‘夠’取碼為‘GD’(句多),‘佝僂’的‘佝’(gōu)取碼為‘RG’(亻句)。
對于全部讀音均與本字讀音不一致或無關聯的多音偏旁部件,采用常讀音定碼。‘耀’(yào)字的右件‘翟’,現在用于姓氏讀zhái,為常讀音,古代指稱長尾野雞讀dí。在現代語音里,此兩讀的聲、韻均與‘耀’(yào)的讀音無關。則‘耀’字取碼為‘GZ’(光翟)。番,常讀音為‘fān’,另在地名‘番禺’里讀‘pān’。在‘播’字里‘番’作部件取常讀音‘fǎn’定碼。
有些字其部件為多音件,本字也為多音字,如‘櫟’,稱樹讀lì,地名櫟陽讀yuè,則‘櫟’既取為‘ML’,也取為‘MV’;以應用廣泛的樹名音為正碼。三.取碼方法1.拆分漢字,取部件讀音的第一個字母為代碼。分BD(八刀)。祁SE(礻阝)。八PN(丿ㄟ)。
2.取碼以四碼為限,超過四碼者,取前三碼和最后一碼。永DZZN(丶フㄟ)。
3.兩件字用二次分解法和反切法截取識別碼以分離同碼字。
兩件字分為三類第一類,以偏旁部件(附錄二的55件)或筆畫部件(共8件)為前件的兩件字,先作第一級分解,將字分解成兩個部件取主碼后,再作第二級分解,拆分后件,用單件反切法,先切取后件之首,然后反取后件之尾作識別碼。如篁‘ZH·BW’(_皇·白王);簧‘ZH·CB’(_黃·艸八);篌‘ZH·RS’(_侯·亻矢);乏‘PZ·DN’(丿之·丶ㄟ)。
第二類,以成字部件為前件的兩件字,先作第一級分解,將漢字分解出兩個部件取主碼后,再作第二級分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識別碼。如別‘LD·KG’(另刂·口 第三類,兩件字中后件若為不能拆分的單筆畫部件(‘一丨丶乙’等),省略識別碼。如‘釓’,取碼為‘JZ’(钅乚);‘釔’,取碼為‘JZ’(钅乙);‘丸’,取碼為‘JD’(九丶);‘斥’,取碼為‘JD’(斤丶)。
用于計算機漢字輸入,第三碼取該字讀音的第一個字母為識別碼,第四碼取i補位,如‘釓’(gá),取碼為‘JZGI’(钅乚·gáI);‘釔’(yǐ),取碼為‘JZYI’(钅乙·yǐI);‘丸’,取碼為‘JDWI’(九、·wánI);‘斥’,取碼為‘JDCI’(斤、·chìI)4.三件字也作二次分解,將第三件拆分,取第三件之末件作為識別碼。如鶯‘CMN H’(卄冖鳥一)。犖‘CMN·S’(卄冖牛·丨)。
三件字的第三件若為不能拆分的單筆畫部件,省略識別碼。如及‘PZN’(丿ㄋㄟ)。用于計算機漢字輸入,第四碼取該字讀音的第一個字母為識別碼。如及‘PZNJ’(丿ㄋㄟ·jí)5.單筆畫的一件字(只“一乙”兩字,此兩字實際上是兩個筆畫部件),取其筆畫讀音定碼,用于計算機漢字輸入,再加補三個i作補位碼一HⅢ。乙ZⅢ。
6.詞語兩字詞先分別按兩字讀音的音首第一個字母定主碼,再將兩字切分用兩字反切法補上識別碼。如“中國”取碼為“ZG·KH”(中國·口一)。
三字詞先分別按三字讀音的音首第一個字母定主碼,再將第三字切分取最后一件定為識別碼。如“新氣象”取碼為“XQX·N”(新氣象·ㄟ)。
四字詞分別按四字讀音的音首第一個字母定碼。如“欣欣向榮”取碼為“XXXR”。
四字以上的詞,取前三字和最后一字各自讀音的音首第一個字母為編碼。如“西部大開發”取碼為“XBDF”。四.轉換與借位本編碼用于計算機漢字鍵盤輸入,將鍵盤中的英文字母鍵位轉換為漢語拼音字母鍵位使用。
其中英文字母鍵名V、U、I、O在本編碼中作為“借位代碼”,用于計算機漢字輸入借‘V’為含有‘ǖ’音的‘yu、yun、yue、yun’四音的代碼。‘雷’,輸入碼為‘VT·HT’。‘玩’,輸入碼為‘WV·HE’。‘朋’,輸入碼為‘VV·JE’。‘動’,輸入碼為‘VL·EP’。借“U”鍵位為“氵”的代碼,如“江”字,輸入碼為“UG·HH”;借“I”鍵位為“鄉”的代碼,如“編”字,輸入碼為“IB·HC”;借“O”鍵位為“扌”的代碼,如“打”字,輸入碼為“OD·HG”。五.部件筆畫部件。共有橫豎撇捺點折鉤挑(一丨丿ㄟ丶乙 )八件,按其讀音的音首第一個字母分別取字母H、S、P、N、D、Z、G、T,用于計算機鍵盤漢字輸入,相應地定在鍵位H、S、P、N、D、Z、G、T上。其識別與使用詳見附表一。
偏旁部件共55件,按其讀音分別定碼,即定碼為B的是勹、 冫、廣;定碼為C的是卄、巛、束、镸;定碼為D的是刂、 定碼為E的是阝;定碼為G的是變形艮;定碼為H的是灬、巟、 定碼為J的是冂、卩、丬、巠或 段、钅;定碼為K的是凵;定碼為L的是變形良;定碼為M的是一、宀、冃;定碼為P的是疋或 ;定碼為Q的是巧;定碼為R的是亻;定碼為S的是厶、彡、彐、纟、糸、_、 扌、饣、氵、礻;定碼為T的是乇;定碼為W的是攵;定碼為X的是 _、忄;定碼為Y的是乂、尢、 、讠、衤;定碼為Z的是廴、辶、 。其識別與使用詳見附表成字部件。成字部件取字范圍基本以GB2312的6763個漢字為準。部分成字部件及其相似形的識別與使用詳見附表三。六.附表附表一
筆畫部件的名稱代碼及說明部件 名稱讀音 代碼 說明與例字一橫héng H 作漢字稱yī,作組字部件一律稱héng不稱yī一(H),三(HE),下(HB)。
丨豎shù S丿撇piě P 從右上方向左下方運行提筆而收的,無論長短都稱‘撇’匕飛學北步(下左為短撇,拆為‘止丨 丿’)。
ㄟ捺nà N 人之辶。
丶點diǎn D‘習’字第三筆為‘挑’,‘飛’字第二筆為‘撇’,‘北’字左下為‘挑’,右上為‘撇’,均不視作‘點’。
乙折zhé Z 指稱一切帶轉折的筆畫,包括_ㄥ ㄋ乚 等。另 此形順依一般稱法,稱‘折’不稱‘橫鉤’。甲乙的‘乙’作漢字單用時稱yǐ,作組字部件時,稱為zhé,代碼為Z乙(Z),釔(JZ),釓(JZ)。
鉤gōu G 包括豎左鉤、豎右鉤 和斜鉤丁以弋。不包括帶轉折的鉤,如‘_’ 等。
挑tiǎoT 例北刁習兆。
附表二偏旁部件的名稱代碼及說明部件名稱讀音代碼說明與例字勹 包字框bāo B 例字包匍。
八字形bā B 包括在一切部位被中分的橫排而寫的兩筆。例字丫蘭益半卷豆小辦亦業夾傘善(羊 一口)潦。
冫 冰字旁bīn B 只限于左右結構的左偏旁冰凍冷決馮。‘寒習飛斗棗’中的兩筆不劃入‘冰字旁’。有些字的左旁兩筆并不是‘冰’,本方案只重形,不重源,為了統一,在左者一律稱作冰字旁。
在其它部位者,不論屬‘冰’不屬‘冰’,一律不劃入‘冰字旁’。
疒病字頭bìngB艸草頭形chǎoC 在上(艸草)在中(卄垂)在下(廾弄),一律約定稱為‘草’。正例莽葬共開弄弊戒。相似形甘(廿二),其(廿三八)。
巛 三拐川chuān C 例字巡甾(zāi)巢邋(lā)鬣(liè)朿 刺字旁cì C 例字棘刺棗策。‘朿’本非偏旁部件,因不是現代通常用字,故納入偏旁部件。
镸 變形長cháng C 例字套肆髟刂立刀旁dāoD只限于左右結構的右偏旁。‘師堅而介’這類字的兩豎(有的是撇與豎)不劃入‘刂’,而按兩個筆畫部件取碼。‘氘’,不取作‘氣刂’,而取作‘氣丿丨’。
ク斜刀dāo D例字危芻急負爭色龜免奐象詹久夕。只限于筆順相同的部件,不用于‘萬方敖’等字,這些字里的‘ク’筆順是先折后撇。‘欠’字開頭兩筆不視作‘ク’。
阝雙耳旁ěr E在左在右統稱為‘雙耳旁’。
變形艮 gèn G例字即既爵灬四點火huǒH例字然煮煎熬焉燕。‘燕’字四點本不是‘火’,本方案重形不重源,約定‘灬、’的代碼一律為‘H’。
巟偏旁巟huāng H例字荒慌謊。
虎字頭hǔH例字虎虐滹璩冂偏旁冂jiǒng J例字迥炯同貝巾見丹冊冉(冂丨二)而身敝曲典裔商骨日曰月。
卩 節字底jiē J例字節癤即爺命印衛卯卸卿卻叩。‘卩’本為符節的‘節’,不稱單耳旁。在‘報服赧’等字里的相似形,也視作‘卩’。
丬 將字旁jiāng J經字旁jīngJ 叚 假字旁jiǎ J假葭瘕遐瑕暇霞钅 金字旁J凵 偏旁凵kǎn K讀kǎn。例字凼兇。
變形良 liáng L例字郎朗。
冖 冪字頭mìM 冖是冪的古字。例字冪冥蒙農冗孛鶴榮愛舜亭帝帶學常堂黨裳棠嚏帶沉骨。
宀 寶蓋宀miǎnM取古音讀為miǎn。
冃 冒字頭mào M‘冒’字的上件‘冃’,從冂從二,不是‘曰’。‘冒’字應拆分為‘冃目’。‘冕’,上件‘冃’,不是‘曰’。‘冕’字應拆分為‘冃免’。例字冒冕勖帽瑁。
疋() 異體匹pǐ P稱腳讀shū。讀yǎ時,古同‘雅’。又為‘匹’(pǐ)的異體字。本方案納入偏旁部件,取音為pǐ楚胥疏。
犭犬字旁quǎn Q例字狗貓狼猝狺(yín)獨獅。
亻單人旁rénR ‘在存’兩字的第二三兩筆作‘亻’字件取碼,‘在’拆為‘一亻土’。‘存’則拆為‘一仔’。‘段’字起首兩筆不視作‘亻’。
厶私字旁sī S 私幺公雄。
彐橫山shān S 例字當芻急尋靈帚錄雪彗艮侵殷。包括下列字里中橫出頭的相似形事尹肅隸聿爭妻秉兼捷慧。
彡三撇旁shān S 例字杉釤衫須。
纟絞絲旁sī S 練細。
糸絲字旁sī S 讀sī時,古為‘絲’字繁體(糸糸)的省寫,‘纟’本作‘糸’。
另讀mì,細絲。本方案取音為sī紊素。
生字主體shēS 例字生青隹(亻丶一 ng
氺變形水shuǐ S泰滕求。
扌提手旁 S饣食字旁 S氵三點水 S礻示字旁 S攵偏旁文wénW 小字形xiǎo X例字少光肖當尚黨嘗賞東(七小)樂(丿_小)爾曾雀木未耒束柬秉敝。‘不’字‘一’下三筆的筆順與‘小’字不同,不能視作‘小’。
_興字頭xīng X例字興學_變形心xīnX恭慕忝隳。
忄豎心旁 X乂偏旁乂yìY正例刈義艾殺父兇風岡趙爽。相似形例字史吏更。‘乂’,本為漢字,并非偏旁部件,因不是現代通常用字,故納入偏旁部件。
尢尤字主體yóu Y例字尤(尢、)龍(尢丿、)。
禿尾羊yáng Y例字羔羲。
讠言字旁 Y衤衣字旁 Y廴建之旁zhī Z例字建延廷。
辶走之旁zhīZ走之旁建之旁,代碼同為‘z’。
爪字形zhǎo Z采受。
_竹字旁 Z以上55個為本編碼的全部偏旁部件,它們均屬不能單獨成字的部件。不在此55件之列的其它偏旁部件,如“匚 攵 ”等,均拆零處理。“彳(chì)豸(zhì)髟(biāo)”是次常用漢字,不是偏旁部件。
附表三部分成字部件及相似形部件字 讀音代碼 說明二 èr E兩橫畫作‘二’字取碼時,應以上短下長為準,否則不能當作‘二’字取形。‘王’,前兩橫上長下短,不能與‘丨’畫合成取作‘干’ 應拆分為‘一土’。‘戔’(上短下長),取為‘二し丿。‘氣’(上長下短),取為‘丿一一乙’。‘韋’(上長下短),取為‘一一 丨。‘垂’,為‘千卄一一’。‘重’為‘丿一申二’。
七 qiQ相似形車東切長。‘切’,左旁本為‘七’(從刀七聲),現規范為‘一し ’,本方案視作‘七’的相似形取碼。‘長’的第二三兩筆也相應地視作‘七’,‘長’取為‘丿七ㄟ’。
bǔ B卜字形上貞占盧卣卓桌睿。
幾 jǐ S例凡朵風凹(幾冂一)。
比字左旁biB比字左旁視作‘匕’的相似形比頃(只此二字)。‘化’、‘叱’、
‘齔’(chèn)字的右部為撇出頭,不視之為‘匕’。
木mù M木的相似形殺親茶。木字豎筆無鉤,‘殺親茶’此三字的有鉤的末件視作木的相似形。
罒sì S四字形(不視作‘目’)黑柬(一罒小)羅罹署罩。‘曾’為‘丷冂小一日’。
井jǐng J相似形例寒鞲。
曰yuè Y例字昌汩(gǔ)。約定只取‘昌’的下件‘汩’的右件從‘曰’(yuè),其它字的‘日’(rǐ)字形、‘曰’(yuè)字形,無論寬窄,作部件時,一律約定為‘日’(rì)。注意‘冒冕’兩字上部不從‘曰’而從‘冃’(mào)。
月yuè Y相似形例且(月一)直(十月二)具(月二八)。斜月旁然炙。
變形止zhǐ Z例足走疋婕。
六字形liù L例字立交旁帝商摘滴冥毅子zǐ Z作偏旁的‘孑’,不讀jié,代碼一律為Z孩孤。
冊cèC冊字形扁嗣龠。
yáng Y歪尾羊羞差著。
1.一種順應漢字的形與音拆分取碼的漢字編碼法,其特征是順形拆分;順音定碼;字、詞編碼長度不大于四碼,不足四碼者,用二次分解法和反切法截取識別碼補位以分離同碼字。
2.如權利要求1所述的漢字編碼法,其特征在于二次分解法是先作第一級分解,將兩件字與三件字分解成部件,或將兩字詞、三字詞詞條分解成單字,取主碼后,再作第二級分解,將部件或詞條里的單字拆分以便截取識別碼,兩件字以偏旁部件或筆畫部件為前件的兩件字,先作第一級分解,將字分解成兩個部件取主碼后,再作第二級分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識別碼;以成字部件為前件的兩件字,先作第一級分解,將漢字分解出兩個部件取主碼后,再作第二級分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識別碼,三件字先作第一級分解,將字分解成三個部件取主碼后,再作第二級分解,將第三件拆分,取第三件之末件作為識別碼,兩字詞先將詞條作第一級分解,按兩字讀音的音首第一個字母定主碼,然后再作第二級分解,將兩字切分,用兩字前后反切法補上識別碼,三字詞先將詞條作第一級分解,按三字讀音的音首第一個字母定主碼,然后再作第二級分解,將第三字切分取最后一件定為識別碼。
3.如權利要求1或2所述的漢字編碼法,其特征在于反切法是一種對兩件字或兩字詞切分反取的方法,前件為偏旁部件或筆畫部件的兩件字,先作第一級分解,將字分解成兩個部件取主碼后,再作第二級分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識別碼;前件為成字部件的兩件字,先作第一級分解,將字分解出兩個部件取主碼后,再作第二級分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識別碼,兩字詞先作第一級分解,將詞拆成兩個單字,按兩個字的讀音取主碼后,再將兩字分別作第二級拆分,然后用前字取首、后字取尾的兩字反切法截取識別碼。
4.如權利要求3所述的漢字編碼法,其特征是筆畫部件有“一、丨、丿、ㄟ、、、乙、 ”八件,按其讀音的音首第一個字母分別取字母H、S、P、N、D、Z、G、T,用于計算機鍵盤漢字輸入,相應地定在鍵位H、S、P、N、D、Z、G、T上。
5.如權利要求3所述的漢字編碼法,其特征是偏旁部件有55件,按其讀音分別定碼,即定碼為B的是勹、 冫、疒;定碼為C的是卄、巛、束、 定碼為D的是刂、 定碼為E的是阝;定碼為G的是變形艮;定碼為H的是灬、巟 定碼為J的是冂、卩、丬、 或 叚、钅;定碼為K的是凵;定碼為L的是變形良;定碼為M的是冖、宀、冃;定碼為P的是疋或 定碼為Q的是犭;定碼為R的是亻;定碼為S的是厶、彡、彐、纟、糸、 水、扌、饣、氵、礻;定碼為T的是乇;定碼為W的是攵;定碼為X的是 ツ、 忄;定碼為Y的是乂、尢、 讠、衤;定碼為Z的是廴、辶、 _、
6.如權利要求1所述的漢字編碼法,其特征是順形拆分包括依照規范筆順、順應漢字構成拆分,隨字取形,部件容量取大不取小,部件級別取大不取小,上下結構靠上不靠下,左右結構靠后不靠前,中分取整,構字部件取常不取偏。
7.如權利要求1所述的漢字編碼法,其特征在于順音定碼,按所取部件的普通話的讀音,取音首第一個字母為該部件的代碼,多音的表音部件則隨字定音,對于全部讀音均與本字讀音不一致或無關聯的多音偏旁部件,采用常讀音定碼。
本發明是一種順應漢字的形與音拆字取碼的漢字編碼法,包括:順形拆分;順音取碼;字、詞編碼長度不大于四碼,不足四碼者,用二次分解法和反切法截取識別碼補位以分離同碼字。本發明用于計算機漢字鍵盤輸入,簡單易學;用于辭書檢索,可以直接翻頁,一步到位。
15
16
分享
157094
1
|
發表于 2021-12-30 10:07:14
|
發自
安卓客戶端
有趣
169915
2
|
發表于 2021-12-31 07:43:10
|
發自
安卓客戶端
漢語言小孩背不下去書了好不容易過來摸摸魚,一看到反切,腦子下意識就是古代漢語
151308
2
|
發表于 2021-12-31 08:52:34
|
發自
安卓客戶端
理科生直接好家伙
169215
1
|
發表于 2022-1-4 21:12:53
|
發自
安卓客戶端
感謝分享
168598
1
|
發表于 2022-1-4 23:30:46
|
發自
安卓客戶端
喵啊
170105
0
|
發表于 2022-1-5 10:01:13
|
發自
安卓客戶端
感謝分享
154973
0
|
發表于 2022-1-5 19:58:56
|
發自
安卓客戶端
感謝分享
87447
0
|
發表于 2022-1-5 22:50:59
|
發自
安卓客戶端
感謝分享
169054
0
|
發表于 2022-1-6 07:08:00
|
發自
安卓客戶端
學到了,不過好復雜
返回版塊
1
2
3
/ 3 頁
尚未登錄
高級模式
您需要登錄后才可以回帖
登錄
|
加入學院
回帖后跳轉到最后一頁
發表回復
分享
復制鏈接