《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 以音節為輸入單位的藏文輸入模型研究

以音節為輸入單位的藏文輸入模型研究

2008-06-24
作者:王維蘭

  摘 要:藏文" title="藏文">藏文音節作為輸入的基本單位,建立了音節與詞的編碼模型" title="編碼模型">編碼模型以及音節輸入、詞匯輸入和聯想輸入的模型并實現了藏文輸入方案。試驗結果表明,該方案科學、合理。輸入方法簡單、方便、快速。
  關鍵詞: 藏文輸入 編碼模型 輸入系統模型


  藏文輸入是藏文信息處理的一個重要內容。目前藏文輸入法主要有基字輸入法、拉丁輸入法和區位碼輸入法[1]。基字輸入法類似于拼寫輸入法[2],國外的Wylie[3]輸入法即為拉丁輸入法。基字輸入法和拼寫輸入法都是將字丁拆分成藏文字母,然后規定編碼順序,或者按照藏文書寫規則依次輸入。Wylie輸入法是鍵入字丁的拉丁轉寫,從而轉換為藏文字丁。總之,這幾種輸入法都是以藏文字丁為編碼單位輸入的。根據字丁的疊加層數,有不等的擊鍵次數:基字字丁需2鍵;疊字(含元音)字丁擊鍵次數比層數少1;無元音的3層疊字則需4鍵。參考文獻[4]實現了一種藏文詞組輸入方案,其基本特點是按照單音節詞、雙音節詞、三音節詞、四音節詞和多音節詞分別以每個詞各音節的基字與后置字編碼,實現藏文詞輸入。本文建立以音節為基本輸入單位的輸入模型、詞匯輸入模型及其相應的聯想輸入,從理論和實現的角度解決藏文的快速輸入問題。
2 藏文輸入法編碼方案模型
2.1 以音節為輸入單位的可行性及其編碼模型的建立
  藏文音節結構的兩種形式如圖1所示。一個音節有7個成分,1、2、3、4、5、6、7分別為基字、上加字、下加字、前加字、后加字、又后加字和元音位置。除基字外,其它任何成分少一個或幾個,只要符合音節規則,都是合法音節。從左到右形成4個縱向單位,除第二個縱向單位外,其他三個部分都不缺或少一個、兩個、三個和四個,則分別形成四字、三字、雙字和單字音節。詞由一個或多個音節構成,音節之間用音節點分隔。


  目前在中文Windows環境下處理藏文,音節的每一個縱向單位即字丁占一個漢字位置。
  首先建立藏文音節編碼方案的模型,表示以音節為單位的輸入方案的可行性。根據參考文獻[5][6]的啟發并分析藏文的特點,定義了5個集合:(1)T={t:t是藏文音節}是規范藏文音節集。藏文有嚴格的音節拼寫規則,規范音節是本方案必須獲得的一個統計數據,根據已經統計的數據[7][8],集合T含有的元素個數約12 000左右。以此集為基礎建立如下各集。(2)W={為一個詞包含的音節數,w是詞}為藏文詞集。(3)C={c:c是鍵盤字符}是編碼字符集。C可以是小寫26個英文字母、大寫英文字母、10個數字0~9以及鍵盤上的其他字符。(4)S={s:s=C1C2……Cm,其中Ck∈C,k=1,2,……n是英文字母數目}是藏文數字、符號、音節、梵文代碼集。每個代碼s都是一個或若干編碼字符。因為S是T對應的編碼集,而不同音節有相同的代碼現象,如對三字音節:和雙字音節:的編碼就可能一樣,因為前一個音節中的第二個字母在第二個音節中是下加字(變形顯示),所以S集的元素個數小于T集,即|S|≤|T|。(5)L={==∈S,k=1,2,……m},m為詞li包含的音節數,li為詞的代碼串,對應的代碼}。
  設規范藏文音節集T中所有子集(即冪集)表示為2T,S為T的代碼集。根據以上集合可建立如下音節編碼模型。
  定義1 若g是S到2T的一個映射:g:S→2T,即s→g(s)且對任意的音節t∈T,g-1({t}≠,則稱g為一種音節編碼方案。若存在s∈S,使得|g(s)|>1,則稱g為有重碼的音節編碼方案,這時,g(s)中的藏文音節的代碼都是s。若對于每個s∈S,總有|g(s)|=1,則g為無重碼的音節編碼。
  若g為無重碼的藏文音節編碼,則g是S到T的單滿射。這樣s和g(s)一一對應。實際上g不是一個單滿射,這在實際設計中是允許的。反之,任何一個規范音節,根據某種編碼方式都有編碼。如果把以音節為單位的藏文信息輸入過程看成通過輸入音節代碼得到藏文音節的過程,則有:
  定義2 音節的代碼轉換為藏文的模型可以表示為:ti=g2°g1(si),其中gi(si)表示取得代碼Si的重碼音節集,g2表示重碼音節中的選擇處理,最后得到規范音節集中的藏文音節ti
  因為|gi(si)|≥1,即代碼Si所對應的音節至少有一個,當|gi(si)|>1時,即代碼Si對應多個音節,而g2表示從這多個音節中選取一個。可以由輸入者完成,也可以由計算機自動完成。如果自動完成,則必須通過音節的轉移概率或藏文語言知識的應用。
  因為信息輸入是一個狀態轉移過程,如前面定義的藏文音節集、代碼集、代碼字符集,可以建立如下音節輸入模型:
  定義3 代數系統<2T,S,g,,T>稱為以音節為單位的藏文輸入處理系統模型,其2T是藏文音節集T的所有子集(即T的冪集),稱為該代數系統的狀態集;空集表示初始狀態;T為終結狀態集;g稱為狀態轉移函數,是2T×S到T的一個映射:g:2T×S→2T。若用q表示狀態,則模型:(q,s) g(q,s)=q∪{g(i)(g1(s))}就表明在狀態q下,如果再輸入代碼s,則得到以s為代碼的重碼音節集g1(s)。n=|g1(s)|是g1(s)中所含元素的個數。g(i)(g1(s))表示從g1(s)的元素集合{g(1)(g1(s)),g(2)(g1(s)),……g(n)(g1(s))}中取定一個。
  因為藏文的詞都是由若干個音節組成的,所以當音節的代碼集是S時,若用f鍵符表示空格,則S+f表示音節代碼加空格符的集合。于是詞的代碼集為:
  (S+f)i-1S=S∪(S+f)S∪……∪+(S+f)m-1S=S∪(S+f)×S∪……∪(S+f)×(S+f)×……(S+f)×S的子集,其中m=max{|k|:|k|是詞包含的音節個數},于是有:
  定義4 若g是(S+f)i-1S到詞集W的所有子集2W的一個滿射,則g為一藏文詞輸入編碼方案。對于該編碼方案g,若有w∈W,則g(-1)({w})=是不允許的;若有s∈(S+f)i-1S,則可以有g(s)=
  有了藏文詞的編碼方案,即可以得到詞輸入系統的模型:
  定義5 一個詞輸入系統的模型是一個5元代數系統<2W,L,g,,W>,其含義如下:
  2W是藏文詞集W的所有子集,是該代數系統的狀態集;L=(S+f)i-1S是詞的代碼集;空集表示一個詞也沒有輸入時的初始狀態;W稱為系統的終結狀態集;g稱為狀態轉移函數,是2W×L到2W的一個映射:g:2W×L→2W,(q,l)|→g(q,l)=q∪{g(i)(g1(l))}。其中g1是一個詞編碼方案,它是L到2W的一個映射;g1(l)是代碼為l的重碼詞集合;g(i)是{g1(l)|l∈L}到W的一個映射。g(i)(g1(l))表示從集{g(1)(g1(l)),g(2)(g1(l)),g(3)(g1(l)),……g(n)(g1(l))}中選取一個,它是詞集W中的一個確定元素。
  從上面的" title="面的">面的模型可以發現,如果以s為代碼的音節集g(i)(g1(s))和以l為代碼的詞集g(i)(g1(l))的個數很多,在實際輸入法應用中可選擇兩種方法:一是手工鍵選,即在輸入法候選窗口通過翻頁選擇。如果每次都要不斷翻頁選擇,不僅打斷人的思維,也不能有效提高輸入速度。二是通過語言知識的統計和應用自動選擇。鑒于藏文語言應用研究的現狀,通過兩種辦法來解決這個問題:(1)詞頻。通過靜態的詞頻排序盡量減少翻頁,達到快速輸入的目的。(2)智能記憶。將靜態統計和輸入時的動態統計情況相結合,通過記憶,不斷調整靜態統計的結果,適應輸入者的動態需要,減少翻頁鍵選。
2.2 音節和詞的聯想輸入
  在設計聯想輸入時分為以下兩個層次。
  (1)音節輸入過程的聯想
  音節t可以用代碼s表示,而s=C1C2……Ck,Ci∈C,i=1,2,……k,C1C2……Ck是對一個音節的編碼。一個音節最多由四個縱向單位,七個成分組成,最少只有一個輔音字母,所以音節的代碼串是不定長碼。于是,音節的聯想可以有多種方式,如由前加字聯想可能的基字、上加字、下加字、后加字和又后加字;或由基字聯想可能的其他成分而組合成的規范音節。隨著代碼序列s的輸入,每個Ci的輸入既和前面字母的結合有確定性,又對后面有聯想結果,以供選擇,直到音節代碼輸入結束。
  (2)詞輸入過程的聯想
  詞的代碼由若干個音節的代碼組成,輸入第一個" title="第一個">第一個音節時的聯想是音節的聯想,輸入第二個及以后的音節時則進入詞的聯想。詞的聯想是根據前面的n個音節聯想的,當輸入第n+1個音節的第一個代碼時,聯想下一個可能音節的詞,依次類推。
3 實驗結果與分析
  前面用藏文的拉丁轉寫作為輸入代碼,實現了以音節為輸入單位的藏文輸入法。圖2為輸入窗口和選擇窗口,實現一個音節的輸入和聯想過程。當輸入y時,聯想出以為基字的所有可能的音節;當輸入yo時,聯想出以基字位置的所有音節;當輸入yos時,聯想出以為基字、后加字拉丁轉寫為sa的藏文音節(此時有惟一一項)。
  圖3為詞的聯想輸入過程。輸入一個6音節的詞(其拉丁轉寫為:kun brtags kyi ma rig pa),候選窗口序號1所在的詞即為要輸入的詞。如左側的輸入窗口和候選窗口所示,當輸入第二個音節的拉丁轉寫首字母時,聯想出所有第一個音節為kun,第二個音節的前加字、基字為ba的藏文詞。隨著輸入的繼續,候選窗口列表在已確定的前面幾個音節的前提下,聯想后面的音節。


  上述輸入方案以實現為目標,以實用為目的。在本方案的基礎上,設計和實現了一個藏文輸入系統。實驗表明該輸入方案科學、合理。
參考文獻
1 彭壽全,黃 可.漢字信息處理.成都:電子科技大學出版社,1994:336~360
2 柔 特,才智杰.班智達藏文詞組輸入法的設計與實現.少數民族語言信息技術研究進展——中國少數民族語言信息技術與語言資源庫建設學術研討會論文集,2004:228
3 谷文祥.關于計算機漢字信息輸入處理的一個新模型.計算機研究與發展,1995;(7):61~65
4 錢培德.計算機漢字I/O處理的數學模型.中文信息學報,1992;(2):46~51
5 王維蘭.現代藏文語言單位頻率和頻級關系的統計分析.科學技術與工程,2004;(5):413~417
6 王維蘭,陳萬軍.藏文字丁、音節頻率及其信息熵.術語標準化與信息技術,2004;(2):27~31

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲片区在线| 久久国产精品免费一区| 欧美日韩精品免费观看视频| 久久精品国产亚洲一区二区三区 | 亚洲另类春色国产| 亚洲国产福利在线| 久久精品国产69国产精品亚洲| 欧美怡红院视频| 久久99在线观看| 久久国产精品久久久久久电车| 欧美一区二区播放| 香蕉久久一区二区不卡无毒影院 | 亚洲尤物在线视频观看| 一片黄亚洲嫩模| 一个人看的www久久| 一本一本久久| 亚洲天堂av在线免费观看| 亚洲视频专区在线| 亚洲在线视频一区| 欧美亚洲免费在线| 亚洲成人资源网| 亚洲精品国产精品国自产观看 | 久久久久久久精| 久久亚洲综合| 欧美91大片| 欧美日本在线视频| 欧美视频网址| 国产精品色在线| 国产欧美综合一区二区三区| 国产欧美一区二区三区久久人妖| 国产情侣一区| 亚洲精品美女| 久久爱www久久做| 欧美亚洲视频一区二区| 欧美在线国产精品| 亚洲国产另类久久精品| 亚洲精品视频在线看| 日韩一区二区久久| 亚洲一区二区三区免费观看| 欧美有码在线观看视频| 久久女同互慰一区二区三区| 欧美二区视频| 国产精品国产三级欧美二区| 国产手机视频精品| 亚洲国产精品成人综合色在线婷婷 | 国产日韩欧美不卡在线| 精品91久久久久| 亚洲免费高清视频| 亚洲欧美精品在线观看| 亚洲国产小视频在线观看| 在线综合亚洲| 久久久国际精品| 欧美精品一区二区三区在线播放 | 亚洲一区二区三区午夜| 欧美与黑人午夜性猛交久久久| 久久综合久久久久88| 欧美午夜久久久| 激情成人av| 亚洲天堂久久| 亚洲精品国久久99热| 午夜在线成人av| 免费欧美视频| 国产精品私人影院| 亚洲日本va午夜在线电影| 亚洲欧美日韩精品久久久| 亚洲日韩成人| 久久精品99无色码中文字幕| 欧美日韩成人在线视频| 国产亚洲精品一区二区| 亚洲激情午夜| 另类尿喷潮videofree| 欧美亚日韩国产aⅴ精品中极品| 国产字幕视频一区二区| 亚洲美女视频在线免费观看| 欧美怡红院视频一区二区三区| 中文一区二区| 裸体丰满少妇做受久久99精品| 欧美午夜不卡视频| 在线免费观看一区二区三区| 午夜电影亚洲| 亚洲在线1234| 欧美激情区在线播放| 国模私拍视频一区| 亚洲尤物视频在线| 在线午夜精品自拍| 蜜臀av性久久久久蜜臀aⅴ四虎| 国产精品日韩欧美综合| 亚洲精品视频在线观看网站| 亚洲大片av| 久久国内精品视频| 国产精品久久久久久影视| 91久久精品国产91久久性色tv| 欧美一级视频精品观看| 亚洲欧美日韩精品久久亚洲区| 欧美精品一区二区三区久久久竹菊| 国外成人网址| 午夜精品国产| 亚洲欧美在线高清| 欧美午夜电影网| 亚洲日本中文字幕免费在线不卡| 亚洲第一色在线| 欧美专区在线| 国产精品日韩在线| 亚洲午夜在线| 亚洲影院在线| 国产精品v欧美精品v日本精品动漫| 亚洲人成在线观看一区二区| 91久久久久久久久| 久久综合一区二区三区| 国产一区二区久久久| 亚洲欧美国产77777| 亚洲欧美日韩另类精品一区二区三区| 欧美日韩国产一区二区三区| 亚洲黄色视屏| 亚洲精品在线观看免费| 欧美风情在线| 亚洲国产精品欧美一二99| 亚洲三级免费电影| 欧美14一18处毛片| 亚洲黑丝在线| 亚洲人久久久| 欧美成人性网| 亚洲日本一区二区三区| 亚洲精品乱码久久久久久日本蜜臀| 另类综合日韩欧美亚洲| 在线看国产一区| 亚洲精品一区二区三区蜜桃久| 欧美精品手机在线| 亚洲美女黄色| 一本色道久久综合狠狠躁篇怎么玩 | 蜜臀久久99精品久久久久久9| 国产一区二区久久| 久久精品国产亚洲一区二区三区| 久久青青草原一区二区| 精品1区2区| 亚洲美女中文字幕| 欧美日韩另类视频| 这里是久久伊人| 午夜免费久久久久| 国产一级久久| 亚洲二区在线视频| 欧美激情按摩| 亚洲视频导航| 欧美在线视频免费| 精品盗摄一区二区三区| 亚洲毛片一区二区| 欧美午夜视频在线观看| 亚洲在线成人| 久久久中精品2020中文| 亚洲二区在线视频| 在线视频精品一| 国产精品一二三视频| 久久精品国产在热久久| 欧美理论在线| 亚洲综合不卡| 久久综合网络一区二区| 亚洲区一区二| 篠田优中文在线播放第一区| 国产亚洲综合在线| 99精品国产在热久久婷婷| 国产精品久久久久毛片大屁完整版| 小辣椒精品导航| 欧美激情一区二区久久久| 中文精品99久久国产香蕉| 欧美在线免费| 最新中文字幕一区二区三区| 亚洲影院一区| 一区二区三区在线视频播放| av成人黄色| 国产欧美日韩不卡| 亚洲美女诱惑| 国产欧美一区二区精品秋霞影院 | 亚洲福利视频三区| 欧美日韩亚洲综合在线| 欧美亚洲一级片| 午夜精品一区二区三区在线| 久热综合在线亚洲精品| 亚洲经典三级| 欧美一区二区精美| 亚洲国产你懂的| 欧美一区=区| 亚洲黄色尤物视频| 欧美制服丝袜| 日韩视频三区| 久色成人在线| 亚洲欧美大片| 欧美日韩精品一本二本三本| 欧美一区二区三区在线观看| 欧美国产一区二区| 先锋亚洲精品| 国产精品草草| 亚洲精品少妇30p| 国产一区日韩二区欧美三区| 在线一区观看| 在线观看日韩av电影| 小黄鸭精品aⅴ导航网站入口| 91久久嫩草影院一区二区| 久久久.com| 亚洲欧美另类在线| 欧美日韩中文字幕日韩欧美|