人妻少妇精品久久久久久蜜臀av,久久综合激激的五月天,日韩精品无码专区免费播放,欧美精品999

bing輸入法(bing輸入法app)

前沿拓展:

bing輸入法

必應輸入法是使用非常是比較常見的問題,eg:“牛奶”常常被南方人發(fā)音為“liulai”,遇到類似的問題,可通過沿推排鹽司盾設(shè)置屬性-> 常用-> 模糊音-> 選項,設(shè)置模糊音選項。
 


英文字母只有26個,可以一個鍵盤一個字母的輸入。

中文常用字有3500個,中華字海中收入全量簡體字有8萬5千個,GB2312 編碼收入漢字20902個。也就是說無法在一個漢字一個鍵盤的方式實現(xiàn)輸入。

現(xiàn)在回頭看,中文輸入法,基本經(jīng)歷了自然音節(jié)編碼輸入,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。

輸入法輸入漢字的快慢與漢字編碼長度相關(guān),也就是輸入漢字需要敲擊幾次鍵盤。

GBK2312 一共有6700多個常用漢字,每一個漢字出現(xiàn)的概率:

P1, P2,P3,… , P6700

大致估算需要10個比特。

輸入法有26個字母,每個字母可以代表log26大概是4.7比特,

也就是說平均一個漢字需要敲擊10/4.7 約等于2.1次鍵。

如果把漢字組成詞,平均輸入一個字可以少敲幾次鍵盤,

不考慮上下文情況下,以詞為單位統(tǒng)計,漢字信息熵大概是8bit,則平均輸入一個漢字要敲擊8/4.7 約等于1.7次鍵盤。

考慮上下文情況下,對漢語建立基于詞的統(tǒng)計語言模型,漢字信息熵可以降到6bit 左右。則平均輸入一個漢字敲擊6/4.7 月等于1.3次鍵,那么這是漢字的輸入已經(jīng)比英語快得多了。

紫光拼音,是通過建立大詞庫解立大詞庫,詞越來越多,越來越長,甚至將整句唐詩作為一個詞,沒有根本做到利用上下文。

利用上下文最好的辦法是借助語言模型,而語言模型對內(nèi)存要求高,而輸入法不能占有過多的內(nèi)容,因此目前google、搜狗、百度、微軟幾家輸入法基本在同一檔次。

3、拼音轉(zhuǎn)漢字

其實就是拼音到漢字的轉(zhuǎn)換解碼函數(shù),每輸入一個字母,就類似導航中車輛每走一步,利用動態(tài)規(guī)劃方法不斷調(diào)整輸出。

4、個性化語言模型

現(xiàn)有漢字拼音輸入法距離信息論極限還有很大距離,從理論上講,只要語言模型足夠大,拼音輸入法的平均敲擊次數(shù)就可以接近理論值。

個性化的特點是,不同人寫東西主題不同,用詞習慣不同,說話和寫作水平不同,應該各自有自己的語言模型。

通過不斷收集個人寫的內(nèi)容,訓練一個特定的語言模型,可以較快的接近信息理論值。實現(xiàn)快速輸入的目的。

拓展知識:

原創(chuàng)文章,作者:九賢生活小編,如若轉(zhuǎn)載,請注明出處:http://m.xiesong.cn/89528.html

久久无码中文字幕免费影院| 成人网中文字幕| 国产无码2020不卡| 国产亚洲欧美精品一区| 欧欧美色图亚洲色图| 美女网站在线婷婷六月| 亚洲色欧美一区| 国产福利精品一区二区| 四虎影院网址。| 工口黄色网站| 日日日干夜夜夜操| 久久人妻AV无码中文专区| 另类亚洲无码| 九九精品帝王导航| AV资源区| 成人无码| 婷综合| 欧美日韩精品性爱| 久久久青青精品视频| 亚洲人成无码久久久久| 亚洲综合第一| 三级网站30| 亚洲五月丁香综合色| 情侣激情| 中文字幕久久久久人妻中出| 日本黄大片视频| 色丁香视频| 自慰无码观看| 久久久久久综合网天天| 欧美一区二区三区蜜臀| 久久 少妇懂色粉嫩| 天堂中文在线资下| 一本一道| 麻豆国产尤物| XXX视频一区| 南丰县| 欧美xxxx黑人又粗又长| 久草五六精品| 六月天av导航| 久久精品国产96精品亚洲| 亚洲宗合|