拆字型輸入法重複字的統計


前言:
0. 大家在討論各輸入法的選字率時,總是沒有標準可依循,因此我才將
 幾種輸入法的重複字一一列表,這樣比較起來也較有根據....

1. 以下數據以各輸入法之標準拆法為準(不使用所謂的"特技" 的情況下)
   (即不使用任何簡碼(根)、一字多拆,只需學標準規則、字根的重複字水準)
  以下方式雖可避免數字鍵選字,但仍屬於選字: (因為其需要額外的記憶)
  a.簡根(碼)、一字多拆  b.嘸蝦米加V  c.快倉加S D F  d.大易加M V

 2. 以下只是將所有重複字的量列出,並未考慮常用字使用頻率加權,所以在一般
  文章中的實際選字率並不一定跟此表成正比,僅供參考...
  (如果各位有需要,可將後面附的各輸入法重複字列表拿來計算頻率加權)

 3. 以下字根數以標準字根為準(不含簡根),且任何變形字根都算一個字根
  (有些雖然字根很多,但字形相似的歸同一鍵,應不太難記...)
=====================================
輸入法 最高碼數 鍵數  字根數  第二選字  第三選字 第四選字 第五選字 第六以後
============= ======== ==== ====== ======== ======== ======== ======== ========
█以下以5401字計算:
 
倉頡 24 102 112+z(0) 0 0 0 0
行列30 30 262 125 12 1 0 0
大易  
(四碼)
40 253 160 26 4 1 0
大易  
(三碼)
40 253 538+M 89+V 16 1 0
快倉  
(麥)
三至四 24 102 729+S 123+D 14+F 3+G 2
大易  
30鍵  
(四碼)
30 253 352 60 15 4 4
大易  
30鍵  
(三碼)
30 253 883 226 60 14 8
嘸蝦米 26 308 ?+V(0) ?(3) ?(18) ?(0) ?(1)
 

█以下以13051字計算:
 
倉頡 24 102 499 30 6 0 0
大易  
(四碼)
40 253 554 58 9 2 1
行列30 30 262 643 66 6 0 0
嘸蝦米 26 308 ? ? ? ? ?
 

★ 以5401字,倉頡為基準的話,能盲打的輸入法的第二以後選字應該低於二百字才算格 ,合格的有: 倉頡 < 行列30 < 大易(四碼) (※嘸蝦米也可,但尚無標準拆法可計算)

※嘸蝦米因無法取得標準拆法,其一字多拆的特性造成個別嘸蝦米user的選字率不一, 雖然某些嘸蝦米高手可以達到常用字萬分之幾的選字率...  (即上面數據括號內為嘸蝦米高手(Christorng)所提供的最佳化數字) 但是未必每個嘸蝦米user 都能記住所有不選字拆法或簡根(碼)及+V選字, 所以本統計不列入計算!

照嘸蝦米作者宣稱的平均選字率%0.3應該就是標準拆法的選字率,那應比大易低一些(大易好像是%0.5),嘸蝦米5401的第二順位選字我想應該也是一百字多字

 ※多低的選字率才夠呢? 每個人的接受程度不同,不過以好幾種輸入法都能達到一般   文章平均選字率1%以下來說,1%算是最低標準,%2勉強接受,如果是%3 %4 以上,  那似乎太高了一些... (換算成5401字的重複字在200字以下即可達到 %1)  (1%等於平均每打100字遇一個選字 %2=50字 %3=33字 %4=25字 %5=20字....)

以我個人來說,目前是使用大易三碼版,覺得選字率還可接受且平均碼數不到三碼    ,但要使用40鍵則是其最大缺點... 如果直接照上面的數據跟四碼版比較,如果四碼版是 %0.5 ,那三碼版大約 %1.5  (如果考慮常用字頻率加權,應該低於1.5)

※以快倉24鍵三碼來說,選字率要減到 %1 似乎有困難,不過我想,如果再加入 Z X ;,./ 並精確分配字根,以三十鍵三碼來說應該是有可能做到的!

 (至於30(26)鍵四碼,已有嘸蝦米、行列30....可做到)

★ 字根數:   倉頡、快倉 < 大易 < 行列30 < 嘸蝦米

★ 最高碼數: 大易三碼版 < 快倉 < 行列30、嘸蝦米、大易 < 倉頡
      ※快倉多數為三碼,但部份偏旁部首的字使用四碼,所以為 "3~4碼"
      ※我個人認為四碼已相當合理,當然如果用26鍵三碼也能達到1%選字率那更好(雖然有點困難...)

★ 鍵數:     倉頡、快倉 < 嘸蝦米 <  行列30 < 大易 。
     ※行列30在使用1234567890鍵輸入簡碼的情況則應視為40鍵的輸入法雖然行列30曾創下全國速度記錄(但想必有用數字鍵的簡碼),所以假如以純30(或26)鍵的輸入法來說,嘸蝦米才是目前最快的(不過簡碼也要背不少才能最快...).

★ 以處理大量罕用字(13051字)來說 倉頡 > 大易 > 行列30  (嘸蝦米我目前尚無數據) 以13051從頭輸入到最後一個字來說,倉頡每24字遇一選字,大易20字,行列30為18字大體來說,用這三種用來輸入罕用字都堪用,不需像快倉在輸入罕用字時得改用其他輸入方式(如倉頡或簡易)(至少目前版本的快倉只編碼至5401字)

..£cc ωizard【lccw@ms8.hinet.net】
====================================

註: 1. 以上的字根數某些是直接看字根表算的,可能有誤差,但應差不了多少

   2. 目前大易只有40鍵、26鍵版(盛興輸入法),以上的30鍵為我自已把1234567890
    移至asdfghjkl;鍵的實驗版本

   3. 倉頡如果運用+Z選第二選字,或是在出現選字時,將按Z或按;定義成跟按 2
    相同的功能,應該較為理想(按2比較難按)
    也就是說如果倉頡的user記住這112個選字+Z的話,那就能達到一般文章99%的
    準確率(1%為打錯按鍵及超過5401字的罕用字...)

   4. 目前簡稱快倉的輸入法有香港及台灣二種版本,本文所指為香港麥先生的版本




本網站為「快速倉頡輸入法第六代」
http://lsd.hkcampus.net/~lsd-mch
由朱邦復先生贊助,麥志洪先生擁有
makchehu@netvigator.com