royjor2016 / rime-cantonese

Rime Cantonese input schema | 粵語拼音輸入方案
https://jyutping.net/
Creative Commons Attribution 4.0 International
0 stars 0 forks source link

to do list 20230515 #1

Open royjor2016 opened 1 year ago

royjor2016 commented 1 year ago

been testing this shit for 6 hours straight this afternoon. wasted my whole day.

lots of bad design and cryptic settings.

to do list

  1. https://github.com/rime/home/wiki/RimeWithSchemata
  2. tiu4 schema.yaml
  3. english dicts cf. https://www.jianshu.com/p/0ca1e7301d4a
  4. 粵文常用漢字表
  5. "latin取代擬聲粵詞"表 (frequency analysis on my telegram chat records to sieve out often used latin canto phrases?)
  6. schema分兩個版本,粵人版同港人版。倉頡之類嗰d香港specific嘅嘢唔laa gaang,粵人版省略得。
  7. 如果㩒錯掣 搞到輸入法學錯咗詞 點刪個錯詞?例如買荔枝 我如果心目中係想要賣荔枝 我應該喺邊改?
  8. 因為每個詞後邊跟咗一抽拼音 所以呢個輸入法popup係打棟好過打橫。但係打棟個話 當個輸入欄近屏幕下邊 個popup就會彈去上邊 就會出現噉樣上下飄忽嘅popup 提示嘅詞忽上忽下冇所謂 最大問題係輸入緊嗰行忽上忽下。
royjor2016 commented 1 year ago
  1. purge rare characters, words, and spellings, e.g. 照X光 ziu3 ik1 si6 gwong1.
royjor2016 commented 1 year ago
  1. 粵語常見嘅一d喺詞中間插單字嘅現象 譬如

助詞/虛詞? 咗 移咗民 食咗飯 填咗海 過 同“咗”同理

形容詞/動詞? 爆 打爆機 碌爆卡 靚/衰/好 寫靚篇文 畫靚幅畫 髹靚間屋

nooby, [2023-05-15 21:58] 呢個問題好幾年前我哋啱整rime-cantonese嗰陣就討論過,答案係冇得搞,因為呢種功能需要語言模型嚟實現,而在線語言模型要錢,我哋冇錢 nooby, [2023-05-15 22:00] 除非邊個肯出錢出力幫我哋host一個在線語言模型,每個月幾百美金噉燒 Roy, [2023-05-15 22:01] 低技術d 淨係整個可能插中間嘅字嘅表 跟住設計1個algorithm來估 得唔得呢? nooby, [2023-05-15 22:01] 理論上得,但係實際效率過低,現實中冇人噉做 而且噉打字可能會窒 ... Roy, [2023-05-15 22:08] 噉我諗到1個再簡單d嘅方法 就係唔靠algorithm估 而係輸入者自己表明嗰隻字係插中 譬如 定 咗 個碼做 zzo 打 sikzzofaan。algorithm見到插中特徵碼,就自動忽略佢來配詞,當佢係sikfaan噉。 Roy, [2023-05-15 22:10] 唔解決呢個問題 打詞就一係斷開逐隻字打 一係打完個詞再行返轉頭插字 nooby, [2023-05-15 22:17] 噉你即係要改librime Roy, [2023-05-15 22:20] 係 長遠目標實要設計更加啱粵語語法同習慣嘅輸入法 粵語獨有嘅一d嘢用漢語frame嘅engine唔夠好 Roy, [2023-05-15 22:27] 仲有譬如 可以+verb 粵語用 verb+得 好過 諸如此類 好嘅 啱粵語習慣嘅輸入法 幫到辟除撈話影響

royjor2016 commented 1 year ago

!!!!! https://github.com/mutoe/rime