rime / rime-cantonese

Rime Cantonese input schema | 粵語拼音輸入方案
https://jyutping.net/
Creative Commons Attribution 4.0 International
551 stars 61 forks source link

編譯錯誤 #39

Closed tanxpyox closed 4 years ago

tanxpyox commented 4 years ago

哩啲字詞部署唔到入去個輸入法度,應該係因爲啲字詞喺*.phrase.dict入面出現咗,但係搵唔到碼表嘅相應拼音。

因爲個list長得滯,所以我將佢paste咗響度,方便大家睇。

laubonghaudoi commented 4 years ago

可唔可以畀多啲信息?係部署落邊個平臺嘅輸入法?如果係使用呢個碼表打字嘅話,直接粘貼重新部署就得。我哋測試過全部平臺都係正常可用嘅。

tanxpyox commented 4 years ago

好似「白雲邨」咁,係jyut6ping3.phrase.dict.yaml入面有收錄,但係打唔出。我估計係因爲冇喺.dict入面定義 邨 cyun1 所致。

我用緊Windows,部署落jyut6ping3度。(我係用最新嗰嗰commit嚟編譯嘅[ 42d7a26051189c1e54367c0409c6135a49050f48 ])

tanxpyox commented 4 years ago
    cyu5    
䆤   cyun1   
䆥   cyun1   
川   cyun1   
村   cyun1   
氚   cyun1   
汆   cyun1   
穿   cyun1   
踆   cyun1   
躥   cyun1   
釧   cyun1   
鋑   cyun1   
鑹   cyun1   
䞼   cyun2

如果冇收「邨」字,咁嗰啲喺.phrase入面有個「邨」字(但係冇喺 jyut6ping3.dict* 度定義)嘅詞就會全部打唔出。

tanxpyox commented 4 years ago

我諗可以用將個list放入電腦程式入面計算每粒字喺個list出現嘅頻率,最高頻率嗰啲就應該係漏咗收錄嘅字嘞。

laubonghaudoi commented 4 years ago

嗰個.phrase.dict文件入邊有好多錯我哋仲未改過來.至於收字問題,我哋都喺度考慮緊點樣修復。歡迎直接PR補丁

tanxpyox commented 4 years ago

我想問下如果.phrase.dict入面有異體字,係應該將.phrase.dict改番正字,定係喺.dict度加埋異體字讀音?

laubonghaudoi commented 4 years ago

所有詞條均默認採用 opencc 字體。如果係單字冇收錄,就直接喺呢個issue入邊反饋,由我哋嚟收錄

tanxpyox commented 4 years ago
baak3
bou6 或讀bou2 (深水埗),fau6 (埠異寫)
but3
caan2 好似係日本新字體,但係phrase度有收
can2 異讀 zan2
gai1 應該係異體
loi4
long4 郎嘅異體, phrase 有收
lung1 搵唔到讀音,但係phrase度當「窿」字噉用
sin3 異體但係廣泛使用
sin6
tong4 二簡字,建議改phrase,此風不可長
wui6 匯嘅異體?廣泛使用
zan1
ze1 搵唔到音,但phrase當「啫」噉用

收住噉多先,得閒再睇。

tanxpyox commented 4 years ago

差個「竓」字,其他喺我個PR 度解決埋嘞。

E0422 23:38:12.378471  7472 entry_collector.cc:133] Encode failure: '上竓'.
E0422 23:38:12.604684  7472 entry_collector.cc:133] Encode failure: '食🍚'.
E0422 23:38:13.022141  7472 entry_collector.cc:133] Encode failure: '瓦竓頭'.
E0422 23:38:13.456939  7472 entry_collector.cc:133] Encode failure: '湘屯阝'.
E0422 23:38:14.179159  7472 entry_collector.cc:133] Encode failure: '有👀睇'.
E0422 23:38:14.722486  7472 entry_collector.cc:133] Encode failure: '磚竓'.
leimaau commented 4 years ago

嗰個「竓」嘅「上竓、瓦竓頭、磚竓」係咩嚟嘅,正確嘅字搵唔到。

tanxpyox commented 4 years ago

我都唔知,不如刪除。

tanxpyox commented 4 years ago

4b374457569ad1f42fd28a677a9aee3160ef08f9 完成修復

laubonghaudoi commented 4 years ago

嗰個應該係「毫」字嘅異體字

sgalal commented 4 years ago

「坣」字唔一定係錯誤,比如搜索「致坣工業園」就揾到,但係改成「堂」、「壆」都揾唔到。

地圖亦都係「坣」,所以可能係地名用字:

谷歌地圖搜索「致坣工業園」的結果

leimaau commented 4 years ago

應該係深圳嘅哋名, 我喺地圖搜索「壆崗」一類嘅詞就可以搵到,網上見有唔少關於「坣、壆」嘅討論。

sgalal commented 4 years ago

按照 http://baoliao.oeeee.com/67572.html 這個 (網頁 / Archive Page) 中的説法,當地人確實使用「坣」字,讀音 bo 應該對應 bok3。

sgalal commented 4 years ago

嗰個「竓」嘅「上竓、瓦竓頭、磚竓」係咩嚟嘅,正確嘅字搵唔到。

應該係「窰」。「上窰、瓦窰頭、磚窰」都係香港地名,讀 jiu4

上窰路牌:

上窰路牌