Fanhuaji / discussion

記錄有關繁化姬的議題或是內容
37 stars 0 forks source link

專用於 OCR 修正的轉換器? #13

Open n6333373 opened 6 years ago

n6333373 commented 6 years ago

上述兩者現歸類於 錯別字修正 模組中。


例如:子音 + l(小寫L) + 子音 應可轉換為 子音 + i(小寫I) + 子音 ,英文因為發音的關係,不會三個子音(並且中間是小寫L)連在一起。

上述則未實裝。


我幾乎不做 OCR 的工作,因此不知道 OCR 有那些常見的錯誤,如果自動修正一些常見錯誤應該會很有用(?)

n6333373 commented 6 years ago

https://zhconvert.org/#comment-3899694601

井非=並非
朱來=未來
恐泊=恐怕
環表=懷錶
父易=交易
農服=衣服 (非OCR?)
障藏=隱藏
事倩=事情
他門=他們
只身=單身 (非OCR?)
邪路=洩露 (非OCR?)
聽慬=聽懂
蚱蝦=炸蝦