Open orbxball opened 6 years ago
You maybe installed the old version.
We recommand using docker version.
The docs of 基本物件
and 常見情境
were updated today.
We provide an example for translations between Taiwanese Hanji and Taiwanese Lô-má-jī in the 查辭典、斷詞、補漢字、補羅馬字
section on the 常見情境
page.
我已經看完最新的 instruction page,也用了 docker version。
由於我們需要的只是要把「漢字」轉成對應的「臺羅拼音」,所以是否方便提供「辭典」跟「語言模型」的 pre-trained 檔案,才能照著查辭典、斷詞、補漢字、補羅馬字
那個 section 提供的方法快速做轉換,我們拿來做研究的 data 只有國字 e.g. 獅 子 也 會 表 演 啊
。
或是有其他更方便的方法或是工具可以作轉換,煩請告知了,謝謝!
台語ê漢字系統kah華語ê漢字系統bô-kâng,看恁ê例應該是講華語漢字
獅 嘛 會 曉 表 演 啊
獅 子 也 會 表 演 啊
準做恁想欲ài台語羅馬字ê結果
Sai mā ē-hiáu piáu-ián--ah
辭典ê方式較適合台語漢字kah羅馬字之間轉換 台語華語是bô-kâng ê語言,所以無法度用一字一字辭典ê方式 建議用機器翻譯ê技術
阮有提供Mosesê介面
若有興趣,docker內有語料,恁會當改用seq2seq
試,效果可能會較好
What I want to do is given a sentence "臺語語言來講古", and translating it into "tai5-gi2 gi2-gian5 lai5 kong7-koo2" via this tool. It's similar in the example you gave in the passage 用拼音轉臺羅拼音 at the link
However, when I started following the instructions here about 語句轉物件 It should be
However, what I got
Can you give me an example of how to translate a sentence such as "臺語語言來講古" into "tai5-gi2 gi2-gian5 lai5 kong7-koo2" via this tool? Thank you!