i3thuan5 / tai5-uan5_gian5-gi2_kang1-ku7

臺灣言語工具
https://i3thuan5.github.io/tai5-uan5_gian5-gi2_kang1-ku7
Other
109 stars 32 forks source link

輕聲斷詞的spec #418

Closed sih4sing5hong5 closed 6 years ago

sih4sing5hong5 commented 7 years ago

331

輕聲的狀況較複雜

我上一開始攏是共輕聲詞頭前詞敆做伙

舊年佇itaigi摻人討論了,才共兩个分開

舊年討論的過程:

教典內的矣 --ah一寡 --tsi̍t-kuá.是詞無問題

毋過教典例句

我食飽矣。Guá tsia̍h-pá--ah.

加減食一寡。Ke-kiám tsia̍h--tsi̍t-kuá.

斷詞應該是斷做 「Guá」「tsia̍h-pá」「--ah」

「Ke-kiám」「tsia̍h」「--tsi̍t-kuá」

所以「有一部份 -- 的輕聲,佮頭前是無仝詞」

程式的做法攏是看臺羅來判斷斷詞

這馬才會按呢處理

講轉來「拍無去 phah-bô--khì」

我有想欲確定一下

  1. 「拍無去 phah-bô--khì」佇斷詞原則下,敢是一个詞? 相像的例有 「昏去 hūn--khì」 「恬去 tiām--khì」 「害去 hāi--khì」

2-a. 若「拍無去 phah-bô--khì」毋是一个詞,這馬的做法無問題

2-b. 若「拍無去 phah-bô--khì」是一个詞,代表輕聲連字符「--」佮斷詞的原則是衝突的 這咱愛定規則來處理

這種問題咱早慢攏愛處理 因為進前你講「桌頂」寫「toh-tíng」 毋過斷詞愛斷做「toh」佮「tíng」

sih4sing5hong5 commented 7 years ago

詞彙分級是拍phah-bô--khìtsia̍h --tsi̍t-kuá. 所以輕聲改做莫斷開,佮toh-tíng做伙斷較好

sih4sing5hong5 commented 6 years ago

bong報 講的出--來講--出-來

sih4sing5hong5 commented 6 years ago

輸出入

phah-bô--khì=>phah-bô-0khì tsia̍h --tsi̍t-kuá.=>tsia̍h 0tsi̍t-kuá. 後日=>後日 後--日=>後-0日 āu--ji̍t=>āu-0ji̍t 講會出--來=>講會出--來 講--出-來=>講--出-來 害--矣--啦=>害--矣--啦