ku-nlp / pyknp

A Python Module for JUMAN++/KNP
Other
89 stars 23 forks source link

consideration of parse process #42

Open meokz opened 3 years ago

meokz commented 3 years ago

問題

以下のような入力ケースで、顔文字の中にスペースが存在するため、パースができない不具合がある (jumanpp 2.0.0-rc3)

こんにちは(^ ^)
こんにちは こんにちは こんにちは 感動詞 12 * 0 * 0 * 0 "代表表記:こんにちは/こんにちは"
(^ ^) (^ ^) (^ ^) 特殊 1 記号 5 * 0 * 0 "代表表記:顔文字/顔文字 顔文字"
EOS

解決策1

解決策2