trungtv / pyvi

Python Vietnamese Core NLP Toolkit
https://pypi.org/project/pyvi/
MIT License
247 stars 49 forks source link

Dự đoán sai khi gặp từ đồng âm #8

Open vunt-0906 opened 5 years ago

vunt-0906 commented 5 years ago

Ví dụ:

Một cậu bé bò cạnh một con bò.

Post tagging sẽ là:

(['Một', 'cậu', 'bé', 'bò', 'cạnh', 'một', 'con', 'bò', '.'], ['M', 'Nc', 'N', 'N', 'N', 'M', 'Nc', 'N', 'F'])

Và một vài ví dụ khác:

"Chiếc xe chạy băng băng trên đường"
=> ['Chiếc', 'xe', 'chạy', 'băng', 'băng', 'trên', 'đường'], ['Nc', 'N', 'V', 'V', 'N', 'E', 'N']
trungtv commented 5 years ago

Chào em, hình như em chưa chạy tokenizer trước phải không?

vunt-0906 commented 5 years ago

E chạy tokenizer trước rồi ạ.

from pyvi import ViTokenizer, ViPosTagger, ViUtils
data = ViTokenizer.tokenize(u"Một cậu bé bò cạnh một con bò.")
test = ViPosTagger.postagging(data)
print(test)