When I try using sentence segmentation, doc.sents returns a list of sentences with normalized tokens, e.g tạo một sân_chơi lành_mạnh để cán_bộ Hội được giao_lưu , trao_đổi kinh_nghiệm. Is there anyway to get sentences with original (not normalized) token when sentencizing?
Chào bạn,
Hiện tại vivi_spacy chưa hỗ trợ tính năng này bạn nhé. Tuy nhiên do có nhiều bạn có yêu cầu lấy lại câu với tokens gốc nên chúng tôi sẽ tìm cách hỗ trợ trong thời gian tới.
Hi, first of all thanks for a very nice package.
When I try using sentence segmentation,
doc.sents
returns a list of sentences with normalized tokens, e.gtạo một sân_chơi lành_mạnh để cán_bộ Hội được giao_lưu , trao_đổi kinh_nghiệm
. Is there anyway to get sentences with original (not normalized) token when sentencizing?Thanks