langmaninternet / VietnameseTextNormalizer

Thư viện chuẩn hóa văn bản Tiếng Việt
MIT License
174 stars 44 forks source link

Vài thử nghiệm sử dụng thư viện để chuẩn hóa văn bản #16

Open nguyenhung opened 2 years ago

nguyenhung commented 2 years ago

Mình chạy thử ví dụ có sẵn trong UnitTestVietnameseTextNormalizer.py và có đọc và hiểu tiêu chí sửa của bạn là chỉ sửa khi chắc chắn

VietnameseTextNormalizer.Normalize(" UTF8 : Tôi làm việ ở ban công ngệ FPT, tôi là người viêt nam. hôm nay tôi ko thích ăn mì tôm. tôi làm đc 2 bài tập.");
//                                   UTF8 : Tôi làm việc ở ban công nghệ FPT, tôi là người viêt nam. hôm nay tôi không thích ăn mì tôm. tôi làm đc 2 bài tập.

Mình có vài nhận xét nhanh và viết ra để các bạn khác có nhu cầu sử dụng thư viện không phải đánh giá lại

langmaninternet commented 2 years ago

Hay quá cảm ơn góp ý của bạn mình sẽ nghiên cứu update thêm các trường hợp trên để công cụ trở nên hoàn thiện hơn