undertheseanlp / underthesea

Underthesea - Vietnamese NLP Toolkit
http://undertheseanlp.com
GNU General Public License v3.0
1.39k stars 274 forks source link

Corpus for training Named Entity Recognition model #391

Closed huyphat98 closed 3 years ago

huyphat98 commented 3 years ago

Cho em hỏi corpus dataset ban đầu dùng để train cho model này nhóm lấy ở đâu? có thể chia sẻ không?

rain1024 commented 3 years ago

@huyphat98 Em hỏi model nào nhỉ?

huyphat98 commented 3 years ago

dạ cái model NER đó anh. Anh có thể chia sẽ cái dataset anh dùng để train được không ạ

rain1024 commented 3 years ago

@huyphat98 Hiện tại mô hình của underthesea được train trên dữ liệu VLSP2016 NER và VLSP2018 NER em nhé.

underthesea không sở hữu và không có quyền phân phối dữ liệu VLSP. Em hãy email vào địa chỉ vlsp.resources@gmail.com để xin trực tiếp nhóm tác giả em nhé

Thanks,