undertheseanlp / playground

Open Vietnamese NLP Experiments
2 stars 2 forks source link

Sử dụng LSTM cho bài toán word tokenize #19

Open Vietdung113 opened 5 years ago

Vietdung113 commented 5 years ago

Sử dụng LSTM cho bài toán word tokenize

rain1024 commented 5 years ago

@Vietdung113 hay lắm

cái này có thể thử nghiệm token level, sub word level và character level nhỉ?

rain1024 commented 5 years ago

@Vietdung113 mà em dùng thư viện gì tensorflow hay pytorch?

Vietdung113 commented 5 years ago

Chắc là sẽ token level, Chắc em dùng pytorch

Vietdung113 commented 5 years ago

@rain1024 anh có bảng look up cho word embedded tiếng việt không ạ?

rain1024 commented 5 years ago

ý là pre-trained word embedding hả? anh không. chắc là lấy của mấy thánh làm rồi thôi