dominhhai / dominhhai.github.io

My Blog
https://dominhhai.github.io/
14 stars 15 forks source link

em đang làm đề tài ứng dụng mạng nơ ron vào so sánh, đối chiếu 2 văn bản!!! #12

Open cuong369 opened 6 years ago

cuong369 commented 6 years ago

Em muốn hỏi anh là dựa vào mạng RNN em có thể áp dụng vào công việc trên không và mong anh chỉ các liên kết trang, tài liệu tham khảo và quan trọng code nguồn tham khảo để anh thực hiện đề tài. Em cảm ơn anh.

dominhhai commented 6 years ago

bạn có thể nói cụ thể việc so sánh và đối chiếu thế nào không? Bạn nói hơi chung chung như vậy thì khó để đưa ra cách đánh giá.

cuong369 commented 6 years ago

Trước hết em cảm ơn anh đã hồi âm. So sánh đối chiếu ở đây có các tính năng giống như các phần mềm text compare. NÓ sẽ xem xét 1văn bản mẫu và xem xét 1 văn bản khác giống vs nó không. Bất kỳ một sự khác biệt nào sẽ được tìm ra (sai khác ký tự, giãn dòng, space quá tay, vvvv...) so vs bản đầu sẽ đk xác định

Vào 24-07-2018 14:26, "Do Minh Hai" notifications@github.com đã viết:

bạn có thể nói cụ thể việc so sánh và đối chiếu thế nào không? Bạn nói hơi chung chung như vậy thì khó để đưa ra cách đánh giá.

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/dominhhai/dominhhai.github.io/issues/12#issuecomment-407308573, or mute the thread https://github.com/notifications/unsubscribe-auth/AluZB-cIeIxiczLVzIsaAMFBGmfu4kgEks5uJswzgaJpZM4Upq16 .

dominhhai commented 6 years ago

Nếu vậy thì nên sửa dụng các kĩ thuật phi-học máy thì sẽ tốt hơn. Vì khi đó chỉ đơn thuần là so sánh kí tự văn bản tương tự như các trình quản lý mã nguồn như Git chẳng hạn.

Còn nên sử dụng học máy khi bạn cần so sánh 2 văn bản có ý nghĩa tương tự nhau.

cuong369 commented 6 years ago

Dạ vâng. Em cảm ơn anh. Anh nói rất đúng. Em cũng thấy vậy. Thực ra, em biết dùng mạng nơron cho bài toán này ko hợp lý. Trước đó, em nghiên cứu dùng word2vec, lợi dụng tương tự ngữ nghĩa thì đã so sánh được sự khác biệt về ký tự ở 2 bản text. Nhưng mà thấy, nếu phát triển thêm thì dùng mạng nơ-ron ns chung, mạng word2vec nói riêng sẽ ko hiệu quả bằng cách phi học máy. Cảm ơn anh nhé. Cảm ơn rất nhiều

Vào 25-07-2018 07:56, "Do Minh Hai" notifications@github.com đã viết:

Nếu vậy thì nên sửa dụng các kĩ thuật phi-học máy thì sẽ tốt hơn. Vì khi đó chỉ đơn thuần là so sánh kí tự văn bản tương tự như các trình quản lý mã nguồn như Git chẳng hạn.

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/dominhhai/dominhhai.github.io/issues/12#issuecomment-407598412, or mute the thread https://github.com/notifications/unsubscribe-auth/AluZB6-ma5vhzErHLMyUnSUBhv5YNKAnks5uJ8JQgaJpZM4Upq16 .