kiennt / ap-backend

Backend for autopin.it
http://autopin.it
1 stars 0 forks source link

Classifier #84

Closed novadev94 closed 2 years ago

novadev94 commented 9 years ago

Workflow cơ bản là

  1. node dist/main.js category >> data/category.dat với category là tên category
  2. Cân chỉnh lại file category.dat cho đúng chuẩn JSON (thêm [ hoặc ] ở đầu và cuối nếu cần) rồi chạy python filter.py category để lọc đi các pin có description rỗng hoặc trùng id với nhau.
  3. python count.py category sẽ sinh ra 1 dictionary các word (và count) của các pin thuộc category đấy.
  4. python merge.py để gộp các kết quả của tất cả các category lại và đẩy ra 1 file chứa knowledge học được. File này có thể đem sang bên JS để dùng.
  5. classifier.py như cái tên. Em sẽ port cái này sang JS.