node dist/main.js category >> data/category.dat với category là tên category
Cân chỉnh lại file category.dat cho đúng chuẩn JSON (thêm [ hoặc ] ở đầu và cuối nếu cần) rồi chạy python filter.py category để lọc đi các pin có description rỗng hoặc trùng id với nhau.
python count.py category sẽ sinh ra 1 dictionary các word (và count) của các pin thuộc category đấy.
python merge.py để gộp các kết quả của tất cả các category lại và đẩy ra 1 file chứa knowledge học được. File này có thể đem sang bên JS để dùng.
classifier.py như cái tên. Em sẽ port cái này sang JS.
Workflow cơ bản là
node dist/main.js category >> data/category.dat
vớicategory
là tên categorycategory.dat
cho đúng chuẩn JSON (thêm[
hoặc]
ở đầu và cuối nếu cần) rồi chạypython filter.py category
để lọc đi các pin có description rỗng hoặc trùng id với nhau.python count.py category
sẽ sinh ra 1 dictionary các word (và count) của các pin thuộc category đấy.python merge.py
để gộp các kết quả của tất cả các category lại và đẩy ra 1 file chứa knowledge học được. File này có thể đem sang bên JS để dùng.classifier.py
như cái tên. Em sẽ port cái này sang JS.