HiromuMasuda / category_classifier

1 stars 0 forks source link

課題について #2

Open HiromuMasuda opened 6 years ago

HiromuMasuda commented 6 years ago

期限につきましては、5/1(火)を目処に取り組んで頂き、 後ほど指定するGithubアカウントをコラボレーターに追加してください。 それを以て課題提出とさせて頂きます。 ====================================

課題

具体的な要件

環境

Step1: ウェブアプリの具体的な処理について

ウェブアプリの機能

  1. フォームから記事URLを入力する。
  2. 1で入力された記事URLのHTMLを取得し、それを元に、記事カテゴリを判定する。
  3. 2で判定したカテゴリを画面に出力する。

ナイーブベイズを使った分類器の作成

Step2: 分類器の精度向上

コード規約

成果物

期間

5月1日(火)

評価基準

HiromuMasuda commented 6 years ago

進め方

HiromuMasuda commented 6 years ago

改善点

HiromuMasuda commented 6 years ago

django

Python

Tf-Idf

大量データの計算

ナイーブベイズ

pep8/docstring

その他

https://dev.classmethod.jp/series/cm-machine-learning-advent-calendar-2017/

HiromuMasuda commented 6 years ago
N: 80
train_X: 64 test_X: 16
time: 0m16s
time: 0m3s
my_naive_bayes: 0.3125
naive_bayes: 0.625
sgd: 0.6875
k-neighbors: 0.25
logistic-reg: 0.625
liner-svg: 0.5625
random_forest: 0.3125
decision_tree: 0.25

N: 160
train_X: 128 test_X: 32
time: 0m33s
time: 0m8s
my_naive_bayes: 0.75
naive_bayes: 0.84375
sgd: 0.625
k-neighbors: 0.0625
logistic-reg: 0.8125
liner-svg: 0.78125
random_forest: 0.4375
decision_tree: 0.625

N: 480
train_X: 384 test_X: 96
time: 2m19s
time: 0m23s
my_naive_bayes: 0.6979166666666666
naive_bayes: 0.8333333333333334
sgd: 0.8229166666666666
k-neighbors: 0.15625
logistic-reg: 0.8541666666666666
liner-svg: 0.8020833333333334
random_forest: 0.625
decision_tree: 0.5520833333333334

N: 800
train_X: 640 test_X: 160
time: 4m4s
time: 0m36s
my_naive_bayes: 0.73125
naive_bayes: 0.81875
sgd: 0.775
k-neighbors: 0.16875
logistic-reg: 0.85625
liner-svg: 0.85
random_forest: 0.65
decision_tree: 0.5375

N: 1600
train_X: 1280 test_X: 320
time: 9m56s
time: 1m15s
my_naive_bayes: 0.709375
naive_bayes: 0.81875
sgd: 0.8
k-neighbors: 0.278125
logistic-reg: 0.840625
liner-svg: 0.81875
random_forest: 0.740625
decision_tree: 0.63125

N: 3200
train_X: 2560 test_X: 640
time: 24m11s
time: 2m35s
my_naive_bayes: 0.8203125
naive_bayes: 0.8890625
sgd: 0.8703125
k-neighbors: 0.2828125
logistic-reg: 0.9046875
liner-svg: 0.9015625
random_forest: 0.7828125
decision_tree: 0.7140625

N: 6400
train_X: 5120 test_X: 1280
time: 58m58s
time: 5m27s
my_naive_bayes: 0.825
naive_bayes: 0.89375
sgd: 0.9015625
k-neighbors: 0.428125
logistic-reg: 0.9359375
liner-svm: 0.92578125
random_forest: 0.8421875
decision_tree: 0.775