Open HiromuMasuda opened 6 years ago
vectorizer.fit_transform(train_X)
のロジックをスクラッチで作るclf.fit(train_X, train_y)
のロジックをスクラッチで作るtitle + content
をdocとして扱うhttps://dev.classmethod.jp/series/cm-machine-learning-advent-calendar-2017/
N: 80
train_X: 64 test_X: 16
time: 0m16s
time: 0m3s
my_naive_bayes: 0.3125
naive_bayes: 0.625
sgd: 0.6875
k-neighbors: 0.25
logistic-reg: 0.625
liner-svg: 0.5625
random_forest: 0.3125
decision_tree: 0.25
N: 160
train_X: 128 test_X: 32
time: 0m33s
time: 0m8s
my_naive_bayes: 0.75
naive_bayes: 0.84375
sgd: 0.625
k-neighbors: 0.0625
logistic-reg: 0.8125
liner-svg: 0.78125
random_forest: 0.4375
decision_tree: 0.625
N: 480
train_X: 384 test_X: 96
time: 2m19s
time: 0m23s
my_naive_bayes: 0.6979166666666666
naive_bayes: 0.8333333333333334
sgd: 0.8229166666666666
k-neighbors: 0.15625
logistic-reg: 0.8541666666666666
liner-svg: 0.8020833333333334
random_forest: 0.625
decision_tree: 0.5520833333333334
N: 800
train_X: 640 test_X: 160
time: 4m4s
time: 0m36s
my_naive_bayes: 0.73125
naive_bayes: 0.81875
sgd: 0.775
k-neighbors: 0.16875
logistic-reg: 0.85625
liner-svg: 0.85
random_forest: 0.65
decision_tree: 0.5375
N: 1600
train_X: 1280 test_X: 320
time: 9m56s
time: 1m15s
my_naive_bayes: 0.709375
naive_bayes: 0.81875
sgd: 0.8
k-neighbors: 0.278125
logistic-reg: 0.840625
liner-svg: 0.81875
random_forest: 0.740625
decision_tree: 0.63125
N: 3200
train_X: 2560 test_X: 640
time: 24m11s
time: 2m35s
my_naive_bayes: 0.8203125
naive_bayes: 0.8890625
sgd: 0.8703125
k-neighbors: 0.2828125
logistic-reg: 0.9046875
liner-svg: 0.9015625
random_forest: 0.7828125
decision_tree: 0.7140625
N: 6400
train_X: 5120 test_X: 1280
time: 58m58s
time: 5m27s
my_naive_bayes: 0.825
naive_bayes: 0.89375
sgd: 0.9015625
k-neighbors: 0.428125
logistic-reg: 0.9359375
liner-svm: 0.92578125
random_forest: 0.8421875
decision_tree: 0.775
期限につきましては、5/1(火)を目処に取り組んで頂き、 後ほど指定するGithubアカウントをコラボレーターに追加してください。 それを以て課題提出とさせて頂きます。 ====================================
課題
具体的な要件
環境
Step1: ウェブアプリの具体的な処理について
ウェブアプリの機能
ナイーブベイズを使った分類器の作成
Step2: 分類器の精度向上
コード規約
成果物
期間
5月1日(火)
評価基準
精度向上のために、試行錯誤ができている