cheng1999 / Student-Performance-Predict

0 stars 0 forks source link

目前預測結果與未來規劃 #2

Open maxwell-lcy opened 3 years ago

maxwell-lcy commented 3 years ago

分類問題(以總成績60分來界定是否會通過該科目) 根據目前結果來看,模型在預測總成績是否會過沒有很好的表現 使用的方法: PCA,one hot encoding 使用的模型: random forest classifier,Catboost classifier 評分方式:classification_report,cross validation(交叉驗證) 結果:0.60左右,準確率很低 原因:待定,不確定是否是因爲資料筆數過少的問題

回歸問題(以第三次成績作爲分數預測結果) 這部分模型取得了還不錯的效果,MSE的都偏低 使用的方法: one hot encoding,刪除G2或G3分數等於0的資料 使用的模型: SVR,random forest regression, gradient boosting regression 評分方式:MSE,RMSE,cross validation(交叉驗證) 結果:還不錯,特別是在葡萄牙語上表現很好 後續:透過提取random forest 及 gradient boosting 模型中的future importance,可以看到兩者的重要特徵幾乎相同,像failure,absence,Medu等,詳細的在ipynb裡面有列出來

未來規劃: 嘗試優化分類問題的結果,提取不同模型的重要特徵,嘗試今天早上老師介紹的voting模型