giangnguyen2412 / InterpretableMLBook-Vietnamese

Bản dịch của cuốn "Interpretable Machine Learning: A Guide for Making Black Box Models Explainable" sang tiếng Việt
110 stars 44 forks source link

Discussion #2 - complete separation trong logistric regression #8

Closed giangnguyen2412 closed 4 years ago

giangnguyen2412 commented 4 years ago

Trong quá trình dịch mình thấy có 1 vấn đề với logistic regression được đề cập trong 4.5.2.

Logistic regression can suffer from complete separation. If there is a feature that would perfectly separate the two classes, the logistic regression model can no longer be trained. This is because the weight for that feature would not converge, because the optimal weight would be infinite.

Mình muốn discuss về vấn đề này một chút. Trong công thức của hồi quy logistic: image

Nếu x1 là đặc trưng gây ra complete separation, khi này giá trị x1 sẽ hoàn toàn control việc huấn luyện.

Nếu label là 0, thì giá trị beta1 sẽ âm vô cùng và nếu label là 1 thì giá trị beta1 là dương vô cùng để cực đại MLE. Khi này trọng số beta1 sẽ không thể hội tụ do update step giữa mỗi sample là quá lớn (-infinity -> infinity or vice versa).

Ai có cách giải thích khác ko nhỉ?

tungnguyen1234 commented 4 years ago

Em nghĩ cách giải của anh ổn rồi, em gợi ý là làm rõ tại sao feature 1 control việc huấn luyện.