Open hoanguyentat opened 6 years ago
cái hàm model_selection.train_test_split nó để chia mảng thành các tập con và kiểm tra ngẫu nhiên nó ạ Cụ thể hơn trong phần này họ muốn chia tập dữ liệu ra làm 2 phần: 1 để train và 1 để kiểm tra (20% 80%) và việc chia làm 2 bộ để test thì cái X là cái feature còn Y là cái response chính xác hơn như em in ra thử (lệnh X.shape() và Y.shape()) thì cái Y chính là tích của các feature của X
1 để train và 1 để kiểm tra (20% 80%) sao train lại chỉ có 20%
80% để train 20% để test ạ! em viết ngược, trong cmt code e có chú thích r mà ạ
https://github.com/tideburning/python_test4/blob/9513b83bfbd4d258ee51fe40eaab853f764c1f30/bai1/bai1.py#L68