Closed minji-o-j closed 3 years ago
X_train, X_test, y_train, y_test = train_test_split(c_data, data['binaryQuality'],test_size=0.3,random_state=0)
X_test, X_val, y_test, y_val = train_test_split(X_test, y_test,test_size=0.5,random_state=0)
train_test_split
: 데이터셋을 섞어서 나눠준다.
random_state
에 난수 초기값을 같은걸로 전달하면 됨random_state=42
등.. n_neighbors=1
가장 가까운 1개의 이웃 찾음
.fit
: 훈련 데이터셋으로부터 모델을 만들기 위해서는 knn 객체의 fit
method 사용 필요
knn 객체 자체가 변경됨(데이터로 훈련됨)
용어