yangwonsuck / PROJECT_CODE

0 stars 0 forks source link

붓꽃 데이터 분석-초급과정 #1

Open yangwonsuck opened 3 years ago

yangwonsuck commented 3 years ago

from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split import pandas as pd from sklearn.metrics import accuracy_score

붓꽃 데이터 세트를 로딩

iris=load_iris()

iris.data는 iris 데이터 세트에서 피처(feature)만으로 된 데이터를 numpy로 가지고 있다.

iris_data=iris.data

iris.target은 붓꽃 데이터 세트에서 레이블(결정 값)데이터를 numpy로 가지고 있다.

iris_label=iris.target print('iris target값:',iris_label) print('iris target명:',iris.target_names)

붓꽃 데이터 세트를 자세히 보기 위해 DataFrame으로 변환합니다.

iris_df=pd.DataFrame(data=iris_data,columns=iris.feature_names) iris_df['label']=iris.target iris_df.head(3)

X_train,X_test,y_train,y_test=train_test_split(iris_data,iris_label,test_size=0.2,random_state=11)

DecisionTreeClassifier 객체 생성

dt_clf=DecisionTreeClassifier(random_state=11)

학습 수행

dt_clf.fit(X_train,y_train)

학습이 완료된 DecisionTreeClassifier 객체에서 테스트 데이터 세트로 예측 수행

pred=dt_clf.predict(X_test)

print('예측 정확도: {0:.4f}'.format(accuracy_score(y_test,pred)))