Open DAP52113 opened 11 months ago
博主您好,我现在有一个微博爬取的人工标注和机器人爬取的数据信息, 包括user_id 还有isOrNotBot标记是否为机器人字段。我想通过您的代码进行训练,在train函数中一直无法实现,可以说一下这个train函数的具体怎么调用吗
def train(self, model_data): # 归一化 self.scaler = StandardScaler() columns = model_data.columns model_data = self.scaler.fit_transform(model_data) # 训练模型 X_train, X_test, y_train, y_test = train_test_split(model_data, y, test_size=0.2, random_state=100) self.xgb = xgboost.XGBClassifier(learning_rate=0.1,n_estimators=200,max_depth=3,min_child_weight=0.7).fit(X_train, y_train) #learning_rate=0.1,n_estimators=1000,max_depth=5,min_child_weight=1, y_pred = self.xgb.predict(X_test) # 输出精度 acc_xgb = accuracy_score(y_test, y_pred)*100 recall_xgb = recall_score(y_test, y_pred)*100 f1_xgb = f1_score(y_test, y_pred)*100 precision_xgb = precision_score(y_test, y_pred)*100 print("acc_xgb:", acc_xgb) print("recall_xgb, precision_xgb, f1_xgb",recall_xgb, precision_xgb, f1_xgb)
您好,不好意思造成困惑,我这里还没有把train model的代码整合进来。
如果你有标签数据,你可以尝试用sklearn或者其他package进行训练,这部分网络上有很多参考。
2023年10月2日 上午10:30,DAP52113 @.***> 写道: xgboost.XGBClassifier
2023年10月2日 上午10:30,DAP52113 @.***> 写道:
xgboost.XGBClassifier
博主您好,我现在有一个微博爬取的人工标注和机器人爬取的数据信息, 包括user_id 还有isOrNotBot标记是否为机器人字段。我想通过您的代码进行训练,在train函数中一直无法实现,可以说一下这个train函数的具体怎么调用吗