mengxiao2000 / weibo_bot_finder

a project for social bot detection based on weibo.
13 stars 9 forks source link

有关模型训练失败的问题 #1

Open DAP52113 opened 11 months ago

DAP52113 commented 11 months ago

博主您好,我现在有一个微博爬取的人工标注和机器人爬取的数据信息, 包括user_id 还有isOrNotBot标记是否为机器人字段。我想通过您的代码进行训练,在train函数中一直无法实现,可以说一下这个train函数的具体怎么调用吗

def train(self, model_data):
    # 归一化
    self.scaler = StandardScaler()
    columns = model_data.columns
    model_data = self.scaler.fit_transform(model_data)

    # 训练模型
    X_train, X_test, y_train, y_test = train_test_split(model_data, y, test_size=0.2, random_state=100)
    self.xgb = xgboost.XGBClassifier(learning_rate=0.1,n_estimators=200,max_depth=3,min_child_weight=0.7).fit(X_train, y_train)
    #learning_rate=0.1,n_estimators=1000,max_depth=5,min_child_weight=1,
    y_pred = self.xgb.predict(X_test)

    # 输出精度
    acc_xgb = accuracy_score(y_test, y_pred)*100
    recall_xgb = recall_score(y_test, y_pred)*100
    f1_xgb = f1_score(y_test, y_pred)*100
    precision_xgb = precision_score(y_test, y_pred)*100
    print("acc_xgb:", acc_xgb)
    print("recall_xgb, precision_xgb, f1_xgb",recall_xgb, precision_xgb, f1_xgb)
mengxiao2000 commented 11 months ago

您好,不好意思造成困惑,我这里还没有把train model的代码整合进来。

如果你有标签数据,你可以尝试用sklearn或者其他package进行训练,这部分网络上有很多参考。

2023年10月2日 上午10:30,DAP52113 @.***> 写道:

xgboost.XGBClassifier