FederatedAI / FATE

An Industrial Grade Federated Learning Framework
Apache License 2.0
5.66k stars 1.55k forks source link

三方联合建模大数据量失败,无报错信息 #5604

Open didadida321 opened 4 months ago

didadida321 commented 4 months ago

三方建模,配置只打通了guest和两个host之间的连接(parties.conf),host之间没有连接,使用breast数据集可以跑通。但是用大数据集60万样本,跑了10分钟任务挂掉了,没有报错日志输出。如果将host之间也连接的话,大数据量可以跑通,这是为什么呢?

didadida321 commented 4 months ago

又尝试了减小数据集大小,发现任务只要在10分钟以内就能成功,10分钟之后,就会挂掉。是有什么地方设置时间参数么?

mgqa34 commented 4 months ago

请问下用的是什么算法?麻烦给一下算法任务配置,另外也麻烦给下报错日志用于分析

didadida321 commented 4 months ago

请问下用的是什么算法?麻烦给一下算法任务配置,另外也麻烦给下报错日志用于分析

使用的xgb,就是官网给的配置,您这边可以试下大数据集,只连接guest与host之间的网络,三方建模,建模超过10分钟就会失败,这个应该是必现的。