FederatedAI / KubeFATE

Manage federated learning workload using cloud native technologies.
Apache License 2.0
418 stars 222 forks source link

kubefate version 报错 resp.StatusCode=401, error: {"code":401,"message":"incorrect Username or Password"} 。我也检查了config.yaml 里面的配置都没有变过,以前是可以kubefate 查看集群的,重启之后就不行了 #870

Open zhengjun1975 opened 1 year ago

zhengjun1975 commented 1 year ago

What deployment mode you are use?

  1. docker-compose;
  2. Kuberentes.

What KubeFATE and FATE version you are using?

MUST Please state the KubeFATE and FATE version you found the issue

What OS you are using for docker-compse or Kubernetes? Please also clear the version of OS.

Desktop (please complete the following information):

To Reproduce

Clear how to reproduce your problem.

What happen?

Clear the unexpected response.

Screenshots

If applicable, add screenshots to help explain your problem.

Additional context

Add any other context about the problem here.

owlet42 commented 1 year ago

你说的重启指的是什么重启? 你也可以检查以下项:

zhengjun1975 commented 1 year ago

您好,非常感谢您的恢复

2月18日我们公司停电,所以这个kubefate+k8s集群也停机过,物业检修完配电,我们就把k8s+kubefate启动了,开始启动后也出现了一些奇怪的问题我们就把它3个k8s的节点都恢复成2月17日的快照了。 mariadb是我们写入了10.10.10.12的一个单独的docker容器应该是。 没有重新部署过rbac.yaml,不过我现在想既然是认证问题是不是可以从新部署一下rbac.yaml再试。 上周在调试过程中看到的pod是正常的。但是就是kubefate version 或者kubefate cluster ls 时报 401 错误

你说的重启指的是什么重启? 你也可以检查以下项:

你的mariadb有没有持久化

mariadb是否重启过

是否重新部署过rbac.yaml

mariadb和kubefate的pod是否都是正确运行的

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

zhengjun1975 commented 1 year ago

目前问题解决了,需要reinstall rbac.yaml ,重新安装kubectl apply -f kubefate.yaml 中间也解决一些镜像不能拉取的问题的,删除pod后重新create。 然后重启所有节点。然后kubefate version 就能连接kubefate server了。但是集群信息没有显示出来,估计需要kubefate cluster update 一下。

owlet42 commented 1 year ago

如果mariadb没有持久化,cluster的信息可能会丢失,需要重新部署cluster。

zhengjun1975 commented 1 year ago

是的,我用kubectl delete namespace 、create namespace 后,重新cluster install 后,运行正常了!