spidernet-io / spiderpool

Underlay and RDMA network solution of the Kubernetes, for bare metal, VM and any public cloud
https://spidernet-io.github.io/spiderpool/
Apache License 2.0
523 stars 76 forks source link

Error: UPGRADE FAILED: "spiderpool" has no deployed releases #3530

Closed corrtia closed 4 months ago

corrtia commented 4 months ago

The Type of Document Issue

Lacking, Wrong

What's wrong with this document?

文档地址:https://spidernet-io.github.io/spiderpool/dev/usage/rdma-roce-zh_CN/#macvlan-ipvlan-rdma 我按照这个文档的基于 macvlan 或 ipvlan 共享使用 RDMA 网卡安装Spiderpool,我在执行第3步安装spiderpool时报错:

helm upgrade spiderpool spiderpool/spiderpool --namespace kube-system  \
--reuse-values  \
  --set rdma.rdmaSharedDevicePlugin.install=true   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.resourcePrefix="spidernet.io"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.resourceName="hca_shared_devices"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.rdmaHcaMax=500    \
--set rdma.rdmaSharedDevicePlugin.deviceConfig.vendors="15b3"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.deviceIDs="101d"  \
  --set plugins.installCNI=true    --set global.imageRegistryOverride=ghcr.m.daocloud.io
WARNING: Kubernetes configuration file is group-readable. This is insecure. Location: /root/.kube/config
WARNING: Kubernetes configuration file is world-readable. This is insecure. Location: /root/.kube/config
Error: UPGRADE FAILED: "spiderpool" has no deployed releases
corrtia commented 4 months ago

我尝试更改upgrade 为install,但出现了其他错误

Error: unknown flag: --reuse-values
ty-dc commented 4 months ago

感谢您的反馈,如果您是第一次安装 spiderpool,应该使用

helm upgrade --install spiderpool spiderpool/spiderpool 或者 helm install spiderpool spiderpool/spiderpool

Error: unknown flag: --reuse-values 是因为 helm install 没有 --reuse-values 参数,--reuse-values 更多搭配 upgrade 来使用。

文档存在一点不足,我们将文档优化如下,相信体验会更好。

helm upgrade --install  spiderpool spiderpool/spiderpool --namespace kube-system  \
--reuse-values  \
  --set rdma.rdmaSharedDevicePlugin.install=true   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.resourcePrefix="spidernet.io"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.resourceName="hca_shared_devices"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.rdmaHcaMax=500    \
--set rdma.rdmaSharedDevicePlugin.deviceConfig.vendors="15b3"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.deviceIDs="101d"  \
 --set plugins.installCNI=true    --set global.imageRegistryOverride=ghcr.m.daocloud.io
corrtia commented 4 months ago

新的安装命令可以正常运行。tks!

ty-dc commented 4 months ago

新的安装命令可以正常运行。tks!

好的,可以基于你的实际成功的命令,优化一下文档吗?😄

corrtia commented 4 months ago

新的安装命令可以正常运行。tks!

好的,可以基于你的实际成功的命令,优化一下文档吗?😄

我删除了集群里旧的spiderpool 并使用您给我的新命令安装spiderpool ,然后根据文档创建 ippool 并且创建一组跨节点的 DaemonSet 应用完成测试。 我使用的安装命令如下

helm list -n gpu-operator
helm uninstall -n gpu-operator gpu-operator-1716947190
helm upgrade --install  spiderpool spiderpool/spiderpool --namespace kube-system  \
--reuse-values  \
  --set rdma.rdmaSharedDevicePlugin.install=true   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.resourcePrefix="spidernet.io"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.resourceName="hca_shared_devices"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.rdmaHcaMax=500    \
--set rdma.rdmaSharedDevicePlugin.deviceConfig.vendors="15b3"   \
 --set rdma.rdmaSharedDevicePlugin.deviceConfig.deviceIDs="101d"  \
 --set plugins.installCNI=true    --set global.imageRegistryOverride=ghcr.m.daocloud.io
ty-dc commented 4 months ago

我使用的安装命令如下

如果方便的话,找到您引用的文档,按照您使用的命令,修改它,然后提交 PR。非常欢迎提交 PR 为我们修正任何问题😄

corrtia commented 4 months ago

我使用的安装命令如下

如果方便的话,找到您引用的文档,按照您使用的命令,修改它,然后提交 PR。非常欢迎提交 PR 为我们修正任何问题😄

好的。