tencentmusic / cube-studio

cube studio开源云原生一站式机器学习/深度学习/大模型AI平台,支持sso登录,多租户,大数据平台对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式训练,超参搜索,推理服务VGPU,边缘计算,serverless,标注平台,自动化标注,数据集管理,大模型微调,vllm大模型推理,llmops,私有知识库,AI模型应用商店,支持模型一键开发/推理/微调,支持国产cpu/gpu/npu芯片,支持RDMA,支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式
Other
3.45k stars 610 forks source link

安装问题关于已存在kubeflow prometheus #205

Closed 631068264 closed 1 year ago

631068264 commented 1 year ago

针对 现有

kubeflow1.6
k8s 1.22.9 rancher2.6.5 + 再集群已经安装Monitoring (100.2.0+up40.1.2)

那运行start.sh 要怎么改?

还是要卸载原来的?

gxin0426 commented 1 year ago

建议将kubeflow相关组件卸载(包括crd), start.sh 中注释掉monitoring部分代码,再执行start.sh 脚本