Closed 120L020430 closed 11 hours ago
你的节点上有 8 张物理卡吗
你的节点上有 8 张物理卡吗
只有一张,但是这里的nvidia.com/gpu指的不是hami划分的vgpu吗?默认扩容比例是10,我的这个节点上可分配的nvidia.com/gpu是10。而且我也说了部署examples中的nvidia的例子是可以用的,只是和knative结合无法部署
我最近正在写关于 HAmi 的一个 FAQ,不过还处于起草阶段 https://v6eky86feo.feishu.cn/wiki/ViC8wFcItiCCzjkx2c3cgXMhnwh
到时候写完了会放在相关的文档里
里面有关于这个问题的回答:
我最近正在写关于 HAmi 的一个 FAQ,不过还处于起草阶段 https://v6eky86feo.feishu.cn/wiki/ViC8wFcItiCCzjkx2c3cgXMhnwh
到时候写完了会放在相关的文档里
里面有关于这个问题的回答:
明白了,感谢感谢
What happened: 当我在部署knative的函数时,pod无法成功被部署
What you expected to happen: 能成功部署在相应节点上 How to reproduce it (as minimally and precisely as possible): 我使用的是k3s+knative,kantive是一个serverless函数管理框架,可以参照https://knative.dev/docs/install/yaml-install/serving/install-serving-with-yaml/ 安装 我的服务的部署文件如下:
我尝试完全不指定节点、使用nodeaffinity以及nodeSelector这三种方法进行部署,但都报最上面的错 而我在部署正常的k8s的service或者examples中的nvidia的pod例子时,结果是正确的
Anything else we need to know?:
nvidia-smi -a
on your host/etc/docker/daemon.json
)sudo journalctl -r -u kubelet
)dmesg
Environment:
docker version
uname -a