AliyunContainerService / gpushare-device-plugin

GPU Sharing Device Plugin for Kubernetes Cluster
Apache License 2.0
468 stars 144 forks source link

节点有多个不同型号GPU(显存也不一致)时会以第一个识别到的GPU为准 #59

Open SakuraAxy opened 1 year ago

SakuraAxy commented 1 year ago

这里这块代码会导致当节点有多个不同型号GPU(显存也不一致)时会以第一个识别到的GPU为准,例如节点12G +16G ,这个节点两个GPU会被都识别成12G,一共24G

https://github.com/AliyunContainerService/gpushare-device-plugin/blob/45fb8b88692250cff2d53cb64b0a41864a5fcaf3/pkg/gpu/nvidia/nvidia.go#L70

@cheyang