Open asinglestep opened 1 day ago
有啊,Device_utilization_desc_of_container 和 Device_memory_desc_of_container 都有 deviceuuid 的,Pod 的 Name,Ns,Container 的 Name 相关信息都有的
Device_utilization_desc_of_container
有类似dcgm-exporter 的 gpu id 的字段吗?
deviceuuid 就是 dcgm-exporter 的 UUID:
Device_utilization_desc_of_container{..., deviceuuid="GPU-0aa6b97c-d386-26ba-a94a-b9d27c2e3a71", ...}
Device_utilization_desc_of_container
不是uuid,是前面这个id
目前没有直接提供这个 idx,我觉得可以通过 PromQL on (UUID) group_left 联合查询,具体怎么写这个 PromQL 可以问问 GPT,应该可以解决你的问题
Please provide an in-depth description of the question you have:
What do you think about this question?: gpu monitor在上报指标时,加入gpu id字段,方便统计某个pod使用哪个gpu
Environment: