Closed JAINKRE closed 5 months ago
v1.10.10-lts
希望1panel可以集成对主机硬件的监控,主要是各个硬件的参数。这样就可以直接了解服务器各个核心运行的状态,没必要总是远程登录bmc查看了
现在我们通过脚本的方法实现,但是各个参数展现不是很直观,希望可以考虑集成到面板中,以下是具体实现方法:
lm-sensors
sudo apt-get install lm-sensors # Debian/Ubuntu sudo yum install lm_sensors # CentOS/RHEL sudo dnf install lm_sensors # Fedora
sudo sensors-detect
首次运行需要设置启动的传感器 4.查看温度: sensors 5.查看磁盘温度,安装smartmontools: sudo apt-get install smartmontools # Debian/Ubuntu sudo yum install smartmontools # CentOS/RHEL sudo dnf install smartmontools # Fedora 6.查看指定磁盘温度: sudo smartctl -A /dev/sdb | grep Temperature 7.定期更新传感器支持: sudo sensors-detect --auto
首次运行需要设置启动的传感器 4.查看温度:
sensors
5.查看磁盘温度,安装smartmontools:
sudo apt-get install smartmontools # Debian/Ubuntu sudo yum install smartmontools # CentOS/RHEL sudo dnf install smartmontools # Fedora
6.查看指定磁盘温度:
sudo smartctl -A /dev/sdb | grep Temperature
7.定期更新传感器支持:
sudo sensors-detect --auto
1.查询硬件温度:
[root@LocalServer-A02 ~]# sensors coretemp-isa-0000 Adapter: ISA adapter Package id 0: +52.0°C (high = +80.0°C, crit = +100.0°C) Core 0: +52.0°C (high = +80.0°C, crit = +100.0°C) Core 1: +52.0°C (high = +80.0°C, crit = +100.0°C) acpitz-virtual-0 Adapter: Virtual device temp1: +27.8°C (crit = +105.0°C) temp2: +29.8°C (crit = +105.0°C) nouveau-pci-0100 Adapter: PCI adapter GPU core: +0.91 V (min = +0.80 V, max = +1.19 V) temp1: +39.0°C (high = +95.0°C, hyst = +3.0°C) (crit = +105.0°C, hyst = +5.0°C) (emerg = +135.0°C, hyst = +5.0°C)
说明:
coretemp-isa-0000: 这部分显示的是CPU的温度信息,具体来说是Intel处理器的温度。Adapter: ISA adapter表示这是一个通过ISA总线适配器连接的传感器,但实际上这里的描述可能是默认的,因为现代系统很少使用ISA总线。
Package id 0: 表示整个CPU封装的温度,这里是+52.0°C。
Core 0: 表示CPU的第一个核心的温度,同样是+52.0°C。
Core 1: 表示CPU的第二个核心的温度,依然是+52.0°C。 这里的high和crit值分别表示警告温度和临界温度。如果温度达到high值,系统会发出警告;如果达到crit值,则可能会触发更严重的响应,如自动关机,以防止硬件损坏。
acpitz-virtual-0: 这部分显示的是与ACPI(Advanced Configuration and Power Interface)相关的温度信息,通常反映的是主板或其他非CPU组件的温度。
temp1: 显示为+27.8°C,这可能代表主板或某个芯片的温度。
temp2: 显示为+29.8°C,可能代表另一个主板区域或组件的温度。 同样的,这里也有一个crit值,表示如果温度超过+105.0°C,系统可能会采取紧急措施。
nouveau-pci-0100: 这部分显示的是NVIDIA图形卡的温度和电压信息。
Adapter: PCI adapter表明这是通过PCI总线连接的传感器。
GPU core: 显示GPU核心的电压,这里是+0.91V,同时给出了电压的最小值和最大值。
temp1: 显示GPU的温度,这里是+39.0°C,同样有high、crit和emerg值,分别表示警告、临界和紧急温度。
2.查询硬盘温度
[root@LocalServer-A02 ~]# sudo smartctl -A /dev/sdb | grep Temperature 194 Temperature_Celsius 0x0022 047 047 000 Old_age Always - 47 (Min/Max 32/54)
以上只是获取cpu、存储、显卡等温度,这些参数具有普遍适用性。其他参数因为不同机器硬件不同适配会比较麻烦,可以不考虑
No response
感谢大佬建议。 服务器硬件(如 CPU、主板温度等)需求的讨论,统一汇总到该 issue #1614
1Panel 版本
v1.10.10-lts
请描述您的需求或者改进建议
希望1panel可以集成对主机硬件的监控,主要是各个硬件的参数。这样就可以直接了解服务器各个核心运行的状态,没必要总是远程登录bmc查看了
请描述你建议的实现方案
现在我们通过脚本的方法实现,但是各个参数展现不是很直观,希望可以考虑集成到面板中,以下是具体实现方法:
实现
lm-sensors
针对不同系统:参数
1.查询硬件温度:
说明:
coretemp-isa-0000: 这部分显示的是CPU的温度信息,具体来说是Intel处理器的温度。Adapter: ISA adapter表示这是一个通过ISA总线适配器连接的传感器,但实际上这里的描述可能是默认的,因为现代系统很少使用ISA总线。
Package id 0: 表示整个CPU封装的温度,这里是+52.0°C。
Core 0: 表示CPU的第一个核心的温度,同样是+52.0°C。
Core 1: 表示CPU的第二个核心的温度,依然是+52.0°C。 这里的high和crit值分别表示警告温度和临界温度。如果温度达到high值,系统会发出警告;如果达到crit值,则可能会触发更严重的响应,如自动关机,以防止硬件损坏。
acpitz-virtual-0: 这部分显示的是与ACPI(Advanced Configuration and Power Interface)相关的温度信息,通常反映的是主板或其他非CPU组件的温度。
temp1: 显示为+27.8°C,这可能代表主板或某个芯片的温度。
temp2: 显示为+29.8°C,可能代表另一个主板区域或组件的温度。 同样的,这里也有一个crit值,表示如果温度超过+105.0°C,系统可能会采取紧急措施。
nouveau-pci-0100: 这部分显示的是NVIDIA图形卡的温度和电压信息。
Adapter: PCI adapter表明这是通过PCI总线连接的传感器。
GPU core: 显示GPU核心的电压,这里是+0.91V,同时给出了电压的最小值和最大值。
temp1: 显示GPU的温度,这里是+39.0°C,同样有high、crit和emerg值,分别表示警告、临界和紧急温度。
2.查询硬盘温度
说明:
以上只是获取cpu、存储、显卡等温度,这些参数具有普遍适用性。其他参数因为不同机器硬件不同适配会比较麻烦,可以不考虑
附加信息
No response