centreon / centreon-plugins

Collection of standard plugins to discover and gather cloud-to-edge metrics and status across your whole IT infrastructure.
https://www.centreon.com
Apache License 2.0
310 stars 274 forks source link

[hardware::server::lenovo::xcc::snmp::plugin] : --mode=component / Problme with exclude fan #5290

Open monsieurpouet opened 4 days ago

monsieurpouet commented 4 days ago

Hi all !

Quick description

When I use the plugin for lenovo xcc with the threshold-overload, I see the overload is not applicated.

How to reproduce

Please provide below the initial conditions to reproduce the bug

Expected result

OK: All Components are OK | 'temp_Ambient Temp'=22C;0:43;0:47;; 'temp_Exhaust Temp'=35C;;;; 'temp_CPU 1 Temp'=45C;;;; 'temp_CPU 1 DTS'=-51.0C;;;; 'temp_DIMM 1 Temp'=33C;;;; 'temp_DIMM 3 Temp'=34C;;;; 'temp_DIMM 5 Temp'=34C;;;; 'temp_DIMM 7 Temp'=32C;;;; 'temp_DIMM 10 Temp'=34C;;;; 'temp_DIMM 12 Temp'=35C;;;; 'temp_DIMM 14 Temp'=34C;;;; 'temp_DIMM 16 Temp'=31C;;;; 'temp_PCH Temp'=42C;;;; 'volt_SysBrd 12V'=12.096;;10.808:13.216;; 'volt_SysBrd 5V'=4.9374;;4.4928:5.4990;; 'volt_SysBrd 3.3V'=3.2550;;2.9760:3.6270;; 'volt_CMOS Battery'=3.0680;2.3920:;2.2490:;; 'fan_Fan 1 Front Tach'=27%;;;0;100 'fan_Fan 2 Front Tach'=27%;;;0;100 'fan_Fan 3 Front Tach'=27%;;;0;100 'fan_Fan 4 Front Tach'=27%;;;0;100 'fan_Fan 5 Front Tach'=23%;;;0;100 'fan_Fan 6 Front Tach'=24%;;;0;100 'fan_Fan 1 Rear Tach'=25%;;;0;100 'fan_Fan 2 Rear Tach'=26%;;;0;100 'fan_Fan 3 Rear Tach'=25%;;;0;100 'fan_Fan 4 Rear Tach'=26%;;;0;100 'fan_Fan 5 Rear Tach'=22%;;;0;100 'fan_Fan 6 Rear Tach'=23%;;;0;100 'count_disk'=2;;;; 'count_fan'=16;;;; 'count_psu'=2;;;; 'count_temperature'=13;;;; 'count_voltage'=4;;;;

Actual result

CRITICAL: Fan 'Fan 7 Front Tach' status is 'Unknown' - Fan 'Fan 8 Front Tach' status is 'Unknown' - Fan 'Fan 7 Rear Tach' status is 'Unknown' - Fan 'Fan 8 Rear Tach' status is 'Unknown' | 'temp_Ambient Temp'=22C;0:43;0:47;; 'temp_Exhaust Temp'=35C;;;; 'temp_CPU 1 Temp'=45C;;;; 'temp_CPU 1 DTS'=-51.0C;;;; 'temp_DIMM 1 Temp'=33C;;;; 'temp_DIMM 3 Temp'=34C;;;; 'temp_DIMM 5 Temp'=34C;;;; 'temp_DIMM 7 Temp'=32C;;;; 'temp_DIMM 10 Temp'=34C;;;; 'temp_DIMM 12 Temp'=35C;;;; 'temp_DIMM 14 Temp'=34C;;;; 'temp_DIMM 16 Temp'=31C;;;; 'temp_PCH Temp'=42C;;;; 'volt_SysBrd 12V'=12.096;;10.808:13.216;; 'volt_SysBrd 5V'=4.9374;;4.4928:5.4990;; 'volt_SysBrd 3.3V'=3.2550;;2.9760:3.6270;; 'volt_CMOS Battery'=3.0680;2.3920:;2.2490:;; 'fan_Fan 1 Front Tach'=27%;;;0;100 'fan_Fan 2 Front Tach'=27%;;;0;100 'fan_Fan 3 Front Tach'=27%;;;0;100 'fan_Fan 4 Front Tach'=27%;;;0;100 'fan_Fan 5 Front Tach'=23%;;;0;100 'fan_Fan 6 Front Tach'=24%;;;0;100 'fan_Fan 1 Rear Tach'=25%;;;0;100 'fan_Fan 2 Rear Tach'=26%;;;0;100 'fan_Fan 3 Rear Tach'=25%;;;0;100 'fan_Fan 4 Rear Tach'=26%;;;0;100 'fan_Fan 5 Rear Tach'=22%;;;0;100 'fan_Fan 6 Rear Tach'=23%;;;0;100 'count_disk'=2;;;; 'count_fan'=16;;;; 'count_psu'=2;;;; 'count_temperature'=13;;;; 'count_voltage'=4;;;; Checking temperatures temperature 'Ambient Temp' status is Normal [instance: 1][value: 22 C]. temperature 'Exhaust Temp' status is Normal [instance: 2][value: 35 C]. temperature 'CPU 1 Temp' status is Normal [instance: 3][value: 45 C]. temperature 'CPU 1 DTS' status is Normal [instance: 4][value: -51.0 C]. temperature 'DIMM 1 Temp' status is Normal [instance: 5][value: 33 C]. temperature 'DIMM 3 Temp' status is Normal [instance: 6][value: 34 C]. temperature 'DIMM 5 Temp' status is Normal [instance: 7][value: 34 C]. temperature 'DIMM 7 Temp' status is Normal [instance: 8][value: 32 C]. temperature 'DIMM 10 Temp' status is Normal [instance: 9][value: 34 C]. temperature 'DIMM 12 Temp' status is Normal [instance: 10][value: 35 C]. temperature 'DIMM 14 Temp' status is Normal [instance: 11][value: 34 C]. temperature 'DIMM 16 Temp' status is Normal [instance: 12][value: 31 C]. temperature 'PCH Temp' status is Normal [instance: 13][value: 42 C]. Checking voltages voltage 'SysBrd 12V' status is Normal [instance: 1][value: 12.096]. voltage 'SysBrd 5V' status is Normal [instance: 2][value: 4.9374]. voltage 'SysBrd 3.3V' status is Normal [instance: 3][value: 3.2550]. voltage 'CMOS Battery' status is Normal [instance: 4][value: 3.0680]. Checking fans Fan 'Fan 1 Front Tach' status is 'Normal' [instance = 1][value: 27% of maximum] Fan 'Fan 2 Front Tach' status is 'Normal' [instance = 2][value: 27% of maximum] Fan 'Fan 3 Front Tach' status is 'Normal' [instance = 3][value: 27% of maximum] Fan 'Fan 4 Front Tach' status is 'Normal' [instance = 4][value: 27% of maximum] Fan 'Fan 5 Front Tach' status is 'Normal' [instance = 5][value: 23% of maximum] Fan 'Fan 6 Front Tach' status is 'Normal' [instance = 6][value: 24% of maximum] Fan 'Fan 7 Front Tach' status is 'Unknown' [instance = 7][value: offline] Fan 'Fan 8 Front Tach' status is 'Unknown' [instance = 8][value: offline] Fan 'Fan 1 Rear Tach' status is 'Normal' [instance = 9][value: 25% of maximum] Fan 'Fan 2 Rear Tach' status is 'Normal' [instance = 10][value: 26% of maximum] Fan 'Fan 3 Rear Tach' status is 'Normal' [instance = 11][value: 25% of maximum] Fan 'Fan 4 Rear Tach' status is 'Normal' [instance = 12][value: 26% of maximum] Fan 'Fan 5 Rear Tach' status is 'Normal' [instance = 13][value: 22% of maximum] Fan 'Fan 6 Rear Tach' status is 'Normal' [instance = 14][value: 23% of maximum] Fan 'Fan 7 Rear Tach' status is 'Unknown' [instance = 15][value: offline] Fan 'Fan 8 Rear Tach' status is 'Unknown' [instance = 16][value: offline] Checking power supplies power supply 'PSU 1' status is Normal [instance: 1]. power supply 'PSU 2' status is Normal [instance: 2]. Checking disks disk 'M2 Drive 0' status is Normal [instance: 14]. disk 'M2 Drive 1' status is Normal [instance: 15]. Checking raid volumes

Closing words

I don't known why, but some fan is unknown because offline. If I use a threasold option to exclude them, it's in critical status again.

lucie-dubrunfaut commented 2 days ago

Hello :)

If you use the option --threshold-overload='fan,OK,offline' it doesn't work ? Can you provide us with the plugin output with the --debug option set ? (or even better, an anonymised snmpwalk of your data)

monsieurpouet commented 2 days ago

Hi @lucie-dubrunfaut :)

No, it doesn't work :/

The ouput with --debug

.1.3.6.1.4.1.19046.11.1.1.1.2.1.1.1 = 1 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.2 = 2 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.3 = 3 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.4 = 4 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.5 = 5 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.6 = 6 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.7 = 7 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.8 = 8 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.9 = 9 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.10 = 10 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.11 = 11 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.12 = 12 .1.3.6.1.4.1.19046.11.1.1.1.2.1.1.13 = 13 .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.1 = Ambient Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.2 = Exhaust Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.3 = CPU 1 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.4 = CPU 1 DTS .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.5 = DIMM 1 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.6 = DIMM 3 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.7 = DIMM 5 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.8 = DIMM 7 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.9 = DIMM 10 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.10 = DIMM 12 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.11 = DIMM 14 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.12 = DIMM 16 Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.2.13 = PCH Temp .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.1 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.2 = 35 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.3 = 41 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.4 = -51.0 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.5 = 33 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.6 = 34 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.7 = 34 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.8 = 32 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.9 = 34 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.10 = 35 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.11 = 34 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.12 = 31 .1.3.6.1.4.1.19046.11.1.1.1.2.1.3.13 = 42 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.1 = 19 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.2 = 19 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.3 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.4 = -27.0 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.5 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.6 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.7 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.8 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.9 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.10 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.11 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.12 = 22 .1.3.6.1.4.1.19046.11.1.1.1.2.1.4.13 = 19 .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.1 = 50 .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.2 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.3 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.4 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.5 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.6 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.7 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.8 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.9 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.10 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.11 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.12 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.5.13 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.1 = 47 .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.2 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.3 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.4 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.5 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.6 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.7 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.8 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.9 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.10 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.11 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.12 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.6.13 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.1 = 43 .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.2 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.3 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.4 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.5 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.6 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.7 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.8 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.9 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.10 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.11 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.12 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.7.13 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.1 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.2 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.3 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.4 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.5 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.6 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.7 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.8 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.9 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.10 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.11 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.12 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.8.13 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.1 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.2 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.3 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.4 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.5 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.6 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.7 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.8 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.9 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.10 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.11 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.12 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.9.13 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.1 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.2 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.3 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.4 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.5 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.6 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.7 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.8 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.9 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.10 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.11 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.12 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.10.13 = N/A .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.1 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.2 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.3 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.4 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.5 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.6 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.7 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.8 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.9 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.10 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.11 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.12 = Normal .1.3.6.1.4.1.19046.11.1.1.1.2.1.11.13 = Normal .1.3.6.1.4.1.19046.11.1.1.2.2.1.1.1 = 1 .1.3.6.1.4.1.19046.11.1.1.2.2.1.1.2 = 2 .1.3.6.1.4.1.19046.11.1.1.2.2.1.1.3 = 3 .1.3.6.1.4.1.19046.11.1.1.2.2.1.1.4 = 4 .1.3.6.1.4.1.19046.11.1.1.2.2.1.2.1 = SysBrd 12V .1.3.6.1.4.1.19046.11.1.1.2.2.1.2.2 = SysBrd 5V .1.3.6.1.4.1.19046.11.1.1.2.2.1.2.3 = SysBrd 3.3V .1.3.6.1.4.1.19046.11.1.1.2.2.1.2.4 = CMOS Battery .1.3.6.1.4.1.19046.11.1.1.2.2.1.3.1 = 12.096 .1.3.6.1.4.1.19046.11.1.1.2.2.1.3.2 = 4.9374 .1.3.6.1.4.1.19046.11.1.1.2.2.1.3.3 = 3.2705 .1.3.6.1.4.1.19046.11.1.1.2.2.1.3.4 = 3.0680 .1.3.6.1.4.1.19046.11.1.1.2.2.1.4.1 = 12.096 .1.3.6.1.4.1.19046.11.1.1.2.2.1.4.2 = 5.0544 .1.3.6.1.4.1.19046.11.1.1.2.2.1.4.3 = 3.3015 .1.3.6.1.4.1.19046.11.1.1.2.2.1.4.4 = 3.0160 .1.3.6.1.4.1.19046.11.1.1.2.2.1.5.1 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.5.2 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.5.3 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.5.4 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.6.1 = 13.216 .1.3.6.1.4.1.19046.11.1.1.2.2.1.6.2 = 5.4990 .1.3.6.1.4.1.19046.11.1.1.2.2.1.6.3 = 3.6270 .1.3.6.1.4.1.19046.11.1.1.2.2.1.6.4 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.7.1 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.7.2 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.7.3 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.7.4 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.8.1 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.8.2 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.8.3 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.8.4 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.9.1 = 10.808 .1.3.6.1.4.1.19046.11.1.1.2.2.1.9.2 = 4.4928 .1.3.6.1.4.1.19046.11.1.1.2.2.1.9.3 = 2.9760 .1.3.6.1.4.1.19046.11.1.1.2.2.1.9.4 = 2.2490 .1.3.6.1.4.1.19046.11.1.1.2.2.1.10.1 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.10.2 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.10.3 = N/A .1.3.6.1.4.1.19046.11.1.1.2.2.1.10.4 = 2.3920 .1.3.6.1.4.1.19046.11.1.1.2.2.1.11.1 = Normal .1.3.6.1.4.1.19046.11.1.1.2.2.1.11.2 = Normal .1.3.6.1.4.1.19046.11.1.1.2.2.1.11.3 = Normal .1.3.6.1.4.1.19046.11.1.1.2.2.1.11.4 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.1 = 1 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.2 = 2 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.3 = 3 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.4 = 4 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.5 = 5 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.6 = 6 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.7 = 7 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.8 = 8 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.9 = 9 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.10 = 10 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.11 = 11 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.12 = 12 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.13 = 13 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.14 = 14 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.15 = 15 .1.3.6.1.4.1.19046.11.1.1.3.2.1.1.16 = 16 .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.1 = Fan 1 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.2 = Fan 2 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.3 = Fan 3 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.4 = Fan 4 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.5 = Fan 5 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.6 = Fan 6 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.7 = Fan 7 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.8 = Fan 8 Front Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.9 = Fan 1 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.10 = Fan 2 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.11 = Fan 3 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.12 = Fan 4 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.13 = Fan 5 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.14 = Fan 6 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.15 = Fan 7 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.2.16 = Fan 8 Rear Tach .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.1 = 27% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.2 = 27% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.3 = 27% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.4 = 27% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.5 = 23% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.6 = 24% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.7 = offline .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.8 = offline .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.9 = 25% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.10 = 26% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.11 = 25% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.12 = 26% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.13 = 22% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.14 = 22% of maximum .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.15 = offline .1.3.6.1.4.1.19046.11.1.1.3.2.1.3.16 = offline .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.1 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.2 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.3 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.4 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.5 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.6 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.7 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.8 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.9 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.10 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.11 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.12 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.13 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.14 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.15 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.4.16 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.1 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.2 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.3 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.4 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.5 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.6 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.7 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.8 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.9 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.10 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.11 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.12 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.13 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.14 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.15 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.5.16 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.1 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.2 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.3 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.4 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.5 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.6 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.7 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.8 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.9 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.10 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.11 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.12 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.13 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.14 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.15 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.6.16 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.1 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.2 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.3 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.4 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.5 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.6 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.7 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.8 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.9 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.10 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.11 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.12 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.13 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.14 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.15 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.7.16 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.1 = 2432 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.2 = 2432 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.3 = 2432 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.4 = 2432 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.5 = 2432 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.6 = 2432 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.7 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.8 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.9 = 2052 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.10 = 2052 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.11 = 2052 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.12 = 2052 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.13 = 2052 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.14 = 2052 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.15 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.8.16 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.1 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.2 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.3 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.4 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.5 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.6 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.7 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.8 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.9 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.10 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.11 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.12 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.13 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.14 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.15 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.9.16 = 0 .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.1 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.2 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.3 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.4 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.5 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.6 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.7 = Unknown .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.8 = Unknown .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.9 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.10 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.11 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.12 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.13 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.14 = Normal .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.15 = Unknown .1.3.6.1.4.1.19046.11.1.1.3.2.1.10.16 = Unknown .1.3.6.1.4.1.19046.11.1.1.11.2.1.1.1 = 1 .1.3.6.1.4.1.19046.11.1.1.11.2.1.1.2 = 2 .1.3.6.1.4.1.19046.11.1.1.11.2.1.2.1 = PSU 1 .1.3.6.1.4.1.19046.11.1.1.11.2.1.2.2 = PSU 2 .1.3.6.1.4.1.19046.11.1.1.11.2.1.3.1 = SP57A86669 .1.3.6.1.4.1.19046.11.1.1.11.2.1.3.2 = SP57A86669 .1.3.6.1.4.1.19046.11.1.1.11.2.1.4.1 = 02YF224 .1.3.6.1.4.1.19046.11.1.1.11.2.1.4.2 = 02YF224 .1.3.6.1.4.1.19046.11.1.1.11.2.1.5.1 = A1DB32P11JR .1.3.6.1.4.1.19046.11.1.1.11.2.1.5.2 = A1DB32P13T3 .1.3.6.1.4.1.19046.11.1.1.11.2.1.6.1 = Normal .1.3.6.1.4.1.19046.11.1.1.11.2.1.6.2 = Normal .1.3.6.1.4.1.19046.11.1.1.12.2.1.1.14 = 14 .1.3.6.1.4.1.19046.11.1.1.12.2.1.1.15 = 15 .1.3.6.1.4.1.19046.11.1.1.12.2.1.2.14 = M2 Drive 0 .1.3.6.1.4.1.19046.11.1.1.12.2.1.2.15 = M2 Drive 1 .1.3.6.1.4.1.19046.11.1.1.12.2.1.3.14 = Normal .1.3.6.1.4.1.19046.11.1.1.12.2.1.3.15 = Normal Checking temperatures temperature 'Ambient Temp' status is Normal [instance: 1][value: 22 C]. temperature 'Exhaust Temp' status is Normal [instance: 2][value: 35 C]. temperature 'CPU 1 Temp' status is Normal [instance: 3][value: 41 C]. temperature 'CPU 1 DTS' status is Normal [instance: 4][value: -51.0 C]. temperature 'DIMM 1 Temp' status is Normal [instance: 5][value: 33 C]. temperature 'DIMM 3 Temp' status is Normal [instance: 6][value: 34 C]. temperature 'DIMM 5 Temp' status is Normal [instance: 7][value: 34 C]. temperature 'DIMM 7 Temp' status is Normal [instance: 8][value: 32 C]. temperature 'DIMM 10 Temp' status is Normal [instance: 9][value: 34 C]. temperature 'DIMM 12 Temp' status is Normal [instance: 10][value: 35 C]. temperature 'DIMM 14 Temp' status is Normal [instance: 11][value: 34 C]. temperature 'DIMM 16 Temp' status is Normal [instance: 12][value: 31 C]. temperature 'PCH Temp' status is Normal [instance: 13][value: 42 C]. Checking voltages voltage 'SysBrd 12V' status is Normal [instance: 1][value: 12.096]. voltage 'SysBrd 5V' status is Normal [instance: 2][value: 4.9374]. voltage 'SysBrd 3.3V' status is Normal [instance: 3][value: 3.2705]. voltage 'CMOS Battery' status is Normal [instance: 4][value: 3.0680]. Checking fans Fan 'Fan 1 Front Tach' status is 'Normal' [instance = 1][value: 27% of maximum] Fan 'Fan 2 Front Tach' status is 'Normal' [instance = 2][value: 27% of maximum] Fan 'Fan 3 Front Tach' status is 'Normal' [instance = 3][value: 27% of maximum] Fan 'Fan 4 Front Tach' status is 'Normal' [instance = 4][value: 27% of maximum] Fan 'Fan 5 Front Tach' status is 'Normal' [instance = 5][value: 23% of maximum] Fan 'Fan 6 Front Tach' status is 'Normal' [instance = 6][value: 24% of maximum] Fan 'Fan 7 Front Tach' status is 'Unknown' [instance = 7][value: offline] Fan 'Fan 8 Front Tach' status is 'Unknown' [instance = 8][value: offline] Fan 'Fan 1 Rear Tach' status is 'Normal' [instance = 9][value: 25% of maximum] Fan 'Fan 2 Rear Tach' status is 'Normal' [instance = 10][value: 26% of maximum] Fan 'Fan 3 Rear Tach' status is 'Normal' [instance = 11][value: 25% of maximum] Fan 'Fan 4 Rear Tach' status is 'Normal' [instance = 12][value: 26% of maximum] Fan 'Fan 5 Rear Tach' status is 'Normal' [instance = 13][value: 22% of maximum] Fan 'Fan 6 Rear Tach' status is 'Normal' [instance = 14][value: 22% of maximum] Fan 'Fan 7 Rear Tach' status is 'Unknown' [instance = 15][value: offline] Fan 'Fan 8 Rear Tach' status is 'Unknown' [instance = 16][value: offline] Checking power supplies power supply 'PSU 1' status is Normal [instance: 1]. power supply 'PSU 2' status is Normal [instance: 2]. Checking disks disk 'M2 Drive 0' status is Normal [instance: 14]. disk 'M2 Drive 1' status is Normal [instance: 15]. Checking raid volumes

lucie-dubrunfaut commented 2 days ago

Thanks for the debug output :) I think I've found what's wrong, the threshold-overload option seems to be applied to the component status and not its value. In your case, the fans that are offline have status Unknown so if you apply the option to them it seems to work:

--plugin=hardware::server::lenovo::xcc::snmp::plugin --hostname=localhost --snmp-community=XXXX --snmp-port=XXXX --snmp-version=2c --mode=hardware --component='fan' --threshold-overload='fan,OK,Unknown'
OK: All 16 components are ok [16/16 fans]. | 'fan_Fan 1 Front Tach'=27%;;;0;100 'fan_Fan 2 Front Tach'=27%;;;0;100 'fan_Fan 3 Front Tach'=27%;;;0;100 'fan_Fan 4 Front Tach'=27%;;;0;100 'fan_Fan 5 Front Tach'=23%;;;0;100 'fan_Fan 6 Front Tach'=24%;;;0;100 'fan_Fan 1 Rear Tach'=25%;;;0;100 'fan_Fan 2 Rear Tach'=26%;;;0;100 'fan_Fan 3 Rear Tach'=25%;;;0;100 'fan_Fan 4 Rear Tach'=26%;;;0;100 'fan_Fan 5 Rear Tach'=22%;;;0;100 'fan_Fan 6 Rear Tach'=22%;;;0;100 'count_fan'=16;;;;

Although excluded fans are still counted in the total number of fans

monsieurpouet commented 2 days ago

Thanks a lof for your answer !

It's too bad :/ If I have a new fan which became unknwon (for any reasons), I wouldn't have any critical status. And, I see that the doc plugin describe this option with offline option --threshold-overload='fan,OK,offline' not unkown

Do you think that you can take this possibility for the next release ?

lucie-dubrunfaut commented 2 days ago

Hello :)

I'm not sure what you mean by "a new fan became unknown (for no reason)". This unknown status is determined by the equipment, not by the plugin. It results from the content of the OID fanHealthStatus = ‘.1.3.6.1.4.1.19046.11.1.1.3.2.1.10’ If you use the option as indicated in my above answer, you no longer have critical, but you no longer interpret the other possible cases of status unkwnown either. In deed, the description of the option seems to me to be inaccurate, or at least not a true reflection of how it works. As for your last question, I don't really understand what you want from us.

monsieurpouet commented 2 days ago

Okay, I understand now. The status is determined by the equipment. And, like you said, I can't interpret the other possible cases. It's my question finally.

In the output, we can see 2 informations (unknown and offline in value field)

So: Perhaps you could update the description in the document to make it more accurate? And, do you think it's possible to upgrade the plugin to include the utilization of value.

See:

Fan 'Fan 8 Rear Tach' status is 'Unknown' [instance = 16][value: offline]

--critical-status='Unknown' --critical-value=''offline' or somethin like that.

There is 2 threshold levels here:

Like that, itcan provide a critical for different unknown reason.

I hope it's more clear :) we can speak french here ? haha

lucie-dubrunfaut commented 1 day ago

The option --threshold-overload only acts on the status variable of the device and the other options that allow to act on the values are only available in warning and critical. Overall, I understand your needs and I'm going to find out how we can solve it with the options that already exist. And if not, consider adding a new option to deal with this case.

In the meantime, you can use the workaround I've suggested.

monsieurpouet commented 23 hours ago

Hi @lucie-dubrunfaut !

Thanks a lot ! In my case, I use your workaround and, for now, it's good.

Thanks for your consideration.

| Close comment.

lucie-dubrunfaut commented 22 hours ago

Hello :)

We've discussed this with the dev team and to provide a better solution to this option issue we'll have to redesign the current hardware mode, which is done in "old fashion". I'm creating the associated development ticket and we'll try to deal with it when it's possible. (I'm keeping this issue open to make the link with future development thanks for your contribution :) )

monsieurpouet commented 22 hours ago

Yeahhhh :D