slothfk / 1c_zabbix_template_ce

Шаблон Zabbix для мониторинга кластера серверов 1С Предприятия 8.3
MIT License
155 stars 54 forks source link

Странная работа мониторинга сеансов #79

Closed axel36rus closed 2 years ago

axel36rus commented 2 years ago

Добрый день. С недавнего момента, отображение количества сеансов стало работать странно. Появились непонятные скачки на графиках. В момент когда на графике идет падение, при выполнении команды bash -x 1c_license_server.sh used на выходе мы получаем 0. Через 5-10 минут все возвращается в норму.

$ bash -x 1c_license_server.sh used ++ dirname 1c_license_server.sh ++ sed -r 's/\/\//g; s/^(.{1}):/\/\1/'

image

axel36rus commented 2 years ago

UPD: Если выполнить на рабочем сервере команду rac session list --licenses --cluster="id кластера" то на выходе мы получаем данные о выданных лицензиях

axel36rus commented 2 years ago

UPD2: Прошло 2 часа и все как ни в чем не бывало работает bash -x 1c_license_server.sh used ++ dirname 1c_license_server.sh ++ sed -r 's/\/\//g; s/^(.{1}):/\/\1/'

slothfk commented 2 years ago

А можно, когда скрипт возвращает 0-и, выполнить time rac session list, каково будет время выполнения?

axel36rus commented 2 years ago

Наконец поймал момент. time ./rac.exe session list --cluster 49fb42c6-dd6b-4198-b44e-c909ed353d84 Ошибка операции администрирования Нет ответа от сервера server_addr=tcp://SQL10:1541 timeout=60000 line=2325 file=src\DataExchangeTcpClientImpl.cpp

real 2m0.160s user 0m0.000s sys 0m0.015s

axel36rus commented 2 years ago

Перезапуск службы почему то не помогает. Не могу уловить связь когда нет ответа от службы RAS.

slothfk commented 2 years ago

Перезапуск службы почему то не помогает. Не могу уловить связь когда нет ответа от службы RAS.

так тут не RAS не отвечает, а кластер 1С

axel36rus commented 2 years ago

странно, в этот момент никаких проблем с 1С не возникает

slothfk commented 2 years ago

сервера server_addr=tcp://SQL10:1541

настораживает вот это ... 1541 - порт rmngr же

axel36rus commented 2 years ago

А какой порт должен быть?

slothfk commented 2 years ago

А какой порт должен быть?

у кого? я думаю, тут не в портах дело ... а все же в том, какой именно сервис не отвечает ...

axel36rus commented 2 years ago

в момент возникновения проблем, можно где то увидеть какой именно сервис не отвечает?

slothfk commented 2 years ago

в момент возникновения проблем, можно где то увидеть какой именно сервис не отвечает?

По-моему тут все предельно ясно написано

Нет ответа от сервера server_addr=tcp://SQL10:1541 timeout=60000 line=2325 file=src\DataExchangeTcpClientImpl.cpp

нет ответа от tcp://sql10:1541

суть в том, что судя по выводу time для получения данной ошибки потребовалось почти 2 секунды! По-умолчанию, скрипты используют таймаут в 1.5 секунды (можно задавать в макросе {$RAS_TIMEOUT}). Но сути дела это не изменит, так как rac вернет ошибку вместо необходимых значений и на выходе скрипта все равно будут нули!

slothfk commented 2 years ago

Есть ли еще вопросы в рамках данного обращения?

axel36rus commented 2 years ago

Больше нет