@ZabbixPro

Страница 358 из 1183
Alexander
29.08.2017
10:44:30
Мисак, бэкап БД перед апдейтом сделал?

Откатился бы уже на 3.2

Misak
29.08.2017
10:48:11
Мисак, бэкап БД перед апдейтом сделал?
недооцениваешь мою беспечность

Alexander
29.08.2017
10:48:32
Люди делятся на две категории? ;)

Google
Некто
29.08.2017
10:59:23
А что, кстати, фиксили (пытались) в 3.4, чтобы победить агентов? Может это даст пищу для размышлений.

Misak
29.08.2017
11:00:02
патчей не видно в их багзилле

Некто
29.08.2017
11:01:11
Я так понял, что проблема-то их сильно покоробила, значит должны были в ту сторону копать. Иначе странно это - два выпуска и оба бажных.

Misak
29.08.2017
11:01:54
ну может у меня что-то не то. пока в форумах и багзилле тихо, только я жалуюсь

Некто
29.08.2017
11:03:07
На центосе?

Misak
29.08.2017
11:04:39
Некто
29.08.2017
11:10:37
А что логи агента - показывают, что его дергают или активность прекращается через какое-то время? (я не читал предысторию) У меня дебиан, но я что-то опасаюсь мигрировать, если такая история с 3.4...

Misak
29.08.2017
11:17:01
все тихо везде

сервер ведет себя так, как будто все нормально, стандартные сообщения, что кто-то упал, кто-то поднялся

графики не рисуются

через минут 10-20 все затихает, ничего не апдейтится

а иногда веб морда говорит, что сервер наверное не работает

Alseg
29.08.2017
11:22:19
мб у тебя со временем проблемы ?

Google
Alseg
29.08.2017
11:22:34
это не после долгого аптайма и перезагрузки?

заббикс на вм?

графики не рисуются
попробуй посмотреть сразу после старта логи - не стартует ли БД раньше чем синкается ntp

Misak
29.08.2017
11:24:40
время правильное, нтп вроде ОК

Alseg
29.08.2017
11:25:01
у меня был такой факап, после долгого аптайма ВМ rtc может легко убежать на месяц вперед, ребутишь - стартует с этим временем из будущего, стартует БД с левым временем, а через пару секунд синкается нтп. И получается что пока реальное время не станет будущим - графики не рисовались

CentOS, Hyper-V

Alexey
29.08.2017
11:29:55
Misak
29.08.2017
11:30:20
да, около 1000-и

Irek
29.08.2017
11:31:08
может быть убавить на один порядок?

Alexey
29.08.2017
11:31:26
А на графиках самочувствия заббикса

Нету такого что они все заняты

Бывает что тупит скрипт например который что то дергает, не успел отдать за интервал опроса, и тут новое время настало и так исчерпываются все свободные полеры

Но про 3.4 ничего сказать не могу.

Misak
29.08.2017
11:44:37
поллеры при 900 штуках сейчас на 90 процентов заняты

хм

уменьшил количество процессов радикально, боюсь сглазить, но минут пять пока рисует

Alexei
29.08.2017
12:13:46
поллеры при 900 штуках сейчас на 90 процентов заняты
В 3.4 появился новый тип процессов, препроцессоры. Их количество по умолчанию StartPreprocessors=3 и этого будет явно не хватать для такого количество поллеров. Итак, в zabbix_server.conf увеличьте количество препроцессоров и посмотрите на результат. Полезно мониторить загрузку этих препроцессоров для оптимальной конфигурации.

Irek
29.08.2017
12:14:05
Google
Irek
29.08.2017
12:14:12
и порядка 1.8к запросов в секунду

Irek
29.08.2017
12:15:40
ну 900 как то ваще страшно звучит ))

Ivan
29.08.2017
12:16:46
Misak
29.08.2017
12:16:47


Ivan
29.08.2017
12:16:47
)

Irek
29.08.2017
12:16:48
понятно, что это зависит от типа item'ов и их времени исполнения, но у меня все равно в голове не укладывается, тем более судя по вашему дашборду у вас под 700 значений в секу.

Misak
29.08.2017
12:17:19
cat /etc/zabbix/zabbix_server.conf | grep Start ### Option: StartPollers StartPollers=100 ### Option: StartIPMIPollers StartIPMIPollers=10 ### Option: StartPreprocessors # StartPreprocessors=3 ### Option: StartPollersUnreachable StartPollersUnreachable=10 ### Option: StartTrappers StartTrappers=50 ### Option: StartPingers StartPingers=10 ### Option: StartDiscoverers StartDiscoverers=10 ### Option: StartHTTPPollers # StartHTTPPollers=1 ### Option: StartTimers # StartTimers=1 ### Option: StartEscalators # StartEscalators=1 ### Option: StartJavaPollers # StartJavaPollers=0 ### Option: StartVMwareCollectors # StartVMwareCollectors=0 ### Option: StartAlerters # StartAlerters=3 ### Option: StartSNMPTrapper # StartSNMPTrapper=0 ### Option: StartDBSyncers # StartDBSyncers=4 ### Option: StartProxyPollers # StartProxyPollers=1

Ivan
29.08.2017
12:18:40
какие в среднем периоды опросов?

Misak
29.08.2017
12:19:06
30 секунд в основном, это пингеры

много чего по снмп тоже вроде раз в 30 секунд

Ivan
29.08.2017
12:19:36
зачем так часто?

увеличивайте и снизите нагрузку

Misak
29.08.2017
12:21:09
я соврал

траффик по снмп снимаю самое частое раз в 2 минуты

только пинги раз в 30 секунд, и то дефолтный темплейт, я его не трогал

Ivan
29.08.2017
12:23:19
а все остальное? пинги это отдельный процесс, а у вас и StartPingers и StartPollers до небес загруженны

Google
Misak
29.08.2017
12:23:29
в общем, заработало по моему, теперь надо подбирать значения

Alexei
29.08.2017
12:23:52
спасибо, а есть какая-нибудь формула для подбора?
Формулы нет, зависит от сложности обработки значений метрик.

Misak
29.08.2017
12:23:53
что именно посмотреть?

Maxim
29.08.2017
12:24:21
только пинги раз в 30 секунд, и то дефолтный темплейт, я его не трогал
я бы переделал пинги. у себя я сделал пинг раз в 2 секунды и на основании его данных я сделал калк итем по потерям и доступности

Ivan
29.08.2017
12:24:57
ну не знаю, у меня пинги раз в минуту. хватает за глаза

Maxim
29.08.2017
12:25:34
сейчас проверка пингов потерь идет секунд 10 на хост, а если что-то отвалится, то т.к. нет таймаута проверка может идти по идее сильно больше

Alexei
29.08.2017
12:26:12
Misak, zabbix[preprocessing_queue] - длина очереди на обработку значений препроцессорами. Последите за этим параметром и другими, связанными с препроцессингом. Вся информация есть в документации. Сообщите о результатах. ?

Maxim
29.08.2017
12:37:05
А может кто-то мне поможет у меня проблема с macro:context правда версия заббикса не самая последняя 3.2.4 есть макросы вида {$QUEUE_LIMIT} {$QUEUE_LIMIT:events} etc есть триггеры в LLD вида: {Tmpl App RabbitMQ v3:rabbitmq.queues[{#VHOSTNAME},queue_messages,{#QUEUENAME}].count(95,{$QUEUE_LIMIT:"{#QUEUENAME}"},"gt")}>2 item rabbitmq.queues[{#VHOSTNAME},queue_messages,{#QUEUENAME}] (trapper) раз в 30 сек приходят в него данные почему-то не срабатывают юзерконетксты. все время алерт срабатывает по дефолтному значению {$QUEUE_LIMIT} похожая штука с дисками для виртуалок работают нормально

Alexei
29.08.2017
12:39:12
обязательно, а этот параметр рисуется где-нибудь?
Всё, что собирает Zabbix можно вывести на графики

Ilya
29.08.2017
12:40:49
Кроме текста

Maxim
29.08.2017
12:46:08
обязательно, а этот параметр рисуется где-нибудь?
он с 3.4 как я понимаю появился, так что надо будет добавить, наверное

Misak
29.08.2017
12:46:58
я вот все время хотел уточнить - темплейты заббикса ведь апдейтятся с заббиксом или нет?

или надо скачать и вручную проапдейтить?

Misak
29.08.2017
12:47:36
Vitaly
29.08.2017
12:47:55
https://www.zabbix.org/wiki/Zabbix_Templates/Official_Templates здесь шаблон сервера обновленный, в нем должен быть этот айтем

https://www.zabbix.org/wiki/Zabbix_Templates/Official_Templates здесь шаблон сервера обновленный, в нем должен быть этот айтем
соврал, queue нет, но есть другие айтемы по preprocessing , загрузка процессов: worker, manager

Google
Misak
29.08.2017
13:35:37
pg_query(): Query failed: ERROR: column "max_columns" of relation "screens_items" does not exist LINE 1: ...nts,valign,halign,style,url,dynamic,sort_triggers,max_column... ^ [conf.import.php:163 → CFrontendApiWrapper->import() → CApiWrapper->__call() → CFrontendApiWrapper->callMethod() → CApiWrapper->callMethod() → CFrontendApiWrapper->callClientMethod() → CLocalApiClient->callMethod() → call_user_func_array() → CConfiguration->import() → CConfigurationImport->import() → CConfigurationImport->processTemplateScreens() → CTemplateScreenImporter->import() → CTemplateScreen->update() → CScreen->updateReal() → CScreen->replaceItems() → CScreenItem->create() → DB::insert() → DBexecute() → pg_query() in include/db.inc.php:487] Error in query [INSERT INTO screens_items (resourcetype,width,height,x,y,colspan,rowspan,elements,valign,halign,style,url,dynamic,sort_triggers,max_columns,application,resourceid,screenid,screenitemid) VALUES ('0','500','212','0','0','1','1','0','1','0','0','','0','0','3','','45880','7','78')] [ERROR: column "max_columns" of relation "screens_items" does not exist LINE 1: ...nts,valign,halign,style,url,dynamic,sort_triggers,max_column... ^] SQL statement execution has failed "INSERT INTO screens_items (resourcetype,width,height,x,y,colspan,rowspan,elements,valign,halign,style,url,dynamic,sort_triggers,max_columns,application,resourceid,screenid,screenitemid) VALUES ('0','500','212','0','0','1','1','0','1','0','0','','0','0','3','','45880','7','78')".

это при импорте

вот такое в логах появляется, это интересно что означает? 5000:20170829:181258.702 item "MX480 Yerevan:ifHCOutUnicastPPS[ae6.1675]" became not supported: Item preprocessing step #1 failed: (null)

Некто
29.08.2017
14:25:14
------ Oops! Thank you! rebuilding... —---- Вся соль релиза 3.4, похоже ?

Misak
29.08.2017
14:55:02
после этого конфига





cat /etc/zabbix/zabbix_server.conf | grep Start | grep -v "#" StartPollers=150 StartIPMIPollers=10 StartPreprocessors=50 StartPollersUnreachable=35 StartTrappers=50 StartPingers=30 StartDiscoverers=100

хорошо, что теперь стабильно работает

плохо, что пока непонятно

Alexander
29.08.2017
15:36:04
Мисак, у тебя все отвалы агентов - только по препроцессинговым поллерам?

Alexei
29.08.2017
16:00:38
Всё, что собирается заббиксом, проходит через препроцессоры

Misak
29.08.2017
16:03:05
вот недавно был пик очереди в 2,14К

Андрей
29.08.2017
16:38:11
Всё, что собирается заббиксом, проходит через препроцессоры
Начиная с 3.4? Или ранее они были, но не вытаскивались в отдельные потоки?

Alexander
29.08.2017
16:46:31
Rasim
29.08.2017
17:13:33
Добрый вечер! ZBX-12549 не ушла в версии 3,4,1, так? установка с репы на debian 8.

пока не перегрузишь сервер, данных нет.

Страница 358 из 1183