
Alexander
29.08.2017
10:44:30
Мисак, бэкап БД перед апдейтом сделал?
Откатился бы уже на 3.2

Misak
29.08.2017
10:48:11

Alexander
29.08.2017
10:48:32
Люди делятся на две категории? ;)

Google

Некто
29.08.2017
10:59:23
А что, кстати, фиксили (пытались) в 3.4, чтобы победить агентов? Может это даст пищу для размышлений.

Misak
29.08.2017
11:00:02
патчей не видно в их багзилле

Некто
29.08.2017
11:01:11
Я так понял, что проблема-то их сильно покоробила, значит должны были в ту сторону копать. Иначе странно это - два выпуска и оба бажных.

Misak
29.08.2017
11:01:54
ну может у меня что-то не то. пока в форумах и багзилле тихо, только я жалуюсь

Некто
29.08.2017
11:03:07
На центосе?

Misak
29.08.2017
11:04:39

Некто
29.08.2017
11:10:37
А что логи агента - показывают, что его дергают или активность прекращается через какое-то время? (я не читал предысторию)
У меня дебиан, но я что-то опасаюсь мигрировать, если такая история с 3.4...

Misak
29.08.2017
11:17:01
все тихо везде
сервер ведет себя так, как будто все нормально, стандартные сообщения, что кто-то упал, кто-то поднялся
графики не рисуются
через минут 10-20 все затихает, ничего не апдейтится
а иногда веб морда говорит, что сервер наверное не работает

Alseg
29.08.2017
11:22:19
мб у тебя со временем проблемы ?

Google

Alseg
29.08.2017
11:22:34
это не после долгого аптайма и перезагрузки?
заббикс на вм?
графики не рисуются
попробуй посмотреть сразу после старта логи - не стартует ли БД раньше чем синкается ntp

Misak
29.08.2017
11:24:40
время правильное, нтп вроде ОК

Alseg
29.08.2017
11:25:01
у меня был такой факап, после долгого аптайма ВМ rtc может легко убежать на месяц вперед, ребутишь - стартует с этим временем из будущего, стартует БД с левым временем, а через пару секунд синкается нтп. И получается что пока реальное время не станет будущим - графики не рисовались
CentOS, Hyper-V

Misak
29.08.2017
11:25:34

Alexey
29.08.2017
11:29:55

Misak
29.08.2017
11:30:20
да, около 1000-и

Irek
29.08.2017
11:31:08
может быть убавить на один порядок?

Alexey
29.08.2017
11:31:26
А на графиках самочувствия заббикса
Нету такого что они все заняты
Бывает что тупит скрипт например который что то дергает, не успел отдать за интервал опроса, и тут новое время настало и так исчерпываются все свободные полеры
Но про 3.4 ничего сказать не могу.

Misak
29.08.2017
11:44:37
поллеры при 900 штуках сейчас на 90 процентов заняты
хм
уменьшил количество процессов радикально, боюсь сглазить, но минут пять пока рисует

Alexei
29.08.2017
12:13:46
поллеры при 900 штуках сейчас на 90 процентов заняты
В 3.4 появился новый тип процессов, препроцессоры. Их количество по умолчанию StartPreprocessors=3 и этого будет явно не хватать для такого количество поллеров. Итак, в zabbix_server.conf увеличьте количество препроцессоров и посмотрите на результат. Полезно мониторить загрузку этих препроцессоров для оптимальной конфигурации.

Irek
29.08.2017
12:14:05

Google

Irek
29.08.2017
12:14:12
и порядка 1.8к запросов в секунду

Misak
29.08.2017
12:14:28
сейчас например под сто процентов много всего

Irek
29.08.2017
12:15:40
ну 900 как то ваще страшно звучит ))

Ivan
29.08.2017
12:16:46

Misak
29.08.2017
12:16:47

Ivan
29.08.2017
12:16:47
)

Irek
29.08.2017
12:16:48
понятно, что это зависит от типа item'ов и их времени исполнения, но у меня все равно в голове не укладывается, тем более судя по вашему дашборду у вас под 700 значений в секу.


Misak
29.08.2017
12:17:19
cat /etc/zabbix/zabbix_server.conf | grep Start
### Option: StartPollers
StartPollers=100
### Option: StartIPMIPollers
StartIPMIPollers=10
### Option: StartPreprocessors
# StartPreprocessors=3
### Option: StartPollersUnreachable
StartPollersUnreachable=10
### Option: StartTrappers
StartTrappers=50
### Option: StartPingers
StartPingers=10
### Option: StartDiscoverers
StartDiscoverers=10
### Option: StartHTTPPollers
# StartHTTPPollers=1
### Option: StartTimers
# StartTimers=1
### Option: StartEscalators
# StartEscalators=1
### Option: StartJavaPollers
# StartJavaPollers=0
### Option: StartVMwareCollectors
# StartVMwareCollectors=0
### Option: StartAlerters
# StartAlerters=3
### Option: StartSNMPTrapper
# StartSNMPTrapper=0
### Option: StartDBSyncers
# StartDBSyncers=4
### Option: StartProxyPollers
# StartProxyPollers=1


Ivan
29.08.2017
12:18:40
какие в среднем периоды опросов?

Misak
29.08.2017
12:19:06
30 секунд в основном, это пингеры
много чего по снмп тоже вроде раз в 30 секунд

Ivan
29.08.2017
12:19:36
зачем так часто?
увеличивайте и снизите нагрузку

Misak
29.08.2017
12:21:09
я соврал
траффик по снмп снимаю самое частое раз в 2 минуты
только пинги раз в 30 секунд, и то дефолтный темплейт, я его не трогал

Ivan
29.08.2017
12:23:19
а все остальное? пинги это отдельный процесс, а у вас и StartPingers и StartPollers до небес загруженны

Google

Misak
29.08.2017
12:23:29
в общем, заработало по моему, теперь надо подбирать значения

Alexei
29.08.2017
12:23:52

Misak
29.08.2017
12:23:53
что именно посмотреть?

Maxim
29.08.2017
12:24:21

Ivan
29.08.2017
12:24:57
ну не знаю, у меня пинги раз в минуту. хватает за глаза

Misak
29.08.2017
12:24:57

Maxim
29.08.2017
12:25:34
сейчас проверка пингов потерь идет секунд 10 на хост, а если что-то отвалится, то т.к. нет таймаута проверка может идти по идее сильно больше

Alexei
29.08.2017
12:26:12
Misak, zabbix[preprocessing_queue] - длина очереди на обработку значений препроцессорами. Последите за этим параметром и другими, связанными с препроцессингом. Вся информация есть в документации. Сообщите о результатах. ?

Maxim
29.08.2017
12:37:05
А может кто-то мне поможет у меня проблема с macro:context
правда версия заббикса не самая последняя 3.2.4
есть макросы вида
{$QUEUE_LIMIT}
{$QUEUE_LIMIT:events}
etc
есть триггеры в LLD вида:
{Tmpl App RabbitMQ v3:rabbitmq.queues[{#VHOSTNAME},queue_messages,{#QUEUENAME}].count(95,{$QUEUE_LIMIT:"{#QUEUENAME}"},"gt")}>2
item rabbitmq.queues[{#VHOSTNAME},queue_messages,{#QUEUENAME}] (trapper)
раз в 30 сек приходят в него данные
почему-то не срабатывают юзерконетксты. все время алерт срабатывает по дефолтному значению {$QUEUE_LIMIT}
похожая штука с дисками для виртуалок работают нормально

Misak
29.08.2017
12:37:45

Alexei
29.08.2017
12:39:12

Ilya
29.08.2017
12:40:49
Кроме текста

Maxim
29.08.2017
12:46:08

Misak
29.08.2017
12:46:58
я вот все время хотел уточнить - темплейты заббикса ведь апдейтятся с заббиксом или нет?
или надо скачать и вручную проапдейтить?

Vitaly
29.08.2017
12:47:18

Misak
29.08.2017
12:47:36

Vitaly
29.08.2017
12:47:55
https://www.zabbix.org/wiki/Zabbix_Templates/Official_Templates здесь шаблон сервера обновленный, в нем должен быть этот айтем

Google


Misak
29.08.2017
13:35:37
pg_query(): Query failed: ERROR: column "max_columns" of relation "screens_items" does not exist
LINE 1: ...nts,valign,halign,style,url,dynamic,sort_triggers,max_column...
^ [conf.import.php:163 → CFrontendApiWrapper->import() → CApiWrapper->__call() → CFrontendApiWrapper->callMethod() → CApiWrapper->callMethod() → CFrontendApiWrapper->callClientMethod() → CLocalApiClient->callMethod() → call_user_func_array() → CConfiguration->import() → CConfigurationImport->import() → CConfigurationImport->processTemplateScreens() → CTemplateScreenImporter->import() → CTemplateScreen->update() → CScreen->updateReal() → CScreen->replaceItems() → CScreenItem->create() → DB::insert() → DBexecute() → pg_query() in include/db.inc.php:487]
Error in query [INSERT INTO screens_items (resourcetype,width,height,x,y,colspan,rowspan,elements,valign,halign,style,url,dynamic,sort_triggers,max_columns,application,resourceid,screenid,screenitemid) VALUES ('0','500','212','0','0','1','1','0','1','0','0','','0','0','3','','45880','7','78')] [ERROR: column "max_columns" of relation "screens_items" does not exist
LINE 1: ...nts,valign,halign,style,url,dynamic,sort_triggers,max_column...
^]
SQL statement execution has failed "INSERT INTO screens_items (resourcetype,width,height,x,y,colspan,rowspan,elements,valign,halign,style,url,dynamic,sort_triggers,max_columns,application,resourceid,screenid,screenitemid) VALUES ('0','500','212','0','0','1','1','0','1','0','0','','0','0','3','','45880','7','78')".
это при импорте
вот такое в логах появляется, это интересно что означает?
5000:20170829:181258.702 item "MX480 Yerevan:ifHCOutUnicastPPS[ae6.1675]" became not supported: Item preprocessing step #1 failed: (null)


Vitaly
29.08.2017
14:14:52

Misak
29.08.2017
14:16:15

Некто
29.08.2017
14:25:14
------
Oops! Thank you!
rebuilding...
—----
Вся соль релиза 3.4, похоже ?

Misak
29.08.2017
14:55:02
после этого конфига
cat /etc/zabbix/zabbix_server.conf | grep Start | grep -v "#"
StartPollers=150
StartIPMIPollers=10
StartPreprocessors=50
StartPollersUnreachable=35
StartTrappers=50
StartPingers=30
StartDiscoverers=100
хорошо, что теперь стабильно работает
плохо, что пока непонятно

Alexander
29.08.2017
15:36:04
Мисак, у тебя все отвалы агентов - только по препроцессинговым поллерам?

Misak
29.08.2017
15:44:47

Alexei
29.08.2017
16:00:38
Всё, что собирается заббиксом, проходит через препроцессоры

Misak
29.08.2017
16:03:05
вот недавно был пик очереди в 2,14К

Андрей
29.08.2017
16:38:11

Alexander
29.08.2017
16:46:31

Rasim
29.08.2017
17:13:33
Добрый вечер! ZBX-12549 не ушла в версии 3,4,1, так? установка с репы на debian 8.
пока не перегрузишь сервер, данных нет.