@devops_ru

Страница 939 из 4568
Juriy
17.08.2016
12:12:36
в 2.2

Receiving notifications on unsupported items is supported since Zabbix 2.2.

Paul
17.08.2016
12:13:00
Марк, вот про АПИ точно не надо

Juriy
17.08.2016
12:13:12
АПИ там то еще, это правда

Google
Paul
17.08.2016
12:13:27
оно там еще хуже чем вебморда

Phil
17.08.2016
12:13:32
@demeliorator , заббикс

Juriy
17.08.2016
12:13:34
и клиенты бывает текут - тоже правда, бывало такое, но давно

Paul
17.08.2016
12:13:44
а вот по третьему пункту - у тебя сколько машин?

Paul
17.08.2016
12:14:46
и на это уходит 4 SQL-сервера? прикольно

Aleksandr
17.08.2016
12:15:07
всего два

Aleksandr
17.08.2016
12:16:54
да здесь я

Juriy
17.08.2016
12:17:23
золотой комментарий-хауту
сколько админов нужно, чтобы вкрутить ламп.. настроить мониторинг

Dmitry
17.08.2016
12:17:43
такой коммент надо запинить вообще

Oleg
17.08.2016
12:19:06
Всем привет

Google
Oleg
17.08.2016
12:19:35
я понимаю

точно!

Phil
17.08.2016
12:21:10
Вообще бой за zabbix это бой за dashboard. Только за него

Марк
17.08.2016
12:23:28
А на дашборде что, по твоему, должно быть? Видосики с xvideos?

Phil
17.08.2016
12:23:34
ну дашбоард нужен всему, что ты хочешь посмотреть :) например графики. и там начинаются варианты

Dmitry
17.08.2016
12:23:57
пришел тебе алерт и сразу видосик - чтобы не расстраивался

Phil
17.08.2016
12:25:00
Dashboard моежт быть навигация по графикам. Многие хотят использовать dashboard как пульт в самолёте - для быстрого поверхностного ознакомления с состоянием сети. Оба этих варианта.

Juriy
17.08.2016
12:25:03
Paul
17.08.2016
12:25:10
А на дашборде что, по твоему, должно быть? Видосики с xvideos?
а это идея. Упала база прода - и кино тематическое сразу

ну в Заббиксе так можно :))
только ОЧЕНЬ медленно

Phil
17.08.2016
12:25:28
ну в Заббиксе так можно :))
И только поэтому за него бьются. Никакого больше смысла в нем нет

Juriy
17.08.2016
12:26:12
только ОЧЕНЬ медленно
php-fpm + кеширование вместо апача пробовали?

Марк
17.08.2016
12:26:23
только ОЧЕНЬ медленно
Если проработать этот вопрос, то внимание дежурных утроится. Надо пилить стартап

Paul
17.08.2016
12:26:55
php-fpm + кеширование вместо апача пробовали?
тонко. Но проблема там в базе.

Phil
17.08.2016
12:28:09
php-fpm + кеширование вместо апача пробовали?
Поподробнее в месте php-fpm vs apache можно.

Но его можно настроить. И запихать туда всё сразу. Ни одна из перечисленных мною выше систем такого не даёт даже если постараться. Но это единственный смысл заббикса

Juriy
17.08.2016
12:31:23
Поподробнее в месте php-fpm vs apache можно.
так стандартные вроде методики для php, весь интернет ими завален. fcgi+xcache и по памяти и по отзывчивости сильно лучше апчевого модуля

Google
Juriy
17.08.2016
12:32:23
ну и, можно схитрить на nginx и например кешировать все GET'ы по хешу с fastcgi_cache_lock on; fastcgi_cache_use_stale error timeout updating;

Phil
17.08.2016
12:36:43
https://toster.ru/q/41934
Т.е. никакой вообще. Так. Как тогда это относится к моему вопросу раскрыть чудодейственность php-fpm vs apache, благую весть о которой Вы пытались нести?

Aleksandr
17.08.2016
12:39:36
не, ну а чо: * у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. * клиенты, увы, текут по памяти. Порой приходится их убивать * сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу * прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи * очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься
На самом деле видно, что вы им пользовались и пользовались продолжительно, но > у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. Если у айтема тип int, а от агента получен str, этот _конкретный_ айтем просто помечается, как "Not supported" и некоторое время не чекается повторно. Предполагается, что раз айтем вернул белиберду, то чекалка на клиенте сломана/не настроена и не возвращает полезных данных, поэтому часто речекать её избыточно, всё-равно её исправление требует ручного внимания на этом сервере. На самом деле время речека невалидных айтемов регулируется в Administration -> General -> Refresh unsupported items (in sec), по умолчанию 300. Можно сделать сколько угодно. Клиенты "банятся" не за unsupported item, а при unreachable хосте. Раньше было больше условий, при которых хост мог стать unreachable (напр.: слишком высокий параметр таймаута ответа от агента, или таймаут ответа всего по одному айтему). В сегодняшних версиях с этим всё ок. > клиенты, увы, текут по памяти. Порой приходится их убивать Слышал об этом только про виндовые агенты. На версиях выше 2.4.5 я не видел репортов об этом/жалоб с проектов. > сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Как уже сказали, партиционирование. Сколько данных по метрикам, столько и сжирается. Больше всего в RDBMS жрут текстовые логи. > Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу Это нормально для любого мониторинга. Задаётся, что нужно мониторить за год, а что лишь оперативно. Можно забить на это, но рост потребляемого объёма неизбежен на любой платформе. > прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи да, жаль, что прокси не умеет remote commands но remote commands плохая практика, но мы это уже обсудили; если задачи типовые, я бы добавлял их в userparameters, а с нынешними средствами всё это можно ещё и автоматизированно раскидывать > очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься Порог вхождения есть в любую технологию. Спустя время, нынешний уклад в интерфейсе становится интуитивным. Если бы кто придумал, как иначе (лучше) впихнуть все их представления в меню, это бы уже сделали.

Maxim
17.08.2016
12:41:55
На самом деле видно, что вы им пользовались и пользовались продолжительно, но > у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. Если у айтема тип int, а от агента получен str, этот _конкретный_ айтем просто помечается, как "Not supported" и некоторое время не чекается повторно. Предполагается, что раз айтем вернул белиберду, то чекалка на клиенте сломана/не настроена и не возвращает полезных данных, поэтому часто речекать её избыточно, всё-равно её исправление требует ручного внимания на этом сервере. На самом деле время речека невалидных айтемов регулируется в Administration -> General -> Refresh unsupported items (in sec), по умолчанию 300. Можно сделать сколько угодно. Клиенты "банятся" не за unsupported item, а при unreachable хосте. Раньше было больше условий, при которых хост мог стать unreachable (напр.: слишком высокий параметр таймаута ответа от агента, или таймаут ответа всего по одному айтему). В сегодняшних версиях с этим всё ок. > клиенты, увы, текут по памяти. Порой приходится их убивать Слышал об этом только про виндовые агенты. На версиях выше 2.4.5 я не видел репортов об этом/жалоб с проектов. > сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Как уже сказали, партиционирование. Сколько данных по метрикам, столько и сжирается. Больше всего в RDBMS жрут текстовые логи. > Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу Это нормально для любого мониторинга. Задаётся, что нужно мониторить за год, а что лишь оперативно. Можно забить на это, но рост потребляемого объёма неизбежен на любой платформе. > прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи да, жаль, что прокси не умеет remote commands но remote commands плохая практика, но мы это уже обсудили; если задачи типовые, я бы добавлял их в userparameters, а с нынешними средствами всё это можно ещё и автоматизированно раскидывать > очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься Порог вхождения есть в любую технологию. Спустя время, нынешний уклад в интерфейсе становится интуитивным. Если бы кто придумал, как иначе (лучше) впихнуть все их представления в меню, это бы уже сделали.
>а с нынешними средствами всё это можно ещё и автоматизированно раскидывать имеется в виду что-то встроенное в заббикс? или чиф-паппет-энсибл?

Paul
17.08.2016
12:45:05
На самом деле видно, что вы им пользовались и пользовались продолжительно, но > у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. Если у айтема тип int, а от агента получен str, этот _конкретный_ айтем просто помечается, как "Not supported" и некоторое время не чекается повторно. Предполагается, что раз айтем вернул белиберду, то чекалка на клиенте сломана/не настроена и не возвращает полезных данных, поэтому часто речекать её избыточно, всё-равно её исправление требует ручного внимания на этом сервере. На самом деле время речека невалидных айтемов регулируется в Administration -> General -> Refresh unsupported items (in sec), по умолчанию 300. Можно сделать сколько угодно. Клиенты "банятся" не за unsupported item, а при unreachable хосте. Раньше было больше условий, при которых хост мог стать unreachable (напр.: слишком высокий параметр таймаута ответа от агента, или таймаут ответа всего по одному айтему). В сегодняшних версиях с этим всё ок. > клиенты, увы, текут по памяти. Порой приходится их убивать Слышал об этом только про виндовые агенты. На версиях выше 2.4.5 я не видел репортов об этом/жалоб с проектов. > сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Как уже сказали, партиционирование. Сколько данных по метрикам, столько и сжирается. Больше всего в RDBMS жрут текстовые логи. > Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу Это нормально для любого мониторинга. Задаётся, что нужно мониторить за год, а что лишь оперативно. Можно забить на это, но рост потребляемого объёма неизбежен на любой платформе. > прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи да, жаль, что прокси не умеет remote commands но remote commands плохая практика, но мы это уже обсудили; если задачи типовые, я бы добавлял их в userparameters, а с нынешними средствами всё это можно ещё и автоматизированно раскидывать > очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься Порог вхождения есть в любую технологию. Спустя время, нынешний уклад в интерфейсе становится интуитивным. Если бы кто придумал, как иначе (лучше) впихнуть все их представления в меню, это бы уже сделали.
ну вот создатели prometeus придумали.

Phil
17.08.2016
12:45:39
ну вот создатели prometeus придумали.
Все подумали. Умолчательное ограничение стоит у всех абсолютно

Ilya
17.08.2016
12:46:34
ну вот создатели prometeus придумали.
И что там? Заебись всё?

Dmitriy
17.08.2016
12:46:38
ух, сколько всего и снова про заббикс

Paul
17.08.2016
12:47:02
Ilya
17.08.2016
12:47:18
мне норм
Сколько истории ты хранишь?

Paul
17.08.2016
12:48:06
Сколько истории ты хранишь?
в прометее-то? Пока что пол-года, я его недавно запустил совсем

Maxim
17.08.2016
12:48:07
второе
в планах заббикса сделать первое. Я потому и уточнил: вдруг что-то пропустил

Ilya
17.08.2016
12:48:38
в прометее-то? Пока что пол-года, я его недавно запустил совсем
В серверов/метрик сколько? Как данные даунсемплишь?

Phil
17.08.2016
12:49:03
в прометее-то? Пока что пол-года, я его недавно запустил совсем
Ты хранишь там полгода? И как там выборка, норм?

Admin
ERROR: S client not available

Paul
17.08.2016
12:49:26
В серверов/метрик сколько? Как данные даунсемплишь?
на данный момент порядка 40 серверов (пет-проект), порядка 150 метрик на сервер. Даунсемплинг штатный, я его специально не настраивал.

Google
Phil
17.08.2016
12:50:19
10-20 мсек на график
И как запрос с выборкой? Север не роняет?

Paul
17.08.2016
12:50:33
сервер его не замечает. Intel atom 230

Ilya
17.08.2016
12:50:37
Paul
17.08.2016
12:50:51
у меня как раз примерно за пол-года данные

Ilya
17.08.2016
12:50:52
И серверов 40, а не 4000

Aleksandr
17.08.2016
12:50:59
слушайте, народ. как заставить эти долбаные браузеры открыть сайт по http:// эта фигня принудительно епты открывает мне https. как я это ненавижу

Paul
17.08.2016
12:51:00
я примерно пол-года назад начал их собирать

Phil
17.08.2016
12:51:08
сервер его не замечает. Intel atom 230
А причем тут атом. Это диски. Он же сырые данные херачит в файлы

Phil
17.08.2016
12:52:58
диски там 2 WD Green. Иопс смешной.
Ты делал выборку по старым данным?

Paul
17.08.2016
12:53:03
конечно

Phil
17.08.2016
12:53:19
Какое чудо позволяет так сделать?

Paul
17.08.2016
12:54:30
вообще никакой проблемы, если честно. Не знаю, что я не так делаю

Phil
17.08.2016
12:54:53
Напомни размер этой базы сейчас и количество файлов

Paul
17.08.2016
12:55:26
отсюда не посмотреть, вечером отпишусь

но она маленькая совсем. Собираюсь попробовать на большой инсталляции, посмотреть, что будет

Phil
17.08.2016
12:56:35
40x180 дней x 20мс.. чо? маленькая?

Google
Paul
17.08.2016
12:58:16
а с чего ей быть большой? Метрики раз в 10 секунд приходят

+ даунсемплинг

Fike
17.08.2016
12:59:03
Какое чудо позволяет так сделать?
Я, может, немного тупой, но в чем суть проблемы? В быстрых выборках старых данных?

Phil
17.08.2016
12:59:11
+ даунсемплинг
даунчто? он же не умеет агреггировать? или я неправильно что-то понимаю?

Страница 939 из 4568