@devops_ru

« Назад

Страница 939 из 4568

Далее »

Juriy

17.08.2016
12:12:36

в 2.2

Receiving notifications on unsupported items is supported since Zabbix 2.2.

Paul

17.08.2016
12:13:00

Марк, вот про АПИ точно не надо

Juriy

17.08.2016
12:13:12

АПИ там то еще, это правда

Google

Paul

17.08.2016
12:13:27

оно там еще хуже чем вебморда

Phil

17.08.2016
12:13:32

@demeliorator , заббикс

Juriy

17.08.2016
12:13:34

и клиенты бывает текут - тоже правда, бывало такое, но давно

Paul

17.08.2016
12:13:44

а вот по третьему пункту - у тебя сколько машин?

Aleksandr

17.08.2016
12:14:17

а вот по третьему пункту - у тебя сколько машин?

в пике было 800+

Paul

17.08.2016
12:14:46

и на это уходит 4 SQL-сервера? прикольно

Aleksandr

17.08.2016
12:15:07

всего два

Dmitry

17.08.2016
12:15:48

#zabbix #collectd #prometheus #мониторинг #telegraf #nagios #icinga #grafana Снять всю хуйню - collectd, telegraf, graphite. prometheus, influxdb (там варианты). Никаких бестов нет - там у всех есть свои косяки и плюсы Построить графики почти безалтернативно grafana Выслать алерты - nagios, icinga2, shinken. Обычно сейчас icinga2

золотой комментарий-хауту

Aleksandr

17.08.2016
12:16:54

да здесь я

Juriy

17.08.2016
12:17:23

золотой комментарий-хауту

сколько админов нужно, чтобы вкрутить ламп.. настроить мониторинг

Dmitry

17.08.2016
12:17:43

такой коммент надо запинить вообще

Phil

17.08.2016
12:17:51

сколько админов нужно, чтобы вкрутить ламп.. настроить мониторинг

0.5. В самом худшем случае

Oleg

17.08.2016
12:19:06

Всем привет

Google

Oleg

17.08.2016
12:19:35

я понимаю

точно!

Марк

17.08.2016
12:20:41

а вот по третьему пункту - у тебя сколько машин?

4000+

Phil

17.08.2016
12:21:10

Вообще бой за zabbix это бой за dashboard. Только за него

Марк

17.08.2016
12:23:28

А на дашборде что, по твоему, должно быть? Видосики с xvideos?

Phil

17.08.2016
12:23:34

ну дашбоард нужен всему, что ты хочешь посмотреть :) например графики. и там начинаются варианты

Dmitry

17.08.2016
12:23:57

А на дашборде что, по твоему, должно быть? Видосики с xvideos?

норм дашбоард

пришел тебе алерт и сразу видосик - чтобы не расстраивался

Phil

17.08.2016
12:25:00

Dashboard моежт быть навигация по графикам. Многие хотят использовать dashboard как пульт в самолёте - для быстрого поверхностного ознакомления с состоянием сети. Оба этих варианта.

Juriy

17.08.2016
12:25:03

А на дашборде что, по твоему, должно быть? Видосики с xvideos?

ну в Заббиксе так можно :))

Paul

17.08.2016
12:25:10

А на дашборде что, по твоему, должно быть? Видосики с xvideos?

а это идея. Упала база прода - и кино тематическое сразу

ну в Заббиксе так можно :))

только ОЧЕНЬ медленно

Phil

17.08.2016
12:25:28

ну в Заббиксе так можно :))

И только поэтому за него бьются. Никакого больше смысла в нем нет

Juriy

17.08.2016
12:26:12

только ОЧЕНЬ медленно

php-fpm + кеширование вместо апача пробовали?

Марк

17.08.2016
12:26:23

только ОЧЕНЬ медленно

Если проработать этот вопрос, то внимание дежурных утроится. Надо пилить стартап

Paul

17.08.2016
12:26:55

php-fpm + кеширование вместо апача пробовали?

тонко. Но проблема там в базе.

Phil

17.08.2016
12:28:09

php-fpm + кеширование вместо апача пробовали?

Поподробнее в месте php-fpm vs apache можно.

Но его можно настроить. И запихать туда всё сразу. Ни одна из перечисленных мною выше систем такого не даёт даже если постараться. Но это единственный смысл заббикса

Juriy

17.08.2016
12:31:23

Поподробнее в месте php-fpm vs apache можно.

так стандартные вроде методики для php, весь интернет ими завален. fcgi+xcache и по памяти и по отзывчивости сильно лучше апчевого модуля

Phil

17.08.2016
12:32:15

так стандартные вроде методики для php, весь интернет ими завален. fcgi+xcache и по памяти и по отзывчивости сильно лучше апчевого модуля

Впервые слышу. Можно чуть поподробнее о чудодейственных технологиях

Google

Juriy

17.08.2016
12:32:23

ну и, можно схитрить на nginx и например кешировать все GET'ы по хешу с fastcgi_cache_lock on; fastcgi_cache_use_stale error timeout updating;

Phil

17.08.2016
12:33:54

ну и, можно схитрить на nginx и например кешировать все GET'ы по хешу с fastcgi_cache_lock on; fastcgi_cache_use_stale error timeout updating;

чем это отличается от proxy_cache_use_stale и proxy_cache_lock?

Juriy

17.08.2016
12:35:09

чем это отличается от proxy_cache_use_stale и proxy_cache_lock?

https://toster.ru/q/41934

Phil

17.08.2016
12:36:43

https://toster.ru/q/41934

Т.е. никакой вообще. Так. Как тогда это относится к моему вопросу раскрыть чудодейственность php-fpm vs apache, благую весть о которой Вы пытались нести?

Aleksandr

17.08.2016
12:39:36

не, ну а чо: * у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. * клиенты, увы, текут по памяти. Порой приходится их убивать * сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу * прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи * очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься

На самом деле видно, что вы им пользовались и пользовались продолжительно, но > у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. Если у айтема тип int, а от агента получен str, этот _конкретный_ айтем просто помечается, как "Not supported" и некоторое время не чекается повторно. Предполагается, что раз айтем вернул белиберду, то чекалка на клиенте сломана/не настроена и не возвращает полезных данных, поэтому часто речекать её избыточно, всё-равно её исправление требует ручного внимания на этом сервере. На самом деле время речека невалидных айтемов регулируется в Administration -> General -> Refresh unsupported items (in sec), по умолчанию 300. Можно сделать сколько угодно. Клиенты "банятся" не за unsupported item, а при unreachable хосте. Раньше было больше условий, при которых хост мог стать unreachable (напр.: слишком высокий параметр таймаута ответа от агента, или таймаут ответа всего по одному айтему). В сегодняшних версиях с этим всё ок. > клиенты, увы, текут по памяти. Порой приходится их убивать Слышал об этом только про виндовые агенты. На версиях выше 2.4.5 я не видел репортов об этом/жалоб с проектов. > сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Как уже сказали, партиционирование. Сколько данных по метрикам, столько и сжирается. Больше всего в RDBMS жрут текстовые логи. > Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу Это нормально для любого мониторинга. Задаётся, что нужно мониторить за год, а что лишь оперативно. Можно забить на это, но рост потребляемого объёма неизбежен на любой платформе. > прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи да, жаль, что прокси не умеет remote commands но remote commands плохая практика, но мы это уже обсудили; если задачи типовые, я бы добавлял их в userparameters, а с нынешними средствами всё это можно ещё и автоматизированно раскидывать > очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься Порог вхождения есть в любую технологию. Спустя время, нынешний уклад в интерфейсе становится интуитивным. Если бы кто придумал, как иначе (лучше) впихнуть все их представления в меню, это бы уже сделали.

Maxim

17.08.2016
12:41:55

На самом деле видно, что вы им пользовались и пользовались продолжительно, но > у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. Если у айтема тип int, а от агента получен str, этот _конкретный_ айтем просто помечается, как "Not supported" и некоторое время не чекается повторно. Предполагается, что раз айтем вернул белиберду, то чекалка на клиенте сломана/не настроена и не возвращает полезных данных, поэтому часто речекать её избыточно, всё-равно её исправление требует ручного внимания на этом сервере. На самом деле время речека невалидных айтемов регулируется в Administration -> General -> Refresh unsupported items (in sec), по умолчанию 300. Можно сделать сколько угодно. Клиенты "банятся" не за unsupported item, а при unreachable хосте. Раньше было больше условий, при которых хост мог стать unreachable (напр.: слишком высокий параметр таймаута ответа от агента, или таймаут ответа всего по одному айтему). В сегодняшних версиях с этим всё ок. > клиенты, увы, текут по памяти. Порой приходится их убивать Слышал об этом только про виндовые агенты. На версиях выше 2.4.5 я не видел репортов об этом/жалоб с проектов. > сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Как уже сказали, партиционирование. Сколько данных по метрикам, столько и сжирается. Больше всего в RDBMS жрут текстовые логи. > Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу Это нормально для любого мониторинга. Задаётся, что нужно мониторить за год, а что лишь оперативно. Можно забить на это, но рост потребляемого объёма неизбежен на любой платформе. > прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи да, жаль, что прокси не умеет remote commands но remote commands плохая практика, но мы это уже обсудили; если задачи типовые, я бы добавлял их в userparameters, а с нынешними средствами всё это можно ещё и автоматизированно раскидывать > очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься Порог вхождения есть в любую технологию. Спустя время, нынешний уклад в интерфейсе становится интуитивным. Если бы кто придумал, как иначе (лучше) впихнуть все их представления в меню, это бы уже сделали.

>а с нынешними средствами всё это можно ещё и автоматизированно раскидывать имеется в виду что-то встроенное в заббикс? или чиф-паппет-энсибл?

Aleksandr

17.08.2016
12:42:41

>а с нынешними средствами всё это можно ещё и автоматизированно раскидывать имеется в виду что-то встроенное в заббикс? или чиф-паппет-энсибл?

второе

Paul

17.08.2016
12:45:05

На самом деле видно, что вы им пользовались и пользовались продолжительно, но > у заббикс отвратительно работает ситуация, когда клиент не может получить данные или получает неожиданные значения (например NaN вместо 0). Он тупо банит клиента и это ужасно. Если у айтема тип int, а от агента получен str, этот _конкретный_ айтем просто помечается, как "Not supported" и некоторое время не чекается повторно. Предполагается, что раз айтем вернул белиберду, то чекалка на клиенте сломана/не настроена и не возвращает полезных данных, поэтому часто речекать её избыточно, всё-равно её исправление требует ручного внимания на этом сервере. На самом деле время речека невалидных айтемов регулируется в Administration -> General -> Refresh unsupported items (in sec), по умолчанию 300. Можно сделать сколько угодно. Клиенты "банятся" не за unsupported item, а при unreachable хосте. Раньше было больше условий, при которых хост мог стать unreachable (напр.: слишком высокий параметр таймаута ответа от агента, или таймаут ответа всего по одному айтему). В сегодняшних версиях с этим всё ок. > клиенты, увы, текут по памяти. Порой приходится их убивать Слышал об этом только про виндовые агенты. На версиях выше 2.4.5 я не видел репортов об этом/жалоб с проектов. > сервер довольно плохо масштабируется (говорю о 1.6 -> 2.4 - работал только с ними). В первую очередь выжираются диски. Как уже сказали, партиционирование. Сколько данных по метрикам, столько и сжирается. Больше всего в RDBMS жрут текстовые логи. > Постоянно приходится прикидывать, какие метрики мне прям нужны, а без каких я как-нибудь так проживу Это нормально для любого мониторинга. Задаётся, что нужно мониторить за год, а что лишь оперативно. Можно забить на это, но рост потребляемого объёма неизбежен на любой платформе. > прокси помогают масштабировать, но ломают выполнение задач на ноде. То есть приходится решать, что мне нужнее - масштабирование или выполнение задачи да, жаль, что прокси не умеет remote commands но remote commands плохая практика, но мы это уже обсудили; если задачи типовые, я бы добавлял их в userparameters, а с нынешними средствами всё это можно ещё и автоматизированно раскидывать > очень, очень, очень неочевидный и неудобный UI. Кошмарное устройство выражений. Без толстого справочника хрен разберешься Порог вхождения есть в любую технологию. Спустя время, нынешний уклад в интерфейсе становится интуитивным. Если бы кто придумал, как иначе (лучше) впихнуть все их представления в меню, это бы уже сделали.

ну вот создатели prometeus придумали.

Phil

17.08.2016
12:45:39

ну вот создатели prometeus придумали.

Все подумали. Умолчательное ограничение стоит у всех абсолютно

Ilya

17.08.2016
12:46:34

ну вот создатели prometeus придумали.

И что там? Заебись всё?

Dmitriy

17.08.2016
12:46:38

ух, сколько всего и снова про заббикс

Paul

17.08.2016
12:47:02

И что там? Заебись всё?

мне норм

Ilya

17.08.2016
12:47:18

мне норм

Сколько истории ты хранишь?

Paul

17.08.2016
12:48:06

Сколько истории ты хранишь?

в прометее-то? Пока что пол-года, я его недавно запустил совсем

Maxim

17.08.2016
12:48:07

второе

в планах заббикса сделать первое. Я потому и уточнил: вдруг что-то пропустил

Ilya

17.08.2016
12:48:38

в прометее-то? Пока что пол-года, я его недавно запустил совсем

В серверов/метрик сколько? Как данные даунсемплишь?

Phil

17.08.2016
12:49:03

в прометее-то? Пока что пол-года, я его недавно запустил совсем

Ты хранишь там полгода? И как там выборка, норм?

Admin

ERROR: S client not available

Paul

17.08.2016
12:49:26

В серверов/метрик сколько? Как данные даунсемплишь?

на данный момент порядка 40 серверов (пет-проект), порядка 150 метрик на сервер. Даунсемплинг штатный, я его специально не настраивал.

Ты хранишь там полгода? И как там выборка, норм?

10-20 мсек на график

Google

Ilya

17.08.2016
12:49:51

на данный момент порядка 40 серверов (пет-проект), порядка 150 метрик на сервер. Даунсемплинг штатный, я его специально не настраивал.

А что там за штатный? Как работает?

на данный момент порядка 40 серверов (пет-проект), порядка 150 метрик на сервер. Даунсемплинг штатный, я его специально не настраивал.

40 и 150 это мало. Не удивительно, что он тебя устраивает.

Phil

17.08.2016
12:50:19

10-20 мсек на график

И как запрос с выборкой? Север не роняет?

Paul

17.08.2016
12:50:33

сервер его не замечает. Intel atom 230

Ilya

17.08.2016
12:50:37

И как запрос с выборкой? Север не роняет?

У него ещё нет полугода )

Paul

17.08.2016
12:50:51

у меня как раз примерно за пол-года данные

Ilya

17.08.2016
12:50:52

И серверов 40, а не 4000

Aleksandr

17.08.2016
12:50:59

слушайте, народ. как заставить эти долбаные браузеры открыть сайт по http:// эта фигня принудительно епты открывает мне https. как я это ненавижу

Paul

17.08.2016
12:51:00

я примерно пол-года назад начал их собирать

Phil

17.08.2016
12:51:08

сервер его не замечает. Intel atom 230

А причем тут атом. Это диски. Он же сырые данные херачит в файлы

Paul

17.08.2016
12:51:19

слушайте, народ. как заставить эти долбаные браузеры открыть сайт по http:// эта фигня принудительно епты открывает мне https. как я это ненавижу

это HSTS. Чисти кеш

А причем тут атом. Это диски. Он же сырые данные херачит в файлы

диски там 2 WD Green. Иопс смешной.

Phil

17.08.2016
12:52:58

диски там 2 WD Green. Иопс смешной.

Ты делал выборку по старым данным?

Paul

17.08.2016
12:53:03

конечно

Phil

17.08.2016
12:53:19

Какое чудо позволяет так сделать?

Paul

17.08.2016
12:54:30

вообще никакой проблемы, если честно. Не знаю, что я не так делаю

Phil

17.08.2016
12:54:53

Напомни размер этой базы сейчас и количество файлов

Paul

17.08.2016
12:55:26

отсюда не посмотреть, вечером отпишусь

но она маленькая совсем. Собираюсь попробовать на большой инсталляции, посмотреть, что будет

Phil

17.08.2016
12:56:35

40x180 дней x 20мс.. чо? маленькая?

Google

Paul

17.08.2016
12:58:16

а с чего ей быть большой? Метрики раз в 10 секунд приходят

+ даунсемплинг

Fike

17.08.2016
12:59:03

Какое чудо позволяет так сделать?

Я, может, немного тупой, но в чем суть проблемы? В быстрых выборках старых данных?

Phil

17.08.2016
12:59:11

+ даунсемплинг

даунчто? он же не умеет агреггировать? или я неправильно что-то понимаю?

« Назад

Страница 939 из 4568

Далее »

Открыть в Telegram