@devops_ru

Страница 946 из 4568
Konstantin
17.08.2016
21:03:57
business is business

полторы тыщи рабочих мест

и заббикс очень выручает нас

Pavel
17.08.2016
21:08:54
dia ^_^

Google
Vladimir
17.08.2016
21:09:05
а есть чо удобнее?

nagios, icinga, prometheus

Pavel
17.08.2016
21:10:22
эх, я то думал чего то новое.. а тут вечное nagios vs zabbix ^_^

Paul
17.08.2016
21:11:41
эх, я то думал чего то новое.. а тут вечное nagios vs zabbix ^_^
да тут всегда так. То про заббикс, то молочные железы обсуждаем. Интеллектуальная элита сисадминского сообщества же. Не хватает только Шетухина и Олдманна, который нам доходчиво объяснит, что линукс вообще и x86 архитектура - полная дрянь

Pavel
17.08.2016
21:13:46
Вот вам довод. Всем доводам довод. Заббикс уже настроен. Смысл уходить с него на nagios-like систему ? =) Тоже самое можно сказать и в сторону nagios/icinga по отношению к zabbix.

Phil
17.08.2016
21:17:08
Вот вам довод. Всем доводам довод. Заббикс уже настроен. Смысл уходить с него на nagios-like систему ? =) Тоже самое можно сказать и в сторону nagios/icinga по отношению к zabbix.
смысл уйти с заббикса? экономия железа (судя по всему охрененная). экономия человеческих ресурсов (весь "зоопарк" в сумме легче и больше спецов). прогнозируемость и предсказуемость. лёгкая расширяемость и заменяемость компонентов

Vladimir
17.08.2016
21:17:13
и более того, возможно если вы внедрите дополнительный софт для мониторинга, отличный от заббикса, это позволит решать текущие задачи лучше и позволит делать что-то, что сейчас вы даже представить не сможете.

Phil
17.08.2016
21:17:31
После метрик в SQL о чём вообще спрашивать-то можно?

Konstantin
17.08.2016
21:17:39
"мы стали более лучше одеваться"

Vladimir
17.08.2016
21:18:39
"мы стали более лучше одеваться"
Можно в двух словах про текущий ваш подход к мониторингу? Что мониторите, на что обращаете внимание?

я тогда вероятно смогу привести пример что вы сможете получить если поменяете систему

Phil
17.08.2016
21:19:09
нет. просто кодеру этого не понять. и именно к этому относилась моя ирония по поводу кодера, который полез в крутые сисадмины

Konstantin
17.08.2016
21:19:16
это как соскочить с винды на линукс :) придётся поебаться, да и с обновлениями не всё гладко... да и глюки периодически вылезают с самого первого этапа устанвки... но оно того стоит, да...

Google
Phil
17.08.2016
21:20:29
А реально стоит соскакивать с венды на linux в каком-то общем случае? Можно поподробнее об этом? Особенно ещё в какой-нибудь связи с бизнесом, который вы так всуе поминать любите?

Konstantin
17.08.2016
21:22:34
Можно в двух словах про текущий ваш подход к мониторингу? Что мониторите, на что обращаете внимание?
у нас модульная архитектура, сервера собраны попарно в кластеры... вся топология сети выводится на большой экран, если возникает аварийная ситауция, либо не хватает ресурсов на одном из узлов - заббикс нас оповещает... попутно генерит заявку в сервис-деске о возникшей проблеме

Konstantin
17.08.2016
21:24:05
алярм алярму рознь

Vladimir
17.08.2016
21:24:16
то что попадает на пейджер (или куда там)

Konstantin
17.08.2016
21:24:25
одно дело когда статистика не снимается, другое - когда операторы не могут звонки обрабатывать

то что попадает на пейджер (или куда там)
сирена воет на весь отдел :)

Vladimir
17.08.2016
21:26:21
Как часто на это нужно реагировать прям как можно быстрее?

Konstantin
17.08.2016
21:26:42
всегда нужно реагировать чем быстрее тем лучше

Vladimir
17.08.2016
21:26:53
не, вопрос в том когда это критично?

Konstantin
17.08.2016
21:27:06
ибо кц работает 24/7 и минута простоя это огромные денежные потери

ну как рассказать в двух словах... есть сервера, куда аггрегируется статистика, если не собралась - не критично, можно потом

а есть сип и прочая телефонная херь

отвалилось и всё встало

Vladimir
17.08.2016
21:28:34
но сирена орет на любую проблему?

Konstantin
17.08.2016
21:28:44
да

Vladimir
17.08.2016
21:29:07
ооок, а типичные проблемы - насколько сложно решаются?

Konstantin
17.08.2016
21:29:19
и на большом экране сразу видно с каким узлом трабл

Vladimir
17.08.2016
21:29:22
по времязатратам и количествам уникальных действий

Александр
17.08.2016
21:30:08
Кто-то сказал заббикс?

Google
Konstantin
17.08.2016
21:30:32
проблемы всегда разные :) тут сложно сказать

Vladimir
17.08.2016
21:30:52
посчитайте статистику

Admin
ERROR: S client not available

Konstantin
17.08.2016
21:30:59
где-то место закончилось, где-то процесс нагрузил проц до предела

Phil
17.08.2016
21:31:04
Помните да, я несколько часов назад говорил, что битва за заббикс это битва за dashboard? И собственно да, это определяет, что за него бьются не админы. Такой хороший детектор выбрал Чистяков

Я вот тут ещё один знаю - php-fpm vs apache. Почище apache vs nginx

Александр
17.08.2016
21:31:59
Так можно же графану прикрутить и всё

Konstantin
17.08.2016
21:32:10
nginx нормальные люди используют для балансировки нагрузки

Александр
17.08.2016
21:32:16
Ядро же на сях

Phil
17.08.2016
21:32:22
Так можно же графану прикрутить и всё
а что делать с дашбордом алертера?

Александр
17.08.2016
21:32:37
Это да, упущение

Vladimir
17.08.2016
21:33:06
где-то место закончилось, где-то процесс нагрузил проц до предела
ты уверен, что проблемы например с ЦПУ не решаются зачастую одним и тем же набором действий?

Phil
17.08.2016
21:33:16
Это да, упущение
нет. это не упущение. но битва и за это

Konstantin
17.08.2016
21:33:16
не уверен

Vladimir
17.08.2016
21:33:18
Т.е. что решателя этой проблемы допустим в 95% случаев не заменит скрипт

Konstantin
17.08.2016
21:33:28
есть процессы, которые категрически нельзя убивать

Vladimir
17.08.2016
21:33:37
ну пока все еще скриптуется

Александр
17.08.2016
21:33:57
Konstantin
17.08.2016
21:34:05
:D

Александр
17.08.2016
21:34:15
Ненуачо?

Google
Vladimir
17.08.2016
21:34:17
есть процессы, которые категрически нельзя убивать
вот тут недавно netflix выложили свою систему для "уточнения" - пишешь код, он выполняется на сервере или группе серверов где сработал алярм и позволяет порешать проостые случаи и собрать дополнительную статистику, например.

Страница 946 из 4568