@ru_devops - страница 697 - Telegram web archive

🏳️ Phil

Ну я сейчас все контейнеры прошу писать в stdin/stderr, потому что побелить я их на выходе смог только rsyslog. Ну я там юзерам раскладываю по файликам

Vladimir

тебе вот удобнее прометеус, мне в моих проектах забикс. так я не кричу что прометеус гавно )

Тут момент такой. Выбор системы мониторинга довольно важная штука и выбрав немасштабируемое говно сейчас ты будешь с ним жить долго и страдать. Поэтому это важно объяснять особенно новичкам что из себя какой софт представляет

🏳️ Phil

исинга няша как алертинг и борда

Ты ее веб2 юзаешь? А с шинкеном не сравнивал?

Vladimir

А есть какие-то альтернативы по алертингу?

У прома алерт-манагер свой. Для графита есть Moira и bosun например. Ну и как выше сказали

🏳️ Phil

мульён их

Да перестань. Шинкен и еще на заскеле чтото было. И собственно все

Terry

Добрый день. Что взять не сильно тяжелое, для мониторинга мониторинга + доп мониторинга уже имеющихся VM, серверов ? (CPU, memory, возможность мониторить наличие рабочего процесса) Я так предполагаю icinga?

Nazar

Хочешь мониторить мониторинг? )

🏳️ Phil

У прома алерт-манагер свой. Для графита есть Moira и bosun например. Ну и как выше сказали

1. Сколько он есть. 2. Я знаю. Открыл босун и закрыл. Не помню уже почему. Мойру не слышал. У всех алертеров не нагиос стайл какаято бида с эскалациями, группами контактов и нотискоммандами

Dmitry

кстати прометею нехватает нормального единого агента... через некоторое время конфигурация в прометее для хоста начинает выглядеть как сходи на 9100 порт, сходи на 9101 порт и 9117, и еще порт приложения. почему я в одном экспортере не могу сказать что чувак, сходи на хапрокси, ювсги и собери стату с системы. много удобнее.

Какой смысл валить всю инфу в одну кучу?

Denis

Ты ее веб2 юзаешь? А с шинкеном не сравнивал?

шинкен мертв

Vladimir

1. Сколько он есть. 2. Я знаю. Открыл босун и закрыл. Не помню уже почему. Мойру не слышал. У всех алертеров не нагиос стайл какаято бида с эскалациями, группами контактов и нотискоммандами

Потому что чаще всего это народ отдает на откуп какому нибудь pagerduty иди victorops

Georgiy

Какой смысл валить всю инфу в одну кучу?

а зачем ее валить из 20 мест ? все равно оно все должно улететь в прометей

🏳️ Phil

шинкен мертв

Все да? Не успел попробовать?

🏳️ Phil

Потому что чаще всего это народ отдает на откуп какому нибудь pagerduty иди victorops

Ээээ... А может проще просто нагиос взять?)))

Vladimir

Ээээ... А может проще просто нагиос взять?)))

Ну вот компании редко хотят поддерживать инфраструктуру которая будет звонить в случае алертов или там смс слать

Denis

Ээээ... А может проще просто нагиос взять?)))

в нагиосе нет инцидент менеджмента как такого удобного

Terry

Хочешь мониторить мониторинг? )

да, а что тут такого?

Vladimir

А pd это за тебя делает, сразу давая простенький incident Management (которого хватает большинству) и отлично тебе звонит и смсит

Vladimir

И вопит в клиент на телефоне, если таковой есть

Dmitry

а зачем ее валить из 20 мест ? все равно оно все должно улететь в прометей

Потому что инфа о том где берется экспортер может лежать в разных местах, может быть разный релейбл и ещё черт знает что

Vladimir

@schors вот спишь ты себе такой, а тут тебе начинают петь: your servers on fire

Vladimir

Отлично ж

Georgiy

Потому что инфа о том где берется экспортер может лежать в разных местах, может быть разный релейбл и ещё черт знает что

где необходим разный релейбл можно сделать явно где удобнее взять кучей лучше брать кучей

Dmitry

Прометей дьявольски гибок, а вы все хотите все-в-одном

One

нервно на смс начинаешь реагировать )

Ivan

@schors вот спишь ты себе такой, а тут тебе начинают петь: your servers on fire

🏳️ Phil

Ну вот компании редко хотят поддерживать инфраструктуру которая будет звонить в случае алертов или там смс слать

Погодь. А ты что предложил?

🏳️ Phil

в нагиосе нет инцидент менеджмента как такого удобного

Мммм... Ну... А гле есть?

Vladimir

Погодь. А ты что предложил?

Купить себе pagerduty и не париться

🏳️ Phil

@schors вот спишь ты себе такой, а тут тебе начинают петь: your servers on fire

Ну оно так и происходит обычно

🏳️ Phil

Купить себе pagerduty и не париться

Блин. А оно умеет эскалации?

Vladimir

Блин. А оно умеет эскалации?

Да

Georgiy

Прометей дьявольски гибок, а вы все хотите все-в-одном

так это не уменьшает его гибкости зачем мониторингу знание что у вас на хосте за сервисы ? его дело ходить и аггрегировать их у себя

Konstantin

А pd это за тебя делает, сразу давая простенький incident Management (которого хватает большинству) и отлично тебе звонит и смсит

что такое pd ?

Vladimir

что такое pd ?

Pagerduty

Bogdan (SirEdvin)

так это не уменьшает его гибкости зачем мониторингу знание что у вас на хосте за сервисы ? его дело ходить и аггрегировать их у себя

А зачем дополнительная прослойка?

🏳️ Phil

Да

А да

Bogdan (SirEdvin)

Ну и да, можно же экспортёры опрашивать с разным интервалом. Экспортер базы раз в минуту, node exporter раз в 30 секунд.

Vladimir

А да

Оно денег хочет, но много чего умеет

🏳️ Phil

Оно денег хочет, но много чего умеет

Да-да, я вижу

Georgiy

А зачем дополнительная прослойка?

а можно уточнить, в чем прослойка ? вы предлагаете чтобы прометей заходил на машину по ssh и сам забирал нужную стату? то что вы назвали прослойкой это штука экспортирующая метрики. в чем она прослойка ?

Denis

Прометей дьявольски гибок, а вы все хотите все-в-одном

на самом деле нет. На самом деле это заббикс с +\- нормальным шорт терм стораджом.

Denis

Мммм... Ну... А гле есть?

в опенсорсе помоему нигде.

Dmitry

так это не уменьшает его гибкости зачем мониторингу знание что у вас на хосте за сервисы ? его дело ходить и аггрегировать их у себя

Затем что ты можешь все экспортеры ваще на одном хосте держать

🏳️ Phil

в опенсорсе помоему нигде.

С другой стороны - ицинге интеграции бы с redmine/otrs... Наверное причем redmine

🏳️ Phil

А Shinken всё говорите?

Denis

Затем что ты можешь все экспортеры ваще на одном хосте держать

удобно, один хост падает и всё отваливается.

Denis

А Shinken всё говорите?

тм вялые коммиты в репе, и то не по делу

Georgiy

Затем что ты можешь все экспортеры ваще на одном хосте держать

ну оно так и выходит, что хост обмазан тремя экспортерами. почему нельзя в одном их держать ? вот telegraf кажется интересным вариантом

Dmitry

удобно, один хост падает и всё отваливается.

Не все отвалится, а метрики не поедут

Dmitry

Это же не конец света

Dmitry

ну оно так и выходит, что хост обмазан тремя экспортерами. почему нельзя в одном их держать ? вот telegraf кажется интересным вариантом

О да

Denis

вобще то конец.

Denis

для нас лично, неработающий мониторинг это как бы алерт наивысшего порядка.

Dmitry

Если человек сует все экспортеры на один, то для него, видимо, это другой уровень опасности

Dmitry

Кстати, это тоже одна из причин не класть все экспортеры в один

Georgiy

отваливается хост прометея ? или вы про что ?

Vladimir

ну оно так и выходит, что хост обмазан тремя экспортерами. почему нельзя в одном их держать ? вот telegraf кажется интересным вариантом

В го нет нормальных плагинов, поэтому раз разные люди делают разные экспортеры, то вот они и разную инфу дают

Dmitry

отваливается хост прометея ? или вы про что ?

Отваливается хост с кучей экспортеров

Vladimir

И на разных портах висят

Georgiy

Отваливается хост с кучей экспортеров

ну отвалился и отвалился большой экспортер собирал с машины всю стату, а не со всего сервиса

Dmitry

ну отвалился и отвалился большой экспортер собирал с машины всю стату, а не со всего сервиса

Никогда не видел ситуации, когда экспортер тупит?

Georgiy

что за экспортер если не секрет ?

Dmitry

Например сервису плохо, экспортер не успевает собирать метрики между таймаутами

Dmitry

Например экспортер самого Прометея )

Georgiy

не видел довольно стабильно собирают хотя могу предположить что node_exporter может много где залочиться при сборе статы с оборудования

Dmitry

Ну т.е. если делать один большой экспортер, это может аффектить

Dmitry

Нод экспортер работает хорошо, но их же стопицот

Dmitry

+никто не мешает писать свои

Georgiy

ну вот свои и пишу качество экспортеров такое себе

Dmitry

Качество своих? )

Georgiy

официальных

Dmitry

Ну так, а смысл тогда валить в одну кучу? Тут у тебя одни сервисы, тут другие, тут свои

Dmitry

Что смущает? Что все на разных портах?

Georgiy

uwsgi_exporter не умеет собирать кастомные метрики из статы uwsgi, vts_exporter ложится когда в апстриме натыкается на один и тот же хост, там куча проблем у них потребление я вообще молчу

Dmitry

Ну так экспортеры пишут разные люди и не всегда хорошо

Dmitry

Опенсорс же

Georgiy

Ну так, а смысл тогда валить в одну кучу? Тут у тебя одни сервисы, тут другие, тут свои

так инфраструктура обычно такая один хост - одна инстанция сервиса если сервис пользуется локальным кешом в виде редиса (чисто для одного инстанса), uwsgi, сюда же прикрутить штуку собирающая стату по потреблению процесса и т.п. уже получается 3 ты их в прометее логически обьедени в project="projectname", service="servicename" далее по имени метрик разные сервисы на хосте не совпадут все, ты удобно собрал стату полностью с каждого инстанса

Denis 災 nobody

а snmp без шиврования безопасно ?

вполне, при условии вынесения всего с управлением в отдельный влан без доступа в инет. Это актуально и для ipmi, который даже с авторизацией. Бонус - защита от бэкдоров и уязвимостей, когда пароль не спасёт

Tadeusz

достаточно закрывать порт 🙂