🏳️ Phil
что лучше для сбора логов с контейнеров
Ну я сейчас все контейнеры прошу писать в stdin/stderr, потому что побелить я их на выходе смог только rsyslog. Ну я там юзерам раскладываю по файликам
Vladimir
тебе вот удобнее прометеус, мне в моих проектах забикс. так я не кричу что прометеус гавно )
Тут момент такой. Выбор системы мониторинга довольно важная штука и выбрав немасштабируемое говно сейчас ты будешь с ним жить долго и страдать. Поэтому это важно объяснять особенно новичкам что из себя какой софт представляет
🏳️ Phil
исинга няша как алертинг и борда
Ты ее веб2 юзаешь? А с шинкеном не сравнивал?
Vladimir
А есть какие-то альтернативы по алертингу?
У прома алерт-манагер свой. Для графита есть Moira и bosun например. Ну и как выше сказали
🏳️ Phil
мульён их
Да перестань. Шинкен и еще на заскеле чтото было. И собственно все
Terry
Добрый день. Что взять не сильно тяжелое, для мониторинга мониторинга + доп мониторинга уже имеющихся VM, серверов ? (CPU, memory, возможность мониторить наличие рабочего процесса) Я так предполагаю icinga?
Nazar
Хочешь мониторить мониторинг? )
🏳️ Phil
У прома алерт-манагер свой. Для графита есть Moira и bosun например. Ну и как выше сказали
1. Сколько он есть. 2. Я знаю. Открыл босун и закрыл. Не помню уже почему. Мойру не слышал. У всех алертеров не нагиос стайл какаято бида с эскалациями, группами контактов и нотискоммандами
Georgiy
Какой смысл валить всю инфу в одну кучу?
а зачем ее валить из 20 мест ? все равно оно все должно улететь в прометей
🏳️ Phil
шинкен мертв
Все да? Не успел попробовать?
Vladimir
Ээээ... А может проще просто нагиос взять?)))
Ну вот компании редко хотят поддерживать инфраструктуру которая будет звонить в случае алертов или там смс слать
Denis
Ээээ... А может проще просто нагиос взять?)))
в нагиосе нет инцидент менеджмента как такого удобного
Terry
Vladimir
А pd это за тебя делает, сразу давая простенький incident Management (которого хватает большинству) и отлично тебе звонит и смсит
Vladimir
И вопит в клиент на телефоне, если таковой есть
Dmitry
а зачем ее валить из 20 мест ? все равно оно все должно улететь в прометей
Потому что инфа о том где берется экспортер может лежать в разных местах, может быть разный релейбл и ещё черт знает что
Vladimir
@schors вот спишь ты себе такой, а тут тебе начинают петь: your servers on fire
Vladimir
Отлично ж
Georgiy
Потому что инфа о том где берется экспортер может лежать в разных местах, может быть разный релейбл и ещё черт знает что
где необходим разный релейбл можно сделать явно где удобнее взять кучей лучше брать кучей
Dmitry
Прометей дьявольски гибок, а вы все хотите все-в-одном
One
нервно на смс начинаешь реагировать )
Vladimir
Погодь. А ты что предложил?
Купить себе pagerduty и не париться
🏳️ Phil
Купить себе pagerduty и не париться
Блин. А оно умеет эскалации?
Georgiy
Прометей дьявольски гибок, а вы все хотите все-в-одном
так это не уменьшает его гибкости зачем мониторингу знание что у вас на хосте за сервисы ? его дело ходить и аггрегировать их у себя
🏳️ Phil
Да
А да
Bogdan (SirEdvin)
Ну и да, можно же экспортёры опрашивать с разным интервалом. Экспортер базы раз в минуту, node exporter раз в 30 секунд.
Vladimir
А да
Оно денег хочет, но много чего умеет
Georgiy
А зачем дополнительная прослойка?
а можно уточнить, в чем прослойка ? вы предлагаете чтобы прометей заходил на машину по ssh и сам забирал нужную стату? то что вы назвали прослойкой это штука экспортирующая метрики. в чем она прослойка ?
Denis
Прометей дьявольски гибок, а вы все хотите все-в-одном
на самом деле нет. На самом деле это заббикс с +\- нормальным шорт терм стораджом.
Denis
Мммм... Ну... А гле есть?
в опенсорсе помоему нигде.
🏳️ Phil
в опенсорсе помоему нигде.
С другой стороны - ицинге интеграции бы с redmine/otrs... Наверное причем redmine
🏳️ Phil
А Shinken всё говорите?
Denis
Затем что ты можешь все экспортеры ваще на одном хосте держать
удобно, один хост падает и всё отваливается.
Denis
А Shinken всё говорите?
тм вялые коммиты в репе, и то не по делу
Georgiy
Затем что ты можешь все экспортеры ваще на одном хосте держать
ну оно так и выходит, что хост обмазан тремя экспортерами. почему нельзя в одном их держать ? вот telegraf кажется интересным вариантом
Dmitry
удобно, один хост падает и всё отваливается.
Не все отвалится, а метрики не поедут
Dmitry
Это же не конец света
Denis
вобще то конец.
Denis
для нас лично, неработающий мониторинг это как бы алерт наивысшего порядка.
Dmitry
Если человек сует все экспортеры на один, то для него, видимо, это другой уровень опасности
Dmitry
Кстати, это тоже одна из причин не класть все экспортеры в один
Georgiy
отваливается хост прометея ? или вы про что ?
Vladimir
ну оно так и выходит, что хост обмазан тремя экспортерами. почему нельзя в одном их держать ? вот telegraf кажется интересным вариантом
В го нет нормальных плагинов, поэтому раз разные люди делают разные экспортеры, то вот они и разную инфу дают
Dmitry
отваливается хост прометея ? или вы про что ?
Отваливается хост с кучей экспортеров
Vladimir
И на разных портах висят
Georgiy
Отваливается хост с кучей экспортеров
ну отвалился и отвалился большой экспортер собирал с машины всю стату, а не со всего сервиса
Georgiy
что за экспортер если не секрет ?
Dmitry
Например сервису плохо, экспортер не успевает собирать метрики между таймаутами
Dmitry
Например экспортер самого Прометея )
Georgiy
не видел довольно стабильно собирают хотя могу предположить что node_exporter может много где залочиться при сборе статы с оборудования
Dmitry
Ну т.е. если делать один большой экспортер, это может аффектить
Dmitry
Нод экспортер работает хорошо, но их же стопицот
Dmitry
+никто не мешает писать свои
Georgiy
ну вот свои и пишу качество экспортеров такое себе
Dmitry
Качество своих? )
Georgiy
официальных
Dmitry
Ну так, а смысл тогда валить в одну кучу? Тут у тебя одни сервисы, тут другие, тут свои
Dmitry
Что смущает? Что все на разных портах?
Georgiy
uwsgi_exporter не умеет собирать кастомные метрики из статы uwsgi, vts_exporter ложится когда в апстриме натыкается на один и тот же хост, там куча проблем у них потребление я вообще молчу
Dmitry
Ну так экспортеры пишут разные люди и не всегда хорошо
Dmitry
Опенсорс же
Georgiy
Ну так, а смысл тогда валить в одну кучу? Тут у тебя одни сервисы, тут другие, тут свои
так инфраструктура обычно такая один хост - одна инстанция сервиса если сервис пользуется локальным кешом в виде редиса (чисто для одного инстанса), uwsgi, сюда же прикрутить штуку собирающая стату по потреблению процесса и т.п. уже получается 3 ты их в прометее логически обьедени в project="projectname", service="servicename" далее по имени метрик разные сервисы на хосте не совпадут все, ты удобно собрал стату полностью с каждого инстанса
Denis 災 nobody
а snmp без шиврования безопасно ?
вполне, при условии вынесения всего с управлением в отдельный влан без доступа в инет. Это актуально и для ipmi, который даже с авторизацией. Бонус - защита от бэкдоров и уязвимостей, когда пароль не спасёт
Tadeusz
достаточно закрывать порт 🙂