Aleksandr
не, ну его можно приготовить, я делал авто-добавление хостов и авто-назначение групп и шаблонов... но это из разряда "смотри как могу"
тоже делелал ) ну как авто ) просто при деплое ))) в зависимости от роли хоста в кластере автодобавление навешивание шаблонов и создание скринов под них https://github.com/anevenchanniy/zabbixctl
Denis
в агенте есть "теги", сервер эти теги может видеть и он и доступны в экшенах дискевери, ну собственно на этом все и строилось) выглядит "итересно" запускаешь новый агент с "тегами" и секретом, и агент сам стучится в сервер, по секретику сервер его добавляет и за счет дискавери правил навешивает группы и шаблоны
Denis
другими словами 1 раз настроили сервер, а потом просто плодим агенты и они сами добавляются, без пхода на сервер)
Aleksandr
@sergeygals ^^^ должен помнить эту хероту )
Denis
больше бесили userparameter
Denis
в итоге просто была 1 дикая папка /etc/zabbix-agent/scripts и там были все скрипты и userparams тоже все прилетали на все сервера...
Aleksandr
Идея была простая так как мы кластер опенстэка за день могли по пару раз передеплоить. Что бы автоматизировать все это. А так сразу они в заббикс добавились, шаблоны навесили скрины создали.
Aleksandr
и когда видишь что тесты упали ибо кролик сдох, идешь на скрины контроллеров смотришь че там с сетью было в этот момент
Рамиль
https://github.com/ncabatoff/process-exporter есть такой экспортер. он умеет различать процессы и обсчитывать их каждый. Если нет готовой метрики, то там в конфиге можно ее создать из имеющейся статы. А стату оно скорее всего берет в /proc
Artemy
(qemu) info blockstats ide0-hd0: rd_bytes=51105792 wr_bytes=951296 rd_operations=2784 wr_operations=84 ide1-cd0: rd_bytes=0 wr_bytes=0 rd_operations=0 wr_operations=0 floppy0: rd_bytes=0 wr_bytes=0 rd_operations=0 wr_operations=0 sd0: rd_bytes=0 wr_bytes=0 rd_operations=0 wr_operations=0
Хорошая стата если её часто снимать, но самого почти важного - латенси - там нет. Я вот правда не помню был ли там в какой то метрике секунды, возможно и были но их либвирт дропал.
Artemy
я видел LA 6000 из-за io-wait при том что из 16Гигабит FC до хранилки была загрузка 2мб/сек
Ну если у тебя куча синхронного ио в тредах то легко. Но это также значит что ты просасываешь по процу. Вообще какое то странное сочетание, ЛА означает что у тебя куча тредов хочет выполниться и снято с локов, но иовайт ты увидишь только если процы не загружены. Неудачный пининг?
Artemy
На файловую систему? Ну тогда почти понятно
Aleksandr
На файловую систему? Ну тогда почти понятно
там с Hitachi USP-V по FC были подключены тома с XFS где 6Тб почты в mail dir (по 2Тб на диск) - там все изначально через жопу было )))
Artemy
Тогда в общем то ожидаемо, да. Умение отстрелить себе яйцы развитое до уровня «бог»
Aleksandr
когда я пришел было еще страшнее ))) ext2 был ))) на малдирах ему вообще кайфно было за счет метадаты ))) и при каждой авторизации запускался PERLблядь который кастомную авторизацию в LDAP делает ) что бы групповые ящики работали по аналогии с иксчангом )))) То вообще жесткач был ))) 2/3 из 8 ядер был перо ))))) Я когда пришел первым делом его на С переписал. Потом файловую систему сменил и оно так и работало. А решать фундоментально пролему начальство не хотело. Вот так и подталкивал его заплатками всякими
Artemy
Прямо как комунибудь + самовары
Aleksandr
/chatinfo@QuanBot
Aleksandr
Лазил по менюшке данного чатика и нажал для пробы.
Mikhail
ну или будем, но не сразу
Stanley
И да, чисто из практики - никогда не идите в мониторинг " меня в ВМ что то не то". Сожрут (с)
Stanley
Заббикс - лучший. Без вариантов
Dzmitry
Заббикс надо уметь готовить, на больших скейлак убивает инфраструктуру если по дефолту. Лучше нагиос с гоафанкой сбоку, его в церне даже юзают
Михаил
Stanley
Когда вы помрёте уже
Сильно после вас, соевых :)
Михаил
Сильно после вас, соевых :)
Деды раньше помрут, чем узнают что такое временные ряды и зачем вообще придумали пром
Stanley
Деды раньше помрут, чем узнают что такое временные ряды и зачем вообще придумали пром
Его придумали дурни, которые не смогли настроить заббикс. :)
Stanley
И начали собирать кучу дерьма ради пары метрик
Михаил
Его придумали дурни, которые не смогли настроить заббикс. :)
Я прям очень не в настроении. Так что готов банить
Dzmitry
Но почему? Церн прекрасные ребята, они первыми разделили кролик для сервисов пенстека и рассказали об этом на конференции
Михаил
За другое мнение? Мило. :)
За любовь к заббиксу
Stanley
За любовь к заббиксу
Кто ж тебя такого несдержанного админом назначил. :) Илюха чтоли? Поговорю с ним.
Михаил
Давайте остановим срач по мониторингу
Alexey
а что актуально ?
Alexey
добрый вечер
Pavel
У zabbix есть то что ни где не реализовано: - nodata и алерты на это (absent работает иначе) - система алертинга с иерархией алертов
Egor
Надо было ставить Вику
Dzmitry
У zabbix есть то что ни где не реализовано: - nodata и алерты на это (absent работает иначе) - система алертинга с иерархией алертов
У нагиоса или исинги иерархия из коробки, а нодата алерт для меня звучит странно. Если данные не собраны, значит чекер таймаутит и тем самым алертит
Михаил
Хорошее предложение
Denis
чяртом distributed
Denis
правильные мысли
Denis
тебе понадобится S3 и чтобы сразу решить все проблемы бери grafana-agent, им же метрики соберешь заодно)
Denis
там внутри promtail, cadvisor, node_exporter и otlp
Denis
все ёлочное в помойку
Denis
да просто дорого по дискам и сложно :)
Denis
да один кластер ребаланс на каждый пук уже заставляет задуматься
Pavel
loki - "мы написали syslog + grep c rest api, хранилку организуйте сами"
Pavel
да не думай, бери s3
А если его нет?
Denis
ну так сделай
Denis
иначе же весь смысл теряется
Pavel
а накой вообще мне grep + api тогда?
Denis
в графане можно смотреть логи
Denis
promql подобными запросами
Pavel
по тестам этот локи гавно с большим количество приседаний и большим количеством требований к инфре
Denis
при особом упорстве можно даже алертить
Denis
хз, в куб влетает со свистом, а s3 есть в каждой помойке
Denis
что значительно экономит косты на хранении
Denis
ну можешь прям лапками раздеплоить и сказать чтобы он хранил на дисках, если до сих пор нет кубов)
Pavel
ну хз у меня он и 1GB/s не прожевал. захлебнулся
Pavel
Я думал что хуже чем у fluentd (руби) быть не может, я был пессимистом
Pavel
ek - вот вам и хранилка и ретеншен и шарды loki - эбитЭс сами и клал я на CPU/RAM
Pavel
у loki тоже самое, только ты еще ему s3 сделаешь
Irek
VictoriaLogs посмотрите
Irek
правда все еще в глубокой бете
Irek
(сам не тестил)
Denis
VictoriaLogs посмотрите
кажись рано, пусть настоится немного
NS 🇷🇺
ща на биржу выйдут и дела в гору пойдут. а тут еще SberLinux OS подтянется и вообще заживем
NS 🇷🇺
ну у первых IPO на днях, вторые активно народ хантят под балалайку
NS 🇷🇺
Астра
NS 🇷🇺
привлекут бабла и уже будет стыдно ударить в грязь лицом :D
Andrey
Ой вэй))) когда это кому то было стыдно после IPO ))