
Ilya
07.08.2016
20:43:22
Прометей - оперативный мониторинг
Тормозит - да
Так. Где ты данные за год назад хранишь тогда?
Так. “Тормозит” и всё устраивает?

Google

Ilya
07.08.2016
20:43:22
Я в тормоза могу только случайно влететь
А год мне не нужен
Тогда как ты планируешь нагрузку на сервисы / серверы?
Вернее - мне не нужен трендовый мониторинг
Окей, сколько максимум живут данные в твоём прометеусе?
Я не баду, я свою нагрузку могу просто посчитать
2 месяца
#непроебать
Извините за шквал, не знаю как у вас это отобразилось

Alexandr
07.08.2016
20:44:02
И то не аргумент
Я когда на митапе заббикса был, там парень рассказывал как они переходили с Nagios на Zabbix, и у них была проблема с масшабируемостью, не помню правда как его решали

Ilya
07.08.2016
20:44:44

Alexandr
07.08.2016
20:45:54

Ilya
07.08.2016
20:48:21
Короче, я по-быренькому опишу.
У нас есть сервер N1, есть сервер N2.
Между ними мастер-мастер MySQL репликация.
Помимо MySQL, всё остальное синкается rsync’ом постоянно.
Как только мрёт первая нода, мы:
– включаем zabbix_server на второй (конфиги идентичны, айпишники обоих серверов прописаны во всех конфигах)
– переключаем CNAME заббикса на другой хостнейм
Таким образом пассивные проверки дальше работают и пишутся в базу результаты. И скрипты по крону пишут всё в CNAME.
Это очень просто и затратно только в том смысле, что второй сервер нужно, не хуже первого.

Google

Ilya
07.08.2016
20:48:41
Никаких вотчдогов и проч – нет

Andrey
07.08.2016
20:48:46

Ilya
07.08.2016
20:50:51
Есть ещё один заббикс (если кто-то слышал про нас) – у него другая логика.
Там важна только история, никаких изменений не делается в принципе.
Поэтому мы снимаем бэкап каждый день с него.
Даже если мы просрём данные почти за сутки – это не жизненно необходимая информация, просто полезная статистика.
Поэтому у нас два разных заббикса под два разных предназначения.
Первый – пиздец критичный. Второй – важный, но не пиздец.

Andrey
07.08.2016
20:51:12

Ilya
07.08.2016
20:51:16
В первом лампочки / нотификации и нет истории

Andrey
07.08.2016
20:52:04

Ilya
07.08.2016
20:52:07
Хотя я сам себя заинтриговал.
Короче тема такая. Сам Владышев не один раз уже говорил, что, дескать, они мониторинг делают, но они не мониторят.
Я был на курсах Заббикса когда-то. Нового я узнал – ничего.
Это просто пересказ документации.
Надеюсь, они меня простят за такую рекламу.

Andrey
07.08.2016
20:55:29

Alexandr
07.08.2016
20:55:34

Ilya
07.08.2016
20:55:54
А в прошлом году я был на конференции, общался с девушкой из Израиля, которая рассказывала, что у них ДВАЖДЫ случалась почти одна и та же проблема и они за ёбаную гору денег обращались в саппорт Заббикса, чтобы те им починили эти проблемы.
Судя по тому, что она описала – эти проблемы получали и мы, только мы их порешать как-то смогли без помощи кого-то из компании. А просто потому что трубы горели и надо было решать.

Alexandr
07.08.2016
20:55:54
Документация я считаю одна их самых офигенных

Andrey
07.08.2016
20:57:32
Вообщем, продукт поставляется как есть)

Ivan
07.08.2016
20:57:48
Документация — говно, как по мне


Ilya
07.08.2016
20:58:04
Я так понимаю Badoo тесно сотрудничает с Владышевым и его командой и вместе внедряли мониторинг и патчи под Вас делаются?
Нет, мы не сотрудничаем. Просто замутили митап первый раз, потому что мне захотелось (могу рассказать потом, почему захотелось). А второй раз – потому что совпало два события:
1. группа https://www.meetup.com/Zabbix-Moscow-Meetup/ осталась без владельца и я её выкупил
2. вышел заббикс 3.0
Алексей написал мне и спросил, не хотим ли мы провести ещё митап, типа приуроченный к выходу заббикс 3.0
Ну нам захотелось и так получилось второй раз.
Единственный раз, когда сотрудничали – это когда очень много лет назад впиливали инвентаризацию (по крайней мере мне поведали уже ушедшие из компании коллеги). Но мы уже давно GLPI юзаем, так что один хуй не помогло.
Документация — говно, как по мне
Документация как описание хорошая.
Там нет рецептов в стиле “ЧТО ДЕЛАТЬ ЕСЛИ ВАША ДЕВУШКА БЕРЕМЕННА”, но нам уже не страшно, наелись говна много.
Просто им ведь тоже бабло надо зарабатывать. И это нормально.

Google

Ivan
07.08.2016
21:01:09
нормально, просто такого восторга от таких доков я не поддерживаю

Ilya
07.08.2016
21:01:21
Ты будто не видел хуже документацию
У них она – не хуже, чем должна быть
Я вот даже не знаю, каким образом можно переложить знания из моей головы в текст.
Потому что особенностей много, которые важны и нужны, но не написаны в явном виде.

Q
07.08.2016
21:02:28

Ilya
07.08.2016
21:03:26

Alexandr
07.08.2016
21:03:37
Ты будто не видел хуже документацию
Я видел документацию полный пиздец, неактуальную, а они хотя бы от версии к версии дополняют и меняют по мере необходимости. Ясен хрен что они не будут прям досконально все писать, но чтобы разобраться в основах вполне достаточно

Ilya
07.08.2016
21:05:12
У кого-то простоев быть не должно.
У кого-то допустимы.
У кого-то можно лежать хоть всю ночь.
В зависимости от требуемого результата – уже решение найдётся.
Здесь на заббикс я бы не завязывался. Много продуктов не умеют масштабироваться и фейловериться.
Всегда можно найти какие-нибудь пути решения проблем.
А то может и проблем-то нет.
У нас за года три, заббикс дох один раз.
И то только потому что его перезагрузили случайно.

Alexandr
07.08.2016
21:07:12

Ilya
07.08.2016
21:07:17
У нас всё в пределах локальной сети

Google

Alexandr
07.08.2016
21:08:19

Ilya
07.08.2016
21:09:00
Я ничего про PostgreSQL, честно скажу, не знаю, в этом плане. Ибо всю жизнь юзаю MySQL. Но слейвы же там есть? Если да – то похрен :)

Aleksandr
07.08.2016
21:09:04
Универсальных подо все + оптимальных решений не бывает.
Заббикс поносят те, кому он просто не подошёл под их флагманский проект из-за повышенных требований в каком-то отдельном вопросе, который они точечно решили другим решением. При этом, субъективно, таких проектов меньшинство. Из коробки, заббикс закрывает много вопросов, а отдельные его области отлично тюнятся при повышенных требованиях. А так, на отдельные задачи созданы отдельные инструменты. Заббикс отлично комбайново справляется с основным пластом вопросов

Ilya
07.08.2016
21:09:28

Alexandr
07.08.2016
21:09:38

Ivan
07.08.2016
21:10:11

Ilya
07.08.2016
21:10:17
Ну да и ладно, просто мастер-мастер для быстрого переключения.
У нас был и мастер->слейв. Просто обратно долго переключаться.
Ну и лайфхак: у нас есть DBA, мы с базой себе мозги не ебём)

Ivan
07.08.2016
21:10:46
дба эт чит!)

Ilya
07.08.2016
21:10:57
Ещё какой
Но я тебе так скажу, что можно почитать маленечко мануалов распространённых и тоже будешь читерить.
Народ отсюда прёт в DevOps чат

Alexander
07.08.2016
21:15:27
больше чатов богу чатов!
а то читать нечего )
по 1.5-3к сообщений в день всего генерят )

Alexandr
07.08.2016
21:18:37

Ilya
07.08.2016
21:18:40
Бля. Прошу пардона за аттачмент, а не за картинку.

Andrey
07.08.2016
21:20:34

Ilya
07.08.2016
21:44:30
Ахаха, забанили неженки.
Передайте привет Девопсанам.

Google

Ilya
08.08.2016
09:50:15
Заббикс и Рига живут в наших сердца ^W^W^W на наших столах.

Alexander
08.08.2016
09:50:22
вот блядь да. Самый вкусный, с чёрной смородиной.

Aleksandr
08.08.2016
09:50:22
=D

Kirill
08.08.2016
09:51:00

Ilya
08.08.2016
09:55:58
Кто будем сотым?