@ZabbixPro

Страница 1127 из 1183
Alexander
06.10.2018
12:54:27
Alexander
06.10.2018
12:54:35
Да брось.
Не брошу

БД должно быть 2

Vladislavs
06.10.2018
12:54:52
и я пытаюсь понять природу этого явления
Позже должны быть duplicate errors,

Google
Alexander
06.10.2018
12:55:22
БД должно быть 2
Мультимастер не обязательно делать

Alexander
06.10.2018
12:55:34
Иначе костыли

Dmitry
06.10.2018
12:56:14
Да в чем проблема випа для БД?

Ilya
06.10.2018
12:56:40
Обязательно
Ну а нафига?

Alexander
06.10.2018
12:57:04
Иначе костыли
Кластер с подхватом - костыль?.. ну-ну.

Alexander
06.10.2018
12:57:04
Ну а нафига?
Упал сервер бд. Что дальше?

@asand3r ^^^

Ilya
06.10.2018
12:57:19
Упал сервер бд. Что дальше?
И как мультимастер решит эту проблему?

Alexander
06.10.2018
12:57:29
Кластер с подхватом - костыль?.. ну-ну.
Мускул. Упал мастер - что дальше?

Ilya
06.10.2018
12:58:37
Мы про мастер-мастер или про многопоточную репликацию?

Alexander
06.10.2018
12:59:06
Google
Ilya
06.10.2018
13:01:28
Давай оба рассматривать
Так вот мастер-мастер можно с натягом назвать мультимастером, да и заббикс не сможет работать с несколькими базами. Я вообще не уверен, что ему голову не оторвёт. Ну у нас есть два мастера. Один из них логический мастер, тот, в который пишут. Если заббикс там что-то запишет из кэша в последнюю секунду и ты отрубишь этот мастер-сервер, а через секунду ты переключишь мастера на другой — я даже не могу представить, что будет. Взять хотя бы те же ids.

Ilya
06.10.2018
13:04:44
Автоинкремент должен решить. Писать заббикс будет в сервер с ИП, который плавает (vip)
Мы уже выяснили, что автоинкремента мало, и вот у @dmitrytiger такая именно ситуация. Автоинкремент один, а в таблице ids другое значение. Я на такое же наступил с users и usergroups.

Ilya
06.10.2018
13:05:27
Это ж бага?
Бага. Только она не воспроизводится в 999 случаев из 1000 (если не больше).

Alexander
06.10.2018
13:05:38
Или отставание слейва если мультимастер

Alexander
06.10.2018
13:06:37
@asand3r ^^^
Пардон ) я за рулём.

Dmitry
06.10.2018
13:11:10
Здесь дедлок
ну понятно что из за недостаточного перформанса базы такое можно словить, но тут похоже что хендлинг таких ошибок не сделан что позволяет стать базе неконсистентной

Dmitry
06.10.2018
13:11:49
@ddpechkin такая схема?
Ну потеря данных в несколько минут - кажется невеликой. Не каждый же день у вас летят серваки

Dmitry
06.10.2018
13:13:40
Зависит от нагрузки - но даже час данных в случае дизастера - кажется, немного

Google
Alexey
06.10.2018
13:15:40










Dmitry
06.10.2018
13:15:55
Ещё вопрос - а роллбеки есть? И какая нагрузка на БД по RPS
по логам не видно, рпс небольшой но затыки обычно во время импорта шаблонов илучаются

Alexander
06.10.2018
13:16:36
Как работает логика импорта при рабочем сервере

Kamil
06.10.2018
13:33:26
Small 4 дня SLA - даже не смешно
нууу у мтс тоже два дня время ответа на жалобу...но обычно быстрее работают...

Alexander
06.10.2018
13:34:20
по логам не видно, рпс небольшой но затыки обычно во время импорта шаблонов илучаются
Можно включить мониторинг мускула и там видно будет - есть в стандартном шаблоне. + Включить логгирование локов в мускуле

Kamil
06.10.2018
13:34:30
покупают реакцию а не объем
разве? у того же мс вроде продаются часы работы саппорта...вполне се объем

Alexander
06.10.2018
13:43:57
@asand3r ^^^
Ну вот, собственно, о чем мы?.. Про отказовустойчивость Zabbix server - имхо, это только фейловер. Из знакомых мне технологий. Сервер БД - история отдельная. Если рассматривать вопрос, что будет, если упадет сервер БД, а сервер Zabbix останется жив и как-то помешают кеши - я бы сходу, наверное, предложил перезапускать сервер Zabbix при переезде инстанса СУБД на другой узел кластера.

Kamil
06.10.2018
13:45:28
Alexander
06.10.2018
13:46:00
Процессор сгорел

Google
Alexander
06.10.2018
13:46:36
Инстанс не едет. Он умер
Ну, какая разница?.. Я к тому, что пока второй сервер поднимает СУБД, сервер Zabbix останаливается и запускается заново после старта СУБД.

причина смерти?
Да вообще не важно наверное.

Kamil
06.10.2018
13:47:01
Пофиг
отнють, падение, например, при обновлении забикса это одно, а падение из за пожара в датацентре это другое, во втором случае по идее всякие растянутые кластеры должны помочь

Alexander
06.10.2018
13:48:05
отнють, падение, например, при обновлении забикса это одно, а падение из за пожара в датацентре это другое, во втором случае по идее всякие растянутые кластеры должны помочь
Не, ну мы же рассматриваем просто ситуацию, когда потеряли бэкенд. Т.е. он не отвечает и не позволяет писать/читать, а не сама база покоцалась.

Kamil
06.10.2018
13:48:10
Да вообще не важно наверное.
типа если пожар то нам пофиг?

Alexander
06.10.2018
13:48:47
Я б держал слейв в другом дц и бекап сервера заббикс

Kamil
06.10.2018
13:49:31
Я б держал слейв в другом дц и бекап сервера заббикс
лично у меня проблемы с высокой доступностью забикса...демон забикса какого хрена теряет сеть при переезде внутри гиперв кластера...хотя сам сервер доступен

Alexander
06.10.2018
13:51:18
вот взяла и сломалсь? просто так? это из разряда обновлений винды с топерей данных?
Да фиг знает, я имею в виду ситуацию, когда сдохло ПО, а данные живы и не требуется восстановления из бекапа.

Admin
ERROR: S client not available

Kamil
06.10.2018
13:52:18
Мак статика?
ага, и ип забитый...я списал все на мою тупость в этом вопросе и забил. так как при проблемах он через лайф миграцию не передет и так

А решается как?
рестарт демона

Alexander
06.10.2018
13:52:49
Alexander
06.10.2018
13:53:34
Kamil
06.10.2018
13:53:46
Я больше не про жизнь заббикса на кластере гипервизоров, а про 2 сервера Заббикс и про 2 СУБД сервера
ну субд уже есть вроде такие рещения, а забикс как я понимаю не умеет в высокую доступность проше несколько серверов с разными базами поднимать, и писать в них с двух агентов

Google
Alexander
06.10.2018
13:54:25
Остальное - Обман

Alexander
06.10.2018
13:54:35
Alexander
06.10.2018
13:54:46
Нет. )
Тю. Что ж ты этосамое

Kamil
06.10.2018
13:55:10
Нет. )
вот, сама ос то работает. хотя я особо не проверял...так как в линуховый только забикс

Alexander
06.10.2018
13:55:44
Не, я подумал, что вся ВМ становится по сети недоступна.

Kamil
06.10.2018
13:56:01
ладно забикс..система мониторинга...ебаная жопа один не умеет в высокую доступность нормально

Alexander
06.10.2018
13:56:33
ладно забикс..система мониторинга...ебаная жопа один не умеет в высокую доступность нормально
Я просто не понимаю, что он должен уметь делать из коробки по вашим обоюдным желаниям?

Kamil
06.10.2018
13:56:47
Не, я подумал, что вся ВМ становится по сети недоступна.
нее тут норм, терминалку даж не выкидывает

Alexander
06.10.2018
13:57:17
Я просто не понимаю, что он должен уметь делать из коробки по вашим обоюдным желаниям?
Масштабироваться по горизонтали на уровне сервера - очевидно

Alexander
06.10.2018
13:58:06
Но мы же всё равно говорим про какой-то кластер, да?

Kamil
06.10.2018
13:58:19
Я просто не понимаю, что он должен уметь делать из коробки по вашим обоюдным желаниям?
у роутеров вроде есть такой режим..забыл как называется, когда они работают в паре, и при потере одного из роутеров, второй подхватывает клиентов незаметно для оных

Alexander
06.10.2018
13:59:18
Я не понимаю зачем пилить этот функционал самому, если есть Peacemaker и Linux HA.

Alexander
06.10.2018
14:00:16
Не спеши

Посмотри на схемы заббикса. Посчитай сколько там кешей. И сделай выкл ему из розетки

Alexander
06.10.2018
14:03:20
Окей. Отходя от темы необходимости - это же наверняка практически невозможно реализовать после стольких лет работы системы. В смысле, такой функционал наверное надо при проектировании закладывать.

Страница 1127 из 1183