@ZabbixPro

« Назад

Страница 1127 из 1183

Далее »

Alexander

06.10.2018
12:54:27

Иначе нет фейловера

Да брось.

Alexander

06.10.2018
12:54:35

Да брось.

Не брошу

БД должно быть 2

Vladislavs

06.10.2018
12:54:52

и я пытаюсь понять природу этого явления

Позже должны быть duplicate errors,

Google

Alexander

06.10.2018
12:55:22

БД должно быть 2

Мультимастер не обязательно делать

Alexander

06.10.2018
12:55:34

Мультимастер не обязательно делать

Обязательно

Иначе костыли

Dmitry

06.10.2018
12:56:14

Да в чем проблема випа для БД?

Ilya

06.10.2018
12:56:40

Обязательно

Ну а нафига?

Alexander

06.10.2018
12:57:04

Иначе костыли

Кластер с подхватом - костыль?.. ну-ну.

Alexander

06.10.2018
12:57:04

Ну а нафига?

Упал сервер бд. Что дальше?

@asand3r ^^^

Ilya

06.10.2018
12:57:19

Упал сервер бд. Что дальше?

И как мультимастер решит эту проблему?

Alexander

06.10.2018
12:57:29

И как мультимастер решит эту проблему?

Вип

Кластер с подхватом - костыль?.. ну-ну.

Мускул. Упал мастер - что дальше?

Ilya

06.10.2018
12:58:37

Мы про мастер-мастер или про многопоточную репликацию?

Alexander

06.10.2018
12:59:06

Мы про мастер-мастер или про многопоточную репликацию?

Давай оба рассматривать

Google

Ilya

06.10.2018
13:01:28

Давай оба рассматривать

Так вот мастер-мастер можно с натягом назвать мультимастером, да и заббикс не сможет работать с несколькими базами. Я вообще не уверен, что ему голову не оторвёт. Ну у нас есть два мастера. Один из них логический мастер, тот, в который пишут. Если заббикс там что-то запишет из кэша в последнюю секунду и ты отрубишь этот мастер-сервер, а через секунду ты переключишь мастера на другой — я даже не могу представить, что будет. Взять хотя бы те же ids.

Alexander

06.10.2018
13:02:56

Так вот мастер-мастер можно с натягом назвать мультимастером, да и заббикс не сможет работать с несколькими базами. Я вообще не уверен, что ему голову не оторвёт. Ну у нас есть два мастера. Один из них логический мастер, тот, в который пишут. Если заббикс там что-то запишет из кэша в последнюю секунду и ты отрубишь этот мастер-сервер, а через секунду ты переключишь мастера на другой — я даже не могу представить, что будет. Взять хотя бы те же ids.

Автоинкремент должен решить. Писать заббикс будет в сервер с ИП, который плавает (vip)

@ddpechkin такая схема?

Потери будут какие-то

Из-за кешей

Интересно посмотреть как галера поможет. Сам только нефейловер использую

Ilya

06.10.2018
13:04:44

Автоинкремент должен решить. Писать заббикс будет в сервер с ИП, который плавает (vip)

Мы уже выяснили, что автоинкремента мало, и вот у @dmitrytiger такая именно ситуация. Автоинкремент один, а в таблице ids другое значение. Я на такое же наступил с users и usergroups.

Alexander

06.10.2018
13:05:00

Мы уже выяснили, что автоинкремента мало, и вот у @dmitrytiger такая именно ситуация. Автоинкремент один, а в таблице ids другое значение. Я на такое же наступил с users и usergroups.

Это ж бага?

Ilya

06.10.2018
13:05:27

Это ж бага?

Бага. Только она не воспроизводится в 999 случаев из 1000 (если не больше).

Alexander

06.10.2018
13:05:38

Или отставание слейва если мультимастер

Бага. Только она не воспроизводится в 999 случаев из 1000 (если не больше).

Ну. Хитрая бага

Alexander

06.10.2018
13:06:37

@asand3r ^^^

Пардон ) я за рулём.

Alexander

06.10.2018
13:09:07

Коллеги кто может посказать, такая строчка в логе сможет привести к тому что при дискавери айтемы могут быть перезаписаны новосозданными? [Z3005] query failed: [1205] Lock wait timeout exceeded; try restarting transaction [update ids set nextid=nextid+15 where table_name='items' and field_name='itemid'] zabbix_server [4150]: ERROR [file:db.c,line:700] Something impossible has just happened.

Здесь дедлок

Это если никто не пишет в таблицу кроме заббикс - бага разрабов

Коллеги кто может посказать, такая строчка в логе сможет привести к тому что при дискавери айтемы могут быть перезаписаны новосозданными? [Z3005] query failed: [1205] Lock wait timeout exceeded; try restarting transaction [update ids set nextid=nextid+15 where table_name='items' and field_name='itemid'] zabbix_server [4150]: ERROR [file:db.c,line:700] Something impossible has just happened.

А +15 - это бай дизайн?

Dmitry

06.10.2018
13:11:10

Здесь дедлок

ну понятно что из за недостаточного перформанса базы такое можно словить, но тут похоже что хендлинг таких ошибок не сделан что позволяет стать базе неконсистентной

Dmitry

06.10.2018
13:11:49

@ddpechkin такая схема?

Ну потеря данных в несколько минут - кажется невеликой. Не каждый же день у вас летят серваки

Alexander

06.10.2018
13:11:50

ну понятно что из за недостаточного перформанса базы такое можно словить, но тут похоже что хендлинг таких ошибок не сделан что позволяет стать базе неконсистентной

Поиграться с уровнем изоляции транзакций разве что могу предложить

Ну потеря данных в несколько минут - кажется невеликой. Не каждый же день у вас летят серваки

Минут?!

Dmitry

06.10.2018
13:13:40

Зависит от нагрузки - но даже час данных в случае дизастера - кажется, немного

Google

Alexander

06.10.2018
13:13:41

ну понятно что из за недостаточного перформанса базы такое можно словить, но тут похоже что хендлинг таких ошибок не сделан что позволяет стать базе неконсистентной

Ещё вопрос - а роллбеки есть? И какая нагрузка на БД по RPS

Зависит от нагрузки - но даже час данных в случае дизастера - кажется, немного

Согласен. Но это не файловер. Больше на стендбай сервер похоже

Alexey

06.10.2018
13:15:40

Dmitry

06.10.2018
13:15:55

Ещё вопрос - а роллбеки есть? И какая нагрузка на БД по RPS

по логам не видно, рпс небольшой но затыки обычно во время импорта шаблонов илучаются

Alexander

06.10.2018
13:16:36

по логам не видно, рпс небольшой но затыки обычно во время импорта шаблонов илучаются

О. А это кейс

Как работает логика импорта при рабочем сервере

Kamil

06.10.2018
13:33:26

Small 4 дня SLA - даже не смешно

нууу у мтс тоже два дня время ответа на жалобу...но обычно быстрее работают...

Alexander

06.10.2018
13:34:20

по логам не видно, рпс небольшой но затыки обычно во время импорта шаблонов илучаются

Можно включить мониторинг мускула и там видно будет - есть в стандартном шаблоне. + Включить логгирование локов в мускуле

Kamil

06.10.2018
13:34:30

покупают реакцию а не объем

разве? у того же мс вроде продаются часы работы саппорта...вполне се объем

Alexander

06.10.2018
13:34:48

разве? у того же мс вроде продаются часы работы саппорта...вполне се объем

То наркоманы

Alexander

06.10.2018
13:43:57

@asand3r ^^^

Ну вот, собственно, о чем мы?.. Про отказовустойчивость Zabbix server - имхо, это только фейловер. Из знакомых мне технологий. Сервер БД - история отдельная. Если рассматривать вопрос, что будет, если упадет сервер БД, а сервер Zabbix останется жив и как-то помешают кеши - я бы сходу, наверное, предложил перезапускать сервер Zabbix при переезде инстанса СУБД на другой узел кластера.

Alexander

06.10.2018
13:45:13

Ну вот, собственно, о чем мы?.. Про отказовустойчивость Zabbix server - имхо, это только фейловер. Из знакомых мне технологий. Сервер БД - история отдельная. Если рассматривать вопрос, что будет, если упадет сервер БД, а сервер Zabbix останется жив и как-то помешают кеши - я бы сходу, наверное, предложил перезапускать сервер Zabbix при переезде инстанса СУБД на другой узел кластера.

Инстанс не едет. Он умер

Пишем в другую СУБД

Kamil

06.10.2018
13:45:28

Инстанс не едет. Он умер

причина смерти?

Alexander

06.10.2018
13:46:00

причина смерти?

Пофиг

Процессор сгорел

Google

Alexander

06.10.2018
13:46:36

Инстанс не едет. Он умер

Ну, какая разница?.. Я к тому, что пока второй сервер поднимает СУБД, сервер Zabbix останаливается и запускается заново после старта СУБД.

причина смерти?

Да вообще не важно наверное.

Kamil

06.10.2018
13:47:01

Пофиг

отнють, падение, например, при обновлении забикса это одно, а падение из за пожара в датацентре это другое, во втором случае по идее всякие растянутые кластеры должны помочь

Alexander

06.10.2018
13:48:05

отнють, падение, например, при обновлении забикса это одно, а падение из за пожара в датацентре это другое, во втором случае по идее всякие растянутые кластеры должны помочь

Не, ну мы же рассматриваем просто ситуацию, когда потеряли бэкенд. Т.е. он не отвечает и не позволяет писать/читать, а не сама база покоцалась.

Kamil

06.10.2018
13:48:10

Да вообще не важно наверное.

типа если пожар то нам пофиг?

Alexander

06.10.2018
13:48:47

типа если пожар то нам пофиг?

Тут дизастер

Я б держал слейв в другом дц и бекап сервера заббикс

Kamil

06.10.2018
13:49:31

Не, ну мы же рассматриваем просто ситуацию, когда потеряли бэкенд. Т.е. он не отвечает и не позволяет писать/читать, а не сама база покоцалась.

вот взяла и сломалсь? просто так? это из разряда обновлений винды с топерей данных?

Я б держал слейв в другом дц и бекап сервера заббикс

лично у меня проблемы с высокой доступностью забикса...демон забикса какого хрена теряет сеть при переезде внутри гиперв кластера...хотя сам сервер доступен

Alexander

06.10.2018
13:51:18

вот взяла и сломалсь? просто так? это из разряда обновлений винды с топерей данных?

Да фиг знает, я имею в виду ситуацию, когда сдохло ПО, а данные живы и не требуется восстановления из бекапа.

Admin

ERROR: S client not available

Alexander

06.10.2018
13:51:28

лично у меня проблемы с высокой доступностью забикса...демон забикса какого хрена теряет сеть при переезде внутри гиперв кластера...хотя сам сервер доступен

Мак статика?

Alexander

06.10.2018
13:51:55

лично у меня проблемы с высокой доступностью забикса...демон забикса какого хрена теряет сеть при переезде внутри гиперв кластера...хотя сам сервер доступен

А решается как?

Kamil

06.10.2018
13:52:18

Мак статика?

ага, и ип забитый...я списал все на мою тупость в этом вопросе и забил. так как при проблемах он через лайф миграцию не передет и так

А решается как?

рестарт демона

Alexander

06.10.2018
13:52:49

лично у меня проблемы с высокой доступностью забикса...демон забикса какого хрена теряет сеть при переезде внутри гиперв кластера...хотя сам сервер доступен

Я больше не про жизнь заббикса на кластере гипервизоров, а про 2 сервера Заббикс и про 2 СУБД сервера

Alexander

06.10.2018
13:53:34

ага, и ип забитый...я списал все на мою тупость в этом вопросе и забил. так как при проблемах он через лайф миграцию не передет и так

Почему не переедет? У меня ВМ на CentOS 7.5 в кластере 2012 R2 нормально переезжают.

Kamil

06.10.2018
13:53:46

Я больше не про жизнь заббикса на кластере гипервизоров, а про 2 сервера Заббикс и про 2 СУБД сервера

ну субд уже есть вроде такие рещения, а забикс как я понимаю не умеет в высокую доступность проше несколько серверов с разными базами поднимать, и писать в них с двух агентов

Alexander

06.10.2018
13:53:46

рестарт демона

Кеш соединений

ну субд уже есть вроде такие рещения, а забикс как я понимаю не умеет в высокую доступность проше несколько серверов с разными базами поднимать, и писать в них с двух агентов

Это да. Я с этого и начал. С коробки не умеет. Аминь

Google

Kamil

06.10.2018
13:54:20

Почему не переедет? У меня ВМ на CentOS 7.5 в кластере 2012 R2 нормально переезжают.

в вм забикс?

Alexander

06.10.2018
13:54:25

Остальное - Обман

Alexander

06.10.2018
13:54:35

в вм забикс?

Нет. )

Alexander

06.10.2018
13:54:46

Почему не переедет? У меня ВМ на CentOS 7.5 в кластере 2012 R2 нормально переезжают.

Соединения не рвет?

Нет. )

Тю. Что ж ты этосамое

Kamil

06.10.2018
13:55:10

Нет. )

вот, сама ос то работает. хотя я особо не проверял...так как в линуховый только забикс

Alexander

06.10.2018
13:55:44

Не, я подумал, что вся ВМ становится по сети недоступна.

Kamil

06.10.2018
13:56:01

ладно забикс..система мониторинга...ебаная жопа один не умеет в высокую доступность нормально

Alexander

06.10.2018
13:56:04

вот, сама ос то работает. хотя я особо не проверял...так как в линуховый только забикс

Вопрос реализации соединений на сервере при переезде

ладно забикс..система мониторинга...ебаная жопа один не умеет в высокую доступность нормально

Бгг

Alexander

06.10.2018
13:56:33

ладно забикс..система мониторинга...ебаная жопа один не умеет в высокую доступность нормально

Я просто не понимаю, что он должен уметь делать из коробки по вашим обоюдным желаниям?

Kamil

06.10.2018
13:56:47

Не, я подумал, что вся ВМ становится по сети недоступна.

нее тут норм, терминалку даж не выкидывает

Alexander

06.10.2018
13:57:17

Я просто не понимаю, что он должен уметь делать из коробки по вашим обоюдным желаниям?

Масштабироваться по горизонтали на уровне сервера - очевидно

Alexander

06.10.2018
13:58:06

Но мы же всё равно говорим про какой-то кластер, да?

Alexander

06.10.2018
13:58:11

Но мы же всё равно говорим про какой-то кластер, да?

Да

Kamil

06.10.2018
13:58:19

Я просто не понимаю, что он должен уметь делать из коробки по вашим обоюдным желаниям?

у роутеров вроде есть такой режим..забыл как называется, когда они работают в паре, и при потере одного из роутеров, второй подхватывает клиентов незаметно для оных

Alexander

06.10.2018
13:59:04

у роутеров вроде есть такой режим..забыл как называется, когда они работают в паре, и при потере одного из роутеров, второй подхватывает клиентов незаметно для оных

https://www.freebsd.org/doc/handbook/carp.html

Как пример

Alexander

06.10.2018
13:59:18

Я не понимаю зачем пилить этот функционал самому, если есть Peacemaker и Linux HA.

Alexander

06.10.2018
14:00:16

Я не понимаю зачем пилить этот функционал самому, если есть Peacemaker и Linux HA.

Подумай

Не спеши

Посмотри на схемы заббикса. Посчитай сколько там кешей. И сделай выкл ему из розетки

Alexander

06.10.2018
14:03:20

Окей. Отходя от темы необходимости - это же наверняка практически невозможно реализовать после стольких лет работы системы. В смысле, такой функционал наверное надо при проектировании закладывать.

« Назад

Страница 1127 из 1183

Далее »

Открыть в Telegram