@devops_ru

Страница 155 из 4568
ptchol
17.05.2016
13:18:43
как в процессе копирования можно сломать базу ? может она уже сломана была ?

Evgeny
17.05.2016
13:18:56
винты 1Т, база весит 0,75Т
сжатие. Если у него первая версия движка то сжимая все что он дампит и копирует может в 400Гю влезть

Paul
17.05.2016
13:19:02
репейр нихера не ломает.
у меня сломал один раз. Потер данные

ptchol
17.05.2016
13:19:22
_картинка дауни младшего закатывающего глаза_

Google
Paul
17.05.2016
13:19:34
как в процессе копирования можно сломать базу ? может она уже сломана была ?
если там один диск - то его могли просто покрошить физически. Особенно, если он SAS

Alex
17.05.2016
13:19:44
Омг да драма

ptchol
17.05.2016
13:19:49
и причем тут репейр ?

Evgeny
17.05.2016
13:19:49
как в процессе копирования можно сломать базу ? может она уже сломана была ?
после анклин шатдауна с вылетом батарейки на рейде (напряжение в ДЦ скакануло до 480) востсановление базы восстановило ее с другими _id

Alex
17.05.2016
13:19:57
Лепра лавс да драма

ptchol
17.05.2016
13:20:00
правильно

выкиньте нахуй свои рейды с батарейками

=)

Evgeny
17.05.2016
13:20:17
Уже :)

ptchol
17.05.2016
13:20:48
вы бы еще сказали "я уранил винт когда ставил в другой сервак" а потом репейр не смог восстановить мои данные.

Paul
17.05.2016
13:21:00
и причем тут репейр ?
давайте не путать кислое с длинным, ок? История моя с репейром - это одно, а расколотый диск - совсем другое. У меня репейр в базе потерял небольшой кусочек данных, что-то порядка 2 гиг. Это было сырье, так что никто, в общем-то, не обидился

ptchol
17.05.2016
13:21:29
а зачем вы после одного в качестве примера приводите другое ? )

Google
Evgeny
17.05.2016
13:21:44
вы бы еще сказали "я уранил винт когда ставил в другой сервак" а потом репейр не смог восстановить мои данные.
ну суть проблемы в том что мы хз почему у него не корректная база. это может быть сыпящийся винт, может что-то еще. anyway сначала лучше сделать копию на другой диск

ptchol
17.05.2016
13:21:57
именно !

Paul
17.05.2016
13:22:21
а зачем вы после одного в качестве примера приводите другое ? )
я не привожу пример :) я только рекомендую ПЕРЕД repair сделать копию базы на случай, если этот repair что-то где-то поломает. Если не поломает - выдыхаем и удаляем спокойно копию

ptchol
17.05.2016
13:22:25
я и предлагаю на тот сервак на который репликацию пытается восстновить запустить атм mongodump

он все равно не сможет сделать его. места не хватит

это первое.

Evgeny
17.05.2016
13:23:06
именно !
Упс, я вдруг пролистал выше и понял что ва не мне на предложение сначала скопировать потом чинить отвечали, прошу прощения

Paul
17.05.2016
13:23:08
я писал о том же самом

процитировать мое старое сообщение?

ptchol
17.05.2016
13:23:16
возможно ему для начала помог бы compact а потом repair

Paul
17.05.2016
13:23:23
дамп, стоп, рипейр

James
17.05.2016
13:23:23
да там диск sas

ptchol
17.05.2016
13:23:31
но у него баз много, и пусть он сам считает сможет ли ему компакт что покампактить ))

James
17.05.2016
13:23:34
но на днях проверяли там по дискам всё норм

Evgeny
17.05.2016
13:23:34
он все равно не сможет сделать его. места не хватит
Да почему? Делать дамп в аутпут который потом сжимать на лету перед записью

Paul
17.05.2016
13:23:42
да там диск sas
выкинь нафиг. У меня полка с SAS-дисками была, они мрут раз в месяц

Evgeny
17.05.2016
13:24:24
Я про копию и дамп в соседний сервер

ptchol
17.05.2016
13:24:54
Да почему? Делать дамп в аутпут который потом сжимать на лету перед записью
потому что это встроенная функция которая требует х2 места. Вы наверно хотите сказать что она ничем не отличается от dump\restore но мы и пытаемся попросить его это сделать )

пока что первую половину )

Google
Evgeny
17.05.2016
13:25:09
Я не про репейр

Paul
17.05.2016
13:26:05
Я не про репейр
так не получится-то рипейр. Дамп на соседнюю машину просто

ptchol
17.05.2016
13:26:42
спокуха. все все поняли. человек молчит видимо гуглит как запустить монгодамп с соседней тачки либо делает уже )

Evgeny
17.05.2016
13:27:05
Я предлагаю сделать на соседнюю машину дамп и копию. Потом, коль скоро дамп пройдет, можно либо пробовать (ну вдруг кому-то хочется) делать репейр либо просто накатить обратно сразу со сменой движка на wt

Paul
17.05.2016
13:27:15
ну или морально готовится...

Paul
17.05.2016
13:28:01
ptchol
17.05.2016
13:28:55
WAL

oplog

Evgeny
17.05.2016
13:30:00
WAL
Я б сначала остановил прод ну или запланиовал все на ночь когда можно остановить

ptchol
17.05.2016
13:31:57
ну классно если им так можно, но обычно так нельзя. Или там могла быть история типа "мы возьмем монгу, сможем между разными инстансами базы переключаться в любой момент" и все такое )

Dmitry
17.05.2016
13:32:41
о

тут тоже репликация

Evgeny
17.05.2016
13:33:23
Мне сейчас кажется что визави попал в ситуацию когда у него не понимается слейв и так или иначе прод работает не штатно. Если совсем не останавливать для починки можно попасть в ситуацию полной неконсистентности и тоже будет не хорошо.

James
17.05.2016
13:35:53
коллеги спасибо за советы

Paul
17.05.2016
13:36:14
Мне сейчас кажется что визави попал в ситуацию когда у него не понимается слейв и так или иначе прод работает не штатно. Если совсем не останавливать для починки можно попасть в ситуацию полной неконсистентности и тоже будет не хорошо.
выше он приводил ошибку. Она с большой вероятностью указывает на битые файлы базы, из которых наш визави, видимо, просто не читает данные при штатном фунцкионировании системы. При дампе и репликации данные будут прочитаны везде и это вызывает падение сервереа

James
17.05.2016
13:36:18
прод останавливать нельзя даже ночью

Google
James
17.05.2016
13:36:29
там вот человек писал

Dmitry
17.05.2016
13:36:44
вот я тоже спрошу. Есть мускул М-S репликация(RBR+GTID). Происходит какая-то мистика - SHOW SLAVE STATUS показывает что репликация идет, но

James
17.05.2016
13:36:47
[In reply to Evgeny Kruglov] очень медленно. Проще сделать slave на WiredTiger, сделать его мастером и поменять движок на бывшем master - получим master + slave на wired tiger

вот это интерестно

Dmitry
17.05.2016
13:37:00
1) внезапно скачет seconds behind master

James
17.05.2016
13:37:16
связь?

Dmitry
17.05.2016
13:37:21
2) на мастере пропадает SLAVE HOST и из процессов выпадает репликация

Evgeny
17.05.2016
13:37:23
вот это интерестно
Если слейв не собирается тк мастер падает?

James
17.05.2016
13:37:47
на сервере с мастером забивается кеш память

Admin
ERROR: S client not available

James
17.05.2016
13:37:58
я пока другой причины не вижу

Dmitry
17.05.2016
13:38:16
3) в логах жесть типа 2016-05-17T13:28:32.198251Z 11 [Note] Slave SQL thread for channel '' initialized, starting replication in log 'mysql-bin.000024' at position 495266629, relay log '/var/log/mysql/slave-relay-bin.000129' position: 4 2016-05-17T13:28:32.210972Z 10 [Note] Slave I/O thread for channel '': connected to master 'user@dhost:3306',replication started in log 'mysql-bin.000024' at position 495266629

James
17.05.2016
13:38:25
как только доходит до 100% тут же падает мастер

Dmitry
17.05.2016
13:38:41
2й день голову ломаю (

Dmitry
17.05.2016
13:39:17
http://dl.dropbox.com/u/12617456/Selection_122.png на заббиксе лаг выглядит так

и да, тестоый апдейт не доезжает

James
17.05.2016
13:40:22
не думаю

в общем если сегодня ничего не нарулю, завтра буду пробовать сделать дамп на слейв

посмотрим

Google
James
17.05.2016
13:41:00
что из этого получится

http://dl.dropbox.com/u/12617456/Selection_122.png на заббиксе лаг выглядит так
попробуй свой вопрс задать в тематической группе

Slava
17.05.2016
13:47:45
http://risovach.ru/kartinka/9970372

Paul
17.05.2016
13:54:43
прод останавливать нельзя даже ночью
у вас два варианта - вы выбираете время, останавливаете прод и чините базу ИЛИ повреждения базы распространяются дальше, вы теряете данные и лишаетесь прода в непредсказуемый момент. Выбирать - вам. Время играет против вас

James
17.05.2016
13:55:18
откуда уверенность что нужно чинить?

Paul
17.05.2016
13:55:56
откуда уверенность что нужно чинить?
мы это обсуждали выше. У вас падает тред из-за невозможности чтения файла базы. Скорее всего это означает повреждения файлов базы.

Leonov
17.05.2016
13:56:05
а вы не пробовали выключить и включить?

James
17.05.2016
13:56:22
повторюсь что падает когда становиться 100% памяти

Paul
17.05.2016
13:56:27
а вы не пробовали выключить и включить?
нельзя, писали же. 5х9 на одном сервере

James
17.05.2016
13:56:28
нет не пробовал

Leonov
17.05.2016
13:57:20
это отсылка

Андрей
17.05.2016
14:15:23
Всем привет. Подскажите плиз ключевые слова для гугления, чтобы решить задачу: есть сервис на Python + Postgresql. Надо сделать второй сервер аналогичный и фронтенд перед ними поставить, чтобы в случае падения основного сервера фронтенд переключался на второй сервер. Запросы к серверу не http, просто tcp. Я так понимаю, что на Postgresql надо реплику настроить. Но вот как подойти к задаче, по распределению запросов к бэкэнду не совсем понимаю. Какой для этого софт использовать? И можно ли на Postgresql настроить Master - Master репликацию или на балансировщик прикрутить скрипт, который будет переключать базу из slave в мастер? Как правильней?

Чутка уточню: фронтенд просто пробрасывать пакеты должен и понимать, когда один из серверов ложится, чтобы предпринять какие-то действия

Taviscaron
17.05.2016
14:18:23
haproxy

ptchol
17.05.2016
14:19:40
и bdr ))

Андрей
17.05.2016
14:21:40
bdr норм в целом будет работать? (при условии, что я вдумчиво прочитаю документацию). Подводных камней никаких на практике не встречалось?

Andrey
17.05.2016
14:25:48
pgpool для балансировки

и стриминг реплику

с фейловером

Андрей
17.05.2016
14:34:25
Я правильно понял, pgpool использовать в случае если сам сервис будет на фронтенде, а на бэкэндах чисто Postgresql? В случае же с haproxy сервис остаётся на бэкэндах вместе с базой и тогда уже ключевое слово для гугления - bdr?

Sergey
17.05.2016
14:36:41
ребят, приветствую а никто youtrack и gitlab не интегрировал? что за сертификат он просит?

от чего?

Страница 155 из 4568