@devops_ru

« Назад

Страница 155 из 4568

Далее »

ptchol

17.05.2016
13:18:43

как в процессе копирования можно сломать базу ? может она уже сломана была ?

Evgeny

17.05.2016
13:18:56

винты 1Т, база весит 0,75Т

сжатие. Если у него первая версия движка то сжимая все что он дампит и копирует может в 400Гю влезть

Paul

17.05.2016
13:19:02

репейр нихера не ломает.

у меня сломал один раз. Потер данные

ptchol

17.05.2016
13:19:22

_картинка дауни младшего закатывающего глаза_

Google

Paul

17.05.2016
13:19:34

как в процессе копирования можно сломать базу ? может она уже сломана была ?

если там один диск - то его могли просто покрошить физически. Особенно, если он SAS

Alex

17.05.2016
13:19:44

Омг да драма

ptchol

17.05.2016
13:19:49

и причем тут репейр ?

Evgeny

17.05.2016
13:19:49

как в процессе копирования можно сломать базу ? может она уже сломана была ?

после анклин шатдауна с вылетом батарейки на рейде (напряжение в ДЦ скакануло до 480) востсановление базы восстановило ее с другими _id

Alex

17.05.2016
13:19:57

Лепра лавс да драма

ptchol

17.05.2016
13:20:00

правильно

выкиньте нахуй свои рейды с батарейками

=)

Evgeny

17.05.2016
13:20:17

Уже :)

Roman

17.05.2016
13:20:27

выкиньте нахуй свои рейды с батарейками

шутник.

ptchol

17.05.2016
13:20:48

вы бы еще сказали "я уранил винт когда ставил в другой сервак" а потом репейр не смог восстановить мои данные.

Paul

17.05.2016
13:21:00

и причем тут репейр ?

давайте не путать кислое с длинным, ок? История моя с репейром - это одно, а расколотый диск - совсем другое. У меня репейр в базе потерял небольшой кусочек данных, что-то порядка 2 гиг. Это было сырье, так что никто, в общем-то, не обидился

ptchol

17.05.2016
13:21:29

а зачем вы после одного в качестве примера приводите другое ? )

Google

Evgeny

17.05.2016
13:21:44

вы бы еще сказали "я уранил винт когда ставил в другой сервак" а потом репейр не смог восстановить мои данные.

ну суть проблемы в том что мы хз почему у него не корректная база. это может быть сыпящийся винт, может что-то еще. anyway сначала лучше сделать копию на другой диск

ptchol

17.05.2016
13:21:57

именно !

Paul

17.05.2016
13:22:21

а зачем вы после одного в качестве примера приводите другое ? )

я не привожу пример :) я только рекомендую ПЕРЕД repair сделать копию базы на случай, если этот repair что-то где-то поломает. Если не поломает - выдыхаем и удаляем спокойно копию

ptchol

17.05.2016
13:22:25

я и предлагаю на тот сервак на который репликацию пытается восстновить запустить атм mongodump

он все равно не сможет сделать его. места не хватит

это первое.

Evgeny

17.05.2016
13:23:06

именно !

Упс, я вдруг пролистал выше и понял что ва не мне на предложение сначала скопировать потом чинить отвечали, прошу прощения

Paul

17.05.2016
13:23:08

я писал о том же самом

процитировать мое старое сообщение?

ptchol

17.05.2016
13:23:16

возможно ему для начала помог бы compact а потом repair

Paul

17.05.2016
13:23:23

дамп, стоп, рипейр

James

17.05.2016
13:23:23

да там диск sas

ptchol

17.05.2016
13:23:31

но у него баз много, и пусть он сам считает сможет ли ему компакт что покампактить ))

James

17.05.2016
13:23:34

но на днях проверяли там по дискам всё норм

Evgeny

17.05.2016
13:23:34

он все равно не сможет сделать его. места не хватит

Да почему? Делать дамп в аутпут который потом сжимать на лету перед записью

Paul

17.05.2016
13:23:42

да там диск sas

выкинь нафиг. У меня полка с SAS-дисками была, они мрут раз в месяц

Да почему? Делать дамп в аутпут который потом сжимать на лету перед записью

repair не сможет. Нужно 2х места

Evgeny

17.05.2016
13:24:24

Я про копию и дамп в соседний сервер

ptchol

17.05.2016
13:24:54

Да почему? Делать дамп в аутпут который потом сжимать на лету перед записью

потому что это встроенная функция которая требует х2 места. Вы наверно хотите сказать что она ничем не отличается от dump\restore но мы и пытаемся попросить его это сделать )

пока что первую половину )

Google

Evgeny

17.05.2016
13:25:09

Я не про репейр

Paul

17.05.2016
13:26:05

Я не про репейр

так не получится-то рипейр. Дамп на соседнюю машину просто

ptchol

17.05.2016
13:26:42

спокуха. все все поняли. человек молчит видимо гуглит как запустить монгодамп с соседней тачки либо делает уже )

Evgeny

17.05.2016
13:27:05

Я предлагаю сделать на соседнюю машину дамп и копию. Потом, коль скоро дамп пройдет, можно либо пробовать (ну вдруг кому-то хочется) делать репейр либо просто накатить обратно сразу со сменой движка на wt

Paul

17.05.2016
13:27:15

ну или морально готовится...

ptchol

17.05.2016
13:27:46

Я предлагаю сделать на соседнюю машину дамп и копию. Потом, коль скоро дамп пройдет, можно либо пробовать (ну вдруг кому-то хочется) делать репейр либо просто накатить обратно сразу со сменой движка на wt

а мотом долбать мозг себе, как же дифф накатить да ? )

потому что волы мы писать человечески не можем.

Paul

17.05.2016
13:28:01

Я предлагаю сделать на соседнюю машину дамп и копию. Потом, коль скоро дамп пройдет, можно либо пробовать (ну вдруг кому-то хочется) делать репейр либо просто накатить обратно сразу со сменой движка на wt

очень медленно. Проще сделать slave на WiredTiger, сделать его мастером и поменять движок на бывшем master - получим master + slave на wired tiger

Evgeny

17.05.2016
13:28:30

потому что волы мы писать человечески не можем.

Волы?

ptchol

17.05.2016
13:28:55

WAL

oplog

Evgeny

17.05.2016
13:29:19

очень медленно. Проще сделать slave на WiredTiger, сделать его мастером и поменять движок на бывшем master - получим master + slave на wired tiger

ИМХО за 6 часов (проскакивала эта цифра) можно было сделать это

Evgeny

17.05.2016
13:30:00

WAL

Я б сначала остановил прод ну или запланиовал все на ночь когда можно остановить

ptchol

17.05.2016
13:31:57

ну классно если им так можно, но обычно так нельзя. Или там могла быть история типа "мы возьмем монгу, сможем между разными инстансами базы переключаться в любой момент" и все такое )

Dmitry

17.05.2016
13:32:41

о

тут тоже репликация

Evgeny

17.05.2016
13:33:23

Мне сейчас кажется что визави попал в ситуацию когда у него не понимается слейв и так или иначе прод работает не штатно. Если совсем не останавливать для починки можно попасть в ситуацию полной неконсистентности и тоже будет не хорошо.

James

17.05.2016
13:35:53

коллеги спасибо за советы

Paul

17.05.2016
13:36:14

Мне сейчас кажется что визави попал в ситуацию когда у него не понимается слейв и так или иначе прод работает не штатно. Если совсем не останавливать для починки можно попасть в ситуацию полной неконсистентности и тоже будет не хорошо.

выше он приводил ошибку. Она с большой вероятностью указывает на битые файлы базы, из которых наш визави, видимо, просто не читает данные при штатном фунцкионировании системы. При дампе и репликации данные будут прочитаны везде и это вызывает падение сервереа

James

17.05.2016
13:36:18

прод останавливать нельзя даже ночью

Google

James

17.05.2016
13:36:29

там вот человек писал

Dmitry

17.05.2016
13:36:44

вот я тоже спрошу. Есть мускул М-S репликация(RBR+GTID). Происходит какая-то мистика - SHOW SLAVE STATUS показывает что репликация идет, но

James

17.05.2016
13:36:47

[In reply to Evgeny Kruglov] очень медленно. Проще сделать slave на WiredTiger, сделать его мастером и поменять движок на бывшем master - получим master + slave на wired tiger

вот это интерестно

Dmitry

17.05.2016
13:37:00

1) внезапно скачет seconds behind master

James

17.05.2016
13:37:16

связь?

Dmitry

17.05.2016
13:37:21

2) на мастере пропадает SLAVE HOST и из процессов выпадает репликация

Evgeny

17.05.2016
13:37:23

вот это интерестно

Если слейв не собирается тк мастер падает?

James

17.05.2016
13:37:47

на сервере с мастером забивается кеш память

Admin

ERROR: S client not available

James

17.05.2016
13:37:58

я пока другой причины не вижу

Dmitry

17.05.2016
13:38:16

3) в логах жесть типа 2016-05-17T13:28:32.198251Z 11 [Note] Slave SQL thread for channel '' initialized, starting replication in log 'mysql-bin.000024' at position 495266629, relay log '/var/log/mysql/slave-relay-bin.000129' position: 4 2016-05-17T13:28:32.210972Z 10 [Note] Slave I/O thread for channel '': connected to master 'user@dhost:3306',replication started in log 'mysql-bin.000024' at position 495266629

James

17.05.2016
13:38:25

как только доходит до 100% тут же падает мастер

Dmitry

17.05.2016
13:38:41

2й день голову ломаю (

ptchol

17.05.2016
13:39:00

на сервере с мастером забивается кеш память

совпадение)

Dmitry

17.05.2016
13:39:17

http://dl.dropbox.com/u/12617456/Selection_122.png на заббиксе лаг выглядит так

и да, тестоый апдейт не доезжает

James

17.05.2016
13:40:22

не думаю

в общем если сегодня ничего не нарулю, завтра буду пробовать сделать дамп на слейв

посмотрим

Google

James

17.05.2016
13:41:00

что из этого получится

http://dl.dropbox.com/u/12617456/Selection_122.png на заббиксе лаг выглядит так

попробуй свой вопрс задать в тематической группе

Slava

17.05.2016
13:47:45

http://risovach.ru/kartinka/9970372

Paul

17.05.2016
13:54:43

прод останавливать нельзя даже ночью

у вас два варианта - вы выбираете время, останавливаете прод и чините базу ИЛИ повреждения базы распространяются дальше, вы теряете данные и лишаетесь прода в непредсказуемый момент. Выбирать - вам. Время играет против вас

James

17.05.2016
13:55:18

откуда уверенность что нужно чинить?

Paul

17.05.2016
13:55:56

откуда уверенность что нужно чинить?

мы это обсуждали выше. У вас падает тред из-за невозможности чтения файла базы. Скорее всего это означает повреждения файлов базы.

Leonov

17.05.2016
13:56:05

а вы не пробовали выключить и включить?

James

17.05.2016
13:56:22

повторюсь что падает когда становиться 100% памяти

Paul

17.05.2016
13:56:27

а вы не пробовали выключить и включить?

нельзя, писали же. 5х9 на одном сервере

James

17.05.2016
13:56:28

нет не пробовал

Leonov

17.05.2016
13:57:20

это отсылка

Андрей

17.05.2016
14:15:23

Всем привет. Подскажите плиз ключевые слова для гугления, чтобы решить задачу: есть сервис на Python + Postgresql. Надо сделать второй сервер аналогичный и фронтенд перед ними поставить, чтобы в случае падения основного сервера фронтенд переключался на второй сервер. Запросы к серверу не http, просто tcp. Я так понимаю, что на Postgresql надо реплику настроить. Но вот как подойти к задаче, по распределению запросов к бэкэнду не совсем понимаю. Какой для этого софт использовать? И можно ли на Postgresql настроить Master - Master репликацию или на балансировщик прикрутить скрипт, который будет переключать базу из slave в мастер? Как правильней?

Чутка уточню: фронтенд просто пробрасывать пакеты должен и понимать, когда один из серверов ложится, чтобы предпринять какие-то действия

Taviscaron

17.05.2016
14:18:23

haproxy

ptchol

17.05.2016
14:19:40

и bdr ))

Андрей

17.05.2016
14:21:40

bdr норм в целом будет работать? (при условии, что я вдумчиво прочитаю документацию). Подводных камней никаких на практике не встречалось?

Andrey

17.05.2016
14:25:48

pgpool для балансировки

и стриминг реплику

с фейловером

Андрей

17.05.2016
14:34:25

Я правильно понял, pgpool использовать в случае если сам сервис будет на фронтенде, а на бэкэндах чисто Postgresql? В случае же с haproxy сервис остаётся на бэкэндах вместе с базой и тогда уже ключевое слово для гугления - bdr?

Sergey

17.05.2016
14:36:41

ребят, приветствую а никто youtrack и gitlab не интегрировал? что за сертификат он просит?

Открыть в Telegram