Dimonyga
Через засвеченное волокно с другим трафиком, там порядка 150 мегабит. Для этого про VXLAN и подумываю.
Dimonyga
150 из гигабита
Dimonyga
теоретически, я же пока что могу не поднимать в другом ЦОД-е ceph, а через VXLAN пустить только qemu-rbd клиента .....
Dimonyga
думаю так будет лучше. утащить туда ненагруженные ВМ, должно проканать
Михаил
а итоговая цель разделения на два цода какая?
Dimonyga
переезд
Михаил
без простоя ес-но?
Dimonyga
угу
Михаил
кармическая ебля
почитай про rbd mirror
кластер на jewel?
Dimonyga
А вообще возможно краш рулет повешать не на пул а на образ ?
Dimonyga
да, джевел. мирор не канает, ибо загрузка сильно больше 50% и даже 70%. временного ничего нет
Михаил
((
Dimonyga
подумаю, расскажу потом как переехали
Михаил
да ты сюда пиши по ходу)
Dimonyga
=)
Михаил
200 гигов это же можно тупо бекап рестор
Dimonyga
ну щас пока VXLAN натяну и клиентов без нагрузки на диск потащу в новый ЦОД
Dimonyga
надо без даунтайма, ибо заморочей много.
Михаил
прям всех без даунтайма?
Михаил
может часть хотя бы перетащить ручками
Dimonyga
Не, но процентов 50 точно надо без него
Михаил
ну тогда да, видимо тащить весь кластер
Евгений
Dimonyga
из этих 200 гигабайт сотку отжирает mysql база, которую даунтаймить ваще нельзя
Dimonyga
Dimonyga
брррр ...... пойду накапаю себе. без поллитры не разобраться .....
Dimonyga
G72K
Dimonyga
а вот тут то вся и загвоздка. прокси нету. напрямую.
Dimonyga
Былаб прокся - переключился бы
G72K
ну так заведите
Dimonyga
Это требует ребута, а не хотелось бы, ибо после него система тупит минут 20 и пользователи поднимают панику.
G72K
у вашей базы 1 клиент? как вы его обновляете тогда? :)
Vyacheslav
ну время подгадать наверное можно
Dimonyga
1 - Зачем обновлять то, что работает годами ? 2 - система модульная, ядро редко требует каких-то шевелений, как правило обновляется переферия которая спокойно отночится к ребутам
Евгений
так, а какой профит от второго ДЦ тогда?
Dimonyga
переезд
Dimonyga
говорю же =)
Евгений
о как
Dimonyga
плавное перетаскивание с одного цода в другой
Vyacheslav
да нет проблем: в новогоднюю ночь всем пожелать добра в новом году, отрубить, снять дамп, перенести. Дешево и надежно.
Dimonyga
Vyacheslav
в любом случае лучше чем "вы знаете, ваша база разрушилась, дамп конечно есть, но что-то не поднимается, мы работаем над этим"
Михаил
а не лучше ли бд тащить через средства репликации бд?
Sn00part
Александр
Политота приди, да?
Mike
Почему из-за него, если не работает дозвон по сотовой сети до части номеров?
Mike
И причем тут ркн?
Vyacheslav
коллеги, мы здесь Ceph вообще-то обсуждаем
Mike
Mike
коллеги, мы здесь Ceph вообще-то обсуждаем
Давай так, что бы не уходить от тематики канала: у Мегафона упал ceph, поэтому упала сеть и массовые проблемы с дозвоном. Но про ceph они не признаются, но мы то знаем...
Mike
Тематика соблюдена? Можно продолжать про Мегафон?
Logan
нет, у них просто кривые руки. Не так давно пролетал пост с пикабу от одного из бывших технарей М. Там посокращали (прошу прощения - оптимизировали) технические группы)
Unsupported
у Мегафона падал ceph?
Unsupported
хм
Unsupported
господа, почему мониторов надо 3, а не, скажем, 9, на кластере из 10 нод?
Александр
Александр
Сколько хочешь
Александр
Не?
Unsupported
Я выше просто по тексту прочитал вопрос человек, который спрашивал про кластер из 4 нод и из 10 нод, ему сказали на рандомных 3х
Roman
https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0%9F%D0%B0%D0%BA%D1%81%D0%BE%D1%81
Roman
желательно, чтобы количество мониторов в кластере было нечётным числом для улучшения работы алгоритма Paxos при сохранении кворума.
Александр
Кворум нужен из нечётных а там пох вроде как
Unsupported
потому что я собираююсь 9 мониторов делать
Unsupported
10 нод с OSD, на 9 из них мониторы
Unsupported
кстати, не встречались с "зависанием" rgw?
В логе строчки
2017-06-13 00:01:15.402361 7fb333ebf700 0 ERROR: failed to clone shard, completion_mgr.get_next() returned ret=-125
В системном логе в этом время
июн 13 00:01:01 HOSTNAME radosgw[2444]: 2017-06-13 00:01:01.326362 7fb32feb7700 -1 received signal: Hangup from PID: 30998 task name: killall -q -1 ceph-m
(ротация логов)
Unsupported
после чего rgw только принимает соединения и не обрабатывет их никак
Unsupported
разбираться времени не было, рестартнул сервис
Sergei
Unsupported
почему?
Mike
Anonymous
почему?
кстати да. Да и зачем?
Unsupported
Потому что кроме osd, на этих серверах ещё будет один сервис сторонний и эти серверы будут собраны в пары для него
Unsupported
надеюсь по-русски выразился
Unsupported
и есть вероятность, что на той площадке возьмут и погасят половину серверов
Mike
Ты сначала ответь себе на вопрос, что ты получишь от 9-ти мониторов, вместо 3-х или 5-ти?
Unsupported