J
не совсем понимаю, вы не могли бы привести аргументы против
Но для начала надо понять как именно отдается хранилище виртуалкам. Что за хранилище, кстати? Из любопытства)
Михаил
Ну, gitlab использовали.
это те которые лежали день ?)
J
Там пиздец бутерброд. MS Azure в качестве хостинга. Поверх него натянуты виртуалки с цефом с 3х репликацией. В цефе настроен cephfs. И в нем они хранили вроде как бд и гит репозитоии.
Михаил
Если б день, лол)
а они рили цеф в вм держали?
J
И удивлялись чо так плохо работает)
J
Ага.
J
не совсем понимаю, вы не могли бы привести аргументы против
Ну так вот. Я vmware очень мало пользовался, потому не знаю как там оно работает. Ну типа по-умолчанию образы дисков хранятся в виде файлов же. А вот при подключении какого-нибудь энтерпрайзного хранилища - как? Виртуальным машинам напрямую LUN отдаются или ESXi их так же, эти тома форматирует под какую-то фс свою и на них хранит файлы-образы?
citius
>ESXi их так же, эти тома форматирует под какую-то фс свою и на них хранит файлы-образы? this
citius
VMFS называется
citius
луны напрямую то со стораджа можешь виртуалке прокинуть конечно, но это уже в обход всферы
J
А, ну вот.
J
>ESXi их так же, эти тома форматирует под какую-то фс свою и на них хранит файлы-образы? this
Поэтому идея и дерьмовая. Значит получается лишний уровень абстракции. OSD пишет в фс внутри виртуалки, все это транслируется в блочные операции, отправляется по сети хз как и пишется в файл на LUN, соответствено, файл этот на VMFS.
J
Какой-то такой, нехороший пирог получается.
dmitry
то есть вы имеете ввиду, что производительность проседает по большей части из-за скорости доступа к СХД?
Александр
То, что это будет наверняка медленно - одно. Но с чего это всё вдруг развалилось?
citius
всан юзают не только лишь все
dmitry
ну вопрос то в другом - имеет ли в этом случае делить канал на private/public network и как бы это лучше организовать =)
citius
это отдельная недешевая же фича, ну и спрашивали конкретно про внешний сторадж
citius
впрочем всан не особо и решает проблему бутерброда
J
А что в этом кардинально неправильного?
Неизвестно как в azure организовано хранилище. И неизвестно не работают ли виртуалки с цефом на одном хосте. Многократный оверхэд, задержки идут по пизде, сохранность данных из-за многослойных буферов и кэширования - тоже.
J
Там где нужна была сетевая фс ребята нагородили хз чо вообще.
citius
получается что сторадж отдает диски по iscsi, далее вмварь добавляет ФС, которая потом в виде файлов, но в блочном режиме уходит в виртуалки, которые потом еще свое там городят кто во что горазд.
J
То, что это будет наверняка медленно - одно. Но с чего это всё вдруг развалилось?
Развалилось не это) Они случайно сделали vacuum на основной базе. А бэкапы были только не очень свежие.
dmitry
А у кого-нибудь тут разваливался цеф без возможности восстановления данных?
dmitry
ну у меня пока только тестовая среда, я сейчас нагрузочное изобретаю
dmitry
попутно изучая метрики и добавляя их в мониторинг)
J
У клаудмаус, хехе.
Ну, он же не сам развалился)
Михаил
Ну, он же не сам развалился)
А никто не знает как он развалился
Anonymous
честно вам сказать из-за чего развалился?)
Anonymous
ибо сам даже смотрел их кластер и пытался помочь...
Anton
Расскажите
Anonymous
помнится мне, что тогда еще актуальная версия ceph'а была firefly. Но им жутно не нравилась его производительность.
Anonymous
ну они и обновились, на в то время, не стабильный hammer.
Anonymous
а когда пошли ошибки, то потом еще и обновились аж на master ветку
Anonymous
а у мастер ветки была проблема связанная с утечкой памяти, ну и при нехватке памяти на сервере(еще один баг) убились данные
Anonymous
и количество репликаций у них было 2.
Anonymous
хотя и количество репликации бы тут непомогли.
Anonymous
так что ceph там был не причем. банально админы накосячили, ну или их руководство
Mike
Т.е. обновляться нельзя @ даешь везде dumpling
J
и количество репликаций у них было 2.
Пиздели всем что у них 3х и 8 нод. Так запомнил)
J
Там еще какие-то историибыли про то как умудрились проебать все карты кластера какие можно. Твоя история, в общем то, похожа на то что я себе представлял)
J
Т.е. обновляться нельзя @ даешь везде dumpling
Обновлять нельзя все сразу и на нестабильную ветку)
Anonymous
так что ceph там был не причем. банально админы накосячили, ну или их руководство
ух как сурово, вот да. всегда интересовался, КАК у них это получилось
Anonymous
теперь в крякене и выше сто пудов туча багов с аллокацией памяти
Anonymous
уже проходили
Anonymous
есть в другом месте, не у меня
J
Там чо рассказывают то? На крякене печально пока, да?
Anonymous
ну в люминозе оно будет вроде как стабильным
Anonymous
у нас в проде пашет, но трясемся за данные (не сильно важный но продакшен, будет неприятно просрать архивные данные)
Mark ☢️
У мен крякен. Но без цеффс
Anonymous
были проблемы с аллокацией памяти, етц. вроде починили
Anonymous
у меня в проде крякен, на файлосторе
Mark ☢️
Все работает. Багов не видел. Утечки были но чот пропали сами собой
Anonymous
на мой взгляд, блюстор будет готов для прода через год
Mark ☢️
Без блюстора я юзаю
Anonymous
с файлостором мы никаких утечек не видели
Mark ☢️
Блюстар там сегфолтится. Вернее ассерт фейлится
J
Меня блюстор интересует)
Mark ☢️
Люминоус онли кароч для блюстора
J
Ну ладно, в ближайшие пару недель протестирую, может будет чего рассказать.
Anonymous
кто нибудь ssd кстати тестировал на блюсторе?
Mark ☢️
при ротации логов RocksDB?
Хз. Испугался. Дропнул к херам.
Anonymous
если да, то оно чинилось
Anonymous
но сцук стремно
Anonymous
@victor_chaplinsky fyi
Mark ☢️
Именно. Посмотри ченджлог в люминоусе по блюстору и охуей
Anonymous
хыыыыых
Anonymous
оно хотя бы форматно-совместимо?