Gleb
как s3 у кого-то сейчас в проде есть? там то хоть лучше чем с попытками использовать виртуальные машины поверх рбд?
Михаил
Gleb
надеюсь
Vlad
Можно и в него.
ceph это оверхед для s3. проще minio поставить. и быстрее будет.
Mark ☢️
Mark ☢️
Mark ☢️
Limits
As with Minio in stand-alone mode, distributed Minio has a per tenant limit of minimum 4 and maximum 16 drives (imposed by erasure code). This helps maintain simplicity and yet remain scalable. If you need a multiple tenant setup, you can easily spin multiple Minio instances managed by orchestration tools like Kubernetes.
Vlad
На каждый большой бакет приходится поднимать свой кластер. И сменить адрес ноды в кластере нельзя.
Vlad
Для очень больших кластеров ceph лучше.
Mark ☢️
Для маленьких походу тож не плохо. Мне нра. Я вобще с одного нода с 3 дисками начинал. Ыыыы
Mark ☢️
Крушмап недефолтный делал чтобы копии в рамках нода мог делать
Mark ☢️
А потом ноды добавил и поменял крушмап
Mark ☢️
Суксес, УМВР
Mark ☢️
Сколько iops?
Нуууу. Три нода. Журналы на ссд. 10 осд. Помойму в район пары тыщ получается. На пуле сайзом три. На пуле сайзом 1 сильно больше. Вангую я вобще не правильно мерял. Михаил грит что фио с рбдшным бакендом врёт
Vlad
Я тоже на живом кластере менял crushmap для организации второго ДЦ. Но пара тыщь для ssd кластера это очень мало.
Mark ☢️
Vlad
Там буквально пару лет назад read path был не выше 3000 iops, независимо от технологии стораджа.
Vlad
Mark ☢️
Потому что от выбора ключей критически зависит результат тестирования
Vlad
Блин, ну сейчас не охота рыться в списке рассылки ceph.
Vlad
Сравнивал, ха-ха. ceph с netapp. Диски одинаковые. У Ceph были существенно более высокие latency и iops меньше.
Mark ☢️
Vlad
Методика простая - в kvm запущена виртуалка. В ней запускается fio тест. Для ceph rbd, для netapp nfs. Для клтиента, виртуалки, условия одинаковые. И на чем лежит её диск ей одинаково.
Mark ☢️
А уж не включен ли у тебя кеш для нфса ? Fscache который
Mark ☢️
https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Storage_Administration_Guide/ch-fscache.html
Mark ☢️
Vlad
Объем тестируемых данных был конечно-же выше доступной гипервизору и тем более виртуалке памяти. Кеш тут не поможет.
Mark ☢️
Fio на блокдевайс натравлен или на файл в фс ?
Vlad
режим кеширования none
Vlad
Mark ☢️
Mark ☢️
Что в плане преаллокейта ?
Mark ☢️
Прост запись в непреаллокейченную область во всех системах тормознее
Михаил
Mark ☢️
На нфсе кстать какой формат то был ? Qcow2? Raw?
Vlad
Vlad
Mark ☢️
Vlad
?
только dd if=/dev/zero of=/dev/sdb
Mark ☢️
И он их в зависимости от настроек делает в спарсе-дырки
Vlad
Mark ☢️
Надо fallocate на файл сделать. Либо в нфсе если не работает то предварительно пртотереть файл с образом нулями
Mark ☢️
Mark ☢️
Ну и в цефе тож надо преаллоцировать. Тем же куему-имг
Vlad
ну фиг его знает, виртуалки на netapp работали существенно стабильнее и быстрее чем на ceph :)
Mark ☢️
Mark ☢️
Помойму это точно поливание говном необоснованное. У мну виртуалки переживали рестарт кластера и недобор кворума.
Михаил
Mark ☢️
Хм. Вобщето задержки в сети имеют критичноедля иопсов значение
Mark ☢️
Раунд трип тайм и все такое
Михаил
Михаил
Латенси в вм как минимум будет разным
Vlad
Vlad
может сам протокол оверхед даёт
Mark ☢️
https://www.keycodemedia.com/2017/01/01/fibre-channel-vs-ethernet-by-alex-grossman/
Alex
А как жить на стораджах с 36 дисками по 8Тб?
В стандартном рабочем режиме каждый демон osd потребляет около 512МВ RAM не зависимо от объема диска. При включении кэш тиринга osd входящие в кэш пул потребляют в районе 1GB RAM на каждый демон в рабочем режиме. А вот при аварии - там нужно смотреть, не факт что каждый демон начнёт кушать по гигу на терабайт. Все зависит от крашмапы.
А сколько вы нод с таким объемом ставить будете? И какую отказоустойчивость планируете? Потому что без этого сразу начнётся разговор, что "ceph говно"
Mark ☢️
Не, а внатуре, на что уходит столько памяти ?
Dmitry
Кстате да, хороший вопрос? Кэши?
Arkadiy
Память на ребаланс же
Mark ☢️
Роман
цефа не знаю, но сдаётся мне, для ускорения процесса ребаланса: единожды вгрузить в память побольше данных, ятобы поберечьь головы оставшихся дисков
Михаил
Михаил
интереса ради
Pavel
Sergei
Pavel
Михаил
Михаил
надо еще чем-нить проверить