J
А. Я на ZFS где-то кроме локалхоста скептически смотрю, честн осказать.
Михаил
больше секса с дебагом проблем вот в чем смысл этой схемы
J
Ну типа да. Дерьмовая схема, на мой неискушенный взгляд.
Mark ☢️
Sven
)))
J
Посоны, давайте вот какую норм тему подниму. Я не разбирался пока. Bluestore хоть для чего-то использует синхронную запись?
J
Типа там для WAL в RocksDB? Вроде нет, вроде только o_direct при записи используется.
Mark ☢️
не может быть, так или иначе синк долженбыть.. либо через O_SYNC/O_DSYNC либо через fsync()
J
Ну мож пояснит кто)
Sergei
только хотел ответить про статью, а срач уже убрали :(
Sergei
о нет, только не еще один чатик с теми же людьми
J
Лол)
Dmitry
А есть готовый образ для установки с флешки? Типа petasan.org, чтобы все зависимости по отдельности не тянуть в изолированной сети
Anonymous
Народ, подскажите плз, в OpenNebula при импорте обычных ВМ нужно таки создавать кучу persistent образов и ассоциировать каждый со своим шаблоном?
Anonymous
или я чего-то не понимаю?
Dmitry
Просто, может готовые есть? Чтоб велосипед не делать
Arkadiy
Михаил
http://onreader.mdl.ru/MasteringCeph/content/Ch03.html оно?
Александр
Там норм кстати написано, ты это зря
Александр
Имеено про цеф
Александр
Другие хз как, а вот именно MasteringCeph норм
Александр
Это скорее не пропуски, а не переведенные части
Mike
Что с этим azw3 делать?
Михаил
Arkadiy
Амазон Киндл же
Arkadiy
Через приложение открывается
Arkadiy
Можно онлайн сконыертироыать во все что угодно
Сергей Казенный
Подскажите, можно ли поменять у pg основную копию на другую? А то основная копия побилась и не восстанавливается, а гасить osd чтобы переехала очень долго.
J
Именно у одной pg?
J
Это делается не так обычно) Сносится битый экземпляр и копируетя с сервера где эта pg целая. А что, всю пг надо заменять? Может там несколько объектов всего битые?
J
pg repair не срабатывает?
Сергей Казенный
Несколько объектов только
Сергей Казенный
repair не срабатывает
Сергей Казенный
3
J
Реплика 2?
Надеюсь, нет) Идиотская ж идея.
Сергей Казенный
2 реплики совпадают
J
3
Ну тогда да, вручную проще всего удалить и скопировать из целой копии.
Mike
Шаманил с osd? Удалял и добавлял?
Сергей Казенный
Нода упала по питанию. После старта так.
Сергей Казенный
10.2.7
Сергей Казенный
Копирование живой копии не помогло. Что-то не так сделал? Погасил колечную osd, скопировал объект, поднял osd.
Сергей Казенный
В Ceph Best Practices Manual - Mirantis OpenStack Documentation пишут: Important: The repair process is very tricky when the primary copy is broken. Current repair behavior with replicated PGs is to copy the primary's data to the other nodes. This makes the Ceph cluster self-consistent, but might cause problems for consumers if the primary had the wrong data.
Сергей Казенный
Как-то не радует это.
J
А делал то все как в инструкции?
Сергей Казенный
да
J
Ну тогда удали просто к хренам целую копию и запусти заново.
J
Я имею ввиду, с поврежденного осд.
J
То есть, все то же самое, но вот как: Нашел проблемные объекты Забекапил на всякий случай Удалил. Слил журнал Запустил осд Запустил pg repair
J
Чот я тупанул и сам перечитав инструкцию понял что не надо было копировать ничо, а достаточно просто удалить было.
Mike
Troubleshooting PGs — Ceph Documentation http://docs.ceph.com/docs/master/rados/troubleshooting/troubleshooting-pg/
J
Да эт не надо, наеврное. Проблему ж уже нашли Неконсистентная PG, битые объекты на одном из OSD.
Mike
Можно сменить primary osd
Mike
Можно весь osd обозначить как lost
Mike
И удалить
J
Но зачем? Да и коллега писал что этого как раз пытается избежать.
Сергей Казенный
можно обозначить, но разливаться это будет сутки-другие
Сергей Казенный
хотелось быстрее
J
Ну так я ж говорю, сбил тебя. Битые копии с первичного осд удали просто и все Среплицируются с целых.
J
Чтоб не прослыть идиотом и пустозвоном скажу что в точно такой же ситуации три раз был и так делал.
Сергей Казенный
у вас основная копия билась или реплика?
J
И так и эдак бывало. С точки зрения ceph разницы никакой нет, по идее.
Сергей Казенный
вот не выходит никак
Сергей Казенный
не пересоздает удаленный объект
Сергей Казенный
хоть тресни =(
Сергей Казенный
Если разницы нет, то почему мирантис такие ужасы пишет?
J
А вот черт их знает. Ничего что я на "ты", кстати? Надеюсь, норм. Давай прям по порядку расскажи в подробностях, пожалуйста, как делаешь.
Сергей Казенный
На одном из объектов получилось совсем странно. У всех 3 копий md5 совпадает а объект считается inconsistent
J
Журнал еще есть, не забудь., leveldb еще где метаданные хранятся.
J
Поэтому и предлагается еще и журнал синхронизировать с filestore сначала, а после удаления проблемного объекта запускать pg recovery.
Сергей Казенный
Вот полная история одного из объектов: pg 14.ed is active+clean+inconsistent, acting [146,136,6] в логе: [ERR] : 14.ed shard 136: soid 14:b7771fab:::rbd_data.95fd9a12ae8944a.0000000000034c28:355c data_digest 0x307a236c != data_digest 0xd590df9b нашел объект на 3 нодах, md5 у всех трех совпадает
Сергей Казенный
у одного отличается дата
Сергей Казенный
но содержимое то совпадает, что ему не нравится?
J
Ну я ж выше написал, объект нетолько файл на диске, вот в чем беда.
J
Если вот так сделать: stop the OSD that has the wrong object responsible for that PG flush the journal (ceph-osd -i <id> —flush-journal) move the bad object to another location start the OSD again call ceph pg repair 17.1c1