Dmitry
я обновляю - раза 2 уже обновлял
Dmitry
но внутри одной мажорной
Dmitry
можно попробовать то что чуваки пишут
Dmitry
By setting
osd pg max concurrent snap trims = 0
and noscrub and nodeep-scrub, the cluster was able to finish replicating and we have then re-added all down osd's again.
But these 3 parameters/flags need to remain set to prevent "random" OSD's to go down.
Dmitry
и поглядеть - не уйдет ли
Pavel
слушай
Pavel
хотел спросить
Pavel
нормально будет сейчас убивать снап?
Pavel
ceph osd pool rmsnap pool pool-snap
Pavel
таким вот образом
Pavel
видимо вся фигня именно из-за снапов и пошла
Dmitry
да - скорее всего
Dmitry
да
Pavel
626 requests are blocked > 32 sec
Pavel
омг
Pavel
2889 requests are blocked > 32 sec
Pavel
ОМГ
Dmitry
чорт
Pavel
12930 requests are blocked > 32 sec
Pavel
24624 requests are blocked > 32 sec
Pavel
пиздец
Михаил
а я смотрю ceph профи в этом чате нашлись
Dmitry
да если бы
Dmitry
тут похоже пиздец подкрался
Михаил
это была ирония сейчас)
Pavel
13384 requests are blocked > 32 sec
Михаил
пиздец
Pavel
стало конечно поменьше
Pavel
но пиздец
Dmitry
ну понятно
Dmitry
щас он грохнет их все же
Aleksandr
:(
Pavel
главное чтобы меня раньше не грохнули ;)
Aleksandr
БЕГИ
Михаил
тут то я точно продам фуру вазелина)
Dmitry
Dmitry
потом делаем как у чувака - osd pg max concurrent snap trims = 0
and noscrub and nodeep-scrub,
Dmitry
или osd disk threads = 0
Dmitry
и смотрим - как обновнять кластер
Pavel
ага
Pavel
ОТПУСТИЛО
Pavel
ЕГО ОТПУСТИЛО
Pavel
мужики, я курить
Pavel
много и яростно
SergeyB
тут и выпить не грех
Pavel
а потом правки
Pavel
проблема осталась
Dmitry
уф блеать
Pavel
а вот дичь с реквестами ушла
Pavel
всё отошёл
Dmitry
ну вот - теперь не грех и пятницу отпраздновать )) тем более мне уже можно начинать бухать за завтра ))
Pavel
рано ещё
Pavel
By setting
osd pg max concurrent snap trims = 0
and noscrub and nodeep-scrub, the cluster was able to finish replicating and we have then re-added all down osd's again.
But these 3 parameters/flags need to remain set to prevent "random" OSD's to go down.
Pavel
ушёл делать
Михаил
а расскажите
надо добавить 12 OSD. если добавить сразу 6, загнать им вес в 0 и постепенно повышать IOPS кластера просядет сильнее, чем если бы я добавлял по одной OSD и изменял им вес?
Pavel
короче
Pavel
внёс изменения
Pavel
упавшие осд не добавляются
Михаил
что пишут
Pavel
ща сойдётся
Pavel
и скажу логи
Pavel
лог пустой
Pavel
у этой OSD
Pavel
а вот
Pavel
дописал видимо
Pavel
http://dropmefiles.com/QYSZd
Михаил
хм, а если логи монитора глянуть
Михаил
или всего цефа
Pavel
у меня не пишет main.log кстати
Михаил
глупый вопрос. а что с местом? и оперативкой
Dmitry
та же херня в общем
Pavel
всех ресурсов с запасом раз в 5
Pavel
Так
Pavel
в общем вернулись на исходную
Pavel
только кластер стал работать ощутимо быстрее
Pavel
но проблемы с доступом к части инфы сохранились
Dmitry
надо подумать
Dmitry
снапшоты мы грохнули
Pavel
пойду логи мона смотреть