Mark ☢️
# hdparm -i /dev/sda /dev/sda: Model=OCZ-TRION150, FwRev=SAFZ12.3, SerialNo=26MB31F9K1AU
Mark ☢️
Mark ☢️
вести с полей моего реалити-шоу, продолжаю издеваться над своим кластером. новые симптомы: 1) высокий cpu usage на osd, как мне кажется, не связан с репликацией. такой же высокий cpu usage наблюдается на osd, на которых нет pg, которые не active+clean, и сейчас osd, на которых недореплицированная pg не имеют такой аномально высокой нагрузки 2) я покрутил crush tunables в optimal и получил 76% misplaced данных. подождал сутки, почти все дореплицировалось, осталась одна PG, в которой 10к (всего в кластере 69М) объектов остались в misplaced. 3) очень, очень медленно эти 10к объектов рассасываются. собственно, свежие вопросы: 1) есть ли у вас, господа, долгий (десятки часов) хвост ребаланса? основная часть ребаланса у меня прошла на хорошей скорости (1-2 Гб/с), а оставшиеся несколько гигабайт данных переливаются десятки часов. 2) есть предположение, что такое поведение - это следствие какой-то кривизны в CRUSH. уважаемые мэтры, если вы видите здесь что-то неадекватное - скажите мне, пожалуйста. мне не нравится например строчка "device 36 device36", но ее удаление и перекомпиляция/загрузка крашмапы не удаляют упоминание. Ранее был osd 36, который по процедуре стандартно выкинули. crushmap: https://gist.github.com/spuzirev/362a2867e2f4db1f302d43e2d296308e ceph osd tree: https://gist.github.com/spuzirev/e8bbd1d4f7056876f76e3016ec3d6d3e ceph -s: https://gist.github.com/spuzirev/8559f4704ad696d3c300d9006ae004ff
что я заметил:
Mark ☢️
host ceph07
Mark ☢️
там нет OSD с именем device36
Mark ☢️
это раз. тоесть у тебя есть осд который сейчас ни в каком ни в хосте
Mark ☢️
root default
Sergei
Я потом раскурился, это норм после удаления осдшки
Mark ☢️
item ceph07 weight 16.366
Mark ☢️
item ceph06 weight 18.185
Mark ☢️
тоесть вес там поменьше (ну, это норма)
Sergei
Я вернул 36, все веса вровень, device36 стал нормальным. Проблема на месте.
Mark ☢️
высокий cpu usage на osd
Mark ☢️
на всех ?
Sergei
Нет, преходящее
Anonymous
сюда бы знакмого затащить
Anonymous
у него преокт был на ceph, точнее у redhat на 8 петабайт
Sergei
путем проб и ошибок с Марком обнаружили, что как-то неадекватно ведет себя rgw, создавая ненормальную нагрузку на небольшое количество PG. тем osd, которым не повезло хостить на себе эту PG просто не хватало ресурсов на бекфилл. прямо сейчас сразу после роллинг-рестарта всех rgw все полегчало. говорить о понимании рано, конечно. дождусь воспроизведения проблемы в неволе, наснимаю дампов и буду дальше подраскуривать. но хотя бы средство купирования нашли.
Mark ☢️
http://lists.ceph.com/pipermail/ceph-users-ceph.com/2015-June/002221.html
Mark ☢️
про снапшоты
Mark ☢️
http://lists.ceph.com/pipermail/ceph-users-ceph.com/2015-June/002224.html
Mark ☢️
And during this time CPU usage on all the OSDs spikes to 200%+
Mark ☢️
доставляет
Mark ☢️
Откатывание на снапшот кладёт нахер всё. подтверждаю
Mark ☢️
удаление вроде не стопит всё
Sergei
господа, скажите, существует ли возможность иметь часть нод на bluestore, а часть на старом привычном filestore?
Mark ☢️
да
Mark ☢️
стопроцентно
Mark ☢️
там типа абстракция.
Александр
Такс, ребят, подскажите по вопросу, а ноды должны быть стандартаризированны? В доке не нашёл что-то ответа на данный вопрос.
Александр
Т.е. конфигруация у меня будет следующая, вот только не знаю что делать со storage, менять ли там диски под схему или оставить всё как есть.
Александр
Александр
Т.е. прейти к форме 2ssd+4hdd соразмерные
Михаил
Ну если ноды одинаковые, то так удобнее
Александр
Вопрос про большой сторадж
Александр
Как его сделать
Михаил
Тогда забей
Александр
С этими то понятно
Александр
Одинаковые
Александр
Ладно подумаю под что использовать
Александр
Что-то кроме бэкапов у меня идей и нет больше(
Александр
Кстати, нашёл тут, что ceph рекомендует брать одинаковые процессоры(я про поколение(нашёл в кукбук по цефу))
Александр
Там несколько иначе написано, что типа, стоит воздержаться от применения разных поколений процессоров, производителей, а так же архитектур, во избежании проблем с миграцией и осложнением сопровождения.
Александр
Я точно не помню, занят пока что, потом найду цитату
Alexander
Кстати, нашёл тут, что ceph рекомендует брать одинаковые процессоры(я про поколение(нашёл в кукбук по цефу))
Под compute советуют или одинаковые процы использовать, или заморачиваться с cpu_model и cpu_mode=custom в nova.conf, чтобы не было проблем с миграцией из-за разных наборов инструкций процессоров
Anonymous
За какой год?
2014 например
Uncel
2014 например
https://bugzilla.redhat.com/show_bug.cgi?id=1397402
Uncel
И бонусом https://lwn.net/Articles/679289/
Polnoch
https://bugzilla.redhat.com/show_bug.cgi?id=1397402
Warning: No matches found for: scylladb
Polnoch
Его нет в официальных репах шапки
Polnoch
А то, чего нет в официальных репах, шапкой не поддерживается
Uncel
Warning: No matches found for: scylladb
Баг старого systemd
Polnoch
Баг старого systemd
они не отловили это на тестах, т.к. в их репозиториях этого пакета нет
Polnoch
собственно, это не является критичной проблемой, т.к. все остальные официальные пакеты работают же
Uncel
Солнцеликий починил https://github.com/systemd/systemd/issues/2632
Uncel
А redhat слегка так зажрался
Polnoch
я не знаю, ИМХО, проблемы есть везде. Субъективно с красношляпой их чуть меньше
Polnoch
хотя Ubuntu LTS тоже норм
Mark ☢️
ceph tell osd.3 bench
Mark ☢️
Вот такая команда позволила мне обнаружить проблему медленной линейной записи
Mark ☢️
на этом конкретном ноде был адски медленный ссд — при этой команде, он (как и HDD) в сто процентов
Mark ☢️
(пока писал эту фразу — подумал что там возможно идиотический контроллер)
Mark ☢️
И точно! так и есть — контроллер. а я-то думаю.... каждый диск отдельно отбенчил — всё в порядке, даже больше моих ожиданий. а вместе отбенчить — я не додумался
Mark ☢️
сраные макретолохи
Александр
Железный контроллер?
Roman
bus saturation?
Насыщение автобуса? :)
Александр
))
Mark ☢️
Насыщение автобуса? :)
пиздец смешно. Ну в общем — видимо да. используется контроллер который прям на метринке.
Mark ☢️
только блять какой шины ?
Mark ☢️
што конкретно ?
Александр
только блять какой шины ?
А сервер HP? Те что писал?
Mark ☢️
нет. на НР как раз всё ок. но там и ссд другой
Александр
Ну модель тогда матери
Mark ☢️
System Information Manufacturer: Gigabyte Technology Co., Ltd. Product Name: EG41MFT-US2H