Shaker
Владимир
Владимир
вы выбрали самый тупой вариант который есть у ZFS
Владимир
а теперь жалуетесь)
Alex
ну перед ним еще предбанник, условный, роутер запросов на эти ноды
Владимир
Владимир
Вы применили похоже все практики чтобы затормозить zfs))
Alex
пока не пересобрали по книжке и мудрым советам
Shaker
Ну, если ты сравниваешь zfs mirror и считаешь, что это лучшее, то я бы лучше выбрал ceph с EC 8:3 если у тебя несколько сотен дисков.
Shaker
по иопсам будет сильно хуже, латенси - хуже чем zfs
Shaker
Но когда у тебя сдохнет контроллер, то массив не ляжет.
Alex
Shaker
Владимир
Да, на одной хранилке включили, потом долго угорали, как оно тупит )))
1. пул собираете на mirror, никаких сложных рейдов
2. Подберите оптимальный размер блока и сжатие под ваш тип данных, предварительно потестируйтесь
3. Чем больше vdev в пуле тем производительнее
4. Ну и конечно нормальные диски, лучше всего если не HDD, а если уж HDD то хорошие + вынести slog устройство отдельно для увеличени производительности записи
5. есть ещё кеш l2arc но тут по обстоятельствам, он далеко не всегда нужен
6. Ну и конечно чем больше ОЗУ тем лучше, но в целом даже с малыми объёмами работает достойно
Shaker
Ребаланс под 500 гбит по кластеру , когда ноду вывели )
Shaker
Alex
Бохато жить не запретишь =)
Alex
тоды цеф хорошо вам ложится, видимо
Shaker
George
Alex
>3. Чем больше vdev в пуле тем производительнее
тут завит от нагрузки. больше vdev - больше рандом, больше дисков в одном vdev - больше сиквенс
Shaker
А мне диски с mirror под бэкапы жалко, экономика не сойдется. Если до 500 тер например, то вполне можно как ты пишешь. Дальше, нюансы.
Владимир
Владимир
Alex
Shaker
Alex
Alex
это не считая времени
Alex
время иногда дороже
Shaker
Alex
Ободи все хосты и замени там адаптеры еще. И проводочки. И обнови дрова. Ой, а что на фрю 11 этой карточки нет? ой как жаль, вы же переставить систему, да?
Shaker
Ну и еще, в zfs нам очень нравилось переливать с одного стора на другой сотни терабайт, чтобы дефрагментацию произвести, или места там добавить.
Alex
И у вас несколько сотен машин в двух дц. И 4 админа на всё =)
Shaker
Поэтому апгрейд стора длилс месяцами.
Shaker
Но в целом, zfs все равно очень хорошее решение. Но не для больших цельных массивов - меньше 120 дисков.
Shaker
Потому как у нас есть несколько "кэшей" на zfs, с nvme ( raidz ) на 100 tb и все очень хорошо. Но у них срок жизни год-два.
Roman
Shaker
Наша контора - нет, но есть знакомые геодезисты, пробовали его, плевались. Надо будет глянуть.
Shaker
У них zfs в люстре, это то еще решение. Но кстати, отличная ниша для zfs тоже.
Roman
Roman
Shaker
а чего плевались у сивида?
Сходу не вспомню точно, могу уточнить. Там важен был быстрый параллельный доступ для рассчетов. Как я понял, вопрос в скорости. Люстра с zfs оказалась самой быстрой, и это на их-то хламожелезе.
Shaker
Смотрели еще BeeGFS, вот она по скорости была в топе с люстрой.
Roman
lizardfs/moosefs - говно без fsync-а и через fuse
beegfs - у квапса разваливался
openafs - оно вообще живо? но признаю, не тестил
lustre - ну понятно что живо, но специфическая вроде вещь всё же и отказоустойчивость в ней встроенная зачаточная
gluster - не слышал положительных отзывов
gfs2, ocfs - для разделяемого блокдевайса
nfs - костыли
juicefs - поделка ещё смешнее чем geesefs
orangefs - тут тоже не тестил
Roman
из сдс чата😁
Shaker
Я в курсе, что там квапс смотрел )) Ну не осилил он beegfs, бывает. Пол года он под нагрузкой проработал, но это было с их платной поддержкой ( запуск и первое сопровождение ).
Shaker
В общем, если ближе к топику zfs. Строить цельные монолитные системы на zfs, с сотнями дисков в пуле, более опасно. Лучше использовать с макс 3 полками, и распихивать между ними данные, может как по аналогии с люстрой. Или своими "скриптами". Такое имхо.
Владимир
/report
Roman
Юрий
/report
Свет, выключайте свет, они лезут на него))
Shaker
Юрий
Владимир
Юрий
В итоге как победили растущий LCC?
idle3ctl -d /dev/sdX
При том в вики арча (п3.6.3) написано, что не рекомендуется. Почему не рекомендуется — не написано. Искал, спрашивал — нигде никто ничего не знает (может быть потому что Москва — порт 5 морей, хз)
Владимир
Юрий
Всё ещё, если честно, не уверен, не зря ли влез в эту историю...
George
Vladislav
Fedor
В нем сбои другого порядка
Fedor
Либо есть статус ок либо приемлемый, либо нет, и это распространяется на все данные
Vladislav
Пул-рейде, чтобы непоняток по терминологии не было
Vladislav
Vladislav
George
Вот так если делать
Мету скорее всего побили, протестить надо через поиск конкретных блоков файла через zdb и их обнуление
Vladislav
Владимир
Всем привет, а в zfs работает установка квот юзерам через
quota quotatool
есть такие пакеты, я когда-то давно ими управлял квотами пользователей
Быстрый гуглинг не дал плодов, решил тут спросить)
Vladislav
Владимир
Владимир
эти пакеты локальными и управляют))
Alex
Alex