Ivan
Хотя может быть я борщу. При чтении из такого пула мелкими блоками (например 1М) скорость будет сильно меньше, верно ?
Ivan
как могут повлиять сами данные ?
Vladimir
ээ, ну ФС хранит данные...
Vladimir
если у вас будет много мелких - от больших блоков будет только вред, если много больших файлов и линейная запись (бекапы какие-нибудь) то стоит потестить большие блоки, да
George
По дефолту макс 1м, до 16 руками выкручивается
Ivan
спасибо, почитаю
George
нет, не в курсе про него )
https://openzfs.github.io/openzfs-docs/Performance%20and%20Tuning/ZFS%20on%20Linux%20Module%20Parameters.html#zfs-max-recordsize
Ivan
в основном большой скорости работы и не ожидаю. это массив для хранения музыки,фильмов,фоток. в таком случае чем больше recordsize, тем лучше ?
George
Ну и понимайте кейс 16м рекордсайза, он улучшит эффективность хранения но латенси будет хуже чем у 1м того же
George
в основном большой скорости работы и не ожидаю. это массив для хранения музыки,фильмов,фоток. в таком случае чем больше recordsize, тем лучше ?
я себе 16м ставил на фотки точно, и сжатие включал, если не смогло сжать оно запишет не сжатым
Ivan
на форумах за 2018-2019 года писали что там что-то непонятное со стабильностью на таком размере. сейчас всё ок ? планирую пользоваться zfs send на этом пуле.
George
Ну и последний блок со сжатием не будет всегда 16м)
Ivan
это понятно, да.
Ivan
https://gist.github.com/fling-/c66bf1e4a082b5cf9cd4d1106fe6e2bc к примеру такое. возможно ужет закрыт этот issue, я особо не разбирался. решил узнать мнение пользующихся.
Ivan
просто попутно по моей ошибке прочитал.
George
У меня проблем не было, но я не особо часто send recv делаю
Ivan
ок, спасибо.
Сергей
в основном большой скорости работы и не ожидаю. это массив для хранения музыки,фильмов,фоток. в таком случае чем больше recordsize, тем лучше ?
чем больше рекордсайз тем больше будет а) компрессия и б) потоковые чтение/запись. Но я сомневаюсь что на современных алгортимах компрессии фото и видео можно ещё что-то выжать дополнительно. Пул будет работаь на постоянную раздачу или это своего рода "длительное хранение личных фото"?
Алексей
Хотя бы zle по-любому надо включить
Сергей
Георгий, а что за латенси?
задержка при операциях записи. Представьте - сколько времени нужно чтобы сжать блок в 128кб или в 16мб? вот на каждую операцию записи будет "вызываться" подсистема сжатия, которая попробует сжать записываемые данные. При записи разреженных данных коэф. компрессии будет на 16Мб конечно лучше чем на 128. Но какой ценой)
Алексей
Ясно, спасибо
Алексей
Хотя с другой стороны, какая разница если надо сжать 100мб?
Сергей
Хотя с другой стороны, какая разница если надо сжать 100мб?
ну если 100 и один раз, то разницы не будет конечно заметно. А если постоянно писать сжатое видео 24/7 в пул с рекордсайз=16М, то наверное это будет неайс))
Алексей
Я как раз сейчас тестирую сжатие и прочие вещи на предмет насколько это все лучше или хуже, и сколько можно сэкономить места, да и вообще влияет ли это на латенси
Алексей
И если влияет, то в какую сторону
Алексей
И, самое главное, как деградирует скорость записи при заполнении пула, на каком уровне деградация настолько велика, что становится уже неприемлемо
Алексей
Вот и посмотрим
Алексей
С меня аналитический отчёт
Сергей
есть вот такая штука, может пригодится: http://www.brendangregg.com/blog/2014-07-16/iosnoop-for-linux.html
Сергей
И вот такая: https://github.com/koct9i/ioping
Алексей
Интересно, посмотрю, спасибо
Д
ну так и превратите один из блейдов на каждом шасси в NAS, который будет отдавать общее хранилище в кластер. А между собой эти NAS можно синхронизировать. Я выше ссылку давал ZFS HA
Добрый день все обдумываю, получается я могу одну ноду, на каждом шасси сделать хранилищем? И HA будет работать? не понятно ведь эти NAS по сути разные будут , то естьв этом варианте получается именно синхронизация? полноценно машина не перебежит же, на второй нас в другом шасси? да и в одном шасси всего 6 дисков вставить можно, кажется маловато будет.
Сергей
Добрый день все обдумываю, получается я могу одну ноду, на каждом шасси сделать хранилищем? И HA будет работать? не понятно ведь эти NAS по сути разные будут , то естьв этом варианте получается именно синхронизация? полноценно машина не перебежит же, на второй нас в другом шасси? да и в одном шасси всего 6 дисков вставить можно, кажется маловато будет.
добрый день. Речь про HA для ВМ или про HA для хранилища? HA для хранилища реализуется через механизм по описанию выше (HA ZFS). А вот как поведёт себя кластер прокса, если в нём из 7 узлов, сразу четыре (три блейда + quorum disk) станут недоступны - нужно проверять или через эмулятор или вживую на собранном кластере. Всю нагрузку оставшиеся узлы вряд ли поятнут - но можно определить только "особые" ВМ, которые и будут резервироваться в HA.
Д
что то ни так ни так не выходит отказоустойчивости, с двумя шасси. Прям печаль. А что за эмулятор?
Д
думал вариант все VM на общей полке разместить, ту что докупили, но получается полка будет узкое место для всего кластера
Сергей
что то ни так ни так не выходит отказоустойчивости, с двумя шасси. Прям печаль. А что за эмулятор?
я же не сказал что это невозможно. Просто у меня не было опыта с кластерами из 6 физических нод + 1 кворум диск и проверки как поведёт себя HA при выпадении 3+1 узла из кластера. По идее оставшиеся 3 узла какую-то нагрузку будут тянуть, ведь второй экземпляр хранилища (который на этом же шасси) - будет жив и доступен. apt-get install pve-ha-simulator
Anonymous
https://www.servethehome.com/the-case-for-using-zfs-compression/
среднее сжатие 1.4 у меня
Сергей
среднее сжатие 1.4 у меня
у меня хорошо жмутся СУБД и некоторые полупустые ВМ. Фото и видео намного хуже
George
lz4 почти не влияет. возможно и zle не будет влиять, но у этого алгоритма хуже сжатие.
Вот кстати zle не такой быстрый и на базовых тестах lz4 у меня был побыстрее, видимо за счёт эвристик своих, он умеет на раннем этапе несжимаемое не трогать
Сергей
Вот кстати zle не такой быстрый и на базовых тестах lz4 у меня был побыстрее, видимо за счёт эвристик своих, он умеет на раннем этапе несжимаемое не трогать
видел патчи по добавлению zstd. Вроде по скорости ничем не хуже lz4, но лучше жмёт. Но их вроде пока не приняли
George
сам алгоритм
Сергей
да, вижу что lz4 чемпион по скорости
George
https://facebook.github.io/zstd/
George
Сергей
https://indico.fnal.gov/event/16264/contributions/36466/attachments/22610/28037/Zstd__LZ4.pdf
George
у zstd ещё фишка в словарях интересная
Сергей
будет потихоньку накапливаться всякий хлам, который жалко удалить.
мне кажется овчинка не стоит выделки. Взять 1М и будет практически тот же эффект что и от 16
George
для колд стораджа латенси немного побоку, я тоже выбрал 16М для этого
Сергей
сжать эффективнее шансов больше минимум
это если сжимаемый контент. Я даже не представляю что это за контент, который на 16 сожмётся хотя бы на >20% лучше чем на 1М))
Сергей
H.264/H.265/JPG/HEIC - они практически не сжимаемые
George
это если сжимаемый контент. Я даже не представляю что это за контент, который на 16 сожмётся хотя бы на >20% лучше чем на 1М))
а там и на 1% может быть важно, сейчас требуется минимум 12.5% сжать чтобы zfs записал сжатым. Вот жмётся оно на 11.9%, и всё)))
George
H.264/H.265/JPG/HEIC - они практически не сжимаемые
на большом объёме это практически даёт о себе знать иногда)) А по делу - фотки в jpeg весьма так жмутся на zfs с lz4
George
ну и упоминал уже, что без сжатия zfs последний блок файла запишет размером с recordsize, если у файла больше 1го блока. А сжатие это нивелирует, и сожмётся только последний блок
George
вот мои циферки rpool/data/photos compressratio 1.08x - rpool/data/photos recordsize 16M local
George
в общем кому не жалко обычно простаивающий cpu - lz4 стоит включать ради шанса что-то сжать. Не сожмётся - запишется как есть
George
(это про cold storage)
Ivan
у lz4 не существует опций сжатия ?
George
у lz4 не существует опций сжатия ?
существует, но он на скорость сделан и там не очень интересно получается
George
в репе lz4 можете глянуть
Ivan
а вот для swap рекомендуют lze. не лучше ли просто zswap включить ?
George
а вот для swap рекомендуют lze. не лучше ли просто zswap включить ?
со свапом вообще не всё так просто)) начиная с того, что пока все дедлоки не искоренили и не особо рекомендуется его включать
Ivan
а почему этого явно не пишут в рекомендации делать zvol для swap ?
George
https://openzfs.github.io/openzfs-docs/Getting%20Started/Debian/Debian%20Buster%20Root%20on%20ZFS.html?highlight=swap#step-7-optional-configure-swap