Alexander
А про 2.0.4 какие-то страшные посты можно встретить время от времени, как-то вообще не хочется ее юзать кроме как для просто посмотреть, persistent L2ARC - это конечно классно, хочется, но колется как грится. Уже посмотрел на виртуалке в Linode, прикольно конечно, но сыровато судя по отзывам других.
Alexander
обновился сразу же из реп proxmox и никаких проблем
А вдруг, пусть отлежится годик другой ...
central
ну у меня файлопомойка так что можно, да и бекапы важных данных никто не отменял
Alexander
ну у меня файлопомойка так что можно, да и бекапы важных данных никто не отменял
Только когда бэкапы делаются через send | receive, то заранее и не знаешь насколько они тру винрарны на сомнительных версиях. С меня хватило нервотрепки от hole birth в 0.6.x, но вроде лично меня пронесло ( в хорошем смысле).
nikolay
чем больше я работаю с зфс, тем больше понимаю, что система для ссд, желательно нве :(
Не оптимизирована даже под ssd пока к сожалению. Хотя может в оракле уже оптимизировали
Evgenii
nikolay
Если нужны сниски и реплики, шифрование, альтернатив нет.
я написал ответ на фразу "система для ссд, желательно нве", а так кто ж мешает ее использовать. надо только понимать что выжать макс. производительность на ssd или nvme пуле пока не получится.
Alexander
Ага, больше не обновляется, 0.8.6 самое оно
Т.е. 0.8.6 - это самая надежная версия ZOL за все время? Можно даже смело в прод ? с репликами ессно на бэкап сервера.
George
Т.е. 0.8.6 - это самая надежная версия ZOL за все время? Можно даже смело в прод ? с репликами ессно на бэкап сервера.
каждый, конечно, сам определяет стабильность версии, для меня в 0.8.6 были нужные фиксы и отлежалась эта ветка весьма достаточно
Alexander
каждый, конечно, сам определяет стабильность версии, для меня в 0.8.6 были нужные фиксы и отлежалась эта ветка весьма достаточно
Ну если аптайм не критичен, лишь бы не утерять данные, реплики есть как на 0.8.5, так и на 0.7.12 Я единственно чего боюсь, чтобы она не начала слать кривые реплики, это пипец.
Alexander
А как вы решаете с фрагментацией на проде? Держите отдельный дополнительный пул под send | recieve ?
George
Ну если аптайм не критичен, лишь бы не утерять данные, реплики есть как на 0.8.5, так и на 0.7.12 Я единственно чего боюсь, чтобы она не начала слать кривые реплики, это пипец.
В send у неё только известная давно бага с большими блоками, если один раз отправить с -L а потом без, в 2.0 проверку сделали
Alexander
Я обычно шлю только сначала -R и потом только -I
Alexander
IMHO сильно не хватает процедуры дефрагментации для ZFS, все эти байки про она и так хорошо работает - полная чушь, со временем фрагментация растет как миленькая, особенно на СУБД нагрузке и если места немного остается.
Alexander
Ключевое слово "мало места"
Ну это понятно, но даже если добавить, надо как-то разгрести старое, только через send | receive на новый пул?
George
Минимум 20% свободного места надо держать
Alexander
Некоторые вообще борются с фрагментацией насколько я понял просто постоянно наращивая размер пула :)
George
Ну это понятно, но даже если добавить, надо как-то разгрести старое, только через send | receive на новый пул?
На забитом по месту пуле ничего не поможет, увы это противопоказано любой cow-like fs
Alexander
Минимум 20% свободного места надо держать
Ну я как раз про остаток в 20-30%, если даже при таком остатке достаточно интенсивно и долго молотить zvol с ext3 поверх него, то как-то забивается нафик все.
Василий
На забитом по месту пуле ничего не поможет, увы это противопоказано любой cow-like fs
Типа на не забитом она не фрагментится дикими темпами)))
Alexander
Есть подозрение, что никогда и не будет. Потому что на ссд пофиг, а диски потихоньку вымирают
Надо бы еще попробовать dedicated SSD зеркало под метадату хотябы, как оно? пробовали уже?
George
Типа на не забитом она не фрагментится дикими темпами)))
Ну начнём с того, что она фрагментится по умолчанию, эт да)
Alexander
Это как? Под кеш l2arc?
Ниет :) именно только под МЕТА дату, чтобы данные с мухами отдельно, а метаданные с котлетами отдельно, или мне это приснилось?
Evgenii
Типа на не забитом она не фрагментится дикими темпами)))
Copy-on-Write так работает. Любое изменение кусочка файла на самом деле не меняет его. Запрашивается новое место для записи изменения. Зато наши любимые снимки и надежность на высоте! Любая технология - это набор компромиссов
Alexander
Как вам кстати новость от разраба 4-ого рейзера? Можно уже выкидывать ZFS на помойку или еще рано ? LOL
Василий
Ниет :) именно только под МЕТА дату, чтобы данные с мухами отдельно, а метаданные с котлетами отдельно, или мне это приснилось?
Это как? Не помню такой опции. У меня три ссд по 60 подцеплено к разделу raidz2 из 8 дисков, 12 тб. Вообще, судя по иостат на ссд почти нет обращений
George
Это все равно только кеш.
Смотря в каком виде подключали, special vdev - не кеш
Василий
Copy-on-Write так работает. Любое изменение кусочка файла на самом деле не меняет его. Запрашивается новое место для записи изменения. Зато наши любимые снимки и надежность на высоте! Любая технология - это набор компромиссов
Никто не мешал разработчикам сделать онлайн дефрагментацию, но им нафиг оно не надо. На сановских серверах памяти столько, что там все ней сидит, а остальные им пофиг
Alexander
А Люстру пробовали?
Василий
George
Запилите на коленке block pointer rewrite нам
Василий
О, знатоки подъехали
Не понял, чего тебе пригорело?
Fedor
Что-то читаю.. и что-то пока передумал на зол переезжать 😁😁
George
Не понял, чего тебе пригорело?
"никто не мешал"
Fedor
Страшные вещи какие-то рассказываете :)
Alexander
Send, копипаста
Т.е. все таки надо на проде держать еще один резервный пул такого же размера? И неспешно с хорошими найсами его реплицировать ?
Василий
"никто не мешал"
Окей, ты дедуп используешь в проде?
Alexander
А какие еще варианты?
Разве есть что-то надежнее ZOL 0.7.12 и 0.8.6 ?
George
Страшные вещи какие-то рассказываете :)
На иллюмосе те же баги, если что) ток в zol они закрываются оперативнее. Про проприетарный оракловый не скажу
Alexander
На иллюмосе те же баги, если что) ток в zol они закрываются оперативнее. Про проприетарный оракловый не скажу
Еще и тестятся огромным количеством юзеров и пилятся изначально под Линупс, а не бэкпортируются неавторами.
Evgenii
На иллюмосе те же баги, если что) ток в zol они закрываются оперативнее. Про проприетарный оракловый не скажу
Можно я залечу со своей проблемой, о которой ночью писал? освежу так сказать. Если после репликации, выполнить наследование ключа для целевого датасета/тома, то следующий инкрементный снимок сломает том. У вас нет комментариев по этому поводу? Я вроде бы не нашел такого же открытого бага, возможно плохо искал.
Ivan
Класнная штука, стоит тестить на своей нагрузке
юзаю. относительно недавно пересоздал пул и все zvol сделал с блоками 128, а в стате видно более всего записи блоками 32-64. так же встречается 4 и 8. я думал что менее 128к блоков не будет, но на всякий оставил special.
central
Минимум 20% свободного места надо держать
а процент свободного места влиять на износ ссд?
Evgenii
Вот пример попытки репликации такого, сломанного тома. свойства тома - говорят что ключ загружен попытка загрузки ключа - говорит, что ключ загружен zfs send - говорит, что ключ НЕ загружен
Evgenii
Вот отправка без расшифровки (-w) в новое место, с последующей попыткой загрузки ключа. Ключ не подходит. Я так понимаю - сливай воду.
Evgenii
Alexander
Окей, ты дедуп используешь в проде?
Кстати рулезнейшая вещь для бэкапов Db2 с опцией dedup. Но такой пул при заполнении проще грохнуть или убрать носитель в дальний ящик как ленточку, чем пытаться что-то удалять на нем. Зато бэкапов туда можно залить немерянное количество. В сотни раз больше обычного.
George
Вот отправка без расшифровки (-w) в новое место, с последующей попыткой загрузки ключа. Ключ не подходит. Я так понимаю - сливай воду.
я не погружался, честно говоря, но если у вас есть репродьюсер - стоит его закинуть в виде issue, ребята которые причастны к шифрованию посмотрят
Evgenii
Да занимаюсь. Оформляю. Просто вдруг вы что-то слышали, и они уже работают над этим. Спасибо за ответ
George
Т.е. все таки надо на проде держать еще один резервный пул такого же размера? И неспешно с хорошими найсами его реплицировать ?
если вам прям со временем стреляет - держите ещё больше свободного места, вместо всегда пустого рядом плюс учитывайте, что zvol после полного своего заполнения аллоцирует блоки помедленнее уже, может вы ещё и в это воткнулись
Василий
при чём тут дедуп?
При том, что это фича, которую используют единицы, кто живёт не на железе под который этот дедуп делался. Но его пилят. Потому что это выгодно. А дефраг на том железе пофиг. У меня мса с соляркой поверх. Фрагментацию не чувствует
George
потому и нет ни "онлайн дефрага", ни какого-либо изменения уже записанных данных на ходу
Alexander
если вам прям со временем стреляет - держите ещё больше свободного места, вместо всегда пустого рядом плюс учитывайте, что zvol после полного своего заполнения аллоцирует блоки помедленнее уже, может вы ещё и в это воткнулись
Вообщем пока наращиванием места производительность решается, наращиваем, если уже все приплыли, то окончательный send | receive на резерв, а так для профилактики то лишним не будет реплика на соседнем сервере, причем заведомо менее фрагментированная.
Alexander
Я пробовал дедуп для бекапов, на пуле 16тб, машина на 32гб успевала писать со скоростью 3-4м/с, с круглосуточным хрустом винтов
Это обычные файлы, а бэкапы Db2 льются очень хорошо, потому что они заранее подготовлены уже с расчетом на дедупликацию. Или пробовал как раз бэкапы Db2?
Василий
ох, почитайте про block pointer rewrite, там тупо сложность в разы выше
Зфс в принципе не простая система. Там дофига того что сложно. Вернее: для сообщества сложно, для сановцев нафиг не надо
Alexander
Зфс в принципе не простая система. Там дофига того что сложно. Вернее: для сообщества сложно, для сановцев нафиг не надо
А сановцы - это ораклоиды или smartos-вцы? У них там сановцы поголовно прирожденные reticula математики с треугольными головами?
Василий
Что такое смартосовцы не знаю