@ru_zfs - страница 470 - Telegram web archive

sam

а размер arc не меняется не лету? надо ребутать?

central

а размер arc не меняется не лету? надо ребутать?

может все таки лимиты arc имеете в виду?

sam

да, максимальный размер

sam

можно на"ты" =)

Vladislav

Ссылки Гугла говорят что можно и без ребута

sam

через /sys/module/zfs/parameters/zfs_arc_max? чот не рабоатет

George

а размер arc не меняется не лету? надо ребутать?

в сторону увеличения - можно на лету, уменьшения - просто так он освобождать не будет память

sam

сработало

sam

и вроде как урезало

Δαρθ

в сторону увеличения - можно на лету, уменьшения - просто так он освобождать не будет память

echo 3 >/proc/sys/vm/drop_caches ?

sam

спасибо

Vladislav

/report

Egor

Почему кривое? Имеено так и нажо делать, с поправкой на то что send должен быть инкрементальным. Но надо понимать, что если дц именно сгорит, то интевал между снимками будет потерян. В остальных случаях, всегда можно выдернуть с хранилки последний инкремент и переслать в новый дц

Вы уверены? Я не разбираюсь в постгре, вдруг она через какой-то немалый интервал сбрасывает транзакции на диск, или вообще копия может попасть в неконсистентное состояние из-за простого копирования

central

Вы уверены? Я не разбираюсь в постгре, вдруг она через какой-то немалый интервал сбрасывает транзакции на диск, или вообще копия может попасть в неконсистентное состояние из-за простого копирования

чего? данные либо в wal либо в основных файлах и никак иначе

central

да и не копирование там а снепшот что нифига не одно и то же

Ivan

Вы уверены? Я не разбираюсь в постгре, вдруг она через какой-то немалый интервал сбрасывает транзакции на диск, или вообще копия может попасть в неконсистентное состояние из-за простого копирования

если пг делает чекпоинт до снапшота, то гарантия восстановления будет близка к 100%

Egor

Ок, спасибо

Andrey

Пофигу-можно просто на горячуую тарить, при старте откатит до последней закоммиченной транракции.а тут снапшот-максимум потеря междр чекпоинтами-по дефаулту 5минут

Fedor

если пг делает чекпоинт до снапшота, то гарантия восстановления будет близка к 100%

100 процентов в случае, если в вал пишутся полные страницы

Andrey

Перед снапшотом-принудительно сделать чекпоинт

Andrey

https://lackofimagination.org/2022/04/our-experience-with-postgresql-on-zfs/

Roman

https://lackofimagination.org/2022/04/our-experience-with-postgresql-on-zfs/

пока не вышла zfs 3 - не слишком пригодно к использованию под БД на nvme

Andrey

Да она и без nvme неплохо работает

Roman

так оно так) Просто на nvme сильная просадка по возможной производительности, но патч уже есть

Andrii

у меня посгря на зфс отдавается в вм-ку по нфс на той же тачке ) в нифигуительном хайлоаде полет нормальньій, размер базьі 2тб

Andrii

сжатие 2х получается

Ivan

у меня посгря на зфс отдавается в вм-ку по нфс на той же тачке ) в нифигуительном хайлоаде полет нормальньій, размер базьі 2тб

красиво

Ivan

* на самом деле нет 😃

Andrii

посгря смело гребет 200к иопс

Ivan

но интересно зачем так

Andrii

чтоб получить адекватное сжатие, у меня вьіходит база 2тб, но на пуле 1.2тб

Roman

у меня посгря на зфс отдавается в вм-ку по нфс на той же тачке ) в нифигуительном хайлоаде полет нормальньій, размер базьі 2тб

у меня постгря частично на zfs, сжатие к 4

Andrii

если завернуть в звол сжатие страдает значительно

Andrii

у меня постгря частично на zfs, сжатие к 4

так зависит же от типа данньіх хранимьіх

Ivan

а не лучше бд в контейнере держать ?

Andrii

а не лучше бд в контейнере держать ?

контейнер менее стабильньій

Roman

так зависит же от типа данньіх хранимьіх

блобов нет

Ivan

вместо nfs можно же viofs

Ivan

в теории он быстрее должен быть

Andrii

я не увидел ограничений по скорости по виртуальному бриджу, вьідавливал 60+ гигабит по нфс синтетикой

Roman

вместо nfs можно же viofs

virtio-fs?

Ivan

virtio-fs?

да

Roman

да

она работает через fuse и по куче тестов днище

Andrey

БД на шпиндельных дисках, arc 23 G, сжатие lz4 чтение данных - разогретый кэш, к дискам практически не обращается - верхняя строчка - это чтение arc

Andrii

у меня патерн - запись

Andrey

обращение к arc - фактически iopsы

Ivan

она работает через fuse и по куче тестов днище

в последних ядрах и qemu подняли производительность же

central

подскажите команду для бенчмарка методов сжатия zfs, встроенная

Vladislav

так оно так) Просто на nvme сильная просадка по возможной производительности, но патч уже есть

Осталось лишь его внедрить

Roman

Осталось лишь его внедрить

обещают в 3й версии в этом году

Δαρθ

подскажите команду для бенчмарка методов сжатия zfs, встроенная

а что хочется узнать по сжатию?

central

а что хочется узнать по сжатию?

производительность

Δαρθ

производительность

степень сжатия или скорость работы алго сжатия?

central

степень сжатия или скорость работы алго сжатия?

скорость

Δαρθ

скорость

ну тут все просто. гзип мегатормоз всегда а далее lz4>zstd-1>...>zstd-9

riv

Вы уверены? Я не разбираюсь в постгре, вдруг она через какой-то немалый интервал сбрасывает транзакции на диск, или вообще копия может попасть в неконсистентное состояние из-за простого копирования

Мои знания и опыт показывают, что базы данных принципе так не делают, накапливая данные длител ное время в озу. Если бы это было так, то дисковая подстстема не была бы для них узким местом. Более того, именно особенностью zfs является отсутствие возможности не консистентного копирования, для этого и сделана транзакционная модель записи данных и снимки. И более того, например в mysql можно (и нужно) отключить часть механизмов направленных на обеспечение консистентности записи на диск для увеличения повышенного быстродействия. Тут надо гуглить тюнинг mysq для zfs. Большого опыта работы с постгре на zfs у меня нет, но имеющийся говорит, что ничего неожиданного не происходит. Но надо учитывать, что снимок фиксирует состояние базы данных на определенный момент времени. Если прошел ещё интервал времени, то на диске уже появились новые данные. Т.е. почти всегда у вас будет хвост из не переданных данных. Передать их до конца, чтобы возобновить работу сервера в другом датацентре можно только остановив сервер, создав ещё один снимок и передав последний инкремент.

riv

Мои знания и опыт показывают, что базы данных принципе так не делают, накапливая данные длител ное время в озу. Если бы это было так, то дисковая подстстема не была бы для них узким местом. Более того, именно особенностью zfs является отсутствие возможности не консистентного копирования, для этого и сделана транзакционная модель записи данных и снимки. И более того, например в mysql можно (и нужно) отключить часть механизмов направленных на обеспечение консистентности записи на диск для увеличения повышенного быстродействия. Тут надо гуглить тюнинг mysq для zfs. Большого опыта работы с постгре на zfs у меня нет, но имеющийся говорит, что ничего неожиданного не происходит. Но надо учитывать, что снимок фиксирует состояние базы данных на определенный момент времени. Если прошел ещё интервал времени, то на диске уже появились новые данные. Т.е. почти всегда у вас будет хвост из не переданных данных. Передать их до конца, чтобы возобновить работу сервера в другом датацентре можно только остановив сервер, создав ещё один снимок и передав последний инкремент.

Кстати, потом инкременты можно передавать в обратную сторону без необходимости пересылать датасет с базой данных (fs или zvol), чтобы в будущем вернуть сервер в первый датацентр.

riv

пока не вышла zfs 3 - не слишком пригодно к использованию под БД на nvme

Ну магичнски низких хадержек на optane ram (я имею в виду эти клевые модули озу nvram) конечно сейчас не добиться. Но зато можно, например, используя cache, log и special на nvme, остальное разместить на sata/sas ssd или даже на hdd и драматически уменьшить стоимость хранилки, при этом сохраняя быстродействие на уровне голого nvme.

riv

чтоб получить адекватное сжатие, у меня вьіходит база 2тб, но на пуле 1.2тб

zstd?

riv

если завернуть в звол сжатие страдает значительно

При одинакомом recordsize и volblocksize, предполагаю, что будет сопоставимо.

Andrii

zstd?

lz4

Andrii

При одинакомом recordsize и volblocksize, предполагаю, что будет сопоставимо.

неа, тестили

riv

lz4

Настоятельнл рекомендую попробовать zstd. У меня он меньше грузит процессор, а сжимает в разы лучше. Но я использую volblocksize 16K, вппочем и на 8K приимущества сохраняются.

Andrii

попробуем

riv

неа, тестили

Интересно. В этом надо разобраться. Чудес быть не должно. А поверх zvol что было?

Andrii

ехт4

Станислав

ехт4

А ext4 тюнили, чтобы он хранил блоки данных постгресса рядом в ZFS, а не разбрасывал как попало?

Станислав

У постгресс по умолчанию 8к блок, если память не изменяет. А максимальный блок у ext4 ограничен pagesize ОС, в linux это 4к. Ему нужно сообщить, что блоки постгресса нужно и рядом размещать {4к+4к} и разом это делать

Andrii

делали

Andrii

в начале весь интернет прочитали )))

))

Народ тут такая проблема что каждый раз когда включаю комп, на рабочем столе папка с китайский названием, каждый раз удаляю после перезагрузки опять появляется, кто знает в чем проблема?

Alexandr

переходи на ZFS 😂

Roman

Народ тут такая проблема что каждый раз когда включаю комп, на рабочем столе папка с китайский названием, каждый раз удаляю после перезагрузки опять появляется, кто знает в чем проблема?

Пора отформатировать диск

))

Пора отформатировать диск

почему

))

??

Denis

Народ тут такая проблема что каждый раз когда включаю комп, на рабочем столе папка с китайский названием, каждый раз удаляю после перезагрузки опять появляется, кто знает в чем проблема?