sam
а размер arc не меняется не лету? надо ребутать?
central
а размер arc не меняется не лету? надо ребутать?
может все таки лимиты arc имеете в виду?
sam
да, максимальный размер
sam
можно на"ты" =)
Vladislav
Ссылки Гугла говорят что можно и без ребута
sam
через /sys/module/zfs/parameters/zfs_arc_max? чот не рабоатет
George
а размер arc не меняется не лету? надо ребутать?
в сторону увеличения - можно на лету, уменьшения - просто так он освобождать не будет память
sam
сработало
sam
и вроде как урезало
sam
спасибо
Vladislav
/report
Egor
Почему кривое? Имеено так и нажо делать, с поправкой на то что send должен быть инкрементальным. Но надо понимать, что если дц именно сгорит, то интевал между снимками будет потерян. В остальных случаях, всегда можно выдернуть с хранилки последний инкремент и переслать в новый дц
Вы уверены? Я не разбираюсь в постгре, вдруг она через какой-то немалый интервал сбрасывает транзакции на диск, или вообще копия может попасть в неконсистентное состояние из-за простого копирования
central
да и не копирование там а снепшот что нифига не одно и то же
Egor
Ок, спасибо
Andrey
Пофигу-можно просто на горячуую тарить, при старте откатит до последней закоммиченной транракции.а тут снапшот-максимум потеря междр чекпоинтами-по дефаулту 5минут
Fedor
если пг делает чекпоинт до снапшота, то гарантия восстановления будет близка к 100%
100 процентов в случае, если в вал пишутся полные страницы
Andrey
Перед снапшотом-принудительно сделать чекпоинт
Andrey
https://lackofimagination.org/2022/04/our-experience-with-postgresql-on-zfs/
Roman
https://lackofimagination.org/2022/04/our-experience-with-postgresql-on-zfs/
пока не вышла zfs 3 - не слишком пригодно к использованию под БД на nvme
Andrey
Да она и без nvme неплохо работает
Roman
так оно так) Просто на nvme сильная просадка по возможной производительности, но патч уже есть
Andrii
у меня посгря на зфс отдавается в вм-ку по нфс на той же тачке ) в нифигуительном хайлоаде полет нормальньій, размер базьі 2тб
Andrii
сжатие 2х получается
Ivan
* на самом деле нет 😃
Andrii
посгря смело гребет 200к иопс
Ivan
но интересно зачем так
Andrii
чтоб получить адекватное сжатие, у меня вьіходит база 2тб, но на пуле 1.2тб
Andrii
если завернуть в звол сжатие страдает значительно
Andrii
у меня постгря частично на zfs, сжатие к 4
так зависит же от типа данньіх хранимьіх
Ivan
а не лучше бд в контейнере держать ?
Andrii
а не лучше бд в контейнере держать ?
контейнер менее стабильньій
Ivan
вместо nfs можно же viofs
Ivan
в теории он быстрее должен быть
Andrii
я не увидел ограничений по скорости по виртуальному бриджу, вьідавливал 60+ гигабит по нфс синтетикой
Roman
да
она работает через fuse и по куче тестов днище
Andrey
БД на шпиндельных дисках, arc 23 G, сжатие lz4 чтение данных - разогретый кэш, к дискам практически не обращается - верхняя строчка - это чтение arc
Andrii
у меня патерн - запись
Andrey
обращение к arc - фактически iopsы
Ivan
она работает через fuse и по куче тестов днище
в последних ядрах и qemu подняли производительность же
central
подскажите команду для бенчмарка методов сжатия zfs, встроенная
Roman
Осталось лишь его внедрить
обещают в 3й версии в этом году
central
Δαρθ
производительность
степень сжатия или скорость работы алго сжатия?
Δαρθ
скорость
ну тут все просто. гзип мегатормоз всегда а далее lz4>zstd-1>...>zstd-9
riv
Вы уверены? Я не разбираюсь в постгре, вдруг она через какой-то немалый интервал сбрасывает транзакции на диск, или вообще копия может попасть в неконсистентное состояние из-за простого копирования
Мои знания и опыт показывают, что базы данных принципе так не делают, накапливая данные длител ное время в озу. Если бы это было так, то дисковая подстстема не была бы для них узким местом. Более того, именно особенностью zfs является отсутствие возможности не консистентного копирования, для этого и сделана транзакционная модель записи данных и снимки. И более того, например в mysql можно (и нужно) отключить часть механизмов направленных на обеспечение консистентности записи на диск для увеличения повышенного быстродействия. Тут надо гуглить тюнинг mysq для zfs. Большого опыта работы с постгре на zfs у меня нет, но имеющийся говорит, что ничего неожиданного не происходит. Но надо учитывать, что снимок фиксирует состояние базы данных на определенный момент времени. Если прошел ещё интервал времени, то на диске уже появились новые данные. Т.е. почти всегда у вас будет хвост из не переданных данных. Передать их до конца, чтобы возобновить работу сервера в другом датацентре можно только остановив сервер, создав ещё один снимок и передав последний инкремент.
riv
Мои знания и опыт показывают, что базы данных принципе так не делают, накапливая данные длител ное время в озу. Если бы это было так, то дисковая подстстема не была бы для них узким местом. Более того, именно особенностью zfs является отсутствие возможности не консистентного копирования, для этого и сделана транзакционная модель записи данных и снимки. И более того, например в mysql можно (и нужно) отключить часть механизмов направленных на обеспечение консистентности записи на диск для увеличения повышенного быстродействия. Тут надо гуглить тюнинг mysq для zfs. Большого опыта работы с постгре на zfs у меня нет, но имеющийся говорит, что ничего неожиданного не происходит. Но надо учитывать, что снимок фиксирует состояние базы данных на определенный момент времени. Если прошел ещё интервал времени, то на диске уже появились новые данные. Т.е. почти всегда у вас будет хвост из не переданных данных. Передать их до конца, чтобы возобновить работу сервера в другом датацентре можно только остановив сервер, создав ещё один снимок и передав последний инкремент.
Кстати, потом инкременты можно передавать в обратную сторону без необходимости пересылать датасет с базой данных (fs или zvol), чтобы в будущем вернуть сервер в первый датацентр.
riv
пока не вышла zfs 3 - не слишком пригодно к использованию под БД на nvme
Ну магичнски низких хадержек на optane ram (я имею в виду эти клевые модули озу nvram) конечно сейчас не добиться. Но зато можно, например, используя cache, log и special на nvme, остальное разместить на sata/sas ssd или даже на hdd и драматически уменьшить стоимость хранилки, при этом сохраняя быстродействие на уровне голого nvme.
riv
если завернуть в звол сжатие страдает значительно
При одинакомом recordsize и volblocksize, предполагаю, что будет сопоставимо.
Andrii
riv
lz4
Настоятельнл рекомендую попробовать zstd. У меня он меньше грузит процессор, а сжимает в разы лучше. Но я использую volblocksize 16K, вппочем и на 8K приимущества сохраняются.
Andrii
попробуем
riv
неа, тестили
Интересно. В этом надо разобраться. Чудес быть не должно. А поверх zvol что было?
Andrii
ехт4
Станислав
ехт4
А ext4 тюнили, чтобы он хранил блоки данных постгресса рядом в ZFS, а не разбрасывал как попало?
Станислав
У постгресс по умолчанию 8к блок, если память не изменяет. А максимальный блок у ext4 ограничен pagesize ОС, в linux это 4к. Ему нужно сообщить, что блоки постгресса нужно и рядом размещать {4к+4к} и разом это делать
Andrii
делали
Andrii
в начале весь интернет прочитали )))
))
Народ тут такая проблема что каждый раз когда включаю комп, на рабочем столе папка с китайский названием, каждый раз удаляю после перезагрузки опять появляется, кто знает в чем проблема?
Alexandr
переходи на ZFS 😂
))
??
Denis
точно, кто-то порчу навёл на комп
))
Да вижу все тут юмористы)