@ru_zfs - страница 299 - Telegram web archive

Василий

возможно реализация была довольно простой, вот и запилили до кучи.

Вот я тоже, только такую причину придумать смог Типа, а дайте сделаем, будет фичей больше. А что оно нафиг не надо, пофиг

Δαρθ

вот может кому интересно будет, потестил тут zfs vs btrfs на ssd в качестве root раздела. суть теста -- читаем все файлы типичного рут-раздела с холодными кешами. ~14 гигабайт, ~500 тыщ файлов. читаю при помощи time tar -c /path/ >/dev/null

Δαρθ

итак, холодные кеши: zfs: 3.8 секунд, btrfs: 3.3 секунды прогретые кеши (т.е. всё из RAM) zfs: 1.3 секунды, btrfs: 0.9 секунд

George

А вы про что вообще тогда спорите?) мы про копиес в зфс, пытаюсь найти причину его разработки

Ну кейс то простой, я видел людей, которые используют, не плохо для случаев где резервирования нет но хочется шансы поднять. Ну и подноготная простая - этот функционал итак нужен и используется всегда, например для метадаты

George

Видимо было дёшево дать управлять им для данных тоже

Василий

Видимо было дёшево дать управлять им для данных тоже

С этим согласен, с тем что выше, могу сказать, что странные люди. Грубо говоря, два диска по 1тб стоят где как один на 2тб. Но общая надёжность зеркала будет выше и скорость выше, а полезная ёмкость одинаковая. Пока вижу только вариант, что нет свободных портов для дисков, но это не особо на прод похоже

George

С этим согласен, с тем что выше, могу сказать, что странные люди. Грубо говоря, два диска по 1тб стоят где как один на 2тб. Но общая надёжность зеркала будет выше и скорость выше, а полезная ёмкость одинаковая. Пока вижу только вариант, что нет свободных портов для дисков, но это не особо на прод похоже

Хорошо для ноутов заходит

George

Zfs не только на серверах:)

Василий

Zfs не только на серверах:)

Ну солярку на ноутах не видел)))

Fedor

Опенсолярку давно на свой ставил

Fedor

Иллюмос тоже

Fedor

Работает через задницу, но работает - эксперимент удался 😁

Василий

Иллюмос тоже

Не не. Эту ж фичу впилили на обычной солярке. Так что какую то цель последовали этм злые поклонники солнца

Василий

Я бы понял, если бы она появилась в озфс, но ее не было в обычной. Так нет же. Есть

Fedor

Зфс планировалась не только, как серверная, насколько помню

George

Зфс планировалась не только, как серверная, насколько помню

По городской легенде снапшоты появились по причине удобной инкрементальной отправки диффов разрабу в другую страну чтоли😁 это к слову

Fedor

😁😁😁👍

George

А по поводу перформанса под бд - минимум delphix (одна из компаний с наибОльшим количеством разрабов openzfs и ex-sunовцев) использует и продаёт zfs именно для бд

George

Забавности в воскресный вечер)

Serega

А по поводу перформанса под бд - минимум delphix (одна из компаний с наибОльшим количеством разрабов openzfs и ex-sunовцев) использует и продаёт zfs именно для бд

а в чем мотивация использовать zfs под бд? кроме снапшотов есть еще что-то?

Evgenii

а в чем мотивация использовать zfs под бд? кроме снапшотов есть еще что-то?

лично мне достаточно снапшотов и возможности их отправлять куда угодно, чтобы за мотивироваться

Василий

лично мне достаточно снапшотов и возможности их отправлять куда угодно, чтобы за мотивироваться

снапшоты базы данных? серьезно? :)))

central

снапшоты базы данных? серьезно? :)))

а что не так?

Василий

а что не так?

а то что нормальные бд, данные и транзакции рекомендуют хранить на разных массивах, а снапшот разных массивов операция не атомарная

Василий

да и слать куда то не консистентное состояни базы данных через фс, при наличии нормальной репликации средствами базы данных - так себе решение

Василий

грубо говоря, какая нить команда, update x set c=c+100, поменят пару терабайт на массиве и будет через сенд слаться сутки на другой массив

Evgenii

грубо говоря, какая нить команда, update x set c=c+100, поменят пару терабайт на массиве и будет через сенд слаться сутки на другой массив

Это будет верно только, данные этого поля занимают в базе пару терабайт. Я с такими объемами не работаю слава богу

Evgenii

Зато на приемнике не нужна запущенная база, ему не нужно повторять логику запроса, нагружать процессор, выполняя логику запроса на реплики и самое главное - это просто настроить и поддерживать, в отличие от реплика сета внутри базы

Sergey

да и слать куда то не консистентное состояни базы данных через фс, при наличии нормальной репликации средствами базы данных - так себе решение

Сделать данные гарантированно консистентными на момент создания снапшота - не проблема.

Василий

Сделать данные гарантированно консистентными на момент создания снапшота - не проблема.

как?

Василий

не забывай, это бд, и у нее свои буферы

Василий

Зато на приемнике не нужна запущенная база, ему не нужно повторять логику запроса, нагружать процессор, выполняя логику запроса на реплики и самое главное - это просто настроить и поддерживать, в отличие от реплика сета внутри базы

ну для слабоменяющихся баз, в принципе да, но есть же еще ключи, которые при обслуживании часто ребилдятся полностью. а это может быть тоже весьма существенные объемы

Василий

грубо говоря, снапшот это выключение питания, в ближайшей аналогии. в 99% случаев все хорошо (если это не асинхрон)

Sergey

как?

Например, на mysql это делается так: flush tables with read lock;

Sergey

после создания снапшота - unlock tables;

Sergey

на других субд есть аналогичные механизмы

Василий

ну ок. вариант. хотя что то мне подсказывает, что в кровавом энтерпрайзе, так не используют

Andrey

У вас упрощенное представление о том, что есть БД и как она работает. Это не набор файлов, как в файлопомойке. Oracle прекрасно снапшотится и создаются клоны, никаких проблем не наблюдается. Они же выпускают zfssa - хранилище для БД, которое используется,например, в exadata. Точно так же не видно проблем с снапшотами на Postgres. Просто нужно уметь готовить

Andrey

Используют - используют, еще как

Andrey

Либо снапшоты на уровне дисковой системы, если таковая есть, либо, например тот же ZFS

Sergey

mssql вообще умеет пофайлово бекапиться за счёт поддержки shadow copy

Василий

У вас упрощенное представление о том, что есть БД и как она работает. Это не набор файлов, как в файлопомойке. Oracle прекрасно снапшотится и создаются клоны, никаких проблем не наблюдается. Они же выпускают zfssa - хранилище для БД, которое используется,например, в exadata. Точно так же не видно проблем с снапшотами на Postgres. Просто нужно уметь готовить

или у вас). но спорить не буду. у меня самая большая база 1.5тб, и та на мсскл. бекапы сливаю средствами самой бд

Василий

mssql вообще умеет пофайлово бекапиться за счёт поддержки shadow copy

только это поддержка со стороны имено бд. грубо говоря, поверх зфс такого она не сделает

Andrey

ms sql под это дело мало подходит - это из другой реальности

Василий

тоже самое с ораклом наверняка

Василий

а вот всякие мускли и постргессы врядли

Andrey

хотя если запускать ms sql на linux - то вполне себе можно делать снапшоты и клогы, быстро, буквально минута независимо от размера БД

Sergey

только это поддержка со стороны имено бд. грубо говоря, поверх зфс такого она не сделает

Я о том, что mssql можно бекапить пофайлово без остановки сервера всякими там бакула или бареос

Василий

хотя если запускать ms sql на linux - то вполне себе можно делать снапшоты и клогы, быстро, буквально минута независимо от размера БД

атомарно на разных вольюмах?

Andrey

дык oracle тоже в общем-то бэкапится только rman на горячую, все что карсивое и с кнопками - это обертка вокруг rman

Evgenii

атомарно на разных вольюмах?

zfs может делать снимок дерева волюмов атомарно. Это будет ровно одна операция на файловой системе - 1 транзакция.

Василий

Я о том, что mssql можно бекапить пофайлово без остановки сервера всякими там бакула или бареос

а зачем останавливать мсскл при бекапе?

Sergey

а зачем останавливать мсскл при бекапе?

я не предлагаю его останавливать, наоборот, говорю, что можно не останавливать

Василий

zfs может делать снимок дерева волюмов атомарно. Это будет ровно одна операция на файловой системе - 1 транзакция.

оппа, пошешел гуглить как сделать дерево вольюмов. интересная информация

Sergey

при бекапе НЕ средствами mssql

Evgenii

zfs может делать снимок дерева волюмов атомарно. Это будет ровно одна операция на файловой системе - 1 транзакция.

я проверял. у этих снимков будет одна txg метка стоять

Andrey

ну вижу проблем - при старте БД будет rollback/rollforward до последней закоммиченной транзации в transaction log применительно к ms sql или redo/archivelog для oracle

Василий

при бекапе НЕ средствами mssql

не средствами скл, как оно транзакции определяет? или оно все же что то там локает/комитит

Василий

ну вижу проблем - при старте БД будет rollback/rollforward до последней закоммиченной транзации в transaction log применительно к ms sql или redo/archivelog для oracle

+

Sergey

не средствами скл, как оно транзакции определяет? или оно все же что то там локает/комитит

mssql знает, что его сейчас бекапят

Василий

mssql знает, что его сейчас бекапят

так это средствами скл. просто с внешней мордочкой, грубо говоря.

Sergey

так это средствами скл. просто с внешней мордочкой, грубо говоря.

это не тот бекап, что встроен в mssql

Evgenii

оппа, пошешел гуглить как сделать дерево вольюмов. интересная информация

-r и указываем родительский датасет zfs snapshot -r tank/home@now

Василий

еще раз, если "комитить и локать" в бд, то да, можно снапить

Василий

-r и указываем родительский датасет zfs snapshot -r tank/home@now

чтто такое родительский датасет если речь про вольюмы шла?

Василий

отдельные диски, отдельные пулы

Evgenii

Допустим у вас Proxmox rpool rpool/ROOT rpool/ROOT/pve-1 rpool/data rpool/data/subvol-110-disk-0 rpool/data/subvol-201-disk-0 rpool/data/subvol-202-disk-0 rpool/data/subvol-203-disk-0 rpool/data/subvol-204-disk-0 rpool/data/vm-100-disk-0 rpool/data/vm-101-disk-0 rpool/data/vm-102-disk-0 rpool/data/vm-103-disk-0 rpool/data/vm-104-disk-0 rpool/data/vm-105-disk-0 rpool/data/vm-106-disk-0 rpool/data/vm-106-disk-1 Тогда надо делать снимок rpool/data@имя_снимка

Василий

не, не так, у меня есть raizd2 с кешем под данные и какой то raid10 под логи. как сделать синхронно снапшот?

Василий

зы: по рекомендациям, так сказать, для скл

Evgenii

не, не так, у меня есть raizd2 с кешем под данные и какой то raid10 под логи. как сделать синхронно снапшот?

если z-пулы разные - то никак.

Василий

если z-пулы разные - то никак.

так в том то и фишка, что для логов рекомендуют быстрый для линейной записи диск (чуть не сату можно брать), а для данных - быстрый для случайного чтения

Василий

и мало того, часто рекомендуют, что бы эти массивы были разные

Evgenii

тогда снимки становятся бесполезными, с моей точки зрения

Sergey

кстати, qemu guest agent на венде использует VSS, соответственно, нет вообще проблем делать снапшоты вендовых виртуалок с mssql

Василий

тогда снимки становятся бесполезными, с моей точки зрения

так о чем и речь. у меня тоже одно время было все на одном диске. но когда база перешагнула 1тб и 30 пользователей, любые действия ставили раком, и логи вынесли на отдельный массив

Василий

кстати, qemu guest agent на венде использует VSS, соответственно, нет вообще проблем делать снапшоты вендовых виртуалок с mssql

снять то нет :))

Василий

грубо говоря, правильный, с точки зрения БД снапшот, это тот, при откате на который, потом нет в логах отката/применения транзакции

Sergey

снять то нет :))

Данные в снимке будут консистентными. Но я не знаю, как оно себя поведёт, если дисков несколько.

George

так в том то и фишка, что для логов рекомендуют быстрый для линейной записи диск (чуть не сату можно брать), а для данных - быстрый для случайного чтения

обычно, всё же, это один пул, но разные датасеты

Sergey

грубо говоря, правильный, с точки зрения БД снапшот, это тот, при откате на который, потом нет в логах отката/применения транзакции

Ещё раз, mssql знает, что его бекапят.