Alexander
Вобщем мне абсолютно обязательно bare metal ZFS ноды, и потом чем-то задублировать их zvols.
Alexander
HAST поверх zvol IMHO идеально, или любые другие несложные аналоги HAST.
Причем ради сравнения можно сделать одну ноду на OpenZFS, а другую на Illumos. Zvol блоки то у них универсально совместимые получаются на выходе.
Это вероятно снижает опасность влияния потенциальных багов в однотипном софте хранилок низкого к железу уровня .
Василий
Ты предлагаешь колхозить свое решение для синхронизации
Alexander
Alexander
Лучше конечно максимум готового.
Василий
Сколько тысяч установок на нем есть?
Alexander
Сколько тысяч установок на нем есть?
Я не предлагаю прям точно FreeBSD HAST, но какие-нибудь аналоги. Якобы DRBD - аналог, он более популярен? А есть и другие, Gluster, GPFS, но они сложнее.
Alexander
https://upload.wikimedia.org/wikipedia/commons/5/5b/DRBD_concept_overview.png
Alexander
Одну ноду поднять на SmartOS, вторую на Proxmox.
Объединить их zvols в DRBD HA, соответственно линупсы для DRBD пусть работают в виртуалках, куда проброшены zvols в виде виртуальных блочных устройств.
Если время выявит нестабильность хостовой оси одного из узлов, то потом можно оставить одну зарекомендовавшую себя хостовую ось на обоих узлах.
Василий
И ждать когда это со звоном упадёт
Fedor
Alexander
В точку 😁
Поверх дублированного блока может работать софт с проверкой целостности типа IBM Db2 прямо на блочном без FS или опять еще одна ZFS для файликов, они сразу же заметят любые отклонения в целостности данных.
"Highly available" refers to accessibility, not the reliability of the storage. An HA system is a tricky thing to do, correctly, and also ensure good performance. There are partitioning issues and other fun stuff. A typical HA system is actually a bit risky to the data, because there are more vectors for things to go wrong ... and badly wrong at that. This is important to companies where you are running a service and want to come as close to 100% uptime as possible.
Andrey
Andrey
и https://github.com/ewwhite/zfs-ha/wiki
Fedor
Twissel
В описании мужик все сам собирает, в целом так вернее будет, но все же)
Twissel
Хотя... shared storage он и в Африке шаред
Alexander
Можно ли у пула заменить его числовой GUID ?
Alexander
Похоже штатно нельзя:
https://zfs-discuss.opensolaris.narkive.com/QjeTN3hY/changing-guid
Василий
Fedor
inqfen
А вообще, зачем пытаться использовать zfs как кластерное решение, если оно изначально не кластерное?
Василий
Василий
есть цепф, всан и на крайняк сторедж директ
Василий
наверняка еще пачка других
inqfen
Ну да, тут 2 варианта - либо у тебя программный продукт сам умеет в кластеризацию и распределение своихх данных по своим репликам, тогда можно накатить это на независимые ФС - или нет, тогда берешь решение которое это обеспечит. А брать то, которое не для этого и поверх него колхозить какие-то неродные ему сущности - вдвойне колхоз
Alexander
если сможешь воспроизвести ситуацию - будет прекрасно.
Настроил в линоде iSCSI target на одном хосте Alpine и iSCSI клиента на другом хосте Devuan через приватный нетарифицируемый VLAN.
С прицелом в будущем на использование других хостеров для разных частей зеркал, у них цены бывают в разы ниже Линоды, до 5 раз и более.
Создал пул на Devuan из нескольких remote iSCSI блоков с Alpine.
Попробовал реплицировать датасеты с прерыванием по Ctrl+C
По умолчанию без -s на приемнике никаких токенов не создается.
При указании -s появляется возможность продолжить до ближайшего незавершенного снэпшота, рулез.
Но у меня ведь раньше при возникновении проблем с блокировкой датасета на приемнике не использовалась опция -s на приемнике, почему тогда отвисали датасеты после прерывания?
Alexander
Alexander
А вообще, зачем пытаться использовать zfs как кластерное решение, если оно изначально не кластерное?
ZFS - это с моей точки зрения самый надежный способ работы с baremetal дисками.
Я доверяю ZFS для низкоуровнего хранения данных намного больше, чем всевозможным LVM, CEPH и уж тем более Microsoft.
Мне очень нравится Microsoft близко к юзерам для GUI в связке с DevExpress XAF, но хранилки и СУБД лучше бы без них. PG и Db2 - вот это норм.
Хотелось бы найти open source вариант "сильно упрощенный Lustre для нищебродов" ессно на базе ZFS.
Fedor
Fedor
Раз уж на то пошло, то и на лвм том же, правильно его приготовив, можно сделать хранилку с приемлемым уровнем надёжности.
Fedor
Если рассматривать хранилку как сервис
Fedor
Пока это выглядит как процесс ради процесса.
Опиши желаемый конечный результат с описанием пограничных условий, тогда можно будет подискутировать.
Alexander
Fedor
Чтобы выбрать решение из нескольких, надо их изучить все.
Fedor
А где тут зфс?
Alexander
А где тут зфс?
ZFS - должна быть прослойкой между аппаратными дисками и NAS каталогом.
George
Fedor
Alexander
Fedor
Аргументируй необходимость использования ЗФС, которая не про ХА, в ХА решении.
Fedor
Fedor
Конкретика
Fedor
Это не аргумент, как ты понимаешь :)
Alexander
Это не аргумент, как ты понимаешь :)
Лучше эту тему вероятно прекратить, потому что у нас разные ценности при оценке надежности софтовых решений, превращаюих физические блоки в транзакционные с контролем целостности данных.
Fedor
ХА это так и так про репликацию - тут ты от этого никуда не денешься.
Fedor
Требования по RTO/RPO какие?
Fedor
Fedor
Fedor
Тебе не нужен этот сервис. Видимо ты написал про него так, чтоб разговор поддержать.
Alexander
Fedor
Вот ты опять редактируешь свои сообщения.
Просто смешно :)
Fedor
В общем, последнее предупреждение.
Пиши, пожалуйста, по делу и не отвлекай людей для бесцельных разговоров.
У меня в голове почти сложилось готовое решение с сопоставимой надёжностью, проверками контролями и прочим. А все зря. :)
Fedor
What Every Programmer Should Know About SSDs
https://databasearchitects.blogspot.com/2021/06/what-every-programmer-should-know-about.html
Fedor
Art
Коллеги, у меня по дискуссии выше вопрос назрел насчёт HA
Сейчас я использую ZFS-репликацию между нодами. Это псевдо-HA, я понимаю. Но мне норм.
Но тру-HA для хранилки в таком случае это что вообще? Какие критерии?
Пример: есть БД, которая интенсивно пишет. Сторадж при этом HA. Одна нода хранилки падает. Настоящее HA реально обеспечит мне 0 простоя и 0 потери данных?
Art
Хочется просто понять, чего я лишён с ZFS )
Василий
Василий
Alexander
Василий
Василий
итого: все очень ХА, можно добавлять вынимать диски, все очень быстрое
Василий
но очень дорого и хочет 10g
Art
Василий
Василий
но есть одно но: ESX only
The
Василий
Art
inqfen
inqfen
С надёжностью все норм, а вот быстродействие оставляет желать лучшего