Ivan
George
Vladislav
Vladislav
Δαρθ
Ну и типа, это значит что скоро будет релиз 2.2.1 ?
Vladislav
Alex
Релизнули 2.2.1 , важно
Note: We recommend that anyone running zfs-2.2.0 to please update to this release. Gentoo users have identified a block cloning bug (#15526) that can result in data corruption in zfs-2.2.0. To workaround this, zfs-2.2.1 disables block cloning by default (see #15529 and 479dca5).
Fedor
при импорте была ошибка
Fedor
плюс не все патчи пока включены
Alex
> disables block cloning by default
я так понимаю, погнута новая для zfs фича, которая reflink
Юзал её на xfs. Задумка хорошая, но реализация не очень понравилась. Был удивлен, что затащили её в zfs. И вот...
Fedor
либо пул повредился ещё при придыдущей версии, хотя scrub делал
Fedor
https://dpaste.com/CYKF9JA8A
Vladislav
Vladislav
Fedor
с ro или рекавери всё ок
Fedor
Vladislav
Vladislav
?
Да, как раз твои и Ивана сообщения
Fedor
Vladislav
Я думал ты уже победил проблему
Fedor
в рекавери работает
всякие прод системы пока не переводил на 2.2
Δαρθ
Vladislav
Ivan
Fedor
Ivan
Free
❓Вопрос знатокам
Как ведет себя zfs, если не весь диск неисправен, а обнаружена неустранимая ошибка только в одном блоке?
Как-то помечается один из файлов как поврежденный, или же сразу весь пул херется?
Vladislav
Vladislav
Сектор диска? Блок ZFS?
Free
Это пока теоретический вопрос.
Например, появился единственный не читаемый сектор на диске в страйп-пуле.
Но более для меня актуальный - допустим, в пуле raidz1 при скрабе или ресилверинге не удается исправить единственную ошибку в одном байте каком-то.
Не приведет ли это к потере всего пула?
Vladislav
Vladislav
Вы оперируете разными понятиями и разными уровнями
Vladislav
Про аппаратный уровень
https://en.wikipedia.org/wiki/Bad_sector
Free
Ну, допустим, в страйп-пуле - ошибка ДИСКА.
Блок, сектор - разве настолько важно? Если разное поведение - то в идеале ответ предполагал бы, что "в таком случае - так, в другом - вот так".
Vladislav
Vladislav
Если у Вас умер ДИСК, то пул перейдёт в degraded
Vladislav
Если сектор на HDD, то там может и не быть данных, там могут быть старые данные, там могут быть актуальные данные
SMART может среагировать на это раньше ZFS и перепишет данные используя встроенные CRC или пометит его как ошибку с CRC error, и тогда уже ZFS будет разбираться с этим
Vladislav
Вы объясните какую ситуацию Вы рассматриваете
Free
С УМЕР - все понятно, это описано в документации.
А если не умер, а ошибка в единственном месте (блоке, секторе, файле)?
Считается ли при этом, что ВЕСЬ ДИСК умер или по-другому обрабатывается?
Vladislav
Если у Вас умрёт 1 блок в non-ecc памяти - у Вас сдохнет пул с какой-то вероятностью
Free
Давайте попробую конкретизировать.
Vladislav
Vladislav
Это если мы про случай, где блок поврежднём на самом диске, когда SMART не нашёл bad block, а встроенная CRC не смогла его исправить и это АППАРАТНЫЙ (а не софт) дефект блока
Vladislav
Vladislav
А ещё есть ситуация, когда диск посыпался и за одни блоком посыпалось 200 других
Vladislav
прямо на секцию ZFS где содержатся чексуммамы файлов
Δαρθ
Free
Давайте попробую конкретизировать.
Есть пул raidz1, на котором проходил ресилверинг одного диска.
По неизвестной причине вдруг другой диск перешел в статус REMOVED.
После перегрузки этот диск появился снова и начался ресилверинг на нем.
Вот вдруг в процессе ресилверинга этих уже двух дисков будет обнаружена ошибка в единственном месте, которую избыточность этого пула не может исправить.
Допустим, это место относится к единственному байту единственного файла.
Будет ли как-то помечен только этот файл как неисправный, или же zfs решит, что появилось два неисправных диска в пуле с избыточностью 1 и на основании этого весь пул признает негодным?
Vladislav
Vladislav
Как то, что диск данные в этом секторе будут признаны мёртвыми и восстановление будет невозможно, если встроенная CRC не справится, так и вариант, то встроенная CRC диска справится сама
По этой причине существует scrub, по этой причине существует SMART, по этой причине существует Raid-6 (z2)
Vladislav
welcome
Vladislav
Vladislav
ZFS тут как бэ не причём
Δαρθ
Vladislav
Δαρθ
Я про CRC уровня диска
Ну ЦРЦ в целом не занмиается исправением ошибок всё же.
Конечно тут можно сказать что BCH это по сути большущее CRC, но всё же там алгоритм исправления нетривиальный )
Free
ZFS тут как бэ не причём
ZFS при том, что это активно обновляемая файловая система самого современного уровня, и специалисты профильного чата вдруг могли бы знать, что если не реализована, то хотя бы обсуждается возможность более гибкого реагирования на появление таких ошибок.
Я вполне могу представить ситуацию, когда софт при невозможности восстановления одного байта предложил бы не уничтожать все остальные терабайты, а что-то сделать с единственным файлом
Vladislav
Vladislav
Так, мне нужно кое-что проверить
Δαρθ
Δαρθ
Можно игрушечный пул ЗФС сделать на файле для экспериментов
Vladislav
Vladislav
А Рид-соломон это CRCode
Free
Vladislav
Нет, всё так, рид-соломон используется на CD\DVD\HDD
Vladislav
Δαρθ
https://en.wikipedia.org/wiki/Reed%E2%80%93Solomon_error_correction
" Reed Solomon codes based on the original encoding scheme, are not a class of BCH codes, and depending on the set of evaluation points, they are not even cyclic codes."
Vladislav
*depending on the set of evaluation points*
Vladislav
Ага
Δαρθ
ну вощем это не общий случай рид-соломона обзывать CRC
Δαρθ
могут не понять
Vladislav
Vladislav
В общем, HDD имеют возможность сами править часть ошибок насколько мне известно
Vladislav
В смарте даже есть параметр который это сообщает