@ru_zfs - страница 695 - Telegram web archive

Ivan

Планируется ли поддержка ядра 6.6, которое новое LTS? @gmelikov

были ядра, которые поддержка обошла стороной ?

George

Планируется ли поддержка ядра 6.6, которое новое LTS? @gmelikov

конечно планируется)

Vladislav

хз что в коммитах, я юзаю пакеты gentoo, а туда попадают только релизы :)

А стоит глянуть коммиты

Vladislav

Δαρθ

Ну и типа, это значит что скоро будет релиз 2.2.1 ?

Vladislav

Ну и типа, это значит что скоро будет релиз 2.2.1 ?

Ну посмотрите на релизы последних 6 версий

Alex

Релизнули 2.2.1 , важно Note: We recommend that anyone running zfs-2.2.0 to please update to this release. Gentoo users have identified a block cloning bug (#15526) that can result in data corruption in zfs-2.2.0. To workaround this, zfs-2.2.1 disables block cloning by default (see #15529 and 479dca5).

Fedor

при импорте была ошибка

Fedor

плюс не все патчи пока включены

Vladislav

при импорте была ошибка

Мдас. А только вчера мне втирали, что импорт безопасен....

Alex

> disables block cloning by default я так понимаю, погнута новая для zfs фича, которая reflink Юзал её на xfs. Задумка хорошая, но реализация не очень понравилась. Был удивлен, что затащили её в zfs. И вот...

Fedor

либо пул повредился ещё при придыдущей версии, хотя scrub делал

Fedor

WARNING: zfs: adding existent segment to range tree (offset=a18422c6000 size=4a000) ZFS: Unloaded module v2.2.0-1_g459c99ff2 ZFS: Loaded module v2.2.1-1, ZFS pool version 5000, ZFS filesystem version 5 PANIC: zfs: adding existent segment to range tree (offset=a18422c6000 size=4a000) Showing stack for process 4052008 CPU: 27 PID: 4052008 Comm: z_wr_iss Tainted: P OE 6.5.11-300.fc39.x86_64 #1 Hardware name: Supermicro Super Server/H12SSL-i, BIOS 2.6a 09/27/2023 Call Trace: <TASK> dump_stack_lvl+0x47/0x60 vcmn_err+0xdf/0x120 [spl] zfs_panic_recover+0x79/0xa0 [zfs] range_tree_add_impl+0x28f/0xea0 [zfs] ? range_tree_remove_impl+0x55d/0xf50 [zfs] space_map_load_callback+0x59/0x90 [zfs] space_map_iterate+0x195/0x410 [zfs] ? __pfx_space_map_load_callback+0x10/0x10 [zfs] space_map_load_length+0x7f/0x100 [zfs] metaslab_load+0x184/0x9d0 [zfs] ? __kmem_cache_alloc_node+0x19d/0x340 ? spl_kmem_alloc+0x116/0x130 [spl] metaslab_activate+0x3b/0x280 [zfs] ? metaslab_set_selected_txg+0x94/0xd0 [zfs] metaslab_alloc_dva+0x64f/0x12d0 [zfs] metaslab_alloc+0xe2/0x290 [zfs] zio_dva_allocate+0xc4/0x8d0 [zfs] ? kmem_cache_free+0x22/0x3a0 ? zio_io_to_allocate+0x63/0x90 [zfs] zio_execute+0x84/0x120 [zfs] taskq_thread+0x2c0/0x4e0 [spl] ? __pfx_default_wake_function+0x10/0x10 ? __pfx_zio_execute+0x10/0x10 [zfs] ? __pfx_taskq_thread+0x10/0x10 [spl] kthread+0xe5/0x120 ? __pfx_kthread+0x10/0x10 ret_from_fork+0x31/0x50 ? __pfx_kthread+0x10/0x10 ret_from_fork_asm+0x1b/0x30 </TASK>

Fedor

https://dpaste.com/CYKF9JA8A

Vladislav

Мдас. А только вчера мне втирали, что импорт безопасен....

?? Импорт безопасен, ага Обновление фич не всегда

Vladislav

либо пул повредился ещё при придыдущей версии, хотя scrub делал

Выше есть

Fedor

с ro или рекавери всё ок

Fedor

Выше есть

?

Vladislav

WARNING: zfs: adding existent segment to range tree (offset=a18422c6000 size=4a000) ZFS: Unloaded module v2.2.0-1_g459c99ff2 ZFS: Loaded module v2.2.1-1, ZFS pool version 5000, ZFS filesystem version 5 PANIC: zfs: adding existent segment to range tree (offset=a18422c6000 size=4a000) Showing stack for process 4052008 CPU: 27 PID: 4052008 Comm: z_wr_iss Tainted: P OE 6.5.11-300.fc39.x86_64 #1 Hardware name: Supermicro Super Server/H12SSL-i, BIOS 2.6a 09/27/2023 Call Trace: <TASK> dump_stack_lvl+0x47/0x60 vcmn_err+0xdf/0x120 [spl] zfs_panic_recover+0x79/0xa0 [zfs] range_tree_add_impl+0x28f/0xea0 [zfs] ? range_tree_remove_impl+0x55d/0xf50 [zfs] space_map_load_callback+0x59/0x90 [zfs] space_map_iterate+0x195/0x410 [zfs] ? __pfx_space_map_load_callback+0x10/0x10 [zfs] space_map_load_length+0x7f/0x100 [zfs] metaslab_load+0x184/0x9d0 [zfs] ? __kmem_cache_alloc_node+0x19d/0x340 ? spl_kmem_alloc+0x116/0x130 [spl] metaslab_activate+0x3b/0x280 [zfs] ? metaslab_set_selected_txg+0x94/0xd0 [zfs] metaslab_alloc_dva+0x64f/0x12d0 [zfs] metaslab_alloc+0xe2/0x290 [zfs] zio_dva_allocate+0xc4/0x8d0 [zfs] ? kmem_cache_free+0x22/0x3a0 ? zio_io_to_allocate+0x63/0x90 [zfs] zio_execute+0x84/0x120 [zfs] taskq_thread+0x2c0/0x4e0 [spl] ? __pfx_default_wake_function+0x10/0x10 ? __pfx_zio_execute+0x10/0x10 [zfs] ? __pfx_taskq_thread+0x10/0x10 [spl] kthread+0xe5/0x120 ? __pfx_kthread+0x10/0x10 ret_from_fork+0x31/0x50 ? __pfx_kthread+0x10/0x10 ret_from_fork_asm+0x1b/0x30 </TASK>

Стек без отладочных символов малополезен.

Vladislav

?

Да, как раз твои и Ивана сообщения

Fedor

Да, как раз твои и Ивана сообщения

я помню

Vladislav

Я думал ты уже победил проблему

Fedor

в рекавери работает всякие прод системы пока не переводил на 2.2

Δαρθ

> disables block cloning by default я так понимаю, погнута новая для zfs фича, которая reflink Юзал её на xfs. Задумка хорошая, но реализация не очень понравилась. Был удивлен, что затащили её в zfs. И вот...

Зато в btrfs эта фича работает ЗБС :)

Alex

Зато в btrfs эта фича работает ЗБС :)

"только через мой гнилой труп" (с) =)

Vladislav

Мдас. А только вчера мне втирали, что импорт безопасен....

feature@block_cloning Ибо это отдельная фича

Ivan

Релизнули 2.2.1 , важно Note: We recommend that anyone running zfs-2.2.0 to please update to this release. Gentoo users have identified a block cloning bug (#15526) that can result in data corruption in zfs-2.2.0. To workaround this, zfs-2.2.1 disables block cloning by default (see #15529 and 479dca5).

в проксмоксе её по дефолту отключили, как знали.

Fedor

в проксмоксе её по дефолту отключили, как знали.

там уже есть 2.2.0 или речь про эту фичу?

Ivan

там уже есть 2.2.0 или речь про эту фичу?

есть 2.2.0 в стабильной репе

Free

❓Вопрос знатокам Как ведет себя zfs, если не весь диск неисправен, а обнаружена неустранимая ошибка только в одном блоке? Как-то помечается один из файлов как поврежденный, или же сразу весь пул херется?

Vladislav

❓Вопрос знатокам Как ведет себя zfs, если не весь диск неисправен, а обнаружена неустранимая ошибка только в одном блоке? Как-то помечается один из файлов как поврежденный, или же сразу весь пул херется?

На каком уровне он обнаружен? Блок ЧЕГО?

Vladislav

Сектор диска? Блок ZFS?

Free

Это пока теоретический вопрос. Например, появился единственный не читаемый сектор на диске в страйп-пуле. Но более для меня актуальный - допустим, в пуле raidz1 при скрабе или ресилверинге не удается исправить единственную ошибку в одном байте каком-то. Не приведет ли это к потере всего пула?

Vladislav

Это пока теоретический вопрос. Например, появился единственный не читаемый сектор на диске в страйп-пуле. Но более для меня актуальный - допустим, в пуле raidz1 при скрабе или ресилверинге не удается исправить единственную ошибку в одном байте каком-то. Не приведет ли это к потере всего пула?

Сектор HDD? Блок HDD? Блок ZFS? Байт информации?

Vladislav

Вы оперируете разными понятиями и разными уровнями

Vladislav

Про аппаратный уровень https://en.wikipedia.org/wiki/Bad_sector

Free

Ну, допустим, в страйп-пуле - ошибка ДИСКА. Блок, сектор - разве настолько важно? Если разное поведение - то в идеале ответ предполагал бы, что "в таком случае - так, в другом - вот так".

Vladislav

Ну, допустим, в страйп-пуле - ошибка ДИСКА. Блок, сектор - разве настолько важно? Если разное поведение - то в идеале ответ предполагал бы, что "в таком случае - так, в другом - вот так".

Важно, потому что разные уровни решают проблему по другому

Vladislav

Если у Вас умер ДИСК, то пул перейдёт в degraded

Vladislav

Если сектор на HDD, то там может и не быть данных, там могут быть старые данные, там могут быть актуальные данные SMART может среагировать на это раньше ZFS и перепишет данные используя встроенные CRC или пометит его как ошибку с CRC error, и тогда уже ZFS будет разбираться с этим

Vladislav

Вы объясните какую ситуацию Вы рассматриваете

Free

С УМЕР - все понятно, это описано в документации. А если не умер, а ошибка в единственном месте (блоке, секторе, файле)? Считается ли при этом, что ВЕСЬ ДИСК умер или по-другому обрабатывается?

Vladislav

Если у Вас умрёт 1 блок в non-ecc памяти - у Вас сдохнет пул с какой-то вероятностью

Free

Давайте попробую конкретизировать.

Vladislav

С УМЕР - все понятно, это описано в документации. А если не умер, а ошибка в единственном месте (блоке, секторе, файле)? Считается ли при этом, что ВЕСЬ ДИСК умер или по-другому обрабатывается?

Шаг 1. Открываем гугл Шаг 2. Пишем - zfs bad blocks Шаг 3. Открываем первые 2 ссылки .... Шан N. Продолжаем чтение

Vladislav

Это если мы про случай, где блок поврежднём на самом диске, когда SMART не нашёл bad block, а встроенная CRC не смогла его исправить и это АППАРАТНЫЙ (а не софт) дефект блока

Vladislav

Планируется ли поддержка ядра 6.6, которое новое LTS? @gmelikov

6.6 завезли если что

Vladislav

А ещё есть ситуация, когда диск посыпался и за одни блоком посыпалось 200 других

Vladislav

прямо на секцию ZFS где содержатся чексуммамы файлов

Δαρθ

Это пока теоретический вопрос. Например, появился единственный не читаемый сектор на диске в страйп-пуле. Но более для меня актуальный - допустим, в пуле raidz1 при скрабе или ресилверинге не удается исправить единственную ошибку в одном байте каком-то. Не приведет ли это к потере всего пула?

Я делал эксперименты типа такого: собрать raidz1 на 3 дисках, забить рандомом один из них полностью, читать файлы. ZFS все файлы возвращала а после resilver вовсе всё делала шоколадно

Δαρθ

6.6 завезли если что

Да, я тоже радуюсь этому! :)

Free

Давайте попробую конкретизировать.

Есть пул raidz1, на котором проходил ресилверинг одного диска. По неизвестной причине вдруг другой диск перешел в статус REMOVED. После перегрузки этот диск появился снова и начался ресилверинг на нем. Вот вдруг в процессе ресилверинга этих уже двух дисков будет обнаружена ошибка в единственном месте, которую избыточность этого пула не может исправить. Допустим, это место относится к единственному байту единственного файла. Будет ли как-то помечен только этот файл как неисправный, или же zfs решит, что появилось два неисправных диска в пуле с избыточностью 1 и на основании этого весь пул признает негодным?

Vladislav

Есть пул raidz1, на котором проходил ресилверинг одного диска. По неизвестной причине вдруг другой диск перешел в статус REMOVED. После перегрузки этот диск появился снова и начался ресилверинг на нем. Вот вдруг в процессе ресилверинга этих уже двух дисков будет обнаружена ошибка в единственном месте, которую избыточность этого пула не может исправить. Допустим, это место относится к единственному байту единственного файла. Будет ли как-то помечен только этот файл как неисправный, или же zfs решит, что появилось два неисправных диска в пуле с избыточностью 1 и на основании этого весь пул признает негодным?

Я описал Вам ситуацию. И то и другое возможно

Vladislav

Как то, что диск данные в этом секторе будут признаны мёртвыми и восстановление будет невозможно, если встроенная CRC не справится, так и вариант, то встроенная CRC диска справится сама По этой причине существует scrub, по этой причине существует SMART, по этой причине существует Raid-6 (z2)

Vladislav

welcome

Free

Я описал Вам ситуацию. И то и другое возможно

То есть возможно, что вместо потери одного пиксела на какой-то фотке zfs уничтожит весь архив фото, например?

Vladislav

То есть возможно, что вместо потери одного пиксела на какой-то фотке zfs уничтожит весь архив фото, например?

Любой рейд массив*

Vladislav

ZFS тут как бэ не причём

Δαρθ

Как то, что диск данные в этом секторе будут признаны мёртвыми и восстановление будет невозможно, если встроенная CRC не справится, так и вариант, то встроенная CRC диска справится сама По этой причине существует scrub, по этой причине существует SMART, по этой причине существует Raid-6 (z2)

встроенная (в ZFS) "CRC" (там не тлько CRC может быть) исправлением ошибок не занимается :)

Vladislav

встроенная (в ZFS) "CRC" (там не тлько CRC может быть) исправлением ошибок не занимается :)

Я про CRC уровня диска

Δαρθ

Я про CRC уровня диска

Ну ЦРЦ в целом не занмиается исправением ошибок всё же. Конечно тут можно сказать что BCH это по сути большущее CRC, но всё же там алгоритм исправления нетривиальный )

Free

ZFS тут как бэ не причём

ZFS при том, что это активно обновляемая файловая система самого современного уровня, и специалисты профильного чата вдруг могли бы знать, что если не реализована, то хотя бы обсуждается возможность более гибкого реагирования на появление таких ошибок. Я вполне могу представить ситуацию, когда софт при невозможности восстановления одного байта предложил бы не уничтожать все остальные терабайты, а что-то сделать с единственным файлом

Vladislav

Ну ЦРЦ в целом не занмиается исправением ошибок всё же. Конечно тут можно сказать что BCH это по сути большущее CRC, но всё же там алгоритм исправления нетривиальный )

Хмммм

Vladislav

Так, мне нужно кое-что проверить

Δαρθ

ZFS при том, что это активно обновляемая файловая система самого современного уровня, и специалисты профильного чата вдруг могли бы знать, что если не реализована, то хотя бы обсуждается возможность более гибкого реагирования на появление таких ошибок. Я вполне могу представить ситуацию, когда софт при невозможности восстановления одного байта предложил бы не уничтожать все остальные терабайты, а что-то сделать с единственным файлом

Я думаю это тот самый случай когда нужно проверить. записать файл с известной последовательностью байт (отключив упаковку), потом найти её на диске и испортить, и посмотреть что ZFS сделает

Δαρθ

Можно игрушечный пул ЗФС сделать на файле для экспериментов

Vladislav

Ну ЦРЦ в целом не занмиается исправением ошибок всё же. Конечно тут можно сказать что BCH это по сути большущее CRC, но всё же там алгоритм исправления нетривиальный )

Потому что для меня CRC в первую очередь cyclic redundancy code, а не cyclic redundancy check

Vladislav

А Рид-соломон это CRCode

Free

Я думаю это тот самый случай когда нужно проверить. записать файл с известной последовательностью байт (отключив упаковку), потом найти её на диске и испортить, и посмотреть что ZFS сделает

Да, конечно. Но я думал - вдруг это известная ситуация, и кто-то из знатоков где-то видел ответ на такой вопрос (сам я простым поиском и в книге FreeBSD Mastery: ZFS ответ не нашел).

Vladislav

Нет, всё так, рид-соломон используется на CD\DVD\HDD

Δαρθ

Потому что для меня CRC в первую очередь cyclic redundancy code, а не cyclic redundancy check

https://users.ece.cmu.edu/~koopman/roses/dsn04/koopman04_crc_poly_embedded.pdf например. "used for error *detection*"

Vladislav

https://users.ece.cmu.edu/~koopman/roses/dsn04/koopman04_crc_poly_embedded.pdf например. "used for error *detection*"

То что он може так использоваться я и не спорю, CRC содержит достаточно много разных кодов

Δαρθ

https://en.wikipedia.org/wiki/Reed%E2%80%93Solomon_error_correction " Reed Solomon codes based on the original encoding scheme, are not a class of BCH codes, and depending on the set of evaluation points, they are not even cyclic codes."

Vladislav

*depending on the set of evaluation points*

Vladislav

Ага

Δαρθ

ну вощем это не общий случай рид-соломона обзывать CRC

Δαρθ

могут не понять

Vladislav

ну вощем это не общий случай рид-соломона обзывать CRC

fair point

Vladislav

В общем, HDD имеют возможность сами править часть ошибок насколько мне известно

Vladislav

В смарте даже есть параметр который это сообщает