Autumn
это не перенос с датасета (контейнер) в zvol(виртуалка)? или я где-то ошибся?
Vladislav
Vladislav
cp подходит когда у Вас 2-5 файлов
Vladislav
Но не сотни
ArtAnt
Autumn
cp подходит когда у Вас 2-5 файлов
это все ньюансы, rsync такой же инструмент как cp, можно еще найти таких же инструментов, я описал простейший способ, но если вам имея локальный датасет и zvol нравится долбиться в сеть, то ну удачи
Vladislav
Autumn
Вы описали два одинаковых варианта с точки зрения используемых инструментов
Повторю коллега, Вы вольны выбрать инструмент копирования сами, но использования инструмента будет разным, ибо копировать rsync-ом по сети из контейнера в виртуалку это одно, а гнать через ОЗУ с одного примонтированного раздела в другой это разные суть вещи, пусть даже вы будете и то и другое делать rsync-ом. Но инструменты то бывают разные. Если я возьму не rsync то что? Способ резко поменялся?
Vladislav
Vladislav
Более того, Вы начали отвечать на вопрос, который не спрашивали
Vladislav
Вы отвечаете на вопрос
"Как оптимально перегнать данные через утилиту файлового копирования с zfs на zvol?"
Vladislav
Что имеет примерно никакого отношения к тому, что спрашивал топик стартер
Autumn
ArtAnt
Autumn
Так у меня в вопросе написано, что отдаётся по NFS.
это у вас не в вопросе, а в вариантах выбора которые Вы сами себе напридумывали, вы написали что вы думаете сделать "внутри самой виртуалки предварительно отдав ей zvol при этом подключив dataset по nfs", я ж не эстрасенс угадывать подключен ли ваш датасет изначально так или вы пытаясь решить проблему и вешаете его по nfs зачем то, а учитывая что Вы изначально предлагали отправить снапшот датасета в zvol, то ну я хз как этот вариант расценивать
Vladislav
ArtAnt
это у вас не в вопросе, а в вариантах выбора которые Вы сами себе напридумывали, вы написали что вы думаете сделать "внутри самой виртуалки предварительно отдав ей zvol при этом подключив dataset по nfs", я ж не эстрасенс угадывать подключен ли ваш датасет изначально так или вы пытаясь решить проблему и вешаете его по nfs зачем то, а учитывая что Вы изначально предлагали отправить снапшот датасета в zvol, то ну я хз как этот вариант расценивать
ну вот чтобы вы сами себе не напридумывали (Я вам дал два рабочих способа. Что Вам еще надо?), что вы действительно якобы дали мне ответ, прежде чем его давать, нужно было задать уточняющие вопросы, хотя вот народ меня понял.., а вы посчитали, что дали аж два рабочих способа и даже скинули гифку, где вы или кто-то там долбиться об стенку. Действительно надо заканчивать этот цирк.
Shaker
Контроллер перегревпется или отвал чипа или ещё что-то с контролоером. У меня вылечилось заменой сервера :-)
Все это пробовали, к сожалению. Я уже писал в посте. У нас стоит prom, мы пишем метрики влючая температуру hba. Она рержится до 68 градусов, это для таких hba - норма. Даже разнесли полки на разные hba. Сервер меняли. Самый простой способ уронить, это find -ls на том, и сразу через пару минут начинают отваливаться диски. Файлов там много мелких(несколько сотен млн), find никогда до конца не доходит. После ребута, или tank clear если в degraded, снова online и все работает.
Scrub кстати завершается без ошибок. Если в этот момент нет рабочей нагрузки.
Shaker
Конечно, задуман эксперимент. Собрать новый пул без зеркал, и сделать туда экспорт тома. И посмотреть, как будет там. Но такое поведение zfs вижу впервые. Судя по данным, на 2.1.4 такого не было, а как перешли на 2.1.5 начались проблемы.
Vladislav
Vladislav
На 2.1.13
Vladislav
https://openzfs.github.io/openzfs-docs/Developer%20Resources/Custom%20Packages.html#dkms-1
Shaker
Ну, хотелось-бы точно понять, что проблема у 2.1.5, она такая вот, и нужно вообще везде обновляться. У нас везде одинаковая версия, и обычно просто так ее не меняем. Мы пока 2.1.5 приняли как стабильную
Shaker
А так, можно попробовать на этом инстансе обновиться после всех остальных экспериментов , да.
Vladislav
Я все ещё сказал, что проблема аппаратная, но стоит исключить софт в первую очередь
ArtAnt
Andrey
Подскажите, а можно в zfs в raidz включить игнорирование ошибок чтения? На время слития данных?
Aleks
failmode=continue ?
Кот Матроскин
Приветствую, отказ двух дисков в RAIDZ2 это понятное дело, а что если в массиве куча битых секторов по разным дискам начнёт появляться, может получится так что, дисков отказавших не будет, но какие то данные потеряются?
Fedor
история скорее не про отказ дисков, а отказ копий данных. если битые сектора затронут соответствующее количество копий, эти данные будут потеряны.
Кот Матроскин
Кот Матроскин
Vladislav
Как и в абсолютно любой реализации рейда
Vladislav
Потому что рейд НЕ бэкап
Andrey
Скажем так, у меня вот тока что пул raidz с дисками бу, проживших 65000 часов, буквально через 2 недели, сказал афидарзейн. Изза большого количества ошибок записи и чтения, но я уверен что даже в этом случае не было выпадания секторов более чем на одном диске.
Mikhail
Кот Матроскин
Кот Матроскин
Andrey
Откуда ошибки то?
Там бэды?
не совсем:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 081 063 044 Pre-fail Always - 124131516
3 Spin_Up_Time 0x0003 090 090 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 66
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 082 060 030 Pre-fail Always - 188913461
9 Power_On_Hours 0x0032 028 028 000 Old_age Always - 63706
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 66
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 072 054 045 Old_age Always - 28 (Min/Max 26/34)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 64
193 Load_Cycle_Count 0x0032 099 099 000 Old_age Always - 2692
194 Temperature_Celsius 0x0022 028 046 000 Old_age Always - 28 (0 17 0 0 0)
195 Hardware_ECC_Recovered 0x001a 063 012 000 Old_age Always - 124131516
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
Shaker
Я бы советовал этот диск уже ближе к помойке
Andrey
ну вот, а я не смотрел долго в смарт, работает ж в рейде, теперь то они в помойке
Andrey
некоторые
Юрий
/report
Andrey
если диск выпадает то прекрасно долетает и из проксмокса письмо. Но тут другой случай, даже lsi не замечает подвоха
Andrey
пусть это будет чудесный опыт как делать не надо. но можно
Кот Матроскин
Вадим «Дым» Илларионов ☭
Вадим «Дым» Илларионов ☭
Andrey
Кот Матроскин
Andrey
ну вот она и сработала.
Andrey
да, ZFS не смогла выдержать свой же SLA и пометила пулл как деградет
Кот Матроскин
Andrey
в пуле в послелдний раз на диске было 411 ошибок записи
Andrey
Будем исходить из того что ZFS не будет работать на всяком треше что её подсовываешь. гипотетически может, фактически нет
Кот Матроскин
Заказал значит дешевые диски на озоне, а приехали Б/У с 37К часов и поверхностью не ахти, чет теперь сыкотно делать бекап сторадж на таком)
Andrey
вместо ленты норм
Andrey
Ivan
/report
Andrey
тому же куберу чтобы красиво работать надо красивую инфраструктуру.
Вадим «Дым» Илларионов ☭
Andrey
Вадим «Дым» Илларионов ☭
... но всегда можно наткнуться на "...зумеры изобрели рейд1"
Лишь бы не рейд5, против которого ещё наши бумеры придумали "ааргх" или типа того — "движ против любого воплощения 5-го рейда". :)
Я даже прочувствовал эту хрень на себе, когда в новой конторе восстанавливал рассыпавшийся пятый рейд... Бр-р-р!..
Вадим «Дым» Илларионов ☭
Вспомнил:
A(ssotiation) A(gainst) A(ny) R(AID) 5 F(jundation) — A-A-ARGF! 😆
Andrey
Andrey
выбрал рейд1
Вадим «Дым» Илларионов ☭
Рейд10 во все времена рулит — отчётливый баланс меж скоростью и надёжностью.
Georg🎞️🎥