bes
Ещё можно рандом seek запись сделать но определенного количества и посмотреть по смарту что изменилось в total_writes
Autumn
Так потестите где у них деградация по скорости начинается
Хотел по быстрому, но видать придется сделать fio, ну ок. И на том спасибо.
nAHKPATOB
Чем лечить ошибку: zfs-8000-5e? После перезагрузки пул не монтируется автоматом, выдаёт ошибка 97, делает 3 попытки и всё, дальше никак. При загрузки с флешки freebsd-13 live - и ручном монтировании пишет: state: FAULTED ada0p3 FAULTED corrupted data
Autumn
там все грустно, пулу и данным конец, судя по описанию =(
nAHKPATOB
не встречался, тьфу,тьфу,тьфу, а тут смотрели? https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-5E/index.html
ну конечно смотрел - там предлагают убить пул, создать новый и восстановить из рез.копии. Вот прикольно перегрузился и всё сдохло - ползи в архив.
nAHKPATOB
Хочется ведь понять причину - чтобы в последствии избежать этого
nAHKPATOB
уже третьи грабли у меня с зфс, наверное плюну на неё: память жрёт, пустое место теряет, а теперь ещё и пул сдох после ребута, и при всё этом нет никаких инструментов для лечения, где долгожданные плюсы??? э-эх, печалька...столько надежд...и назад в geom/ufs
Ivan
карма
Autumn
ну конечно смотрел - там предлагают убить пул, создать новый и восстановить из рез.копии. Вот прикольно перегрузился и всё сдохло - ползи в архив.
та да, беда однако, а он не пытался собрать пул перепутав имена дисков? может он пытается собрать его не в той последовательности? после ребута такое бывает, когда меняются имена дисков, хз догадка так себе, но все же
nAHKPATOB
там пул из одного диска
nikolay
там пул из одного диска
если диск помер, то в чем zfs виновата?)
nAHKPATOB
в этом-то и фокус, диск живой, виктория и hdd reg прогнал ни единого сбоя
Δαρθ
в этом-то и фокус, диск живой, виктория и hdd reg прогнал ни единого сбоя
2 раза посчитай мд5сум диска, совпадает? в смарте что?
Autumn
в этом-то и фокус, диск живой, виктория и hdd reg прогнал ни единого сбоя
А шлейф/плата подключения проблемой быть не может? У меня был реальный кейс, перед введением сервера с 8 винтами в эксплуатацию, все винты тщательно проверялись, один винт давал периодические сбои. Было решение заменить. Заменили, поставили, а масив все равно дает сбой по винту. Оказалось что сбои были из-за шлейфа. Новый комплектный заводской шлеф сата заставил поменять 3 диска. По итогу, все диски оказались нормальными, заменили шлеф и сервак пашет уже лет 7 без сбоев.
Ivan
там пул из одного диска
можете smart запостить ?
Δαρθ
в 1ом случае должны быть тормоза еще неслабые?
Autumn
в сате есть вроде црц32 на канале, это или ошибок дохрена в кабеле настолько что 2^-32 вероятность для 32битного црц пропустить битый пакет (с кучей битовых ошибок) срабатывает или железо плюет на это црц где-то. или что-то еще?
Ну у нас было так - собрали пул, запустили, пул вроде работает, потом бац, диск фейлед, ок, пересобрали, бац повторно. Начали проверять диск mhdd - поверхность в норме, smart в норме, опять пересобрали, опять проверили, опять с тем же диском тот же трабл. Винты были сигейт констелейшн серверные. Отправили диск по гарантии на замену. Через пару дней прислали такой же. Всталили, опять та же лабуда. Я попросил заменить на другу марку. Прислали вестерн голд. Поставили, таже лабуда. Но! В этот раз mhdd выдал ошибку по smart-у. Глянули, по ошибке типа ошибка взаимодейтсвия диска с контроллером. Уже точно не скажу как оно на самом деле выглядело, но т.к. все диски были на одном контроллере, через один бэкплейт, решили заменить шлейф. После замены - вуаля, никаких проблем. Так и остался тот вестерн голд в пулес сигейтами стоять. За 5 лет там из 8 сигейтов еще два реально сдохли. Тоже меняли на вестерны голд.
George
в сате есть вроде црц32 на канале, это или ошибок дохрена в кабеле настолько что 2^-32 вероятность для 32битного црц пропустить битый пакет (с кучей битовых ошибок) срабатывает или железо плюет на это црц где-то. или что-то еще?
вообще проблема существующая, лично сталкивался, на материнке один sata вход раз в неделю-месяц давал ошибку разово в баг трекере ещё есть проблемы с amd чипсетами и usb чисто аппаратные, которые zfs оч быстро ловит
Δαρθ
Ну у нас было так - собрали пул, запустили, пул вроде работает, потом бац, диск фейлед, ок, пересобрали, бац повторно. Начали проверять диск mhdd - поверхность в норме, smart в норме, опять пересобрали, опять проверили, опять с тем же диском тот же трабл. Винты были сигейт констелейшн серверные. Отправили диск по гарантии на замену. Через пару дней прислали такой же. Всталили, опять та же лабуда. Я попросил заменить на другу марку. Прислали вестерн голд. Поставили, таже лабуда. Но! В этот раз mhdd выдал ошибку по smart-у. Глянули, по ошибке типа ошибка взаимодейтсвия диска с контроллером. Уже точно не скажу как оно на самом деле выглядело, но т.к. все диски были на одном контроллере, через один бэкплейт, решили заменить шлейф. После замены - вуаля, никаких проблем. Так и остался тот вестерн голд в пулес сигейтами стоять. За 5 лет там из 8 сигейтов еще два реально сдохли. Тоже меняли на вестерны голд.
типа, диск вылетал по таймаутам а не по порче данных?
George
Хочется ведь понять причину - чтобы в последствии избежать этого
я бы смотрел на версию zfs у вас и прошёлся бы по тикетам как открытым так и закрытым, там у вас openzfs ведь уже?
Autumn
типа, диск вылетал по таймаутам а не по порче данных?
он просто помечался в пуле как фейлед, а чем руководствовалась зфс я хз
George
Ну у нас было так - собрали пул, запустили, пул вроде работает, потом бац, диск фейлед, ок, пересобрали, бац повторно. Начали проверять диск mhdd - поверхность в норме, smart в норме, опять пересобрали, опять проверили, опять с тем же диском тот же трабл. Винты были сигейт констелейшн серверные. Отправили диск по гарантии на замену. Через пару дней прислали такой же. Всталили, опять та же лабуда. Я попросил заменить на другу марку. Прислали вестерн голд. Поставили, таже лабуда. Но! В этот раз mhdd выдал ошибку по smart-у. Глянули, по ошибке типа ошибка взаимодейтсвия диска с контроллером. Уже точно не скажу как оно на самом деле выглядело, но т.к. все диски были на одном контроллере, через один бэкплейт, решили заменить шлейф. После замены - вуаля, никаких проблем. Так и остался тот вестерн голд в пулес сигейтами стоять. За 5 лет там из 8 сигейтов еще два реально сдохли. Тоже меняли на вестерны голд.
видимо у вас zfs по таймауту доступа выкидывал диск из пула
Autumn
видимо у вас zfs по таймауту доступа выкидывал диск из пула
Может, я там не так подробно описал ситуацию, я уже не помню точно, это все ж было лет 7 назад, когда мы первый проксмокс на зфс поднимали, но точно помню что диск вылетал не мгновенно, т.е. у меня тогда вообще не было опыта общения с зфс и мы после сброрки пула, прикрутили к нему слог и л2арк на ссд, а потом гоняли по производительности меняя параметры, и вот винт вылетал не сразу. Пул нормально работал пару дней, а потом происходил сбой. Это навело на мысли о проблеме с поверхность, типа мы заливали кучу рэндом даты в пул и натыкались на поврежденное место. Этим мы изначально трактовали периодичность сбоев.
Autumn
а, тогда и по количеству ошибок просто мог выбивать как накапливались
вот чего не помню, того не помню, но 100% проблема была в шлейфе =)
Autumn
причем шлейф шел от бэкплейна к матери, а не от винта к матери, сам винт был в корзине, на которой разъемы питания и сата были, бэкплейн в норме, а косячил шлейф.
nikolay
а, тогда и по количеству ошибок просто мог выбивать как накапливались
у меня связка lsi 9305 и hgst 8 Тб sata давало схожий эффект, помогла перешивка fw на контроллерах
Ivan
7 лет наработки. какой трудяга ) с обычной фс никаких проблем не возникает ?
nAHKPATOB
Нет, нормально. Да и тут полгода работал, вот решил ребутнуть.
nAHKPATOB
изначально(осенью 2020)была FreeBSD 12.2, в апреле обновил до 13.0, пул тоже обновил и загрузчик, перегрузил проверил, работает.
Combot
Катерина has been banned! Reason: CAS ban.
Sergey
Кто что думает про использование таких штук с консьюмерскими SSD? https://a.aliexpress.com/_A6qKYf
Sergey
Конечно, речь не про продакшн, а про домашний сервер.
Dmitriy
Использую типа таких но без конденсатора, а что должен защитить тут конденсатор ? В обычных raid контроллерах он вроде защишает кэш, а тут что ?
Василий
Нве с кешем от друзей наших китайских)
Василий
Тоже не смог придумать зачем тут конденсатор
Василий
Кстати, где-то видел на два разъёма
Dmitriy
Да есть и на два ) работают вполне
Sergey
Использую типа таких но без конденсатора, а что должен защитить тут конденсатор ? В обычных raid контроллерах он вроде защишает кэш, а тут что ?
Мне тоже хотелось понять, каким образом он что-то защищает. По идее, должен в момент отключения дать возможность сохранить кэш, но для этого он должен уметь сообщить накопителю, что надо выключаться.
Sergey
в enterprise ssd конденсаторы встроенные
Василий
да
Не смог нагуглить. Просто гуглить ссд кеш это капец как не про кеш внутри ссд :(
Василий
так в sata тоже есть кэш
Ссд бывают сата, да))
Василий
Я же гугли ссд размер кеша
Sergey
https://www.kingston.com/en/solutions/servers-data-centers/ssd-power-loss-protection
Sergey
что первое нагуглилось
Sergey
вот мне и интересно, эта хрень с конденсатором сможет помочь?
George
Конечно, речь не про продакшн, а про домашний сервер.
Дома кондёры не нужны особо, sync=disabled в случае zfs и все дела
Sergey
Дома кондёры не нужны особо, sync=disabled в случае zfs и все дела
У меня есть данные, которые жалко потерять
George
(в контексте zfs)
Sergey
при чём тут они?
а зачем рисковать с sync=disabled?
Sergey
ещё предложите массив raid10 убрать
George
а зачем рисковать с sync=disabled?
рисковать чем? в случае потери питания примерно последние 5 секунд записи (по дефолту) только потеряются
George
Sergey
зачем slog дома?
А зачем slog не дома?
George
А зачем slog не дома?
БД, синхронная запись же. Которая "дома" нафиг не нужна
George
Ну а мне нужна.
ну так зачем?
George
расскажите ваш кейс
Sergey
ну так зачем?
Бд, синхронная запись, вот это всё. Почта. Пришло письмо, сервер вырубился, письма больше нет.
Sergey
А у меня есть
George
благо дело sync это свойство датасета
Ivan
Бд, синхронная запись, вот это всё. Почта. Пришло письмо, сервер вырубился, письма больше нет.
наверно не стоит сразу при получении удалять письма на сервере
Sergey
благо дело sync это свойство датасета
да, у меня sync=disabled на zvol с торрентами 😊
Василий
ну так зачем?
у меня дома кластер esx из двух нод. когда свет пропал, потом половину линуховых виртуалок висит на чеке