Egor
Опытные, подскажите, под датасет с фильмами есть смысл выставлять recordsize 1M? Какие возможны грабли?
FreeBSD 12.2 версия пула 5000
Evgenii
Ярослав
Vladislav
LordMerlin
Не надо раскладывать перед собой грабли и пытаться не наступить.
Неужели там будет сотни подключений?
Делайте по дефолту, не усложняйте себе жизнь.
Δαρθ
я думаю там речь об экономии на размере меты и меньшей фрагментации
central
Maksym
Привет! Хорошо, что вы есть!
Fedor
👍👍
Δαρθ
а вот подскажите. как правильно собирать сабж из сорцов если сорцы ядра в левом месте и проинсталлить нужно только модули ядра?
Δαρθ
с наскоку --prefix=/tmp --with-linux-kernel=путьксорцам не вышло
Δαρθ
и что такое --with-linux-kernel-obj не вкурил. это /lib/modules/ что ли?
Vladimir
Я тут решил сделать симуляцию надёжности разных конфигураций RaidZ , на основе данных от backblaze - есть интерес?
central
Egor V
Разве надежность это не бекапы по схеме 3-2-1 ? ;)
Egor V
Disaster Recovery и т.д.
Vladimir
ну если интереса нет, то писать не буду
Egor V
просто непонятна цель если честно....в RAIDZ1 можно потерять 1 диск...надежность самих винтов тоже такое, не 100%
Vladimir
Art
Andrew
Симуляцию, имхо, нет, но вероятность отказа — да.
Andrew
Вероятность потери данных на диске с e-16 и e-18 и типа рейда считается несложно, в ёкселе.
Vladimir
Vladimir
мне-то с формулой тоже проще
Александр
Если диск выходит из строя за период с вероятностью N, то не выходит он из строя с вероятностью (1-N). Соответственно, вероятность того, что все диски отработают срок, равна (1-N)^9, выйдет из строя ровно 1 - (1-N)^8. Суммируем, получаем вероятность того, что все отработает
Александр
Средняя наработка на отказ 2.5 миллиона часов.
Vladislav
вы еще не подсчитали вероятность выхода из строя второго диска из пула
Александр
Сейчас соображу, как MTBF перевести в вероятность выхода из строя в течение года
Vladislav
а также вероятность счастливого ребилда пула
Vladislav
да
Александр
Считать вероятность счастливого восстановления - задача очень неблагодарная.
Vladislav
почему? чем больше дисков и больше данных - снижается вероятность счастливого исхода
Александр
Но вообще в 285 лет до отказа диска я не особо... хм...
Александр
Александр
Итак, считаем, что вероятность выхода из строя одного диска в год - 1/285. Кстати, да, похоже
Andrew
https://www.ibm.com/support/pages/re-evaluating-raid-5-and-raid-6-slower-larger-drives
Vladislav
средний срок жизни 3ТБ дисков 2-3 года. очень сильно зависит от условий эксплуатации и нагрузки на блины
Александр
То есть, вероятность невыхода диска из строя - 0.996
Andrew
имхо, нуно считать не вероятность выхода диска из строя, а вероятность прочитать некорректную инфо с кластера диска.
Vladimir
чтобы raid сдох надо чтобы два (или сколько там надо) диска вышли из строя во время rebuild'a
Vladimir
ну и ещё у вас есть предположение, что вероятность выхода из строя не зависит от возраста диска
Василий
Все эти вероятности довольно бестолковая вещь. Потому что в палате у больных 42, в морге около 0, а в среднем 36,5 вроде бы. Но больным все равно больно, а в тем кто в морге уже все равно.
Александр
Vladislav
в чате объявляется перепись людей прослушавших предмет "Теория вероятности и мат статистики" более 1 семестра :)
Василий
Andrew
Василий
Имеем такую картину. Это свежесобранный массив из 24 дисков по 6Тб. Один из них перешел в Faulty на 217-м часу жизни.
Василий
Сутки прошли, а оно все еще 6 часов до конца показывает. Поначалу я радовался, когда пара часов была. О думаю какой волшебный DRAID.
Vladislav
понять и простить. Диски небось все из одной бочки партии
Andrew
Василий
Диск смотрю викторией. Судя по всему один блин посередине сразу был битый. Когда запись до него дошла, диск кончился.
Andrew
Andrew
*конечно, делать так я не советую.
Василий
Так я его заменил уже, это ресильвер идет.
Andrew
Нагрузка есть, иопсов не хватает.
Василий
Нагрузку снял почти сразу, т.к. вообще стояло. Диски понятно небыстрые, но как-то все равно там он заполнен был не больше 3ТБ уже можно было и закончить.
Andrew
Пустое место проверил, осталось данные перелить :p
Василий
Там 2 массива по 12, т.е. он 66ТБ быстро пробежал из первого и вот на втором ресильвер делает неторопливо.
Василий
Это все к чему. А к тому что все эти ваши вероятности годятся для случая, что диски были исправны. А если сразу был дефект, который вылез не сразу?
Василий
Т.е. по хорошему диск это не единый объект с одним MTBF, а там внутри еще много чего, каждый со своим.
Vladimir
в общем , если кому интересно, я сделал непараметрическую симуляцию на основе данных из backblaze для некоторого сферического массива в вакууме с объёмом 8x12 Tb из дисков ST12000NM0007
сравнение 4х конфигураций: raid-z0 (без резервирования), raid-z1 (9xST12000NM0007 ) и т.д
из параметров - только взял время resilver 4 дня.
Ещё там есть график для одного диска , для сравнение.
Vladimir
и отдельно для raid Z2 i raid Z3
Vladimir
в планах - сделать симуляцию для массива из нескольких пулов .
длина графика по времени ограничена временем наблюдения в базе backblaze
Andrew
Andrew
А для хоуммейд, имхо, диск прочесть стОит перед использованием.
Andrew
Но да, это сила "заднего ума".
Andrew
Василий
В таких масштабах еще вопрос надежды на бэкап несколько в другом свете предстает. Допустим у нас массив на 100Тб и есть от него свежий бэкап всегда. Но если он развалится, время на полное восстановление измеряется неделями. Т.е. надо либо массив дробить, либо только ha кластеры делать и бэкапом не страдать.
Ivan
Ivan
т.е. в первую очередь из бэкапа поднимается то что требуется в данный момент времени.
Василий
Раньше бэкапы делались на более дешевый носитель. Например на ленту. И это имело явный смысл, т.к. серьезно дешевле чем поставить рядом второй такой массив и между ними онлайн репликацию. Но сейчас сети быстрые дешевые. Лент такого объема дешевых уже нет.
Andrew
отчуждаемые РК?
Art
Василий
А робот на такие ленты сколько стоит? Нам их надо штук 20-30, чтобы бэкапы 100ТБ массива хранить.
Василий
К тому же эти 12Тб не вполне честные, только если данные жмутся.
Art