Владимир
случайное мать его чтение это обращение к блокам не более 8кб
Владимир
вот подобное называют случайным чтением
Владимир
когда чление последовательное, то в рамках зфс это выглядит как не классическое случайное чтение блоков уже по 128кб или 1Мб, что на порядок производительнее классического случайного чтения
Vladislav
Серьёзно?
Случайное чтение НЕ СВЯЗАНО с размером блока. Ты можешь сделать случайное чтение в 1МБ на 100ТБ массиве
riv
Подразделяется потому что есть буфер
По факту, бытовые современные nvme не поозо работают на чтении. Буфер есть у всех. А вот с записью могут быть проблемы (и скопее всего будут) могу развить эту тему, если нужно
Владимир
Те, кто так пишут просто не пробовали Storage Spaces...
ну налаживать и дотачивать производительность там конечно можно, что не изменяет ситуацию с отвратительными возможностями администрирования пула в котором есть raidz
riv
а вот в бтрфс - возможны)
Много раз пробовал, испытывал. У меня часто умирала с причинами и без. Может быть сейчас не так, но у меня предубеждение возникло.
Владимир
Случайное чтение НЕ СВЯЗАНО с размером блока. Ты можешь сделать случайное чтение в 1МБ на 100ТБ массиве
давай раз ты такой тугой попробуем как с ребёнком Когда ты выполняешь последовательное чтение данных с ZFS, то блоки читаются целиком и да блоки раскиданы, по поверхности, но в целом такие операции не сильно просаживают производительность Когда ты выполняешь случайное чтение по данным zfs так ещё и с мелким блоком, вот тут и настаёт попа, пожалуйста не пытайся изменить контекст разговора чтобы твои утверждения стали выглядеть адекватно, не юли
riv
ну налаживать и дотачивать производительность там конечно можно, что не изменяет ситуацию с отвратительными возможностями администрирования пула в котором есть raidz
Если мы говорим про пул, например из 10 дисков по 18 ТБ за 32К рублей каждый, то переход на мирор требуется очень сильно обосновать. Есть сценарии где z2 и z3 необходимость, например бекапы. На запись у них по zfs receive скорость хорошая, если метаданные на ssd или nvme
Vladislav
Вы сначала не вникли в контекст беседы, а затем жалуетесь что все плохие
Вы буквально начали говорить, что случайное чтение это чтение блоками 4 и 8, что НЕ ТАК
Vladislav
read - 128kb - https://pastebin.com/Z8V40GWs
Владимир
randread - 128kb
и ты читал эти данные случайно, верно, а можно читать данные последовательно. ТОлько на диске в случае zfs они всё равно будут раскиданы случайно
Vladislav
и ты читал эти данные случайно, верно, а можно читать данные последовательно. ТОлько на диске в случае zfs они всё равно будут раскиданы случайно
И поэтому я и говорю, что на ZFS всегда будет чтение случайное. И любое последовательное чтение и случайное чтение станут на ZFS случайным И это ВСЕГДА ниже будет по производительности вне зависимости от блока
Владимир
Прекрати менять контекст под себя
Vladislav
Прекрати менять контекст под себя
Меняешь определения только ты тут
Владимир
Ничего, что торренты работают с блоками больше 128кб?
ничего что зфс может быть блок даже больше 1мб?
Vladislav
ничего что зфс может быть блок даже больше 1мб?
Круто, 16МБ блок когда увижу на пуле - тогда поговорим, изначальные твои слова были про 128кб и 1МБ
Владимир
Меняешь определения только ты тут
ты докапался, до тебя докопались в ответ)), это твои методы)
Владимир
что не так?
Владимир
Владимир
Круто, 16МБ блок когда увижу на пуле - тогда поговорим, изначальные твои слова были про 128кб и 1МБ
ты теряешься в показаниях, не следишь за беседой, на ходу придумываешь новые аргументы
Vladislav
что не так?
Буквально фраза с которой начался спор
Vladislav
На ZFS ВСЕГДА есть случайное чтение
Владимир
На ZFS ВСЕГДА есть случайное чтение
невсегда и я тебе уже привёл пример
Владимир
размер блока может быть большим
Vladislav
размер блока может быть большим
И от этого эти блоки не будут лежать последовательно. Даже если у тебя одна операция на 16кб в час - это всё ещё случайное чтение будет, если не берётся следующий блок за текущим Если у тебя нет никакой нагрузки на пул и ты читаешь по 16кб в 128МБ блоке (и после того как прочитал эти 128МБ начинаешь читать их заново) раз в 15 секунду, то да, действительно - это не будет случайным чтением
Vladislav
https://pastebin.com/ATKniRhP https://pastebin.com/hCB5pNbn
Media and Data Integrity Errors: 55 Media and Data Integrity Errors: 139 Плохие показатели, что за NVMe?
Vladislav
https://pastebin.com/ATKniRhP https://pastebin.com/hCB5pNbn
И на будущее вычищай инфу, которая идёт после errors: Permanent errors have been detected in the following files:
riv
Круто, 16МБ блок когда увижу на пуле - тогда поговорим, изначальные твои слова были про 128кб и 1МБ
Торрент клиент сначала создаст разряженный файл и zfs постарается зарезервировать доя него место так чтобы если его полностью заполнить было не много фрагментов. Это работает. И конечно на zfs производительность может быть меньше при чтении, а может быть и больше. При записи, скорее всего призводительность будет больше, но может быть и меньше чем например на mdadm и lvm и какой то xfs или ext4. Сложно сказать. Но в целом, если пул не заполнять прд завязку, фрагментация не мешает - скажем так :-)
Vladislav
Скорее всего перегрет
Ну, температура 36 и 34 там, похоже на норму
Vladislav
SPCC M.2 PCIe SSD
А, бытовуха
riv
Про торренты - это при условии, что подобная опция включена, потому что не всегда она дефолтная в Deluged она отключена
Вы про последовптельную скачку или про алокацию места? Алокация - это не разряженный файл, без алокации - разряженный
Vladislav
SPCC M.2 PCIe SSD
А сделайте smartctl -a /dev/ Вообще по показателям ZFS и smart - у Вас всё плохо с дисками, почему и кто виноват надо смотреть логи SMART
riv
Я про аллокацию
Какой-то файл в любом случае сначала создается. Если все отключено, он будет разряженным, что не пешает заререзвировать место на случай если он будет заполнен. Там какие-то эвристические алгоритмы доя этого. Я точнее не знаю, но знаю что этотне так тупо работает, как вы это описываете: как если качать файл задом наперед его пошинкует на минимальные кусочки. Кусочки будут, но не минимального размера
Vladislav
https://pastebin.com/kpB6pbYY
А точной модели нет? По прошивке похоже на Silicon Power XD80 Вообще, по параметрам TBW диск похож на нормальный. Попробуйте через fio насоздавать кучку файлов небольшого объёма с определённым seed, и потом почитать их хэш и ещё раз создать и ещё раз посчитать хэш Я бы сказал, что есть проблема с подключением, контакты точно ок? Ошибки после внезапного отключения питания возникли?
Vladimir
Ошибки до или после отключения питания возникли?
с момента установки не выключалось
Vladimir
69 дней
Vladislav
с момента установки не выключалось
Ну как сказать, Вы БУ их брали?
Vladimir
Ну как сказать, Вы БУ их брали?
в момент настройки да были ребуты нет новые
Vladislav
в момент настройки да были ребуты нет новые
Окей, ну тогда могу только порекомендовать диски пропустить сквозь нагрузку из создания файлов и их подсчёта хэшсумм
Vladislav
методика есть какая этой операции?
Ну, типо подобного https://www.flamingbytes.com/blog/fio-benchmark-on-multiple-files/ только blocksize поменяйте на что-нибудь около 128-512k
Vladislav
У Вас уже часть данных убита
Vladislav
Если Вам нужны данные - лучше вытащите что ещё живо с него в любом случае
Vladimir
ок, пойду вытаскивать
riv
методика есть какая этой операции?
В zfs проведине scrub 2 раза подряд, если ошибок не прибавляется каждый раз, то можно сделать вывод что чтение не глбючит. Запишите данные медленно со скоростью 500кб - 1мб/ сек объем 10Гб, проверьте скрабом 2 раза, не выпосло количество ошибок, значит медленная запись не глючит; запишите данные на zfs объемом меньше буфера ssd если он там есть с интервалами между записью, после последней записи подрждите, интервпли такие чтобы средняя скорость записи не превышала 0.5-1мб /сек. Проверьте скрабом два раза, не растут ошибки? Значит в бытовом редиме ssd работает нормально. Последний тест: записывайте не сжимаемые данные максимальным потоком на весь объем ssd. При этом в соседнем окне откройте dmesg -w и смотрите какие ошибке будут. Вангую: либо это будет заисание nvme и ошибки от zfs либо nvme перегреется и будет перезапускаться и ошибки будут более разнообразные. Можно начать с последнего теста. Тесты я расположил в поряке увеличения вероятности получить сбой на устройстве. Так бы я исследовпл причину появления ошибок. Она кстати может быть в некачественном питании. Это тоже надо проверить.
Alexander
Попробуйте сделать рекордсайз 4 или 8 или еще больше мб, запишите новые данные (они запишутся новым размером). После чего попробуйте прочитать их, какая будет скорость? Для рекордсайза больше 1мб надо будет твикнуть немного
Кстати - протестировал с recordsize=2,4,8,16M (напомню - 7x HDD в raidz1, тестируется с помощью "frametest" - пишем-читаем 9000х 12МБ файлов в 4 потока). Запись - 650МБ/с, чтение на recordsize=1,2,4,8М - в пределах погрешности (400-440МБ/с). А вот при recordsize=16M чтение стало очень даже неплохо - 600МБ/с. По "zpool iostat -r" все в sync_read c req_size=2М, по "iostat -zxm" наконец-то пошли read req. merge, причем %rrqm=33%. arcstat все равно показывает 0% prefetch_hit, но это я так понял нормально и показывает немного не то, что мы думаем...
Alexander
Так что теперь вопрос - почему нет read requests merged при recordsize < 16M. Понятно, что файл размером 12М влезает целиком в recordsize, но все же...
Алексей
Zfs отстой)
Vladimir
В zfs проведине scrub 2 раза подряд, если ошибок не прибавляется каждый раз, то можно сделать вывод что чтение не глбючит. Запишите данные медленно со скоростью 500кб - 1мб/ сек объем 10Гб, проверьте скрабом 2 раза, не выпосло количество ошибок, значит медленная запись не глючит; запишите данные на zfs объемом меньше буфера ssd если он там есть с интервалами между записью, после последней записи подрждите, интервпли такие чтобы средняя скорость записи не превышала 0.5-1мб /сек. Проверьте скрабом два раза, не растут ошибки? Значит в бытовом редиме ssd работает нормально. Последний тест: записывайте не сжимаемые данные максимальным потоком на весь объем ssd. При этом в соседнем окне откройте dmesg -w и смотрите какие ошибке будут. Вангую: либо это будет заисание nvme и ошибки от zfs либо nvme перегреется и будет перезапускаться и ошибки будут более разнообразные. Можно начать с последнего теста. Тесты я расположил в поряке увеличения вероятности получить сбой на устройстве. Так бы я исследовпл причину появления ошибок. Она кстати может быть в некачественном питании. Это тоже надо проверить.
белый и пушистый зверек подкрался незаметно, а я наивно думал собрал все на новом оборудовании, и год можно спать спокойно, а хватило на 60 дней😡
Vladimir
Чтобы спать спокойно стоит брать enterprise nvme (pm963, pm983, pm9a3)
так там и система в целом золотая получаеться
Vladislav
так там и система в целом золотая получаеться
Да нет? Pm983 на 1.92тб стоит 9к рублей или около того В личке
Станислав
read - 128kb - https://pastebin.com/Z8V40GWs
А зачем fio выполнять из под sudo, находясь под рутом?))