Василий
Василий
10мб чтения, 32гб озу чисто под хранилку, 50% заняты все диски
Василий
синк дисейблед
Fedor
А что тут? Максимальная скорость?
Василий
А что тут? Максимальная скорость?
яж подгорать пришел, а не хвастаться) тут максимальные тормоза
Василий
если что, горячих данных там чуть больше 30-50 гб
Fedor
Диски медленные?
Fedor
iostat что говорит?
Василий
фрагментация дикая. % это и есть остат. просто для себя сделал скрипт который иостат и зпул стал совмещает
Fedor
Лучше наверное либо рамы добить, либо диски менять. Но при ребуте тормоза будут просто ад.
Fedor
Понятно. Хороший скрипт. 😁
Fedor
Виртуализация?
Fedor
А сам иостат который программа?
Fedor
iostat -dx 10
Василий
Лучше наверное либо рамы добить, либо диски менять. Но при ребуте тормоза будут просто ад.
32гб + 3 диска ссд по 60гб в кеше... если что это домашняя хранилка, через нас на ней валяется 6-7 виртуалок, активно живущие только оксидайзед (интервал час на 30 устройств) и заббикс (толкьо что сильно урезал)
Василий
Василий
тут два массива + рпул. второй бекапы он активен только ночью
Fedor
Нужен второй вывод
Fedor
Я не помню ключик который там девайсы нормально показывает
Василий
упали нагрузки... солярис и фри вей: хрен поймешь какой файло читается
Василий
даже линух что то показывает
Fedor
Через дтрейс выяснял
Fedor
Даже зволы показывал
Fedor
В итоге с зволами сгреб данные из кстат и отправил в графики
Василий
Через дтрейс выяснял
пробовал, не выдает ни одного пути :(
Василий
Василий
это иотоп на дтрейсах
Василий
причем рсинк оно видит, а нфс обращения нет :(
Fedor
Может не туда цепляется
Fedor
Я давно кидал репу с примерами из дтрейс бук, там хорошие наброски для нфс в том числе имеются
Fedor
Да и не только.
Fedor
https://github.com/brendangregg/DTrace-book-scripts
Ivan
чем нагружаешь ?
Fedor
Это очень странно. Как нфс экспортируешь?
Василий
чем нагружаешь ?
Так вон как раз и пишу, что фиг узнаешь, нет нормального iotop
Василий
Это очень странно. Как нфс экспортируешь?
В splaris 11 только один способ есть
Василий
sharenfs
Fedor
Тогда все должно видеться…
Василий
Snoop видит рсинк операции, но не видит нфс
Василий
Возможно, оно видит только после закрытия файла, но это бред
Ivan
nfs в асинхронном режиме ?
Василий
nfs в асинхронном режиме ?
На солярке такого нет. Zfs да
Fedor
Грепни нфс по именам файлов
Fedor
Там было что-то такое
Fedor
Их там несколько
Василий
export ZPOOL_SCRIPTS_AS_ROOT=1 zpool iostat -c iostat-1s 1 не?
root@san:~# zpool iostat -c iostat-1s 1 invalid option 'c' For more info, run: zpool help iostat root@san:~# uname -a SunOS san.srv 5.11 11.4.24.75.2 i86pc i386 i86pc \
Василий
сорян
Василий
iostat -c cpu us sy st id 1 11 0 88
Василий
вторую команду не пойму
Василий
что за -1s?
Andrey
Это на linux
Dmitry
Вопрос, больше теоретический. Вот есть у меня ZFS (на базе Proxmox), 6 дисков SCSI, поверх них собран raidz2 с отдельным logs на nvme. Эти SCSI диски видимо подключены через SMC2208 в режиме HBA, удаленно ни модель, ничего другого не понять. Начал клонировать виртуалку - с этого гипервизора на этот гипервизор - вся система легла колом. После этого я уже поднимал другие гипервизоры, правда на основе 4х дисков, в таком же формате - raidz2 + logs на m2 При условии, что мне не так сильно критично свободное место в уже установленных серверах - как мне лучше пересобрать ZFS для получения лучшей производительности?
Dmitry
зеркала лучший вариант в ЗФС по производительности
Типа вот так zpool create tank mirror и дальше уже номера дисков. А вот эта тема - логи, кеш, их как лучше использовать?
Art
Типа вот так zpool create tank mirror и дальше уже номера дисков. А вот эта тема - логи, кеш, их как лучше использовать?
да, только имена дисков задавай не через обычные буковки типа /dev/sda , а через айдишники, типа такого /dev/disk/by-id/ata-TOSHIBA_MG07ACA12TE_60D0A028X85X Так zfs пул будет вообще независим от того, как система обзовёт диски, и соотв его можно будет легко переносить между системами, авось пригодится А ещё лучше даже так: сделай wipefs -a каждому диску. После чего, очищенные, они отобразятся в гуе Прокса, и ты сможешь создать пул там, так быстрее будет
Dmitry
Окей, с этим понятно. А логи / кеши? У меня сейчас по планам собрать кластер из 5 серваков, на трех будет основной zfs под систему + медленные данные + хранилка, и отдельно - на CEPH из SSD дисков распределенную хранилку на 3х гипервизорах И вот как раз основную дисковую xfs видимо буду собирать как зеркало + nvme под логи
Dmitry
вообще это норм же архитектура?
Art
Типа вот так zpool create tank mirror и дальше уже номера дисков. А вот эта тема - логи, кеш, их как лучше использовать?
если честно, я из всех спец девайсов только SLOG-девайс юзал, это кэш на запись. Годная штука, с ней можно включать асинхронную запись и наслаждаться скоростью вкупе с безопасностью данных. Но для такого девайся нужен или энтерпрайзный ССД, желательно НВМЕ конечно и ОБЯЗАТЕЛЬНО с капаситором. Либо просто-напросто Оптан. Про ИБП молчу, куда без него. И если данные прям супермегаважны, то ещё и зазеркалить бы это девайс не помешало бы, хотя это уже можно сказать излишество
Art
Окей, с этим понятно. А логи / кеши? У меня сейчас по планам собрать кластер из 5 серваков, на трех будет основной zfs под систему + медленные данные + хранилка, и отдельно - на CEPH из SSD дисков распределенную хранилку на 3х гипервизорах И вот как раз основную дисковую xfs видимо буду собирать как зеркало + nvme под логи
зеркало в ЗФС это однозначно ВИН, минус только в его дороговизне да, логи\logs то SpecialLOG-девайс и есть. Он так называется, потому что хранит ZIL - ZFS intent log В чём его смысл. Итак, вообще ZIL хранится в оперативе, и понятно она быстрее чем любой ССД, даже Оптана. И при этом ZFS может врать системе, что уже записала всё, что требовалось на сам диск(и), хотя на самом деле эти данные ещё не покинули ZIL, который в оперативке. А по факту данные будут переписаны в ПЗУ позже. Поэтому и называется этот вид обмана асинхронной записью. Такой подход обепечивает ооочень быструю запись, но ценой вероятного полного краха файловой системы, если во время записи всё повиснет или отрубится свет. Оперативка-то ощищается при выключении. Так что это опасно. Но когда у тебя есть SLOG-девайс, то ты можешь точно так же обманывать систему, но уже с гораздо большим уровнем безопасности. Теперь-то ZIL на ССД, который не обнулится от отключения света. Но чтобы ССД успел всё точно дозаписать, ему нужен маленький автономный источник энергии, у ССД это не батарейки, а просто большие такие конденсаторы. А вот Оптану это не нужно, он такой быстрый, что точно успет всё дозаписать.
nikolay
если честно, я из всех спец девайсов только SLOG-девайс юзал, это кэш на запись. Годная штука, с ней можно включать асинхронную запись и наслаждаться скоростью вкупе с безопасностью данных. Но для такого девайся нужен или энтерпрайзный ССД, желательно НВМЕ конечно и ОБЯЗАТЕЛЬНО с капаситором. Либо просто-напросто Оптан. Про ИБП молчу, куда без него. И если данные прям супермегаважны, то ещё и зазеркалить бы это девайс не помешало бы, хотя это уже можно сказать излишество
для slog можно ставить даже обычный sata ssd, пару в зеркале. тогда не нужен ни оптан с конденсатором, ни ибп (в теории-)). ессно желательно взять диски с хорошим оверпровижионингом и write intensive, но в принципе под slog достаточно выделить раздел на 32-64 Гб и оставить достаточно свободного места на, например, mixed ssd, а ля kingston dc500m. обязательное из всего этого только mirror, потому как при потере slog есть реальный риск потери данных и получения неконсистентного пула с разъехавшимися индексами..
Василий
Если асинхрон, то кеш слог нафиг не нужнее
George
зеркало в ЗФС это однозначно ВИН, минус только в его дороговизне да, логи\logs то SpecialLOG-девайс и есть. Он так называется, потому что хранит ZIL - ZFS intent log В чём его смысл. Итак, вообще ZIL хранится в оперативе, и понятно она быстрее чем любой ССД, даже Оптана. И при этом ZFS может врать системе, что уже записала всё, что требовалось на сам диск(и), хотя на самом деле эти данные ещё не покинули ZIL, который в оперативке. А по факту данные будут переписаны в ПЗУ позже. Поэтому и называется этот вид обмана асинхронной записью. Такой подход обепечивает ооочень быструю запись, но ценой вероятного полного краха файловой системы, если во время записи всё повиснет или отрубится свет. Оперативка-то ощищается при выключении. Так что это опасно. Но когда у тебя есть SLOG-девайс, то ты можешь точно так же обманывать систему, но уже с гораздо большим уровнем безопасности. Теперь-то ZIL на ССД, который не обнулится от отключения света. Но чтобы ССД успел всё точно дозаписать, ему нужен маленький автономный источник энергии, у ССД это не батарейки, а просто большие такие конденсаторы. А вот Оптану это не нужно, он такой быстрый, что точно успет всё дозаписать.
В ZFS понятия краха системы при потере питания нет, только если баг
nikolay
зеркало в ЗФС это однозначно ВИН, минус только в его дороговизне да, логи\logs то SpecialLOG-девайс и есть. Он так называется, потому что хранит ZIL - ZFS intent log В чём его смысл. Итак, вообще ZIL хранится в оперативе, и понятно она быстрее чем любой ССД, даже Оптана. И при этом ZFS может врать системе, что уже записала всё, что требовалось на сам диск(и), хотя на самом деле эти данные ещё не покинули ZIL, который в оперативке. А по факту данные будут переписаны в ПЗУ позже. Поэтому и называется этот вид обмана асинхронной записью. Такой подход обепечивает ооочень быструю запись, но ценой вероятного полного краха файловой системы, если во время записи всё повиснет или отрубится свет. Оперативка-то ощищается при выключении. Так что это опасно. Но когда у тебя есть SLOG-девайс, то ты можешь точно так же обманывать систему, но уже с гораздо большим уровнем безопасности. Теперь-то ZIL на ССД, который не обнулится от отключения света. Но чтобы ССД успел всё точно дозаписать, ему нужен маленький автономный источник энергии, у ССД это не батарейки, а просто большие такие конденсаторы. А вот Оптану это не нужно, он такой быстрый, что точно успет всё дозаписать.
даже если у тебя не доедет последние 5 секунд данных из лога при падении по питанию - это не смертельно для zfs. а вот потеря slog чревата более серьезными проблемами.
Dmitry
Так, а это как то тюнить надо, или при создании пула с LOG диском - оно сразу взлетает без проблем?
George
Есть только крах того что внутри)))
консистентность на уровне приложения, да. Зависит от рук разработчика
Art
Народ, что-то вы меня путаете...
Art
Я начинаю сомневаться в своём понимании zfs)
George
даже если у тебя не доедет последние 5 секунд данных из лога при падении по питанию - это не смертельно для zfs. а вот потеря slog чревата более серьезными проблемами.
>а вот потеря slog чревата более серьезными проблемами. тем же чревата, что и без него - потеря данных с него (за последние Х секунд)
Fedor
А без выделенного девайса лог не сразу на диски ли пишется?
Василий
консистентность на уровне приложения, да. Зависит от рук разработчика
А как его руки помогут, если система сказала что все записала, а сама нефига не записала и свет пропал
George
А без выделенного девайса лог не сразу на диски ли пишется?
конечно, ZIL есть всегда, вопрос на основном vdev ли он или на slog