Fedor
iostat -dx 1
Fedor
и секунд 10
Ivan
т.е. в этот момент из дисков должны бы выжиматься все соки. а по факту хз что происходит
Fedor
ща посмотрим, выжимаются ли
Fedor
если нет команды такой - apt-get install sysstat
Fedor
ща увидим все
Fedor
Evgenii
Кстати.. воможно проблему решит sync=disabled
в этом случае синхронные запросы, которые в обычном случае вешают IO до момента завершении каждой операции записи, не будут этого делать))
данные на диск будут скидываться сразу огромными пачками. То есть система не будет ждать реального завершения записи данных на диски.
Если свет рубанет, ZFS откатит последнюю пачку транзакций.
Ivan
Ivan
Пришлось ребутнуться
Fedor
как это могло убить :)
Ivan
Хз все ио повисло
Fedor
а...
Fedor
тогда сам зфс подвис
Ivan
Даж терминал повис
Evgenii
может там диск стучит, послушай
Ivan
Не, диски ок.
Ivan
В атопе видно что нагружаются равномерно
Evgenii
zfs set sync=disabled имя пула.. попробуй, должно полететь
Ivan
Evgenii
Ну это неправильно
по идее это не правильно только если у тебя кластер со связанными данными. Т.к тогда данные придут в неконсистентное состояние
Fedor
скорее всего, было примерно следующее.
Fedor
сначала забился большой файл
Fedor
потом файл был удалён, и датасет начал освобождаться.
Fedor
и эта процедура в некоторых случаях при освобождении большого объёма рекордов может подвесить ощутимо всё ио по зфс
Fedor
Evgenii
врут?
http://www.oug.org/files/presentations/zfszilsynchronicity.pdf
Ivan
Ivan
потом удалил файл, место быстро появилось.
Fedor
и потом карточный домик начал рушиться, верно?
Fedor
по скорости
Fedor
до полнго нуля
Ivan
Ivan
хуже не стало после удаления
Fedor
хост на мониторинге не стоит?
Ivan
нет
Fedor
Ivan
только прокс и атоп из мониторингов )
Fedor
потом ачинает валиться потихоньку
Fedor
сейчас тогда надо будет провести такой же второй тест
Ivan
Ivan
но не совсем так хорошо, как было раньше
Evgenii
а выше написано "Disabling ZIL is not recommended where data consistency is required (such as database servers) but will not result in file system corruption"
Ivan
Ivan
atop,кстати обычно нагрузку не более 30% на диски рисует.
Ivan
обычно она около 0
Ivan
короче казалось бы любых ресурсов хватает. процы не загружены на 100%, памяти свободной от кэшей 25%, и диски на пике нагрузки показывали до 32% (хотя наверно при рандомном доступе информация от atop не очень актуальна).
Evgenii
Ivan
не, я про atop
Ivan
и это в самом-самом пике нагрузки
Ivan
Ivan
сейчас iodelay стал ещё меньше
Ivan
видать потомучто новые данные кладутся более последовательно.
Fedor
сейчас уже поздно смотреть.
Fedor
iostat -dx 1
Fedor
проблема исчезла с перезагрузкой
Ivan
Ivan
самое нагруженое что отловилось.
Ivan
кстати, для zfs желательно hdparm -W 0 делать ?
Ivan
думаю если сделаю, скорость совсем упадет
Fedor
а -W это что там?
Fedor
кеш?
Ivan
да, дисковый кэш
Fedor
-W Get/set the IDE/SATA drive´s write-caching feature.
Fedor
если диск используется полностью, в коде опензфс вроде написано, что автоматом использовать кеш
Fedor
он его автоматом включает
Ivan
Ivan
это я открыл студию в вм 😃
Ivan
т.е. те данные, которые свежие, открываются и копируются быстро. те, которые были созданы во время почти полного заполнения пула фрагментированы и добываются медленно.
Fedor
они так и останутся, пока не будут заново перелиты
Ivan
Ivan
виндовый дефраг
Ivan
благо он показывает 70% фрагментации из-за маленького размера массива.
Ivan
пидее лучшим решением будет миграция с ноды на ноду
Ivan
или нет ?
Fedor
не факт.
Fedor
оно так и так из за cow пишется нелинейно и разбрасывается по своим законам