Mikhail
Привет чат!
Mikhail
А можно ли как-то отключить счётчики aggsum?
Mikhail
А то postgres при чтении с диска постоянно в него утыкается 77,77% [kernel] [k] osq_lock 2,45% postgres [.] LWLockAttemptLock 1,70% [kernel] [k] mutex_spin_on_owner 1,52% postgres [.] GetSnapshotData 1,18% postgres [.] LWLockRelease 1,14% [kernel] [k] lz4_decompress_zfs 0,65% postgres [.] heap_page_prune 0,59% [kernel] [k] aggsum_flush_bucket.isra.3 0,49% libc-2.28.so [.] __strcoll_l postgres 1221930/1221930 3372684.555130: cycles: ffffffffa7709fa9 osq_lock ([kernel.kallsyms]) ffffffffa7e920e4 __mutex_lock.isra.5 ([kernel.kallsyms]) ffffffffc2ea5180 aggsum_add ([kernel.kallsyms]) ffffffffc2ea9edd arc_free_data_buf.isra.40 ([kernel.kallsyms]) ffffffffc2eab059 arc_buf_destroy_impl ([kernel.kallsyms]) ffffffffc2eaef6f arc_buf_destroy ([kernel.kallsyms]) ffffffffc2eb7c2e dbuf_destroy ([kernel.kallsyms]) ffffffffc2eb80dc dbuf_evict_one ([kernel.kallsyms]) ffffffffc2eb7ad3 dbuf_rele_and_unlock ([kernel.kallsyms]) ffffffffc2ec1605 dmu_buf_rele_array.part.6 ([kernel.kallsyms]) ffffffffc2ec3ce8 dmu_read_uio_dnode ([kernel.kallsyms]) ffffffffc2ec3d4f dmu_read_uio_dbuf ([kernel.kallsyms]) ffffffffc2f86287 zfs_read ([kernel.kallsyms]) ffffffffc2fab0e1 zpl_read_common_iovec ([kernel.kallsyms]) ffffffffc2fab4da zpl_iter_read ([kernel.kallsyms]) ffffffffa78c4871 new_sync_read ([kernel.kallsyms]) ffffffffa78c70c1 vfs_read ([kernel.kallsyms]) ffffffffa78c74ff ksys_read ([kernel.kallsyms]) ffffffffa760419b do_syscall_64 ([kernel.kallsyms]) ffffffffa80000ad entry_SYSCALL_64_after_hwframe ([kernel.kallsyms]) 7f2310c9f8c2 __libc_read (/usr/lib64/libpthread-2.28.so) 71460b read (inlined) 71460b FileRead (/usr/pgsql-10/bin/postgres)
Mikhail
Версия древняя - 0.8.4, система с 8 NUMA нодами и 192 ядрами в сумме.
Mikhail
@gmelikov , help please if possible. Очень буду благодарен совет ибо вопрос для меня срочный
George
@gmelikov , help please if possible. Очень буду благодарен совет ибо вопрос для меня срочный
емнип нет, но последние пару месяцев в мастер по ним как раз идёт серия патчей на сильную оптимизацию, например https://github.com/openzfs/zfs/pull/12145
Mikhail
да, я видел фиксы от Александра Мотина
Mikhail
нагрузка всего то до 10KIOPs
Mikhail
Копейки
Mikhail
а система вообще в клинче
Mikhail
Fedor
а точно ли в это утыкается? pg_stat_activity может чуть больше рассказать - на нумах иногда встречаются весёлые эффекты при хорошей нагрузке.
Ivan
нума и пг вообще не бро
Fedor
очень не бро. :)
Fedor
и чем такие красивые картинки рисуются?)
A1EF
и чем такие красивые картинки рисуются?)
Приятно видеть использования перфа. Про флеймграфы можно в первоисточнике посмотреть
Mikhail
а точно ли в это утыкается? pg_stat_activity может чуть больше рассказать - на нумах иногда встречаются весёлые эффекты при хорошей нагрузке.
Чтение с диска - 1.2мс, постгресс же читает блок за 22мс. Flamegraph как пруф что в счётчики утыкается
Mikhail
нума и пг вообще не бро
Бро, не Бро, но работает с патчами даже на страшных нума где latency порядка 1мкс. :) тут версия без патчей, latency в пределах 240нс, и проблема больше не в pg, а в ядре linux, точнее zfs. Буду пробовать выбить тестовую прощадку, воспроизвести проблему и пробовать свежие версии. Да и читать код.
Mikhail
Ну поскольку это из dmu, то думаю что не будет разницы
Fedor
А если ext3/4 поверх Zvol, или без разницы?
Доп. слой абстракций не всегда хорошее решение
Alexander
Доп. слой абстракций не всегда хорошее решение
Некоторые жаловались, что в ZFS тормозит именно FS, даже я с таким сталкивался в комплекте с ZoneMinder, в таких случаях zvol+Ext/XFS помогает. Но если на более низком уровне типа DMU, то конечно смысла нет.
Alexander
zeneminder на всем тормозит
На ZFS сильнее, чем на ext4 over zvol
Alexander
А кто-нибудь знает хорошую систему видеонаблюдения? Open source под Linux.
Autumn
zeneminder на всем тормозит
О, не только у меня с zoneminder траблы. У меня он и на zfs и на xfs чудеса тормозов показывал. Перевел все на чистый ext4 поверх lvm и все стало ОК. Я хз почему так, но вот как есть.
Autumn
А кто-нибудь знает хорошую систему видеонаблюдения? Open source под Linux.
только зонеминдер, других нет, и он не плохой сам по себе
Autumn
по крайней мере у меня с ним явных проблем нет, а в связке с zm-ninja вообще норм
Autumn
Даже на SSD хотя бы для кэша ZFS?
Вообще тормозит, основные тормоза видны когда в рабочее время пытаешься просмотреть эвенты, система просто вешается, т.е .он с диска эвент считать не может. Потом выдает ошибку - типа эвента нет. Но на диске он есть и читается. Сменил все на lvm+ext4 и вуаля, ни одной проблемы с просмотром и экспортом. Мистика.
Autumn
Изначально был xfs, потом я втулил zfs c SLOG-ом на ссд, а потом перевел все на ext4
Autumn
Alexander
:)
Autumn
Alexander
Ну хорошо, что нашлось решение, надо будет взять на заметку.
Василий
А если ext4-> LVM -> ZVol :)
предлагаю еще с десяток фс внутрь всунуть
Василий
у меня было: AFS поверх NTFS поверх NFS поверх ZFS. кто больше?
Ivan
На ZFS сильнее, чем на ext4 over zvol
думаю стоит потюнить фс
Владимир
А если ext4-> LVM -> ZVol :)
ненене, тут вместо ext4 должен стоять бтрфс
Владимир
Василий
вообще, вы все фигней занимаетесь. если в цепочке нет FAT, желательно 16 (но можно и 12) это все не тру
Василий
Василий
у винта сверх урочные. загрузка 102%
Владимир
я думал там типа всегда на 2 умножение, фат 8 фат 16), не?)
Владимир
фат12 это на дискетах было
дискеты застал, понимание что такое файловая система не было тогда))
Василий
дискеты, еще лет 10 назад в налоговой требовали)
Василий
ну может чуть больше
nikolay
nikolay
в файлике результаты моих тестов, если кому интересно. они подтверждают то, что я писал выше - смена планировщика на уровне block device не дает никакого эффекта.
nikolay
отдельно по поводу параметра nr_requests - как видно из файла в моей системе (CentOS Linux release 8.4.2105) по умолчанию он задан равным 6448, что более чем достаточно для любого устройства кроме nvme диска. изменение этого параметра на, например, 100 не дает никакого эффекта, так как значение параметра aqu-sz при подаче нагрузки не превышает 10. убирать его до 1 не вижу никакого смысла, это ни как не повлияет на количество iops, просто тупо поднимет latency..
Alexander
фат12 это на дискетах было
Между прочим у флоповода нет АНБшной прошивки, а у печенюх есть дверца по защите от затроянивания загрузчика ;) Его драйвер даже хотели выкинуть из ядра :( Но добавить его вручную нам несложно ...
Anton
Фолкс, а есть у кого понимание когда draid подвезут?
Alexander
Кто аналоговый?
Флоповод же (привод для работы с печенюхами 1.44")
Fedor
Даже кассетник- и тот цифровой
лёха карась
привет
Василий
Флоповод же (привод для работы с печенюхами 1.44")
Никому только не рассказывай. А то смеяться будут
Василий
В современных винтах аналога больше чем там
Alexander
В современных винтах аналога больше чем там
Так суть не в наличии аналога, а в отсутствии сложной микропроцессорной цифры с программами. В современных винтах на борту HDD комп такой мощности, что в него наверно можно запихать даже микро Linux, не говоря уж о закладках для связи через PLC.
Василий
CGA были цифровые, а VGA аналоговые
Василий
народ, напомните как в фре префетч отключить?
Василий
sysctl vfs.zfs.prefetch_disable=0 sysctl: unknown oid 'vfs.zfs.prefetch_disable'
Василий
ругается
Alexander
причем тут мощность до цифры?
1) В FDD никакой сложной цифровой логики уровня on board CPU с прошивками в нем нет. 2) В современных HDD там целый вычислительный центр, которому позавидует телефон 15 летней давности.
Alexander
Я не про кодирование сигнала для магнитного слоя, а про управление сервоприводом.
Alexander
вычислительная моща в моторчике?
В драйвере на Linux хосте же. По крайне мере так было написано в одной доке, погуглю еще потом.
Alexander
и при чем тут аналог или цифра?
Что в самом флоповоде НЕТ прошивок с троянами. По крайне мере в трушных с широким шлейфом, а не современных USB с алишки.