J
Мне диким кажется сам факт того что кому-то нужны "курсы" от инфоцыган)
Stanley
Stanley
Не любишь локал диски?
kn
Че? :)
опять криптопидор приходил
Stanley
А, пропустил
Stanley
Я уж думал ты от локал волумов сгорел
Stanley
Испугался...
Stanley
Ой, кстати. Тупейший вопрос. А есть матрица совместимости стека с fc хранилками?
kn
есть драйвера для cinder, иногда их вендоры выпускают
kn
но, надо очень вдумчиво и внимательно смотреть, какие функции работают (и иногда как)
Stanley
Там же принцип, что мы fc приземляем на все гиперы, а синдер/гланс ходят в веб-апи и режут волумы/таргеты/луны?
kn
Stanley
О, накидали кучку. Но да, с поддержкой как то не очень...
Stanley
И второй, более сложный вопрос. Даже на локалдисках, либвирт вм дает в 2-3 раза меньше иопсов чем напрямую с хостовой системы
Stanley
Кто то писал что это из за того что квм-кему пишет в один поток. Хз
Stanley
А в стеке это как реализовать?
Stanley
Тогда это ручной закат солнца...
Nikolay
Чтобы убить oops одной вм, а потом лимит навести?
Эрик
Не пройди, пожалуйста
Эрик
Там бот проходил капчу
Stanley
Ну при ливе может и нет. Там в коде scp.
Aleksandr
У него имя такое было. ) Потер
J
@creepy_owlet
Извини что в вечер субботы тэгаю, но потом забуду)
Подскажи, я верно понимаю что во время периодического sync_power_state все conductor воркеры параллельно долбят каждый BMC?
То есть, 8 воркеров == 8 запросов к BMC параллельно. Авось хоть один отработает) Так?
Илья | 😶☮️🐸
Илья | 😶☮️🐸
Не ?
Илья | 😶☮️🐸
flow и тд
Ilya
Там по маку/ip балансит
Зависит от настроек. Есть например такая:
TransmitHashPolicy=layer3+4.
Хэш для определения конкретной верёвки будет считаться на основе IP адресов и номеров TCP портов.
Ilya
Источника и приёмника.
Ilya
Включаем этот режим, запускаем два аперфа в режиме сервера на разных портах, например так:
iperf3 -s -D -p 10444
iperf3 -s -D -p 10443
Mikhail
Интересно протестить как часто проблемы с фрагментацией пакетов возникают. Я давно как-то тестил 802.3ad с layer 3-4 и утилизация была норм, а вот фрагментацию не проверял
Ilya
Ilya
на бондах с двумя линками в LACP и одним IP адресом на бонде у одного и второго сервера
Fedor
Fedor
J
Включаем этот режим, запускаем два аперфа в режиме сервера на разных портах, например так:
iperf3 -s -D -p 10444
iperf3 -s -D -p 10443
Получишь для каждого iperf по пропускной способности одного интерфейса в бонде.
Суть алгоритмов хэширования и режимов работы бонда без LACP, но с балансировкой в том чтобы намеренно пускать фрйемы относящиеся к одному обмену (флоу) через один и тот же интерфейс.
Это не ограничение железа, а необходимость, потому что если просто херачить пакет туда-пакет сюда, как делает balance-rr или если использовать хитрый алгоритм, а не консистентное хеширование, то велик шанс что фреймы будут прилетать на хост назначения не в том порядке ак были отправлены.
Для TCP примера возьми TCP. Для него out-of-order в порядке вещей, в нем заложен механизм сборки потока по sequence number.
Но в эзернете ничо такого нет. Поэтому out of order tcp сегменты в поток собрать можно, но перед этим тебе надо собрать ip пакеты и завернутые в них сегменты из ethernet фреймов. Но если фреймы приходят не в том порядке как отправлялись, то ничо не соберется.
Есть вариант для одного флоу получить полную пропускную способность бонда - если у тебя будут прямые линки между отправителем и получателем с одинаковыми характеристиками среды передачи и бонд в режиме balance-rr. А если balance-rr попытаться гнать через свитч, то не заработает нормально.
В целом, конечно, если не фрагментировать ip пакеты и если они все будут одинакового размера и если tcp сегменты будут одинакового размера, то должно работать и так. Но наверн такие реализации разве что в студенческих научных работах)
J
Спасибо)
Какой грязный хак :D
J
Не очень тебя понял про сослагательное наклонение.
Если ты имеешь ввиду что BMC прошивки все говно мудацкое и что редфиш всё сделал только хуже,то да, согласен)
J
Да, я посмотрел.
На всякий случай переспросил, потому что офигел немного.
J
Тоже верно.
Ток чо-то его вместо того чтобы продвигать как стандарт начали продавать как лицензируемую фичу для хипстуров от мира baremetal оркестрации и любителей навороченного DCIM софта)
J
IT такая параша -_-
J
Хотел сидеть, работать с крутым железом и софтом написанными умными дядями и в ус не дуть)
J
Та это придумка жидомасонов же)
J
В традиционные ценности)
Ну ладно. разобрался и хорошо.
Ilya
Получишь для каждого iperf по пропускной способности одного интерфейса в бонде.
Суть алгоритмов хэширования и режимов работы бонда без LACP, но с балансировкой в том чтобы намеренно пускать фрйемы относящиеся к одному обмену (флоу) через один и тот же интерфейс.
Это не ограничение железа, а необходимость, потому что если просто херачить пакет туда-пакет сюда, как делает balance-rr или если использовать хитрый алгоритм, а не консистентное хеширование, то велик шанс что фреймы будут прилетать на хост назначения не в том порядке ак были отправлены.
Для TCP примера возьми TCP. Для него out-of-order в порядке вещей, в нем заложен механизм сборки потока по sequence number.
Но в эзернете ничо такого нет. Поэтому out of order tcp сегменты в поток собрать можно, но перед этим тебе надо собрать ip пакеты и завернутые в них сегменты из ethernet фреймов. Но если фреймы приходят не в том порядке как отправлялись, то ничо не соберется.
Есть вариант для одного флоу получить полную пропускную способность бонда - если у тебя будут прямые линки между отправителем и получателем с одинаковыми характеристиками среды передачи и бонд в режиме balance-rr. А если balance-rr попытаться гнать через свитч, то не заработает нормально.
В целом, конечно, если не фрагментировать ip пакеты и если они все будут одинакового размера и если tcp сегменты будут одинакового размера, то должно работать и так. Но наверн такие реализации разве что в студенческих научных работах)
Если в моём примере под flow понимать комбинацию IP address/TCP port для источника и приёмника, то да. Если эти параметры неизменны, то хэш будет одинаковый и весь такой траффик уйдёт по одной верёвке из двух. Важно понимать, что даже iperf при многопоточной работе в режиме клиента динамически получает порты и трафик начинает балансироваться. Но для большей эффективности лучше и серверные порты сделать разными, что увеличит равномерность балансировки
Ilya
Ну и еще важный комментарий - что хэш считает и выбирает верёвку отправитель :)
J
Ilya
Я сейчас всё говорил про TransmitHashPolicy=layer3+4 и 802.3ad
Ilya
J
Fedor
Dell и его lifecycle controller готовы с тобой об этом поспорить
J
Fedor
А вы не поверите, но такой херней будто бы там все участники занимаются.
Fedor
Ну у них и под ансибл, как и у хп, свои кастомные обёртки есть
Fedor
да вроде бесплатно. у меня есть ансибл, который забирает с сервака серийник по редфишу, так там то-ли три, то-ли 4 места в зависимости от вендора, который тоже в паре мест может быть прописан, ещё и фолбек по ipmi
Fedor
и лучше всех в этой олимпиаде выступают asrock rack, у которого серийника нет, но можно хотя бы прописать через тулы/инженера и gigabyte, у которого может быть партия с одинаковыми серийниками, но их ещё и хрен поменяешь.
после всего этого зоопарка подобный движ выглядит более чем понятно https://servernews.ru/1094835
Dmitry
J
Каждый BMC должен получить только один запрос, там очередь.
Так, а тогда если можешь поясни в чем смысл предупреждения вот тут:
https://docs.openstack.org/ironic/latest/admin/power-sync.html
In deployments with many nodes and IPMI as the configured BMC protocol, the default values of a 60 seconds power sync interval and 8 worker threads may lead to a high rate of required retries due to client-side UDP packet loss (visible via the corresponding warnings in the conductor logs). While Ironic automatically retries to get the power status for the affected nodes, the failure rate may be reduced by increasing the power sync cycle, e.g. to 300 seconds, and/or by reducing the number of power sync workers, e.g. to 2. Pleae keep in mind, however, that depending on the concrete setup increasing the power sync interval may have an impact on other components relying on up-to-date power states.
J
Не пойму каким образом количество baremetal серверов под управлением ironic может влиять на уровень потерь UDP трафика на стороне BMC контроллеров.
Dmitry
Так, а тогда если можешь поясни в чем смысл предупреждения вот тут:
https://docs.openstack.org/ironic/latest/admin/power-sync.html
In deployments with many nodes and IPMI as the configured BMC protocol, the default values of a 60 seconds power sync interval and 8 worker threads may lead to a high rate of required retries due to client-side UDP packet loss (visible via the corresponding warnings in the conductor logs). While Ironic automatically retries to get the power status for the affected nodes, the failure rate may be reduced by increasing the power sync cycle, e.g. to 300 seconds, and/or by reducing the number of power sync workers, e.g. to 2. Pleae keep in mind, however, that depending on the concrete setup increasing the power sync interval may have an impact on other components relying on up-to-date power states.
Наизусть не помню, но читается как "имейте в виду, ipmi это udp, при большом количестве пакетов некоторые могут теряться"
Dmitry
Тупо из опыта
J
Ищу причину почему супермикровские платформы X12 отвратительно себя ведут с ironic)
Dmitry
Потому что Supermicro? 😁
Dmitry
Используй redfish и самую свежую версию sushy
Dmitry
У нас клиенты используют x12
J
Потому что Supermicro? 😁
С прошлыми поколениями все норм, а вот с новыми они начали ставить новые чипы ASPEED и, видимо, слегка перепиленную прошивку от них. Там небось redfish эмулирует IPMI как-то и получается шляпа.
Dmitry
Я советую не использовать ipmi без крайней необходимости
Dmitry
Теперь когда фокус сместился на redfish, с качеством там все хуже
Dmitry
Ааа, да, есть такая подстава
Dmitry
Сволочи вообще говоря
Dmitry
Ну такая у них бизнес модель
J
Сволочи вообще говоря
Ваще не поспорю. Ну так то микра в мире серверов это как микротик в мире телекома)
На бумажках круто всё, соотношение цена\функционал хорошее, но как доходит до сложных вещей, жопа)
Dmitry
Напиши в понедельник, что у тебя там с ipmi. Я вряд ли помогу, но могу от души посочувствовать.
J
Нет, нельзя на новых платформах)
J
Вот раскопали, но пока не смотрели и не пробовали.
https://github.com/zsrv/supermicro-product-key
Знакомая картинка?)
Nikolay
Я не помню, может и решал какую задачу, но забыл