NS 🇷🇺
Слышал тут на такое с ovs жаловались. @ftarasenko да?
у нас на 2 секунды падает с DVR сетями
NS 🇷🇺
на квинсе
Fedor
Слышал тут на такое с ovs жаловались. @ftarasenko да?
да, в R есть коммит, который собирает овёс до того, как начинается миграция
Fedor
там был DVR, но это не должно иметь отношения
Fedor
поскольку воспроизводится на тенантных адресах, не на паблике
NS 🇷🇺
ну в принципе логично
Artyom
Господа, а кто-нибудь уже делал кластер с гипервизорами на разных архитектурах?
Я и твой кот
Кто интересовался, Airship (который 1.x) на Ubuntu 18.04 и на релизе Stain.
Я и твой кот
Да, спасибо большое!
Нашёл, что команда начала готовить миграцию на Train, но это не мои ребята, особо деталей у меня нет. Но в апстрим что-то всё равно видно будет, как пойдёт.
Vladyslav
Я тут нашел ребят из проекта opnfv, у них тоже можно посмотреть варианты, все открыто кроме блин пайплайна
Vladyslav
приходится по кускам собирать
Vladyslav
инфу
Я и твой кот
Апгрейд: Shipyard –> Armada и всё как обычно
Vladyslav
Да, это у меня следующий этап.
Vladyslav
> команда начала готовить миграцию на Train Ты ж говорил, что апдейт между версиями не того, вы ж не новыми клаудами мигрируете?
Я и твой кот
> команда начала готовить миграцию на Train Ты ж говорил, что апдейт между версиями не того, вы ж не новыми клаудами мигрируете?
Между мажорными версиями я вживую процесса у нас не видел. Но пишут, что готовят in-flight upgrade stein->train. Ставим политику rollingupdate pod’ам, и поехали. Но это пока в разработке, на сколько я вижу доки, репо и пайплайны.
Vladyslav
Я и твой кот
Если бы ролингапдейтами только можно было обойтись, базу же миграчить надо
Вот этим и занимаемся. Раббит ещё потенциально. Ну и там много что ещё. Что-то деприкейтнулось. Операционка уже 18.04, там systemd-resolved, chrony, netplan, etc. Дрова новые на сетевушки.
Vadim
Привет! Есть вопрос по Openstack (Stein) + Ceilometer + Gnocchi Пробую получить cpu util по статье https://medium.com/@berndbausch/how-i-learned-to-stop-worrying-and-love-gnocchi-aggregation-c98dfa2e20fe или по ответу https://stackoverflow.com/questions/56216683/openstack-get-vm-cpu-util-with-stein-version # gnocchi aggregates '(metric cpu rate:mean)' id=0203af36-f579-4e06-8a82-f4f4ccd4d487 | tail -3 | 0203af36-f579-4e06-8a82-f4f4ccd4d487/cpu/rate:mean | 2020-06-19T08:20:00+00:00 | 300.0 | 91430000000.0 | | 0203af36-f579-4e06-8a82-f4f4ccd4d487/cpu/rate:mean | 2020-06-19T08:25:00+00:00 | 300.0 | 92510000000.0 | +----------------------------------------------------+---------------------------+-------------+---------------+ # gnocchi aggregates '(aggregate rate:mean (metric cpu mean))' id=0203af36-f579-4e06-8a82-f4f4ccd4d487 Invalid input: 'aggregate' operation invalid for dictionary value @ data[u'operations'] (HTTP 400) Никто не сталкивался?
irondyn
Привет. Вляпался в вопрос с зависающими миграциями. Может кто-то сталкивался/видел рецепт? Newton. На одной из нод openstack'a случился oom. После этого перестали нормально работать миграции. В том числе и для остальных нод. Перезапуск служб не помогает. По virsh list —all вижу, что инстансы приезжают на целевую ноду, однако в openstack повисает состояние migrating, в базе nova висят указания на исходную ноду, в neutron указания migrating to. На исходной ноде в node-compute.log болтаются сообщения вида: Migration operation has completed Error monitoring migration: The server has either erred or is incapable of performing the requested operation. (HTTP 500) Live migration failed. VM Stopped (Lifecycle Event). После чего периодически повторяющиеся During sync_power_state the instance has a pending task (migrating). Skip. При этом на целевой ноде VM Resumed (Lifecycle Event) During the sync_power process the instance has moved from host node5 to host node2. Значения в базе конечно поправить можно (что я и делал), но это помогает ровно до первой лайв-миграции. Рассинхроны фактического состояния инстансов и тем, что говорит openstack ловил и раньше, но то были случайные какие-то события. Здесь же какое-то повальное влияние на все тестовые инстансы. С продакшн инстансами, скорее всего, будет то же самое.
Vadim
Мне нужно получить сpu utilization истанса в процентах, для внешней системы.
Tamerlan
Мне нужно получить сpu utilization истанса в процентах, для внешней системы.
вот пусть внешняя система и считает у тебя utilization, а в гноче бери cpu
Vadim
Да так и придется делать.
Tamerlan
трансформировать данные разработчики целометра на своей стороне отказались - бери данные и делай что хочешь
Vadim
это понятно, ну так gnocchi есть post-processing, хотелось бы воспользоваться
Tamerlan
это понятно, ну так gnocchi есть post-processing, хотелось бы воспользоваться
я как-то в попугаях получаю у себя с помощью post-processing, но оно не похоже на решение для продакшена
Tamerlan
если это метрики для бизнеса, то лучше просто у себя пересчитывать хер пойми что в этой гноче происходит
Tamerlan
а если это мониторинг, то я бы промом воспользовался
Aleksey
а если это мониторинг, то я бы промом воспользовался
Вот скажите, а либвирт-экспортер разве не закрывает все потребности по мониторингу ВМ?
Tamerlan
Вот скажите, а либвирт-экспортер разве не закрывает все потребности по мониторингу ВМ?
да наверное то и закрывает, но метрики не только для мониторинга люди используют - а пром это довольно узкий инструмент
Aleksey
ага
Что-то ещё?
Tamerlan
Что-то ещё?
немножко не понял вопроса
Aleksey
немножко не понял вопроса
Ну я к тому что для билинга вы же не КлаудКити используете, а скорее всего что-то своё. Таким образом вы научились забирать данные из одной таймсиреесбд, а пром при этом узкий инструмент?
Jain
Пром не точен. И для биллинга мало подходит из за этой причины. Когда счёт так сказать по секундам идёт и все стоит денег то пром тут проигрывает.
Jain
В интернетах много статей почему пром для этого не подходит.
Tamerlan
я вот его не трогал, но был опыт с таносом, там как-то всё тоже через жопу
Aleksey
а есть опыт?
@stress_t может больше рассказать
Jain
Даже и поминутно или даже почасовая не подойдёт для прома. Пром аггрегирует и компримирует данные. Это для биллинга ... Так себе
Tamerlan
Даже и поминутно или даже почасовая не подойдёт для прома. Пром аггрегирует и компримирует данные. Это для биллинга ... Так себе
ну наверное компримирование ничего плохого в себе не несёт, проблемы то начинаются когда нужно всё это дело скейлить
Pavel
VM сейчас прожовывакт 25к записей в секунду. Пишется в два стораджа. За месяц получается около 50 гигов. Пром там сдох и половины не осилив
Pavel
Jain
50гб в месяц это не очень много. Сколько у вас таргетов и как часто опрашивается? (Я тут тоже пром везде запили. Через неделю предстоит. Запилить ещё на 500-600 свитчей. Вот боюсь немного :)
Tamerlan
на каком временном промежутке оно начинает тормозить? т.е., за три месяца можно получить статистику?
Pavel
таргетов порядка 300
Pavel
раз в 15 секунд.
Pavel
пром в день на этих данных давал около 10-12 гигов. виктория 1
Aleksey
раз в 15 секунд.
Ну не все, те что в кубе некоторые имеют свои скраб интервалы
Pavel
прому нужно было около 32 гигов. виктория живет на 8
Jain
Ну по Гб сколько он кушает и сколько нам жрет всерогно. Главное чтоб нелагал и не падал :)
Pavel
скажем так по субъективным оценкам виктория наголову выше прома.
J
Привет. Вляпался в вопрос с зависающими миграциями. Может кто-то сталкивался/видел рецепт? Newton. На одной из нод openstack'a случился oom. После этого перестали нормально работать миграции. В том числе и для остальных нод. Перезапуск служб не помогает. По virsh list —all вижу, что инстансы приезжают на целевую ноду, однако в openstack повисает состояние migrating, в базе nova висят указания на исходную ноду, в neutron указания migrating to. На исходной ноде в node-compute.log болтаются сообщения вида: Migration operation has completed Error monitoring migration: The server has either erred or is incapable of performing the requested operation. (HTTP 500) Live migration failed. VM Stopped (Lifecycle Event). После чего периодически повторяющиеся During sync_power_state the instance has a pending task (migrating). Skip. При этом на целевой ноде VM Resumed (Lifecycle Event) During the sync_power process the instance has moved from host node5 to host node2. Значения в базе конечно поправить можно (что я и делал), но это помогает ровно до первой лайв-миграции. Рассинхроны фактического состояния инстансов и тем, что говорит openstack ловил и раньше, но то были случайные какие-то события. Здесь же какое-то повальное влияние на все тестовые инстансы. С продакшн инстансами, скорее всего, будет то же самое.
Привет! А что nova-compute на проблемном сервере? В нормальном состоянии? enabled/up? Логи смотришь в дебаг режиме? По твоему описанию ничего непонятно же пока. И, судя по тому, что никто не ответил сходу это не баг какой-то, а экзотическая ситуация. Поэтому без дебага никак.
Григорій
Здравствуйте , а есть здесь у кого-то отпыт работы с ironic-tempest-plugin ?
Григорій
У меня есть некоторый, а что нужно?
Да что-то получаю No valid host was found при выполнении ironic_tempest_plugin.tests.scenario.test_baremetal_basic_ops.BaremetalBasicOps.test_baremetal_server_ops
Dmitry
Надо смотреть в логах nova-scheduler и nova-compute, что там нове не нравится.
Dmitry
Ну и убедиться, что всё настроил правильно: tempest не отвечает за создания корректных флейворов, например.
Григорій
От за флейворы тоже думал, пока здесь копаю, но что-то безуспешно
Dmitry
как успехи?
Пока никак, переключился на другой проект
Jain
Добрый день, а есть ли возможность экспортировать полностью весь проект? Со всеми сетями, метой, данными в циндере и свифте итд. Так сказать переехать с одного стэка на другой?
Dmitry
Добрый день, а есть ли возможность экспортировать полностью весь проект? Со всеми сетями, метой, данными в циндере и свифте итд. Так сказать переехать с одного стэка на другой?
Ну в теории достаточно перенести базу и данные. Но на практике, при отличающемся окружении будет много, очень много обработок напильником и не факт, что успешном
Jain
Мне не все проекты. А только один бы перенести малой кровью.
Dmitry
Dmitry
мсье знает толк
Pavel
Вы слишком хорошо думает о openstack. там такая хрень твориться в таблицах бд