Anonymous
как-то странно давать тему, которую не любой товарищ в из профильного комьюнити с ходу осилит.
Alexandr
Anonymous
Radik
Понятия не имею )
Radik
Но доблестный Михаил из чата Ceph взял контакт и пошел помогать.
Anonymous
сломает жизнь девочке :(
Radik
За сим кланяюсь и тему можно закрыть )
Михаил
Михаил
Или это какой то другой?
Radik
А вдруг жену найдет? :)
Anonymous
будете потом её по митапам и конференциями про open source искать...
Михаил
Тут много Михаилов
Ilya
Yuf
Александр
a1eXei
Кто знает, кто знает) Может серьёзно она станет ведущим программист какого-нибудь нового известного open source проекта 🙈
Yuf
Тема сисек не раскрыта
Igor
как то странно, работало все и потом начались ошибки вида
2017-06-20 22:59:12.997 104663 DEBUG nova.compute.utils [req-6fbf898d-e1de-4690-92dc-0d1605c99712 955553174dbf41128778b11aaaa25cc0 ef3badbd48a94dcfb20cec0f12e75ffe - - -] [instance: a5cde9be-602b-480a-9c97-6f44167c8c59] internal error: process exited while connecting to monitor: warning: host doesn't support requested feature: CPUID.80000001H:ECX.svm [bit 2]
при создании инстанса
Anonymous
так логи libvirt/инстанса надо смотреть
Igor
да там
warning: host doesn't support requested feature: CPUID.80000001H:ECX.svm [bit 2]
2017-06-20T21:35:16.797235Z qemu-system-x86_64: cannot set up guest memory 'pc.ram': Cannot allocate memory
получается что все же память не мог выделить
Artem
Коллеги, сколько памяти используется для миграции? У меня есть нода с флавором в 2GB, есть гипервизор с free_Memory 4152GB. Миграция не проходит с ошибкой https://pastebin.com/Fa5igjEh.
Если я добавляю гипервизор с 12Gb памяти, то на него без проблем мигрирует.
То есть мне для миграции 2GB инстанса нужно как миниум 12GB оперативы? =)
Artem
Artem
Коллеги, такой вопрос, могу ли я приатачить port из сети без subnet на ней, типа вот так:
neutron port-create --port_security_enabled=false --no-security-groups vlan2
nova interface-attach --port-id b217122d-e3ed-4609-949d-70790ed1910e 2c0c4645-0ce2-49c5-8083-190cd847846d
/usr/lib/python2.7/dist-packages/novaclient/client.py:278: UserWarning: The 'tenant_id' argument is deprecated in Ocata and its use may result in errors in future releases. As 'project_id' is provided, the 'tenant_id' argument will be ignored.
warnings.warn(msg)
ERROR (BadRequest): Network requires port_security_enabled and subnet associated in order to apply security groups. (HTTP 400) (Request-ID: req-168176fc-eee9-4f0b-805e-2231df1717c7)
Anonymous
вряд ли.
Anonymous
даже sr-iov сети требуют какого-нибудь сабнета.
Anonymous
хотя он и не играет рояля для них
Artem
Ну то есть мне завести какую нибудь серую subnet и отключить dhcp
Anonymous
примерно, да.
Igor
@ArtemKaramyshev в итоге с выключенным оверкоммитом виртуальная память была вся занята и не создавались виртуалки и вручную) включил оверкоммит + ksm
citius
поднимал этот вопрос уже недавно, агенты нейтрона выпадают в ххх как-то рандомно.
опенстек оката.
например сейчас это выглядит так:
[root@stack-node3 neutron]# neutron agent-list | grep xxx
neutron CLI is deprecated and will be removed in the future. Use openstack CLI instead.
| 58b64c8b-2781-48c0-ba85-ef85b71aa634 | Linux bridge agent | stack-node3 | | xxx | True | neutron-linuxbridge-agent |
| 97727698-7fb7-4d99-8ec7-dd1c20cad161 | L3 agent | stack-node2 | nova | xxx | True | neutron-l3-agent |
| b0c5e227-026b-43fd-807a-97968f0edd74 | Metadata agent | stack-node3 | | xxx | True | neutron-metadata-agent |
| f24a70bb-07f1-43e0-81eb-5e73bc233398 | Metadata agent | stack-node2 | | xxx | True | neutron-metadata-agent |
если рестартнуть или даже удалить эти агенты, то ситуация повторяется позже, но могут быть агенты с других хостов (всего три хоста)
в логе с дебагом нихрена толком нет ) в том же логе линуксбридж агента сильно подозрительных записей не видно.
шо делать? :)
Anonymous
смотреть системные логи гипервизора?
Roman
раббит?
Anonymous
и rabbit тоже, кстати.
citius
реббит вот подозрительно, да. в логе метадата и других агентов есть такое:
2017-06-21 10:46:34.065 17679 ERROR oslo.messaging._drivers.impl_rabbit [-] [3f1a164a-cd1e-4b3b-a502-178a373ad320] AMQP server rabbit-cluster:5672 closed the connection. Check login credenti
als: Socket closed
2017-06-21 10:46:35.087 17679 INFO oslo.messaging._drivers.impl_rabbit [-] [3f1a164a-cd1e-4b3b-a502-178a373ad320] Reconnected to AMQP server on rabbit-cluster:5672 via [amqp] client with por
t 60162.
2017-06-21 10:54:26.852 17668 ERROR oslo.messaging._drivers.impl_rabbit [-] [73aacf81-0cad-400b-9fdd-69ed6c8a47b7] AMQP server rabbit-cluster:5672 closed the connection. Check login credenti
als: Socket closed
2017-06-21 10:54:27.874 17668 INFO oslo.messaging._drivers.impl_rabbit [-] [73aacf81-0cad-400b-9fdd-69ed6c8a47b7] Reconnected to AMQP server on rabbit-cluster:5672 via [amqp] client with por
t 38014.
Anonymous
агенты - это демоны. их даже oom killer может дропать.
citius
но реббит живой, все три ноды живые, на вид проблем нет
Roman
cluster_status норм?
citius
нет, процессы живые. но дерегистрируются.
citius
да, норм
citius
[root@stack-node3 neutron]# rabbitmqctl cluster_status
Cluster status of node 'rabbit@stack-node3' ...
[{nodes,[{disc,['rabbit@stack-node1','rabbit@stack-node2',
'rabbit@stack-node3']}]},
{running_nodes,['rabbit@stack-node1','rabbit@stack-node2',
'rabbit@stack-node3']},
{cluster_name,«"rabbit@stack-node1"»},
{partitions,[]},
{alarms,[{'rabbit@stack-node1',[]},
{'rabbit@stack-node2',[]},
{'rabbit@stack-node3',[]}]}]
Anonymous
проблема IP связности?
Roman
мту мож?
Anonymous
в syslog/messages точно ничего подозрительного?
Roman
вот еще, мож чем поможет
Roman
https://www.slideshare.net/michaelklishin/troubleshooting-common-oslomessaging-and-rabbitmq-issues
citius
не, в системных логах чисто.
айпи связность чего с чем? там 10Г интерфейсы, мту везде стоит 9к
Roman
а точно везде? )
citius
перепроверю щас. но было норм когда настраивалось )
Artem
citius
валом ресурсов. на активном контроллере сейчас LA 1.2 из 32 ядер. памяти из 128 свободно 90
citius
это новая инсталляция, пока и нагрузки то нет )
Artem
citius
больше всего жрет кролик
citius
порядка 15% постоянно
Artem
А очереди покажите?
citius
ок, чуть позже скину, спс.
Roman
а скока файловых дескрипторов и сокетов раббит использует в данный момент?
Roman
file_descriptors
{total_used
{sockets_used
citius
MTU перепроверил, везде совпадает.
{file_descriptors,
[{total_limit,924},
{total_used,505},
{sockets_limit,829},
{sockets_used,503}]},
citius
list_queues большую портянку выдает. что оттуда показать?
citius
citius
да, есть. как раз смотрю этот листинг.
citius
24 0 q-agent-notifier-l2population-update_fanout_d46d9f35a83a4916be4bf934fac354b5
citius
и другие аналогичные, как раз сетевые агенты.
citius
я вот нашел что у меня somaxconn был низкий, потому что в сисктл параметры завезли, а ребута не было, и перечитать проебали )
citius
но пока вроде не помогло
citius
2017-06-21 13:00:45.929 26046 ERROR neutron.agent.dhcp.agent [req-2bfd4950-b733-4216-9962-77c43cdb2212 - - - - -] Timeout notifying server of ports ready. Retrying...
citius
вот похоже что отвалы каким-то образом происходят
citius
нашел я короче главный косяк.
citius
NTP
citius
время разъехалось слишком сильно. как поправил время, все заработало с полпинка. все агенты онлайн, машины создаются, все в ажуре.
citius
а время разъехалось потому что сука нейтрон дефолт роуты на хостах унес куда не надо. ну это уже мой косяк наверное даже больше.
citius
всем спасибо за мысли )
Andrey
насколько сильно разъехалось ?
citius
1-2 мин
Александр
Коллеги добрый день. если кому интересно https://www.ptsecurity.com/ru-ru/research/webinar/282877/
Anonymous
а что умеет этот firewall?
Александр
Вебинар посвещен не самой функции. А то как она укалдывается в концепцию NFV. То как платформа оркестрирует функции сторонних разработчиков.