Алексей
Всем привет, подскажите, с чем может быть проблема: задеплоил андреклауд с помощью tripleo, далее начинаю добавлять ноды для оверклауда, но сталкиваюсь с тем, что не создаются агенты для них. (undercloud) [stack@tripleo-undercloud-01 ~]$ openstack network agent list -f json [ { "ID": "0897033b-54ec-47f4-8ca0-adc8d360c079", "Agent Type": "L3 agent", "Host": "tripleo-undercloud-01.localdomain", "Availability Zone": "nova", "Alive": true, "State": true, "Binary": "neutron-l3-agent" }, { "ID": "133c9ff9-4b44-4d5c-94b7-4a41be5faddc", "Agent Type": "DHCP agent", "Host": "tripleo-undercloud-01.localdomain", "Availability Zone": "nova", "Alive": true, "State": true, "Binary": "neutron-dhcp-agent" }, { "ID": "83d2213d-0f81-4997-ae12-989027559966", "Agent Type": "Open vSwitch agent", "Host": "tripleo-undercloud-01.localdomain", "Availability Zone": null, "Alive": true, "State": true, "Binary": "neutron-openvswitch-agent" } ] Должны появляться еще ironic-neutron-agent под каждый БМ. Появлялись до ребута хоста андреклауда, после ребута увы не появляются.
Алексей
в логах ironic-neutron-agent следующее:
Алексей
2021-11-10 11:06:10.478 3210 WARNING keystoneauth.discover [req-fcf95fa8-b44f-44cf-83c7-0fdb202b3f1b - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url. 2021-11-10 11:06:10.489 3210 WARNING keystoneauth.discover [req-fcf95fa8-b44f-44cf-83c7-0fdb202b3f1b - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url. 2021-11-10 11:06:10.490 3210 ERROR networking_baremetal.ironic_client [req-fcf95fa8-b44f-44cf-83c7-0fdb202b3f1b - - - - -] Ironic API might not be running, failed to establish a connection with ironic, reason: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.. Retrying ...: openstack.exceptions.NotSupported: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.
Алексей
что-то после ребута видать криво поднялось, рестартовал так же контейнер ironic-api, но это не помогает
Mkhl
Hi tcp коннект проходит к 192.168.24.2 на 13385? правила iptable не слетели после ребута?
Алексей
root@tripleo-undercloud-01:[~]: podman exec -ti -u0 ironic_neutron_agent curl -k https://192.168.24.2:13385 |jq { "name": "OpenStack Ironic API", "description": "Ironic is an OpenStack project which aims to provision baremetal machines.", "default_version": { "id": "v1", "links": [ { "href": "https://192.168.24.2:13385/v1/", "rel": "self" } ], "status": "CURRENT", "min_version": "1.1", "version": "1.72" }, "versions": [ { "id": "v1", "links": [ { "href": "https://192.168.24.2:13385/v1/", "rel": "self" } ], "status": "CURRENT", "min_version": "1.1", "version": "1.72" } ] }
Алексей
вроде проходит
Алексей
а вот с правилами кажется беда
Алексей
есть андер поднятый с помощью tripleo-quickstart
Алексей
там вижу большую партянку в input
Алексей
на этом хосту их нет
Mkhl
попробуй довезти недостающие правила. там может и в mangle таблице что-нибудь было
Алексей
довез, но что-то оно не хочет по-прежнему заводится
Алексей
рестартанул еще контейнеры айроника и нейтрона, не помогло(
Mkhl
так а в логах что? кондактор что пишет?
Алексей
в логах ironic-neutron-agent все так же по-прежнему: root@tripleo-undercloud-01:[~]: tail /var/log/containers/neutron/ironic-neutron-agent.log 2021-11-10 20:20:55.414 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'compute': Encountered an exception attempting to process config for project 'nova' (service type 'compute'): no such option valid_interfaces in group [nova]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [nova] 2021-11-10 20:20:55.414 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'placement': Encountered an exception attempting to process config for project 'placement' (service type 'placement'): no such option valid_interfaces in group [placement]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [placement] 2021-11-10 20:20:55.428 69512 WARNING keystoneauth.discover [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url. 2021-11-10 20:20:55.439 69512 WARNING keystoneauth.discover [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url. 2021-11-10 20:20:55.439 69512 ERROR networking_baremetal.ironic_client [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Ironic API might not be running, failed to establish a connection with ironic, reason: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.. Retrying ...: openstack.exceptions.NotSupported: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions. 2021-11-10 20:21:25.465 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'compute': Encountered an exception attempting to process config for project 'nova' (service type 'compute'): no such option valid_interfaces in group [nova]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [nova] 2021-11-10 20:21:25.466 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'placement': Encountered an exception attempting to process config for project 'placement' (service type 'placement'): no such option valid_interfaces in group [placement]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [placement] 2021-11-10 20:21:25.480 69512 WARNING keystoneauth.discover [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url. 2021-11-10 20:21:25.490 69512 WARNING keystoneauth.discover [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url. 2021-11-10 20:21:25.491 69512 ERROR networking_baremetal.ironic_client [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Ironic API might not be running, failed to establish a connection with ironic, reason: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.. Retrying ...: openstack.exceptions.NotSupported: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.
Алексей
в логах кондактора никакого криминала
Алексей
там все ок
Aleksandr
no such option valid_interfaces
Алексей
а что ето значит?
Алексей
какой-то физический интерфейс?
Алексей
сравниваю с другим андером, все тоже самое
Mkhl
интерфейсы все поднялись на хосте?
Алексей
проверил еще раз, да, все интерфейсы поднялись
Алексей
(undercloud) [stack@tripleo-undercloud-01 ~]$ ip a 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever 2: ens192: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP group default qlen 1000 link/ether 00:50:56:b2:ae:b9 brd ff:ff:ff:ff:ff:ff inet 10.10.10.10/24 brd 10.31.136.255 scope global noprefixroute ens192 valid_lft forever preferred_lft forever inet6 fe80::250:56ff:feb2:aeb9/64 scope link noprefixroute valid_lft forever preferred_lft forever 3: ens224: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq master ovs-system state UP group default qlen 1000 link/ether 00:50:56:b2:a8:3e brd ff:ff:ff:ff:ff:ff inet6 fe80::250:56ff:feb2:a83e/64 scope link valid_lft forever preferred_lft forever 4: ovs-system: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000 link/ether e6:cc:78:8c:73:bb brd ff:ff:ff:ff:ff:ff 6: br-int: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000 link/ether 06:03:8d:73:d5:4b brd ff:ff:ff:ff:ff:ff 7: br-ctlplane: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UNKNOWN group default qlen 1000 link/ether 00:50:56:b2:a8:3e brd ff:ff:ff:ff:ff:ff inet 192.168.24.1/24 brd 192.168.24.255 scope global br-ctlplane valid_lft forever preferred_lft forever inet 192.168.24.3/32 brd 192.168.24.3 scope global br-ctlplane valid_lft forever preferred_lft forever inet 192.168.24.2/32 brd 192.168.24.2 scope global br-ctlplane valid_lft forever preferred_lft forever inet6 fe80::250:56ff:feb2:a83e/64 scope link valid_lft forever preferred_lft forever
Алексей
на другом андере тоже самое
Aleksandr
В конфиге это есть ? https://docs.openstack.org/nova/queens/configuration/config.html#glance.valid_interfaces
Алексей
такой параметр в конфигах айроника есть, но он закомментирован
Aleksandr
2021-11-10 20:21:25.465 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'compute': Encountered an exception attempting to process config for project 'nova' (service type 'compute'): no such option valid_interfaces in group [nova]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [nova] 2021-11-10 20:21:25.466 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'placement': Encountered an exception attempting to process config for project 'placement' (service type 'placement'): no such option valid_interfaces in group [placement]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [placement]
Aleksandr
а в нове и плейсменте ?
Aleksandr
он то явно матерится что не может его в конфигах найти
Алексей
grep valid_interface -lr /var/lib/config-data/ /var/lib/config-data/puppet-generated/ironic_inspector/etc/ironic-inspector/inspector.conf /var/lib/config-data/puppet-generated/ironic_api/etc/ironic/ironic.conf /var/lib/config-data/puppet-generated/ironic/etc/ironic/ironic.conf /var/lib/config-data/ironic_inspector/etc/ironic-inspector/inspector.conf /var/lib/config-data/ironic_inspector/etc/ironic/ironic.conf /var/lib/config-data/ironic_api/etc/ironic/ironic.conf /var/lib/config-data/ironic/etc/ironic/ironic.conf
Алексей
в нове и плейсменте получается нет
Алексей
есть другой андер задеплоенный с помощью quickstart'a
Алексей
grep valid_interface -lr /var/lib/config-data/ /var/lib/config-data/puppet-generated/ironic_api/etc/ironic/ironic.conf /var/lib/config-data/puppet-generated/ironic_inspector/etc/ironic-inspector/inspector.conf /var/lib/config-data/puppet-generated/ironic/etc/ironic/ironic.conf /var/lib/config-data/puppet-generated/nova/etc/nova/nova.conf /var/lib/config-data/ironic_api/etc/ironic/ironic.conf /var/lib/config-data/ironic_inspector/etc/ironic-inspector/inspector.conf /var/lib/config-data/ironic_inspector/etc/ironic/ironic.conf /var/lib/config-data/ironic/etc/ironic/ironic.conf /var/lib/config-data/nova/etc/nova/nova.conf
Алексей
там вот такой список
Алексей
есть нова
Алексей
и там этот параметр расскоментирован
Алексей
возможно действительно в этом проблема
Aleksandr
valid_interfaces Type: list Default: internal,public List of interfaces, in order of preference, for endpoint URL.
Aleksandr
если параметра нет то берется дефолт
Aleksandr
а интерфейсов с такими именами нет
Aleksandr
едпоинты развесить не могут сервисы соответственно
Алексей
[ { "Service Name": "keystone", "Interface": "internal", "URL": "http://192.168.24.3:5000" }, { "Service Name": "keystone", "Interface": "public", "URL": "https://192.168.24.2:13000" }, { "Service Name": "ironic-inspector", "Interface": "public", "URL": "https://192.168.24.2:13050" }, { "Service Name": "ironic", "Interface": "public", "URL": "https://192.168.24.2:13385" }, { "Service Name": "ironic", "Interface": "internal", "URL": "http://192.168.24.3:6385" }, { "Service Name": "neutron", "Interface": "internal", "URL": "http://192.168.24.3:9696" }, { "Service Name": "ironic-inspector", "Interface": "admin", "URL": "http://192.168.24.3:5050" }, { "Service Name": "ironic-inspector", "Interface": "internal", "URL": "http://192.168.24.3:5050" }, { "Service Name": "ironic", "Interface": "admin", "URL": "http://192.168.24.3:6385" }, { "Service Name": "keystone", "Interface": "admin", "URL": "http://192.168.24.3:35357" }, { "Service Name": "neutron", "Interface": "admin", "URL": "http://192.168.24.3:9696" }, { "Service Name": "neutron", "Interface": "public", "URL": "https://192.168.24.2:13696" } ]
Алексей
собственно таких ендпонитов вообще нет 😳
Алексей
ни у новы ни у плейсмента
Алексей
создам попозже руками, проверю заработает ли
Алексей
создавать ендпоинты для новы и плейсмента не пришлось, этих сервисов и вовсе не было в андере
Алексей
проблема оказалась в публичнои ендпоинте айроника
Алексей
Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url.
Алексей
тут идет обращение к haproxy, в логах хапрокси я увидел SSL handshake failure и сделал пока по-наркомански, переделал публичный ендпоинт на http
Алексей
теперь создаются агенты ironic-neutron-agent для бареметаллов
Алексей
подсмотрел, что в колле в ironic_neutron_agent.ini добавлятеся параметр cafile
Алексей
вернул ендпоинту https и добавил так же cafile в ини файл
Алексей
стало ок
Алексей
root@tripleo-undercloud-1:[~]: podman exec ironic_neutron_agent cat etc/neutron/plugins/ml2/ironic_neutron_agent.ini [ironic] auth_type=password auth_url=http://192.168.24.3:5000 username=ironic password=S4sKbc7obrtWBgVhxpPGkk08v project_domain_name=Default project_name=service user_domain_name=Default region_name=regionOne cafile=/etc/pki/tls/certs/ca-bundle.trust.crt
Vyacheslav
ткните в мануал, как добавить ещё один DHCP server в созданную subnet...
J
ткните в мануал, как добавить ещё один DHCP server в созданную subnet...
В конфиге нейтрона надо поменять. dhcp_agents_per_network =
Vyacheslav
В конфиге нейтрона надо поменять. dhcp_agents_per_network =
это есть, но для старых сетей он не создал новые
J
это есть, но для старых сетей он не создал новые
Скорее всего и не создаст. Пробовал выкл\вкл dhcp делать для подсетей?
J
Есть еще способ.
J
Если у тебя уже созданы и зарегистрированы DHCP агенты, можно сделать openstack agent add network --dhcp <agent-id> <network>
Vyacheslav
а как в коле использовать на compute nova-manage?
Vyacheslav
Fedor
на кампуте наверное никак, кампута не должна ходить в базу
Vyacheslav
https://access.redhat.com/solutions/6370731
Vyacheslav
на кампуте наверное никак, кампута не должна ходить в базу
да запустил с контрола всё вроде заработало
Via funky
Коллеги, а CVE-2016-7404 в Magnum уже пофиксили? а то Kolla все еще на него ссылается если выставлять - enable_cluster_user_trust: true
Via funky
Еще вопрос, при создание кластера с помощью magnum - кластер создает одну ноду - мастер. И дальше ждет, ничего не делая. шаблон создания: openstack coe cluster template create kubernetes-cluster-template \ --image Fedora-CoreOS-34 \ --external-network public \ --dns-nameserver 8.8.8.8 \ --master-flavor m1.small \ --flavor m1.small \ --coe kubernetes
Via funky
В чем может быть проблема?
AcidMan
В чем может быть проблема?
а кластер то какой командой создаёте?
AcidMan
ну и что значит ждёт? openstack coe cluster show что показывает?
Via funky
а кластер то какой командой создаёте?
openstack coe cluster create kubernetes-cluster \ --cluster-template kubernetes-cluster-template \ --master-count 1 \ --node-count 1 \ --keypair admin
AcidMan
и что в логах?
Via funky
ну и что значит ждёт? openstack coe cluster show что показывает?
$ openstack coe cluster show kubernetes-cluster +----------------------+------------------------------------------------------------+ | Field | Value | +----------------------+------------------------------------------------------------+ | status | CREATE_IN_PROGRESS | | health_status | None | | cluster_template_id | 9a420dea-b766-4513-8127-cd98b767a142 | | node_addresses | [] | | uuid | 49bd12f3-27db-486a-a434-a82b5d4f5eaa | | stack_id | 95a2a67a-c4c8-4409-b2c6-998daf499438 | | status_reason | None | | created_at | 2021-11-12T19:09:08+00:00 | | updated_at | 2021-11-12T19:09:14+00:00 | | coe_version | None | | labels | {} | | labels_overridden | {} | | labels_skipped | {} | | labels_added | {} | | fixed_network | None | | fixed_subnet | None | | floating_ip_enabled | True | | faults | | | keypair | admin | | api_address | None | | master_addresses | [] | | master_lb_enabled | False | | create_timeout | 60 | | node_count | 1 | | discovery_url | https://discovery.etcd.io/d1750709ddcbb5893d553b92689f0f1a | | docker_volume_size | None | | master_count | 1 | | container_version | None | | name | kubernetes-cluster | | master_flavor_id | m1.small | | flavor_id | m1.small | | health_status_reason | {} | | project_id | a4772ae150414b02adf9052a449a6605 | +----------------------+------------------------------------------------------------+
Via funky
и что в логах?
ERROR magnum.drivers.heat.k8s_fedora_template_def [req-0b5cd0b8-71f6-448d-8520-cf6c8f91ac4f - - - - -] Failed to load default keystone auth policy: FileNotFoundError: [Errno 2] No such file or directory: '/etc/magnum/keystone_auth_default_policy.json'
Via funky
ответ на вопрос получен, как я понимаю?
Не совсем... I have seen the keystone_auth_default_policy.json error and it should not prevent magnum from working. Я видел эту ошибку но говорят такое может быть из за SSL сертификата