Алексей
Всем привет, подскажите, с чем может быть проблема: задеплоил андреклауд с помощью tripleo, далее начинаю добавлять ноды для оверклауда, но сталкиваюсь с тем, что не создаются агенты для них.
(undercloud) [stack@tripleo-undercloud-01 ~]$ openstack network agent list -f json
[
{
"ID": "0897033b-54ec-47f4-8ca0-adc8d360c079",
"Agent Type": "L3 agent",
"Host": "tripleo-undercloud-01.localdomain",
"Availability Zone": "nova",
"Alive": true,
"State": true,
"Binary": "neutron-l3-agent"
},
{
"ID": "133c9ff9-4b44-4d5c-94b7-4a41be5faddc",
"Agent Type": "DHCP agent",
"Host": "tripleo-undercloud-01.localdomain",
"Availability Zone": "nova",
"Alive": true,
"State": true,
"Binary": "neutron-dhcp-agent"
},
{
"ID": "83d2213d-0f81-4997-ae12-989027559966",
"Agent Type": "Open vSwitch agent",
"Host": "tripleo-undercloud-01.localdomain",
"Availability Zone": null,
"Alive": true,
"State": true,
"Binary": "neutron-openvswitch-agent"
}
]
Должны появляться еще ironic-neutron-agent под каждый БМ. Появлялись до ребута хоста андреклауда, после ребута увы не появляются.
Алексей
в логах ironic-neutron-agent следующее:
Алексей
2021-11-10 11:06:10.478 3210 WARNING keystoneauth.discover [req-fcf95fa8-b44f-44cf-83c7-0fdb202b3f1b - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url.
2021-11-10 11:06:10.489 3210 WARNING keystoneauth.discover [req-fcf95fa8-b44f-44cf-83c7-0fdb202b3f1b - - - - -] Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url.
2021-11-10 11:06:10.490 3210 ERROR networking_baremetal.ironic_client [req-fcf95fa8-b44f-44cf-83c7-0fdb202b3f1b - - - - -] Ironic API might not be running, failed to establish a connection with ironic, reason: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.. Retrying ...: openstack.exceptions.NotSupported: The baremetal service for 192.168.24.3:regionOne exists but does not have any supported versions.
Алексей
что-то после ребута видать криво поднялось, рестартовал так же контейнер ironic-api, но это не помогает
Mkhl
Hi
tcp коннект проходит к 192.168.24.2 на 13385? правила iptable не слетели после ребута?
Алексей
root@tripleo-undercloud-01:[~]: podman exec -ti -u0 ironic_neutron_agent curl -k https://192.168.24.2:13385 |jq
{
"name": "OpenStack Ironic API",
"description": "Ironic is an OpenStack project which aims to provision baremetal machines.",
"default_version": {
"id": "v1",
"links": [
{
"href": "https://192.168.24.2:13385/v1/",
"rel": "self"
}
],
"status": "CURRENT",
"min_version": "1.1",
"version": "1.72"
},
"versions": [
{
"id": "v1",
"links": [
{
"href": "https://192.168.24.2:13385/v1/",
"rel": "self"
}
],
"status": "CURRENT",
"min_version": "1.1",
"version": "1.72"
}
]
}
Алексей
вроде проходит
Алексей
а вот с правилами кажется беда
Алексей
есть андер поднятый с помощью tripleo-quickstart
Алексей
там вижу большую партянку в input
Алексей
на этом хосту их нет
Mkhl
попробуй довезти недостающие правила. там может и в mangle таблице что-нибудь было
Алексей
довез, но что-то оно не хочет по-прежнему заводится
Алексей
рестартанул еще контейнеры айроника и нейтрона, не помогло(
Mkhl
так а в логах что? кондактор что пишет?
Алексей
в логах кондактора никакого криминала
Алексей
там все ок
Aleksandr
no such option valid_interfaces
Алексей
а что ето значит?
Алексей
какой-то физический интерфейс?
Алексей
сравниваю с другим андером, все тоже самое
Mkhl
интерфейсы все поднялись на хосте?
Алексей
проверил еще раз, да, все интерфейсы поднялись
Алексей
(undercloud) [stack@tripleo-undercloud-01 ~]$ ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: ens192: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP group default qlen 1000
link/ether 00:50:56:b2:ae:b9 brd ff:ff:ff:ff:ff:ff
inet 10.10.10.10/24 brd 10.31.136.255 scope global noprefixroute ens192
valid_lft forever preferred_lft forever
inet6 fe80::250:56ff:feb2:aeb9/64 scope link noprefixroute
valid_lft forever preferred_lft forever
3: ens224: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq master ovs-system state UP group default qlen 1000
link/ether 00:50:56:b2:a8:3e brd ff:ff:ff:ff:ff:ff
inet6 fe80::250:56ff:feb2:a83e/64 scope link
valid_lft forever preferred_lft forever
4: ovs-system: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000
link/ether e6:cc:78:8c:73:bb brd ff:ff:ff:ff:ff:ff
6: br-int: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000
link/ether 06:03:8d:73:d5:4b brd ff:ff:ff:ff:ff:ff
7: br-ctlplane: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UNKNOWN group default qlen 1000
link/ether 00:50:56:b2:a8:3e brd ff:ff:ff:ff:ff:ff
inet 192.168.24.1/24 brd 192.168.24.255 scope global br-ctlplane
valid_lft forever preferred_lft forever
inet 192.168.24.3/32 brd 192.168.24.3 scope global br-ctlplane
valid_lft forever preferred_lft forever
inet 192.168.24.2/32 brd 192.168.24.2 scope global br-ctlplane
valid_lft forever preferred_lft forever
inet6 fe80::250:56ff:feb2:a83e/64 scope link
valid_lft forever preferred_lft forever
Алексей
на другом андере тоже самое
Aleksandr
В конфиге это есть ? https://docs.openstack.org/nova/queens/configuration/config.html#glance.valid_interfaces
Алексей
такой параметр в конфигах айроника есть, но он закомментирован
Aleksandr
2021-11-10 20:21:25.465 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'compute': Encountered an exception attempting to process config for project 'nova' (service type 'compute'): no such option valid_interfaces in group [nova]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [nova]
2021-11-10 20:21:25.466 69512 WARNING openstack [req-739a0d5e-8d21-4193-8cff-1b661c659ffe - - - - -] Disabling service 'placement': Encountered an exception attempting to process config for project 'placement' (service type 'placement'): no such option valid_interfaces in group [placement]: oslo_config.cfg.NoSuchOptError: no such option valid_interfaces in group [placement]
Aleksandr
а в нове и плейсменте ?
Aleksandr
он то явно матерится что не может его в конфигах найти
Алексей
grep valid_interface -lr /var/lib/config-data/
/var/lib/config-data/puppet-generated/ironic_inspector/etc/ironic-inspector/inspector.conf
/var/lib/config-data/puppet-generated/ironic_api/etc/ironic/ironic.conf
/var/lib/config-data/puppet-generated/ironic/etc/ironic/ironic.conf
/var/lib/config-data/ironic_inspector/etc/ironic-inspector/inspector.conf
/var/lib/config-data/ironic_inspector/etc/ironic/ironic.conf
/var/lib/config-data/ironic_api/etc/ironic/ironic.conf
/var/lib/config-data/ironic/etc/ironic/ironic.conf
Алексей
в нове и плейсменте получается нет
Алексей
есть другой андер задеплоенный с помощью quickstart'a
Алексей
grep valid_interface -lr /var/lib/config-data/
/var/lib/config-data/puppet-generated/ironic_api/etc/ironic/ironic.conf
/var/lib/config-data/puppet-generated/ironic_inspector/etc/ironic-inspector/inspector.conf
/var/lib/config-data/puppet-generated/ironic/etc/ironic/ironic.conf
/var/lib/config-data/puppet-generated/nova/etc/nova/nova.conf
/var/lib/config-data/ironic_api/etc/ironic/ironic.conf
/var/lib/config-data/ironic_inspector/etc/ironic-inspector/inspector.conf
/var/lib/config-data/ironic_inspector/etc/ironic/ironic.conf
/var/lib/config-data/ironic/etc/ironic/ironic.conf
/var/lib/config-data/nova/etc/nova/nova.conf
Алексей
там вот такой список
Алексей
есть нова
Алексей
и там этот параметр расскоментирован
Алексей
возможно действительно в этом проблема
Aleksandr
valid_interfaces
Type: list
Default: internal,public
List of interfaces, in order of preference, for endpoint URL.
Aleksandr
если параметра нет то берется дефолт
Aleksandr
а интерфейсов с такими именами нет
Aleksandr
едпоинты развесить не могут сервисы соответственно
Алексей
[
{
"Service Name": "keystone",
"Interface": "internal",
"URL": "http://192.168.24.3:5000"
},
{
"Service Name": "keystone",
"Interface": "public",
"URL": "https://192.168.24.2:13000"
},
{
"Service Name": "ironic-inspector",
"Interface": "public",
"URL": "https://192.168.24.2:13050"
},
{
"Service Name": "ironic",
"Interface": "public",
"URL": "https://192.168.24.2:13385"
},
{
"Service Name": "ironic",
"Interface": "internal",
"URL": "http://192.168.24.3:6385"
},
{
"Service Name": "neutron",
"Interface": "internal",
"URL": "http://192.168.24.3:9696"
},
{
"Service Name": "ironic-inspector",
"Interface": "admin",
"URL": "http://192.168.24.3:5050"
},
{
"Service Name": "ironic-inspector",
"Interface": "internal",
"URL": "http://192.168.24.3:5050"
},
{
"Service Name": "ironic",
"Interface": "admin",
"URL": "http://192.168.24.3:6385"
},
{
"Service Name": "keystone",
"Interface": "admin",
"URL": "http://192.168.24.3:35357"
},
{
"Service Name": "neutron",
"Interface": "admin",
"URL": "http://192.168.24.3:9696"
},
{
"Service Name": "neutron",
"Interface": "public",
"URL": "https://192.168.24.2:13696"
}
]
Алексей
собственно таких ендпонитов вообще нет 😳
Алексей
ни у новы ни у плейсмента
Алексей
создам попозже руками, проверю заработает ли
Алексей
создавать ендпоинты для новы и плейсмента не пришлось, этих сервисов и вовсе не было в андере
Алексей
проблема оказалась в публичнои ендпоинте айроника
Алексей
Failed to contact the endpoint at https://192.168.24.2:13385 for discovery. Fallback to using that endpoint as the base url.
Алексей
тут идет обращение к haproxy, в логах хапрокси я увидел SSL handshake failure и сделал пока по-наркомански, переделал публичный ендпоинт на http
Алексей
теперь создаются агенты ironic-neutron-agent для бареметаллов
Алексей
подсмотрел, что в колле в ironic_neutron_agent.ini добавлятеся параметр cafile
Алексей
вернул ендпоинту https и добавил так же cafile в ини файл
Алексей
стало ок
Алексей
root@tripleo-undercloud-1:[~]: podman exec ironic_neutron_agent cat etc/neutron/plugins/ml2/ironic_neutron_agent.ini
[ironic]
auth_type=password
auth_url=http://192.168.24.3:5000
username=ironic
password=S4sKbc7obrtWBgVhxpPGkk08v
project_domain_name=Default
project_name=service
user_domain_name=Default
region_name=regionOne
cafile=/etc/pki/tls/certs/ca-bundle.trust.crt
Vyacheslav
ткните в мануал, как добавить ещё один DHCP server в созданную subnet...
J
Vyacheslav
Vyacheslav
J
Есть еще способ.
J
Если у тебя уже созданы и зарегистрированы DHCP агенты, можно сделать
openstack agent add network --dhcp <agent-id> <network>
Vyacheslav
Vyacheslav
а как в коле использовать на compute nova-manage?
Vyacheslav
Fedor
на кампуте наверное никак, кампута не должна ходить в базу
Vyacheslav
https://access.redhat.com/solutions/6370731
Vyacheslav
Via funky
Коллеги, а CVE-2016-7404 в Magnum уже пофиксили? а то Kolla все еще на него ссылается если выставлять - enable_cluster_user_trust: true
Via funky
Еще вопрос, при создание кластера с помощью magnum - кластер создает одну ноду - мастер. И дальше ждет, ничего не делая. шаблон создания: openstack coe cluster template create kubernetes-cluster-template \
--image Fedora-CoreOS-34 \
--external-network public \
--dns-nameserver 8.8.8.8 \
--master-flavor m1.small \
--flavor m1.small \
--coe kubernetes
Via funky
В чем может быть проблема?
AcidMan
ну и что значит ждёт? openstack coe cluster show что показывает?
Via funky
а кластер то какой командой создаёте?
openstack coe cluster create kubernetes-cluster \
--cluster-template kubernetes-cluster-template \
--master-count 1 \
--node-count 1 \
--keypair admin
AcidMan
и что в логах?
Via funky
ну и что значит ждёт? openstack coe cluster show что показывает?
$ openstack coe cluster show kubernetes-cluster
+----------------------+------------------------------------------------------------+
| Field | Value |
+----------------------+------------------------------------------------------------+
| status | CREATE_IN_PROGRESS |
| health_status | None |
| cluster_template_id | 9a420dea-b766-4513-8127-cd98b767a142 |
| node_addresses | [] |
| uuid | 49bd12f3-27db-486a-a434-a82b5d4f5eaa |
| stack_id | 95a2a67a-c4c8-4409-b2c6-998daf499438 |
| status_reason | None |
| created_at | 2021-11-12T19:09:08+00:00 |
| updated_at | 2021-11-12T19:09:14+00:00 |
| coe_version | None |
| labels | {} |
| labels_overridden | {} |
| labels_skipped | {} |
| labels_added | {} |
| fixed_network | None |
| fixed_subnet | None |
| floating_ip_enabled | True |
| faults | |
| keypair | admin |
| api_address | None |
| master_addresses | [] |
| master_lb_enabled | False |
| create_timeout | 60 |
| node_count | 1 |
| discovery_url | https://discovery.etcd.io/d1750709ddcbb5893d553b92689f0f1a |
| docker_volume_size | None |
| master_count | 1 |
| container_version | None |
| name | kubernetes-cluster |
| master_flavor_id | m1.small |
| flavor_id | m1.small |
| health_status_reason | {} |
| project_id | a4772ae150414b02adf9052a449a6605 |
+----------------------+------------------------------------------------------------+
Via funky
и что в логах?
ERROR magnum.drivers.heat.k8s_fedora_template_def [req-0b5cd0b8-71f6-448d-8520-cf6c8f91ac4f - - - - -] Failed to load default keystone auth policy: FileNotFoundError: [Errno 2] No such file or directory: '/etc/magnum/keystone_auth_default_policy.json'
AcidMan
Via funky
ответ на вопрос получен, как я понимаю?
Не совсем... I have seen the keystone_auth_default_policy.json error and it should not prevent magnum from working. Я видел эту ошибку но говорят такое может быть из за SSL сертификата