ᴅⁱᵐⁱᴅʳ0ˡ
всем привет, ни у кого в облаке нет gpu, как мониторить кол-во используемых видюх?
J
Например, готовый уже плагин pci api)
J
Никак блин. Запросом из базы nova дергать или портировать этот самый pci api на современные микроверсии 2.xx. Беда то видишь в чем. Я логику разработчиков core проектов не понимаю. Есть вот placement сервис, он ведет учет ресурсов. Но по какой-то хуй пойми какой причине учет pci устройств он не ведет. Данные о проброшенных pci устройствах в базе nova. И в api 2.xx нет возможности запросить данные по pci устройствам. А теперь еще, когда появился cyborg, я вообще хз чо будет.
J
Таблица nova.pci_devices. Пока вижу так что самое простое сделать ридонли пользователя с правами только на чтение и прям руками сконструированными запросами выдергивать.
ᴅⁱᵐⁱᴅʳ0ˡ
ппц(
J
Или cyborg прикручивай) Но как по мне от него только возни больше чем пользы в нынешнем виде.
J
ппц(
Ну если так не нравится, могу тебе предложить из какого-нибудь агента дергать скрипт который будет парсить XML виртуалок и сразу отдавать это дело в TSDB какую-то)
J
Потому что если у тебя гипервизор, например, в maintenance mode или вообще пропал\сгорел\маски шоу вынесли, в базе все равно останется запись о свободных pci устройствах. А по факту их нет)
J
И способ с агентами на существующую инфраструктуру неплохо ложится, потому что так или иначе почти все на гипервизорах ставят всякие агенты для сбора логов и метрик. И есть инфраструктура и для хранения этого добра.
Vladyslav
@paper_planes_squad Приветствую, подскажи пожалуйста не встречалось ли тебе такого, уже какой день не могу побороть: May 20 17:48:49 maas-region-0 sh[92]: 2020-05-20 17:48:49 maasserver: [error] ################################ Exception: PartitionTable matching query does not exist. ################################ May 20 17:48:49 maas-region-0 sh[92]: 2020-05-20 17:48:49 maasserver: [error] Traceback (most recent call last): May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/django/core/handlers/base.py", line 132, in get_response May 20 17:48:49 maas-region-0 sh[92]: response = wrapped_callback(request, *callback_args, **callback_kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/maasserver/utils/views.py", line 185, in view_atomic_with_post_commit_savepoint May 20 17:48:49 maas-region-0 sh[92]: return view_atomic(*args, **kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3.5/contextlib.py", line 30, in inner May 20 17:48:49 maas-region-0 sh[92]: return func(*args, **kwds) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/maasserver/api/support.py", line 59, in __call__ May 20 17:48:49 maas-region-0 sh[92]: response = upcall(request, *args, **kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/django/views/decorators/vary.py", line 21, in inner_func May 20 17:48:49 maas-region-0 sh[92]: response = func(*args, **kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/piston3/resource.py", line 190, in __call__ May 20 17:48:49 maas-region-0 sh[92]: result = self.error_handler(e, request, meth, em_format) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/piston3/resource.py", line 188, in __call__ May 20 17:48:49 maas-region-0 sh[92]: result = meth(request, *args, **kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/maasserver/api/support.py", line 298, in dispatch May 20 17:48:49 maas-region-0 sh[92]: return function(self, request, *args, **kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/maasserver/api/partitions.py", line 92, in read May 20 17:48:49 maas-region-0 sh[92]: partition_table = device.partitiontable_set.get() May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/django/db/models/manager.py", line 127, in manager_method May 20 17:48:49 maas-region-0 sh[92]: return getattr(self.get_queryset(), name)(*args, **kwargs) May 20 17:48:49 maas-region-0 sh[92]: File "/usr/lib/python3/dist-packages/django/db/models/query.py", line 334, in get May 20 17:48:49 maas-region-0 sh[92]: self.model._meta.object_name May 20 17:48:49 maas-region-0 sh[92]: maasserver.models.partitiontable.DoesNotExist: PartitionTable matching query does not exist. May 20 17:48:49 maas-region-0 sh[92]: 2020-05-20 17:48:49 regiond: [info] 127.0.0.1 GET /MAAS/api/2.0/nodes/4a4hsm/blockdevices/36/partitions/ HTTP/1.1 --> 500 INTERNAL_SERVER_ERROR (referrer: -; agent: python-requests/2.19.1) Похоже как проблема MAAS, но не уверен.
Vladyslav
На всех контролерах, не на одном сервере.
Vladyslav
И drydock cыпет похожими ошибками: 2020-05-20 17:51:38,567 - DEBUG - api_client.py:180:_send_request Received error response - URL: GET http://maas-region.ucp.svc.cluster.local/MAAS/api/2.0/nodes/4a4hsm/blockdevices/36/partitions/ - RESPONSE: 500 2020-05-20 17:51:38,567 - DEBUG - api_client.py:181:_send_request Response content: PartitionTable matching query does not exist. 2020-05-20 17:51:38,567 - WARNING - blockdev.py:69:__init__ Could not load partitions on node 4a4hsm block device 36 2020-05-20 17:51:38,616 - DEBUG - node.py:2424:start Polling node n4 status attempt 123 of 270: Deploying 2020-05-20 17:51:38,628 - DEBUG - node.py:2424:start Polling node n3 status attempt 123 of 270: Deploying
Vladyslav
после чего получаю в maas статус deploy failed, лезу проверять на ноду и разбивка в порядке.
Я и твой кот
@vladyslavg обновите maas-rack-controller и maas-region-controller до maas-rack-controller:2f4e6e22dd85cac6e870812a2f9fbd60ea46401f maas-region-controller:2f4e6e22dd85cac6e870812a2f9fbd60ea46401f
Я и твой кот
> лезу проверять на ноду и разбивка в порядке Хотя может не ваша проблема. Хм. Но попробуйте.
Я и твой кот
Но похожа.
Я и твой кот
sstream-cache тоже до кучи до той же версии
Я и твой кот
Что, очинилось?
Vladyslav
нет, но хоть что-то.
Vladyslav
Щас буду обновлять.
Я и твой кот
versions.yaml
Vladyslav
У меня идеи закончились.
Vladyslav
Я в курсе)
Vladyslav
Спасибо)
Я и твой кот
там в treasuremap в tools есть updater.py скриптик, он автоматом может обновлять версии имейджей и хелм чартов некоторых
Я и твой кот
а, версии хельм-чартов тоже обновите до той же
Я и твой кот
хотя они не менялись. но всё же.
Vladyslav
@paper_planes_squad спасибо, буду пробовать.
Я и твой кот
Благо обновление версий - это вжух - и готово.
Vladyslav
@paper_planes_squad я приблизительно так-же боролся с airship-virt)
Я и твой кот
Хоть бы что-ли кто-то ещё Airship заюзал, а? Он же классный.
J
Хоть бы что-ли кто-то ещё Airship заюзал, а? Он же классный.
Да когда-то хотел, но во-первых, не люблю когда много контейнеров, а во-вторых такое впечатление что он настолько сложный что по нему отдельную книжку писать можно) Не в обиду.
J
Впрочем, едва ли openstack-ansible сильно приятнее. К нему привык просто уже немного.
Vladyslav
Я сегодня вот еще одним глазком смотрел на kolla-ansible
Я и твой кот
Складывайте найденные грабли в текстовик, потом зальёте в траблшутинг гайд.
Vladyslav
я с ним немного работал еще во времена kolla-kubernetes
Vladyslav
@paper_planes_squad +
Я и твой кот
Google Anthos – это как платный Airship? В каком чатике спросить?
Я и твой кот
@vladyslavg маякните, как там завелось
Vladyslav
@paper_planes_squad я беседовал с Шведским лидером проекта Google Anthos, в двух словах чтоб сильно не офтопить там пока внутри Vmware. И это слабо похоже на Airship
Vladyslav
@paper_planes_squad обязательно, у меня после обновления поломалась сетевая загрузка, чуто позже буду опять пробовать.
Vladyslav
О. А можно имя? Попробую связаться по одному делу.
Постараюсь найти, это было на Google days. Но в будущем они планируют уже переход к kvm, и вот тогда будет нечто похожее.
Aleksey
Подскажите люди добрые, кто-то мапит дополнительные атрибуты для LDAP групп?
Aleksey
что-то лыжи не едут, то ли я с синтаксисом напутал, то ли надо чтобы какой-то синк случился
Nidhitansh
❗Gentle Reminder ❗ Deadline Announced :- 22nd may The Opportunity that Will Never Come Again, □Be ready for the future. □Ready for the what needed after Covid-19 □Whole 5g technology Based On Hybrid cloud *Registration link :* - http://www.lwindia.com/Hybrid-Cloud-NC.php
Aleksey
что-то я вообще не понимаю, mapping_additional_attributes вообще не работает, поиск по атрибутам делается, а вот в keystone поля не появляются
Aleksey
что-то тут каждый раз как про keystone вопросы задаю, так тишина. У всех что ли только локальные пользователи и с 2мя ролями(админ, не админ)?
Evgeny
как догадался? )
Aleksey
похоже вот оно. https://bugs.launchpad.net/keystone/+bug/1839441
Aleksey
не ну всё как обычно, мы фичу запилили ещё 2014, но она почему-то не работала
Aleksey
параметры есть с 2014, а тут вот такое Extra attributes are a bad idea overall. Please provide more information on what is attempting to be solved here and what the use cases are. With more information I'll lift my -2.
Vladyslav
@paper_planes_squad https://review.opendev.org/#/c/725068/ ответили в комьюнити тоже.
Vladyslav
Не гуглилось(
Я и твой кот
@paper_planes_squad https://review.opendev.org/#/c/725068/ ответили в комьюнити тоже.
Ну я, собственно, и дал вам версию контейнеров, в которых этот патч уже есть. Именно его и искал.
Я и твой кот
Так что пробуйте запустить.
Vladyslav
Да, огромное спасибо. Пробую.
Vladyslav
@paper_planes_squad 2020-05-21 17:26:18,657 - DEBUG - orchestrator.py:470:process_filter Filtering nodes based on node names. 2020-05-21 17:26:19,471 - DEBUG - machine.py:612:identify_baremetal_node Found MaaS resource 66ggxc matching Node n3 2020-05-21 17:26:19,471 - WARNING - node.py:2317:start Unexpected status Failed deployment for node n3, skipping deployment. 2020-05-21 17:26:19,473 - DEBUG - task.py:173:failure Adding n3 to failures list. 2020-05-21 17:26:19,474 - DEBUG - state.py:215:get_task Assembling result messages for task d08bd895-0e7b-4884-b796-0c0fd1569817. 2020-05-21 17:26:20,063 - DEBUG - machine.py:612:identify_baremetal_node Found MaaS resource f8qr3x matching Node n2 2020-05-21 17:26:20,063 - DEBUG - machine.py:612:identify_baremetal_node Found MaaS resource fchpsb matching Node n4 2020-05-21 17:26:20,063 - WARNING - node.py:2317:start Unexpected status Failed deployment for node n2, skipping deployment. 2020-05-21 17:26:20,064 - WARNING - node.py:2317:start Unexpected status Failed deployment for node n4, skipping deployment. 2020-05-21 17:26:20,065 - DEBUG - task.py:173:failure Adding n2 to failures list. 2020-05-21 17:26:20,065 - DEBUG - task.py:173:failure Adding n4 to failures list. Вообще без какой-то резонной ошибки зафейлилось.
Я и твой кот
Может снести данные MaaS’а и передеплоить?
Vladyslav
попробую да
Vladyslav
@paper_planes_squad а возможно это из-за проблем с сетью на нодах после деплоя May 21 17:30:01 maas-region-0 maas.service_monitor[110]: [warn] Service 'ntp' is on but not in the expected state of 'running', its current state is 'exited'. Вот такое нашел в логах maas
Vladyslav
ну и залогинится по ssh не дает
vmguru
Всем, доброй ночи! Сильно не бейте, я новичок в Openstack
ᴅⁱᵐⁱᴅʳ0ˡ
Начало не плохое😂
vmguru
Есть дисковый массив, нужно презентовать LUN 10TB на 10 серверов (compute nodes), для хранения всех VMs
vmguru
Я только работал с VMware, в нем всё намного проще, есть vmfs и все Esxi сервера определяют его как один datastore и одновременно обращаються
vmguru
Как добиться такого же в Openstack? Или это не реализуем и тут только NFS сервер нужен?
Jain
что у вас за хранилка?
NS 🇷🇺
что у вас за хранилка?
Правильный вопрос )
NS 🇷🇺
Способов вагон и не надо делать как в вмваре
Jain
Ну вот как это (не)работает ... я просто не понимаю. Дома работает, а на работе нет. Запустил сегодня на работе 1000 вмок, как и дома везде один и тотже образ, докер и gitlab-runner из одного плейбука ... фв, прокси итд нету. ... но вот на работе kolla-build застревает на этом таске. А дома даже не чихает ... INFO:kolla.common.utils.base:Step 19/33 : RUN rpm --import https://packages.grafana.com/gpg.key && rpm --import https://repos.influxdata.com/influxdb.key && rpm --import https://packages.treasuredata.com/GPG-KEY-td-agent && rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch INFO:kolla.common.utils.base: ---> Running in 90a3a403ecbd начинаю думать что сетевики гдето меня тролят. ...
✠ FLASh ✠
а нельзя просто ручками ткнуть для начала в эти линки?
✠ FLASh ✠
которые под --import