
Илья
01.05.2016
16:59:23
тогда можно будет сразу обрыв кабеля выводить

Алексей
01.05.2016
16:59:37
мониторим то мы при этом что ?

Ilya
01.05.2016
16:59:56
о выпадении интерфейсы из лага тоже отдельно надо уведомлять и коррелировать. я не помню, что бы сейчас это работало

Google

Илья
01.05.2016
17:07:03
если его еще нет
физическое падение порта и так обнаружится

Ilya
01.05.2016
17:07:58
Да, упала физика из лага, об этом тоже нужно знать и система должна понимать сколько линков осталось. Если остался один - то уведомить.
У меня например в конфиге min links 2, если останется 1 линк, то лаг ляжет, но при этом один из физ интерфейсов будет еще активен.
Сложно?

Илья
01.05.2016
17:09:21
дак у тебя и так прилетит link down по физике

Ilya
01.05.2016
17:10:42
от одного интерфейса, но еще один в лаге будет в апе.
в interfaces показывается lag и его состовляющие

Илья
01.05.2016
17:11:04
зайдем с другой стороны
что должен сделать нок чего он еще не делает
нок поднимет алармы согласно тому что пришлет железка
если железка пришлет падение порта или лага, нок поднимет соответствующую аварию

Ilya
01.05.2016
17:14:10
Коррелировать лаг, сабы только на физику, остальное должно отработать и что я выше написал не учитываем)

Google

Алексей
01.05.2016
17:14:47
ребята еще раз от цели зависит
мы мониторим сервис или линки ?
пусть линки падают у нас есть альтернативные маршрруты

Ilya
01.05.2016
17:15:12
Сервис в идеале

Алексей
01.05.2016
17:15:31
есл имониторим сервис то нам надо подниматься по уровням оси и по топологии

Илья
01.05.2016
17:15:36
то есть если сервис не пострадал значит ничего не делаем пока все совсем не пизденется?

Ilya
01.05.2016
17:15:37
@freeseacher придется в ентерапрайзе с сервисами мудрить )

Алексей
01.05.2016
17:15:40
при этом на каждом из уровней тололгия своя.

Илья
01.05.2016
17:16:10
у нас кольцо, все ушло на резерв, сидим дрочим пока и резерв не ляжет
так что ли

Алексей
01.05.2016
17:16:12
при этом расчитать топологию более высокго уровня без тологии более низкого уровня нельзя

Ilya
01.05.2016
17:16:37
Звучит то все правильно

Алексей
01.05.2016
17:16:38
Зи, ты хочешь мониторить сеть, а не услугу

Илья
01.05.2016
17:16:44
конечно
я же эксплуатирую сеть

Алексей
01.05.2016
17:16:52
а @somovis услугу.
это две разные задачи
я же не отрицаю факта того что для мониторинга сети надо поднимать аварию когда упали линк в лаге.
надо и еще как
пусть бегут и чинят.

Google

Илья
01.05.2016
17:17:49
ну тогда надо исходить из того зачем нужен нок

???
01.05.2016
17:17:51
/stat@comstatbot

Combot
01.05.2016
17:17:51
comstatbot.xyz/chat/-1001030501606

Алексей
01.05.2016
17:18:07
но надо ли запускать перерасчет бабла из-за того что у тя упал линк неизвестно
может клиент пострадал а может и нет

Ilya
01.05.2016
17:18:43
Как правильно говорится - поднять уровень сервиса

Илья
01.05.2016
17:19:39
:)
yf cthdbc b tuj rfxtcndj
на сервис и его качество
как будто не в России живете

Ilya
01.05.2016
17:23:24
все изменится

Алексей
01.05.2016
17:23:51
nginx перед influx руляет.
надо впиливать в плейбук

Ilya
01.05.2016
17:25:18
?
@freeseacher сколько у тебя MO и линков в ноке, и сколько ресурсов отведено под это?

Алексей
01.05.2016
17:25:56
пока не готов делится цифрами
как будет понятна информация по сайзингу все раскажу

Ilya
01.05.2016
17:30:23
Хорошо

Dmitry
01.05.2016
17:38:54
много

Google

Dmitry
01.05.2016
17:39:09
пытаемся вывести зависимость между ресурсами и железом
точнее - ориентировочная есть, уточняем практическую
но - очень много, далеко не каждая система такое вообще вытянет

Илья
02.05.2016
17:08:21
Чувствую вторая волна пошла

Алексей
02.05.2016
17:49:32
Чёрт

Alexey
03.05.2016
06:23:41
Чего-то у меня поломалось после коммита в башне с custom repo support... вылетает на Pulling NOC customization
The error was: AttributeError: 'NoneType' object has no attribute 'startswith'
Custom repo у меня не используется

Dmitry
03.05.2016
07:43:48
Поправлю

Alexey
03.05.2016
07:56:31
ещё я поломал монгу и пока чинил наткнулся на ошибку No handlers could be found for logger "noc.lib.nosql"
Нагуглил, что перед logging.getLogger... неплохо бы вызывать logging.basicConfig()
ещё вот такое поймал в логе discovery: No module named dbpool.db.backends.postgresql_psycopg2.base
и ещё ругательство на некий jemalloc:
ERROR: ld.so: object '/usr/lib64/libjemalloc.so.1' from LD_PRELOAD cannot be preloaded (cannot open shared object file): ignored

Алексей
03.05.2016
09:19:18
да
всё так
Alexey а у тя какая платформа ?

Dmitry
03.05.2016
09:51:42
на debian он будет так ругаться
я же говорю - нужно в vars ко всем путям добавить еще jemalloc_path
Alexey - дай полный трейс с башни

Alexey
03.05.2016
11:18:50
именно Debian... кстати, там в конфиге supervisord неправильный путь до libjemalloc, исправил, но не помогло
а насчёт трейса - где бы его взять, там не пишется весь

Google

Dmitry
03.05.2016
11:20:01
а что оно воббще написало?

Alexey
03.05.2016
11:25:17
TASK [node : Pull NOC Customizations] ******************************************
An exception occurred during task execution. To see the full traceback, use -vvv. The error was:
AttributeError: \'NoneType\' object has no attribute \'startswith\'
я понял про -vvv, но куда это дописать при запуске deploy...

Dmitry
03.05.2016
11:27:17
а попробуй inventory посмотри

Алексей
03.05.2016
11:33:18
там пути везде разные будут
сегодня попроавлю

Alexey
03.05.2016
11:35:29
ок
а инвентори - это где? в котексте башни

Алексей
03.05.2016
11:35:41
в environment сверху

Alexey
03.05.2016
11:38:06
noc_custom_enabled: false
noc_custom_repo: null
noc_custom_revision: null
что и ожидалось