
Ilya
09.09.2018
05:11:48
discovery
activator
коррелятор и даже sae трейснули
[sae] RPC call failed: Failed: No active activators for pool 'default'

Google

Andrey
09.09.2018
05:17:00

Ilya
09.09.2018
05:17:18

Andrey
09.09.2018
05:17:19
там баг глобальный такой. От него дохнут активаторы

Ilya
09.09.2018
05:19:02
2018-09-08 12:18:05,115 [nsq.client] [10.50.74.67:4150:10.50.74.67:4150] connection is stale (100.23s), closing
2018-09-08 12:18:05,177 [activator] POST /api/activator/ (10.50.74.66) 91657.38ms
2018-09-08 12:18:05,177 [nsq.async] uncaught exception in data event
UNHANDLED EXCEPTION (2018-09-08 12:18:05.177684)
PROCESS: ./services/activator/service.py
VERSION: 15.05.1+microservices.11152.6ad2efaa
BRANCH: microservices CHANGESET: 6ad2efaa
ERROR FINGERPRINT: 142e2a35-489c-5985-9466-391c6e4ff3c9
WORKING DIRECTORY: /opt/noc
EXCEPTION: <class 'tornado.iostream.StreamClosedError'> Stream is closed
лог активатора

Andrey
09.09.2018
05:19:52

Ilya
09.09.2018
05:21:31

Andrey
09.09.2018
05:21:50
ну, перезапускай да и всё. Бага известная. Пока не пофикшена

Ilya
09.09.2018
05:26:21
Андрей, а как траблшутить interface-status-ex?

Andrey
09.09.2018
05:27:19

Ilya
09.09.2018
05:27:21
Я чисто дергаю скрипт, данные которые я получаю верные, но нок какго-то хера шлёт события up/down, хотя в реальности интерфейсы не меняют статус

Google

Andrey
09.09.2018
05:28:05

Ilya
09.09.2018
05:28:21

Andrey
09.09.2018
05:28:29
хороший повод поставить сниматься

Ilya
09.09.2018
05:29:35
обязательно
Ты про interface admin/oper в профиле интерфейса?

Andrey
09.09.2018
05:30:17

Ilya
09.09.2018
05:30:27
ок, посмотрим

Andrey
09.09.2018
05:30:48

Ilya
09.09.2018
05:30:54
Я смотрю ddash нету для них?

Andrey
09.09.2018
05:52:24
рисуютя на интерфейсах

Ilya
09.09.2018
05:52:45
а, ок

Andrey
09.09.2018
05:53:51
а, ок
вот так встанешь с утра пораньше и узнаешь новую фичу

Ilya
09.09.2018
05:54:01
Я давно не заходил в профиль интерфейса, а там уже столько метрик добавили
круто

Andrey
09.09.2018
05:54:35
а я встану с утра пораньше и узнаю новую багу. Давай меняться ;)

Ilya
09.09.2018
05:54:47
))

Google

Ilya
09.09.2018
05:54:54
а чинить кто будет?)

Andrey
09.09.2018
05:56:46

Ilya
09.09.2018
05:59:08
Я чет забыл даже где он

Andrey
09.09.2018
05:59:34

Ilya
09.09.2018
06:00:05

Andrey
09.09.2018
06:00:24

Ilya
09.09.2018
06:00:51

Andrey
09.09.2018
06:01:12
починишь 2 бага?

Ilya
09.09.2018
06:01:54
эээх )
Больше сломаю, чем починю

Andrey
09.09.2018
06:03:02

Ilya
09.09.2018
06:03:30
почему у меня нету то?
у меня только load in/out

Andrey
09.09.2018
06:04:33
почему у меня нету то?
Лимит ответов на сегодня исчерпан. Благодарим за обращение в нашу службу ответов на все вопросы. Удачного дня. Пи, пи, пи.

Ilya
09.09.2018
06:04:38
надо было другие вопросы задавать, блин

Andrey
09.09.2018
06:05:31

Ilya
09.09.2018
06:05:52
не начали

Google

Ilya
09.09.2018
06:06:09
ой
начали же
Fields: %s interface.date.ts.managed_object.path.discards_in.discards_out.errors_in.errors_out.load_in.load_out.speed.status_admin.status_duplex.status_oper
2018-09-09 2018-09-09 08:52:33 1889526433007432043 ['','','','xe-0/0/3'] 0 0 0 0 117598789 179543274 10000000000 1 3 1

Andrey
09.09.2018
06:07:18
остальные графики-то строятся?

Ilya
09.09.2018
06:07:31
только load in/out

Andrey
09.09.2018
06:10:10
да, я как-то фиксил но не закоммитил

Ilya
09.09.2018
06:11:19

Gitlab
09.09.2018
07:13:54

Ilya
09.09.2018
07:45:49
удалил кастомный путь к ddash, стало ок
Last physical up time : 2018-08-03 12:52:42
Last physical down time : 2018-08-03 12:51:47

Andrey
09.09.2018
07:48:37

Ilya
09.09.2018
07:48:50
нок явно врёт

Gitlab
09.09.2018
07:49:23
aversant opened merge request at / noc:
Migrate WEB Monitor to SelfMon.
Migrate WEB Monitor to SelfMon.

Ilya
09.09.2018
07:49:55
?
Что может врать?
Скрипт возвращает периодически неверный результат или что?
До апдейста на прошлой неделе такого не было
проблема наболюдается с разными платформами и вендорами, это либо дискавери, либо generic скрипты

Gitlab
09.09.2018
07:54:11

Google

Gitlab
09.09.2018
07:59:10

Ilya
09.09.2018
08:12:07
Канал херовый с часто алертящим МО, в логах оч часто 2018-09-09 11:12:23,550 [script] [Huawei.VRP.get_interface_status_ex|10.100.3.200] SNMP timeout. Passing to next method

Andrey
09.09.2018
08:13:34
ааа) тогда понятно в чём дело

Ilya
09.09.2018
08:13:47
но это не значит, что интерфейс down
откуда такая логика?

Andrey
09.09.2018
08:14:58