@nocproject

Страница 1250 из 2357
Andrey
22.07.2017
08:20:45
А корреляцию починили?

Или нет

Нет.
Нет и нет

Минуту назад создание аварии с деревом обьектов

Google
Andrey
22.07.2017
08:39:35
ммм.... никогда?

Алексей
22.07.2017
08:41:22
@EKbfh а ты что ли вышел ?

Ivan
22.07.2017
08:44:06
@EKbfh а ты что ли вышел ?
Ну, я вышел из мест без инета.

Вечерами можно потупить

Ilya
22.07.2017
08:52:45
Минуту назад создание аварии с деревом обьектов
После какого-то из апдейтов дерево перестало строится

Ilya
22.07.2017
10:04:34


в dcs всё зарегано

fx00f
22.07.2017
11:02:52
Заработало? Можно обновляться?

Ilya
22.07.2017
11:06:06
нет

Google
Ilya
22.07.2017
11:06:25
@freeseacher ты свободен потыкать нок?

Andrey
22.07.2017
11:11:40
Заработало? Можно обновляться?
обновляться нельзя минимум до следующей недели

влили серьёзные изменения

но, вдруг, кому-то скучно

fx00f
22.07.2017
11:12:17
Пофиг. У меня fm пока ещё заббикс может

Andrey
22.07.2017
11:12:27
пока ещё?

:)

хромой заббикс из последних сил открывает аварии

fx00f
22.07.2017
11:22:29
Ну у меня выбора нет((( приходится пока им страховаться. Теперь знаю, что только с твоей рецензии можно обновляться) главное, что Дискавери работает. Пока это главное

Andrey
22.07.2017
11:22:59
дык, моя рецензия мало что значит.

традиционно, обновляютя если хотят новую фичу или есть мешающий баг

а тут целое слияние веток было

@somovis я так и не увидел Issue или доказательства, что в FM что-то неработает

Ilya
22.07.2017
11:27:46
@somovis я так и не увидел Issue или доказательства, что в FM что-то неработает
Я и не открывал на данный момент, т.к. теперь и проверить никак нельзя

fx00f
22.07.2017
11:27:54
Буду теперь знать)))

Andrey
22.07.2017
11:28:02
в каком плане нельзя проверить?

т.е. уже всё работает?

Ilya
22.07.2017
11:28:19
т.е. уже всё работает?
ФМ не работает

Проверить корреляцию нельзя

Andrey
22.07.2017
11:28:40
:(

Google
Andrey
22.07.2017
11:28:53
FM работает

проверить корреляцию можно

Ilya
22.07.2017
11:29:04
В логах ping false, а статус ок

Andrey
22.07.2017
11:29:21
причём тут код?

Ilya
22.07.2017
11:29:28
Потому что не работает

Andrey
22.07.2017
11:29:34
у пингера, коррелятора и классификатора есть логи

там видно путь прохождения аварии

надо заглянуть в них и понять на каком этапе затык

Ilya
22.07.2017
11:30:36
В ринге только session renewed

Сегодня обновил

Ilya
22.07.2017
11:31:02
А, не везде

2017-07-22 14:27:28,250 [ping] [10.100.5.52] Changing status to False

2017-07-21 13:28:30,745 [correlator] [5971d74e4a5e6823e69d20fa|*-pss-52|10.100.5.52] NOC | Managed Object | Ping Failed: dispose: Calculated alarm severity is: 3000 2017-07-21 13:28:30,748 [correlator] [5971d74e4a5e6823e69d20fa|*-pss-52|10.100.5.52] NOC | Managed Object | Ping Failed raises alarm NOC | Managed Object | Ping Failed(5971d74e4a5e68227c60aa6a): {} 2017-07-21 13:32:27,712 [correlator] [5971d83b4a5e682327875b74|*-pss-52|10.100.5.52] NOC | Managed Object | Ping OK clears alarm NOC | Managed Object | Ping Failed(5971d74e4a5e68227c60aa6a)

свежее нету времени

только Session renewed

Andrey
22.07.2017
11:43:44
до классификатора дошло?

Ilya
22.07.2017
11:51:43
Andrey
22.07.2017
11:52:22
cat /var/log/noc/classificator* | grep 10.100.5.52

Google
Andrey
22.07.2017
11:52:55
У меня их 140, ищу
надеюсь, ты не поочерёдно просматриваешь 140 логов

Ilya
22.07.2017
12:10:36
cat /var/log/noc/classificator* | grep 10.100.5.52
?‍♂ Он все файлы по очереди перебирает

По времени не нахожу

Bitbucket
22.07.2017
12:42:20
Andrey pushed to noc/feature/microservices Fix Resolution exception when timeout in DCS

Andrey
22.07.2017
12:42:54
По времени не нахожу
т.е. этого адреса в логах нет?

Ilya
22.07.2017
12:57:31
а вот в 13:28 есть

2017-07-21 13:28:30,697 [classifier] [5971d74e4a5e6823e69d20fa|dpmo-pss-52|10.100.5.52] Managed object found 2017-07-21 13:28:30,697 [classifier] [5971d74e4a5e6823e69d20fa|dpmo-pss-52|10.100.5.52] Event class: NOC | Managed Object | Ping Failed ({}) 2017-07-21 13:28:30,701 [classifier] [5971d74e4a5e6823e69d20fa|dpmo-pss-52|10.100.5.52] Disposing 2017-07-21 13:28:30,704 [classifier] [5971d74e4a5e6823e69d20fa|dpmo-pss-52|10.100.5.52] Event processed successfully

Andrey
22.07.2017
12:59:16
не

21 число

Admin
ERROR: S client not available

Andrey
22.07.2017
12:59:20
не канает

т.е. не дошло до классификатора

Ilya
22.07.2017
12:59:53
а, 21, точно

не заметил

Andrey
22.07.2017
12:59:56
надо проверять NSQ

проверь, что запущена, перезапусти пингер и убедись что он нормально к нему подключился

в начале будут по этому поводу сообщения

Andrey
22.07.2017
13:02:33
я про пингер

Google
Ilya
22.07.2017
13:06:21
все инстансы так

Andrey
22.07.2017
13:07:48
притяни последний фикс

должен уйти 'noc.core.dcs.error.ResolutionError'>

Ilya
22.07.2017
13:25:03
должен уйти 'noc.core.dcs.error.ResolutionError'>
да, ping заработал, нго вот web отвалился)

а всё, бд долго подключалась

должен уйти 'noc.core.dcs.error.ResolutionError'>
2017-07-22 16:08:42,030 [ping] [10.100.5.55] Changing status to True

но аларм висит до сих пор

это не 52 - другой МО

Andrey
22.07.2017
13:26:50
смотри в классификатор

дошло до него?

Ilya
22.07.2017
13:29:14
со вчерашнего дня нету ничего по этому МО

я как раз вчера обновлялся

Andrey
22.07.2017
13:30:39
systemctl status nsqd

Ilya
22.07.2017
13:31:01
● nsqd.service - Realtime distributed messaging (nsqd) Loaded: loaded (/etc/systemd/system/nsqd.service; enabled) Active: active (running) since Сб 2017-07-22 16:22:39 MSK; 8min ago Main PID: 809 (nsqd) CGroup: /system.slice/nsqd.service └─809 /opt/noc/bin/nsqd -config /etc/nsq/nsqd.conf июл 22 16:30:28 noc nsqd[809]: [nsqd] 2017/07/22 16:30:28.361406 CLIENT(10.50.74.63:51896): desired protocol magic 'POST' июл 22 16:30:28 noc nsqd[809]: [nsqd] 2017/07/22 16:30:28.361449 ERROR: client(10.50.74.63:51896) bad protocol magic 'POST' июл 22 16:30:31 noc nsqd[809]: [nsqd] 2017/07/22 16:30:31.522334 200 GET /stats?format=json (10.50.74.63:27939) 174.376µs июл 22 16:30:36 noc nsqd[809]: [nsqd] 2017/07/22 16:30:36.957120 200 GET /ping (127.0.0.1:46231) 1.414µs июл 22 16:30:37 noc nsqd[809]: [nsqd] 2017/07/22 16:30:37.681725 LOOKUPD(10.50.74.63:4160): sending heartbeat июл 22 16:30:41 noc nsqd[809]: [nsqd] 2017/07/22 16:30:41.525865 200 GET /stats?format=json (10.50.74.63:27939) 137.654µs июл 22 16:30:45 noc nsqd[809]: [nsqd] 2017/07/22 16:30:45.256015 TCP: new client(10.50.74.63:55979) июл 22 16:30:45 noc nsqd[809]: [nsqd] 2017/07/22 16:30:45.256198 CLIENT(10.50.74.63:55979): desired protocol magic 'POST' июл 22 16:30:45 noc nsqd[809]: [nsqd] 2017/07/22 16:30:45.256243 ERROR: client(10.50.74.63:55979) bad protocol magic 'POST' июл 22 16:30:46 noc nsqd[809]: [nsqd] 2017/07/22 16:30:46.957623 200 GET /ping (127.0.0.1:48710) 1.28µs

Andrey
22.07.2017
13:31:34
ERROR: client(10.50.74.63:55979) bad protocol magic 'POST'

Ilya
22.07.2017
13:32:21
помню, что раньше оно было :)

Andrey
22.07.2017
13:59:08
systemctl restart nsqd

nsqd --version

Ilya
22.07.2017
14:01:31
отходил

июл 22 17:02:07 noc nsqd[24905]: [nsqd] 2017/07/22 17:02:07.888380 TCP: new client(10.50.74.63:39602) июл 22 17:02:07 noc nsqd[24905]: [nsqd] 2017/07/22 17:02:07.888612 CLIENT(10.50.74.63:39602): desired protocol magic ' V2'

Страница 1250 из 2357