
E_zombie
08.07.2017
20:44:15
Но форма ничетак.

Bitbucket
08.07.2017
20:45:44
Maksim pushed to noc/feature/microservices
Update profile ECI.SAM get_interfaces

Иван
08.07.2017
21:55:42
restart act<tab>
Единственное подозрительное, что есть в логе Activator-NOC
2017-07-08 21:52:45,586 [tornado.general] 400 GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7): Invalid service id
2017-07-08 21:52:45,586 [activator] GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7) 1.22ms
2017-07-08 21:52:46,592 [tornado.general] 400 GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7): Invalid service id
2017-07-08 21:52:46,593 [activator] GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7) 3.30ms

Bitbucket
08.07.2017
23:16:36
HP.ProCurve.get_version now correctly works whith HP-3500yl ➔
Tested on HP-3500yl-24G, firmware K.15.16.0005
? Dmitry Luhtionov

Google

Uvin
09.07.2017
02:43:47
народ есть кто может подскаать как развернуть NOC через Tower

Aleksandr
09.07.2017
05:40:32
Инфа разрознена часть тут https://kb.nocproject.org/pages/viewpage.action?pageId=25887132
часть тут http://repodoc.readthedocs.io/en/feature-doc/installation/manual.html
часть в других мануалах

Bitbucket
09.07.2017
08:19:15
Dmitry Volodin pushed to noc/feature/moversion
discovery: Fix syntax error
Dmitry Volodin pushed to noc/feature/moversion
SAE: Fix imports and query

Иван
09.07.2017
08:56:01

Bitbucket
09.07.2017
09:07:16
Dmitry Volodin pushed to noc/feature/moversion
sa.managedobjectselector: Filters by profile, vendor, platform, version and TT System

Иван
09.07.2017
09:32:46

Алексей
09.07.2017
09:34:11
ioloop там не ошибка. точнее ошибка но на работу она точно не влияет
а вот почему у тя
2017-07-08 21:52:46,592 [tornado.general] 400 GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7): Invalid service id
2017-07-08 21:52:46,593 [activator] GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7)
вот это интересно
@dvolodin как так может быть ?

Google

Иван
09.07.2017
09:35:50
Тогда что это? Этот трейс в web.log появляется часто, не только при попытке запустить опрос.

Bitbucket
09.07.2017
09:39:19
Dmitry Volodin pushed to noc/feature/moversion
Replace managed object profile usage

Иван
09.07.2017
09:40:07
Хм. А может это быть из-за того, что я увеличивал кол-во активаторов? Потом вернул 1 и, кажется, после этого перестало работать.

Алексей
09.07.2017
09:41:19
останови полностью нок на 70 секунд
это почистит старые записи в consul

Иван
09.07.2017
09:41:47
Ок.

Алексей
09.07.2017
09:41:57
вообще надо только на 60. но 10 секунд запаса

Dmitry
09.07.2017
09:42:53
https://code.getnoc.com/noc/noc/issues/35
вот нашел древний issue
кто хочет занятся?
могу показать, как правильно настроить ETL для экспорта объектов из заббикса

Алексей
09.07.2017
09:45:22
@ss ?

Иван
09.07.2017
09:45:59

Алексей
09.07.2017
09:46:30
не надо хоть на сколько. надо что бы консул подерагал сервисы
за этим процессом можно посмотреть на http://noc_ip:8500

Иван
09.07.2017
09:52:58

Bitbucket
09.07.2017
09:58:35
Dmitry Volodin pushed to noc/feature/moversion
./noc script: Fix json object handling

Алексей
09.07.2017
09:58:45
вот. это проблема.
на сервере посмотри на consul info
тебя особенно интересует наличие лидера

Google

Иван
09.07.2017
10:00:15
Это?
consul:
bootstrap = true
known_datacenters = 1
leader = false
leader_addr =
server = true

Bitbucket
09.07.2017
10:00:20
Dmitry Volodin pushed to noc/feature/moversion
SAE: Fix query

Алексей
09.07.2017
10:03:42

Иван
09.07.2017
10:07:53
Сайт консула это consul.io ?

Алексей
09.07.2017
10:08:06
ага

Иван
09.07.2017
10:10:09
Заглянул в сислог, а там..
Jul 9 21:07:20 noc telegraf[26528]: 2017-07-09T10:07:20Z E! Error in plugin [inputs.httpjson]: Get https://172.ххх.ххх.ххх/inv/monitor/: x509: cannot validate certificate for 172.ххх.ххх.ххх because it doesn't contain any IP SANs
Jul 9 21:07:20 noc consul[1275]: 2017/07/09 21:07:20 [ERR] http: Request PUT /v1/session/create, error: No cluster leader from=127.0.0.1:32598

Алексей
09.07.2017
10:10:24
No cluster leader это проблема
172.ххх.ххх.ххх because it doesn't contain any IP SANs
не проблема

E_zombie
09.07.2017
10:11:28
c ioloop лезут ошибки если из CLI запускаешь что нибудь с селектором на много объектов

Иван
09.07.2017
10:13:58

E_zombie
09.07.2017
10:15:23
попробуй. но это может быть с активаторами отвалившимия от консула связано. тут рекомендуют эпизодически ребутать активаторы ....

Иван
09.07.2017
10:15:29
А как сделать так, чтобы при деплое часовой пояс не слетал?

E_zombie
09.07.2017
10:15:57
не в курсе. у тебя на всех нодах одно время 7

Иван
09.07.2017
10:16:53
У меня одна нода.

E_zombie
09.07.2017
10:17:19
и время всё ок ?

Иван
09.07.2017
10:17:46

E_zombie
09.07.2017
10:19:02
ты консулов ДВА поставил?

Иван
09.07.2017
10:19:44
Нет, один.

Алексей
09.07.2017
10:22:08
ойпи не менялся ?

Google

Алексей
09.07.2017
10:23:05
я бы отмотал лог консула до момента первого появления No cluster leader и посмотрел чего там такое случилось
ибо потеря лидер не такое уж штатное явление

Иван
09.07.2017
10:23:16
Нет. Всегда один и тот же.

E_zombie
09.07.2017
10:23:34
а должно быть ДВА.

Алексей
09.07.2017
10:24:41
нее
на одном хосте можно один
два надо для точного указания в многосерверной конфигации кто бутсрап сервер

Иван
09.07.2017
10:31:25
Jul 4 22:48:29 noc consul[27566]: 2017/07/04 22:48:29 [ERR] agent: failed to sync remote state: No cluster leader
Jul 4 22:48:29 noc consul[27566]: agent: failed to sync remote state: No cluster leader
Jul 4 22:48:30 noc consul[27566]: consul.acl: Failed to get policy from ACL datacenter: No cluster leader
Jul 4 22:48:30 noc consul[27566]: 2017/07/04 22:48:30 [ERR] consul.acl: Failed to get policy from ACL datacenter: No cluster leader
А чуть раньше при перезапуске НОКа было вот такое
Jul 4 22:48:22 noc mkdir[27558]: /bin/mkdir: невозможно создать каталог «/var/run/consul»: Файл существует

Admin
ERROR: S client not available

Алексей
09.07.2017
10:37:03
эт всё не фатальное

Иван
09.07.2017
10:37:55
Вот так было за несколько секунд до первой ошибки
Jul 4 22:48:22 noc consul[27566]: raft: Node at 172.ууу.ууу.ууу:8300 [Follower] entering Follower state (Leader: "")
А вообще НОК работает на 172.ххх.ххх.ххх

Алексей
09.07.2017
10:38:44
стопни консул и нок

Иван
09.07.2017
10:38:55
Через 172.ууу.ууу.ууу сервер может в инет ходить.

Алексей
09.07.2017
10:39:05
https://www.consul.io/docs/guides/outage.html
думаю тебе интересно
consul operator raft -list-peers
ну и скорее всего понадобится https://www.consul.io/docs/guides/outage.html#manual-recovery-using-peers-json

Иван
09.07.2017
10:45:30
root@noc:~/temp# consul operator raft list-peers
Error getting peers: Failed to retrieve raft configuration: Unexpected response code: 500 (No cluster leader)

Google

Bitbucket
09.07.2017
10:59:31
Dmitry Volodin pushed to noc/feature/moversion
ProfileCheckRules: Use Profile reference

Иван
09.07.2017
11:00:28
Нашел в /etc/consul/config.json
"bind_addr": "172.yyy.yyy.yyy"
"recursors": [ "172.yyy.yyy.yyy" ]
Наверно, надо переправить на 172.ххх.ххх.ххх ?
Там где работает НОК?

Алексей
09.07.2017
11:01:22
bind должен быть такой какой есть на машине адрес
и по идее деплой его таким и выставляет

Иван
09.07.2017
11:02:19
А если адреса 2 ?
Точно, менялся адрес. Раньше в башне в настройках ноды был localhost, а потом я поставил 172.ххх.ххх.ххх и сделал деплой

Алексей
09.07.2017
11:05:05
вот отсюда и грабля
в много серверной конфигурации сейчас должно быть досвольно просто сменить адрес. когда серверов консула более одного. именно серверов.
а в односерверной видимо надо фигачить Peers.json каждый деплой

Иван
09.07.2017
11:07:29
Т.е. мне смена адреса в /etc/consul/config.json не поможет?

Алексей
09.07.2017
11:08:14
черт
Using raft/peers.json for recovery can cause uncommitted Raft log entries to be implicitly committed, so this should only be used after an outage where no other option is available to recover a lost server. Make sure you don't have any automated processes that will put the peers file in place on a periodic basis.
низя

Иван
09.07.2017
11:08:55
Вот этот кусок я не понял. Ясно только, что что-то может испортиться.
Почему нельзя? "должно испотльзоваться только после отключения когда невозможны другие способы восстановления потерянного сервера"
А чем чревато "безусловный коммит записей Raft log " ?

Bitbucket
09.07.2017
11:15:17
Dmitry Volodin pushed to noc/feature/moversion
PeeringPoint: Use profile reference
Dmitry Volodin pushed to noc/feature/moversion
sa.peeringpoint: Filter by profile
Dmitry Luhtionov pushed to noc/feature/microservices
Fix Huawei.MA5600T.get_interfaces script

Иван
09.07.2017
11:21:07
А как узнать версию протокола Raft ? Для разных версий разная структура файлов.