@nocproject

Страница 1219 из 2357
E_zombie
08.07.2017
20:44:15
Но форма ничетак.

Bitbucket
08.07.2017
20:45:44
Maksim pushed to noc/feature/microservices Update profile ECI.SAM get_interfaces

Иван
08.07.2017
21:55:42
restart act<tab>
Единственное подозрительное, что есть в логе Activator-NOC 2017-07-08 21:52:45,586 [tornado.general] 400 GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7): Invalid service id 2017-07-08 21:52:45,586 [activator] GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7) 1.22ms 2017-07-08 21:52:46,592 [tornado.general] 400 GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7): Invalid service id 2017-07-08 21:52:46,593 [activator] GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7) 3.30ms

Bitbucket
08.07.2017
23:16:36
HP.ProCurve.get_version now correctly works whith HP-3500yl ➔ Tested on HP-3500yl-24G, firmware K.15.16.0005   ? Dmitry Luhtionov

Google
Uvin
09.07.2017
02:43:47
народ есть кто может подскаать как развернуть NOC через Tower

Aleksandr
09.07.2017
05:40:32
Инфа разрознена часть тут https://kb.nocproject.org/pages/viewpage.action?pageId=25887132

часть тут http://repodoc.readthedocs.io/en/feature-doc/installation/manual.html

часть в других мануалах

Bitbucket
09.07.2017
08:19:15
Dmitry Volodin pushed to noc/feature/moversion discovery: Fix syntax error

Dmitry Volodin pushed to noc/feature/moversion SAE: Fix imports and query

Иван
09.07.2017
08:56:01
Перезапусти активатор, посмотри в его логи
Насколько я понял, торнадо не может запуститься, т.к. возникает ошибка в IOLOOP

Bitbucket
09.07.2017
09:07:16
Dmitry Volodin pushed to noc/feature/moversion sa.managedobjectselector: Filters by profile, vendor, platform, version and TT System

Иван
09.07.2017
09:32:46
Насколько я понял, торнадо не может запуститься, т.к. возникает ошибка в IOLOOP
Но почему это происходит мне непонятно. Надо как-то дебажить Ioloop?

Алексей
09.07.2017
09:34:11
ioloop там не ошибка. точнее ошибка но на работу она точно не влияет

а вот почему у тя 2017-07-08 21:52:46,592 [tornado.general] 400 GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7): Invalid service id 2017-07-08 21:52:46,593 [activator] GET /health/?service=f755fee8-0651-41a4-8bdc-dde66415c8d2 (172.19.31.7)

вот это интересно

@dvolodin как так может быть ?

Google
Иван
09.07.2017
09:35:50
Тогда что это? Этот трейс в web.log появляется часто, не только при попытке запустить опрос.

Bitbucket
09.07.2017
09:39:19
Dmitry Volodin pushed to noc/feature/moversion Replace managed object profile usage

Иван
09.07.2017
09:40:07
Хм. А может это быть из-за того, что я увеличивал кол-во активаторов? Потом вернул 1 и, кажется, после этого перестало работать.

Алексей
09.07.2017
09:41:19
останови полностью нок на 70 секунд

это почистит старые записи в consul

Иван
09.07.2017
09:41:47
Ок.

Алексей
09.07.2017
09:41:57
вообще надо только на 60. но 10 секунд запаса

Dmitry
09.07.2017
09:42:53
https://code.getnoc.com/noc/noc/issues/35

вот нашел древний issue

кто хочет занятся?

могу показать, как правильно настроить ETL для экспорта объектов из заббикса

Алексей
09.07.2017
09:45:22
@ss ?

Иван
09.07.2017
09:45:59
вообще надо только на 60. но 10 секунд запаса
Да я могу хоть на сколько остановить. Пока им пользуюсь только я.

Алексей
09.07.2017
09:46:30
не надо хоть на сколько. надо что бы консул подерагал сервисы

за этим процессом можно посмотреть на http://noc_ip:8500

Bitbucket
09.07.2017
09:58:35
Dmitry Volodin pushed to noc/feature/moversion ./noc script: Fix json object handling

Алексей
09.07.2017
09:58:45
вот. это проблема.

на сервере посмотри на consul info

тебя особенно интересует наличие лидера

Google
Иван
09.07.2017
10:00:15
Это? consul: bootstrap = true known_datacenters = 1 leader = false leader_addr = server = true

Bitbucket
09.07.2017
10:00:20
Dmitry Volodin pushed to noc/feature/moversion SAE: Fix query

Алексей
09.07.2017
10:03:42
Это? consul: bootstrap = true known_datacenters = 1 leader = false leader_addr = server = true
да. почини это используя сайт консула. быть может для начала хватит перезапуска

Иван
09.07.2017
10:07:53
Сайт консула это consul.io ?

Алексей
09.07.2017
10:08:06
ага

Иван
09.07.2017
10:10:09
Заглянул в сислог, а там.. Jul 9 21:07:20 noc telegraf[26528]: 2017-07-09T10:07:20Z E! Error in plugin [inputs.httpjson]: Get https://172.ххх.ххх.ххх/inv/monitor/: x509: cannot validate certificate for 172.ххх.ххх.ххх because it doesn't contain any IP SANs Jul 9 21:07:20 noc consul[1275]: 2017/07/09 21:07:20 [ERR] http: Request PUT /v1/session/create, error: No cluster leader from=127.0.0.1:32598

Алексей
09.07.2017
10:10:24
No cluster leader это проблема

172.ххх.ххх.ххх because it doesn't contain any IP SANs не проблема

E_zombie
09.07.2017
10:11:28
c ioloop лезут ошибки если из CLI запускаешь что нибудь с селектором на много объектов

E_zombie
09.07.2017
10:15:23
попробуй. но это может быть с активаторами отвалившимия от консула связано. тут рекомендуют эпизодически ребутать активаторы ....

Иван
09.07.2017
10:15:29
А как сделать так, чтобы при деплое часовой пояс не слетал?

E_zombie
09.07.2017
10:15:57
не в курсе. у тебя на всех нодах одно время 7

Иван
09.07.2017
10:16:53
У меня одна нода.

E_zombie
09.07.2017
10:17:19
и время всё ок ?

Иван
09.07.2017
10:17:46
да. почини это используя сайт консула. быть может для начала хватит перезапуска
Перезапуск не помог 2017/07/09 21:16:11 [ERR] http: Request PUT /v1/session/create, error: No cluster leader from=127.0.0.1:56828

и время всё ок ?
Ну да. А после деплоя становится московский часовой пояс

E_zombie
09.07.2017
10:19:02
ты консулов ДВА поставил?

Иван
09.07.2017
10:19:44
Нет, один.

Алексей
09.07.2017
10:22:08
ойпи не менялся ?

Google
Алексей
09.07.2017
10:23:05
я бы отмотал лог консула до момента первого появления No cluster leader и посмотрел чего там такое случилось

ибо потеря лидер не такое уж штатное явление

Иван
09.07.2017
10:23:16
Нет. Всегда один и тот же.

E_zombie
09.07.2017
10:23:34
а должно быть ДВА.

Алексей
09.07.2017
10:24:41
нее

на одном хосте можно один

два надо для точного указания в многосерверной конфигации кто бутсрап сервер

Иван
09.07.2017
10:31:25
Jul 4 22:48:29 noc consul[27566]: 2017/07/04 22:48:29 [ERR] agent: failed to sync remote state: No cluster leader Jul 4 22:48:29 noc consul[27566]: agent: failed to sync remote state: No cluster leader Jul 4 22:48:30 noc consul[27566]: consul.acl: Failed to get policy from ACL datacenter: No cluster leader Jul 4 22:48:30 noc consul[27566]: 2017/07/04 22:48:30 [ERR] consul.acl: Failed to get policy from ACL datacenter: No cluster leader

А чуть раньше при перезапуске НОКа было вот такое Jul 4 22:48:22 noc mkdir[27558]: /bin/mkdir: невозможно создать каталог «/var/run/consul»: Файл существует

ойпи не менялся ?
Не менялся, но их на сервере 2.

Admin
ERROR: S client not available

Алексей
09.07.2017
10:37:03
эт всё не фатальное

Иван
09.07.2017
10:37:55
Вот так было за несколько секунд до первой ошибки Jul 4 22:48:22 noc consul[27566]: raft: Node at 172.ууу.ууу.ууу:8300 [Follower] entering Follower state (Leader: "")

А вообще НОК работает на 172.ххх.ххх.ххх

Алексей
09.07.2017
10:38:44
стопни консул и нок

Иван
09.07.2017
10:38:55
Через 172.ууу.ууу.ууу сервер может в инет ходить.

Алексей
09.07.2017
10:39:05
https://www.consul.io/docs/guides/outage.html

думаю тебе интересно consul operator raft -list-peers

ну и скорее всего понадобится https://www.consul.io/docs/guides/outage.html#manual-recovery-using-peers-json

Иван
09.07.2017
10:45:30
root@noc:~/temp# consul operator raft list-peers Error getting peers: Failed to retrieve raft configuration: Unexpected response code: 500 (No cluster leader)

Google
Bitbucket
09.07.2017
10:59:31
Dmitry Volodin pushed to noc/feature/moversion ProfileCheckRules: Use Profile reference

Иван
09.07.2017
11:00:28
Нашел в /etc/consul/config.json "bind_addr": "172.yyy.yyy.yyy" "recursors": [ "172.yyy.yyy.yyy" ]

Наверно, надо переправить на 172.ххх.ххх.ххх ?

Там где работает НОК?

Алексей
09.07.2017
11:01:22
bind должен быть такой какой есть на машине адрес

и по идее деплой его таким и выставляет

Иван
09.07.2017
11:02:19
А если адреса 2 ?

Точно, менялся адрес. Раньше в башне в настройках ноды был localhost, а потом я поставил 172.ххх.ххх.ххх и сделал деплой

Алексей
09.07.2017
11:05:05
вот отсюда и грабля

в много серверной конфигурации сейчас должно быть досвольно просто сменить адрес. когда серверов консула более одного. именно серверов.

а в односерверной видимо надо фигачить Peers.json каждый деплой

Иван
09.07.2017
11:07:29
Т.е. мне смена адреса в /etc/consul/config.json не поможет?

Алексей
09.07.2017
11:08:14
черт

Using raft/peers.json for recovery can cause uncommitted Raft log entries to be implicitly committed, so this should only be used after an outage where no other option is available to recover a lost server. Make sure you don't have any automated processes that will put the peers file in place on a periodic basis.

низя

Иван
09.07.2017
11:08:55
Вот этот кусок я не понял. Ясно только, что что-то может испортиться.

Почему нельзя? "должно испотльзоваться только после отключения когда невозможны другие способы восстановления потерянного сервера"

А чем чревато "безусловный коммит записей Raft log " ?

Bitbucket
09.07.2017
11:15:17
Dmitry Volodin pushed to noc/feature/moversion PeeringPoint: Use profile reference

Dmitry Volodin pushed to noc/feature/moversion sa.peeringpoint: Filter by profile

Dmitry Luhtionov pushed to noc/feature/microservices Fix Huawei.MA5600T.get_interfaces script

Иван
09.07.2017
11:21:07
А как узнать версию протокола Raft ? Для разных версий разная структура файлов.

Страница 1219 из 2357