@nocproject

Страница 2069 из 2357
Алексей
28.05.2018
08:52:53
у меня их сильно больше

но намерян делится в обмен на аварии. :)

Ivan
28.05.2018
08:53:06
4 » 1

Stannis
28.05.2018
08:53:42
но намерян делится в обмен на аварии. :)
Нет проблем, всё для комунити

Google
Алексей
28.05.2018
08:53:48
ага да

Ivan
28.05.2018
08:54:27
ага да
если в гит статус есть хотя бы что-то красное, то он не обновляется, так?

Алексей
28.05.2018
08:55:01
не знаю у меня нету

Ivan
28.05.2018
08:55:10
башня хуёвничает с гиом значит.

по графане: можно ли иметь список динамически сгенеренных дашей МО в какой-нибудь папочке типа "недавно посещённое"?

ведь ID и прочее не менялось

Алексей
28.05.2018
08:59:11
динамически сгенереные дашики это json-ки отданные графане

Neoll
28.05.2018
09:02:06
aloha, снова я с прокси для бота телеграмма, наведите на пусть истенный. перепробовал уже всякое, сейчас squid работает(пока без всякий авторизаций). на ноде $ export http_proxy="http://ip:port" $ export https_proxy="https://ip:port" env | grep -i proxy выдает что http_proxy есть нужный. curl -v https://api.telegram.org/ —proxy http://ip:port возращает мне что соединение установлено, и в логах сквида собсно 198 myip TCP_TUNNEL/200 6291 CONNECT api.telegram.org:443 - HIER_DIRECT/remoteip - а логи в ноке все время failed: 599 Connection refused

Алексей
28.05.2018
09:03:54
так работает ?

Stannis
28.05.2018
09:04:35
Напомните про слоты для консула пожалуйста Они должны равнятся количеству процессов или потоков в процессе?

Алексей
28.05.2018
09:05:06
нет

слоты это сколько должно быть процессов занятых обработкой

Google
Алексей
28.05.2018
09:05:42
если процессу не досталось слота он становится бекапным. и активно ждет появления свбодного слота

если слотов больше чем процессов - часть задач делатся не будет

Stannis
28.05.2018
09:06:12
Т.е. нет смысла высавлять больше слотов, чем сервисов?

если слотов больше чем процессов - часть задач делатся не будет
понял смотрел поиском в чатике, там была рекомендация увеличить количество слотов

Алексей
28.05.2018
09:07:03
есть смысл на инсталяциях где нужно сделать резерв. наприме если у тя 6 серверов с дискавери и ты хотел бы выключить один из них то выставление запасных процессов как раз поможет

Алексей
28.05.2018
09:08:17
на сингл сервере конечно толку нет

может даже вредно

Neoll
28.05.2018
09:10:45
так работает ?
вот так сработало

спасибо, значит все таки не в сервере прокси было дело. схоронил

то есть можно экспортить прокси на прямую ноку

Алексей
28.05.2018
09:13:58
Раз так сработало значит у тя 2 варианта. Первый это заканирибутить в опенсорс. Сделав так что запуск будет вести себя так вот прикрутив оное в башню и в скрипты старта. Второй вариант нафигачить системд юнит который будет стартовать этот сервис отдельно с нужными переменными. И выключить сервис в башне

как говорится choose your destiny

Ivan
28.05.2018
09:18:20
динамически сгенереные дашики это json-ки отданные графане
Но через сутки работы нока json не поменяется же, так?

Алексей
28.05.2018
09:18:44
он нигде не сохраняется

Ivan
28.05.2018
09:19:17
дупустим, у меня будет место, где он сохраняется. Или в графане

Алексей
28.05.2018
09:19:52
чем но как мне тебе помочь ?

Neoll
28.05.2018
09:20:12
все равно спасибо, дальше уже наверчу что необходимо

Алексей
28.05.2018
09:20:41
ок да

Google
Ivan
28.05.2018
09:21:27
чем но как мне тебе помочь ?
ты мне? Я хочу в графане иметь LAST 10 MO, чтобы не из CARD туда шляться

Алексей
28.05.2018
09:22:11
надо поговорить с сашей

Ivan
28.05.2018
09:22:29
я у него спрашивал. Он глубоко выдохнул

и сказал, что нужна какая-то прокладка

но спроси, вдруг ты лучше ему обяъснишь

Алексей
28.05.2018
09:23:19
иди в церковь задавай вопрос по новой. там обсудим как решить.

но сегодня как ты знаешь это делать бесполезно

Ivan
28.05.2018
09:23:29
сегодня всё равно РИФ

Алексей
28.05.2018
09:23:33
да да

если можно будет что то сделать с моей стороны я сделаю

Neoll
28.05.2018
09:25:35
ок да
можно еще вопрос, алерты ospf down/up в SA > object notification пока еще поломаны?

https://code.getnoc.com/noc/noc/issues/739

Stannis
28.05.2018
09:26:18
@freeseacher подскажите пожалуйста по метрикам У меня математика не сходится: script_idle_workers{node="nocworker01",service="activator",pool="default"} 2 script_max_workers{node="nocworker01",service="activator",pool="default"} 20 script_workers{node="nocworker01",service="activator",pool="default"} 3 script_running_workers{node="nocworker01",service="activator",pool="default"} 1 Из 20 воркеров, работает 3, ещё 2 в idle Остальные где? : )

Neoll
28.05.2018
09:26:27
ну в логах корелятора, как была ошибка, такая же и осталась

Алексей
28.05.2018
09:31:16
@freeseacher подскажите пожалуйста по метрикам У меня математика не сходится: script_idle_workers{node="nocworker01",service="activator",pool="default"} 2 script_max_workers{node="nocworker01",service="activator",pool="default"} 20 script_workers{node="nocworker01",service="activator",pool="default"} 3 script_running_workers{node="nocworker01",service="activator",pool="default"} 1 Из 20 воркеров, работает 3, ещё 2 в idle Остальные где? : )
script_idle_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 15 script_max_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 106 script_running_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 13 script_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 28

так же

Stannis
28.05.2018
09:31:51
106??

Алексей
28.05.2018
09:32:20
script_idle_workers+script_running_workers=script_workers

Google
Алексей
28.05.2018
09:32:42
но max это всего

ну всмысле больше 106 не будет

Stannis
28.05.2018
09:33:00
я понимаю

это 106 потоков одного процесса

Так нормально работает?

я поставил по 20 + 2 инстанса на ядро как рекомендовали

Алексей
28.05.2018
09:34:32
у меня там вообще вот так



Так нормально работает?
это ведь активатор. у него 80% времени netwait

Neoll
28.05.2018
09:36:57
job ping Failed to get job log(на всех mo) при этом бокс и переодик работают исправно. в ./noc ctl у всего running (кроме корелятора)

что может быть?

Neoll
28.05.2018
09:38:45
Total Duration: 7.851s Count: 461, Failed: 9, Skipped: 0

так вот
https://pastebin.com/UqJEjPQb

вот на все что поругалось

Алексей
28.05.2018
09:41:59
ну кроме smtp ничего критичного не вижу

осталось перепроверить что активаторы есть в консуле

я пока не придумал как это тестить с консоли

Neoll
28.05.2018
09:42:45
Google
Алексей
28.05.2018
09:42:46
надо зайти по порту 8500 и посмотреть пореганы ли активаторы

Neoll
28.05.2018
09:43:21
осталось перепроверить что активаторы есть в консуле
да, там все ок, ну кроме сертификатов nginx ну это пока все равно



ага, и в боксе сейчас Terminated due RPC error: No active service activator-default found

хм

Алексей
28.05.2018
09:45:36
это печально

перезапусти актоваторы и перепроверь

Stannis
28.05.2018
09:46:14
я пока не придумал как это тестить с консоли
? curl -s localhost:8500/v1/agent/services | python -m json.tool | grep act | wc -l

Алексей
28.05.2018
09:47:41
? curl -s localhost:8500/v1/agent/services | python -m json.tool | grep act | wc -l
ну вот как то так да. но до ума довести надо

ну и на дебиане нет curl

Stannis
28.05.2018
09:48:22
-m requests : )

Алексей
28.05.2018
09:49:19
хочется так вот https://github.com/aelsabbahy/goss/blob/master/docs/manual.md#http

но там надо побадатся с синтаксисом

это кстати сильно сдвинет диагностику вперед

Neoll
28.05.2018
09:50:00
перезапусти актоваторы и перепроверь
помогло, бокс удачно и переодик. а пинг все так же статус ОК но Failed to get job log )

Алексей
28.05.2018
09:50:12
а там и нет job-log

нет корелятора некому разгребать последствия и поднимать аварии или опускать оные

Neoll
28.05.2018
09:51:29
Command: /opt/noc/noc ctl status |grep correlator: stdout: patterns not found: [/correlator-.+RUNNING/]

Алексей
28.05.2018
09:51:39
это кстати сильно сдвинет диагностику вперед
я уже думал было сомневатся что стоит продолжать писать тесты для goss ибо автор куда то запропастился. но не так давно он вернулся

Neoll
28.05.2018
09:52:49
почини это
руками если останавливать и запускать он все равно running

Страница 2069 из 2357