
Алексей
28.05.2018
08:52:53
у меня их сильно больше
но намерян делится в обмен на аварии. :)

Ivan
28.05.2018
08:53:06
4 » 1

Stannis
28.05.2018
08:53:42

Google

Алексей
28.05.2018
08:53:48
ага да

Ivan
28.05.2018
08:54:27
ага да
если в гит статус есть хотя бы что-то красное, то он не обновляется, так?

Алексей
28.05.2018
08:55:01
не знаю у меня нету

Ivan
28.05.2018
08:55:10
башня хуёвничает с гиом значит.
по графане:
можно ли иметь список динамически сгенеренных дашей МО в какой-нибудь папочке типа "недавно посещённое"?
ведь ID и прочее не менялось

Алексей
28.05.2018
08:59:11
динамически сгенереные дашики это json-ки отданные графане

Neoll
28.05.2018
09:02:06
aloha, снова я с прокси для бота телеграмма, наведите на пусть истенный. перепробовал уже всякое, сейчас squid работает(пока без всякий авторизаций). на ноде
$ export http_proxy="http://ip:port"
$ export https_proxy="https://ip:port"
env | grep -i proxy выдает что http_proxy есть нужный.
curl -v https://api.telegram.org/ —proxy http://ip:port возращает мне
что соединение установлено, и в логах сквида собсно 198 myip TCP_TUNNEL/200 6291 CONNECT api.telegram.org:443 - HIER_DIRECT/remoteip -
а логи в ноке все время failed: 599 Connection refused

Алексей
28.05.2018
09:03:54
так работает ?

Stannis
28.05.2018
09:04:35
Напомните про слоты для консула пожалуйста
Они должны равнятся количеству процессов или потоков в процессе?

Алексей
28.05.2018
09:05:06
нет
слоты это сколько должно быть процессов занятых обработкой

Google

Алексей
28.05.2018
09:05:42
если процессу не досталось слота он становится бекапным. и активно ждет появления свбодного слота
если слотов больше чем процессов - часть задач делатся не будет

Stannis
28.05.2018
09:06:12
Т.е. нет смысла высавлять больше слотов, чем сервисов?

Алексей
28.05.2018
09:07:03
есть смысл на инсталяциях где нужно сделать резерв. наприме если у тя 6 серверов с дискавери и ты хотел бы выключить один из них то выставление запасных процессов как раз поможет

Stannis
28.05.2018
09:08:01

Алексей
28.05.2018
09:08:17
на сингл сервере конечно толку нет
может даже вредно

Neoll
28.05.2018
09:10:45
спасибо, значит все таки не в сервере прокси было дело. схоронил
то есть можно экспортить прокси на прямую ноку

Алексей
28.05.2018
09:13:58
Раз так сработало значит у тя 2 варианта. Первый это заканирибутить в опенсорс. Сделав так что запуск будет вести себя так вот прикрутив оное в башню и в скрипты старта. Второй вариант нафигачить системд юнит который будет стартовать этот сервис отдельно с нужными переменными. И выключить сервис в башне
как говорится choose your destiny

Ivan
28.05.2018
09:18:20

Алексей
28.05.2018
09:18:44
он нигде не сохраняется

Ivan
28.05.2018
09:19:17
дупустим, у меня будет место, где он сохраняется. Или в графане

Алексей
28.05.2018
09:19:52
чем но как мне тебе помочь ?

Neoll
28.05.2018
09:20:12
все равно спасибо, дальше уже наверчу что необходимо

Алексей
28.05.2018
09:20:41
ок да

Google

Ivan
28.05.2018
09:21:27

Алексей
28.05.2018
09:22:11
надо поговорить с сашей

Ivan
28.05.2018
09:22:29
я у него спрашивал. Он глубоко выдохнул
и сказал, что нужна какая-то прокладка
но спроси, вдруг ты лучше ему обяъснишь

Алексей
28.05.2018
09:23:19
иди в церковь задавай вопрос по новой. там обсудим как решить.
но сегодня как ты знаешь это делать бесполезно

Ivan
28.05.2018
09:23:29
сегодня всё равно РИФ

Алексей
28.05.2018
09:23:33
да да
если можно будет что то сделать с моей стороны я сделаю

Neoll
28.05.2018
09:25:35
ок да
можно еще вопрос, алерты ospf down/up в SA > object notification пока еще поломаны?
https://code.getnoc.com/noc/noc/issues/739

Алексей
28.05.2018
09:26:01

Stannis
28.05.2018
09:26:18
@freeseacher подскажите пожалуйста по метрикам
У меня математика не сходится:
script_idle_workers{node="nocworker01",service="activator",pool="default"} 2
script_max_workers{node="nocworker01",service="activator",pool="default"} 20
script_workers{node="nocworker01",service="activator",pool="default"} 3
script_running_workers{node="nocworker01",service="activator",pool="default"} 1
Из 20 воркеров, работает 3, ещё 2 в idle
Остальные где? : )

Neoll
28.05.2018
09:26:27
ну в логах корелятора, как была ошибка, такая же и осталась

Алексей
28.05.2018
09:31:16
@freeseacher подскажите пожалуйста по метрикам
У меня математика не сходится:
script_idle_workers{node="nocworker01",service="activator",pool="default"} 2
script_max_workers{node="nocworker01",service="activator",pool="default"} 20
script_workers{node="nocworker01",service="activator",pool="default"} 3
script_running_workers{node="nocworker01",service="activator",pool="default"} 1
Из 20 воркеров, работает 3, ещё 2 в idle
Остальные где? : )
script_idle_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 15
script_max_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 106
script_running_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 13
script_workers{env="prod",instance="ZZ.132:26849",node="mwrk01_mo",service="activator"} 28
так же

Stannis
28.05.2018
09:31:51
106??

Алексей
28.05.2018
09:32:20
script_idle_workers+script_running_workers=script_workers

Google

Алексей
28.05.2018
09:32:42
но max это всего
ну всмысле больше 106 не будет

Stannis
28.05.2018
09:33:00
я понимаю
это 106 потоков одного процесса
Так нормально работает?
я поставил по 20 + 2 инстанса на ядро как рекомендовали

Алексей
28.05.2018
09:34:32
у меня там вообще вот так

Neoll
28.05.2018
09:36:57
job ping Failed to get job log(на всех mo) при этом бокс и переодик работают исправно. в ./noc ctl у всего running (кроме корелятора)
что может быть?

Алексей
28.05.2018
09:37:29
так вот

Neoll
28.05.2018
09:38:45
Total Duration: 7.851s
Count: 461, Failed: 9, Skipped: 0
так вот
https://pastebin.com/UqJEjPQb
вот на все что поругалось

Алексей
28.05.2018
09:41:59
ну кроме smtp ничего критичного не вижу
осталось перепроверить что активаторы есть в консуле
я пока не придумал как это тестить с консоли

Neoll
28.05.2018
09:42:45

Google

Алексей
28.05.2018
09:42:46
надо зайти по порту 8500 и посмотреть пореганы ли активаторы

Neoll
28.05.2018
09:43:21
ага, и в боксе сейчас Terminated due RPC error: No active service activator-default found
хм

Алексей
28.05.2018
09:45:36
это печально
перезапусти актоваторы и перепроверь

Stannis
28.05.2018
09:46:14

Алексей
28.05.2018
09:47:41
ну и на дебиане нет curl

Stannis
28.05.2018
09:48:22
-m requests : )

Алексей
28.05.2018
09:49:19
хочется так вот https://github.com/aelsabbahy/goss/blob/master/docs/manual.md#http
но там надо побадатся с синтаксисом
это кстати сильно сдвинет диагностику вперед

Neoll
28.05.2018
09:50:00

Алексей
28.05.2018
09:50:12
а там и нет job-log
нет корелятора некому разгребать последствия и поднимать аварии или опускать оные

Neoll
28.05.2018
09:51:29
Command: /opt/noc/noc ctl status |grep correlator: stdout: patterns not found: [/correlator-.+RUNNING/]

Алексей
28.05.2018
09:51:39

Neoll
28.05.2018
09:52:49
почини это
руками если останавливать и запускать он все равно running