@nocproject

Страница 376 из 2357
Ilya
07.10.2016
19:56:08
ну и на воркере nsq

Алексей
07.10.2016
19:56:16
вот это похоже на причину

Ilya
07.10.2016
19:57:30
вот это похоже на причину
но события опять залипли

они как будто реально теряются

Google
Ilya
07.10.2016
19:57:53
22:30 последнее

может у нас конечно в цоде херь какая-то, вм на разных нодах, но незамечено на остальных системах

на standalone проблем подобных не было

Dmitry
07.10.2016
20:02:28
nsqlookupd у тебя нормальный?

Ilya
07.10.2016
20:02:39
Dmitry
07.10.2016
20:02:43
и nsqd за него цепляются

?

проверь топологию nsq

Алексей
07.10.2016
20:04:09
ох тыж йожик

Ivan
07.10.2016
20:04:14
о чем в логе будет много рас сазано
пока всё чисто. Ничего не закончилось. Монга кушает 203 коннекта, но она вроде не ограничена в башне. Постгрес 204/300. Discovery tasks Running 222, late 420. Добавляю ещё 1 процесс дискавери? активаторов сейчас 5 по 30

Алексей
07.10.2016
20:04:23
на каждую ноду п lookupd ?

оверкил

http://nsq.io/overview/design.html

Google
Dmitry
07.10.2016
20:05:08
да, как-то много

Ilya
07.10.2016
20:05:48
хех

оверкил
это может быть связано с моей ситуацией?

не думаю

Алексей
07.10.2016
20:13:07
нет просто еще один лишнй ресурс

который кстати на халяву жрет ресурсы

Ilya
07.10.2016
20:13:40
спс за это

но куда копать?)

Что если когда-то ntp был сбит и к тому же мигрировали вм на другой хост+авария была в цоде.. Как восстонавливать всю эту херь?

Dmitry
07.10.2016
20:15:13
пиздить админа и EMC

за уехавшее время

Ilya
07.10.2016
20:16:26
и IBM тогда уж за дохлый брокейд

Алексей
07.10.2016
20:16:27
нет

пиздить поздно

время сделай что бы было нормальным

Dmitry
07.10.2016
20:16:49
а IBM не пиздить, а выпиздить

Алексей
07.10.2016
20:16:58
потом смотри очереди. в них недолжно быть старых данных

Ilya
07.10.2016
20:17:02
время сделай что бы было нормальным
на всех нодах время синк

Алексей
07.10.2016
20:17:11
потом читай лог классифкатора и коррелятора

Google
Ilya
07.10.2016
20:17:15
в nsq

Алексей
07.10.2016
20:17:22
они долвольно внятно пишут что с ним не так

Илья
07.10.2016
20:17:54
Dmitry
07.10.2016
20:17:55
уехавшее время часто встречается

N
07.10.2016
20:17:57
kb.nocproject.org закончился

Dmitry
07.10.2016
20:18:03
что-бы такого сделать с ним

Алексей
07.10.2016
20:18:10
Механику я усвоил давно
а можешь сделать зарисовку ?

там же в конфлюенсе через макрос gliffy

Алексей
07.10.2016
20:19:53
Ilya
07.10.2016
20:20:01
noc.schedules.scheduler

N
07.10.2016
20:20:03
не открывается

Ilya
07.10.2016
20:20:03
что тут лежит?

Илья
07.10.2016
20:20:57
+1

N
07.10.2016
20:21:00
теперь да

хм

а кто говорил, что телеграф плодит процессы и там надо что-то в конфиге поправить?

Google
Ivan
07.10.2016
20:23:01
а можешь сделать зарисовку ?
Да, если расскажешь, как дискавери-тредов, раннинг тасков может быть больше, чем активаторо-тасков

Алексей
07.10.2016
20:23:07
кто то даже в фак это записал

N
07.10.2016
20:23:20
да вот я и пытался в факе найти )

Ivan
07.10.2016
20:23:37
Алексей
07.10.2016
20:23:51
да вот я и пытался в факе найти )
ну видимо не найдешь.

Ivan
07.10.2016
20:23:51
да вот я и пытался в факе найти )
Обнови телеграф до версии 1+

Алексей
07.10.2016
20:23:56
потому что это был иван :)

Ivan
07.10.2016
20:24:09
Я про ьелегоаф не писал!

N
07.10.2016
20:24:17
а ансибл не обновляет?

Ivan
07.10.2016
20:24:19
Я на него на тот момент обиделся

Алексей
07.10.2016
20:24:45
N
07.10.2016
20:26:21
кстати, я чувствую, что мне тоже графики придется пилить по состоянию нока, и смотреть за шедулером я же тогда галку "Управляем " снял с МО, и по этому МО еще примерно сутки логи принимались, а потом начали дропаться

Ilya
07.10.2016
20:26:31
https://github.com/influxdata/telegraf/blob/master/scripts/telegraf.service

в /etc/systemd/system/telegraf.service

systemctl daemin-reload

потом рестарт

N вот

N
07.10.2016
20:26:48
ага, спс

Ilya
07.10.2016
20:27:53
@freeseacher Lookupd Conns. горели зеленым, а теперь нет

это как-то отражает статус?

Google
Ilya
07.10.2016
20:30:50
сделал 1 nsqllookup, сразу нагрузка на event node возрасла

Ivan
07.10.2016
20:32:43
Ilya
07.10.2016
20:32:58
2016-10-07 23:32:22,013 [classifier] [57f806564847302e33fba501|kr01-vpn-gw01-1|10.100.3.25] Failed to process event: database error: Can't canonicalize query: BadValue: unknown string alias for $type: SSL

Ivan
07.10.2016
20:33:12
Я от рута дописывал, точно

Ilya
07.10.2016
20:38:11
@dvolodin вот коррелятор у меня весь в трейсах, я тебе прислал лог сегодня

Dmitry
07.10.2016
20:38:48
понятия не имею, что это

SSL выключи

Ilya
07.10.2016
20:39:16
Я вот тоже без понятия

Ivan
07.10.2016
21:00:23
Я что-то не пойму

я ставлю в башне 6 активаторов, в файл пишутся 5

в инвентори

ставлю 5, пишутся 4

что за приколы

а теперь вообще, 5 не меняется

там как-то надо хитро тыкать?

Буду f5-чить

Да, в поле инстансов лучше после f5 проверять

Abslimit
07.10.2016
22:05:51
Добрый вечер. Не скажете, в скрипте ./scripts/upgrade можно ли как нибудь пропустить обновление PIPа

Ilya
07.10.2016
22:20:31
@dvolodin у вас если отрыть вкладку events события последние с текущим временем или с какой-то задержкой будут?

Ivan
07.10.2016
22:53:34
Добрый вечер. Не скажете, в скрипте ./scripts/upgrade можно ли как нибудь пропустить обновление PIPа
на девелоп ветку положен болт, рекомендую рассмотреть возможность переноса МО и прочего

Страница 376 из 2357