
Ilya
07.10.2016
19:56:08
ну и на воркере nsq

Алексей
07.10.2016
19:56:16
вот это похоже на причину

Ilya
07.10.2016
19:57:30
они как будто реально теряются

Google

Ilya
07.10.2016
19:57:53
22:30 последнее
может у нас конечно в цоде херь какая-то, вм на разных нодах, но незамечено на остальных системах
на standalone проблем подобных не было

Dmitry
07.10.2016
20:02:28
nsqlookupd у тебя нормальный?

Ilya
07.10.2016
20:02:39

Dmitry
07.10.2016
20:02:43
и nsqd за него цепляются
?
проверь топологию nsq

Алексей
07.10.2016
20:04:09
ох тыж йожик

Ivan
07.10.2016
20:04:14
о чем в логе будет много рас сазано
пока всё чисто. Ничего не закончилось.
Монга кушает 203 коннекта, но она вроде не ограничена в башне.
Постгрес 204/300.
Discovery tasks Running 222, late 420.
Добавляю ещё 1 процесс дискавери? активаторов сейчас 5 по 30

Алексей
07.10.2016
20:04:23
на каждую ноду п lookupd ?
оверкил
http://nsq.io/overview/design.html

Google

Dmitry
07.10.2016
20:05:08
да, как-то много

Ilya
07.10.2016
20:05:48
хех
оверкил
это может быть связано с моей ситуацией?
не думаю

Алексей
07.10.2016
20:13:07
нет просто еще один лишнй ресурс
который кстати на халяву жрет ресурсы

Ilya
07.10.2016
20:13:40
спс за это
но куда копать?)
Что если когда-то ntp был сбит и к тому же мигрировали вм на другой хост+авария была в цоде..
Как восстонавливать всю эту херь?

Dmitry
07.10.2016
20:15:13
пиздить админа и EMC
за уехавшее время

Ilya
07.10.2016
20:16:26
и IBM тогда уж за дохлый брокейд

Алексей
07.10.2016
20:16:27
нет
пиздить поздно
время сделай что бы было нормальным

Dmitry
07.10.2016
20:16:49
а IBM не пиздить, а выпиздить

Алексей
07.10.2016
20:16:58
потом смотри очереди. в них недолжно быть старых данных

Ilya
07.10.2016
20:17:02

Алексей
07.10.2016
20:17:11
потом читай лог классифкатора и коррелятора

Ilya
07.10.2016
20:17:13

Google

Ilya
07.10.2016
20:17:15
в nsq

Алексей
07.10.2016
20:17:22
они долвольно внятно пишут что с ним не так

Илья
07.10.2016
20:17:54

Dmitry
07.10.2016
20:17:55
уехавшее время часто встречается

N
07.10.2016
20:17:57
kb.nocproject.org закончился

Dmitry
07.10.2016
20:18:03
что-бы такого сделать с ним

Алексей
07.10.2016
20:18:10
там же в конфлюенсе через макрос gliffy

Ilya
07.10.2016
20:18:35

Алексей
07.10.2016
20:19:53

Ilya
07.10.2016
20:20:01
noc.schedules.scheduler

N
07.10.2016
20:20:03
не открывается

Ilya
07.10.2016
20:20:03
что тут лежит?

Илья
07.10.2016
20:20:57
+1

N
07.10.2016
20:21:00
теперь да
хм
а кто говорил, что телеграф плодит процессы и там надо что-то в конфиге поправить?

Ilya
07.10.2016
20:22:35

Google

Ivan
07.10.2016
20:23:01

Алексей
07.10.2016
20:23:07
кто то даже в фак это записал

N
07.10.2016
20:23:20
да вот я и пытался в факе найти )

Ivan
07.10.2016
20:23:37

Алексей
07.10.2016
20:23:51

Ivan
07.10.2016
20:23:51

Алексей
07.10.2016
20:23:56
потому что это был иван :)

Ivan
07.10.2016
20:24:09
Я про ьелегоаф не писал!

N
07.10.2016
20:24:17
а ансибл не обновляет?

Ivan
07.10.2016
20:24:19
Я на него на тот момент обиделся

Алексей
07.10.2016
20:24:45

N
07.10.2016
20:26:21
кстати, я чувствую, что мне тоже графики придется пилить по состоянию нока, и смотреть за шедулером
я же тогда галку "Управляем " снял с МО, и по этому МО еще примерно сутки логи принимались, а потом начали дропаться

Ilya
07.10.2016
20:26:31
https://github.com/influxdata/telegraf/blob/master/scripts/telegraf.service
в /etc/systemd/system/telegraf.service
systemctl daemin-reload
потом рестарт
N вот

N
07.10.2016
20:26:48
ага, спс

Ilya
07.10.2016
20:27:53
@freeseacher Lookupd Conns. горели зеленым, а теперь нет
это как-то отражает статус?

Google

Ilya
07.10.2016
20:30:50
сделал 1 nsqllookup, сразу нагрузка на event node возрасла

Ivan
07.10.2016
20:32:43

Ilya
07.10.2016
20:32:58
2016-10-07 23:32:22,013 [classifier] [57f806564847302e33fba501|kr01-vpn-gw01-1|10.100.3.25] Failed to process event: database error: Can't canonicalize query: BadValue: unknown string alias for $type: SSL

Ivan
07.10.2016
20:33:12
Я от рута дописывал, точно

Ilya
07.10.2016
20:38:11
@dvolodin вот коррелятор у меня весь в трейсах, я тебе прислал лог сегодня

Dmitry
07.10.2016
20:38:48
понятия не имею, что это
SSL выключи

Ilya
07.10.2016
20:39:16
Я вот тоже без понятия

Ivan
07.10.2016
21:00:23
Я что-то не пойму
я ставлю в башне 6 активаторов, в файл пишутся 5
в инвентори
ставлю 5, пишутся 4
что за приколы
а теперь вообще, 5 не меняется
там как-то надо хитро тыкать?
Буду f5-чить
Да, в поле инстансов лучше после f5 проверять

Abslimit
07.10.2016
22:05:51
Добрый вечер. Не скажете, в скрипте ./scripts/upgrade можно ли как нибудь пропустить обновление PIPа

Ilya
07.10.2016
22:20:31
@dvolodin у вас если отрыть вкладку events события последние с текущим временем или с какой-то задержкой будут?

Ivan
07.10.2016
22:53:34