
Алексей
14.12.2017
21:39:05
тут

Wingman
14.12.2017
21:42:44
тут
Тогда хоть скажи, на какие графики смотреть попристальнее в контексте очередей nsq и эвентов)

Алексей
14.12.2017
21:42:46
ну и парочку для завтравки выложил на https://grafana.com/orgs/shirokih

Ivan
14.12.2017
21:44:04

Google

Wingman
14.12.2017
21:45:17
ну да
чо там ставить

Алексей
14.12.2017
21:46:28
по результатам он переложит в nsq_channel_depth{channel="dispose"}
первый очередь класификтаора. второй корелятора

Ivan
14.12.2017
21:48:20
у тебя всё равно один пул!

Wingman
14.12.2017
21:48:29
:/
а у тебя не взлетает, чтоли?
ну да

Ivan
14.12.2017
21:48:47

Wingman
14.12.2017
21:48:53

Алексей
14.12.2017
21:49:12

Google

Алексей
14.12.2017
21:49:26
смотри на динамику. думай.

Wingman
14.12.2017
21:49:48
угу
но один хрен какая-то магия

Алексей
14.12.2017
21:49:53
получится какая то мысль оформи ее как alarm

Wingman
14.12.2017
21:50:08
навалило несколько тыщ, процы в полку, передеплоил, разгребло
=\

Алексей
14.12.2017
21:50:44
https://prometheus.io/docs/alerting/configuration/
вот как оформить ее в аларм

Wingman
14.12.2017
21:51:11
да, я чуток почитал уже

Алексей
14.12.2017
21:51:37
пром крайне линейная штука

Wingman
14.12.2017
21:52:03
да один бинарник и один конфиг (ну, в базе)
прям аж непривычно

Алексей
14.12.2017
21:52:16
не один конфиг
и не один бинарник
но остальные сюрпризы я тебе оставлю на потом

Wingman
14.12.2017
21:52:48
:D

Алексей
14.12.2017
21:53:00
кривая обучения у него такая же как у нока.
хотя нет. у нока злее.

Ivan
14.12.2017
21:53:22
это та, на которой вешаться можно?

Алексей
14.12.2017
21:53:37

Google

Ivan
14.12.2017
21:53:43
ага.

Wingman
14.12.2017
21:54:17
nsq_channel_depth{channel="fmwriter"}
^ а это что, число эвентов в очереди?

Алексей
14.12.2017
21:54:24
да

Wingman
14.12.2017
21:54:37
нихрена оно не разгребло :D
блин

Алексей
14.12.2017
21:56:04
ты данные то для диагностики собрал уже ?
отдай собранное

Wingman
14.12.2017
21:56:08
и таки тоже подвирает

Алексей
14.12.2017
21:56:12
интрересно же

Wingman
14.12.2017
21:57:06
:D
https://ip-home.net/files/prof_funcs.txt
а не
чем отличаются msgs от be-depth?

Алексей
14.12.2017
21:59:58

Wingman
14.12.2017
22:00:03
30-40c

Алексей
14.12.2017
22:00:55
нда.

Google

Wingman
14.12.2017
22:01:21
всё очень плохо? я опять что-то сделал не так?)
ну и пока так и есть 1ev/sec на 400к в очереди :)

Алексей
14.12.2017
22:05:22
а у тя какая ось ?

Wingman
14.12.2017
22:08:07
деб 8.9
Ну и да, последний раз, когда деплойнул 8 или 12, они просто стали грести по 0.2-0.5 / сек
Как будто им что-то не отдает данные, а не они сами не успевают

Алексей
14.12.2017
22:12:23
надо дебажить.
пока путь только один. issuue

Wingman
14.12.2017
22:14:17
Ок
Завтрв уже

Ivan
14.12.2017
22:27:32

Алексей
14.12.2017
22:28:01
ls лишний да

Ivan
14.12.2017
22:28:11
и ведь на всех нодах надо удалять, да?)

Алексей
14.12.2017
22:30:21
конечно
это снизит нагрузку на прометей
так он не будет собирать одни и теже данные 2 раза

Ivan
14.12.2017
22:35:48
вдруг, поможет с пропавшими метриками

fx00f
14.12.2017
22:42:35
Надежда умирает последней

Ilya
14.12.2017
22:43:54
А зря

fx00f
14.12.2017
22:45:33
Я верую!

Google

fx00f
14.12.2017
22:46:01
Что наступит день и воздастся нам за терпение наше!

Ivan
14.12.2017
22:46:31
Lasciate ogni speranza, voi ch'entrate

fx00f
14.12.2017
22:47:28
Ну тут не ад же)
Хотя...

Ivan
14.12.2017
23:01:05
хуй там был, в общем.
дискавери он снимает, а пинги-шминги не хочет
хотя саксессы вроде показывает

Stannis
15.12.2017
00:17:35
Башня валится на этом шаге
TASK [node : Relink site-packages] 03:55changed: [noc01] => { "changed": true, "cmd": [ "/opt/noc/scripts/deploy/link-site-packages" ], "delta": "0:00:00.031696", "end": "2017-12-14 23:06:27.071893", "failed": false, "rc": 0, "start": "2017-12-14 23:06:27.040197" } STDOUT: CHANGED TASK [node : Install node python packages(should take a while for a first time)] ***
в логах:
[node : Install node python packages(should take a while for a first time)] ***\n\nConnection terminated\n', True, 0, 0, 0, 0, 58])
Таймауты в SSH выкрутил на максимум

Алексей
15.12.2017
00:20:42
трогать таймауты никакие не стоило
если инсталяция пошла по такому пути значит что то фатально идет не по задуманному.
есть какие то внезапности

Stannis
15.12.2017
00:29:47
И опять такая же беда
[migrate : Synchronize collections] ***************************************\n\nConnection terminated\n', True, 0, 0, 0, 0, 59])

Алексей
15.12.2017
00:30:20
это они в пределах одного хоста так себя ведут ?:

Stannis
15.12.2017
00:31:03
Две VM
1. Tower
2. noc
общаются через br0

Алексей
15.12.2017
00:31:48
что такое br0 ? bro ?

Stannis
15.12.2017
00:32:06
linux bridge
Я к тому, что они считай что кабелем соеденены
никаких таймаутов быть не может
CentOS7

Алексей
15.12.2017
00:32:44
so you have to fix it