
Ilya
08.06.2016
16:22:53
и то secondary
На основной смотреть просто больно ))

Алексей
08.06.2016
16:23:07
я понима.
просто дима сейчас учил его раставлять доступ а не ядро

Google

Ilya
08.06.2016
16:23:47
Ну схема нормальная получилась для цода

Алексей
08.06.2016
16:23:48
доступ довольно простой как правило.
* кольца
* деревья
* солнца

Ilya
08.06.2016
16:23:57
читабельная

Алексей
08.06.2016
16:24:49
ну и опять же напомню, мы ищем в команду человека которому можно будет поручить фронтенд.
за деньги.

SS
08.06.2016
16:25:20
что на чем писать

Алексей
08.06.2016
16:25:58
js
делать так что бы нок был симпатичнее а Zi довольнее.

Ilya
08.06.2016
16:26:41
10798 root 20 0 297M 33732 5572 R 99.0 0.2 5:05.17 ./bin/python ./services/syslogcollector/service.py
10795 root 20 0 295M 29652 5580 R 97.1 0.2 4:54.62 ./bin/python ./services/trapcollector/service.py
Меня это начало напрягать

Алексей
08.06.2016
16:27:02
у тя там есть нагрузка ?

Ilya
08.06.2016
16:27:28
Я не могу посмотреть по мониторингу, но да, видимо есть

Алексей
08.06.2016
16:27:41
всмысле к тебе прилетают и трапы и сислоги ?

Ilya
08.06.2016
16:27:45
да

Google

Ilya
08.06.2016
16:27:52
И
supervisord тоже в 100%

Алексей
08.06.2016
16:28:53
опа
чего в логах ?
давай начнем с сервисов

Ilya
08.06.2016
16:30:27
Я обновился 12 мин назад, поэтому в логах мало толкового

Алексей
08.06.2016
16:33:14
я праивльно опнимаю что цепочка выглядит так
нормальная нагрузка -> обновление - > высокая нагрузка ?

Jason
08.06.2016
16:33:52
Can anyone tell me what the inc_root directive in noc-sync.conf specifies? What's the difference between inc_root and root?

Ilya
08.06.2016
16:34:09
Надо тестировать, высокая нагрузка была даже через какое-то время после ребута ноды, но только на syslog, trapcollect.
supervisord при этом был в норме
На второй ноде все хорошо после обновления
На эту ноду больше прилетает логов

Алексей
08.06.2016
16:35:09
илья у тя же есть телеграф
он по идее собирает нагрузку
сделай к ней дашбордик минимальный

Ilya
08.06.2016
16:35:47
Можешь скинуть конфиг?
У тебя красивые дашборды

Алексей
08.06.2016
16:36:35

Ilya
08.06.2016
16:36:37
На счет метрик, я в то же время сделал отдельный дашборд руками и добавил хосты - метрики есть, но при нажатии на кнопку ddash из нока - пусто (black screen)

Алексей
08.06.2016
16:41:27
датасорс должен называться telemetry
в графане очень просто делаются дашбордики поэтому я не вижу особо смысла их выкладывать, толку не много. это ведь вкусовщина

Google

Ilya
08.06.2016
16:43:13
аха, понял

SS
08.06.2016
16:45:32
что то на картах включаю отображение загрузки и ничего не меняется. Что должно быть включено в узлах?

Алексей
08.06.2016
16:45:58
SS у тебя я так понимаю старая версия

SS
08.06.2016
16:46:35

Алексей
08.06.2016
16:47:59
ну да.
ветка devel по всей видимости

SS
08.06.2016
16:48:21
да
а вы какую мучаете?

Алексей
08.06.2016
16:48:32
ну а мы тут про микросервисную :)

SS
08.06.2016
16:48:44
она ж вроде еще не работает стабильно?

Алексей
08.06.2016
16:48:53
много записи в логи ?

SS
08.06.2016
16:49:12
пару месяцев назад вроде не взлетела
у нас

Алексей
08.06.2016
16:49:24
если у тя традиционные винты то 180 это их полоток

Ilya
08.06.2016
16:49:38
На DB hhd+ssd

Алексей
08.06.2016
16:49:52
ога
значит у тя как я и предполагал сразу пошло чег ото писать ся в логи

Google

Алексей
08.06.2016
16:50:13
много сразу

Ilya
08.06.2016
16:50:36
возможно
дб курит вообще

Алексей
08.06.2016
16:51:09
дык ты в реалтайме глянь tail -f var/log/*coll*.log

Ilya
08.06.2016
16:51:33
[syslogcollector] Failed to mpub to topic 'events': SendError: no connections (None). Retry
весь лог засран

Алексей
08.06.2016
16:51:55
в каком состоянии nsq ?

Ilya
08.06.2016
16:52:26
как посмотреть?

Алексей
08.06.2016
16:52:36
systemctl status nsqd


Ilya
08.06.2016
16:52:48
Jun 08 19:16:59 st02 systemd[1]: nsqd.service: main process exited, code=exited, status=1/FAILURE
Jun 08 19:16:59 st02 systemd[1]: Unit nsqd.service entered failed state.
Jun 08 19:16:59 st02 systemd[1]: nsqd.service holdoff time over, scheduling restart.
Jun 08 19:16:59 st02 systemd[1]: Stopping Realtime distributed messaging (nsqd)...
Jun 08 19:16:59 st02 systemd[1]: Starting Realtime distributed messaging (nsqd)...
Jun 08 19:16:59 st02 systemd[1]: nsqd.service start request repeated too quickly, refusing to start.
Jun 08 19:16:59 st02 systemd[1]: Failed to start Realtime distributed messaging (nsqd).
Jun 08 19:16:59 st02 systemd[1]: Unit nsqd.service entered failed state.
Вот поэтому может метрики и не работали у меня
systemctl status nsqd
nsqd.service - Realtime distributed messaging (nsqd)
Loaded: loaded (/etc/systemd/system/nsqd.service; enabled)
Active: failed (Result: start-limit) since Wed 2016-06-08 19:16:59 MSK; 35min ago
Process: 9374 ExecStart=/opt/noc/bin/nsqd -config /opt/noc/var/etc/nsq/nsqd.conf (code=exited, status=1/FAILURE)
Main PID: 9374 (code=exited, status=1/FAILURE)
CGroup: /system.slice/nsqd.service
на второй ноде nsq тоже лежит


Алексей
08.06.2016
16:54:44
да именн опо этому метрики не попадают в influx
а есть ли у тя nsqlookupd ?

Ilya
08.06.2016
16:55:42
Да, 1*n нод
на каждой

Алексей
08.06.2016
16:56:17
это наверное дофига. это ноды координации
по идее на три хоста у тя должно быть
* одна нода nsqlookupd
* 3 ноды nsqd
* одна админка
ну на крайняк две ноды lookupd

Google

Ilya
08.06.2016
16:58:39
админка на дб, nsqd 1*n нод, на каждой ноде
так же и лукап
Лукап на дб лучше оставить? А кол-во инстансов?

Илья
08.06.2016
16:59:56
@somovis успешно перенял мою роль сношателя мозга

Ilya
08.06.2016
17:00:06
@ivzakharov давно :)
Я просто хочу, что бы оно работало :)

Алексей
08.06.2016
17:00:37
lookupd один
на все.
и один инстанс

Ilya
08.06.2016
17:00:49
В системных сервисах я не силен, поэтому не знаю
Ок

Алексей
08.06.2016
17:00:52
nsqd один на каждой ноде

Ilya
08.06.2016
17:01:04

Алексей
08.06.2016
17:01:09
да

Ilya
08.06.2016
17:01:46
Ну, поехали

SS
08.06.2016
17:03:22
а где можно почитать про микросервисы, в чем их суть и плюсы?