
Алексей
06.10.2016
07:11:42
телеграф от рута работает ?

Ivan
06.10.2016
07:12:41

E_zombie
06.10.2016
07:17:02
2016/10/06 10:15:41 Error: procstat getting process, exe: [] pidfile: [] pattern: [noc-mrt] user: [] Failed to execute /usr/bin/pgrep. Error: 'exit status 1'
2016/10/06 10:15:41 Error: procstat getting process, exe: [] pidfile: [] pattern: [noc-ping] user: [] Failed to execute /usr/bin/pgrep. Error: 'exit status 1'
2016/10/06 10:15:41 Error: procstat getting process, exe: [] pidfile: [] pattern: [noc-classifier] user: [] Failed to execute /usr/bin/pgrep. Error: 'exit status 1

Google

Илья
06.10.2016
07:18:57

Ivan
06.10.2016
07:19:37

E_zombie
06.10.2016
07:21:20
а куда телеграф фигачит свои пиды ?
или это к пгрепу ?

Ivan
06.10.2016
07:31:48
телеграф вроде за пидами процессов охотится

E_zombie
06.10.2016
07:32:15
вот почему оно не могёт
2016/10/06 10:28:01 Error: procstat getting process, exe: [] pidfile: [] pattern: [noc-discovery] user: [] Failed to execute /usr/bin/pgrep. Error: 'exit status 1'
[root@nochost telegraf]# grep pgrep *.log | awk '{print $12}' | sort | uniq
[mongod]
[noc-activator]
[noc-card]
[noc-classifier]
[noc-correlator]
[noc-discovery]
[noc-login]
[noc-mailsender]
[noc-mrt]
[noc-omap]
[noc-ping]
[noc-pmwriter]
[noc-sae]
[noc-syslogcoll]
[noc-trapcollec]
[noc-web]
[root@nochost telegraf]# which pgrep
/usr/bin/pgrep

Ivan
06.10.2016
07:33:26
pwd

E_zombie
06.10.2016
07:33:40
[root@nochost telegraf]# pwd
/var/log/telegraf

Ivan
06.10.2016
07:34:17
у меня таких ошибок нет

Google

Ivan
06.10.2016
07:34:21
но были, кстати
./noc ctl

E_zombie
06.10.2016
07:42:03
[root@nochost noc]# ./noc ctl
unix:///opt/noc/var/sock/supervisor.sock no such file
noc@dev/sar/nochost>
кхм. что скажут уважаемые доны?

Dmitry
06.10.2016
07:45:50
supervisord у тебя лежит

E_zombie
06.10.2016
07:48:09
аааа точна. у меня нок выключен

Ivan
06.10.2016
07:48:25
вот до чего члены резиновые доводят

Ilya
06.10.2016
07:48:54
)))

Ivan
06.10.2016
07:49:17

E_zombie
06.10.2016
07:51:50
http://pastebin.com/XfDhN4en

Ivan
06.10.2016
07:52:13
всё ок

E_zombie
06.10.2016
07:52:37
2016/10/06 10:52:22 ERROR in input [postgresql]: pq: Ident authentication failed for user "noc"
x509: cannot validate certificate for 10.64.255.210 because it doesn't contain any IP SANs]
2016/10/06 10:55:13 Input [httpjson] gathered metrics, (10s interval) in 1.510016319s
2016/10/06 10:55:13 ERROR in input [postgresql]: pq: Ident authentication failed for user "noc"
2016/10/06 10:55:13 Input [postgresql] gathered metrics, (10s interval) in 3.301714698s

Ivan
06.10.2016
08:06:28
А вот в графане монгу что лучше пониторить?
какие показатели?
в башне указано 300 одновременных подключений
Это open_connections?

Алексей
06.10.2016
08:13:29
Вань далеко ушли от расчета

Google

Алексей
06.10.2016
08:13:33
давай к нему вернемся

Ivan
06.10.2016
08:14:48
Ну да, я хотел узнать сколько там задач и прочее
в браузере могу смотреть, так пока нет
ну давай посчитаем
{"late_tasks": 620, "running_tasks": 51, "total_tasks": 1386, "pool": "default", "lag": 3094.676029}
это сейчас
чем число 50 может быть определено?

Алексей
06.10.2016
08:17:47

E_zombie
06.10.2016
08:18:08
Oct 05 13:30:58 nochost nginx[778]: nginx: [warn] "ssl_stapling" ignored, issuer certificate not found
Oct 05 13:30:58 nochost nginx[778]: nginx: the configuration file /etc/nginx/nginx.conf syntax is ok

Алексей
06.10.2016
08:18:09
добивай телеграф что бы собиралось

E_zombie
06.10.2016
08:18:10
?

Алексей
06.10.2016
08:18:16

Ivan
06.10.2016
08:18:29

Алексей
06.10.2016
08:18:42

Ivan
06.10.2016
08:18:55
ну вот телеграф не от рута, например

Алексей
06.10.2016
08:18:58
надо просто отработать по доке телеграфа
телеграв что бы собирал все надо что бы работал от рута
что бы он так работал надо сказать это systemd
я это сделал так вот
systemctl edit telegraf

Google

Алексей
06.10.2016
08:20:30
[Service]
User=root
OOMScoreAdjust=-999

Ivan
06.10.2016
08:21:05

Алексей
06.10.2016
08:21:25
да дебиан же
у дебиана старый systemd
значит надо руками сделать такой вот файл
/etc/systemd/system/telegraf.service.d/override.conf
и перезагрузить systemd
Вань, это реально как то к ноку отновится всё ?

Ivan
06.10.2016
08:23:15
прямое отношение, кмк
тем более используется для нока

Алексей
06.10.2016
08:23:31
дебиан у тя благодяря ноку ?

Ivan
06.10.2016
08:23:40
нет, а что?

Алексей
06.10.2016
08:23:50
это все штатные компоненты дебиана

Ivan
06.10.2016
08:23:51
Вот systemd у меня благодаря ноку

Алексей
06.10.2016
08:24:06
ну привыкай... он тупо везде

Ivan
06.10.2016
08:24:15
Ну я уже да, что теперь-то.
systemctl cat telegraf.service

Алексей
06.10.2016
08:25:18
вот что бы понятно было. надо что бы телеграф который пишут ребята из инфлюкса собирал метрику из ссылки.
типичная задача для сисадмина

Ivan
06.10.2016
08:25:36
Это я догадался

Google

Ivan
06.10.2016
08:28:46
а это нормально, что telegraf весь не стопается?
по service stop
один процесс пропадает и всё
прибью щас всех

Алексей
06.10.2016
08:30:24
этот вопрос уже надо в фак
телеграф обновил до 1.0 ?

Ivan
06.10.2016
08:31:08
Нет, а нужно? Telegraf - version 0.13.2

Алексей
06.10.2016
08:31:17
meh...
Вань запишешь в фак ?

Ivan
06.10.2016
08:31:42
Конечно
я вижу фак по башне
и миграцию на микросервисы
в какой?

Алексей
06.10.2016
08:32:13
https://github.com/influxdata/telegraf/pull/1252
https://github.com/influxdata/telegraf/pull/1279
фиг знает в какой нить что бы не отвечать на тот вопрос раз в 2 недели

E_zombie
06.10.2016
08:36:54
/etc/systemd/system/telegraf.service.d/override.conf

Ivan
06.10.2016
08:37:29
Алексей, надо наверное это и в инсталляцию запилить, чтобы вопросов больше не было
чтобы телеграф от рута работал
Или уже в мануал по графане добавить
т.к. не всем надо?