@metrics_ru

Страница 203 из 681
Andrey
05.07.2017
17:52:11
ну через cli? или вот прям в базу, оно же оттуда всё нынче парсится

Sergey
05.07.2017
18:46:15
ты там помню с неделю назад предлогал мониторинг, не напомнишь урлу?
ткни меня в сообщение, я уже точно не помню что конкретно писал, но оперативный мониторинг сейчас лучше всего через прометей делать, если тебе не надо мультицодовость со статистикой и полной отказоустойчивостью, то тут ньюансы

Bogdan (SirEdvin)
06.07.2017
07:03:49
Немного повторю свой вопрос, так как все еще боль. Подскажите, как кто мониторит процессы для Prometheus? А то не могу адекватно разобратся с этим https://github.com/ncabatoff/process-exporter, не находит один процесс.

Ну ладно, я просто не умею писать :(

Google
Andor
06.07.2017
08:16:46
Что значит "не находит"?

Denis
06.07.2017
10:44:16
А может кто нибудь рассказать про logstash vs fluentd ?

Mikhail
06.07.2017
10:47:34
https://www.slideshare.net/td-nttcom/fluentd-vs-logstash-for-openstack-log-management

мне в свое время помогло

Phil
06.07.2017
10:49:04
Заблокировано по решению органов государственной власти...

Bogdan (SirEdvin)
06.07.2017
10:58:28
Интересно, а кто-то может подсказать расшифровку метрик для collectd?

Я вот не могу понять, что означает часть ключей у плагина processes

Paul
06.07.2017
11:02:06
Google
Denis
06.07.2017
11:19:04
Semyon
06.07.2017
11:19:45
а fluentd еще живой, не убили его?
он еще и работает отлично

Maxim
06.07.2017
11:20:59
Matvey
06.07.2017
11:29:43
посоны, кто чем postfix измеряет?

Anton
06.07.2017
13:53:44
я ждал когда придут люди спрашивать про мониторинг экзима, дровекотэ, и постфикса

Matvey
06.07.2017
13:54:40
вполне естественные желания

Anton
06.07.2017
13:54:45
bash шкриптами + mtail

Sergey
06.07.2017
14:00:20
посоны, кто чем postfix измеряет?
а что там можно померить? O_o

Dmitry
06.07.2017
14:00:41
длину очередей

Matvey
06.07.2017
14:00:52
очереди, например

Dmitry
06.07.2017
14:00:58
не все же админы неуязвимого локалхоста с тремя письмами в сутки

Sergey
06.07.2017
14:01:12
а, спамерско-провайдерские вопросы ?))

Phil
06.07.2017
14:10:38
Это из за линкедина
Ну насколько я понимаю - нет, вполне самостоятельно

Alexandr
06.07.2017
14:11:10
упс

shit happens all the time

Dmitry
06.07.2017
14:16:23
а, спамерско-провайдерские вопросы ?))
когда шлешь 500к-1м писем в одной рассылке, и тебя вдруг банит майл\яндекс\рамблер

Sergey
06.07.2017
14:17:25
глупые ?)) они ничего не понимают - ты же счастье клиентам рассылаешь: очищенное, кристаллизованное, кусочками!

Dmitry
06.07.2017
14:17:44
не все рассылки - ненужное рекламное говно

Google
Paul
06.07.2017
14:17:57
Sergey
06.07.2017
14:19:39
не все рассылки - ненужное рекламное говно
к сожалению/счастью - согласен, не все

Сергей
06.07.2017
14:21:11
Ну насколько я понимаю - нет, вполне самостоятельно
Не, из за линкеда, было по крайней мере было, надо будет список грепнуть, как у компа буду.

Dmitry
06.07.2017
14:21:40
Кто монитори куб промом, подскажите: вот это <kubernetes_sd_config> и это https://github.com/kubernetes/kube-state-metrics

не один йух?

Andor
06.07.2017
14:30:39
не

там кое-какие метрики о жизни подов отдаются

Dmitry
06.07.2017
15:17:15
да, пойду собирать

Oleg ?
07.07.2017
09:10:21
Ребят, привет!

а можно в прометее для отдельной джобы в отдельный слак канал слать?

Dmitry
07.07.2017
09:11:13
да

Maxim
07.07.2017
09:11:21
а что мешает-то?

Oleg ?
07.07.2017
09:11:33
не могу сообразить

где указать это

тоесть сейчас общий канал

Maxim
07.07.2017
09:12:20
- match: severity: critical receiver: telephone-ops continue: true - receiver: 'amplifr-slack' match: cluster: amplifr continue: true - receiver: 'amplifr-email' match_re: cluster: amplifr severity: warning|critical continue: true

Oleg ?
07.07.2017
09:12:21
global: resolve_timeout: 1m route: receiver: 'slack' group_by: ['alertname','instance'] group_wait: 5s group_interval: 5s repeat_interval: 1h receivers: - name: 'slack' slack_configs: - send_resolved: true username: 'bot' channel: '#prometheus' api_url: '' icon_emoji: '{{ if eq .Status "firing" }}:ghost:{{ else }}:ok_hand:{{ end }}' title: '{{ if ne .Status "firing" }}[{{ .Status | toUpper }}]{{ end }}{{ .CommonAnnotations.title }}' text: '{{ if eq .Status "firing" }}{{ .CommonAnnotations.description }}{{ else }}{{ .CommonAnnotations.back }}{{ end }}'

а вот оно match

Получается нужно типа

receiver: slack-job match: job: myjob

Google
Oleg ?
07.07.2017
09:13:46
так ?

Admin
ERROR: S client not available

Maxim
07.07.2017
09:13:59
нужно несколько слак-ресиверов описать

и матчить в них по нужному признаку

Oleg ?
07.07.2017
09:21:14
а continue:true что делает?

@pipopolam

Maxim
07.07.2017
09:21:37
не останавливается на достигнутом

мне надо, чтобы ВСЕ алерты после расфасовки еще обязательно мне в почту валились

Oleg ?
07.07.2017
09:22:52
понял ,спаибо

Maxim
07.07.2017
09:22:54
# A default receiver receiver: martian-ops ... routes: - match_re: service: ^(.*)$ receiver: martian-ops continue: true ...

Roman
07.07.2017
09:42:58
Всем привет, кто-нибудь писал scripted dashboard для гарфаны? Из него можно напрямую сделать запрос в datasource?

Dorian
07.07.2017
11:16:05
Господа

Как правильно метрики в Прома писать?

Я поставил pushgateway

это правильный метод?

Paul
07.07.2017
11:17:45
теоретически правильный - использовать экспортер

пуш-гейт - это специфичный кейс, все это описано в доке

Andrey
07.07.2017
11:18:32
а вот коллеги помогите разобраться

Maxim
07.07.2017
11:18:44
теоретически правильный - использовать экспортер
самый правильный - прямая инструментация все-таки ;)

Andrey
07.07.2017
11:18:51
в какой-то момент времени графану стало глючить и она стала говорить unknown error при обновлении графиков

Google
Andrey
07.07.2017
11:18:56
потом чутка потупит и всё ок

проверил - сетевое соединение в порядке, сокетов на прометее хватает

Maxim
07.07.2017
11:19:19
может он перегружен?

Andrey
07.07.2017
11:19:25
да нет

Maxim
07.07.2017
11:19:29
не всегда успевает отвечать

Andrey
07.07.2017
11:19:30
там щас около 300 метрик

Maxim
07.07.2017
11:19:37
а, ну эт вообще ниочем

Andrey
07.07.2017
11:19:41
ну да

там 10 серверов пока подключены

из которых активны 5

Страница 203 из 681