@metrics_ru

Страница 301 из 681
Danila
16.10.2017
08:44:37
босун, мойра, графана
Понравился вариант с grafana, но я думал что она больше для отображения нежели для алертинга

Danila
16.10.2017
08:45:02
справляется с задачей? смс, почта + телегу хочу прикрутить

Vladimir
16.10.2017
08:46:03
справляется с задачей? смс, почта + телегу хочу прикрутить
там сложно сделать сложный алертинг (местами скорее невозможно)

Google
Vladimir
16.10.2017
08:46:09
для простых алертов графаны хватает

Danila
16.10.2017
08:46:40
хм, а если погрузиться в сенсу+сенсу сервер. Сенсу сервер закроет вопрос ?

Danila
16.10.2017
08:51:26
так себе, но можно
получается вышеуказанные 3 игрока, являются своего рода лидерами для задачи альтертинга ?

Anton
16.10.2017
08:51:36
сенсу не про алертинг

сенсу это "евент процессор", и я бы признал, что сенсу до 3 версии провалилась

но если ставить задачу "пахипстерски" заменить нагиос, то ок

Danila
16.10.2017
08:52:26
сенсу не про алертинг
я постояно пытаюсь его привязать ко всему :( но не нравится его слишком большая модульность

Anton
16.10.2017
08:53:02
ну если тебя устраивает на всех серверах по раббиту, и говнищу в /opt/sensu то тебе никто же не мешает

Danila
16.10.2017
08:53:33
Я мониторить инфраструктуру

Anton
16.10.2017
08:53:36
потом одного перестанет хватать, ты захочешь скалировать, а скалировать это можно только занеся им денюжку, или ковыряя их сервисдискавери через редис

Danila
16.10.2017
08:54:26
остановился вот на чем - collectd + carbon+whisper + grafana

осталось понять как слать письма счастья

Google
Anton
16.10.2017
08:54:56
возьми мойру или бозун

Igor
16.10.2017
08:57:55
я бота для телеграма напейсал для алертов. В 2017 не хотелось с емайлами связываться.

M
16.10.2017
09:00:15
collectd + riemann + graphite + grafana

riemann гибкая штука очень

Igor
16.10.2017
09:02:35
нету решения для телеги до сих пор ?
э... я не знаю. Забыл посмотреть.

M
16.10.2017
09:03:33
нету решения для телеги до сих пор ?
я с collectd отправляю в телеграм уведомление

Oleg ?
16.10.2017
09:39:21
Ребят, есть такой роут алертманагера route: receiver: 'slack' group_by: ['alertname','instance','host'] group_wait: 5s group_interval: 5s repeat_interval: 2h routes: - match_re: job: gate|gate-init receiver: slack-gate group_wait: 5s group_interval: 5s continue: true - match_re: job: nodes-gate|ping-gate routes: - match: alertname: host_down receiver: slack-gate group_wait: 5s group_interval: 5s continue: true

пытаюсь затестить последний матч job=nodes-gate, кладу node_exporter на хосте. аларм прилетает в дефолтный ресивер

ALERT host_down IF up {job=~"nodes|nodes-gate"} == 0 FOR 40s LABELS { severity = "critical" } ANNOTATIONS { title = "ALARM", titleback = "ALARM RESOLVED", description = "Node-exporter not responding on {{ $labels.name }}. Probably HOST is DOWN", back = "Host {{ $labels.name }} UP", }

ЧЯДНТ

Andor
16.10.2017
09:51:07
Не вижу node-gate в алерте, но подозреваю, что оно есть

Лучше покажи горящий алерт

Oleg ?
16.10.2017
10:02:25


IF up {job=~"nodes|nodes-gate"} == 0

@Andorka

Andor
16.10.2017
10:03:12
Это у прометея такой интерфейс алертов стал?

Oleg ?
16.10.2017
10:03:44
alertmanager Version: 0.8.0

M
16.10.2017
10:17:10
ребята а кто-то знает иди делал отправку с alert manager в mattermost

Google
M
16.10.2017
10:17:36
это типа как slack только бесплатно

Bogdan (SirEdvin)
16.10.2017
10:26:54
ребята а кто-то знает иди делал отправку с alert manager в mattermost
Вроде можно просто как в слак: https://docs.mattermost.com/developer/webhooks-incoming.html

Oleg ?
16.10.2017
10:27:56
@Andorka нет мыслей? (

Andor
16.10.2017
10:31:10
сорян, занят

A
16.10.2017
11:19:45
ребят, есть у кого пример collectd конфига для postgresql ?

Алексей
16.10.2017
11:41:43
о! https://github.com/grafana/grafana/pull/9166

@alexanderzobnin у этого есть шансы на мерж ?

Andrey
16.10.2017
11:46:23
а почему нет, там же точно гитхаб есть и даже как то сильно хвалились что в каком то релизи добавили управление по группам/компаниям вроде

Алексей
16.10.2017
11:48:40
потому что обычно torkelo на gh реагирует молнееносно

ptchol
16.10.2017
11:53:03
ребят, есть у кого пример collectd конфига для postgresql ?
<Plugin postgresql> <Database "puppetdb"> Host "127.0.0.1" Port "5432" User "" Password "" Query "custom_deadlocks" Query "backends" Query "transactions" Query "queries" Query "queries_by_table" Query "query_plans" Query "table_states" Query "query_plans_by_table" Query "table_states_by_table" Query "disk_io" Query "disk_io_by_table" Query "disk_usage" </Database> </Plugin>

Alexander
16.10.2017
11:53:26
@alexanderzobnin у этого есть шансы на мерж ?
Сначала офигел - 51 файл, потом посмотрел - это зависимости. Я думаю есть, вопрос времени...

Алексей
16.10.2017
11:56:54
видимо надо чуваку намекнуть что тестов нету...

ибо сейчас его заворачивают судя оп всему из за них

Danila
16.10.2017
13:38:22
у Collectd - 2 версии? 5.6 5.7 текущих одновременно судя по гиту

Andrey
16.10.2017
13:49:30
как будто это что то плохое

Danila
16.10.2017
14:11:26
collectd.conf должен лежать в /etc/ ?

не в /etc/collectd ?

Sergey
16.10.2017
14:11:53
/etc

colelctd.d - там всякие include

Vasiliy
16.10.2017
14:13:40
/etc

Google
M
16.10.2017
14:13:41
collectd.conf должен лежать в /etc/ ?
он должен лежать там где в конфиге include укажите

Vasiliy
16.10.2017
14:13:48
/link@yetanotherstatsbot

Admin


Yet Another Stats
16.10.2017
14:13:49
https://yasb.exileed.com/telegram/chat/1001068522817

Danila
16.10.2017
14:15:48
thx

Vladimir
17.10.2017
04:24:52
Яндекс делает митап по КХ в Берлине: https://events.yandex.com/events/meetings/05-10-2017/

Alexander
17.10.2017
07:43:19
я опять к вам со своим снмп трапами. принимать трап на сервер, потом его парсить и складывать в тот же пром/елку, но чем алертить в случае жопы?

графана вроде только по графику умеет?

Единорожа
17.10.2017
07:44:58
Алертаманагер прома?

Alexander
17.10.2017
07:45:14
он еще жив? я думал они его забросили

Единорожа
17.10.2017
07:46:31
Updated 4 days ago

Latest commit 4a8e710 6 days ago

Alexander
17.10.2017
07:47:33
надо будет посмотреть. спасибо.

Единорожа
17.10.2017
07:49:30
Вот только у меня с ним проблема есть, что он resolved шлет несколько раз если repeat_interval 5-10 мин

M
17.10.2017
09:39:10
Ребята скажите ктото по промитеусу, почему он не использует etc/hosts файл для того чтобы разрешить имя когда указываешь таргет

Nklya
17.10.2017
09:41:11
Возможно потому что он написан на гошечке и использует свой резолвер

Subbotin
17.10.2017
09:47:40
гошечка по-умолчанию использует системный резолв. но если её собрать со специальным флажком, то не будет

GithubReleases
17.10.2017
09:48:43
https://github.com/grafana/grafana/releases/v4.6.0-beta2 was tagged

Google
M
17.10.2017
09:52:50
потому что использует
но у меня игнорирует, и я не могу понять почему

Andor
17.10.2017
09:53:06
ты небось в докере запускаешь?

Vsevolod
17.10.2017
09:53:33
тюююю

M
17.10.2017
09:53:45
ну проясните

чего ping работает а Прометей нет

Andor
17.10.2017
09:54:13
у меня и то и то работает

но у меня 1) не докер 2) самосборный

M
17.10.2017
09:54:44
ладно

Maxim
17.10.2017
09:54:55
чего ping работает а Прометей нет
зайди в контейнер и попробуй пингануть

M
17.10.2017
09:55:17
да в контейнере пингует

Страница 301 из 681