Danila
16.10.2017
08:44:37
босун, мойра, графана
Понравился вариант с grafana, но я думал что она больше для отображения нежели для алертинга
Vladimir
16.10.2017
08:44:49
Danila
16.10.2017
08:45:02
справляется с задачей? смс, почта + телегу хочу прикрутить
Vladimir
16.10.2017
08:46:03
Google
Vladimir
16.10.2017
08:46:09
для простых алертов графаны хватает
Danila
16.10.2017
08:46:40
хм, а если погрузиться в сенсу+сенсу сервер. Сенсу сервер закроет вопрос ?
Anton
16.10.2017
08:50:41
Danila
16.10.2017
08:51:26
так себе, но можно
получается вышеуказанные 3 игрока, являются своего рода лидерами для задачи альтертинга ?
Anton
16.10.2017
08:51:36
сенсу не про алертинг
сенсу это "евент процессор", и я бы признал, что сенсу до 3 версии провалилась
но если ставить задачу "пахипстерски" заменить нагиос, то ок
Danila
16.10.2017
08:52:26
сенсу не про алертинг
я постояно пытаюсь его привязать ко всему :( но не нравится его слишком большая модульность
Anton
16.10.2017
08:53:02
ну если тебя устраивает на всех серверах по раббиту, и говнищу в /opt/sensu то тебе никто же не мешает
Danila
16.10.2017
08:53:33
Я мониторить инфраструктуру
Anton
16.10.2017
08:53:36
потом одного перестанет хватать, ты захочешь скалировать, а скалировать это можно только занеся им денюжку, или ковыряя их сервисдискавери через редис
Danila
16.10.2017
08:54:26
остановился вот на чем - collectd + carbon+whisper + grafana
осталось понять как слать письма счастья
Google
Anton
16.10.2017
08:54:56
возьми мойру или бозун
Igor
16.10.2017
08:57:55
я бота для телеграма напейсал для алертов. В 2017 не хотелось с емайлами связываться.
M
16.10.2017
09:00:15
collectd + riemann + graphite + grafana
riemann гибкая штука очень
Danila
16.10.2017
09:01:58
Igor
16.10.2017
09:02:35
M
16.10.2017
09:03:33
Oleg ?
16.10.2017
09:39:21
Ребят, есть такой роут алертманагера
route:
receiver: 'slack'
group_by: ['alertname','instance','host']
group_wait: 5s
group_interval: 5s
repeat_interval: 2h
routes:
- match_re:
job: gate|gate-init
receiver: slack-gate
group_wait: 5s
group_interval: 5s
continue: true
- match_re:
job: nodes-gate|ping-gate
routes:
- match:
alertname: host_down
receiver: slack-gate
group_wait: 5s
group_interval: 5s
continue: true
пытаюсь затестить последний матч
job=nodes-gate, кладу node_exporter на хосте.
аларм прилетает в дефолтный ресивер
ALERT host_down
IF up {job=~"nodes|nodes-gate"} == 0
FOR 40s
LABELS { severity = "critical" }
ANNOTATIONS {
title = "ALARM",
titleback = "ALARM RESOLVED",
description = "Node-exporter not responding on {{ $labels.name }}. Probably HOST is DOWN",
back = "Host {{ $labels.name }} UP",
}
ЧЯДНТ
Andor
16.10.2017
09:51:07
Не вижу node-gate в алерте, но подозреваю, что оно есть
Лучше покажи горящий алерт
Oleg ?
16.10.2017
10:02:25
IF up {job=~"nodes|nodes-gate"} == 0
@Andorka
Andor
16.10.2017
10:03:12
Это у прометея такой интерфейс алертов стал?
Oleg ?
16.10.2017
10:03:44
alertmanager Version:
0.8.0
M
16.10.2017
10:17:10
ребята а кто-то знает иди делал отправку с alert manager в mattermost
Google
M
16.10.2017
10:17:36
это типа как slack только бесплатно
Bogdan (SirEdvin)
16.10.2017
10:26:54
Oleg ?
16.10.2017
10:27:56
@Andorka нет мыслей? (
Andor
16.10.2017
10:31:10
сорян, занят
A
16.10.2017
11:19:45
ребят, есть у кого пример collectd конфига для postgresql ?
Алексей
16.10.2017
11:41:43
о! https://github.com/grafana/grafana/pull/9166
@alexanderzobnin у этого есть шансы на мерж ?
Andrey
16.10.2017
11:46:23
а почему нет, там же точно гитхаб есть и даже как то сильно хвалились что в каком то релизи добавили управление по группам/компаниям вроде
Алексей
16.10.2017
11:48:40
потому что обычно torkelo на gh реагирует молнееносно
ptchol
16.10.2017
11:53:03
ребят, есть у кого пример collectd конфига для postgresql ?
<Plugin postgresql>
<Database "puppetdb">
Host "127.0.0.1"
Port "5432"
User ""
Password ""
Query "custom_deadlocks"
Query "backends"
Query "transactions"
Query "queries"
Query "queries_by_table"
Query "query_plans"
Query "table_states"
Query "query_plans_by_table"
Query "table_states_by_table"
Query "disk_io"
Query "disk_io_by_table"
Query "disk_usage"
</Database>
</Plugin>
Alexander
16.10.2017
11:53:26
Алексей
16.10.2017
11:56:54
видимо надо чуваку намекнуть что тестов нету...
ибо сейчас его заворачивают судя оп всему из за них
Danila
16.10.2017
13:38:22
у Collectd - 2 версии? 5.6 5.7 текущих одновременно судя по гиту
Andrey
16.10.2017
13:49:30
как будто это что то плохое
Danila
16.10.2017
14:11:26
collectd.conf должен лежать в /etc/ ?
не в /etc/collectd ?
Sergey
16.10.2017
14:11:53
/etc
colelctd.d - там всякие include
Vasiliy
16.10.2017
14:13:40
/etc
Google
M
16.10.2017
14:13:41
Vasiliy
16.10.2017
14:13:48
/link@yetanotherstatsbot
Admin
Yet Another Stats
16.10.2017
14:13:49
https://yasb.exileed.com/telegram/chat/1001068522817
Danila
16.10.2017
14:15:48
thx
Vladimir
17.10.2017
04:24:52
Яндекс делает митап по КХ в Берлине: https://events.yandex.com/events/meetings/05-10-2017/
Vladimir
17.10.2017
05:20:26
Alexander
17.10.2017
07:43:19
я опять к вам со своим снмп трапами.
принимать трап на сервер, потом его парсить и складывать в тот же пром/елку, но чем алертить в случае жопы?
графана вроде только по графику умеет?
Единорожа
17.10.2017
07:44:58
Алертаманагер прома?
Alexander
17.10.2017
07:45:14
он еще жив? я думал они его забросили
Единорожа
17.10.2017
07:46:31
Updated 4 days ago
Latest commit 4a8e710 6 days ago
Alexander
17.10.2017
07:47:33
надо будет посмотреть. спасибо.
Единорожа
17.10.2017
07:49:30
Вот только у меня с ним проблема есть, что он resolved шлет несколько раз если repeat_interval 5-10 мин
M
17.10.2017
09:39:10
Ребята скажите ктото по промитеусу, почему он не использует etc/hosts файл для того чтобы разрешить имя когда указываешь таргет
Nklya
17.10.2017
09:41:11
Возможно потому что он написан на гошечке и использует свой резолвер
Subbotin
17.10.2017
09:47:40
гошечка по-умолчанию использует системный резолв. но если её собрать со специальным флажком, то не будет
GithubReleases
17.10.2017
09:48:43
https://github.com/grafana/grafana/releases/v4.6.0-beta2 was tagged
Andor
17.10.2017
09:52:19
Google
M
17.10.2017
09:52:50
Andor
17.10.2017
09:53:06
ты небось в докере запускаешь?
M
17.10.2017
09:53:22
Vsevolod
17.10.2017
09:53:33
тюююю
M
17.10.2017
09:53:45
ну проясните
чего ping работает а Прометей нет
Andor
17.10.2017
09:54:13
у меня и то и то работает
но у меня 1) не докер 2) самосборный
M
17.10.2017
09:54:44
ладно
Maxim
17.10.2017
09:54:55
M
17.10.2017
09:55:17
да в контейнере пингует