
Danila
16.10.2017
08:44:37
босун, мойра, графана
Понравился вариант с grafana, но я думал что она больше для отображения нежели для алертинга

Vladimir
16.10.2017
08:44:49

Danila
16.10.2017
08:45:02
справляется с задачей? смс, почта + телегу хочу прикрутить

Vladimir
16.10.2017
08:46:03

Google

Vladimir
16.10.2017
08:46:09
для простых алертов графаны хватает

Danila
16.10.2017
08:46:40
хм, а если погрузиться в сенсу+сенсу сервер. Сенсу сервер закроет вопрос ?

Anton
16.10.2017
08:50:41

Danila
16.10.2017
08:51:26
так себе, но можно
получается вышеуказанные 3 игрока, являются своего рода лидерами для задачи альтертинга ?

Anton
16.10.2017
08:51:36
сенсу не про алертинг
сенсу это "евент процессор", и я бы признал, что сенсу до 3 версии провалилась
но если ставить задачу "пахипстерски" заменить нагиос, то ок

Danila
16.10.2017
08:52:26
сенсу не про алертинг
я постояно пытаюсь его привязать ко всему :( но не нравится его слишком большая модульность

Anton
16.10.2017
08:53:02
ну если тебя устраивает на всех серверах по раббиту, и говнищу в /opt/sensu то тебе никто же не мешает

Danila
16.10.2017
08:53:33
Я мониторить инфраструктуру

Anton
16.10.2017
08:53:36
потом одного перестанет хватать, ты захочешь скалировать, а скалировать это можно только занеся им денюжку, или ковыряя их сервисдискавери через редис

Danila
16.10.2017
08:54:26
остановился вот на чем - collectd + carbon+whisper + grafana
осталось понять как слать письма счастья

Google

Anton
16.10.2017
08:54:56
возьми мойру или бозун

Igor
16.10.2017
08:57:55
я бота для телеграма напейсал для алертов. В 2017 не хотелось с емайлами связываться.

M
16.10.2017
09:00:15
collectd + riemann + graphite + grafana
riemann гибкая штука очень

Danila
16.10.2017
09:01:58

Igor
16.10.2017
09:02:35

M
16.10.2017
09:03:33

Oleg ?
16.10.2017
09:39:21
Ребят, есть такой роут алертманагера
route:
receiver: 'slack'
group_by: ['alertname','instance','host']
group_wait: 5s
group_interval: 5s
repeat_interval: 2h
routes:
- match_re:
job: gate|gate-init
receiver: slack-gate
group_wait: 5s
group_interval: 5s
continue: true
- match_re:
job: nodes-gate|ping-gate
routes:
- match:
alertname: host_down
receiver: slack-gate
group_wait: 5s
group_interval: 5s
continue: true
пытаюсь затестить последний матч
job=nodes-gate, кладу node_exporter на хосте.
аларм прилетает в дефолтный ресивер
ALERT host_down
IF up {job=~"nodes|nodes-gate"} == 0
FOR 40s
LABELS { severity = "critical" }
ANNOTATIONS {
title = "ALARM",
titleback = "ALARM RESOLVED",
description = "Node-exporter not responding on {{ $labels.name }}. Probably HOST is DOWN",
back = "Host {{ $labels.name }} UP",
}
ЧЯДНТ

Andor
16.10.2017
09:51:07
Не вижу node-gate в алерте, но подозреваю, что оно есть
Лучше покажи горящий алерт

Oleg ?
16.10.2017
10:02:25
IF up {job=~"nodes|nodes-gate"} == 0
@Andorka

Andor
16.10.2017
10:03:12
Это у прометея такой интерфейс алертов стал?

Oleg ?
16.10.2017
10:03:44
alertmanager Version:
0.8.0

M
16.10.2017
10:17:10
ребята а кто-то знает иди делал отправку с alert manager в mattermost

Google

M
16.10.2017
10:17:36
это типа как slack только бесплатно

Bogdan (SirEdvin)
16.10.2017
10:26:54

Oleg ?
16.10.2017
10:27:56
@Andorka нет мыслей? (

Andor
16.10.2017
10:31:10
сорян, занят

A
16.10.2017
11:19:45
ребят, есть у кого пример collectd конфига для postgresql ?

Алексей
16.10.2017
11:41:43
о! https://github.com/grafana/grafana/pull/9166
@alexanderzobnin у этого есть шансы на мерж ?

Andrey
16.10.2017
11:46:23
а почему нет, там же точно гитхаб есть и даже как то сильно хвалились что в каком то релизи добавили управление по группам/компаниям вроде

Алексей
16.10.2017
11:48:40
потому что обычно torkelo на gh реагирует молнееносно

ptchol
16.10.2017
11:53:03
ребят, есть у кого пример collectd конфига для postgresql ?
<Plugin postgresql>
<Database "puppetdb">
Host "127.0.0.1"
Port "5432"
User ""
Password ""
Query "custom_deadlocks"
Query "backends"
Query "transactions"
Query "queries"
Query "queries_by_table"
Query "query_plans"
Query "table_states"
Query "query_plans_by_table"
Query "table_states_by_table"
Query "disk_io"
Query "disk_io_by_table"
Query "disk_usage"
</Database>
</Plugin>

Alexander
16.10.2017
11:53:26

Алексей
16.10.2017
11:56:54
видимо надо чуваку намекнуть что тестов нету...

Алексей
16.10.2017
11:57:12
ибо сейчас его заворачивают судя оп всему из за них

Danila
16.10.2017
13:38:22
у Collectd - 2 версии? 5.6 5.7 текущих одновременно судя по гиту

Andrey
16.10.2017
13:49:30
как будто это что то плохое

Danila
16.10.2017
14:11:26
collectd.conf должен лежать в /etc/ ?
не в /etc/collectd ?

Sergey
16.10.2017
14:11:53
/etc
colelctd.d - там всякие include

Vasiliy
16.10.2017
14:13:40
/etc

Google

M
16.10.2017
14:13:41

Vasiliy
16.10.2017
14:13:48
/link@yetanotherstatsbot

Admin
ERROR: S client not available

Yet Another Stats
16.10.2017
14:13:49
https://yasb.exileed.com/telegram/chat/1001068522817

Danila
16.10.2017
14:15:48
thx

Vladimir
17.10.2017
04:24:52
Яндекс делает митап по КХ в Берлине: https://events.yandex.com/events/meetings/05-10-2017/

Vladimir
17.10.2017
05:20:26

Alexander
17.10.2017
07:43:19
я опять к вам со своим снмп трапами.
принимать трап на сервер, потом его парсить и складывать в тот же пром/елку, но чем алертить в случае жопы?
графана вроде только по графику умеет?

Единорожа
17.10.2017
07:44:58
Алертаманагер прома?

Alexander
17.10.2017
07:45:14
он еще жив? я думал они его забросили

Единорожа
17.10.2017
07:46:31
Updated 4 days ago
Latest commit 4a8e710 6 days ago

Alexander
17.10.2017
07:47:33
надо будет посмотреть. спасибо.

Единорожа
17.10.2017
07:49:30
Вот только у меня с ним проблема есть, что он resolved шлет несколько раз если repeat_interval 5-10 мин

M
17.10.2017
09:39:10
Ребята скажите ктото по промитеусу, почему он не использует etc/hosts файл для того чтобы разрешить имя когда указываешь таргет

Nklya
17.10.2017
09:41:11
Возможно потому что он написан на гошечке и использует свой резолвер

Subbotin
17.10.2017
09:47:40
гошечка по-умолчанию использует системный резолв. но если её собрать со специальным флажком, то не будет

GithubReleases
17.10.2017
09:48:43
https://github.com/grafana/grafana/releases/v4.6.0-beta2 was tagged

Andor
17.10.2017
09:52:19

Google

M
17.10.2017
09:52:50

Andor
17.10.2017
09:53:06
ты небось в докере запускаешь?

M
17.10.2017
09:53:22

Vsevolod
17.10.2017
09:53:33
тюююю

M
17.10.2017
09:53:45
ну проясните
чего ping работает а Прометей нет

Andor
17.10.2017
09:54:13
у меня и то и то работает
но у меня 1) не докер 2) самосборный

M
17.10.2017
09:54:44
ладно

Maxim
17.10.2017
09:54:55

M
17.10.2017
09:55:17
да в контейнере пингует