
Karey
03.10.2017
19:24:51
У меня не валятся на это события

Алексей
03.10.2017
19:25:38
нет таки указать его надо
ALERT service_down
IF up{job!~"prod|stage"} == 0
LABELS {environment="Production", resource="{{$labels.instance}}", service="Prometheus", severity="Critical", value="{{$value}}"}
ANNOTATIONS {description="Prometheus client down", summary="Prometheus client down"}
в оригинале он немного проще

Google

Karey
03.10.2017
19:29:19
Черт, спасибо большое)
Я так и знал что там есть какая-то метрика на этот счет, но не мог найти

Алексей
03.10.2017
19:29:57
по слову ALERT рулесы неплохо гуглятся на гитхабе

Karey
03.10.2017
19:30:13
Спасибо!

ptchol
04.10.2017
10:03:51
Пчолы не гавно

Алексей
04.10.2017
10:04:26
зацепило то как

ptchol
04.10.2017
10:05:29
А все современные мониторинги сосут у заббикса по одному критерию, это статистика и представление тригерных эвентов
В остальном он какуля

Andrey
04.10.2017
10:06:56
кстати, тут оно как то мельком на днях проскочило, а я правильно понял, что прометеус просто физически нынче не приспособлен хранить что то долго? а как решается, ну да с одной стороны старые метрики ни о чём, но иногда ж интересна динамика и статистика :)

Maxim
04.10.2017
10:07:20
ремот_сторажи для этого придуманы

Gleb
04.10.2017
10:07:39

Maxim
04.10.2017
10:08:31
ну у заббикса-то сзади вполне понятный сикуель

Andrey
04.10.2017
10:08:49
не то что неназываемый и тут обделается, сомнения нет, ну вот инфлюкс тот же вроде там даже как то "уплотнять" может старое, а можно тупо забить и оно вроде как просто собирается

Google

Maxim
04.10.2017
10:08:52
хотя у нас как-то было такое, что база заббикса подрастала на 30гб в сутки

Sergey
04.10.2017
10:23:22
и у них неправильный мед

Paul
04.10.2017
10:51:30

Bogdan (SirEdvin)
04.10.2017
11:06:02
Интересно, а у prometheus есть какой-то remote_storage, который умеет в read и write, и не influx?)

Paul
04.10.2017
11:14:34

Nklya
04.10.2017
13:06:41
Статьи про написание плагинов для телеграфа
https://www.influxdata.com/blog/how-to-write-telegraf-plugin-beginners/
https://www.influxdata.com/blog/building-better-telegraf-plugin/

Старый
04.10.2017
13:16:10
https://github.com/o0ste0o/MyZabbixTemplates/tree/master/Zabbix_IIS8_monitoring
кто такое пробовал?

Nklya
04.10.2017
13:17:03
Прекрасное сочетание - забикс и иис

Paul
04.10.2017
13:18:46
законченное великолепие
шедевр
не хватает оракла

Danila
04.10.2017
13:21:58
Друзья, стартую пока что standalone sensu сервер

Wom
04.10.2017
13:22:10
mssql

Danila
04.10.2017
13:22:19
в uchiwa упорно не отображаются клиенты

Maxim
04.10.2017
13:23:53
не?

Danila
04.10.2017
13:24:59
Коллеги ?

Google

User ?
04.10.2017
13:41:32
@troschinsky А клиент до rmq достучался?
https://sensuapp.org/docs/0.24/installation/install-rabbitmq-on-ubuntu-debian.html#create-a-dedicated-rabbitmq-vhost-for-sensu
Этот момент не забыт?
ну и у редиса был нюанс с ipv4
https://github.com/sensu/uchiwa/issues/483

Bogdan (SirEdvin)
04.10.2017
13:48:45

Danila
04.10.2017
13:50:55
в конфиге uchiwa что нужно указывать ?


Oleg
04.10.2017
13:56:28
Всем привет.
Нужна помочь с prometheus.
Дано: есть метрика типа SummariesVector "rpc_server_full_duration_seconds", в ее labels есть "call_name" и "http_status_code"
Есть alert следующего вида
IF delta(rpc_server_full_duration_seconds_count{call_name=~"5[0-9]{2}"}[5m]) > 0
Проблема: допустим, как-то call_name выкинул 500-ку
С точки зрения prometheus такой метрики не было, она появилось вот только что.
Условие alert'а не срабатывает, потому что delta между undefined и 0 равна нулю
Алерт высвечивается только в ситуации, когда ошибка повторяется второй раз
Каким образом мне изменить условие alert'а так, чтобы
1) ловить изменения значения метрики (текущее условие это уже умеет)
2) ловить ситуации вида undefined => 0 (текущее условие такое не ловит)
?

User ?
04.10.2017
13:57:16

Danila
04.10.2017
13:57:46

Nklya
04.10.2017
13:58:36
Есть же готовая роль для ансибла с документацией для установки и конфигурирования сенсу, зачем страдать руками?

User ?
04.10.2017
13:59:24

Roman
04.10.2017
14:00:41

Oleg
04.10.2017
14:01:11

Danila
04.10.2017
14:03:36

Oleg
04.10.2017
14:03:49
Вот так выглядит запрос changes(rpc_server_full_duration_seconds_count{http_status_code=~"5[0-9]{2}"}[48h])
Нужно как раз отличить undefined от 0

Roman
04.10.2017
14:05:22

Oleg
04.10.2017
14:05:43
Вот жопа же!

Danila
04.10.2017
14:32:06
Как я понял, я всегда устанавливаю просто sensu. на клиенте или на сенсу-сервере - разницы нет. а задействуется у сенсу то, что имеет конфиг , верно ?

User ?
04.10.2017
14:39:20
именно

Google

User ?
04.10.2017
14:39:43
ну и запускаешь ты клиента или сервер, конфиги в одном месте лежат

Старый
04.10.2017
14:42:35

Paul
04.10.2017
19:51:06
он тоже есть
нет-нет, это все должно быть на одной машине. Я один раз запустил заббикс на оракле и уложил довольно–таки мощный сервер

Artem
05.10.2017
09:45:41

Старый
05.10.2017
09:46:01

Maxim
05.10.2017
10:16:25
https://github.com/rapidloop/sop

Admin
ERROR: S client not available

Maxim
05.10.2017
10:16:31
все уже видали?
Long-term archiving: downsample and store metrics for a configurable retention period. Stored data can be queried anytime with Grafana and APIs.

Алексей
05.10.2017
10:17:21
mature project!

Maxim
05.10.2017
10:17:40
целых семь коммитов, чо тебе не так
?

Алексей
05.10.2017
10:18:13
у меня некоторые initial длиннее...

Andrey
05.10.2017
10:24:00
Всем привет! Кто как мониторит mysql в docker-контейнерах? есть каки-нить бест-практикс почитать? :)

Алексей
05.10.2017
10:24:36
да. бестпрактис докера не пихать туда базы

Andrey
05.10.2017
10:26:57
что имеем, то имеем. скажем в моем случае данная реализация оптимальна

Wom
05.10.2017
10:37:50
база или движок базы у тебя там?

Andrey
05.10.2017
11:00:06
ридонли база. но это не суть. мониторить то нужно подключаясь к mysql внутри контейнера, вот и интересно, вдруг кто уже таким занимается и поделится опытом

Andor
05.10.2017
11:10:12

Google

Andrey
05.10.2017
11:10:56
можно поднять еще один контейнер - подключаться из него :)

Andrew
05.10.2017
13:20:45
Добрый вечер
я хотел бы попросить помощи
делаю по примерам kapacitor алерты но они не работают почему-то
уже делаю через telegraf
видно что значение попадает чтоб сработал алерт но он не приходит
что делать?
я понимаю что экстрасенсов нет
я могу предоставить TICKscript если есть у кого желание помоч

Alexander
05.10.2017
16:23:50
Don't ask to ask. Just ask.

M
05.10.2017
16:27:18

Tkorochka
05.10.2017
16:39:07
О! Уважаемые люди в чатике. Скажите, а как из grafana вытащить сырыми данными линии с графика? Я могу через firebug взять строчку с запросом, но для этого нужен браузер, а я хочу все графики так опросить.

Andrey
05.10.2017
16:46:25
эмм... а зачем это делать с графаной?

Tkorochka
05.10.2017
16:48:54
Есть ES. В нем данные за неделю. Самый простой способ агрегировать только то что нужно и в нужном виде - вытащить из графаны и положить в другой игдекс ES. В grafana все графики есть.

Алексей
05.10.2017
17:09:35
самый простой. окей.
на графике посмотреть f12 в браузере посмотреть дата запрос
подделать запрос curl -ом
тот случай когда чуство юмора сильнее чем желание помочь

Nik
05.10.2017
17:20:57
Вот вы шутите, а меня тоже интересовало как из графины годый график подучить

Andrey
05.10.2017
17:22:16
ну графики то там экспортятся довольно на ура, а вот зачем там данные тырить, когда это в общем тупо система отрисовки, это вопрос

Nik
05.10.2017
17:34:47

Алексей
05.10.2017
17:35:57
графики экспортируются на раз
читать об этом не надо.

Andrey
05.10.2017
17:36:09
в смысле? http://docs.grafana.org/reference/sharing/

Алексей
05.10.2017
17:36:12
надо просто тыкнуть share