
Terminator
04.10.2018
14:25:49
@krakazyabra будет жить. Поприветствуем!

Алексей
04.10.2018
14:31:01

Serg
04.10.2018
14:31:11
Дык я на будущее ))

Алексей
04.10.2018
14:31:20
а набудущее неудаляй.

Google

Serg
04.10.2018
14:31:26
У меня впереди еще много экспериментов ?

Алексей
04.10.2018
14:31:29
само уйдет. подожди retention

Andrey
04.10.2018
14:33:24
А удаление через api не очень хорошая идея что ли?

Serg
04.10.2018
14:33:57

Алексей
04.10.2018
14:34:26
эм. 365 ?
гдето у меня был крутой смайлик про фейлпалм. не могу найти. там где сразу полчата фэеспламнуло
может у @Nklya есть

Andrey
04.10.2018
14:35:53

Алексей
04.10.2018
14:36:49
Это чем обусловлено?
тем что базы tsdb append only по архитектуре. и удаление в них - по факту костыль

evix
04.10.2018
14:37:07
лучше ждать ретеншн да

Алексей
04.10.2018
14:37:31
тем более что ртеншены в контексте прома довольно коротки.

Nklya
04.10.2018
14:41:54
Я думаю цифра в 365 дней родилась из Z

Wom
04.10.2018
14:45:05
может это просто число дней в году?

Google

Алексей
04.10.2018
14:45:25
год слишком плавающая константа

Andrey
04.10.2018
14:56:39
псс
парни
а заббикс научился прометеус читать

Alexander
04.10.2018
14:57:44
тут, кстати, в description-е чата опечатка
> Атуальный список TSDB

Алексей
04.10.2018
15:01:31

Viktor
04.10.2018
16:41:21
Тут про алертманагер рассказывают?
Можете кидануться той частью доки где рассказывают как правильно дергать переменные в алертах?

Алексей
04.10.2018
16:42:56
{{$labels.instance}}
{{$value}}
это всё

Viktor
04.10.2018
16:51:11
я могу сделать value: time() - {{ $value }}? или же {{ $value }} / 1024?
на резнноый вопрос "чеб не проверить" отвечу что возможности пока нет, а знать нужно бы

Алексей
04.10.2018
17:17:53
там юзаются гошные шаблоны
можно так вот например
annotations:
description: '{{$labels.host}}: {{$labels.path}} disk usage is above 90% (current value is: {{ $value | printf "%.2f"}})'
summary: '{{$labels.host}}: Low disk space'

terry
04.10.2018
17:24:08

Алексей
04.10.2018
17:26:31
@EKbfh ты не пробовал туда ещё чего добавлять ?

Anton
04.10.2018
17:26:54
а есть способ посмотреть все labels?

Алексей
04.10.2018
17:27:21

Andrey
04.10.2018
17:28:54
@freeseacher ты как то пытался найти людей, которые юзают m3? они таки откликнулись? интересно было бы какой-то отзыв получить

Google

Алексей
04.10.2018
17:29:16
да. такие люди есть в gitter проекта
там ~40 человек.
живых русскоговорящих пока не найдено.

Andrey
04.10.2018
17:30:36
просто пытаюсь понять объем подпиливаний, в случае использования его как long-term
просто выбор адаптеров с remote read не так широк, как я погляжу. как поступают тогда в случае наличия только write? делят дашборды и репорты на актуальные и исторические?

Алексей
04.10.2018
17:34:28
никак не поступают. это очевидно тупиковая ветка развития

Ivan
04.10.2018
17:36:08

Алексей
04.10.2018
17:36:46
почитав доку на m3db выглядит будто размах у них широкий. сколько придется пилить до mvp на своей инфораструктуре я хз.
в августе ребята признали что стоит бы сделать тесты на функциональность связанную с промом. тут читать https://github.com/m3db/m3/issues/866

Andrey
04.10.2018
17:38:01
в promhouse смущает конечно "do not use it in production")

Алексей
04.10.2018
17:38:05
сейчас выглядит будто основную работу тащит https://github.com/richardartoul
отвечает быстро и по делу.

Andrey
04.10.2018
17:39:42
ну с другой стороны, ведь и remote write/read не самая стабильная вещь

Алексей
04.10.2018
17:40:15
даже в проме такое написано.
https://prometheus.io/docs/prometheus/latest/stability/
Things considered unstable for 2.x:
Any feature listed as experimental or subject to change, including:
The holt_winters PromQL function
Remote read, remote write and the remote read endpoint
v2 HTTP and GRPC APIs

Viktor
04.10.2018
17:46:30

RK
04.10.2018
19:17:22
Подскажите, как включить в графане при алертах (отправка в телегу), отображение метрик в сообщении? У меня почему-то на одном типе алертов приходит метрика, на других просто урл на график. При этом в slack всегда метрика прилетает.
А второй вопрос. В slack прилетает метрика со значением, после запятой дохрена цифр. Мне нужно или срезать до 2 или округлить. Как это сделать? При этом в телегу норм, срезает до 3 знаков после запятой ?

Deep Sea
04.10.2018
19:35:43
в датасурсе надо это делать по-идее

Артём
05.10.2018
09:28:00
Подскажите пожалуйтса.
Ночью снимается бэкап и в это время реплика отстаёт от мастера —> срабатывает алерт
Как убрать это ложное срабатывание на этот период?
Через exp в prometheus'e? Так и не понял как это делать используя имеющиеся у него функции.
Или эту логику можно переложить на alertmanager ?

Andrey
05.10.2018
09:49:29
Увы, нет. Мы свой Alertmanager поэтому написали.
https://github.com/prometheus/alertmanager/issues/876

r9032504423
05.10.2018
10:12:38
Кек, алсо пишу свой alert manager именно по этой причине ?

Google

Алексей
05.10.2018
10:13:17
а почему не темплейтить конфиг алертманаджера и релоадить его по "крону" ?

Admin
ERROR: S client not available

Артём
05.10.2018
10:15:05
не хочется костылить, думал есть возможность добиться результата имеющимся функционалом

Andrey
05.10.2018
10:16:00
а функции вида hour(), minute()?

Алексей
05.10.2018
10:16:28
хм.
с каких пор штуки которые делают шаблонизацию и релоадят конфиг считаются костылингом ?
с каких порт подстройка сервиса под то что что то в физическом мире происходит по крону считается костылингом ?

Артём
05.10.2018
10:16:52

Алексей
05.10.2018
10:18:28
ведь сайленсы именно для этого придуманы...

Andrey
05.10.2018
10:20:14

Алексей
05.10.2018
10:20:55

Andor
05.10.2018
10:22:28
посчитать самому, в прометее это же всегда UTC
но это такое себе развлечение

Алексей
05.10.2018
10:23:07
а вот это уже выглядит как костыль да
потом под него будут еще подпорки

Andor
05.10.2018
10:23:38
да там хорошее универсальное решение не придумать

Алексей
05.10.2018
10:23:51
например баз стало две :) и бекапить надо в разное время

Артём
05.10.2018
10:23:59
как по мне так этот функционал напрашивается

Andor
05.10.2018
10:24:00
если надо считать даты-время, то ты так или иначе будешь покрываться костылями

Алексей
05.10.2018
10:24:02
тем более в схеме уже есть "скрипт бекапа"

Google

Артём
05.10.2018
10:24:29
да, с сайленсом пока видится лучшим выходом

Roman
05.10.2018
10:25:05
можно еще из скрипта бекапа экспортить дополнительную метрику со значениями 0/1 (не нужно мониторить/нужно мониторить). умножать метрику лага на эту служебную

Maxim
05.10.2018
10:25:47
единственное только, что алертменеджер может быть недоступен с машины где скрипт бекапа

Алексей
05.10.2018
10:26:26
схему было бы сложно реалиховать если бы скрипта не было. например мониторинг сущностей которые в физическом мире выключают "уходя госите свет"
тут нужен был бы фикс со стороны алертманаджера да

Andrey
05.10.2018
10:29:48
hour(timestamp(up{}==0)) < 20 > 18 - ну да, костылевато конечно
если я правильно понимаю принцип работы функций этих

Maxim
05.10.2018
10:31:23
(hour() > 7 < 16)

Andrey
05.10.2018
10:31:52
а как увязывать с выражением основным для алерта?

Andor
05.10.2018
10:32:16
and on () ...

Andrey
05.10.2018
10:34:19
and on () ...
да, спасибо, быть честным, не знал, что label list может быть пустым