@metrics_ru

Страница 658 из 681
Terminator
04.10.2018
14:25:49
@krakazyabra будет жить. Поприветствуем!

Алексей
04.10.2018
14:31:01
Возможно да, но иногда надо почистить кучу всякого ауна )))
удали всю историю. не думаю что ты успел насобирать больше чем хотел бы удалить

Serg
04.10.2018
14:31:11
Дык я на будущее ))

Алексей
04.10.2018
14:31:20
а набудущее неудаляй.

Google
Serg
04.10.2018
14:31:26
У меня впереди еще много экспериментов ?

Алексей
04.10.2018
14:31:29
само уйдет. подожди retention

Andrey
04.10.2018
14:33:24
А удаление через api не очень хорошая идея что ли?

Serg
04.10.2018
14:33:57
само уйдет. подожди retention
Ну нееее, ждать 365 дней, как в одной известной компании????

Алексей
04.10.2018
14:34:26
эм. 365 ?

гдето у меня был крутой смайлик про фейлпалм. не могу найти. там где сразу полчата фэеспламнуло

может у @Nklya есть

Andrey
04.10.2018
14:35:53
а набудущее неудаляй.
Это чем обусловлено?

Алексей
04.10.2018
14:36:49
Это чем обусловлено?
тем что базы tsdb append only по архитектуре. и удаление в них - по факту костыль

evix
04.10.2018
14:37:07
лучше ждать ретеншн да

Алексей
04.10.2018
14:37:31
тем более что ртеншены в контексте прома довольно коротки.

Nklya
04.10.2018
14:41:54
Я думаю цифра в 365 дней родилась из Z

Wom
04.10.2018
14:45:05
может это просто число дней в году?

Google
Алексей
04.10.2018
14:45:25
год слишком плавающая константа

Andrey
04.10.2018
14:56:39
псс

парни

а заббикс научился прометеус читать

Alexander
04.10.2018
14:57:44
тут, кстати, в description-е чата опечатка > Атуальный список TSDB

Алексей
04.10.2018
15:01:31
а заббикс научился прометеус читать
андрей, есть 2 канала на которых эту новость стоит и нужно обсуждать. предлагаю делать это там. спасибо.

Viktor
04.10.2018
16:41:21
Тут про алертманагер рассказывают? Можете кидануться той частью доки где рассказывают как правильно дергать переменные в алертах?

Алексей
04.10.2018
16:42:56
{{$labels.instance}}

{{$value}}

это всё

Viktor
04.10.2018
16:51:11
я могу сделать value: time() - {{ $value }}? или же {{ $value }} / 1024? на резнноый вопрос "чеб не проверить" отвечу что возможности пока нет, а знать нужно бы

Алексей
04.10.2018
17:17:53
там юзаются гошные шаблоны

можно так вот например annotations: description: '{{$labels.host}}: {{$labels.path}} disk usage is above 90% (current value is: {{ $value | printf "%.2f"}})' summary: '{{$labels.host}}: Low disk space'

Алексей
04.10.2018
17:26:31
@EKbfh ты не пробовал туда ещё чего добавлять ?

Anton
04.10.2018
17:26:54
а есть способ посмотреть все labels?

Алексей
04.10.2018
17:27:21
а есть способ посмотреть все labels?
сделай запрос в пром. он тебе скажет их все

Andrey
04.10.2018
17:28:54
@freeseacher ты как то пытался найти людей, которые юзают m3? они таки откликнулись? интересно было бы какой-то отзыв получить

Google
Алексей
04.10.2018
17:29:16
да. такие люди есть в gitter проекта

там ~40 человек.

живых русскоговорящих пока не найдено.

Andrey
04.10.2018
17:30:36
просто пытаюсь понять объем подпиливаний, в случае использования его как long-term

просто выбор адаптеров с remote read не так широк, как я погляжу. как поступают тогда в случае наличия только write? делят дашборды и репорты на актуальные и исторические?

Алексей
04.10.2018
17:34:28
никак не поступают. это очевидно тупиковая ветка развития

Алексей
04.10.2018
17:36:46
почитав доку на m3db выглядит будто размах у них широкий. сколько придется пилить до mvp на своей инфораструктуре я хз. в августе ребята признали что стоит бы сделать тесты на функциональность связанную с промом. тут читать https://github.com/m3db/m3/issues/866

Andrey
04.10.2018
17:38:01
в promhouse смущает конечно "do not use it in production")

Алексей
04.10.2018
17:38:05
сейчас выглядит будто основную работу тащит https://github.com/richardartoul отвечает быстро и по делу.

Andrey
04.10.2018
17:39:42
ну с другой стороны, ведь и remote write/read не самая стабильная вещь

Алексей
04.10.2018
17:40:15
даже в проме такое написано. https://prometheus.io/docs/prometheus/latest/stability/ Things considered unstable for 2.x: Any feature listed as experimental or subject to change, including: The holt_winters PromQL function Remote read, remote write and the remote read endpoint v2 HTTP and GRPC APIs

RK
04.10.2018
19:17:22
Подскажите, как включить в графане при алертах (отправка в телегу), отображение метрик в сообщении? У меня почему-то на одном типе алертов приходит метрика, на других просто урл на график. При этом в slack всегда метрика прилетает.

А второй вопрос. В slack прилетает метрика со значением, после запятой дохрена цифр. Мне нужно или срезать до 2 или округлить. Как это сделать? При этом в телегу норм, срезает до 3 знаков после запятой ?

Deep Sea
04.10.2018
19:35:43
в датасурсе надо это делать по-идее

Артём
05.10.2018
09:28:00
Подскажите пожалуйтса. Ночью снимается бэкап и в это время реплика отстаёт от мастера —> срабатывает алерт Как убрать это ложное срабатывание на этот период? Через exp в prometheus'e? Так и не понял как это делать используя имеющиеся у него функции. Или эту логику можно переложить на alertmanager ?

Andrey
05.10.2018
09:49:29
Увы, нет. Мы свой Alertmanager поэтому написали. https://github.com/prometheus/alertmanager/issues/876

r9032504423
05.10.2018
10:12:38
Кек, алсо пишу свой alert manager именно по этой причине ?

Google
Алексей
05.10.2018
10:13:17
а почему не темплейтить конфиг алертманаджера и релоадить его по "крону" ?

Admin
ERROR: S client not available

Артём
05.10.2018
10:15:05
не хочется костылить, думал есть возможность добиться результата имеющимся функционалом

Andrey
05.10.2018
10:16:00
а функции вида hour(), minute()?

Алексей
05.10.2018
10:16:28
хм. с каких пор штуки которые делают шаблонизацию и релоадят конфиг считаются костылингом ? с каких порт подстройка сервиса под то что что то в физическом мире происходит по крону считается костылингом ?

Артём
05.10.2018
10:16:52
а функции вида hour(), minute()?
да, читал, но не понял как с ними это реализовать Можете привести пример?

Andrey
05.10.2018
10:20:14
Алексей
05.10.2018
10:20:55
а функции вида hour(), minute()?
а как потом связать это с тем что бекап начинает делатся в другой таймзоне ? или в другое время ?

Andor
05.10.2018
10:22:28
посчитать самому, в прометее это же всегда UTC

но это такое себе развлечение

Алексей
05.10.2018
10:23:07
а вот это уже выглядит как костыль да

потом под него будут еще подпорки

Andor
05.10.2018
10:23:38
да там хорошее универсальное решение не придумать

Алексей
05.10.2018
10:23:51
например баз стало две :) и бекапить надо в разное время

Артём
05.10.2018
10:23:59
как по мне так этот функционал напрашивается

Andor
05.10.2018
10:24:00
если надо считать даты-время, то ты так или иначе будешь покрываться костылями

Алексей
05.10.2018
10:24:02
тем более в схеме уже есть "скрипт бекапа"

Google
Артём
05.10.2018
10:24:29
да, с сайленсом пока видится лучшим выходом

Roman
05.10.2018
10:25:05
можно еще из скрипта бекапа экспортить дополнительную метрику со значениями 0/1 (не нужно мониторить/нужно мониторить). умножать метрику лага на эту служебную

Maxim
05.10.2018
10:25:47
единственное только, что алертменеджер может быть недоступен с машины где скрипт бекапа

Алексей
05.10.2018
10:26:26
схему было бы сложно реалиховать если бы скрипта не было. например мониторинг сущностей которые в физическом мире выключают "уходя госите свет"

тут нужен был бы фикс со стороны алертманаджера да

Andrey
05.10.2018
10:29:48
hour(timestamp(up{}==0)) < 20 > 18 - ну да, костылевато конечно

если я правильно понимаю принцип работы функций этих

Maxim
05.10.2018
10:31:23
(hour() > 7 < 16)

Andrey
05.10.2018
10:31:52
а как увязывать с выражением основным для алерта?

Andor
05.10.2018
10:32:16
and on () ...

Andrey
05.10.2018
10:34:19
and on () ...
да, спасибо, быть честным, не знал, что label list может быть пустым

Страница 658 из 681