
Алексей
19.09.2017
18:26:13
cardvisor более не обязателен
метрики можно снимать напрямую с докера с 17,06 кажется

b0g3r
19.09.2017
18:32:42
Всем привет. Юзаю influxdb+grafana для визуализации всяких-разных метрик с телеграм-бота. Живу радостно и счастливо и вдруг появляется у меня желание посылать раз в день уведомление с набором метрик куда-нибудь
У grafana удачно есть возможность alert'а в тот же телеграм: я набросал график, куда впихнул все нужные мне метрики, спрятал его подальше и поставил алерт - проверка раз в 24 часа и условие, которое заведомо всегда true. Но grafana оказалась сильно умнее меня и решила, что посылать алерт дважды, если условие всё ещё true - не надо
Вопрос: как мне хитро побороть графану с её излишне умными алертами / как иначе делать ежедневные отчеты?

Sergey
19.09.2017
18:37:14
свеженький доклад про то как готовят пром в cloudflare https://www.youtube.com/watch?v=lHtY7TUsLzk

Google

Andor
19.09.2017
18:37:46

Zhenia
19.09.2017
18:38:04
они там для галочки

Алексей
19.09.2017
18:38:24
не использовать Influx он не база.

b0g3r
19.09.2017
18:38:40
А графану-то можно использовать? :)

Алексей
19.09.2017
18:38:44
но если у вас всё хорошо. то ладно
алертинг в графане сыр. но не торт :)

Zhenia
19.09.2017
18:39:11
графана - отличная. но алерты у нее не нужны

Алексей
19.09.2017
18:39:29
что автоматом ведет вас к алертам через капаситор.
чего вы очевижно хотите избежать.
понимаю да.

b0g3r
19.09.2017
18:39:41
Оффтопный вопрос - почему инфлукс говно
Неоффтопный вопрос - как тогда мне прикрутить туда daily report?

Zhenia
19.09.2017
18:39:51
тут люди мечтают о бекенд апи к графане, что бы напилить нормальный алертинг

Google

b0g3r
19.09.2017
18:40:08
туда - это куда-нибудь, вы мне можете слов наговорить, я их нагуглю
К графане я привязан, но не прям сильно-сильно

Алексей
19.09.2017
18:40:21
погугли инфлюкс в этой теме.
отчет это скорее про redash/metabase
графана оперативный мониторинг да

b0g3r
19.09.2017
18:41:23
Напоминаю, что у меня объемы небольшие: до 30 событий в секунду

Zhenia
19.09.2017
18:41:34
https://www.influxdata.com/time-series-platform/kapacitor/
вот алертилка
но больше всех с инфлюксм работал @freeseacher

b0g3r
19.09.2017
18:42:11
от графаны очень нравятся красивенькие графики и возможность их херачить iframe'ом куда мне нужно

Zhenia
19.09.2017
18:42:16
так что, я бы доверял его мнению про не база

Алексей
19.09.2017
18:42:38
30 событий в секунду можно писать в блокнот. при помощи бабушен с подъезда.
там справится всё что угодно
так что довольны стеком - ок.
берите капаситор.

b0g3r
19.09.2017
18:43:41
ради daily report?

Алексей
19.09.2017
18:43:58
дайли репорт ! = алерт

b0g3r
19.09.2017
18:44:23
согласен полностью

Алексей
19.09.2017
18:44:33
для репортов есть редаш. он умеет с инфлюксом

b0g3r
19.09.2017
18:44:40
Ага

Google

Алексей
19.09.2017
18:44:42
но он толстый. очень.

b0g3r
19.09.2017
18:44:49
:(
Чет как-то всё грустно :(

Алексей
19.09.2017
18:47:28
не
всё ровно

b0g3r
19.09.2017
18:47:37
В принципе, ничто не мешает мне на коленке нахерачить скрипт, который сходит, соберет и раз в сутки всё отправит, но графана была так близка

Алексей
19.09.2017
18:47:40
девопс ворлд

Zhenia
19.09.2017
18:47:47
не проще для дейли репортов на таких обьемах написать скрипт и в крон его?

Алексей
19.09.2017
18:47:51
да
скрипт проще

Vyacheslav
19.09.2017
18:48:00
Как вариант по крону снимать с графаны скриншот в пдф каким-нибудь хедлесс хромом

b0g3r
19.09.2017
18:48:13
да не, мне графики не нужны

Алексей
19.09.2017
18:48:13
у графаны он встроен

b0g3r
19.09.2017
18:48:23
к тому же там есть png генератор

Алексей
19.09.2017
18:48:27
так что там директ имидж вполнес ебе есть

b0g3r
19.09.2017
18:48:35
просто оно так красиво мне высрало алерт, но один раз... и мне стало так невообразимо грустно, что захотелось закостылить

Vyacheslav
19.09.2017
18:48:50
Пдф? Ну-ну.... ))

Алексей
19.09.2017
18:49:00
не пробовал конечно

b0g3r
19.09.2017
18:49:07
для пдфки есть плагин какой-то

Google

Алексей
19.09.2017
18:49:09
но это только флаг
нее. позырил в js захардкожено Png

Nklya
19.09.2017
18:57:57
Если прямо очень хочется, можно найти в коде графаны это условие и закоментить

Алексей
19.09.2017
18:58:59
да
/usr/share/grafana/vendor/phantomjs/render.js
тут вот

Zlokot
19.09.2017
19:02:54

Алексей
19.09.2017
19:03:14
вот вы сейчас эти вопросы задаете и я чот засомневался.
ибо прям не заюзал еще

Zlokot
19.09.2017
19:03:26
я так вобще нуб
начал копать отсюда - https://grafana.com/dashboards/893
там есть линк на гит репу с конфами.
подстроил под свою лабу.
и в общем в этом дашборде хочу, чтобы показывало кол-во гостей на ноде.
в смысле контейнеров. дурацко-длинное слово
привык к гостям

Vyacheslav
19.09.2017
19:37:17
кто там спрашивал почему инлюкс гавно?
вот поэтому:
тупо с нифига ушел в 100% CPU

Paul
19.09.2017
19:38:17
тупо на старт ушло 6 часов

Vladimir
19.09.2017
19:59:58

Vyacheslav
19.09.2017
20:01:38

Vladimir
19.09.2017
20:03:52
Ну так данных много, компактить надо тоже много

Google

Алексей
19.09.2017
20:19:01
а ретеншен какой ?

Vyacheslav
19.09.2017
20:39:55

Алексей
19.09.2017
20:40:40
тогда твой инфлюкс на мой вглязд делал полную хрень. :)

Vyacheslav
19.09.2017
20:44:33
там правда хост хиленький (4 ядра, 8 гиг оперативы) и пока есть возможность залить проблему железом, но, пойду ка я завтра все-таки ныть руководству по поводу переезда на кликхауз ))

Алексей
19.09.2017
20:46:14
нельзя взять и перехать на кликхаус. надо всё прееделывать увы :(

Zlokot
19.09.2017
21:16:29
вопрос про метрики в графане
count(rate(container_last_seen{name=~".+"}[$interval]))
этот query вычисляет количество контейнеров.
но в это кол-во попадают ВСЕ контейнеры которые размещены на всех нодах в swarm.
мне надо добавить в этот query еще один параметр - instance - чтобы выбирая имя нода в дропдаун на дашборде, мне отображалось кол-во контенейров именно на этой ноде.
как это сделать?

Stas
19.09.2017
21:17:06
Грусть в кликхауса это при конвертации типов string int ну и сложность с транспонированием в широкую таблицу из узкой...
Пытаемся тут кластер большой собрать ~100GB день метрик, ротация раз в год, и похоже лучшее что нам подходит это именно ch но есть с ним сложности :(
Ну и собственно вопрос - верный ли выбор или есть что лучше?

yuyu
19.09.2017
21:30:02

Stas
19.09.2017
21:33:31

yuyu
19.09.2017
21:35:23
toIntOrZero() не подходит?

Stas
19.09.2017
21:36:19

yuyu
19.09.2017
21:37:48
Ну тогда только через case или if. Длинно конечно.

Stas
19.09.2017
21:39:33
Ну тогда только через case или if. Длинно конечно.
Не подходит, мне нужно сделать широкую таблицу и уже в ней далее делать вычисления, сейчас пока думаю насчёт замены типа string на int для колонки, тогда все работает, но там ещё лежат массивы которые придётся переносить...

yuyu
19.09.2017
21:45:09
Int по скорости выигрыш почти наверняка даст. Может и стоит заморочиться.

Stas
19.09.2017
21:55:40

Andor
19.09.2017
22:31:33

Vladimir
20.09.2017
07:08:55