
yopp
23.01.2017
13:36:03

lastsky
23.01.2017
13:36:31
нормальный вариант, они сами вроде так рекомендуют
любой node_exporter можно грепнуть по метрикам - там будет в этом формате версия node_exporter и коммит же

yopp
23.01.2017
13:37:11
не

Google

yopp
23.01.2017
13:38:07
то что делает прометей с версией это именно _исторические_ данные. ну тоесть у нас с T1 по T2 была версия X, а с T2 по T3 версия Y
а «факт», это когда мы просто записываем одну точку
и это, к сожалению, не прометеевская история

Maxim
23.01.2017
13:39:15

lastsky
23.01.2017
13:39:33
# curl -s 127.0.01:9100/metrics | grep version | grep revision
# HELP node_exporter_build_info A metric with a constant '1' value labeled by version, revision, branch, and goversion from which node_exporter was built.
node_exporter_build_info{branch="master",goversion="go1.7.3",revision="42d1658d5632fe0bfb281761d5e3620cfc37990b",version="0.13.0-rc.2"} 1

yopp
23.01.2017
13:39:36

Maxim
23.01.2017
13:39:50
а если между деплоями прометей успеет заскочить за данными, то будет больше
вопрос-то только в том, как часто скрапить пушгейтвей

yopp
23.01.2017
13:40:12
блин
как бы ещё объяснить-то.

lastsky
23.01.2017
13:41:20
ну вот я про этот вариант имел ввиду, что они сами так делают и ничего зазорного отдать лейблы и единицу туда

yopp
23.01.2017
13:41:46

Google

Maxim
23.01.2017
13:42:39
это от задачи зависит же
меня вполне устраивает такое поведение
у меня ста деплоев за десять секунд не происходит, мне ок

yopp
23.01.2017
13:42:40
короче, если говорить проще: прометей не событийно-ориентированный. тоесть прометею срать что произошло между двумя скрейпами, ему интересно только «мгновенное» значение в момент скрейпа
по этому любая попытка засунуть в прометей «событие» обречена на провал
деплой — событие
а вот версия бекенда, это историческое значение

lastsky
23.01.2017
13:46:17
пф
можно просто сделать IF revision CHANGED then warning и алертменеджер отрапортует событие
(ну, я утрирую синтаксис!)

Maxim
23.01.2017
13:47:59
а можно просто не теоретизировать и отталкиваться от стоящей задачи ;)
о чем я тут с самого начала говорю

yopp
23.01.2017
13:49:20
пф
это «пф» ведёт к большим проблемам с использованием прометея ;)
точнее, если ты не понимаешь вот эту, казалось бы несущественную, деталь прометей будет плохим выбором, потому что ты его будешь сходу неправильно готовить
этот подход за одно объясняет почему ретроспективно в прометей данные засунуть можно только через жопу

Maxim
23.01.2017
13:54:12
ну вот боевая задача:
система деплоя сделана из говна и палок (don't ask)
программисты хотят дашборд с корреляцией версии бэкенда (которую прометей скрапит с бэкенда) и номером деплоя
ну и алерт по этой херне

Daniel
23.01.2017
13:54:20

lastsky
23.01.2017
13:54:26
почему don't ask то (вот всегда так)

Maxim
23.01.2017
13:55:22

yopp
23.01.2017
13:55:26
второй вопрос: «а почему я не могу засунуть в прометей свои 100 точек с разницой 100мс?»

lastsky
23.01.2017
13:56:01
ну у меня была задача по отображению версий для разработчиков и я её решил, этим самым путем, в общем

Google

lastsky
23.01.2017
13:56:35

Maxim
23.01.2017
13:57:07

yopp
23.01.2017
13:57:10
и да, на всякий случай, я не говорю что задачу решить невозможно, я говорю что она будет решена с ограничениями

Daniel
23.01.2017
13:57:40

yopp
23.01.2017
13:58:10
да, и мы приходим к простому выводу что «прометей — не tsdb»

Maxim
23.01.2017
13:58:29
и что теперь? закапываем?

Daniel
23.01.2017
13:58:40
и что у нас tsdb?

yopp
23.01.2017
13:58:47
нет, перестём мыслить категориями tsdb

Daniel
23.01.2017
13:59:15
инфлюкс говно.
дальше

yopp
23.01.2017
13:59:24
отлично

yopp
23.01.2017
13:59:49
а дальше я продолжу писать бумажки

Maxim
23.01.2017
13:59:52

yopp
23.01.2017
14:00:19
окей!

Maxim
23.01.2017
14:00:24
просто конкретно эту задачу можно успешно решить вышеописанным способом

Igor
23.01.2017
14:00:26
?

yopp
23.01.2017
14:00:32

Maxim
23.01.2017
14:00:36
не прибегая к сторонним инструментам

yopp
23.01.2017
14:01:23
вобщем меня исключительно сочетание «записать факт» и «pushgateway» триггернуло

Google

yopp
23.01.2017
14:01:33
факт в прометей записать нельзя
но это профдеформация, мне в детстве промавтоматизация на хвост наступила

lastsky
23.01.2017
14:02:08
погоди, а метрика ALERTS в прометее - твою проблему не решает?

Maxim
23.01.2017
14:02:19

yopp
23.01.2017
14:02:30
ты предложил факт записать через пушгейт :)

Daniel
23.01.2017
14:03:49

yopp
23.01.2017
14:08:17
да, к шринку хожу, рассказываю как меня архитектор бил ногами, когда я не понимал почему нет «текущего значения», а есть только «последнее известное значение»

Daniel
23.01.2017
14:09:01
ну - мне, например, хватило одной двойки за лабу по физике, чтобы этот простой факт усвоить

Vladimir
23.01.2017
14:09:45
тут мы придем к выводу что люди хотят странное от систем, которые для этого не предназначены

yopp
23.01.2017
14:09:51

Admin
ERROR: S client not available

Vladimir
23.01.2017
14:09:55
и к тому что хорошего мониторинга в опенсорсе нет
и я сомневаюсь что хороший мониторинг есть у контор в своих приватных сетях

Alex Milushev
23.01.2017
14:10:27
а есть критерии этого “хорошего мониторинга”?

Daniel
23.01.2017
14:10:30
прометей - это операционный мониторинг АКА алертер

yopp
23.01.2017
14:10:37
а есть критерии «мониторинга»?

Daniel
23.01.2017
14:10:48
нужны еще оперативный и трендовый

Vladimir
23.01.2017
14:11:41

Alex Milushev
23.01.2017
14:11:59

Vladimir
23.01.2017
14:12:12

Google

Alex Milushev
23.01.2017
14:12:30
должен же быть конечный набор характеристик, иначе как получается вывод о текущем состоянии дел?

Vladimir
23.01.2017
14:13:25
как администратор я хочу HA - несколько инстансов, очередь проверок, кворум, все вот такое вот

Alex Milushev
23.01.2017
14:13:51
можно сделать какой-то сводный документ/табличку

Vladimir
23.01.2017
14:14:01
чтобы отказ одной ноды не вел к остановке мониторинга всего в целом

Alex Milushev
23.01.2017
14:14:04
и вогнать туда многие текущие решения
сразу разложив на полочки

Vladimir
23.01.2017
14:14:19
и также чтобы проверки шли не одномоменто

Alex Milushev
23.01.2017
14:14:44
ну не обязательно ее в одиночку делать то

Vladimir
23.01.2017
14:14:47
в смысле описать, обсудить в сообществе каком-нибудь (например тут) прийти к консенсусу
составить

Alex Milushev
23.01.2017
14:14:52
вот вот

Vladimir
23.01.2017
14:14:58
потом пройтись по имеющимся системам, их разобрать
определить что плюс, что минус
и т.п.

Alex Milushev
23.01.2017
14:15:10
а то сообщество есть а результата работы сообщества мало

Vladimir
23.01.2017
14:15:11
это большой объем работы

yopp
23.01.2017
14:15:33
это бесполезный объём работы, потому что у всех разные модели HA и FT
у всех разные требования, разные бюджеты, разные объёмы данных
не говоря уже о том, что вообще все задачи разные

Alex Milushev
23.01.2017
14:16:04
но есть же конечный набор характеристик