@metrics_ru

Страница 79 из 681
yopp
23.01.2017
13:36:03
app_deploy{commit="foobar"} 1 TS
^ про таймсерию это вот это

lastsky
23.01.2017
13:36:31
нормальный вариант, они сами вроде так рекомендуют

любой node_exporter можно грепнуть по метрикам - там будет в этом формате версия node_exporter и коммит же

yopp
23.01.2017
13:37:11
не

Google
yopp
23.01.2017
13:38:07
то что делает прометей с версией это именно _исторические_ данные. ну тоесть у нас с T1 по T2 была версия X, а с T2 по T3 версия Y

а «факт», это когда мы просто записываем одну точку

и это, к сожалению, не прометеевская история

lastsky
23.01.2017
13:39:33
# curl -s 127.0.01:9100/metrics | grep version | grep revision # HELP node_exporter_build_info A metric with a constant '1' value labeled by version, revision, branch, and goversion from which node_exporter was built. node_exporter_build_info{branch="master",goversion="go1.7.3",revision="42d1658d5632fe0bfb281761d5e3620cfc37990b",version="0.13.0-rc.2"} 1

yopp
23.01.2017
13:39:36
почему? будет последний же
да, а два других потеряли

Maxim
23.01.2017
13:39:50
а если между деплоями прометей успеет заскочить за данными, то будет больше

вопрос-то только в том, как часто скрапить пушгейтвей

lastsky
23.01.2017
13:41:20
ну вот я про этот вариант имел ввиду, что они сами так делают и ничего зазорного отдать лейблы и единицу туда

Google
Maxim
23.01.2017
13:42:39
это от задачи зависит же меня вполне устраивает такое поведение у меня ста деплоев за десять секунд не происходит, мне ок

yopp
23.01.2017
13:42:40
короче, если говорить проще: прометей не событийно-ориентированный. тоесть прометею срать что произошло между двумя скрейпами, ему интересно только «мгновенное» значение в момент скрейпа

по этому любая попытка засунуть в прометей «событие» обречена на провал

деплой — событие

а вот версия бекенда, это историческое значение

lastsky
23.01.2017
13:46:17
пф

можно просто сделать IF revision CHANGED then warning и алертменеджер отрапортует событие

(ну, я утрирую синтаксис!)

Maxim
23.01.2017
13:47:59
а можно просто не теоретизировать и отталкиваться от стоящей задачи ;)

о чем я тут с самого начала говорю

yopp
23.01.2017
13:49:20
пф
это «пф» ведёт к большим проблемам с использованием прометея ;)

точнее, если ты не понимаешь вот эту, казалось бы несущественную, деталь прометей будет плохим выбором, потому что ты его будешь сходу неправильно готовить

этот подход за одно объясняет почему ретроспективно в прометей данные засунуть можно только через жопу

Maxim
23.01.2017
13:54:12
ну вот боевая задача: система деплоя сделана из говна и палок (don't ask) программисты хотят дашборд с корреляцией версии бэкенда (которую прометей скрапит с бэкенда) и номером деплоя ну и алерт по этой херне

Daniel
23.01.2017
13:54:20
это «пф» ведёт к большим проблемам с использованием прометея ;)
о, да. к большим. к проблемам. что за чушь, а?

lastsky
23.01.2017
13:54:26
почему don't ask то (вот всегда так)

Maxim
23.01.2017
13:55:22
почему don't ask то (вот всегда так)
потому что не имеет отношения к задаче

yopp
23.01.2017
13:55:26
о, да. к большим. к проблемам. что за чушь, а?
потому что первый вопрос про прометей: «а почему я не вижу свои пять исторических точек с разницой в миллисекунды»

второй вопрос: «а почему я не могу засунуть в прометей свои 100 точек с разницой 100мс?»

lastsky
23.01.2017
13:56:01
ну у меня была задача по отображению версий для разработчиков и я её решил, этим самым путем, в общем

Google
lastsky
23.01.2017
13:56:35
потому что не имеет отношения к задаче
да, сорри, я покинул все нетематические чаты и это был пост-эффект, больше не буду.

Maxim
23.01.2017
13:57:07
потому что первый вопрос про прометей: «а почему я не вижу свои пять исторических точек с разницой в миллисекунды»
задающий этот вопрос не понимает, чего хочет а я просто складываю цыфирьку в пушгейтвей и жду от нее корреляции с другой цыфирькой, которую прометей получает из другого места и алерта в случае нескладухи что я делаю не так?

yopp
23.01.2017
13:57:10
и да, на всякий случай, я не говорю что задачу решить невозможно, я говорю что она будет решена с ограничениями

Daniel
23.01.2017
13:57:40
второй вопрос: «а почему я не могу засунуть в прометей свои 100 точек с разницой 100мс?»
третий - нахера это нужно? четвертый - а куда их можно засунуть?

yopp
23.01.2017
13:58:10
да, и мы приходим к простому выводу что «прометей — не tsdb»

Maxim
23.01.2017
13:58:29
и что теперь? закапываем?

Daniel
23.01.2017
13:58:40
и что у нас tsdb?

yopp
23.01.2017
13:58:47
нет, перестём мыслить категориями tsdb

и что у нас tsdb?
influx например

Daniel
23.01.2017
13:59:15
инфлюкс говно.

дальше

yopp
23.01.2017
13:59:24
отлично

yopp
23.01.2017
13:59:49
а дальше я продолжу писать бумажки

Maxim
23.01.2017
13:59:52
нет, перестём мыслить категориями tsdb
да остановись же, ебаная рогатая тварь тут все понимают, как работает пушгейтвей, и чего ждать от прометея

yopp
23.01.2017
14:00:19
окей!

Maxim
23.01.2017
14:00:24
просто конкретно эту задачу можно успешно решить вышеописанным способом

Igor
23.01.2017
14:00:26
?

Maxim
23.01.2017
14:00:36
не прибегая к сторонним инструментам

yopp
23.01.2017
14:01:23
вобщем меня исключительно сочетание «записать факт» и «pushgateway» триггернуло

Google
yopp
23.01.2017
14:01:33
факт в прометей записать нельзя

но это профдеформация, мне в детстве промавтоматизация на хвост наступила

lastsky
23.01.2017
14:02:08
погоди, а метрика ALERTS в прометее - твою проблему не решает?

Maxim
23.01.2017
14:02:19
факт в прометей записать нельзя
так никто вроде и не спорил

yopp
23.01.2017
14:02:30
ты предложил факт записать через пушгейт :)

Daniel
23.01.2017
14:03:49
вобщем меня исключительно сочетание «записать факт» и «pushgateway» триггернуло
http://img0.joyreactor.cc/pics/post/%D0%B1%D0%B0%D1%82%D1%8E%D1%88%D0%BA%D0%B0-%D0%B1%D0%B0%D1%82%D1%82%D1%85%D0%B5%D1%80%D1%82-%D0%B3%D1%80%D0%B5%D1%85-1129882.jpeg

yopp
23.01.2017
14:08:17
да, к шринку хожу, рассказываю как меня архитектор бил ногами, когда я не понимал почему нет «текущего значения», а есть только «последнее известное значение»

Daniel
23.01.2017
14:09:01
ну - мне, например, хватило одной двойки за лабу по физике, чтобы этот простой факт усвоить

Vladimir
23.01.2017
14:09:45
тут мы придем к выводу что люди хотят странное от систем, которые для этого не предназначены

Admin
ERROR: S client not available

Vladimir
23.01.2017
14:09:55
и к тому что хорошего мониторинга в опенсорсе нет

и я сомневаюсь что хороший мониторинг есть у контор в своих приватных сетях

Alex Milushev
23.01.2017
14:10:27
а есть критерии этого “хорошего мониторинга”?

Daniel
23.01.2017
14:10:30
прометей - это операционный мониторинг АКА алертер

yopp
23.01.2017
14:10:37
а есть критерии «мониторинга»?

Daniel
23.01.2017
14:10:48
нужны еще оперативный и трендовый

Vladimir
23.01.2017
14:11:41
Alex Milushev
23.01.2017
14:11:59
Смотря с какой точки зрения
а разве есть разные точки зрения?

Vladimir
23.01.2017
14:12:12
а разве есть разные точки зрения?
да, точка зрения пользователя, точка зрения администратора как минимум

Google
Alex Milushev
23.01.2017
14:12:30
должен же быть конечный набор характеристик, иначе как получается вывод о текущем состоянии дел?

да, точка зрения пользователя, точка зрения администратора как минимум
ну Я надеюсь, что взаимоисключающих требований там нет

Vladimir
23.01.2017
14:13:25
как администратор я хочу HA - несколько инстансов, очередь проверок, кворум, все вот такое вот

Alex Milushev
23.01.2017
14:13:51
можно сделать какой-то сводный документ/табличку

Vladimir
23.01.2017
14:14:01
чтобы отказ одной ноды не вел к остановке мониторинга всего в целом

Alex Milushev
23.01.2017
14:14:04
и вогнать туда многие текущие решения

сразу разложив на полочки

Vladimir
23.01.2017
14:14:19
и также чтобы проверки шли не одномоменто

Alex Milushev
23.01.2017
14:14:44
ну не обязательно ее в одиночку делать то

Vladimir
23.01.2017
14:14:47
в смысле описать, обсудить в сообществе каком-нибудь (например тут) прийти к консенсусу

составить

Alex Milushev
23.01.2017
14:14:52
вот вот

Vladimir
23.01.2017
14:14:58
потом пройтись по имеющимся системам, их разобрать

определить что плюс, что минус

и т.п.

Alex Milushev
23.01.2017
14:15:10
а то сообщество есть а результата работы сообщества мало

Vladimir
23.01.2017
14:15:11
это большой объем работы

yopp
23.01.2017
14:15:33
это бесполезный объём работы, потому что у всех разные модели HA и FT

у всех разные требования, разные бюджеты, разные объёмы данных

не говоря уже о том, что вообще все задачи разные

Alex Milushev
23.01.2017
14:16:04
но есть же конечный набор характеристик

Страница 79 из 681