@metrics_ru

Страница 672 из 681
Evgeny
17.10.2018
09:05:03
немного не понял, что вы хотели сказать этим скриншотом
Это дашборд, который смотрит на инстанс akumuli, который живет уже больше года на самом дешевом инстансе DO и не теряет данные (кроме retention), он даже торчит в интернет, чтобы чуваки из графаны могли проверять мой datasource плагин.

Aliaksandr
17.10.2018
09:05:48
Я вот тоже инженер вроде, но пофлудить в чяте у меня время есть
скорее всего, вы всю свою работу автоматизировали, и теперь у вас много свободного времени. Наши программисты не могут пока автоматизировать написание кода, поэтому они должны работать, а не флудить в чатах

Andor
17.10.2018
09:06:49
Я даже не менеджер, но очень хорошо это понимаю

Google
Aliaksandr
17.10.2018
09:08:08
Это дашборд, который смотрит на инстанс akumuli, который живет уже больше года на самом дешевом инстансе DO и не теряет данные (кроме retention), он даже торчит в интернет, чтобы чуваки из графаны могли проверять мой datasource плагин.
а, тогда здорово! Нужно было просто скинуть ссылку на этот дашборд, чтобы люди могли им попользоваться и сравнить с VictoriaMetrics дашбордом - http://play-grafana.victoriametrics.com:3000/d/4ome8yJmz/node-exporter-on-victoriametrics-demo?orgId=1 . В нашем дашборде люди могут редактировать графики

Andor
17.10.2018
09:08:49
:3000? Srsly?

Aliaksandr
17.10.2018
09:09:02
да, стандартный порт графаны

Andor
17.10.2018
09:10:06
Это немного говорит об уровне инженеров в вашей компании

Aliaksandr
17.10.2018
09:10:08
Правило менеджера программистов номер 1: не ожидай что они будут работать 8 часов в день и не будут отвлекаться
вот гады. Тогда будем платить им не за 8 часов, а за 3 часа. Или сколько они времени в день работают?

Andor
17.10.2018
09:10:31
Alexey
17.10.2018
09:10:43
Andor
17.10.2018
09:11:04
Точно

Evgeny
17.10.2018
09:11:28
я как немного менеджер могу сказать что менеджмент и PR, это разные, не связанные вещи

bebebe
17.10.2018
09:12:05
коллеги, есть прекрасный чатик @agile_ru для таких тем

Alexander
17.10.2018
09:38:25
@valyala а это не вы, случаем, автор fasthttp?

Aliaksandr
17.10.2018
09:53:21
я, но сейчас поддержкой занимаются другие люди - https://github.com/kirillDanshin и https://github.com/erikdubbelboer

buttno
17.10.2018
10:01:10
все ясно.

Google
Alexander
17.10.2018
10:01:29
@valyala не обижайтесь, но инженер из вас получше, чем пиарщик или продажник

terry
17.10.2018
10:16:54
https://blog.callr.tech/kamailio-exporter-for-prometheus

Terminator
17.10.2018
11:38:27
lev будет жить. Поприветствуем!

Alexander
17.10.2018
11:49:31
Воу воу зашел чатить почитать, а тут какашками кидаются.

С таким подходом надо автокефалию делать для коммерческих решений.

Wom
17.10.2018
11:55:27
фекалию

lev
17.10.2018
12:07:36
Зашёл почитал и остался

Никита
17.10.2018
12:17:03
Автофекалию многие решения, даже коммерческие, предлагают искаропки.

Алексей
17.10.2018
12:59:11
Агрессивный маркетинг vm на этом канале немного надоел. @valyala предлагаю в следующий раз с готовым решением. Иначе ro. Спасибо!

GithubReleases
17.10.2018
19:40:55
influxdata/telegraf was tagged: 1.8.2 Link: https://github.com/influxdata/telegraf/releases/tag/1.8.2 Release notes: Telegraf 1.8.2

Terminator
17.10.2018
20:24:30
@sc0rp10 будет жить. Поприветствуем!

Konstantin
17.10.2018
20:26:54
господа, а как можно смаппить лейбл в метрике на северити в алерте?

есть у меня метрика наподобии

foo{title="bar", severity="regular"} 1

и я хочу иметь алерт, если foo != 1

но чтобы уровень этого алерта брался из метрики

т.е. я могу наделать алертов по каждому северити, навроде foo{severity="critical"} != 1 foo{severity="warning"} != 1 итд

Google
Алексей
17.10.2018
20:29:08
а какое выражение то для поднятия алерта *?

Konstantin
17.10.2018
20:29:13
но их дофига будет в этой группе, неохота копипастить

а просто foo != 1

Алексей
17.10.2018
20:29:51
дак в нем сохранится серверити

все теги которые были в событии передудт в алерт

Konstantin
17.10.2018
20:30:21
а, так и думал, но проверять чуть проблемно

спасибо

Алексей
17.10.2018
20:30:32
если бы ты чего то сделал типа count или sum тогда да часть тегов была бы съедена

Konstantin
17.10.2018
20:30:47
кстати, так и не нашел, за что меня забанили тут в прошлый раз. это мог был быть бот-терминатор? ?

я тут особо ничего и не писал

Алексей
17.10.2018
20:31:17
терминатор хочет кнопку нажатать.

а забанить могли только за злостное употребление заба

Konstantin
17.10.2018
20:32:12
не, у меня его близко нет и не было ?

Алексей
17.10.2018
20:37:00
Дефайн работать
там ниже аджайл чатик предложили. хорошая рекомендация

Dmitriy M.
17.10.2018
21:40:58
Виктор
17.10.2018
21:49:10
/stat@combot

Combot
17.10.2018
21:49:12
combot.org/c/-1001068522817

Денис
17.10.2018
21:50:07
хм, а как он флуд считает?

Google
Admin
ERROR: S client not available

GithubReleases
17.10.2018
22:10:55
influxdata/telegraf was tagged: 1.8.2 Link: https://github.com/influxdata/telegraf/releases/tag/1.8.2 Release notes: ### Bugfixes * [#4844](https://github.com/influxdata/telegraf/pull/4844): Update write path to match updated InfluxDB v2 API. * [#4840](https://github.com/influxdata/telegraf/pull/4840): Fix missing timeouts in vsphere input. * [#4851](https:/... More

Krakazyabra
18.10.2018
01:53:20
Всем доброй ночи. Скажите, в чём лучше всего рисовать карту сети (свичи, трафик на портах). Данные собираются заббиксом

[Anonymous]
18.10.2018
06:10:55
а кто тоже когда вступил в группу нажал я бот?)))

Terminator
18.10.2018
07:35:09
@rosscomnadzor будет жить. Поприветствуем!

Dmitriy M.
18.10.2018
08:27:29
Подскажите почему алерт менеджер для Resolved вроде как неактуальное значение метрики показывает под $value

Sergey
18.10.2018
08:29:07
Alerts in prometheus only fire when there is a value. Therefore when an alert is resolved, all we know is the last computed value before the end of the alert.

Dmitriy M.
18.10.2018
08:29:57
Видимо из документации? :-) спасибо

Andor
18.10.2018
08:30:26
но ты для Resolved можешь сделать другой текст

Sergey
18.10.2018
08:30:27
Не, это из issues на гитхабе)

Dmitriy M.
18.10.2018
08:30:39
Я предполагал что это вероятно так

Andor
18.10.2018
08:30:40
в шаблоне подправить

Banschikov
18.10.2018
09:19:08
Всем привет! Подскажите по задачке с Prometheus. Так и не нагуглил решение проблемы, возможно что-то я не до конца что-то понимаю... Есть головной кластер Prometheus, который при помощи federation забирает метрики с других prometheus. Есть экземпляр prometheus в k8s, с которым есть проблемы. В нем иногда некоторые targets бывают в состоянии "DOWN" , и головной Prometheus выдает ошибку "context deadline exceeded" Я как понимаю проблема как раз связана с targets, которые в состоянии DOWN ?

Andor
18.10.2018
09:20:03
Первое происходит тогда же, когда второе?

Banschikov
18.10.2018
09:22:07
Первое происходит тогда же, когда второе?
Да. Причем заметил когда в k8s все targets в UP, то в главный пром приходят метрики, но когда в k8s хотя бы один таргет становится DOWN, то получаю эту ошибку.

Andor
18.10.2018
09:22:26
Думаю у тебя с сетью проблема

С прометеем не связанная

context deadline exceed значит что таймаут выполнения запроса, он никак не может быть из-за down таргетов

Подозреваю что у тебя какие-то проблемы со связностью и ошибки - их следствие

Google
Banschikov
18.10.2018
09:27:53
Подозреваю что у тебя какие-то проблемы со связностью и ошибки - их следствие
Когда главный пром делает запрос в k8s, в случае этой ошибки куберовский пром выдает этот лог: level=error msg="federation failed" err="write tcp 10.100.125.227:9090->10.0.0.13:58416: write: broken pipe" source="federate.go:124 10.0.0.13: это адрес api server kubernetes

Я просто не совсем видимо понимаю механизм работы федерации, и не могу понять что происходит в это время

Andor
18.10.2018
09:29:36
Механизм там простейший: один прометей посылает запрос и получает из другого прометея всю кучу метрик, которые удовлетворяют этому запросу

В таргетах на федерейшн прометее глянь

Там можно нажать ссылку ровно ту куда он посылает запрос

Banschikov
18.10.2018
09:32:29
Там можно нажать ссылку ровно ту куда он посылает запрос
Он там все верно посылает запросы. Как запрос доходит до k8s, то я получаю ошибку выше, от прометея в кубере. level=error msg="federation failed" err="write tcp 10.100.125.227:9090->10.0.0.13:58416: write: broken pipe" source="federate.go:124

Andor
18.10.2018
09:32:59
Ну я ж говорю что со связностью проблема

Banschikov
18.10.2018
09:35:35
Ну я ж говорю что со связностью проблема
Самое главное что иногда коннект проходит нормально и метрики появляются, но через каждые 2 запроса получаю эту ошибку. Не совсем понимаю что имеется в виду под словом "связанность", извиняюсь что туплю может...

Andor
18.10.2018
09:36:19
Ну с сетевыми настройками что-то

Страница 672 из 681