
ptchol
19.03.2017
10:15:47
там штук 6-7 и все полезные

Александр
19.03.2017
10:16:25

ptchol
19.03.2017
10:17:02
хм
а ты что делаешь кумулятивный график но не складываешь там серии ?

Google

Старый
19.03.2017
10:17:27

Алексей
19.03.2017
10:22:34

lastsky
19.03.2017
10:23:01
Старый, я тебе вчера прислал готовую формулу же
что здесь опять началось )))

Алексей
19.03.2017
10:23:10
Старый, начни с того что поймешь в чем измеряется тот или иной параметр.

lastsky
19.03.2017
10:23:20
100 - (avg by (instance) (irate(node_cpu{job='node',mode='idle',instance='server02:9100'}[5m])) * 100)

Алексей
19.03.2017
10:23:37

lastsky
19.03.2017
10:24:14
irate should only be used when graphing volatile, fast-moving counters.
https://www.robustperception.io/understanding-machine-cpu-usage/
рекомендации ведущих собаководов.

Mikhail
20.03.2017
08:14:27
слушайте, а как более адекватно измерять задержку прокси по отношению к бэкенду? по абсолютному времени ( ответ прокси - ответ бэкенда ) или по относительной величине( (ответ прокси - ответ бэкенда)) / ответ бэкенда?
ну например, занимаюсь кастомизацией Nginx с целью уменьшения задержки, измерил до/после, абсолютное время увеличилось, относительная доля уменьшилась, вот и гадаю, хуже я сделал или лучше)

Google

Sergey
20.03.2017
08:16:55
непонятно, зачем вообще вводить метрику "относительная задержка".
скорость работы прокси не зависит от скорости работы бэкенда. если бэкенд тормозит - то относительная задержка у вас уменьшится, но это ничего не будет значить. прокси лучше не станет работать.

Vladimir
20.03.2017
08:18:03

Mikhail
20.03.2017
08:19:35
так, про вопрос между относительной и абсолютной задержкой понял, спасибо
да проблема в том, что вообще не замечаешь корреляции между переконфигурацией и временем ответа) даже по 95 процентили временами всплески на графике видно
слишком мало запросов? недостоверные данные?

Pablo
20.03.2017
08:27:39

Mikhail
20.03.2017
08:35:33

Pablo
20.03.2017
08:37:36
Это вероятность что вы себе просто выдумали что время увеличилось

Vladimir
20.03.2017
08:38:29
иногда надо просто пойти по первой ссылке

Mikhail
20.03.2017
08:55:06
Получается, гораздо благоразумней будет высчитывать p-value по фиксированному значению задержки, чем измерять абсолютные значения?

User ?
20.03.2017
09:09:43
Привет, кто-нибудь в курсе, можно ли в графане взять n метрик, их сумму засчитать за 100% и нарисовать график в процентом соотношении, сколько какая метрика занимает

ptchol
20.03.2017
09:16:56
ну и Draw Modes сделать Bars для красоты
или оставить lines но сделать staircase + залить

User ?
20.03.2017
09:18:49
А я понял почему у меня так не получалось.
Если выставлять маленький промежуток времени (1h)
то получаются страшные картинки

Google

ptchol
20.03.2017
09:23:13
там бывают особенности если нулы какие то или ещё че нить такое
ну да, данных не хватает.
там попробовать поставить null as zero
Null Value - Null as Zero

User ?
20.03.2017
09:24:53
поставил, не помогает. У меня эта метрика собирается раз в ~5 минут. Видимо 12 значений на час - слишком мало

ptchol
20.03.2017
09:25:12
не не не. должно быть ок.
странно что не помогает

User ?
20.03.2017
09:26:29
Бекендом используется заббикс, если это имеет значение

Maxim
20.03.2017
09:26:55

User ?
20.03.2017
09:27:31
лови какаху )
Ну я не могу рраз и перепрыгнуть на пром. Оно постепенно идет

ptchol
20.03.2017
09:27:43
Врядли это должно влиять

Alexander
20.03.2017
10:37:20
О, я догнал чатек! Слава понедельнику.
@ptchol крутая тема с cmd+o в графне, но что то не работает нифига. Жму на дашборде. а оно мне графики рефрешит (свежие графана и хром)

Alexander
20.03.2017
10:38:37
есть идеи почему так может быть?
Еще вопрос знатокам прометеуса и графаны – я еще не разбирался в чем может быть дело. Вобщем пока спрошу тут. Есть такой бесючий баг – когда открывешь из графика запрос в прометее (там есть кнопочка), живущем на подурле (/prom), то графана открывает формулу адрес /prom/graph с формулой в куери стринге его в одном формате кодирования, после чего прометей редиректит в другом формате на /graph, игнорируя префикс /prom. В результате – 404. (Если руками добавить в получившийся урл /prom префикс, то ок - всё работает)
У кого-нибудь такое было?

ptchol
20.03.2017
10:47:16
нажми туда и посмотри что как

Alexander
20.03.2017
10:51:36
вопросик я уже нажимал

ptchol
20.03.2017
10:53:42
ну не знаю ! всё в этих ваших линуксах не по человечески ! )

Alexander
20.03.2017
10:54:24
у меня мак. это ваши опенсорсы работают хз как!

Google

Alexander
20.03.2017
10:55:09
самое фиговое когда фронтенд не работает, потому что это не починить
надо лезть в мир нодежса и прочих ангуляров, которые не хочется касаться 5 футовой палкой

ptchol
20.03.2017
11:03:39
открой консольку JS
может там чтопишется в браузере

Vladimir
20.03.2017
11:06:16

Alexander
20.03.2017
11:06:33
grafan 4.1.2 ?

Vladimir
20.03.2017
11:06:42
да

Zhenia
20.03.2017
11:09:39
у меня в хроме не работают, а в огнелисе норм

Admin
ERROR: S client not available

Alexander
20.03.2017
11:16:51
итс э мейджик!

Magistr
20.03.2017
18:53:24
чатик а что ты делаешь если настроены алерты в графане, а она алертит когда тормозит ?

Evgeny
20.03.2017
18:56:01
Кто-нибудь пользуется аннотациями в графане по триггерам из zabbix? Не могу понять это баг или фича при использовании 1 триггера но в котором используется макрос item.value на графике всегда отображается последнее значение во всех аннотациях (разнесенных по времени).

Zhenia
20.03.2017
19:02:13

Magistr
20.03.2017
19:02:57

Zhenia
20.03.2017
19:03:19
честно говоря, не вижу смысла в таком мониторинге
максимум графики рисовать

Timur
20.03.2017
21:46:19
Какой же мать его удобный прометей

Hackru
20.03.2017
21:46:45
стадия 1 - восхищение

Timur
20.03.2017
21:46:58
Так и sql запросы недалеко разучиться писать

Google

Timur
20.03.2017
21:47:02
))

ptchol
21.03.2017
06:30:53

Timur
21.03.2017
06:49:22
Неа, не переходил, просто к текущему стенку (influx, logstash, grafana) добавил
Удобно
Конфиги алертов так вообще конфетка

Hackru
21.03.2017
06:55:53
кстати, посоветуйте как правильно посчитать использование памяти, формулу. а то я как-то накидал, но мне кажется я перемудрил.
ALERT MEMUsageCrit
IF (100 - (node_memory_MemTotal - (node_memory_MemTotal - node_memory_MemFree - node_memory_Cached))/node_memory_MemTotal*100) > 95
FOR 30s
LABELS { severity = "high" }
ANNOTATIONS {
summary = "Server memory is almost full",
description = "Host memory usage is {{ humanize $value }}%. Reported by instance {{ $labels.instance }} of job {{ $labels.job }}."
}
писал глубоко ночью и теперь не могу понять, что я считаю тут))
киньте кто-нибудь свою пасту на использование памяти плз

ptchol
21.03.2017
07:00:33
а что нельзя просто
((node_memory_MemFree + node_memory_Cached )/node_memory_MemTotal)*100 > 95

Hackru
21.03.2017
07:03:48
можно, я поэтому и просил помощи потому что вижу что я как-то странно считаю память, это в целом +- работало, поэтому не трогал
спасибо

bazuka_joe
21.03.2017
07:04:44
зачем считать кешированную память?

ptchol
21.03.2017
07:06:36
Лучше бы было не просто кеш а анрек кеш
Ну и наверно кешед и буфферед попутали

Hackru
21.03.2017
07:09:27
кешированная суммируется со свободной
а буфера это уже использованная

ptchol
21.03.2017
07:10:33
А ну да

Hackru
21.03.2017
07:10:37
т.е. моя изначальная идея была вычесть кеш и свободную из общей памяти

ptchol
21.03.2017
07:10:39
Все ок так то