@metrics_ru

Страница 124 из 681
ptchol
19.03.2017
10:15:47
там штук 6-7 и все полезные

Александр
19.03.2017
10:16:25
там штук 6-7 и все полезные
Ага, а если серверов 20 или ядер больше 20, то график превращается в дичь

ptchol
19.03.2017
10:17:02
хм

а ты что делаешь кумулятивный график но не складываешь там серии ?

Google
Старый
19.03.2017
10:17:27
Ага, а если серверов 20 или ядер больше 20, то график превращается в дичь
"серверов" 130, в среднем по 8-16 потоков, гробов по 4 сокета 12, эльбурсы, где то спарк

Алексей
19.03.2017
10:22:34
в Косарях каких то
ок. cpu usage в косарях.

lastsky
19.03.2017
10:23:01
Старый, я тебе вчера прислал готовую формулу же

что здесь опять началось )))

Алексей
19.03.2017
10:23:10
Старый, начни с того что поймешь в чем измеряется тот или иной параметр.

lastsky
19.03.2017
10:23:20
100 - (avg by (instance) (irate(node_cpu{job='node',mode='idle',instance='server02:9100'}[5m])) * 100)

lastsky
19.03.2017
10:24:14
чем обоснован irate ?
у нас rate не покажет всплески

irate should only be used when graphing volatile, fast-moving counters.

https://www.robustperception.io/understanding-machine-cpu-usage/

рекомендации ведущих собаководов.

Mikhail
20.03.2017
08:14:27
слушайте, а как более адекватно измерять задержку прокси по отношению к бэкенду? по абсолютному времени ( ответ прокси - ответ бэкенда ) или по относительной величине( (ответ прокси - ответ бэкенда)) / ответ бэкенда?

ну например, занимаюсь кастомизацией Nginx с целью уменьшения задержки, измерил до/после, абсолютное время увеличилось, относительная доля уменьшилась, вот и гадаю, хуже я сделал или лучше)

Google
Sergey
20.03.2017
08:16:55
непонятно, зачем вообще вводить метрику "относительная задержка". скорость работы прокси не зависит от скорости работы бэкенда. если бэкенд тормозит - то относительная задержка у вас уменьшится, но это ничего не будет значить. прокси лучше не станет работать.

Mikhail
20.03.2017
08:19:35
так, про вопрос между относительной и абсолютной задержкой понял, спасибо

да проблема в том, что вообще не замечаешь корреляции между переконфигурацией и временем ответа) даже по 95 процентили временами всплески на графике видно

слишком мало запросов? недостоверные данные?

Mikhail
20.03.2017
08:35:33
А какой у вас p-value для наблюдения "время увеличилось, доля уменьшилась"?
Не знаю, что такое p-value, пошел гуглить, нашел научную статью, прочитал определение, все равно не понял. Это что-то вроде предельного значения, выше которого запускается по триггеру алерт?

Pablo
20.03.2017
08:37:36
Это вероятность что вы себе просто выдумали что время увеличилось

Mikhail
20.03.2017
08:55:06
Получается, гораздо благоразумней будет высчитывать p-value по фиксированному значению задержки, чем измерять абсолютные значения?

User ?
20.03.2017
09:09:43
Привет, кто-нибудь в курсе, можно ли в графане взять n метрик, их сумму засчитать за 100% и нарисовать график в процентом соотношении, сколько какая метрика занимает

ptchol
20.03.2017
09:16:56
ну и Draw Modes сделать Bars для красоты

или оставить lines но сделать staircase + залить

User ?
20.03.2017
09:18:49


А я понял почему у меня так не получалось.

Если выставлять маленький промежуток времени (1h) то получаются страшные картинки



Google
ptchol
20.03.2017
09:23:13
там бывают особенности если нулы какие то или ещё че нить такое

ну да, данных не хватает.

там попробовать поставить null as zero

Null Value - Null as Zero

User ?
20.03.2017
09:24:53
поставил, не помогает. У меня эта метрика собирается раз в ~5 минут. Видимо 12 значений на час - слишком мало

ptchol
20.03.2017
09:25:12
не не не. должно быть ок.

странно что не помогает

User ?
20.03.2017
09:26:29
Бекендом используется заббикс, если это имеет значение

User ?
20.03.2017
09:27:31
лови какаху )
Ну я не могу рраз и перепрыгнуть на пром. Оно постепенно идет

ptchol
20.03.2017
09:27:43
Врядли это должно влиять

Alexander
20.03.2017
10:37:20
О, я догнал чатек! Слава понедельнику. @ptchol крутая тема с cmd+o в графне, но что то не работает нифига. Жму на дашборде. а оно мне графики рефрешит (свежие графана и хром)

Alexander
20.03.2017
10:38:37
есть идеи почему так может быть?

Еще вопрос знатокам прометеуса и графаны – я еще не разбирался в чем может быть дело. Вобщем пока спрошу тут. Есть такой бесючий баг – когда открывешь из графика запрос в прометее (там есть кнопочка), живущем на подурле (/prom), то графана открывает формулу адрес /prom/graph с формулой в куери стринге его в одном формате кодирования, после чего прометей редиректит в другом формате на /graph, игнорируя префикс /prom. В результате – 404. (Если руками добавить в получившийся урл /prom префикс, то ок - всё работает) У кого-нибудь такое было?

ptchol
20.03.2017
10:47:16


нажми туда и посмотри что как

Alexander
20.03.2017
10:51:36
вопросик я уже нажимал



ptchol
20.03.2017
10:53:42
ну не знаю ! всё в этих ваших линуксах не по человечески ! )

Alexander
20.03.2017
10:54:24
у меня мак. это ваши опенсорсы работают хз как!

Google
Alexander
20.03.2017
10:55:09
самое фиговое когда фронтенд не работает, потому что это не починить

надо лезть в мир нодежса и прочих ангуляров, которые не хочется касаться 5 футовой палкой

ptchol
20.03.2017
11:03:39
открой консольку JS

может там чтопишется в браузере

Vladimir
20.03.2017
11:06:16
у меня мак. это ваши опенсорсы работают хз как!
у меня на маке все отлично пашет из шорткатов

Alexander
20.03.2017
11:06:33
grafan 4.1.2 ?

Vladimir
20.03.2017
11:06:42
да

Zhenia
20.03.2017
11:09:39
у меня в хроме не работают, а в огнелисе норм

Admin
ERROR: S client not available

Alexander
20.03.2017
11:16:51
итс э мейджик!

Magistr
20.03.2017
18:53:24
чатик а что ты делаешь если настроены алерты в графане, а она алертит когда тормозит ?

Evgeny
20.03.2017
18:56:01
Кто-нибудь пользуется аннотациями в графане по триггерам из zabbix? Не могу понять это баг или фича при использовании 1 триггера но в котором используется макрос item.value на графике всегда отображается последнее значение во всех аннотациях (разнесенных по времени).

Zhenia
20.03.2017
19:02:13
чатик а что ты делаешь если настроены алерты в графане, а она алертит когда тормозит ?
брать avg по 5 минутам скажем, но так ты флапы и мелкие проблемы не получишь

Zhenia
20.03.2017
19:03:19
честно говоря, не вижу смысла в таком мониторинге

максимум графики рисовать

Timur
20.03.2017
21:46:19
Какой же мать его удобный прометей

Hackru
20.03.2017
21:46:45
стадия 1 - восхищение

Timur
20.03.2017
21:46:58
Так и sql запросы недалеко разучиться писать

Google
Timur
20.03.2017
21:47:02
))

ptchol
21.03.2017
06:30:53
Какой же мать его удобный прометей
это вы после заббикса ? или после мунина ? )

Timur
21.03.2017
06:49:22
Неа, не переходил, просто к текущему стенку (influx, logstash, grafana) добавил

Удобно

Конфиги алертов так вообще конфетка

Hackru
21.03.2017
06:55:53
Конфиги алертов так вообще конфетка
у заказчика когда увидел конфиги алёртов глаза чуть не лопнули

кстати, посоветуйте как правильно посчитать использование памяти, формулу. а то я как-то накидал, но мне кажется я перемудрил.

ALERT MEMUsageCrit IF (100 - (node_memory_MemTotal - (node_memory_MemTotal - node_memory_MemFree - node_memory_Cached))/node_memory_MemTotal*100) > 95 FOR 30s LABELS { severity = "high" } ANNOTATIONS { summary = "Server memory is almost full", description = "Host memory usage is {{ humanize $value }}%. Reported by instance {{ $labels.instance }} of job {{ $labels.job }}." }

писал глубоко ночью и теперь не могу понять, что я считаю тут))

киньте кто-нибудь свою пасту на использование памяти плз

ptchol
21.03.2017
07:00:33
а что нельзя просто ((node_memory_MemFree + node_memory_Cached )/node_memory_MemTotal)*100 > 95

Hackru
21.03.2017
07:03:48
можно, я поэтому и просил помощи потому что вижу что я как-то странно считаю память, это в целом +- работало, поэтому не трогал

спасибо

bazuka_joe
21.03.2017
07:04:44
зачем считать кешированную память?

ptchol
21.03.2017
07:06:36
Лучше бы было не просто кеш а анрек кеш

Ну и наверно кешед и буфферед попутали

Hackru
21.03.2017
07:09:27
кешированная суммируется со свободной

а буфера это уже использованная

ptchol
21.03.2017
07:10:33
А ну да

Hackru
21.03.2017
07:10:37
т.е. моя изначальная идея была вычесть кеш и свободную из общей памяти

ptchol
21.03.2017
07:10:39
Все ок так то

Страница 124 из 681