@metrics_ru

Страница 551 из 681
Andor
06.06.2018
08:09:04
показывай что именно ты дёргаешь

конфиг выше - реальный?

Ivan
06.06.2018
08:09:14
http://10.1.29.30:6677/federate

да

Google
Andor
06.06.2018
08:09:31
params: 'match[]': - '{job="kubernetes-cadvisor"}' - '{job="kubernetes-service-endpoints"}'

вот это кто добавлять будет?

иди в прометее скопируй урл который он дёргает

на той же страничке

Ivan
06.06.2018
08:10:55
вот это кто добавлять будет?
https://gist.github.com/beatlejuse/c88ea88ddd053c96c66d9bd9884d6140

Ivan
06.06.2018
08:11:13
вот полный конфиг. там эти секции есть.

это как?

Andor
06.06.2018
08:11:30
открываешь в прометее страничку /targets

ищешь ту что проблемная

нажимаешь правой кнопочкой на мышке или тачпаде на поле Endpoint твоего проблемного таргета и выбираешь пункт "Копировать URL" или "Copy URL"

открываешь консоль

заходишь по ssh на сервер где стоит твой federation прометей

Google
Andor
06.06.2018
08:12:15
пишешь там curl (пробел обязателен)

(чорт, телеграм съедает пробел в конце ``)

потом нажимаешь правую кнопочку мышки или тачпада и выбираешь пункт "Вставить"

или "Paste"

точные названия пунктов меню могут отличаться, но алгоритм примерно такой

Ivan
06.06.2018
08:14:42
т.е. сделать curl http://10.1.29.30:6677/federate из пода с собирающим прометеем, так?

Ivan
06.06.2018
08:15:35
sh: curl: not found

Andor
06.06.2018
08:15:45
прекрасно

но я думаю ты меня уже троллируешь

если из моего объяснения тебе ещё что-то непонятно, то может позовёшь кого-нибудь более опытного помочь?

ирл

Ivan
06.06.2018
08:16:42


Andor
06.06.2018
08:17:48
подозреваю что контейнер очень специфичный, поэтому я упомянул не про контейнер, а про сервер

Ivan
06.06.2018
08:19:06
образ оригинальный - quay.io/prometheus/prometheus:v2.0.0

с самой ноды пробовал до этого



Andor
06.06.2018
08:19:31
да разберись уже сам

Ivan
06.06.2018
08:19:49
как уже сказал - отрабатывает меньше, чем за секунду

Google
Andor
06.06.2018
08:20:47
я вощем не знаю что в фразе "скопировать урл" непонятно

Ivan
06.06.2018
08:22:05
а, дошло )) там урл другой )) http://10.1.29.30:6677/federate?match%5B%5D=%7Bjob%3D%22kubernetes-cadvisor%22%7D&match%5B%5D=%7Bjob%3D%22kubernetes-service-endpoints%22%7D

Andor
06.06.2018
08:22:18
и время всё-таки лучше не на глазок мерять, а например командой time

Ivan
06.06.2018
08:22:29
ну он выдал мне большую простыню в консоль

Andor
06.06.2018
08:22:45
time curl ... >/dev/null

сколько секунд пишет?

Ivan
06.06.2018
08:24:26
real 0m33.111s user 0m0.034s sys 0m0.133s

Andor
06.06.2018
08:24:36
а таймаут у тебя?

Ivan
06.06.2018
08:27:06
14 ))

Andor
06.06.2018
08:27:19
ну вот видишь

и вариантов два: либо сам прометей тормозит на выдаче метрик

либо сеть

Ivan
06.06.2018
08:27:40
f fff ff,fff

Andor
06.06.2018
08:27:44
второе вряд ли, да?

посмотри вообще на производительность того прометея, может он сам просто тормозит

памяти там ему может добавить или процессоров

Oleg ?
06.06.2018
08:32:16
Ребят, привет. Кто может подсказать? у меня алертманагер постоянно наваливает time="2018-06-06T08:27:22Z" level=error msg="Error on notify: context deadline exceeded" source="notify.go:283" time="2018-06-06T08:27:22Z" level=error msg="Notify for 1 alerts failed: context deadline exceeded" source="dispatch.go:262"

можно как то получить более дебажную ошибку ?

Ivan
06.06.2018
08:36:16
блин, клинит телеграм, раскладка меняется с десятого раза ((

да, сеть вряд ли - они в плоской сети

Google
Ivan
06.06.2018
08:36:45
а вот по процу у него скорее всего есть лимит

и вариантов два: либо сам прометей тормозит на выдаче метрик
а есть какой нибудь ориентир? какого показателья можно добиться? потому что метрик там немного - только основные по железу. не очень понятно, почему он их 30 секунд качает

Ivan
06.06.2018
08:46:03
это какая?

Andor
06.06.2018
08:47:51
ну например такая https://grafana.com/dashboards/3662

Pablo
06.06.2018
09:22:16
Evgeny
06.06.2018
09:25:56
Ты можешь из этого реальные тестовые данные восстановить?

Pablo
06.06.2018
09:35:35
Ты можешь из этого реальные тестовые данные восстановить?
нет конечно, я наобот с тобой согласен - нет данных = не повторить = как верить? плюс схема с бигинтом и наносек таймстампами кажется для сетапа нечестной = это "обычный" вендорский "бенчмарк"

Admin
ERROR: S client not available

Pablo
06.06.2018
09:37:30
this > hosts report 10 CPU metrics every 10 seconds and also > timestamp_ns bigint seems legit.
Более того, там в row key кладется еще и день, т.е. вообще можно было small int'ом обойтись под таймстамп

Evgeny
06.06.2018
09:40:33
Я не не то чтобы сомневаюсь в результатах. Может все так и было. Просто без данных не сравнить с чем-то ещё.

Pablo
06.06.2018
09:41:35
да я тоже не говорю что они врут в результатах просто. это я не знаю. но сетап не достаточно убедительный чтобы их честным результатам верить как показателю что ts быстрее с*

Нагиев
06.06.2018
09:42:14
Verbiage

Evgeny
06.06.2018
09:42:46
Мне было бы интересно проверить, сможет ли она малоизвестная tsdb забороть их сетап, работая на t2.micro инстансе.

Но увы :(

M
06.06.2018
09:49:44
ребят подскажите а как прометеус может получать список сервисов по http или каким образом можно динамически его получать с уже готового сервиса

Evgeny
06.06.2018
09:52:34
"одна малоизвестная tsdb" - лойс =)
Самое обидное, что если таки сможет забороть, в это никто не поверит. Слишком неправдоподобно.

Ivan
06.06.2018
09:56:33
ну например такая https://grafana.com/dashboards/3662
спасибо тебе большое за помощь! и за терпение ))

Google
Ivan
06.06.2018
09:56:52
да, был лимит на cpu 200m

поставил 300 - теперь запрос выполняется за 7сек

Andor
06.06.2018
09:57:53
ну 200m это как-то совсем жёстко

Vasyl
06.06.2018
10:05:24
господа, а это нормально, что в графане (4), при изменении timerange за который отображать график, первая точка будет показывать 0, даже если там есть данные?

Andor
06.06.2018
10:07:24
4?

Vasyl
06.06.2018
10:08:56
да, в 4

нашел. Stacking & Null value > Null value

Alex
06.06.2018
12:22:42
Здравствуйте! Вопрос следующий, есть 2 графика. графана





Как объединить их в один, толбец - хост - у него 4 диска - их выводить в одном столбце

В идеале получить следующее



Дмитрий
06.06.2018
12:32:21
Кто-нибудь в telegraf настраивал мониториг софтового или железного рэйда?

и на чём лучше алертин делать?

M
06.06.2018
12:39:55
Ребят а не подскажите remote_read я ведь могу забрать конфиг url которые надо проверять ? какой формат нужно забирать ?

Дмитрий
06.06.2018
12:40:25
Что-то тут не подсказывают(

Matvey
06.06.2018
12:40:25
кислота

Алексей
06.06.2018
12:41:22
кислота
и щелочь. и вообще хим лабу напоминает.

Alex
06.06.2018
12:42:23
не я делал, ни я девопс и вообще я ни в чем не виноват) Посоветуйте, скажите про какашки, передам)

Страница 551 из 681