@metrics_ru

Страница 555 из 681
Timur
07.06.2018
22:51:13
"пром" - в смысле в целом prometheus?

Алексей
07.06.2018
22:51:19
да.

механика прома в том что он должен знать что мониторит

Timur
07.06.2018
22:51:34
ок, а что есть взамен? :)

Google
Timur
07.06.2018
22:53:32
а если поднимать push gateway, то необходимо обеспечить уникальность ключей метрик для каждого инстанса, т.е. включать туда, например, их имена, да? Т.е. типа "job_some-unique-id_bitrate" ну и т.д.

эхма. Посоветуйте тогда плиз, в какую ещё сторону можно посмотреть

Алексей
07.06.2018
22:54:24
push плохой вариант и стоит его избегать. промовцы много об этом пишут

push мониторинг сейчас на основе графита делают

Timur
07.06.2018
22:54:55
push плохой вариант и стоит его избегать. промовцы много об этом пишут
а где пишут, если не секрет? Официальная документация не очень многословна, признаться

Алексей
07.06.2018
22:55:07
блог одного из авторов. самого вредного из них. но весьма соображающего

Timur
07.06.2018
22:56:27
push мониторинг сейчас на основе графита делают
а если надо не только push, но и pull, а push это всего лишь частный случай?

Алексей
07.06.2018
22:57:10
будет солянка чо :)

Алексей
07.06.2018
22:57:25
Andor
07.06.2018
22:57:31
ага

Timur
07.06.2018
22:57:35
плюс хотелось бы мониторить кое-какое железо по snmp, в общем, как-то систематизировать весь тот зоопарк, что у нас образовался за годы. Я понимаю, что серебряной пули нет и всё придётся допиливать, конкретно в prometheus подкупил язык запросов

Google
Timur
07.06.2018
22:57:45
будет солянка чо :)
да уже так и есть, эхма :)

Алексей
07.06.2018
22:58:07
да уже так и есть, эхма :)
солянка тут у многих.

Andor
07.06.2018
22:58:36
да у всех, я думаю

Алексей
07.06.2018
22:58:41
в описании канала есть всякие штуки которые могут быть полезны

Andor
07.06.2018
22:58:45
если не в мониторинге-метриках, то в другом месте

Алексей
07.06.2018
22:58:50
ну если инженерно подходить к вопросу

Timur
07.06.2018
22:58:54
да, я прочитал FAQ и вторую ссылку, угу

с этого и начал, собственно :)

нашёл статью про pushgateway, угу

"Instances may come and go but the old metrics for the expired instances will remain in the Pushgateway and thus Prometheus. In order to synchronize, one must remember to delete expired metrics from the Pushgateway using its API" а через API можно получить дату последнего push для метрики в instance?

Andor
07.06.2018
23:03:22
можно, но прометей её не будет учитывать

Timur
07.06.2018
23:03:58
да это прометею и не надо, по факту можно раз в неделю например запускать зачистку от старого хлама

костыль, конечно

Andor
07.06.2018
23:04:28
в пушгейтвее метрики спилятся по-умолчанию через 5 минут вроде бы

Timur
07.06.2018
23:07:35
вопрос номер 2: если в процессе перегенерации конфига у меня instance_name останется тем же, но поменяется адрес и/или порт, то привязка не слетит, правильно? Старые графики продолжатся и т.д.?

Andor
07.06.2018
23:08:12
ну можно сделать relabel чтобы метрики остались теми же

к сожалению об этом надо подумать заранее

Timur
07.06.2018
23:10:01
ладно, почитаю об этом, спасибо за наводку

Andor
07.06.2018
23:11:05
relabel переписывает метки метрик/таргетов по указанным правилам

например можно всегда отрезать порт от адреса инстанса

Google
Andor
07.06.2018
23:11:34
и тогда с точки зрения прометея это будет тот же инстанс

Timur
07.06.2018
23:15:41
у тебя могут быть определены правила, которые из некоторых данных делают другие данные, агрегируют например. И если ты хочешь их хранить дополнительно (а не вычислять каждый раз при обращении, что весьма ресурсоемко), то ты пишешь правило. Правила хранятся в rules-файлах. Параметр, тобою упомянутый, отвечает за то, как часто необходимо перечитывать файл и переприменять настройки.

Andor
07.06.2018
23:18:54
ты зря на русском читаешь

Timur
07.06.2018
23:20:01
я? Или задавший удалённый вопрос? :)

Oleg
08.06.2018
06:38:59
всем доброго. предыстория стоит исинга2 она опрашивает коммутаторы и упсы,есть 1 сервис по опросу упса внутри сервиса скрипт забрав данные по snmp от упса (температура\питание\ин-оут волтаж\ганрузка обрабатывает их параметры и если они в переделах нормы то просо отдает их исинге с параметром ОК если какойто параметр не гуд то либо Варниг либо КРИТ - но в любом слуае отдает исинге одной строкой - ну сервис же один (получается что 1 сервис мониторин несколько параметров)) в файле /var/spool/icinga2/perfdata строка выглядит как DATATYPE::SERVICEPERFDATA TIMET::1528439857 HOSTNAME::gel-servers-UPS3000RLM SERVICEDESC::ups_stats SERVICEPERFDATA::Temp=20;38;45;0 In_Line_Voltage=226;235;;195 Out_Line_Voltage=221;235;;185 Load=27;50;75;0 RunTime=;20;15;0 Diagnostic=0;15;30;0 Calibration=0;15;30;0 SERVICECHECKCOMMAND::check_common_ups HOSTSTATE::UP HOSTSTATETYPE::HARD SERVICESTATE::OK SERVICESTATETYPE::HARD мне из неё непонятно как данную строку скушает influxdb при стандартной настройке он не поймет данных ERVICEPERFDATA::Temp=20;38;45;0 In_Line_Voltage=226;235;;195 Out_Line_Voltage=221;235;;185 Load=27;50;75;0 RunTime=;20;15;0 Diagnostic=0;15;30;0 Calibration=0;15;30;0 лил примит их за одну метрику ? или както надо указывать что обрабатывать только первое значение ? Грубо говоря у меня потом графана будет строить графики

Wom
08.06.2018
06:54:38
кстати, стоит смотреть ? https://habr.com/post/412901/

Единорожа
08.06.2018
06:56:07
Флант всегда стоит)

Oleg
08.06.2018
07:01:04
скушал флукс нормально

check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Calibration,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Diagnostic,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=In_Line_Voltage,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Load,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Out_Line_Voltage,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Temp,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,service=ups_stats

Sergey
08.06.2018
07:10:16
надо его дописывать
телеграф вообще... хороший, у меня начинает возникать чувство что там пионерлагерь

M
08.06.2018
07:19:49
телеграф вообще... хороший, у меня начинает возникать чувство что там пионерлагерь
блин ни когда вот телеграфом и инфлюкс не пользовался, но о них столько плохого говорят, больше уже чем о Z, что даже интересно глянуть

Sergey
08.06.2018
07:24:23
Z в другом весе выступает :) ему 10+ лет и у него большое русскоязычное сообщество (+ начинающим). А телеграф и инфлюкс как бы модно молодежно и они должны на равных соперничать со всем что написали последние 3-5 лет... Вот по фичам вроде все хорошо, а по качеству кода (архитектуре) - очень хотелось бы лучше

Vadim
08.06.2018
07:26:26
У нас TICK продукты пока что показывают себя с лучшей стороны, нежели конкуренты

Andor
08.06.2018
07:29:06
кто это?

M
08.06.2018
07:29:51
У нас TICK продукты пока что показывают себя с лучшей стороны, нежели конкуренты
ну про инфлюкс вообще написано в FAQ этой группу. А про телеграф вот даже Сергей чуть выше не как о супер приложении отозвался

кто это?
influx / telegraf etc

У нас TICK продукты пока что показывают себя с лучшей стороны, нежели конкуренты
и что значит нежели конкуренты? это какие ещё конкуренты могли показать себя хуже

Vadim
08.06.2018
07:32:53
Прометеус над TSDB.

Google
Vadim
08.06.2018
07:34:23
промик с жирными выборками плоховато себя чувствовал

Andor
08.06.2018
07:35:01
в отличие от...?

Sergey
08.06.2018
07:42:52
T из этого стека я сейчас выбрал по причине что нужно вот прямо сейчас начать сбор метрик с Win машин, а у него достаточно простой конфиг, про I может напеть арию @freeseacher, когда выбирал стек мне хватило его "попаболей" чтобы не ставить над собой эксперименты. Ремарка: если у вас <10к метрик в секунду и количество уникальных метрик <1M - вам повезло и у вас практически все будет нормально работать (можно кстати в FAQ подобную фразу закинуть, если ее там нет :) )

Andor
08.06.2018
07:43:51
https://prometheus.io/docs/introduction/comparison/ а давно такая подробная страница со сравнением появилась?

ну то есть она не рассказывает например о том же графит-кх, но вцелом намного подробнее чем раньше стала

Bogdan (SirEdvin)
08.06.2018
08:10:09
Хм ... а подскажите, можно ли в проме сделать sum_over_time над delta? что-то в духе sum_over_time(delta(metric{})[3m])[3m])?

Andor
08.06.2018
08:10:47
нельзя

Admin
ERROR: S client not available

Andor
08.06.2018
08:11:01
рейндж можно только от сырой метрики взять

Bogdan (SirEdvin)
08.06.2018
08:11:17
Печально :(

Andor
08.06.2018
08:11:34
но ты можешь сделать агрегацию и брать от неё

Bogdan (SirEdvin)
08.06.2018
08:11:49
Через recording rules?

Andor
08.06.2018
08:13:57
ага

M
08.06.2018
08:31:02
Ребята а что по поводу prometheus high availability ? как сделать два прома с одной базой или както standby

Valentin
08.06.2018
08:32:54
а так делают?

Sergey
08.06.2018
08:41:15
по докладам делают много промов каждый со своей базой

Andor
08.06.2018
08:48:05
"с одной базой" не делают

делают дубли

Artem
08.06.2018
09:39:05
по докладам делают много промов каждый со своей базой
И все они снимают одни и те же метрики?

Andor
08.06.2018
09:39:33
Да

Google
Artem
08.06.2018
09:39:43
Не совсем прозрачно, графики надо переделывать

Andor
08.06.2018
09:40:10
В смысле?

Sergey
08.06.2018
09:40:12
доклады выше были, делают проксик и хочешь х2 делаешь х2 прома , хочешь шардирование - пилишь по шардам сбор

Artem
08.06.2018
09:40:20
В смысле?
В графане

Andor
08.06.2018
09:40:29
Что именно переделывать?

Sergey
08.06.2018
09:40:34
ну без доп обвязки это я так понимаю не работает

Artem
08.06.2018
09:40:38
Andor
08.06.2018
09:40:50
На какой?

Artem
08.06.2018
09:41:03
На тот, который не упал с того, который упал

Sergey
08.06.2018
09:41:08
нжинкс&&хапрокси или что то свое

Andor
08.06.2018
09:41:18
А просто прокси поставить?

Vasilii
08.06.2018
09:41:38
два прометеуса могут спокойно одни и теже метрики собирать с тех же хостов

Andor
08.06.2018
09:41:46
Ну и как бы в худшем случае можно датасорс обновить, а не графики менять

Vasilii
08.06.2018
09:42:40
прокси нужна только чтобы просмотр графиков переключать либо в точке между графаной и прометеусом либо перед графаной вообще

Andor
08.06.2018
09:44:08
Либо нагрузку на чтение разделить между прометеями например

Valentin
08.06.2018
09:50:52
прометей, прометей - скрапи метрики бодрей

Alexander
08.06.2018
10:33:16
По какой причине один и тот же запрос в Grafana в графиках отображается с разным опозданием?

Valentin
08.06.2018
10:37:09
с насколько разным?

Alexander
08.06.2018
10:49:46
с насколько разным?
в одном 3 сек, во втором 14. При этом если новый создаю, то уже 14.

Страница 555 из 681