@metrics_ru

« Назад

Страница 555 из 681

Далее »

Timur

07.06.2018
22:51:13

"пром" - в смысле в целом prometheus?

Алексей

07.06.2018
22:51:19

да.

механика прома в том что он должен знать что мониторит

Timur

07.06.2018
22:51:34

ок, а что есть взамен? :)

Google

Timur

07.06.2018
22:53:32

а если поднимать push gateway, то необходимо обеспечить уникальность ключей метрик для каждого инстанса, т.е. включать туда, например, их имена, да? Т.е. типа "job_some-unique-id_bitrate" ну и т.д.

эхма. Посоветуйте тогда плиз, в какую ещё сторону можно посмотреть

Алексей

07.06.2018
22:54:24

push плохой вариант и стоит его избегать. промовцы много об этом пишут

push мониторинг сейчас на основе графита делают

Timur

07.06.2018
22:54:55

push плохой вариант и стоит его избегать. промовцы много об этом пишут

а где пишут, если не секрет? Официальная документация не очень многословна, признаться

Алексей

07.06.2018
22:55:07

а где пишут, если не секрет? Официальная документация не очень многословна, признаться

http://robustperception.io/

блог одного из авторов. самого вредного из них. но весьма соображающего

Timur

07.06.2018
22:56:27

push мониторинг сейчас на основе графита делают

а если надо не только push, но и pull, а push это всего лишь частный случай?

Алексей

07.06.2018
22:57:10

будет солянка чо :)

Andor

07.06.2018
22:57:16

блог одного из авторов. самого вредного из них. но весьма соображающего

он совсем не дурак, но бесит %)

Алексей

07.06.2018
22:57:25

он совсем не дурак, но бесит %)

вааще. даже авой.

Andor

07.06.2018
22:57:31

ага

Timur

07.06.2018
22:57:35

плюс хотелось бы мониторить кое-какое железо по snmp, в общем, как-то систематизировать весь тот зоопарк, что у нас образовался за годы. Я понимаю, что серебряной пули нет и всё придётся допиливать, конкретно в prometheus подкупил язык запросов

Google

Timur

07.06.2018
22:57:45

будет солянка чо :)

да уже так и есть, эхма :)

Алексей

07.06.2018
22:58:07

да уже так и есть, эхма :)

солянка тут у многих.

Andor

07.06.2018
22:58:36

да у всех, я думаю

Алексей

07.06.2018
22:58:41

в описании канала есть всякие штуки которые могут быть полезны

Andor

07.06.2018
22:58:45

если не в мониторинге-метриках, то в другом месте

Алексей

07.06.2018
22:58:50

ну если инженерно подходить к вопросу

Timur

07.06.2018
22:58:54

да, я прочитал FAQ и вторую ссылку, угу

с этого и начал, собственно :)

нашёл статью про pushgateway, угу

"Instances may come and go but the old metrics for the expired instances will remain in the Pushgateway and thus Prometheus. In order to synchronize, one must remember to delete expired metrics from the Pushgateway using its API" а через API можно получить дату последнего push для метрики в instance?

Andor

07.06.2018
23:03:22

можно, но прометей её не будет учитывать

Timur

07.06.2018
23:03:58

да это прометею и не надо, по факту можно раз в неделю например запускать зачистку от старого хлама

костыль, конечно

Andor

07.06.2018
23:04:28

в пушгейтвее метрики спилятся по-умолчанию через 5 минут вроде бы

Timur

07.06.2018
23:07:35

вопрос номер 2: если в процессе перегенерации конфига у меня instance_name останется тем же, но поменяется адрес и/или порт, то привязка не слетит, правильно? Старые графики продолжатся и т.д.?

Andor

07.06.2018
23:08:12

ну можно сделать relabel чтобы метрики остались теми же

к сожалению об этом надо подумать заранее

Timur

07.06.2018
23:10:01

ладно, почитаю об этом, спасибо за наводку

Andor

07.06.2018
23:11:05

relabel переписывает метки метрик/таргетов по указанным правилам

например можно всегда отрезать порт от адреса инстанса

Google

Andor

07.06.2018
23:11:34

и тогда с точки зрения прометея это будет тот же инстанс

Timur

07.06.2018
23:15:41

у тебя могут быть определены правила, которые из некоторых данных делают другие данные, агрегируют например. И если ты хочешь их хранить дополнительно (а не вычислять каждый раз при обращении, что весьма ресурсоемко), то ты пишешь правило. Правила хранятся в rules-файлах. Параметр, тобою упомянутый, отвечает за то, как часто необходимо перечитывать файл и переприменять настройки.

Andor

07.06.2018
23:18:54

ты зря на русском читаешь

Timur

07.06.2018
23:20:01

я? Или задавший удалённый вопрос? :)

Oleg

08.06.2018
06:38:59

подскажи а как поняь метрику с одной точкой ? у меня исинга опрашивает сервис,в сервисе перфдата /var/spool/icinga2/perfdara/serv* там при опросе сервиса получаю DATATYPE::SERVICEPERFDATA TIMET::1528401157 HOSTNAME::gel-servers-UPS3000RLM SERVICEDESC::ups_stats SERVICEPERFDATA::Temp=20;38;45;0 In_Line_Voltage=232;235;;195 Out_Line_Voltage=221;235;;185 Load=27;50;75;0 RunTime=;20;15;0 Diagnostic=0;15;30;0 Calibration=0;15;30;0 SERVICECHECKCOMMAND::check_common_ups HOSTSTATE::UP HOSTSTATETYPE::HARD SERVICESTATE::OK SERVICESTATETYPE::HARD я так понимаю что это одна точка ? если этиданные я буду передавать в флухдб то мне камежтся что эти данные по номальному не лягут (по умолчанию) - по умоолчанию ляжет как 1 метика (или я не прав?)?

как голова ? отошел ?

всем доброго. предыстория стоит исинга2 она опрашивает коммутаторы и упсы,есть 1 сервис по опросу упса внутри сервиса скрипт забрав данные по snmp от упса (температура\питание\ин-оут волтаж\ганрузка обрабатывает их параметры и если они в переделах нормы то просо отдает их исинге с параметром ОК если какойто параметр не гуд то либо Варниг либо КРИТ - но в любом слуае отдает исинге одной строкой - ну сервис же один (получается что 1 сервис мониторин несколько параметров)) в файле /var/spool/icinga2/perfdata строка выглядит как DATATYPE::SERVICEPERFDATA TIMET::1528439857 HOSTNAME::gel-servers-UPS3000RLM SERVICEDESC::ups_stats SERVICEPERFDATA::Temp=20;38;45;0 In_Line_Voltage=226;235;;195 Out_Line_Voltage=221;235;;185 Load=27;50;75;0 RunTime=;20;15;0 Diagnostic=0;15;30;0 Calibration=0;15;30;0 SERVICECHECKCOMMAND::check_common_ups HOSTSTATE::UP HOSTSTATETYPE::HARD SERVICESTATE::OK SERVICESTATETYPE::HARD мне из неё непонятно как данную строку скушает influxdb при стандартной настройке он не поймет данных ERVICEPERFDATA::Temp=20;38;45;0 In_Line_Voltage=226;235;;195 Out_Line_Voltage=221;235;;185 Load=27;50;75;0 RunTime=;20;15;0 Diagnostic=0;15;30;0 Calibration=0;15;30;0 лил примит их за одну метрику ? или както надо указывать что обрабатывать только первое значение ? Грубо говоря у меня потом графана будет строить графики

Wom

08.06.2018
06:54:38

кстати, стоит смотреть ? https://habr.com/post/412901/

Единорожа

08.06.2018
06:56:07

Флант всегда стоит)

Oleg

08.06.2018
07:01:04

скушал флукс нормально

check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Calibration,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Diagnostic,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=In_Line_Voltage,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Load,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Out_Line_Voltage,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,metric=Temp,service=ups_stats check_common_ups,hostname=gel-servers-UPS3000RLM,service=ups_stats

Sergey

08.06.2018
07:10:16

надо его дописывать

телеграф вообще... хороший, у меня начинает возникать чувство что там пионерлагерь

M

08.06.2018
07:19:49

телеграф вообще... хороший, у меня начинает возникать чувство что там пионерлагерь

блин ни когда вот телеграфом и инфлюкс не пользовался, но о них столько плохого говорят, больше уже чем о Z, что даже интересно глянуть

Sergey

08.06.2018
07:24:23

Z в другом весе выступает :) ему 10+ лет и у него большое русскоязычное сообщество (+ начинающим). А телеграф и инфлюкс как бы модно молодежно и они должны на равных соперничать со всем что написали последние 3-5 лет... Вот по фичам вроде все хорошо, а по качеству кода (архитектуре) - очень хотелось бы лучше

Vadim

08.06.2018
07:26:26

блин ни когда вот телеграфом и инфлюкс не пользовался, но о них столько плохого говорят, больше уже чем о Z, что даже интересно глянуть

А где это плохое почитать?

У нас TICK продукты пока что показывают себя с лучшей стороны, нежели конкуренты

Andor

08.06.2018
07:29:06

кто это?

M

08.06.2018
07:29:51

У нас TICK продукты пока что показывают себя с лучшей стороны, нежели конкуренты

ну про инфлюкс вообще написано в FAQ этой группу. А про телеграф вот даже Сергей чуть выше не как о супер приложении отозвался

кто это?

influx / telegraf etc

У нас TICK продукты пока что показывают себя с лучшей стороны, нежели конкуренты

и что значит нежели конкуренты? это какие ещё конкуренты могли показать себя хуже

Vadim

08.06.2018
07:32:53

Прометеус над TSDB.

Google

Vadim

08.06.2018
07:34:23

промик с жирными выборками плоховато себя чувствовал

Andor

08.06.2018
07:35:01

в отличие от...?

Sergey

08.06.2018
07:42:52

T из этого стека я сейчас выбрал по причине что нужно вот прямо сейчас начать сбор метрик с Win машин, а у него достаточно простой конфиг, про I может напеть арию @freeseacher, когда выбирал стек мне хватило его "попаболей" чтобы не ставить над собой эксперименты. Ремарка: если у вас <10к метрик в секунду и количество уникальных метрик <1M - вам повезло и у вас практически все будет нормально работать (можно кстати в FAQ подобную фразу закинуть, если ее там нет :) )

Andor

08.06.2018
07:43:51

https://prometheus.io/docs/introduction/comparison/ а давно такая подробная страница со сравнением появилась?

ну то есть она не рассказывает например о том же графит-кх, но вцелом намного подробнее чем раньше стала

Bogdan (SirEdvin)

08.06.2018
08:10:09

Хм ... а подскажите, можно ли в проме сделать sum_over_time над delta? что-то в духе sum_over_time(delta(metric{})[3m])[3m])?

Andor

08.06.2018
08:10:47

нельзя

Admin

ERROR: S client not available

Andor

08.06.2018
08:11:01

рейндж можно только от сырой метрики взять

Bogdan (SirEdvin)

08.06.2018
08:11:17

Печально :(

Andor

08.06.2018
08:11:34

но ты можешь сделать агрегацию и брать от неё

Bogdan (SirEdvin)

08.06.2018
08:11:49

Через recording rules?

Andor

08.06.2018
08:13:57

ага

M

08.06.2018
08:31:02

Ребята а что по поводу prometheus high availability ? как сделать два прома с одной базой или както standby

Valentin

08.06.2018
08:32:54

а так делают?

Sergey

08.06.2018
08:41:15

по докладам делают много промов каждый со своей базой

Andor

08.06.2018
08:48:05

"с одной базой" не делают

делают дубли

Artem

08.06.2018
09:39:05

по докладам делают много промов каждый со своей базой

И все они снимают одни и те же метрики?

Andor

08.06.2018
09:39:33

Да

Google

Artem

08.06.2018
09:39:43

Не совсем прозрачно, графики надо переделывать

Andor

08.06.2018
09:40:10

В смысле?

Sergey

08.06.2018
09:40:12

доклады выше были, делают проксик и хочешь х2 делаешь х2 прома , хочешь шардирование - пилишь по шардам сбор

Artem

08.06.2018
09:40:20

В смысле?

В графане

Andor

08.06.2018
09:40:29

Что именно переделывать?

Sergey

08.06.2018
09:40:34

ну без доп обвязки это я так понимаю не работает

Artem

08.06.2018
09:40:38

Что именно переделывать?

Сурс же

Andor

08.06.2018
09:40:50

На какой?

Artem

08.06.2018
09:41:03

На тот, который не упал с того, который упал

Sergey

08.06.2018
09:41:08

нжинкс&&хапрокси или что то свое

Andor

08.06.2018
09:41:18

А просто прокси поставить?

Vasilii

08.06.2018
09:41:38

два прометеуса могут спокойно одни и теже метрики собирать с тех же хостов

Andor

08.06.2018
09:41:46

Ну и как бы в худшем случае можно датасорс обновить, а не графики менять

Vasilii

08.06.2018
09:42:40

прокси нужна только чтобы просмотр графиков переключать либо в точке между графаной и прометеусом либо перед графаной вообще

Andor

08.06.2018
09:44:08

Либо нагрузку на чтение разделить между прометеями например

Valentin

08.06.2018
09:50:52

прометей, прометей - скрапи метрики бодрей

Alexander

08.06.2018
10:33:16

По какой причине один и тот же запрос в Grafana в графиках отображается с разным опозданием?

Valentin

08.06.2018
10:37:09

с насколько разным?

Alexander

08.06.2018
10:49:46

с насколько разным?

в одном 3 сек, во втором 14. При этом если новый создаю, то уже 14.

« Назад

Страница 555 из 681

Далее »

Открыть в Telegram