@metrics_ru

Страница 593 из 681
Nklya
19.07.2018
10:33:02
Это же блин не З У каждого экспортера есть http endpoint. Идешь туда и смотришь что за метрики он отдает

Старый
19.07.2018
10:36:47
да, вижу, но почему то в prometheus не попало, лан буду смотреть что опять в когфиге накосячил....

Andor
19.07.2018
10:37:12
в таргетах в прометее есть?

Старый
19.07.2018
10:41:19
Google
Старый
19.07.2018
10:41:21
да

и порт указан нужный

Andor
19.07.2018
10:41:59
и зелёные таргеты?

Старый
19.07.2018
10:43:04
так я подумал ты про конфиг

всё вижу

спасибо, забыл про это

и зелёные таргеты?
красные, причём неясно почему,

ибо по http сейчас всё проверил пашет

ровно скопировав адрес из конфига, прикольно

Andor
19.07.2018
11:01:52
он же пишет причину

Bsod
19.07.2018
11:02:20
ибо по http сейчас всё проверил пашет
А пашет от тебя или от прометеуса?

Старый
19.07.2018
11:02:43
А пашет от тебя или от прометеуса?
от меня, но я значительно дальше от него

чем рядом ноды

Google
Bsod
19.07.2018
11:03:03
Так ты проверь с сервера прометеуса, мож закрыл каким фаерволлом

Старый
19.07.2018
11:03:05
хотя там хецнер

invalid URL port 9100

8080

блин доступа ещё к хостам не имею

Andor
19.07.2018
11:05:27
ну вот тебе и ответ

иди и проверяй настройки

Денис
19.07.2018
11:06:10
современный мир - все думают что нигде нет фаера и все сети плоские =)

Andor
19.07.2018
11:07:33
ну в данном случае вряд ли в фаерволе проблема

судя по тексту ошибки

Денис
19.07.2018
11:19:46
Как будто это что-то плохое
это не плохо, просто это не всегда верно.

Andor
19.07.2018
11:20:13
я бы даже сказал что обычно это неверно

просто не видно

https://blog.timescale.com/sql-nosql-data-storage-for-prometheus-devops-monitoring-postgresql-timescaledb-time-series-3cde27fd1e07 уже обсуждали?

Bogdan (SirEdvin)
19.07.2018
12:28:34
Из занудного, SELECT labels->>'cpu', MAX(value) FROM metrics WHERE name='node_cpu_frequency_hertz' AND time > NOW() - interval '5 min' GROUP BY labels->>'cpu'; Разве это sql?

Deep Sea
19.07.2018
12:30:08
почему нет?

Sergey
19.07.2018
12:32:32
Постгрес сам по себе хорош (на мой взгляд), а если его реально дополнили чем-то правильным для работы с time series-данными - ляпота получится.

Andor
19.07.2018
12:33:31
ага

Google
Bogdan (SirEdvin)
19.07.2018
12:33:40
Dorian
19.07.2018
12:33:50
Andor
19.07.2018
12:33:57
таймскейлы говорят что у них ещё шардинги всякие и т.п

КликХаус мне кажется эффективнее этого стека
а его уже можно с прометеем дружить в обе стороны?

Dorian
19.07.2018
12:35:15
А нужно?

Andor
19.07.2018
12:35:43
тот же вопрос про кликхаус

Dorian
19.07.2018
12:36:00
Пром в первую очередь алармы

Andor
19.07.2018
12:36:14
это лично у тебя?

Dorian
19.07.2018
12:36:27
Лично у меня

Andor
19.07.2018
12:36:27
пром собирает метрики и имеет довольно удобный язык запросов

Dorian
19.07.2018
12:36:49
Ну аналитику годовую с ним не сделаешь

Запросы крутые - да

Dorian
19.07.2018
12:37:09
Но аналитика лучше в КХ

Andor
19.07.2018
12:37:10
а кто про аналитику говорил?

при чём тут аналитика?

Denys ??
19.07.2018
12:37:30
таймскейлы говорят что у них ещё шардинги всякие и т.п
Ну у них кластера нормального нет пока. Как и КХ, в принципе :trollface:

Andor
19.07.2018
12:37:31
хочу рисовать графики

за много лет

Ну у них кластера нормального нет пока. Как и КХ, в принципе :trollface:
я не пользовался ни тем ни тем но они вроде заявляют что есть

или я неправильно прочитал?

Google
Denys ??
19.07.2018
12:38:24
https://blog.timescale.com/time-series-data-cassandra-vs-timescaledb-postgresql-7c2cc50a89ce

"Moreover, as we’ll see, the write performance a single TimescaleDB instance provides for time-series data is quite often more than sufficient for a production workload — and that’s without some of the traditional NoSQL drawbacks that come with Cassandra."

Скейлить TSDB по записи "нинужна, и так все быстра"

Andor
19.07.2018
12:39:33
а, то что пишется только в одну ноду?

Denys ??
19.07.2018
12:39:46
ну да

Andor
19.07.2018
12:39:56
ну это так себе конечно

с другой стороны если туда можно писать столько сколько в прометей, то и ок

ну то есть в remote_write его если вписать, будет ли тащить

Admin
ERROR: S client not available

Dorian
19.07.2018
12:43:43
Andor
19.07.2018
12:44:06
угу

и желательно чтобы оно в обе стороны с прометеем было через remote_write/remote_read

чтобы не менять запросы

Старый
19.07.2018
12:53:59
target_groups: - targets: ['10.0.0.200:3002'] labels: group: 'development' по быстрому в доки не отрыл, подскажите, как правильно, писать в джобе несколько таргет групп или же 1 таргет групп, а потом просто таргет, лабл, название группы? prometheus

Andor
19.07.2018
12:54:24
что такое таргет групп?

Старый
19.07.2018
12:56:34
ile-based service discovery provides a more generic way to configure static targets and serves as an interface to plug in custom service discovery mechanisms. It reads a set of files containing a list of zero or more <static_config>s. Changes to all defined files are detected via disk watches and applied immediately. Files may be provided in YAML or JSON format. Only changes resulting in well-formed target groups are applied. The JSON file must contain a list of static configs, using this format:

типа позволяет делить хосты в джобе на группы

например прод стейбл дев тест

Andor
19.07.2018
12:57:27
а что такое target_groups?

Старый
19.07.2018
12:58:32
# Panamax - job_name: 'panamax' scrape_interval: 5s # Override the global default and scrape targets from this job every 5 seconds. scrape_interval: 5s scrape_timeout: 10s target_groups: - targets: ['10.0.0.200:3002'] labels: group: 'development' вот несколько примеров таких нашёл

Google
Andor
19.07.2018
12:59:17
это же static_configs

ты бы лучше сказал откуда ты это нашёл

Старый
19.07.2018
13:00:28
то есть нельзя в рамках 1 джобы поделить на группы?

Andor
19.07.2018
13:00:49
можно

но называется это по-другому

Старый
19.07.2018
13:03:04
но называется это по-другому
можно плиз название, а то я не хочу в таргете чтот 100 адресов иметь

Dorian
19.07.2018
13:07:57
можно плиз название, а то я не хочу в таргете чтот 100 адресов иметь
static_configs: - targets: - facebook.com:127.0.0.1 - imdb.com:127.0.0.1 - google.com:127.0.0.1 relabel_configs: - source_labels: [__address__] target_label: __param_target - source_labels: [__param_target] target_label: instance - source_labels: [__param_target] regex: '(.*):.*$' replacement: '$1' target_label: 'domain' - source_labels: [__param_target] regex: '.*:(.*)$' replacement: '$1' target_label: 'instance' - source_labels: [__param_target]

Ты этого хочешь?

key:value

Andor
19.07.2018
13:09:31
классный костыль

Старый
19.07.2018
13:10:12
Ты этого хочешь?
почему всё так усложняют то... хочешь тупо поделить хосты в джобе на 6-8 групп, чтобы решать проблемы было удобнее и конфиг читать, а тебе сразу регулярнки писать предлагают

Andor
19.07.2018
13:10:30
бери и дели

но лучше всё равно не static_configs, а file_sd_configs

во внешнем файле держать

Денис
19.07.2018
13:11:30
есть вопрос. храню метрики в clickhouse с помощью graphite-clickhouse и carbon-clickhouse, настройки retention такие https://pastebin.com/eXxNnzL6 некоторые метрики собираются с частотой 30сек, а некоторые 60, в итоге при построении графика в графане с минутными метриками получается что точки есть, а графика нет. может что-то в настройках retention надо исправить? или обязательно, чтобы все метрики собирались с одинаковой частотой ?

Deep Sea
19.07.2018
13:12:20
просто графит отдаёт 0 если точки нету

Deep Sea
19.07.2018
13:12:51
и если ретеншн 30, а метрики каждые 60 сек, то будут нули через точку

Денис
19.07.2018
13:13:17
точки с разным retention на одном графике это странно
нет, на этом графике все точки через 60 сек

Страница 593 из 681