
Dmitry
12.01.2017
16:32:23
видимо они поменяли глубину

Алексей
12.01.2017
18:29:16
и эти люди мне говорят зачем ты вписываешь дефолты

Dmitry
12.01.2017
18:38:00
А чо?

Paul
12.01.2017
20:37:49

Google

Алексей
12.01.2017
20:39:16
Менять дефолты не очень я про это

Paul
12.01.2017
21:37:28
менять дефолты - имеет смысл. Если понимать, зачем. Я своему прометею подрезал используемую память. Иначе он 4 гига сходу выжирает, а у меня столько нет.

Антон
13.01.2017
08:52:39
Привет, кто нибудь запускал API для Alerta не на дефолтных локешейнах?

Paul
13.01.2017
12:18:04
коллеги, кто использует прометей и докер (кубернетес) - как вы запускаете экспортеры для мониторящихся сервисов? прямо внутри контейнера сервиса или создаете отдельный? Я имею ввиду экспортеры типа mysql_exporter

Антон
13.01.2017
12:22:59
по правильному я думаю 1 сервис = 1 контейнер

Paul
13.01.2017
15:57:28
так что, нет ни у кого ответа?

Maxim
13.01.2017
16:05:32
зачем корежить стоковые инстансы
ну то есть имеет смысл делать сразу поды, в которых один из контейнеров - экспортер
это удобно с нескольких сторон:
1. экспортер может ходить к самому сервису прямо на 127.0.0.1
2. в под-манифесте можно сразу писать аннотации
prometheus.io/path: /metrics
prometheus.io/port: "xxx"
prometheus.io/scrape: "true"
и таким образом каждый стартующий под с экспортером будет автомагически окучен прометеем

Google

Maxim
13.01.2017
16:16:46
я имею в виду примерно так:
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
name: mysql
annotations:
deployment.kubernetes.io/revision: "1"
labels:
app: mysql
spec:
template:
metadata:
annotations:
prometheus.io/path: /metrics
prometheus.io/port: "9255"
prometheus.io/scrape: "true"
spec:
containers:
- name: mysql
image: mysql
# ...
- name: mysql-exporter
image: prom/mysqld_exporter
ports:
- containerPort: 9255
protocol: TCP
# ...
полноценного примера из личной жизни показать не могу - у нас все стейтфул-сервисы на bare-metal в неконтейнеризироватом виде

Zon
13.01.2017
18:09:02
Для ластика есть экспортер, который в самом ластике работает, его внутрь, обычно отдельностоящий контейнер, иначе как-то неудобно

Semyon
13.01.2017
19:48:33
@solakkie ты решил тоже бросить это сраное программирование и в опсы податься? :)

Игорь
13.01.2017
19:49:26
видимо да )

Semyon
13.01.2017
19:51:00
блеать, и ты тут

Игорь
13.01.2017
19:52:10
а че бы и нет

Maxim
13.01.2017
22:58:05

Andrey
16.01.2017
17:49:25
господа, халп, туплю с kapacitor'ом
stream
|from()
.database('metrics')
.retentionPolicy('autogen')
.measurement('measurement')
.where(WHERE_COND)
|window()
.period(5m)
.every(10s)
|sum('amount')
.as('sum')
хочу посчитать сумму значений за последние 5 минут, но считается что-то не то

Vitaly
17.01.2017
05:34:26

Антон
18.01.2017
13:18:54
а кто нибудь ограничивает Collectors в node_exporter https://github.com/prometheus/node_exporter или используете на машинах по дефолту?

yopp
18.01.2017
13:19:14

Антон
18.01.2017
13:19:58
разве это не дает большой плюс к памяти на сервере prometheus?

yopp
18.01.2017
13:20:01
Ой, ntp задепрекейтили :(

Andrey
18.01.2017
13:25:55
что взамен?

Алексей
18.01.2017
13:27:16

Dmitry
18.01.2017
13:28:06
"время не любит, когда его убивают"

Антон
18.01.2017
13:28:25
В общем у меня такой вопрос я ставлю node_exporter на машину, и на хосте порядка 760 метрик, считаю так curl http://example.org/metrics | grep -v '^#' | wc -l , как можно убрать не нужные , только отключив collectors в node_exporter?

Google

lastsky
18.01.2017
13:32:48
Ой, ntp задепрекейтили :(
интересный момент, да. задепрекейтили ntp, угрожают депрекейтом megacli, ввели коллектор wifi и кричат что это pure server metrics exporter. pure laptop metrics exporter, если честно, начинает напоминать.

Алексей
18.01.2017
13:34:20

lastsky
18.01.2017
13:34:57
https://github.com/prometheus/node_exporter/releases
megacli - Requires forking, moved to textfile collection.
[FEATURE] Add initial wifi collector #413

Алексей
18.01.2017
13:35:35
пасиб

lastsky
18.01.2017
13:36:31
https://github.com/prometheus/node_exporter/issues/197#issuecomment-173511643
"The node exporter is only for pure machine metrics, it's a non-goal to have the node exporter as a general clearing house for metrics."

Uncel
18.01.2017
13:40:20
Странно, еще не появилась у них идея "100% pure machine metrics" через bmc контроллер брать

lastsky
18.01.2017
13:43:23
bmc как правило поддерживают snmp, а для snmp есть же отдельный экспортер, и даже вроде работчий (как туда залезть иначе если не скриптом + textfile)

Uncel
18.01.2017
13:43:46
redfish только поддерживать

yopp
18.01.2017
13:43:58
про pure server metrics это ты сам уже додумал :)

Maxim
18.01.2017
13:44:37

yopp
18.01.2017
13:44:59
Про megacli ещё более-менее понятно, пушо оно не совспм страндартное. А вот пошто ntp вырезали не ясно. Наверное потому что ntp просто отдельный процесс, за которым надо отдельно следить?
Но тогда мы приходим к идиотизму: по экспортеру на каждый процесс.

lastsky
18.01.2017
13:45:39
ну да, machine / server, тут я додумал конечно, не отрицаю. но... совсем чутка. потому что wifi коллектор ввести - как его применить...

Paul
18.01.2017
13:45:56
это не идиотизм, это концепция

yopp
18.01.2017
13:47:29
https://github.com/prometheus/node_exporter/issues/307

lastsky
18.01.2017
13:47:30

yopp
18.01.2017
13:47:34
https://github.com/prometheus/node_exporter/pull/321

Semyon
18.01.2017
16:39:44
Котаны, а кто-то пробовал Капаситором алертить?

Google

Semyon
18.01.2017
16:39:59
У меня тут юзкейз нарисовался ровно под него, расскажите самое плохое, что вы про него знаете
хочу знать как именно он сломается

Алексей
18.01.2017
16:55:24
Он не приятно настраивается, другого за пару месяцев про него не заметил
Но они вроде впилили шаблоны ща должно стать веселее

Semyon
18.01.2017
16:57:06
в смысле неприятно? Я так понял пишешь чек на TICKScript, пушишь его в запущеный капаситор
и собсно всё

Алексей
18.01.2017
17:06:20
Напиши пару чеков

Semyon
19.01.2017
12:08:46
Котаны, а скажите пожалуйста вот такую фигню.
Сейчас обнаружили, что карбон выставил для некоторой метрики вида
ololo.metric.count метод аггрегации в sum, при том что по-дефолту должен быть average. Никто не сознаётся, что он что-то менял.
Может ли быть такое, что карбон от имени метрики сам решил сделать аггрегацию суммой?

Admin
ERROR: S client not available

ptchol
19.01.2017
12:45:59
@sdfgh153 Денис там в слеке, можешь его спросить ) он подскажет )

Kirill
19.01.2017
12:52:37

Denys ??
19.01.2017
13:16:15
Расписал чуток логику в слаке.
Если метод аггрегации sum – то смотри что в storage-aggregation.conf

Semyon
19.01.2017
13:20:07

Denys ??
19.01.2017
13:24:11
по дефолту используется то что в этом файле
там есть дефолтный паттерн
типа
[default_average]
pattern = .*
xFilesFactor = 0.5
aggregationMethod = average
хотя в каментах написано вот
# For reference, these are the defaults:
# [min]
# pattern = \.min$
# xFilesFactor = 0.1
# aggregationMethod = min
#
# [max]
# pattern = \.max$
# xFilesFactor = 0.1
# aggregationMethod = max
#
# [sum]
# pattern = \.count$
# xFilesFactor = 0
# aggregationMethod = sum
#
# [default_average]
# pattern = .*
# xFilesFactor = 0.5
# aggregationMethod = average

Google

Denys ??
19.01.2017
13:26:19
если метрика заканчивается на max будет max

Semyon
19.01.2017
13:26:39
а, ну вот и разгадка
там метрика заканчивается на count
и я тут погрепал, все метрики заканчивающиеся на count аггрегируются через sum
спасибо

Denys ??
19.01.2017
13:27:21
что логично

Semyon
19.01.2017
13:27:56
не поспоришь
спасибо большое, Денис

Denys ??
19.01.2017
13:29:21
да не за что :)

Антон
19.01.2017
16:20:57
кто нить может подсказать по связке prometheus -> alerta -> telegram или никто не пробовал?

Алексей
19.01.2017
16:21:08
у меня работает

Антон
19.01.2017
16:21:36
круть, у меня работает только до alerta а в telegram бота ничего не попадает почему то
я настроил бота, настроил конфиги для alerta и prometheus, через alerta cli тестовые оповещения проходят и уходят в телеграм бота, но вот когда оповещение приходит из prometheus в alerta , то telegram бот молчит

Алексей
19.01.2017
16:24:16
в логи смотри, и в ответ алерты прометею
может какую нит ьканитель выставляешь неверно

Антон
19.01.2017
16:24:42
да вот знать бы какую

Алексей
19.01.2017
16:24:55
он там довольно разговорчив
но мне пришлось ловить трафик пару тройку раз
ngrep помогал :)

Антон
19.01.2017
16:25:32
оу я этим не особо занимаюсь )