
Andor
02.02.2018
13:42:08
ну дофига кто юзает графит и кликхаус

Bogdan (SirEdvin)
02.02.2018
13:42:19
cadvisor не решает задачу мониторинга контейнеров, по крайне мере в моем случае. Он слишком overpowered + не может нормально отдать статус контейнера, например)

Andor
02.02.2018
13:42:33
а кубер?

Bogdan (SirEdvin)
02.02.2018
13:42:34
Как говорится. свой велосипед роднее

Google

Bogdan (SirEdvin)
02.02.2018
13:42:44
У меня нет системы оркестрации)

Andor
02.02.2018
13:42:56
то есть у тебя есть докеры, но нет оркестрации для них?
чувак, лучше этим займись, легче жить будет
инфа 100%

Grigoriy
02.02.2018
13:43:45
Наличие докеров без оркестрации звучит как "выкинем все плюсы контейнеров, и будем героически жить с минусами"
Непонятно чем оно в таком виде лучше lxd/ovz/kvm
Но я не знаю всех подробностей, конечно, так что могу быть неправ.

Andor
02.02.2018
13:44:50
мы так жили с наколенным подобием оркестрации

Bogdan (SirEdvin)
02.02.2018
13:44:54
Ну, у меня ansible + docker-compose. На количество серверов, которые у нас тащить оркестрацию не вижу смысла. Кубер слишком мощный, nomad на одном сервере не подержишь и так далее.

Andor
02.02.2018
13:44:55
это большая боль в попе

Andrey
02.02.2018
13:46:14

Andor
02.02.2018
13:46:56
без job_name конечно нельзя, но перепишется ли оно значением из файла из file_sd_configs?

Andrey
02.02.2018
13:47:59
так а мне был смысл чтобы один раз прописать file_sd_config и чтобы там job_name дефайнить

Google

Andrey
02.02.2018
13:48:08
но раз нельзя - я придумал для своего случая другую схему
задача была чтобы максимально не трогать prometheus.yml
другой вопрос - что будет если положить невалидный файл в file_sd_config определённую директорию?
помешает ли это рбаботе других scrapeов?

Andrew
02.02.2018
13:48:56
Он проигнорит его.

Andor
02.02.2018
13:48:59
он не прочитается

Andrew
02.02.2018
13:48:59
Скорее всего.

Andrey
02.02.2018
13:49:12
вопрос сталкивался ли кто с этим

Andor
02.02.2018
13:49:55
прометей если запущен, то не перечитает конфиг (целиком), а если не запущен, то не запустится с ошибкой конфига
нжинкс например сделал бы так же

Andrew
02.02.2018
13:50:23
Все что касается file-sd он перечитывает же
целиком все файлы указанные в джобе

Andrey
02.02.2018
13:55:01
так
проверим

Andrew
02.02.2018
13:56:07
У меня вот так:
file_sd_configs:
- files:
- hosts.yml
refresh_interval: 10m
и вот щас игрался с лейблами для хостов - ошибся в синтаксисе и все таргеты отвалились почти сразу из конфига
Правда пром на это никак не отреагировал, просто пересстал скрапить

Andrey
02.02.2018
13:58:57
проверил
просто игнорит
а чо такой refresh_interval большой?

Google

Andrew
02.02.2018
14:04:42
Да не особо часто добавляются хосты, нет смысла в большой динамике.

Bogdan (SirEdvin)
02.02.2018
14:17:03
В целом, это можно сделать только через поиск по внутренностям. Пришлось так и делать, а жаль(

Andor
02.02.2018
14:20:59

Andrew
02.02.2018
14:22:09
Ну вообще да, и правда.

Mike
02.02.2018
18:57:19
Коллеги, нужен совет. Задача простая - есть сеть из серверов, надо замерять между ними латенси сети и показывать. Но не между какой-то парой, а все со всеми. Если конкретно - ceph кластер и надо смотрит латенси между серверами, какие задержки каждый сервер имеет с другими серверами

Andrew
02.02.2018
19:09:09
А как замерять между всеми? Это получается должна быть у каждого сервера отдельная метрика, в количестве равном количеству серверов соседей.
Т.е. есть 10 серверов, и соответственно у каждого собирается 9 метрик, каждая из которых отображает латенси от текущего, до 9ти остальных

Paul
02.02.2018
19:18:25

Andrey
02.02.2018
19:22:13

Paul
02.02.2018
19:22:36
древний, как мамонт, но очень полезный софт

Andrey
02.02.2018
19:23:57
иссью там огонь :)
https://github.com/oetiker/smokeping-3.x/issues/1#issuecomment-150937894

Mike
02.02.2018
19:24:23

Paul
02.02.2018
19:24:56
он примерно так же dead, как RRDTool. Разработку там, по-моему, уже никто не ведет. Но своб задачу выполняет, кушать не просит

Алексей
03.02.2018
03:27:08

Mike
03.02.2018
09:26:14

Yura
03.02.2018
10:05:50

Алексей
03.02.2018
10:07:24

Vladimir
03.02.2018
10:30:38
Главное чтоб работало же

Google

Vladimir
03.02.2018
11:36:47
https://fosdem.org/2018/schedule/event/google_go/
там заявлена трансляция
и ваще мониторинг деврума

Admin
ERROR: S client not available

Vladimir
03.02.2018
11:36:56
(и всего фосдема)

Karey
03.02.2018
11:39:38
Спасибо!

Vladimir
03.02.2018
11:40:04
https://fosdem.org/2018/schedule/track/monitoring_and_cloud/ вот если что

Andrey
03.02.2018
11:40:18
уже началось и идёт
google go которая

Vladimir
03.02.2018
11:40:32
у них потом запись будет

Andrey
03.02.2018
11:40:38
угу

Vladimir
03.02.2018
11:40:39
а я пытаюсь в канальчик заметки вести

Andrey
03.02.2018
11:41:05
гуд

Vladimir
03.02.2018
11:42:22
там про OpenCensus говорят по факту
то есть больше девелоперам
наверное
хотя подход интересный

Denys ??
03.02.2018
11:45:01
Ну, девелоперам это кто то продать должен :)
Почему бы не мы

Vladimir
03.02.2018
11:45:13
ну я тока за, я такое хочу пару лет уже

Paul
03.02.2018
12:18:34

Google

Vladimir
03.02.2018
12:27:21
и кому до принятия еще далеко

Paul
03.02.2018
12:29:24
Они вымрут. Мы потом посмотрим на них в музее

Vladimir
03.02.2018
12:32:34
дык отрицание-гнев-торг-депрессия-принятие
вот все тут на разной стадии просто)
кто-то пока в отрицании
кто-то уже в депрессии

Bogdan (SirEdvin)
03.02.2018
12:39:43

Semyon
03.02.2018
12:52:15

Paul
03.02.2018
12:52:30
сомневаюсь что тут прямо все инженеры :)