
Alex
20.08.2018
14:24:53
единственный стремный момент, это когда тыкаешь на этот endpoint в прометеусе
то он редиректит вот на такую фигню
http://942c855bc906:53000/metrics
то есть не локал хост, а что то непоятное

Google

Alex
20.08.2018
14:25:24
в чем может быть проблема ?
ну и сосбветнное кажыдк 5 сек ошибка Get http://localhost:53000/metrics: dial tcp 127.0.0.1:53000: connect: connection refused
Мой скрап конфиг
scrape_configs:
- job_name: 'nodeexporter'
scrape_interval: 5s
static_configs:
- targets: ['nodeexporter:9100']
- job_name: 'cadvisor'
scrape_interval: 5s
static_configs:
- targets: ['cadvisor:8080']
- job_name: 'prometheus'
scrape_interval: 10s
static_configs:
- targets: ['localhost:9090']
- job_name: 'pushgateway'
scrape_interval: 10s
honor_labels: true
static_configs:
- targets: ['pushgateway:9091']
- job_name: 'tutorial-rpc-metrics'
scrape_interval: 5s
honor_labels: true
static_configs:
- targets: ['localhost:53000']

pl
20.08.2018
14:31:42
проблема в том что у вас пром в докере
а сервис не в докере

Alex
20.08.2018
14:32:03
точняк! я совсем про это забыл
Спасибо!

Dmitry
20.08.2018
14:52:54

Alex
20.08.2018
14:55:03
Это что то подобие прокси?

Andor
20.08.2018
14:55:11
Нет
Можно ридми почитать

Alex
20.08.2018
14:56:55

Google

Andor
20.08.2018
14:57:34
Вообще не понял при чём тут блекбокс экспортер
Тебе надо чтобы http запросы ходили с прометея в твой порт, как это сделать - тебе решать
Можно сунуть в одну сеть, можно поставить проксю

Andrey
20.08.2018
15:39:53
есть вопрос, умеет ли prometheus_client в python вешать метрику в pushgateway с кастомным timestamp'ом ?

Andor
20.08.2018
15:40:15
а зачем?
пушгейтвей же будет хранить только последнее

Andrey
20.08.2018
15:40:57
а прометей при сборе не учитывает ts?

Andor
20.08.2018
15:41:09
нет

Andrey
20.08.2018
15:43:05
концепция была в отправке метрики, которая могла бы стать аннотацией для графаны, для нанесения апдейтов на графики и прочих кастомных сообщений

Andor
20.08.2018
15:43:38
ну ты можешь это делать
если будешь посылать когда событие произошло
но события лучше не в прометее хранить всё-таки

Andrey
20.08.2018
15:44:58
а что бы подошло в качестве такого источника аннотаций? elastic или mysql?

Andor
20.08.2018
15:49:00
Evgeny akumuli бы подошёл? %)
ваще эластик вполне сгодится
и мускуль вроде тоже сгодится
там же мало данных будет

Dmitriy
20.08.2018
15:58:02
Кто сталкивался с багом в UI Grafanы, при редактировании дашборда, указатель ввода отображается "не там"
То есть тыкая на на букву n в node_cpu, на самом деле я нахожусь в слове instance
sum(irate(node_cpu{instance="$host"}[5m])) by (mode) * 100 / count(node_cpu{ instance="$host"}) by (mode)
Понятно объяснил? :)
В Linux на Chrome и Firefox - не норм
В Windows на IE и Chrome - норм
В MacOS на Chrome и Safari - норм

Kirill
21.08.2018
10:47:39
Немного пиратства

Andor
21.08.2018
10:49:00

Google

Dmitriy
21.08.2018
10:49:38
так что это что-то в окружении

Алексей
21.08.2018
10:49:59
спасибо.
#books

Stannis
21.08.2018
14:08:19
Мужики, у кого OpenTSDB
Call queue is full on /0.0.0.0:16020, too many items queued ?
как избавится??

Andor
21.08.2018
14:09:20
Ого, живой пользователь opentsdb?

Stannis
21.08.2018
14:09:20
Уже и региональный сервер перегружал
Ой не пинайте… Такой кусок говна
HDFS->HBASE->OPENTSDB
везде свой гемморой

Andor
21.08.2018
14:10:33
Ну они ж всегда так были вроде

Stannis
21.08.2018
14:12:15
Всегда
Но после прома и кликахуса от этого потрясывет

Evgeny
21.08.2018
14:15:36
а salting включен? возможно слишком много данных идет на один region server, от чего у него растет latency

Stannis
21.08.2018
14:16:42
всего 7 нод и 28 regions
Average rate 1k rps

Evgeny
21.08.2018
14:19:30
это вроде не много
может у него там compaction прост

Google

Stannis
21.08.2018
14:20:50
вот хз что там у него
Оно как-то рандомного колом встает
И не понятно куда дальше копать

Evgeny
21.08.2018
14:22:08
хз, я не работал с opentsdb, только с hbase, hbase обычно из-за compaction-а колом встает

Stannis
21.08.2018
14:22:50
2018-08-21 11:51:28,940 ERROR [CompactionQueue.call] - Failed to read a row to re-compact
org.hbase.async.CallQueueTooBigException: Call queue is full on /0.0.0.0:16020, too many items queued ?
Caused by RPC: GetRequest(table="tsdb", key=[12, 0, 0, -114, 91, 123, 86, 0, 0, 0, 16, 0, 51, 20, 0, 0, 21, 0, 14, 104, 0, 0, 22, 0, 0, 3], family=null, qualifiers=null, attempt=1, region=RegionInfo(table="tsdb", region_name="tsdb,\x0C\x00\x00\x8EY\xA5\x1F\x16\x00\x01,1534514793529.2003d493f538296266b60eb32da8e45b.", stop_key=[12, 0, 2, 34, 90, -41, -79, -48, 0, 0, 1, 1, -19, 104, 0, 0, 5, 0, -91, 73, 0, 0, 33, 2, 80]))
как-то так это выглядит

Admin
ERROR: S client not available

Dmitriy
21.08.2018
14:53:01
Кто-нибудь следит за vSphere силами Prometheus и Grafana?
В паблике что-то кот наплакал

Andor
21.08.2018
14:58:07
Там где-то был экспортер

Алексей
21.08.2018
14:58:22
был экспортер да
хз в каком состоянии

Alex
21.08.2018
15:00:49

Andor
21.08.2018
15:01:17
про всфера-экспортер вспомнинали где-то всего месяц назад

Dmitriy
21.08.2018
15:58:36
Попробовал этот https://github.com/pryorda/vmware_exporter
с хостами и сторами - ок
с vm - проблемы
cannot get vm metric
В код пока не лез
Буду смотреть этот https://github.com/sapcc/vcenter-exporter

Алексей
21.08.2018
15:58:59

Dmitriy
21.08.2018
15:59:44
пермишены ?
на рид все, но версия с пермишенами пока основная, для меня сфера - сервис, завтра саппорт посмотрит

Алексей
21.08.2018
15:59:57
ок да
расскажите чего получилось ? у меня немножо фонвый интерес к теме есть. но сам пока не хочу погружаться

Dmitriy
21.08.2018
16:00:44
да

Bogdan (SirEdvin)
21.08.2018
16:12:29
Кто-то мониторил logspout?)

Nklya
21.08.2018
16:49:09
Аххахаха, Г в квадрате
https://habr.com/company/sberbank/blog/420731/

Google

Andor
21.08.2018
16:58:56
Omg

Andrey
21.08.2018
17:06:43
не, ну а чё, кто то сомневался :)

Paul
21.08.2018
17:08:35
стикера "слабоумие и слабоумие", к сожалению, нет
впрочем, учитывая, из чего они выбирали – заббикс весьма и весьма неплохо смотрится

Nklya
21.08.2018
17:14:20
есть ощущение, что они из 2005 выпрыгнули и решили запилить хардкорную статью на хабр

Алексей
21.08.2018
17:15:02
ну чоты. просто для них 2005 не легаси ещё

Bogdan (SirEdvin)
21.08.2018
17:15:17
В 2005 не было графита?

Алексей
21.08.2018
17:15:34
графит не охвтывает схд.

Petr
21.08.2018
17:15:35
Этого маркетологи требуют
Статьи )

Алексей
21.08.2018
17:15:46
и сеть тоже не охватывает
так что чо нет то...

Psy
21.08.2018
17:16:30
Ну они не виноваты, определенные корпоративные ограничения связывают руки в плане выбора технологий

Paul
21.08.2018
17:30:06
графит, строго говоря – вообще ничего не охватывает