@metrics_ru

Страница 527 из 681
Алексей
03.05.2018
07:56:00
в графите понятно откуда беда с новыми мпетриками а в реляционных базах то чего ?

или это именно new value ?

Andor
03.05.2018
07:56:25
вроде не про новые метрики, а про вообще значения в секунду

Алексей
03.05.2018
07:56:54
а...

Google
Sergey
03.05.2018
07:57:00
ага

Алексей
03.05.2018
07:57:02
о.

Sergey
03.05.2018
07:57:06
в Z

Алексей
03.05.2018
07:57:12
50к не могут ?

там же везде си и базы данных

Sergey
03.05.2018
07:57:28
могут, но трубой без алертов

там один поток в одном ядре на алертинге

Алексей
03.05.2018
07:57:57
Sergey
03.05.2018
07:58:00
так что прям щас нас спасает Power8

или 9, уже не помню

Алексей
03.05.2018
07:58:22
эт как ?

у него резиновое ядро ?

Sergey
03.05.2018
07:59:08
у него гигагерц больше чем в x86 архитектуре

Google
Алексей
03.05.2018
07:59:16
а...

Sergey
03.05.2018
07:59:22
тупо

Алексей
03.05.2018
07:59:56
а алармы в гигагерцы упираются ?

Sergey
03.05.2018
08:00:02
но вот уже начал и он упираться... но к счастью я новый стек собрал и даже обкатал... так что с честью похороним

я тут весной кидал доклад Алексея о том как они меряли Z на разных бекендах... если вообще выключить алертинг (подозреваю что костылем в коде) то Z может и лям метрик через себя пропустить на среднем сервере в бекенд (инфлюкс бугага)

Алексей
03.05.2018
08:02:17
а почему алармы упираются в гигагерцы ? @vadimipatov

Sergey
03.05.2018
08:03:05
а если брать некий условный шаблон 10К серверов и забыл уже сколько метрик + нормальные алерты на это навешать то пичаль бяда и текущая версия дает 50 или 60К и баста карапузики

Andor
03.05.2018
08:03:09
ну вроде сказали что они в один поток обрабатываются

Vadim
03.05.2018
08:03:09
справедливости ради, про алертинг это правда только для версий 3.4. В новых они параллельно обрабатываются: "In Zabbix 3.4, alerts become parallel. In contrast to the previous option of a single alerter implementation for all problem notifications, now there is a new alert manager process that can distribute alerts to several “worker” processes."

Andor
03.05.2018
08:03:34
обрабатываются или считаются?

Vadim
03.05.2018
08:04:05
в чем разница?

Andor
03.05.2018
08:04:19
не знаю как там реализовано

но возможно есть разные процессы, один обрабатывает входящий поток метрик, а второй обрабатывает выхлоп от первого

то есть первый считает алерты, а второй уже обрабатывает

Vadim
03.05.2018
08:06:40
а почему алармы упираются в гигагерцы ? @vadimipatov
лучше @korservick спросить об этом. подозреваю, что данный вывод он сделал из-за того, что у них 3.0 Z стоит, в котором один воркер алерты обрабатывает только

Sergey
03.05.2018
08:07:22
какой ты поставил такой и стоит :)

Vadim
03.05.2018
08:07:43
Sergey
03.05.2018
08:08:27
да никто не спорит что Z круче боргмана

Google
Sergey
03.05.2018
08:08:41
и тетрейшана вместе взятых

Vadim
03.05.2018
08:08:44
а я и не пытаюсь сравнивать

Sergey
03.05.2018
08:09:17
то то ты линейку при входе попросил :)

Алексей
03.05.2018
08:09:50
ушли снова с тех темы в бан зону

Vadim
03.05.2018
08:10:05
мне просто интересно стало как ты сравниваешь и что с чем. раз уж заявляешь про шланг

ага. не будем нарушать правила

Алексей
03.05.2018
08:11:35
да тем более с ними всё просто. сравнивнение с заббиксом -> срач на канале. ro и обидки.

Sergey
03.05.2018
08:12:29
Алексей который местный Алексей выше написал свой стек алертинга из 7 компонент, т.к. тут эти веселые костыли в порядке вещей и вызывают легкую грусть и нервный смех я решил разбавить это капелькой пошлого юмора со своей стороны... и вот тут пришел ты и началось

Vadim
03.05.2018
08:13:02
всё-всё. молчу. я ваще атеист

Stas
03.05.2018
08:57:15
кто уже с 5.0 до 5.1 графаны обновлялся? как там MSSQL работает?

Alexey
03.05.2018
14:37:44
кто уже с 5.0 до 5.1 графаны обновлялся? как там MSSQL работает?
как-то так grafana-server[4999]: panic: runtime error: invalid memory address or nil pointer dereference EDIT: Перезалил базу с drop database; от 4 версии и оно не воспроизвелось. Вероятно в базе оказались куски от 4 и 5.0 и графане это не понравилось

Dorian
04.05.2018
12:06:58
Кто-то пользует consul для регистрации сервисов? У меня есть небольшой проект на 12 машин и 20 приложений. Хочу все экспортеры в консуле зарегистрировать.

Андрей
04.05.2018
12:08:28
docker? consul-registrator тогда можно.

Anton
04.05.2018
12:08:40
использую, около полу-тысячи машин по 3-5 сервисов на каждой

Dorian
04.05.2018
12:08:55
а конкретно, какой вопрос?
Это вообще реально, чтобы не создавать vhosts или открывть порты на всех нодах?

Anton
04.05.2018
12:09:38
ну там определённый набор портов, лучше открывать; но если сб сильно лютует можно только с нод до мастеров открывать

Dorian
04.05.2018
12:09:44
использую, около полу-тысячи машин по 3-5 сервисов на каждой
Впечатляет Получается, что по сети нужно открыть только порт конусулу?

Google
Андрей
04.05.2018
12:12:03
Тогда ansible, например, умеет регистрировать.

Dorian
04.05.2018
12:22:15
А что с портами други?

Регистрацию пусть ансибл делает это не проблема

Вопросов по существу два 1. Какие порты открывать на серверах? 2. Как авторизировать пром с консуле?

Dmitry
04.05.2018
12:22:58
порты открывать те, которые юзает экспортер

и консул

Admin
ERROR: S client not available

Andrey
04.05.2018
12:23:33
ещё и https/tls вешать

Dorian
04.05.2018
12:24:47
Я думал, что к таргету можно через локальный агент консула братиться?

Ясно В общем ради 20 приложений проще в ансибл запилить генерацию конфига прома

Anton
04.05.2018
14:40:31
Ясно В общем ради 20 приложений проще в ансибл запилить генерацию конфига прома
20 быстро перерасёт в 100, 100 в 1000 а потом ты уволишься и кто-то увидет твой ебический конфиг прометея, и уедет в дурку

Andrey
04.05.2018
14:41:25
хрен с ним с уолишься, а вот какбы тебя же заставят через пол годика допилить :)

Dorian
04.05.2018
14:42:49
Система глобального мониторинга на 500+ серверов уже есть - Nagios. Нужна мониторка для проекта

Интересно, что произойдет с консулом на 1000 нодах?

Anton
04.05.2018
14:46:55
да ничего

Dorian
04.05.2018
14:47:15
да ничего
Ах да, ему жу можно всего 3 ноды мастера оставить.

Anton
04.05.2018
14:47:47
https://www.consul.io/docs/guides/performance.html

https://t.me/ru_hashicorp

Google
Tim
04.05.2018
17:01:27
беда беда, прометеус отказывается читать метрики через nginx reverse proxy прометеус пишет unexpected EOF nginx пишет 2018/05/04 18:59:37 [error] 13283#0: *1 upstream prematurely closed connection while reading upstream, client: 192.168.122.109, server: _, request: "GET /metrics/service-a/3 HTTP/1.1", upstream: "http://192.168.122.104:31696/metrics", host: "192.168.122.104:8008" пока ничего не нагугливается, но подозреваю что дело в настройках nginx телнетом тестирую и всё работает

Andor
04.05.2018
17:01:59
ну ты можешь например показать конфиг

Georgiy
04.05.2018
17:02:12
так он тебе сказал что ваш "http://192.168.122.104:31696/metrics" лежит

Andor
04.05.2018
17:02:29
вообще да, это у тебя апстрим оторвал соединение

Tim
04.05.2018
17:02:38
не лежит, руками всё работает

конфиг тупейший location = /metrics/service-b/3 { proxy_pass http://hz2-n04.cluster.jacum.com:31075/metrics; }

Andor
04.05.2018
17:02:57
збс

и как ты считаешь, какой путь ушёл в апстрим?

Georgiy
04.05.2018
17:03:41
конфа то норм

у тебя бек закрывает сокет когда к нему nginx стучится

Tim
04.05.2018
17:04:28
$ telnet 192.168.122.104 8008 Trying 192.168.122.104... Connected to 192.168.122.104. Escape character is '^]'. GET /metrics/service-b/3 HTTP/1.1 Host: 192.168.122.104:8008 User-Agent: Prometheus/2.2.1 Accept: text/plain;version=0.0.4;q=1,*/*;q=0.1 HTTP/1.1 200 OK Server: nginx/1.12.2 Date: Fri, 04 May 2018 16:45:48 GMT Content-Type: text/plain; version=0.0.4; charset=utf-8 Content-Length: 46193 Connection: keep-alive # HELP jvm_gc_collection_seconds Time spent in a given JVM garbage collector in seconds. # TYPE jvm_gc_collection_seconds summary jvm_gc_collection_seconds_count{gc="ParNew",} 8.0 jvm_gc_collection_seconds_sum{gc="ParNew",} 0.086 jvm_gc_collection_seconds_count{gc="ConcurrentMarkSweep",} 1.0 jvm_gc_collection_seconds_sum{gc="ConcurrentMarkSweep",} 0.023 # HELP jvm_threads_current Current thread count of a JVM

Andor
04.05.2018
17:04:33
оно же будет дёргать адрес /metrics/metrics/service-b/3

Tim
04.05.2018
17:04:36
руками всё работает

это с хоста где прометеус

Georgiy
04.05.2018
17:05:18
оно же будет дёргать адрес /metrics/metrics/service-b/3
кстати да, в конце слеша то нет в локейшене

Tim
04.05.2018
17:05:21
и в конце сразу Connection closed by foreign host.

и в логе ошибок нет, когда руками из телнета

Georgiy
04.05.2018
17:06:41
так у тебя в апстриме один порт

а ты идешь на 8008

Страница 527 из 681