
Алексей
03.05.2018
07:56:00
в графите понятно откуда беда с новыми мпетриками а в реляционных базах то чего ?
или это именно new value ?

Andor
03.05.2018
07:56:25
вроде не про новые метрики, а про вообще значения в секунду

Алексей
03.05.2018
07:56:54
а...

Google

Sergey
03.05.2018
07:57:00
ага

Алексей
03.05.2018
07:57:02
о.

Sergey
03.05.2018
07:57:06
в Z

Алексей
03.05.2018
07:57:12
50к не могут ?
там же везде си и базы данных

Sergey
03.05.2018
07:57:28
могут, но трубой без алертов
там один поток в одном ядре на алертинге

Алексей
03.05.2018
07:57:57

Sergey
03.05.2018
07:58:00
так что прям щас нас спасает Power8
или 9, уже не помню

Алексей
03.05.2018
07:58:22
эт как ?
у него резиновое ядро ?

Sergey
03.05.2018
07:59:08
у него гигагерц больше чем в x86 архитектуре

Google

Алексей
03.05.2018
07:59:16
а...

Sergey
03.05.2018
07:59:22
тупо

Алексей
03.05.2018
07:59:56
а алармы в гигагерцы упираются ?

Sergey
03.05.2018
08:00:02
но вот уже начал и он упираться... но к счастью я новый стек собрал и даже обкатал... так что с честью похороним
я тут весной кидал доклад Алексея о том как они меряли Z на разных бекендах... если вообще выключить алертинг (подозреваю что костылем в коде) то Z может и лям метрик через себя пропустить на среднем сервере в бекенд (инфлюкс бугага)

Алексей
03.05.2018
08:02:17
а почему алармы упираются в гигагерцы ? @vadimipatov

Sergey
03.05.2018
08:03:05
а если брать некий условный шаблон 10К серверов и забыл уже сколько метрик + нормальные алерты на это навешать то пичаль бяда и текущая версия дает 50 или 60К и баста карапузики

Andor
03.05.2018
08:03:09
ну вроде сказали что они в один поток обрабатываются

Vadim
03.05.2018
08:03:09
справедливости ради, про алертинг это правда только для версий 3.4. В новых они параллельно обрабатываются:
"In Zabbix 3.4, alerts become parallel. In contrast to the previous option of a single alerter implementation for all problem notifications, now there is a new alert manager process that can distribute alerts to several “worker” processes."

Andor
03.05.2018
08:03:34
обрабатываются или считаются?

Vadim
03.05.2018
08:04:05
в чем разница?

Andor
03.05.2018
08:04:19
не знаю как там реализовано
но возможно есть разные процессы, один обрабатывает входящий поток метрик, а второй обрабатывает выхлоп от первого
то есть первый считает алерты, а второй уже обрабатывает

Sergey
03.05.2018
08:05:58

Vadim
03.05.2018
08:06:40

Алексей
03.05.2018
08:07:20

Sergey
03.05.2018
08:07:22
какой ты поставил такой и стоит :)

Vadim
03.05.2018
08:07:43

Sergey
03.05.2018
08:08:27
да никто не спорит что Z круче боргмана

Google

Sergey
03.05.2018
08:08:41
и тетрейшана вместе взятых

Vadim
03.05.2018
08:08:44
а я и не пытаюсь сравнивать

Sergey
03.05.2018
08:09:17
то то ты линейку при входе попросил :)

Алексей
03.05.2018
08:09:50
ушли снова с тех темы в бан зону

Vadim
03.05.2018
08:10:05
мне просто интересно стало как ты сравниваешь и что с чем. раз уж заявляешь про шланг
ага. не будем нарушать правила

Алексей
03.05.2018
08:11:35
да тем более с ними всё просто. сравнивнение с заббиксом -> срач на канале. ro и обидки.

Sergey
03.05.2018
08:12:29
Алексей который местный Алексей выше написал свой стек алертинга из 7 компонент, т.к. тут эти веселые костыли в порядке вещей и вызывают легкую грусть и нервный смех я решил разбавить это капелькой пошлого юмора со своей стороны... и вот тут пришел ты и началось

Vadim
03.05.2018
08:13:02
всё-всё. молчу. я ваще атеист

Stas
03.05.2018
08:57:15
кто уже с 5.0 до 5.1 графаны обновлялся? как там MSSQL работает?

Alexey
03.05.2018
14:37:44

Dorian
04.05.2018
12:06:58
Кто-то пользует consul для регистрации сервисов?
У меня есть небольшой проект на 12 машин и 20 приложений. Хочу все экспортеры в консуле зарегистрировать.

Anton
04.05.2018
12:08:22

Андрей
04.05.2018
12:08:28
docker? consul-registrator тогда можно.

Anton
04.05.2018
12:08:40
использую, около полу-тысячи машин по 3-5 сервисов на каждой

Dorian
04.05.2018
12:08:55

Anton
04.05.2018
12:09:38
ну там определённый набор портов, лучше открывать; но если сб сильно лютует можно только с нод до мастеров открывать

Dorian
04.05.2018
12:09:44

Dmitry
04.05.2018
12:09:58
можно взять registrator, тогда вообще ничего делать не прийдется

Google

Anton
04.05.2018
12:11:01

Андрей
04.05.2018
12:12:03
Тогда ansible, например, умеет регистрировать.

Dorian
04.05.2018
12:22:15
А что с портами други?
Регистрацию пусть ансибл делает это не проблема
Вопросов по существу два
1. Какие порты открывать на серверах?
2. Как авторизировать пром с консуле?

Dmitry
04.05.2018
12:22:58
порты открывать те, которые юзает экспортер
и консул

Admin
ERROR: S client not available

Andrey
04.05.2018
12:23:33
ещё и https/tls вешать

Dorian
04.05.2018
12:24:47
Я думал, что к таргету можно через локальный агент консула братиться?
Ясно
В общем ради 20 приложений проще в ансибл запилить генерацию конфига прома

Anton
04.05.2018
14:40:31

Andrey
04.05.2018
14:41:25
хрен с ним с уолишься, а вот какбы тебя же заставят через пол годика допилить :)

Dorian
04.05.2018
14:42:49
Система глобального мониторинга на 500+ серверов уже есть - Nagios. Нужна мониторка для проекта
Интересно, что произойдет с консулом на 1000 нодах?

Anton
04.05.2018
14:46:55
да ничего

Dorian
04.05.2018
14:47:15
да ничего
Ах да, ему жу можно всего 3 ноды мастера оставить.

Anton
04.05.2018
14:47:47
https://www.consul.io/docs/guides/performance.html
https://t.me/ru_hashicorp

Google

Tim
04.05.2018
17:01:27
беда беда, прометеус отказывается читать метрики через nginx reverse proxy
прометеус пишет unexpected EOF
nginx пишет
2018/05/04 18:59:37 [error] 13283#0: *1 upstream prematurely closed connection while reading upstream, client: 192.168.122.109, server: _, request: "GET /metrics/service-a/3 HTTP/1.1", upstream: "http://192.168.122.104:31696/metrics", host: "192.168.122.104:8008"
пока ничего не нагугливается, но подозреваю что дело в настройках nginx
телнетом тестирую и всё работает

Andor
04.05.2018
17:01:59
ну ты можешь например показать конфиг

Georgiy
04.05.2018
17:02:12
так он тебе сказал что ваш "http://192.168.122.104:31696/metrics" лежит

Andor
04.05.2018
17:02:29
вообще да, это у тебя апстрим оторвал соединение

Tim
04.05.2018
17:02:38
не лежит, руками всё работает
конфиг тупейший
location = /metrics/service-b/3 {
proxy_pass http://hz2-n04.cluster.jacum.com:31075/metrics;
}

Andor
04.05.2018
17:02:57
збс
и как ты считаешь, какой путь ушёл в апстрим?

Georgiy
04.05.2018
17:03:41
конфа то норм
у тебя бек закрывает сокет когда к нему nginx стучится

Tim
04.05.2018
17:04:28
$ telnet 192.168.122.104 8008
Trying 192.168.122.104...
Connected to 192.168.122.104.
Escape character is '^]'.
GET /metrics/service-b/3 HTTP/1.1
Host: 192.168.122.104:8008
User-Agent: Prometheus/2.2.1
Accept: text/plain;version=0.0.4;q=1,*/*;q=0.1
HTTP/1.1 200 OK
Server: nginx/1.12.2
Date: Fri, 04 May 2018 16:45:48 GMT
Content-Type: text/plain; version=0.0.4; charset=utf-8
Content-Length: 46193
Connection: keep-alive
# HELP jvm_gc_collection_seconds Time spent in a given JVM garbage collector in seconds.
# TYPE jvm_gc_collection_seconds summary
jvm_gc_collection_seconds_count{gc="ParNew",} 8.0
jvm_gc_collection_seconds_sum{gc="ParNew",} 0.086
jvm_gc_collection_seconds_count{gc="ConcurrentMarkSweep",} 1.0
jvm_gc_collection_seconds_sum{gc="ConcurrentMarkSweep",} 0.023
# HELP jvm_threads_current Current thread count of a JVM

Andor
04.05.2018
17:04:33
оно же будет дёргать адрес /metrics/metrics/service-b/3

Tim
04.05.2018
17:04:36
руками всё работает
это с хоста где прометеус

Georgiy
04.05.2018
17:05:18

Tim
04.05.2018
17:05:21
и в конце сразу Connection closed by foreign host.
и в логе ошибок нет, когда руками из телнета

Andor
04.05.2018
17:06:32

Georgiy
04.05.2018
17:06:41
так у тебя в апстриме один порт
а ты идешь на 8008