
Vladimir
14.08.2017
20:23:01
адекватных инструментов, умеющих пересчеты почти не существует

Евгений
14.08.2017
20:27:06

Vladimir
14.08.2017
20:27:28

Daniel
14.08.2017
20:27:34
еще как пишем, но там проблема на проблеме

Google

Vladimir
14.08.2017
20:29:12

Daniel
14.08.2017
20:29:28
особенно поверх кассандры

Vladimir
14.08.2017
20:29:30
а посмотрел бы на то можно ли до вменяемого состояния довести m3db (если очень много времени)
может быть поигрался бы со скрещиванием чего-нибудь под теги с кликхаусом под данные

Anatoliy
15.08.2017
03:53:22

Andor
15.08.2017
06:14:40
abs(max_over_time(metric[1h] offset 1h) - metric) > 5
Примерно так

yuyu
15.08.2017
07:19:22

Ivan
15.08.2017
09:31:34
я от идеи докера для прома отказался.

Anatoliy
15.08.2017
09:32:13

Ivan
15.08.2017
09:32:13
да и не нужен он там, если только нет уже готового кубера или swarm
из под докера время опроса моих endpoints вело себя мягко говоря странно см график

Google

Anatoliy
15.08.2017
09:34:06
Понятно, ну в общем видимо будет одним из тех сервисов что будут жить без докера, думаю еще openvpn из контейнера вытащить, а то надоело честно говоря сеть из за этого перестраивать и где надо и где не надо..(
Судя по всему всё в докер не запихнуть :)

Алексей
15.08.2017
09:34:15

Ivan
15.08.2017
09:35:02
чем объясняешь ?
объяснения не придумал. докер свежий был как и пром. проще было выпилить докер и жить дальше
график слишком цикличный

Sergey
15.08.2017
09:35:33

Алексей
15.08.2017
09:35:53
честно незнаю низкоуровневых механизмомв которые могут дать такое

Ivan
15.08.2017
09:35:56

Алексей
15.08.2017
09:36:15
пожтому мне кажется тут есть другое объяснение а не докер

Sergey
15.08.2017
09:36:17
частота опроса с частотой чего-то ещё
так сказать, hard clipping

Ivan
15.08.2017
09:37:05
пробовал вместо пяти секунд и 1 и 10 результат схожий

Алексей
15.08.2017
09:37:33
ну раз проблема не найдена она воспроизведтся.
только теперь видимо без докера
дай запрос которым смотришь посмотрю у ся

Ivan
15.08.2017
09:38:53

Алексей
15.08.2017
09:42:31
понятно. жаль. интересно посмотреть есть ли такое поведение за пределами твоего стенда
ну и пром там же про себя много рассказывает
http_request_duration_microseconds например

Google

Ivan
15.08.2017
09:53:00

Алексей
15.08.2017
09:54:05
ну если есть желание разобраться пром молодец.

Bogdan (SirEdvin)
15.08.2017
11:57:13
Подскажите, пожалуйста, почему в grafana иногда показывается количество документов Nan.Infinity?
А, все, нашел, вместо current надо ставить total)

Anatoliy
15.08.2017
12:09:00
Народ, как я понял prometheus дергает раз в надцать секунд node_exporter, который уже все данные выдает, так? Но ему самому как добавить дополнительные значения то? Или хотя бы пните в сторону что читать :) Потому как что-то не понимаю как это делается, и гугление тоже видимо как-то не правильно провожу...

Roman
15.08.2017
12:11:51

Anatoliy
15.08.2017
12:13:10
Угу... а просто добавить некоторые параметры которые будут высчитывать другие скрипты я не могу?

Roman
15.08.2017
12:15:10
все что надо прометеусу - адрес, по которому он будет забирать метрики. Т.е. вам нужно приложение, которое будет содержать "некоторые параметры которые будут высчитывать другие скрипты"
это приложение может быть написано на чем угодно, главное чтобы оно отдавало это в правильном для прометеуса формате
расширить же node_exporter, насколько я знаю, нельзя

Anatoliy
15.08.2017
12:17:39
Понятно, значит прометеус просто дерагет вебовскую страничку которую я ему должен дать с данными по правильным форматам?
Ну что же... Спасибо, пошел делать :)

Andor
15.08.2017
12:17:40
телеграф умеет внешние скрипты вызывать

Andor
15.08.2017
12:17:47
node_exporter умеет читать из внешнего файла

Roman
15.08.2017
12:18:39

Anatoliy
15.08.2017
12:18:49
Пошел читать еще и про телеграф тогда :)
P.S. несколько экспортеров на одной машине - это нормально или нет?

Andor
15.08.2017
12:18:53
не надо так.

Anatoliy
15.08.2017
12:20:11
Понятно, значит либо там должно быть что-то что умеет объединять работу нескольких экспортеров либо я что-то не понимаю... Иначе как объединять тот же вывод mysql_exporter с node_exporter?

Roman
15.08.2017
12:24:27

Andor
15.08.2017
12:25:33
несколько экспортеров на одном хосте - это нормально

Evgeny
15.08.2017
13:29:04
подскажите по системе именования метрик в графит исходя из своего опыта
На данный момент схема такая
<dc>.<host>.<app>.<request|process|и т.д> дальше уже специфичные метрики
в графане графики соответcвенно в 90% случаев
*.*.<app>.и метрика какая-нибудь
иногда конечно нужны метрики по хосту или по dc, но кажеться что такое именование неоптимально с точки зрения нагрузки на чтение т.к. если у нас приложение размазано на 10 инстанов получаем х10 чтения с диска,
и в такой схеме сложно навернуть агрегацию по отдельному <app> (непонятно как должна выглядеть агрегированная метрика)
буду очень благодарен за совет по правильному именованию и агрегации метрик ?

Google

Sergey
15.08.2017
14:58:11
так а какая разница как ты распилишь метрику? одна метрика один файл. если приложение имеет метрики не завязанные на хост то его и сохранять надо без привязки к хосту, а если тебе нужна привязка то ты опять же получаешь Х10 - круг замкнулся
если наибольший поток чтения у тебя идет на аггрегированные метрики по приложению - считай и клади его отдельно. глянуть как оно было в разрезе хостов можно будет (если нужно). теряем в месте и иопсах на запись - получаем гешефт на чтение

Evgeny
15.08.2017
15:06:20
вопрос больше имеет ли какое то преимущество именование <app>.<dc>.<host>.<metrica> в плане постоения графиков и агрегации сверху, ну и возможно узнать как у кого сделано, опыт avito в статье на хабре прочитал, но тема именований метрик и агрегаций также не раскрыта

Vladimir
15.08.2017
15:55:25
И схемы зависят от назначения
Есть префикс класса метрик (system, databases, ...)
А формат зависит от префикса
Преимущество простое - нужно людям сокращать путь до их метрик

Admin
ERROR: S client not available

Vladimir
15.08.2017
15:57:58
То есть первые два-три-четыре уровня информативные но при этом содержат мало наборов данных
То есть может быть miscellaneous.(group).(app).(dc).(aggregation).(host).(metric) например

ptchol
15.08.2017
15:59:35
а кто то крутил kapacitor + graphite ?
там вроде оно умеет в graphite input с масочками

Vladimir
15.08.2017
15:59:38
Впрочем исторически у нас слишком много разных схем

Evgeny
15.08.2017
16:08:17

Vladimir
15.08.2017
16:08:43
Тут дело в том что find относительно лёгкий
Так что особой прям разницы не будет, но по той же причине лучше идти от того что матчится сначала и чаще к тому что реже

Evgeny
15.08.2017
17:04:33
clickhouse (carbonapi + graphite-clickhouse ) в качестве хранения метрик у меня так и не взлетает, на запись да все ок, а на чтение там где carbonapi + carbonserver сервер требуют 25% CPU и 30Гб памяти суммарно на весь поток, clickhouse уже на 30% трафика CPU в 90% и по памяти быстро улетает в оом, некоторые запросы у меня не помещались по элементам увеличивал параметры
<max_query_size>104857600</max_query_size>
<max_ast_elements>100000</max_ast_elements>
<use_uncompressed_cache>1</use_uncompressed_cache>
<max_concurrent_queries>500</max_concurrent_queries>
<uncompressed_cache_size>17179869184</uncompressed_cache_size>
все бесполезно, куда копать непонятно

Алексей
15.08.2017
17:06:54
есть тут парни на канале кх
их не спрашивл ?

Google

Алексей
15.08.2017
17:07:18
https://t.me/clickhouse_ru

Vladimir
15.08.2017
17:07:57

Evgeny
15.08.2017
17:08:03
пока не, тут вроде ближе к теме метрик вроде уже есть кто успешно запустил у себя, потом там спрошу, я там есть )

Vladimir
15.08.2017
17:08:20
И количество глобов в запросе в 0 (бесконечно)

Алексей
15.08.2017
17:08:27
ну я вижу что есть. но с такими вот лучше туда

Evgeny
15.08.2017
17:08:33

Roman
15.08.2017
18:35:06

Evgeny
15.08.2017
18:38:58

Roman
15.08.2017
18:44:48

Evgeny
15.08.2017
18:46:02

Anatoliy
15.08.2017
19:08:17
Может кто пояснить что я сделал не так если не сложно? (Python Exporter) https://gist.github.com/anonymous/3a89b036b5aac9a99b7e245bc6626302
Интересует собственно Gauge, остальные два вроде срабатывают, правда зачем это делать так - мне до сих пор не ясно... сами значения там тоже те что первые под руку попались, конкретно их я так понимаю лучше самому пушить вроде?
Нужно то немного - что бы скрипт выполнялся только по запросу. Всё! А в этом случае я так понимаю оно выполняется каждую секунду...

Evgeny
16.08.2017
06:45:56

Vladimir
16.08.2017
07:07:10
@ihard а по времени ответа оно как? И что в логах у carbonapi и clickhouse'а в моменты запросов? Просто поведение очень похоже на раскрытие глобов в запросах все же

Evgeny
16.08.2017
07:28:27

Vladimir
16.08.2017
07:32:47
А что в плане фоновых мержей в кх?
КХ не очень любит маленькие куски и выборку по ним
либо делать бутерброд из Buffer поверх GraphiteMergeTree
и селектить из буфера

Evgeny
16.08.2017
07:43:13