@metrics_ru

Страница 164 из 681
Andrey
22.05.2017
19:00:15
ну да, но иногда может бы было интересно глянуть, у нас тут просто недавно было любопытное, клиент на OpenVZ виртуалки делал LA за 100 влёгкую, почти не дёргая диск и сеть один

вот думаю такое бы как раз что то интересное показало

Denys ??
22.05.2017
19:23:31
> в collectd есть какой то схоже называемый плагин, но по нему ни доки, да и в инфлюкс с графаной он что то вроде не то шлёт, ну или это там надо как то хитро считать. Это какой плагин? Там collectd надо рассказать что куда слать

Но ввобще не все ли равно? Ну упираешься ты не в сам процессор, а в скорость памяти?

Google
Denys ??
22.05.2017
19:28:30
в 99% случаев однохренственно. Но с точки зрения перформанс инженера конечно разные вещи

а, нашел, intel_rdt плагин. Должен слать, если железо / ядро отдает

Denys ??
22.05.2017
19:34:26
не, intel_rdt

Andrey
22.05.2017
19:39:54
эх, чего то в чуть не свежую бубунту они его не завезли наверное ещё

Denys ??
22.05.2017
19:42:44
да, titptop этот тоже требует libpapi, который только в трасти и выше.

Andrey
22.05.2017
19:43:48
ну tiptop пщказывает, а коллектд из ихних апстриам реп что то не хочет заводится с этим плагином, ладно попозже гляну

Ivan
23.05.2017
05:15:32
Мне кажется, кейс для IPC - это оптимизация приложения. Это больше для разработчиков, чем для общего мониторинга.
Соглашусь в целом. Если софт пишется не самими то IPC можно мониторить наравне с температурой на поверхности Марса. На базах данных зачастую можно видеть очень низкий IPC (но что с этим поделать это задача БД ждать данных из памяти).

Если нагрузка самописная то IPCями можно тыкать в разработчиков. Это как минимум кейс для возможной оптимизации приложения.

Алексей
23.05.2017
08:51:55
Господа, а тут есть еще страдальцы с influxdb ? Давайте подумаем как подбирать оптимальный размер шарда ?

Andrey
23.05.2017
08:53:57
ты уточни требования, а то напридумывают всякого, а поди хайлоад какой :) вот у меня в него срёт три калеки и никаких страданий вроде

Алексей
23.05.2017
08:54:43
требования 40м кардиналити 75к метрик в секунду

дефолтный размер шарда у них неделя.

Google
Алексей
23.05.2017
08:55:22
тоесть полный компакт будет раз в неделю.

я сейчас ставлю дневной шард. компакт фулл раз в сутки.. длится примерно 6 часов.

чот я думаю надо бы его еще уменьшить

не понимаю как это скажется на производительности

на опыте эластика должно быть хорошо.

Andrey
23.05.2017
08:57:17
А вынести куда нибудь на SSD не вариант, нынче модно и много где спасает вроде

Алексей
23.05.2017
08:57:20
но это как бы совсем разные базы

быстрее только в память писать

или блочный девайс по имени /dev/null

Ivan
23.05.2017
09:29:32
но это как бы совсем разные базы
А может делать экспорт архивных данных в другую БД (тоже influxdb)?

Алексей
23.05.2017
09:30:03
стока iops не бывает. кстати места тоже

впрочем я так делаю. :)

но не совсем.

у меня две базы. одна короткая для запросов оперативных. вторая долгая. для типа аналитики

Ivan
23.05.2017
09:32:17
понятно, да простые костыли уже сделаны :)

Алексей
23.05.2017
09:33:14
да вот я и пошел смотретьварианты которые еще н етыкал.

а не тыкал я как раз размер шарда

yuyu
23.05.2017
09:39:36
https://www.usenix.org/conference/fast16/technical-sessions/presentation/andersen Кто нибудь пробовал/смотрел на такого зверя? Описано красиво, для простых числовых метрик вроде как самое то. Решение не коробочное, конечно, но что-то в этом есть... Интересно бы это с КХ сравнить и графану прикрутить.

Ivan
23.05.2017
09:41:13
а не тыкал я как раз размер шарда
для меня пока что это вообще тёмный пока что

Google
Алексей
23.05.2017
09:41:30
https://docs.influxdata.com/influxdb/v1.2/concepts/storage_engine/

yuyu
23.05.2017
09:48:58
Что-то influx стала доставать своей непредсказуемостью и их непонятной логикой развития. До какого-то момента было приемлемо (по ~20М серий), а потом бац! И приехали. В какой мере КХ можно как альтернативу рассматривать? Что приобрету/потеряю? Текущий основой объём данных - netflow c несколькими схемами агрегации. Задач две - оператиные картинки за последние часы-сутки и аналитика/тренды за год-два. Ну и с разных legacy RRD хочется слезть в перспективе для других данных.

Vladimir
23.05.2017
09:49:56
grafana/grafana: v4.3.0 was tagged

yuyu
23.05.2017
09:50:18
grafana/grafana: v4.3.0 was tagged
Это уже не бета?

Vyacheslav
23.05.2017
09:58:59
Кликхауз мы будем втыкать вместо influx (тоже достал своими приколами) и не в варианте graphouse, а в полноценном виде "а ля influx". ETA пока не спрашивайте, рано )) По последним нашим тестам кликхауз рвет инфлюкс раза в 4, про стабильность вообще молчу

Алексей
23.05.2017
10:01:30
просто 4 слишком мало. даже для "в".

Evgeny
23.05.2017
10:01:50
https://www.usenix.org/conference/fast16/technical-sessions/presentation/andersen Кто нибудь пробовал/смотрел на такого зверя? Описано красиво, для простых числовых метрик вроде как самое то. Решение не коробочное, конечно, но что-то в этом есть... Интересно бы это с КХ сравнить и графану прикрутить.
Туда можно писать только batch-ами, иначе все будет очень плохо. Там нет тегов и даже иерархии как в графите, есть id-шники метрик и все. В принципе, (shameless plug) в Akumuli (https://github.com/akumuli/Akumuli) хранилище очень похожим образом работает, но не имеет перечисленных недостатков.

Vyacheslav
23.05.2017
10:02:27
В 4 по памяти, инфлюкс любит ее очень, проц чуток поменьше, iops та вообще на порядок вроде

Мы - маленькая команда, которая пилит свой уютненьний мониторинг на основе grafana + clickhouse + telegraf ))

Andrey
23.05.2017
10:05:06
Мы - маленькая команда, которая пилит свой уютненьний мониторинг на основе grafana + clickhouse + telegraf ))
Хм... телеграф, а почему? там поговаривают многое вообще внешними компонентами дёргается это не бяка?

Vyacheslav
23.05.2017
10:06:05
То что у него внешнее - да, бяка, то что свое плагинами - весьма ок

Andor
23.05.2017
10:06:46
телеграф сука бажная пиздец

Алексей
23.05.2017
10:07:51
Google
Алексей
23.05.2017
10:08:06
кроме трекера

Andor
23.05.2017
10:08:20
https://github.com/influxdata/telegraf/issues

у нас ребята девелоперы в него закопались

фиксят что-то

Алексей
23.05.2017
10:09:13
давать ссылку на трекер моветон.

Zhenia
23.05.2017
10:09:32
А кто-то копал в сторону КХ в качестве сторейджа для прома?

Admin
ERROR: S client not available

yuyu
23.05.2017
10:12:59
Мы - маленькая команда, которая пилит свой уютненьний мониторинг на основе grafana + clickhouse + telegraf ))
Какие-то оценки по юзабилити и аппаратным требованиям связки grafana-clickhouse для числа серий (в терминах influx) ~50-100M существуют? Телеграф неоднозначное впечатление оставляет, концепт вроде норм (и kapacitor - тоже), а некоторые куски под травкой, наверное, делались ? snmp plugin - вообще шедевр ?.

Алексей
23.05.2017
10:15:03
@yuyugame 50-100М кардиналити ?

то что они зовут numSeries ?

yuyu
23.05.2017
10:19:24
Ну да. 50-100 - это "на вырост", пока ~30M/. "Готовить" легко - навешиваются теги на routerID/srcAS/dstAS/in/outInterface/etc - и готово. ? Хотелось бы и больше навесить, но инвалид и это с трудом переваривает.

Алексей
23.05.2017
10:19:58
какое железо под это дело?

Andor
23.05.2017
10:20:59
kapacitor на первый взгляд выглядит как riemann

Алексей
23.05.2017
10:31:44
4.3.0-stable (2017-05-23)

Антон
23.05.2017
10:33:20
вопрос , если node_exporter ставить на target хосты, надо на этих хостах ограничивать доступ к /metrics через nginx, кто как делает?

yuyu
23.05.2017
10:44:09
4.3.0-stable (2017-05-23)
SQL datasource там можно уже юзать? Или сыро?

Google
Anton
23.05.2017
13:04:06
есть чо почитать ?
бажная бажная пытался прикрутить к ней сборку по процессам метрички, с бриджем в пром, умирает в рандомное время в течении 8 часов

Andor
23.05.2017
13:06:26
нам пришлось ставить рестарт в крон

как-то можно жить

Anton
23.05.2017
13:07:11
нам пришлось ставить рестарт в крон
у меня так сейчас, кхе кхе, jmx-exporter работает^W не работает

Andor
23.05.2017
13:07:31
мы его не пробовали

у нас мало жавы

а чо, он "ниочень"?

Anton
23.05.2017
13:08:15
а чо, он "ниочень"?
ну как сказать, если ты решил "подебажить", "потрейсить" приложение и хочешь данные по всему вообще, то jmx-exporter наверное плохое решение

память течет, долгий, проц жрёт как не в себя

но, я его не как агент, а как java -jar запускаю

Zhenia
23.05.2017
13:28:36
как агент работает нормально, но я не дебажу, а собираю данные по GC и использованию cpu

если начать собирать больше ~200 метрик, начинает жрать проц и течь по памяти, да

Zhenia
23.05.2017
13:50:07
ну, я из-за этого фильтрую не нужные метрики, а то на 1к метрик, он тек по ~600mb в день

хоть джаву учи, для устранения меморилика

Sergey
23.05.2017
13:56:35
хоть джаву учи, для устранения меморилика
тебе нужно что-то выдернуть по JMX из работающего приложения?

Можно питоном и JPyPe (http://jpype.sourceforge.net/) Полученные значения уже обрабатываются на раз и в графит/куда-нить ещё отправляются

Zhenia
23.05.2017
13:59:03
да, как вариант написать свой экспортер на питоне

спасибо, я подумаю

Страница 164 из 681