
Andrey
22.05.2017
19:00:15
ну да, но иногда может бы было интересно глянуть, у нас тут просто недавно было любопытное, клиент на OpenVZ виртуалки делал LA за 100 влёгкую, почти не дёргая диск и сеть один
вот думаю такое бы как раз что то интересное показало

Denys ??
22.05.2017
19:23:31
> в collectd есть какой то схоже называемый плагин, но по нему ни доки, да и в инфлюкс с графаной он что то вроде не то шлёт, ну или это там надо как то хитро считать.
Это какой плагин? Там collectd надо рассказать что куда слать
Но ввобще не все ли равно? Ну упираешься ты не в сам процессор, а в скорость памяти?

Google

Denys ??
22.05.2017
19:28:30
в 99% случаев однохренственно. Но с точки зрения перформанс инженера конечно разные вещи
а, нашел, intel_rdt плагин. Должен слать, если железо / ядро отдает

Andrey
22.05.2017
19:34:08

Denys ??
22.05.2017
19:34:26
не, intel_rdt

Andrey
22.05.2017
19:39:54
эх, чего то в чуть не свежую бубунту они его не завезли наверное ещё

Denys ??
22.05.2017
19:42:44
да, titptop этот тоже требует libpapi, который только в трасти и выше.

Andrey
22.05.2017
19:43:48
ну tiptop пщказывает, а коллектд из ихних апстриам реп что то не хочет заводится с этим плагином, ладно попозже гляну

Ivan
23.05.2017
05:15:32
Если нагрузка самописная то IPCями можно тыкать в разработчиков. Это как минимум кейс для возможной оптимизации приложения.

Алексей
23.05.2017
08:51:55
Господа, а тут есть еще страдальцы с influxdb ? Давайте подумаем как подбирать оптимальный размер шарда ?

Andrey
23.05.2017
08:53:57
ты уточни требования, а то напридумывают всякого, а поди хайлоад какой :) вот у меня в него срёт три калеки и никаких страданий вроде

Алексей
23.05.2017
08:54:43
требования 40м кардиналити 75к метрик в секунду
дефолтный размер шарда у них неделя.

Google

Алексей
23.05.2017
08:55:22
тоесть полный компакт будет раз в неделю.
я сейчас ставлю дневной шард. компакт фулл раз в сутки.. длится примерно 6 часов.
чот я думаю надо бы его еще уменьшить
не понимаю как это скажется на производительности
на опыте эластика должно быть хорошо.

Andrey
23.05.2017
08:57:17
А вынести куда нибудь на SSD не вариант, нынче модно и много где спасает вроде

Алексей
23.05.2017
08:57:20
но это как бы совсем разные базы
быстрее только в память писать
или блочный девайс по имени /dev/null

Ivan
23.05.2017
09:29:32

Алексей
23.05.2017
09:30:03
стока iops не бывает. кстати места тоже
впрочем я так делаю. :)
но не совсем.
у меня две базы. одна короткая для запросов оперативных. вторая долгая. для типа аналитики

Ivan
23.05.2017
09:32:17
понятно, да простые костыли уже сделаны :)

Алексей
23.05.2017
09:33:14
да вот я и пошел смотретьварианты которые еще н етыкал.
а не тыкал я как раз размер шарда

yuyu
23.05.2017
09:39:36
https://www.usenix.org/conference/fast16/technical-sessions/presentation/andersen
Кто нибудь пробовал/смотрел на такого зверя? Описано красиво, для простых числовых метрик вроде как самое то. Решение не коробочное, конечно, но что-то в этом есть...
Интересно бы это с КХ сравнить и графану прикрутить.

Ivan
23.05.2017
09:41:13

Google

Алексей
23.05.2017
09:41:30
https://docs.influxdata.com/influxdb/v1.2/concepts/storage_engine/

yuyu
23.05.2017
09:48:58
Что-то influx стала доставать своей непредсказуемостью и их непонятной логикой развития. До какого-то момента было приемлемо (по ~20М серий), а потом бац! И приехали. В какой мере КХ можно как альтернативу рассматривать? Что приобрету/потеряю? Текущий основой объём данных - netflow c несколькими схемами агрегации. Задач две - оператиные картинки за последние часы-сутки и аналитика/тренды за год-два. Ну и с разных legacy RRD хочется слезть в перспективе для других данных.

Vladimir
23.05.2017
09:49:56
grafana/grafana: v4.3.0 was tagged

yuyu
23.05.2017
09:50:18

Vyacheslav
23.05.2017
09:58:59
Кликхауз мы будем втыкать вместо influx (тоже достал своими приколами) и не в варианте graphouse, а в полноценном виде "а ля influx". ETA пока не спрашивайте, рано ))
По последним нашим тестам кликхауз рвет инфлюкс раза в 4, про стабильность вообще молчу

Алексей
23.05.2017
09:59:30
https://github.com/influxdata/influxdb/blob/master/CHANGELOG.md
последний релиз 1,2,2.
но уже есть 1,2,4

yuyu
23.05.2017
10:01:13

Алексей
23.05.2017
10:01:30
просто 4 слишком мало. даже для "в".

Evgeny
23.05.2017
10:01:50

Vyacheslav
23.05.2017
10:02:27
В 4 по памяти, инфлюкс любит ее очень, проц чуток поменьше, iops та вообще на порядок вроде
Мы - маленькая команда, которая пилит свой уютненьний мониторинг на основе grafana + clickhouse + telegraf ))

Алексей
23.05.2017
10:04:07

Andrey
23.05.2017
10:05:06

Алексей
23.05.2017
10:05:48

Vyacheslav
23.05.2017
10:06:05
То что у него внешнее - да, бяка, то что свое плагинами - весьма ок

Andor
23.05.2017
10:06:46
телеграф сука бажная пиздец

Алексей
23.05.2017
10:07:51

Google

Алексей
23.05.2017
10:08:06
кроме трекера

Andor
23.05.2017
10:08:20
https://github.com/influxdata/telegraf/issues
у нас ребята девелоперы в него закопались
фиксят что-то

Алексей
23.05.2017
10:09:13
давать ссылку на трекер моветон.

Zhenia
23.05.2017
10:09:32
А кто-то копал в сторону КХ в качестве сторейджа для прома?

Алексей
23.05.2017
10:09:43

Admin
ERROR: S client not available

yuyu
23.05.2017
10:12:59

Алексей
23.05.2017
10:15:03
@yuyugame 50-100М кардиналити ?
то что они зовут numSeries ?

yuyu
23.05.2017
10:19:24
Ну да. 50-100 - это "на вырост", пока ~30M/. "Готовить" легко - навешиваются теги на routerID/srcAS/dstAS/in/outInterface/etc - и готово. ? Хотелось бы и больше навесить, но инвалид и это с трудом переваривает.

Алексей
23.05.2017
10:19:58
какое железо под это дело?

Andor
23.05.2017
10:20:59
kapacitor на первый взгляд выглядит как riemann

Vladimir
23.05.2017
10:31:07

Алексей
23.05.2017
10:31:44
4.3.0-stable (2017-05-23)

Vyacheslav
23.05.2017
10:32:12

Антон
23.05.2017
10:33:20
вопрос , если node_exporter ставить на target хосты, надо на этих хостах ограничивать доступ к /metrics через nginx, кто как делает?

yuyu
23.05.2017
10:44:09

Google

Anton
23.05.2017
13:04:06
есть чо почитать ?
бажная бажная
пытался прикрутить к ней сборку по процессам метрички, с бриджем в пром, умирает в рандомное время в течении 8 часов

Andor
23.05.2017
13:06:26
нам пришлось ставить рестарт в крон
как-то можно жить

Anton
23.05.2017
13:07:11

Andor
23.05.2017
13:07:31
мы его не пробовали
у нас мало жавы
а чо, он "ниочень"?

Anton
23.05.2017
13:08:15
а чо, он "ниочень"?
ну как сказать, если ты решил "подебажить", "потрейсить" приложение и хочешь данные по всему вообще, то jmx-exporter наверное плохое решение
память течет, долгий, проц жрёт как не в себя
но, я его не как агент, а как java -jar запускаю

Zhenia
23.05.2017
13:28:36
как агент работает нормально, но я не дебажу, а собираю данные по GC и использованию cpu
если начать собирать больше ~200 метрик, начинает жрать проц и течь по памяти, да

Anton
23.05.2017
13:48:44

Zhenia
23.05.2017
13:50:07
ну, я из-за этого фильтрую не нужные метрики, а то на 1к метрик, он тек по ~600mb в день
хоть джаву учи, для устранения меморилика

Sergey
23.05.2017
13:56:35
Можно питоном и JPyPe (http://jpype.sourceforge.net/)
Полученные значения уже обрабатываются на раз и в графит/куда-нить ещё отправляются

Zhenia
23.05.2017
13:59:03
да, как вариант написать свой экспортер на питоне
спасибо, я подумаю