@metrics_ru

Страница 650 из 681
Terminator
26.09.2018
06:18:10
@Roman_Zhylak будет жить. Поприветствуем!

terry
26.09.2018
06:19:16
Я имел ввиду вот это https://sourceforge.net/projects/ipt-netflow/
другого варианта кроме пересобрать ядро нет? мне для клауда, если там рухнет ядро и ос - пичаль беда будет, все заново сетапить...

Andor
26.09.2018
06:19:44
Ты как будто руками сетапишь

terry
26.09.2018
06:21:16
Ты как будто руками сетапишь
мне время терять не хочеться на установку и настройку с 0 clickhouse Базы и фаервола в ос

Google
Andor
26.09.2018
06:22:04
Ты как будто руками устанавливаешь и настраиваешь

terry
26.09.2018
06:24:30
Ты как будто руками устанавливаешь и настраиваешь
это пол часа времени, кто мне его оплатит? если есть другие варианты, то зачем сразу прыгать на тот, что может в 50% случаев сломать ос ? логика не очень

Andor
26.09.2018
06:25:45
это конечно ваще не в тему к твоему изначальному вопросу, но мне кажется что тебе надо вопрос автоматического разворачивания хостов, без ручных операций

а трафик на хосте смотреть - прометей с node_exporter должны уметь

без всяких netflow

terry
26.09.2018
06:28:30
Andor
26.09.2018
06:28:49
вряд ли тебе надо считать "сколько байт утекло с этого хоста на этот"

думаю тебе просто счётчики с интерфейсов снимать уже поможет

bebebe
26.09.2018
06:38:15
Насколько я помню DO сам представляет метрики по потреблению сети у дроплета и сам их умеет рисовать

terry
26.09.2018
06:38:42
Насколько я помню DO сам представляет метрики по потреблению сети у дроплета и сам их умеет рисовать
мне не нужно в вебморде, мне нужно в моем мониторинге, это ведь логично?

api их это не позволяет делать, уже 5 лет запрос валяеться в комьюнити

bebebe
26.09.2018
06:46:45
не знаю что для вас логично, а что нет

Andor
26.09.2018
06:47:52
я на каким-то их докладе слышал что они чуть ли не прометей выставляли как api для клиентов

Google
terry
26.09.2018
06:49:19
не знаю что для вас логично, а что нет
ну епрст, у меня есть мониторинг, в нем несколько десятков серверов как железных, так и виртуальных а для метрик и алертов мне нужно лезть в админку DO и клепать еще алерты и тд? вы не находите, что это не есть нормально? тогда логично будет, на каждый сервер, влепить по минимониторингу и вебморде и ходить на каждый отдельн...??

потому и пришел сюда

Andor
26.09.2018
06:52:56
а графики какие-нибудь в админке есть?

terry
26.09.2018
06:56:04
ответ - много

bebebe
26.09.2018
06:56:38
тогда оптимально ставить node_exporter без всякого netflow

terry
26.09.2018
06:56:42
вобщем ладно, спасибо, будем смотреть на прометей

Andor
26.09.2018
06:59:52
https://assets.digitalocean.com/articles/pdocs/screenshots/droplets/graphs-agent-mouseover.png
вот это не из прометея ли грузится?

bebebe
26.09.2018
07:00:19
что у них внутри - мне не известно

Nklya
26.09.2018
07:04:59
похоже что агент умеет отдавать метрики в формате прома А агент ставится по дефолту как я помню

bebebe
26.09.2018
07:05:49
хехе, https://digitalocean.uservoice.com/forums/136585-digitalocean/suggestions/4325151-expose-graph-data-through-api?page=3&per_page=20 с 2013 история тянется

Alex
26.09.2018
07:16:48
похоже что агент умеет отдавать метрики в формате прома А агент ставится по дефолту как я помню
не ставится он по дефолту, однако график сети и без него в админке видно

vladimir
26.09.2018
07:18:04
никто это чудо не трогал ?: https://cloud.google.com/stackdriver

terry
26.09.2018
07:45:57
не ставится он по дефолту, однако график сети и без него в админке видно
хер там плавал, если ставишь галочку мониторить дроплет, то агент автоматом уже идет в поставке ps aux | grep agent nobody 741 0.0 0.5 388276 11580 ? Ssl Sep21 1:12 /opt/digitalocean/bin/do-agent -log_syslog Я это и сделал, мне прилетел клиент

Alex
26.09.2018
07:47:10
да, но это не по дефолту, отметить надо явно

Google
terry
26.09.2018
07:54:37
добрый вечер...

Konstantin
26.09.2018
08:00:18
добрый вечер...
С новым годом, я как то видел варианты netflow без модификации ядра ?

terry
26.09.2018
08:00:55
С новым годом, я как то видел варианты netflow без модификации ядра ?
еще раз, в моем с лучае в DO этого по дефолту нет

так понятнее?

buttno
26.09.2018
08:04:37
Странное желание централизованный мониторинг вне хостера, особенно с sla do @terrifilch можно вопрос, в суппорт писали про это? DO с 2016 года держит все метрики дроплетов в проме

terry
26.09.2018
08:05:39
Странное желание централизованный мониторинг вне хостера, особенно с sla do @terrifilch можно вопрос, в суппорт писали про это? DO с 2016 года держит все метрики дроплетов в проме
фууххх мне нужно мониторить не ос, ее аптайм, а мерять потреьляемые трафики в разные периодны дня и ночи, при нагрузках и без, это все лить в одно место и там все это показывать руководству и кодерам

как мне еще это пояснить?

buttno
26.09.2018
08:06:12
Пояснить можно для чего это лить в одно место?

Сложно понять лишь этот момент

terry
26.09.2018
08:07:12
Пояснить можно для чего это лить в одно место?
да потому, что мониторинг уже есть и рожать на каждое облако новые - нет смысла

вобщем забудьте, спасибо за помощь

terry
26.09.2018
08:07:47
буду думать

buttno
26.09.2018
08:09:09
Нет смысла. В суппорт писать лень. Все тлен.

Vladimir
26.09.2018
09:11:29
слушайте, а кто сталкивался с проблемой, что прометеус 2 в один момент сжирает все место на диске

скачком

Google
Vladimir
26.09.2018
09:34:18
На самом деле он может влёт за ночь сожрать 400 гигов

При стандартном объеме гигов в 30

А если ему дать терр свободного места

То он и террабайт сожрёт

Andor
26.09.2018
09:35:08
а метрики откуда?

Vladimir
26.09.2018
09:35:15
В базе куча *.tmp файлов

Andor
26.09.2018
09:35:42
"куча" это сколько?

Vladimir
26.09.2018
09:36:24
450гигов разделить на 11~ 49 файлов по 11 гигов

Метрики скрейпятся из телеграфа и из http сервисов на хостах

Admin
ERROR: S client not available

Vladimir
26.09.2018
09:36:58
+ из нескольких кластеров кубернетиса

Andor
26.09.2018
09:37:01
то есть 450гб тмп файлов?

Vladimir
26.09.2018
09:37:11
Да, верно

Andor
26.09.2018
09:37:32
как-то это не здорово

а версия какая?

Vladimir
26.09.2018
09:38:15
2.3.2

В интернетах пишут про баг в кампакшене tsdb

Andor
26.09.2018
09:39:49
где именно в интернетах?

а сколько у тебя метрик в секунду и сколько всего таймсерий

у нас были подобные проблемы когда господа разработчики начали писать юзерагент клиентов в лейбл

Google
Andor
26.09.2018
09:44:28
500 мегабайт метрик с инстанса

evix
26.09.2018
09:44:36
а чо нормально же

Vladimir
26.09.2018
12:40:31
Метрик 2000 в секунду. Ну то есть это не то, что к нам все время едет много

Обычный рейт 10 г в день

А тут оп и - 460 гигов за ночь

terry
26.09.2018
12:54:16
А тут оп и - 460 гигов за ночь
логи, трафик по времени, с какого хоста ну и тд

это же типичный дебаг...

Vladimir
26.09.2018
13:04:16
За три дня никаких изменений в паттерны скрейпинга, в количестве семплов, в трафике. Просто в один момент, судя по всему, tsdb всглючивает и не может скомпактить данные или пишет одни и те же данные по несколько раз. Количество семплов в секунду и метрик не менялось. Три дня работало и писало по 10 гигов в день, а потом взяло и записало 400 гигов. Роста объема метрик и семплов в 40 раз не было

Дмитрий
26.09.2018
14:09:14
Колеги, вопрос по icinga2 и созданию проверок. Сritical/config: Error: Validation failed for object 'np1.server.loc!nsp-local-network' of type 'Service'; Attribute 'check_command': Object 'win-local-network' of type 'CheckCommand' does not exist. хотя на ноде прописанно в "C:\Program Files\ICINGA2\share\icinga2\include\command-nscp-local.conf" (команда для примера) object CheckCommand "win-local-network" { import "nscp-local" arguments += { "--warning" = { value = "uptime < 10m" } "--critical" = { value = "uptime < 5m" } } vars.nscp_query = "check_uptime" }

куда копать то ?

Andor
26.09.2018
14:22:07
Вроде в тексте написано что не так

Дмитрий
26.09.2018
14:30:47
Вроде в тексте написано что не так
хм.. что не описан "win-local-network" does not exist. но ниже я привел листинг что на ноде оно описанно

Andor
26.09.2018
14:34:55
Значит не туда пишешь

Дмитрий
26.09.2018
14:35:09
Andor
26.09.2018
14:37:06
Понятия не имею

Исингу2 нии разу не использовал, тем более на винде

bebebe
26.09.2018
14:38:36
кстати, а тут есть счастливые владельцы thruk?

Дмитрий
26.09.2018
14:42:17
Понятия не имею
значит тови слова не имели смысла. печально..

Andor
26.09.2018
14:44:46
Что-то нелогичное сказал?

По-моему всё логично

Дмитрий
26.09.2018
14:50:00
Что-то нелогичное сказал?
слов много - смысла нет

Страница 650 из 681