
Terminator
26.09.2018
06:18:10
@Roman_Zhylak будет жить. Поприветствуем!

terry
26.09.2018
06:19:16

Andor
26.09.2018
06:19:44
Ты как будто руками сетапишь

terry
26.09.2018
06:21:16

Google

Andor
26.09.2018
06:22:04
Ты как будто руками устанавливаешь и настраиваешь

terry
26.09.2018
06:24:30

Andor
26.09.2018
06:25:45
это конечно ваще не в тему к твоему изначальному вопросу, но мне кажется что тебе надо вопрос автоматического разворачивания хостов, без ручных операций
а трафик на хосте смотреть - прометей с node_exporter должны уметь
без всяких netflow

terry
26.09.2018
06:28:30

Andor
26.09.2018
06:28:49
вряд ли тебе надо считать "сколько байт утекло с этого хоста на этот"
думаю тебе просто счётчики с интерфейсов снимать уже поможет

bebebe
26.09.2018
06:38:15
Насколько я помню DO сам представляет метрики по потреблению сети у дроплета и сам их умеет рисовать

terry
26.09.2018
06:38:42
api их это не позволяет делать, уже 5 лет запрос валяеться в комьюнити

bebebe
26.09.2018
06:46:45
не знаю что для вас логично, а что нет

Andor
26.09.2018
06:47:52
я на каким-то их докладе слышал что они чуть ли не прометей выставляли как api для клиентов

Google

terry
26.09.2018
06:49:19
не знаю что для вас логично, а что нет
ну епрст, у меня есть мониторинг, в нем несколько десятков серверов как железных, так и виртуальных
а для метрик и алертов мне нужно лезть в админку DO и клепать еще алерты и тд?
вы не находите, что это не есть нормально?
тогда логично будет, на каждый сервер, влепить по минимониторингу и вебморде и ходить на каждый отдельн...??
потому и пришел сюда

Andor
26.09.2018
06:52:56
а графики какие-нибудь в админке есть?

bebebe
26.09.2018
06:54:22
https://assets.digitalocean.com/articles/pdocs/screenshots/droplets/graphs-agent-mouseover.png

terry
26.09.2018
06:56:04
ответ - много

bebebe
26.09.2018
06:56:38
тогда оптимально ставить node_exporter без всякого netflow

terry
26.09.2018
06:56:42
вобщем ладно, спасибо, будем смотреть на прометей

Andor
26.09.2018
06:59:52

bebebe
26.09.2018
07:00:19
что у них внутри - мне не известно

Nklya
26.09.2018
07:04:59
похоже что агент умеет отдавать метрики в формате прома
А агент ставится по дефолту как я помню

bebebe
26.09.2018
07:05:49
хехе, https://digitalocean.uservoice.com/forums/136585-digitalocean/suggestions/4325151-expose-graph-data-through-api?page=3&per_page=20
с 2013 история тянется

Alex
26.09.2018
07:16:48

vladimir
26.09.2018
07:18:04
никто это чудо не трогал ?:
https://cloud.google.com/stackdriver

terry
26.09.2018
07:45:57

Alex
26.09.2018
07:47:10
да, но это не по дефолту, отметить надо явно

Konstantin
26.09.2018
07:54:12

Google

terry
26.09.2018
07:54:37
добрый вечер...

Konstantin
26.09.2018
08:00:18
добрый вечер...
С новым годом, я как то видел варианты netflow без модификации ядра ?

terry
26.09.2018
08:00:55
так понятнее?

buttno
26.09.2018
08:04:37
Странное желание централизованный мониторинг вне хостера, особенно с sla do
@terrifilch можно вопрос, в суппорт писали про это? DO с 2016 года держит все метрики дроплетов в проме

terry
26.09.2018
08:05:39
как мне еще это пояснить?

buttno
26.09.2018
08:06:12
Пояснить можно для чего это лить в одно место?
Сложно понять лишь этот момент

terry
26.09.2018
08:07:12
вобщем забудьте, спасибо за помощь

terry
26.09.2018
08:07:47
буду думать

buttno
26.09.2018
08:09:09
Нет смысла. В суппорт писать лень. Все тлен.

vladimir
26.09.2018
08:11:39

terry
26.09.2018
08:37:25

Vladimir
26.09.2018
09:11:29
слушайте, а кто сталкивался с проблемой, что прометеус 2 в один момент сжирает все место на диске
скачком

Andor
26.09.2018
09:18:14

Google

Vladimir
26.09.2018
09:34:18
На самом деле он может влёт за ночь сожрать 400 гигов
При стандартном объеме гигов в 30
А если ему дать терр свободного места
То он и террабайт сожрёт

Andor
26.09.2018
09:35:08
а метрики откуда?

Vladimir
26.09.2018
09:35:15
В базе куча *.tmp файлов

Andor
26.09.2018
09:35:42
"куча" это сколько?

Vladimir
26.09.2018
09:36:24
450гигов разделить на 11~ 49 файлов по 11 гигов
Метрики скрейпятся из телеграфа и из http сервисов на хостах

Admin
ERROR: S client not available

Vladimir
26.09.2018
09:36:58
+ из нескольких кластеров кубернетиса

Andor
26.09.2018
09:37:01
то есть 450гб тмп файлов?

Vladimir
26.09.2018
09:37:11
Да, верно

Andor
26.09.2018
09:37:32
как-то это не здорово
а версия какая?

Vladimir
26.09.2018
09:38:15
2.3.2
В интернетах пишут про баг в кампакшене tsdb

Andor
26.09.2018
09:39:49
где именно в интернетах?
а сколько у тебя метрик в секунду и сколько всего таймсерий
у нас были подобные проблемы когда господа разработчики начали писать юзерагент клиентов в лейбл

Google

Andor
26.09.2018
09:44:28
500 мегабайт метрик с инстанса

evix
26.09.2018
09:44:36
а чо нормально же

Vladimir
26.09.2018
12:40:31
Метрик 2000 в секунду. Ну то есть это не то, что к нам все время едет много
Обычный рейт 10 г в день
А тут оп и - 460 гигов за ночь

terry
26.09.2018
12:54:16
это же типичный дебаг...

Vladimir
26.09.2018
13:04:16
За три дня никаких изменений в паттерны скрейпинга, в количестве семплов, в трафике. Просто в один момент, судя по всему, tsdb всглючивает и не может скомпактить данные или пишет одни и те же данные по несколько раз. Количество семплов в секунду и метрик не менялось. Три дня работало и писало по 10 гигов в день, а потом взяло и записало 400 гигов. Роста объема метрик и семплов в 40 раз не было

terry
26.09.2018
13:05:09


Дмитрий
26.09.2018
14:09:14
Колеги, вопрос по icinga2 и созданию проверок.
Сritical/config: Error: Validation failed for object 'np1.server.loc!nsp-local-network' of type 'Service'; Attribute 'check_command': Object 'win-local-network' of type 'CheckCommand' does not exist.
хотя на ноде прописанно в
"C:\Program Files\ICINGA2\share\icinga2\include\command-nscp-local.conf"
(команда для примера)
object CheckCommand "win-local-network" {
import "nscp-local"
arguments += {
"--warning" = {
value = "uptime < 10m"
}
"--critical" = {
value = "uptime < 5m"
}
}
vars.nscp_query = "check_uptime"
}
куда копать то ?

Andor
26.09.2018
14:22:07
Вроде в тексте написано что не так

Дмитрий
26.09.2018
14:30:47

Andor
26.09.2018
14:34:55
Значит не туда пишешь

Дмитрий
26.09.2018
14:35:09

Andor
26.09.2018
14:37:06
Понятия не имею
Исингу2 нии разу не использовал, тем более на винде

bebebe
26.09.2018
14:38:36
кстати, а тут есть счастливые владельцы thruk?

Дмитрий
26.09.2018
14:42:17

Andor
26.09.2018
14:44:46
Что-то нелогичное сказал?
По-моему всё логично

Дмитрий
26.09.2018
14:50:00