
Ivan
26.07.2017
18:18:11
запутался
объясните)

Uncel
26.07.2017
18:19:03
https://groups.google.com/forum/#!topic/prometheus-users/PcQy2Yikd5U

Ivan
26.07.2017
18:19:47

Google

Ivan
26.07.2017
18:20:03
или snmp explorer - это часть серверная?
и она гуляет на устройства по v1/v2/v3 и собирает данные, как это делает заббикс, а потом отдает их прометеусу?

Uncel
26.07.2017
18:20:58

Sergey
26.07.2017
18:21:11

Uncel
26.07.2017
18:21:18

Ivan
26.07.2017
18:21:42
точно
и вот мне нужно было обойти 3 чата с одним и тем же вопросом, в которых ты есть, что бы ты мне ответил?
Сережа, у меня сейчас пригорит)

Uncel
26.07.2017
18:22:03
тематика

Sergey
26.07.2017
18:22:19

Ivan
26.07.2017
18:22:39
ну ты мудак (с)

Sergey
26.07.2017
18:22:51

Ivan
26.07.2017
18:23:30

Sergey
26.07.2017
18:23:36
я знаю

Google

Andrey
26.07.2017
20:39:01

Алексей
26.07.2017
20:41:09
И с графаной и кликхаусом и топологией

Ivan
26.07.2017
20:46:28

Sergey
26.07.2017
20:47:35

Алексей
26.07.2017
20:47:57
Тогда всё равно НОК. Но про топологию надо ещё раз подумать

Ivan
26.07.2017
20:48:00

Sergey
26.07.2017
20:49:30
Сережа, прекращай)
ну обсудили сто раз же уже. если у тебя уже все настроено на твой заббикс и тебе хватит производительности одного бокса на твою инфраструктуру и она не будет расти - ну зачем велосипед изобретать?

Ivan
26.07.2017
20:49:50
в это и упираемся)

Sergey
26.07.2017
20:50:07
ты же посчитал что тебе потребуется 10к nvps. и на 10k nvps производительности хватит.

Ivan
26.07.2017
20:50:36
Потому как железка не своя, а облачная. И не хочется за неё огромные бюджеты ежемесячно отстегивать

GithubReleases
26.07.2017
23:23:00
https://github.com/influxdata/telegraf/releases/1.3.5 was tagged
https://github.com/influxdata/telegraf/releases/1.3.5 was tagged

Pablo
27.07.2017
07:49:07

Alexandr
27.07.2017
07:51:34

Pablo
27.07.2017
07:53:19
а зачем?

Alexandr
27.07.2017
07:54:32
Я понял, что ответа на первоначальный вопрос нет, но готов поиграть. Потому что может эксплуатация может поймать гавно вырубившее одного клиентоса до реального факапа.

Andor
27.07.2017
07:54:39

Google

Andor
27.07.2017
07:55:03
блин, я не тормоз

Alexandr
27.07.2017
07:55:55
Потому, что 100 загрузка БД это событие с приоритетом 1, а загрузка БД в 15% (вместо стандартных 50) это аномалия
И руткозом такой херни может быть одно из сотни минорных мигающих событий

Zhenia
27.07.2017
08:04:24
ладно, чат. Может у кого-то есть тулза которая бы данные из прома забирала и писала в графит?

Pablo
27.07.2017
08:04:53

Andrei
27.07.2017
08:05:28

Alexandr
27.07.2017
08:05:43
К чему вопросы-то? Тебе просто интересно как мы это используем или хочешь плавно подвести к тому, что этот механизм нам ни в рот ни в уши не уперся?

Vladimir
27.07.2017
08:06:44
@yelowhut про anomaly detection - область новая и нормальных универсальных решений кажется нет от слова совсем
потому что чуваки пишут алгоритмы под задачу конкретную

Alexandr
27.07.2017
08:07:12

Vladimir
27.07.2017
08:07:25

Alexandr
27.07.2017
08:07:36
нормализовать функцию и взять от нее производную - не так сложно

Vladimir
27.07.2017
08:07:38
как народ под каждый конкретный случай писал велосипеды так и пишет

Alexandr
27.07.2017
08:07:57
Трабла в том, что я таких механизмов в нормальных решениях не видел, только в кровавом ынтерпрайзе
(а на него теперь денег нет)

Vladimir
27.07.2017
08:08:17
ну так напиши сам :)
это стандартный, увы, подход нынче

Google

Alexandr
27.07.2017
08:08:57
Это да… Но вопрос у товарища стоял вполне четкий - “есть ли что-то?”
И на этот вопрос первый ответ был “Зачем?”

Vladimir
27.07.2017
08:09:19
ну вот ответ на вопрос товарища "нет, нету, пиши сам"

Alexandr
27.07.2017
08:10:00
Блин... придется и дальше толкать кровавый значит :/

Vladimir
27.07.2017
08:10:15
или взять и запилить свое )

Alexandr
27.07.2017
08:10:55
Нет у нас денег на запилить. Я раб галерный

Vladimir
27.07.2017
08:11:05
на ынтерпрайз есть, а на запилить нет? )

Admin
ERROR: S client not available

Alexandr
27.07.2017
08:11:26
Так интегратор, вся фигня
Яж не для себя
Точнее нам доя себя тоже надо

Pablo
27.07.2017
08:12:47

Alexandr
27.07.2017
08:14:05
Ну вроде несколько человек сказали, как это используют

Pablo
27.07.2017
08:14:05

Andor
27.07.2017
08:14:05

Zhenia
27.07.2017
08:14:32
но я так понимаю, ничего нету и нужно на его основе костылять нужное мне

Andor
27.07.2017
08:15:08
а, ты хочешь асинхронно?
думаю нету

Zhenia
27.07.2017
08:15:25
я хочу что бы за сутки до удаления данные переливались в графит

Google

Andor
27.07.2017
08:15:27
ну либо ты (возможно) можешь поставить рядом прометей, сделать его как федерейшн к первому и с него в графит засылать

Alexandr
27.07.2017
08:15:34

Pablo
27.07.2017
08:15:47

Alexandr
27.07.2017
08:16:04

Pablo
27.07.2017
08:16:20
В смысле считаем среднее на окне от 10 и 90 перцентилей и сомтрим когда оно вылетает из него?

Alexandr
27.07.2017
08:16:36
Ез
Верхний и нижний порог динамический

Pablo
27.07.2017
08:16:50
btw offtop — тут постинг вакансий разрешен?

Alexandr
27.07.2017
08:17:11
Ща скриншот попробую найти из кровавого проекта

Pablo
27.07.2017
08:17:49
ок, а какой "класс аномалий" оно находит и какой пропускает, и как по опыту — когда пригождалось.
есть тут "правила канала" где нибудь, чтоб посомтреть можно ли job posting?

Alexandr
27.07.2017
08:20:03
Уточни про класс аномалий. Короче, дальше из проектного начну гнать. Берем тупую цифру - %диск спейс юзед. Триггеры на 80/90. Приклад банковский начинает срать на файловую систему - это для него плохо. Три месяца до этого - 5% бзед в среднем
Юзед
Вот у тебя по статике алерт будет хер знает когда

Zhenia
27.07.2017
08:20:26
ну, тут правило говорить о метриках и мониторинге

Alexandr
27.07.2017
08:20:29
А по динамике - уже
Можно снизить статику

Pablo
27.07.2017
08:20:47
Ез
вот я вижу в описанной схеме проблемы, но может я не до конца понял как мы "аномалии" считаем. ща попробую сформулировать уточняющий вопрос

Zhenia
27.07.2017
08:20:48
так что если вакансия про метрики или мониторинг - то наверное можно