@metrics_ru

Страница 219 из 681
Ivan
26.07.2017
18:18:11
запутался

объясните)

Uncel
26.07.2017
18:19:03
https://groups.google.com/forum/#!topic/prometheus-users/PcQy2Yikd5U

Ivan
26.07.2017
18:19:47
https://groups.google.com/forum/#!topic/prometheus-users/PcQy2Yikd5U
Тогда уточняющий вопрос - это должно быть на клиенте в виде агента?

Google
Ivan
26.07.2017
18:20:03
или snmp explorer - это часть серверная?

и она гуляет на устройства по v1/v2/v3 и собирает данные, как это делает заббикс, а потом отдает их прометеусу?

Uncel
26.07.2017
18:20:58
или snmp explorer - это часть серверная?
аналог любого snmp poller-а

Ivan
26.07.2017
18:21:42
точно
и вот мне нужно было обойти 3 чата с одним и тем же вопросом, в которых ты есть, что бы ты мне ответил?

Сережа, у меня сейчас пригорит)

Uncel
26.07.2017
18:22:03
тематика

Ivan
26.07.2017
18:22:39
ну ты мудак (с)

Sergey
26.07.2017
18:22:51
ну ты мудак (с)
попрошу без этого самого

Ivan
26.07.2017
18:23:30
попрошу без этого самого
ну это фраза из "Самый лучший фильм"

Sergey
26.07.2017
18:23:36
я знаю

Google
Ivan
26.07.2017
20:46:28
И с графаной и кликхаусом и топологией
Топология не нужна. Нужны тригеры и скрипты)

Sergey
26.07.2017
20:47:35
Топология не нужна. Нужны тригеры и скрипты)
вы живете в прошлом веке! вам нужны микросервисы и пайплайны, а не триггеры и скрипты!

Алексей
26.07.2017
20:47:57
Тогда всё равно НОК. Но про топологию надо ещё раз подумать

Sergey
26.07.2017
20:49:30
Сережа, прекращай)
ну обсудили сто раз же уже. если у тебя уже все настроено на твой заббикс и тебе хватит производительности одного бокса на твою инфраструктуру и она не будет расти - ну зачем велосипед изобретать?

Sergey
26.07.2017
20:50:07
ты же посчитал что тебе потребуется 10к nvps. и на 10k nvps производительности хватит.

Ivan
26.07.2017
20:50:36
Потому как железка не своя, а облачная. И не хочется за неё огромные бюджеты ежемесячно отстегивать

GithubReleases
26.07.2017
23:23:00
https://github.com/influxdata/telegraf/releases/1.3.5 was tagged

https://github.com/influxdata/telegraf/releases/1.3.5 was tagged

Alexandr
27.07.2017
07:51:34
Какую задачу вы хотите этим решить?
Алертинг на метрики у которых порог стоит наверху, а она сама уползла вниз

Pablo
27.07.2017
07:53:19
а зачем?

Alexandr
27.07.2017
07:54:32
Я понял, что ответа на первоначальный вопрос нет, но готов поиграть. Потому что может эксплуатация может поймать гавно вырубившее одного клиентоса до реального факапа.

Google
Andor
27.07.2017
07:55:03
блин, я не тормоз

Alexandr
27.07.2017
07:55:55
Потому, что 100 загрузка БД это событие с приоритетом 1, а загрузка БД в 15% (вместо стандартных 50) это аномалия

И руткозом такой херни может быть одно из сотни минорных мигающих событий

Zhenia
27.07.2017
08:04:24
ладно, чат. Может у кого-то есть тулза которая бы данные из прома забирала и писала в графит?

Andrei
27.07.2017
08:05:28
Какую задачу вы хотите этим решить?
Например, помощь в поиске rootcause, когда незначительные события могут влиять на важные вещи.

Alexandr
27.07.2017
08:05:43
что ты дальше с ней делать будешь, с этой аномалией
Дальше я ее запихну в руткоз и посмотрю, на что может влиять и что ее родило

К чему вопросы-то? Тебе просто интересно как мы это используем или хочешь плавно подвести к тому, что этот механизм нам ни в рот ни в уши не уперся?

Vladimir
27.07.2017
08:06:44
@yelowhut про anomaly detection - область новая и нормальных универсальных решений кажется нет от слова совсем

потому что чуваки пишут алгоритмы под задачу конкретную

Vladimir
27.07.2017
08:07:25
Перестань… мы эту хрень толкали с 2009
но тем не менее с 2009 года ничего не поменялось жи

Alexandr
27.07.2017
08:07:36
нормализовать функцию и взять от нее производную - не так сложно

Vladimir
27.07.2017
08:07:38
как народ под каждый конкретный случай писал велосипеды так и пишет

Alexandr
27.07.2017
08:07:57
Трабла в том, что я таких механизмов в нормальных решениях не видел, только в кровавом ынтерпрайзе

(а на него теперь денег нет)

Vladimir
27.07.2017
08:08:17
ну так напиши сам :)

это стандартный, увы, подход нынче

Google
Alexandr
27.07.2017
08:08:57
Это да… Но вопрос у товарища стоял вполне четкий - “есть ли что-то?”

И на этот вопрос первый ответ был “Зачем?”

Vladimir
27.07.2017
08:09:19
ну вот ответ на вопрос товарища "нет, нету, пиши сам"

Alexandr
27.07.2017
08:10:00
Блин... придется и дальше толкать кровавый значит :/

Vladimir
27.07.2017
08:10:15
или взять и запилить свое )

Alexandr
27.07.2017
08:10:55
Нет у нас денег на запилить. Я раб галерный

Vladimir
27.07.2017
08:11:05
на ынтерпрайз есть, а на запилить нет? )

Admin
ERROR: S client not available

Alexandr
27.07.2017
08:11:26
Так интегратор, вся фигня

Яж не для себя

Точнее нам доя себя тоже надо

Alexandr
27.07.2017
08:14:05
Ну вроде несколько человек сказали, как это используют

Pablo
27.07.2017
08:14:05
нормализовать функцию и взять от нее производную - не так сложно
можно подробнее пожалуйста? это подходит только для каких-то случаев или в общем? как нормализовать? Что потом с этой производной?

Zhenia
27.07.2017
08:14:32
прометей вроде сам это умел?
если ты про ремоут адаптер - то он замедляет производительность

но я так понимаю, ничего нету и нужно на его основе костылять нужное мне

Andor
27.07.2017
08:15:08
а, ты хочешь асинхронно?

думаю нету

Zhenia
27.07.2017
08:15:25
я хочу что бы за сутки до удаления данные переливались в графит

Google
Andor
27.07.2017
08:15:27
ну либо ты (возможно) можешь поставить рядом прометей, сделать его как федерейшн к первому и с него в графит засылать

Alexandr
27.07.2017
08:15:34
можно подробнее пожалуйста? это подходит только для каких-то случаев или в общем? как нормализовать? Что потом с этой производной?
Можно. Усредняй значения верхними и нижними персинтилями, 10 и 90 нааоимер. Строй доверительный интервал с переносом день в день

Pablo
27.07.2017
08:15:47
Например, помощь в поиске rootcause, когда незначительные события могут влиять на важные вещи.
это некое абтракнтное представление, что такое бывает* или опыт есть и конкретные примеры?

Pablo
27.07.2017
08:16:20
В смысле считаем среднее на окне от 10 и 90 перцентилей и сомтрим когда оно вылетает из него?

Alexandr
27.07.2017
08:16:36
Ез

Верхний и нижний порог динамический

Pablo
27.07.2017
08:16:50
btw offtop — тут постинг вакансий разрешен?

Alexandr
27.07.2017
08:17:11
Ща скриншот попробую найти из кровавого проекта

Pablo
27.07.2017
08:17:49
ок, а какой "класс аномалий" оно находит и какой пропускает, и как по опыту — когда пригождалось.

есть тут "правила канала" где нибудь, чтоб посомтреть можно ли job posting?

Alexandr
27.07.2017
08:20:03
Уточни про класс аномалий. Короче, дальше из проектного начну гнать. Берем тупую цифру - %диск спейс юзед. Триггеры на 80/90. Приклад банковский начинает срать на файловую систему - это для него плохо. Три месяца до этого - 5% бзед в среднем

Юзед

Вот у тебя по статике алерт будет хер знает когда

Zhenia
27.07.2017
08:20:26
ну, тут правило говорить о метриках и мониторинге

Alexandr
27.07.2017
08:20:29
А по динамике - уже

Можно снизить статику

Pablo
27.07.2017
08:20:47
Ез
вот я вижу в описанной схеме проблемы, но может я не до конца понял как мы "аномалии" считаем. ща попробую сформулировать уточняющий вопрос

Zhenia
27.07.2017
08:20:48
так что если вакансия про метрики или мониторинг - то наверное можно

Страница 219 из 681