@metrics_ru

Страница 552 из 681
evix
06.06.2018
12:46:10
Alex
06.06.2018
12:46:46
не. я просто ассоциации сказал
На основании чего? Много общего мусора в одном графике?

Дмитрий
06.06.2018
12:46:56
а должны?
Желательно чтобы подсказывали)

Google
Alex
06.06.2018
12:47:33
Пробирки
такие комментарии, думаю, можно смело вычищать.

Дмитрий
06.06.2018
12:55:19
Алексей
06.06.2018
12:55:59
ну по крайней мере так было во времена когда мне это было нужно. это в районе 1,0 версии

Дмитрий
06.06.2018
12:56:37
А по алертингу ещё подскажите, у telegraf есть родной механизм через Kapacitor, есть вариант через алерты в графане. Может какие-то ещё варианты есть?

Алексей
06.06.2018
12:57:01
да. можно еще через alerta

или телеграф собирать промом и через пром

Дмитрий
06.06.2018
12:57:59
эта алерта? https://github.com/alerta/alerta

Алексей
06.06.2018
12:58:15
Дмитрий
06.06.2018
12:59:35
так, а какой способ лучше то?)

Алексей
06.06.2018
13:00:16
который вам подойдет

Google
Алексей
06.06.2018
13:00:38
тот который вам покажется легче собрать и обслуживать

Timur
06.06.2018
13:18:06
Господа, я пытаюсь приспособить прометей под мониторинг snmp и blackbox через соответствующие плагины, проблем с написанием конфигов, в общем-то, нет, вопрос: есть ли готовые интерфейсы к генерации конфигов, чтобы можно было пользователям раздать возможность добавлять узлы самостоятельно? Наваять интерфейс на том же фласке - дело нехитрое, просто может уже есть что готовое? Сходу не нагуглилось.

Ну и второй вопрос сразу: в чем лучше всего хранить time series - influx, opentsdb, может быть какие-то рсубд?

Хочу уйти от zabbix и nagios, вот тестирую пока

Пока заббикс собирает какие-то сложные метрики, а нагиос просто пингует то, что достаточно просто пинговать, а хотелось бы чего-нибудь няшного и свежего, и чтобы можно было всякие интересные алерты по корреляциям настроить. Вот взял на тестирование прометей. Область деятельности - аеспи.

M
06.06.2018
13:30:23
Ребята а как прочитать target через remote_read

Алексей
06.06.2018
13:33:43
ну вот я тут примерно такой стек накидал telegraf -> infuxdb -> {grafana, alerta}
если у вас есть возможность исключите из стека инфлюкс. в топике есть описание почему

Алексей
06.06.2018
13:34:54
даже текстовые файлы лучше него

Andor
06.06.2018
13:35:27
даже Z?

Evgeny
06.06.2018
13:35:27
Алексей
06.06.2018
13:36:18
Сколько метрик и сколько данных нужно записывать в секунду?
хм. а есть шансы что можно будет одну малоизвестную субд рекомендовать под связку telegraf -> малоизвестная -> алерты

Timur
06.06.2018
13:37:06
Сколько метрик и сколько данных нужно записывать в секунду?
Хммм, не очень много, можно, наверное где-то 10-15 обойтись. К тому же у меня филиалы, я буду туда инстансы ставить, а оттуда только какие-то агрегированные показатели снимать

Помимо чисто сетевых вещей типа загрузки портов и т.п. хотелось бы вкрутить и всякое разное оборудование и сервисы

Те же базы данных, биллинг и т.д.

M
06.06.2018
13:38:05
Ребят подскажите как можно по http забрать конфиг таргетов для прометоус или нет такого ?

Timur
06.06.2018
13:38:08
Но это в перспективе

Алексей
06.06.2018
13:38:35
Сколько метрик и сколько данных нужно записывать в секунду?
или может быть использовать малоизвестную субд под remote storage ?

Timur
06.06.2018
13:38:46
Прямо сейчас у меня одна железка раз в пару минут опрашивается, обычно где-то не больше 1500-2000 железяк на город

Google
Timur
06.06.2018
13:40:36
Практически что угодно тогда.
"что угодно" это по поводу СУБД?

Evgeny
06.06.2018
13:40:57
или может быть использовать малоизвестную субд под remote storage ?
Можно наверное, но для этого нужно сделать интеграцию с промом.

Timur
06.06.2018
13:41:54
Ок, ладно, а что по поводу морды с управлением? Велосипед написать смогу, но не хотелось бы, может уже есть готовое

Timur
06.06.2018
13:43:59
Вполне частая задача - стоял себе коммутатор, достаточно было мониторить, что он живой, а потом на него повесили эндпоинт mpls vpn, и теперь его уже надо мониторить по полной (а в идеале и транзитные узлы тоже). Конечно, база конфигурации у нас есть, но далеко не все оборудование настраивается из базы, есть места, где все ручками сделано. И вот для таких мест хотелось бы...

Дмитрий
06.06.2018
13:44:16
даже текстовые файлы лучше него
Судя по таблице в тпике, нужно ElasticSearch прикручивать?)

Алексей
06.06.2018
13:45:34
А что нужно для алертов? Текстовые поля?
думаю расчет факта аларма и понимание что с этим делать.

Timur
06.06.2018
13:45:40
Сейчас это делается некрасивым образом - свитч заносится в заббикс и мониторится там, а в том же Прометее достаточно просто включить его в группу узлов - и с него начнут собираться какие-то доп. метрики

M
06.06.2018
13:47:08
Ребят ну помогите нужто 5000 хостов как то забирать

M
06.06.2018
13:47:20
я думал remote_read это делает а оказалось это не то

Алексей
06.06.2018
13:47:40
А что нужно для алертов? Текстовые поля?
я просто довольно давно наблюдаю что база есть. но автор не активно пиарит поделие. или я не понимаю где его юзать.

Evgheni
06.06.2018
13:47:44
Кто-нибудь в telegraf настраивал мониториг софтового или железного рэйда?
делал для софтварного через парсинг /proc/mdstat есть скрипты на Perl и Bash всё выводится в json, который скармливается telegraf'у -> тот отдаёт Prometheus'у -> ну и Grafana

Evgheni
06.06.2018
13:50:44
ну мопед был не мой - я его просто взял для примера

а потом уже переписал под bash - потому что попросили

сейчас поищу скрин с dashboard'a



Google
Evgheni
06.06.2018
13:52:26




Алексей
06.06.2018
13:53:22
миленько

Evgheni
06.06.2018
13:53:50
давно хотел запулить в репку телеграфа - но всё-никак руки не дойдут

Алексей
06.06.2018
13:54:14
ну просто переписать надо не на баш а на го

а механику оставить туже

Timur
06.06.2018
13:54:57
Оно у вас на выходе json отдает?

Evgeny
06.06.2018
13:55:14
я просто довольно давно наблюдаю что база есть. но автор не активно пиарит поделие. или я не понимаю где его юзать.
у автора просто экспертиза в области СУБД а не мониторинга, поэтому ему непонятно как это все продавать людям из мониторинга

Admin
ERROR: S client not available

Evgeny
06.06.2018
13:55:57
для алертов, кмк, нужно что-то вроде rules engine. но вообще это какая-то отдельная сложная задача

не думаю что БД должна это уметь, скорее сама система мониторинга

Алексей
06.06.2018
13:56:18
у автора просто экспертиза в области СУБД а не мониторинга, поэтому ему непонятно как это все продавать людям из мониторинга
самый дешевый способ видимо реализовать endpoint для прома и объявить что умеем с ним рабоать

Evgeny
06.06.2018
13:56:23
БД возможно должна уметь эти алерты хранить

Evgheni
06.06.2018
13:56:44
ну просто переписать надо не на баш а на го
я perl для этой фигни 3 дня учил ... go ещё неделю буду )) но нет времени

Алексей
06.06.2018
13:57:14
они уже финализировали спеку?
ах даже так вот да ? я не знал что она у них не финальна

Evgheni
06.06.2018
13:57:36
Спс, я примерно так и думал сделать
если нужен пример моего скрипта - могу отдать. Я уже не работаю там, где его писал и NDA прошло

Evgeny
06.06.2018
13:57:45
была не финальная какое-то время назад

Google
M
06.06.2018
13:58:34
Никак походу нет у прометеуса динамики такой к сожалению

думаете нельзя ?

Дмитрий
06.06.2018
14:30:54
M
06.06.2018
14:43:18
Смог только хосты с DNS собирать через SRV запись Все еще веду расследование как прометеус может забрать таргеры по http://example.com/targets Надеюсь на помощь тоже вашу

Andor
06.06.2018
14:46:11
а потом уже переписал под bash - потому что попросили
Переписали с перла на баш и сэкономили -1000% форков и -300% памяти

Evgheni
06.06.2018
14:47:08
Perl был в изначальном примере, bash просто идеалогически попросили сделать ... чтобы все могли прочитать скрипт в будущем ))

Andor
06.06.2018
14:48:31
...но никто не стал...

M
06.06.2018
14:59:00
это конечно удивительно что prometheus умеет забирать даже с dns SRV записи но блин по http не может фантастика

Алексей
06.06.2018
15:00:03
telegraf -> opentsdb -> grafana -> grafana-alerting
с ограничениями графана алертинга знакомы ? устраивают ?

Дмитрий
06.06.2018
15:00:39
с ограничениями графана алертинга знакомы ? устраивают ?
неа не знаком, но в алерте не нашел интергации с opentsdb

M
06.06.2018
15:01:01
Походу нашел наконецто

через костыль конечно но есть

Sergey
06.06.2018
15:12:20
если упретесь в то что графана плохо умеет в темплейтизированные алерты

Дмитрий
06.06.2018
15:17:54
Sergey
06.06.2018
15:18:26
еще он умеет в графит и ES

но гуй надо будет скорее всего под себя допиливать (есть плагин в графану и своя мордочка)

вопрос что мониторите и насколько структура того что мониторите упихиваемая в какие то рамки

Sergey
06.06.2018
15:23:14
есть, но не такой красивый как в алерте

Страница 552 из 681