@metrics_ru

Страница 577 из 681
Mi
03.07.2018
08:55:47
Кто-нибудь prometheus использует для мониторинга железа? или все сконцентрированы на приложениях?

Nklya
03.07.2018
08:56:19
дефайн железо

Mi
03.07.2018
08:57:02
?

Ievgen
03.07.2018
08:57:21
если железо умеет отдавать метрики в нужном формате, то какая разница что это?

Google
Andrey
03.07.2018
08:57:23
что конкретно из железа

Mi
03.07.2018
09:00:37
сервера x86 с Linux на борту, blackbox switces\routers(Cisco, Juniper, Huawei и прочее)

Nik
03.07.2018
09:01:22
или можешь в них пропихать node_exporter

?

M
03.07.2018
09:01:43
ребята а prometheus умеет для разных job кранить разное количество времени данные

вот есть данные которые надо хранить один день например

Mi
03.07.2018
09:02:41
snmp как вариант, просто есть идея все в 1 мониторинг засунуть, но придеться поебаца, или оставить как обычно, все что отновится к железу на zabbix, все что относится к приложениям на Prometheus, но тогда нужно будет еще корреливароть сообщения между системами мониторинга.

Andor
03.07.2018
09:03:31
чество говоря у меня не вышло сделать красивый мониторинг прометеем с snmp железками

Bogdan (SirEdvin)
03.07.2018
09:03:35
вот есть данные которые надо хранить один день например
В теории, можно самому чистить, они переделали хранилище

Andor
03.07.2018
09:03:48
точнее чтобы нарисовать где какой трафик идёт с какими концами на сетевых железках - надо очень много рисовать

и всё равно получится какти :)

Google
Mi
03.07.2018
09:04:33
чество говоря у меня не вышло сделать красивый мониторинг прометеем с snmp железками
а каие причины были кроме большого количества "темплейтов" ?

Andor
03.07.2018
09:05:04
по-хорошему хочется внешний вид подобный тому что в какти

в графане таких плагинов нету

https://habrastorage.org/storage2/27c/fae/63e/27cfae63efe680e5644f01c7c9f9c6d3.png

типа такого

Mi
03.07.2018
09:05:59
я с какти слез, в сторону заббикса+графаны, выглядит лучше, и нет проблем с пулером. Но тащить в заббикс метрики приложений это как бы неправильно.

аа, это weathermap

не, такого не надо, это когда сеть из 50-100 железок еще ок, а когда их тысячи, такие карты становятся бесполезными.

Andor
03.07.2018
09:06:51
вряд ли бесполезны

Mi
03.07.2018
09:06:57
только тепловые карты обобщенные, и точные алерты что где-то случилась беда

Andor
03.07.2018
09:07:00
скорее должны быть нескольких уровней

Oleg
03.07.2018
09:07:09
слез с nagios+cacti на icinga2+influx+grafana

Alexander
03.07.2018
09:07:56
слез с nagios+cacti на icinga2+influx+grafana
будешь скоро с influx слазить

Oleg
03.07.2018
09:08:10
будешь скоро с influx слазить
а что в качестве базы испольщовать ?

Sergey
03.07.2018
09:08:28
Paul
03.07.2018
09:08:31
будешь скоро с influx слазить
дайте человеку почуствовать страдание, ну что вы в самом деле

Alexander
03.07.2018
09:08:38
как появиться более-менее серьезные объемы - взвоешь от того сколько это поделие жрет ресурсов

Andor
03.07.2018
09:08:46
не, такого не надо, это когда сеть из 50-100 железок еще ок, а когда их тысячи, такие карты становятся бесполезными.
на прошлой работе был десяток таких вот weathermap'ов между несколькими дц, они были не по каждой железке, а именно по связям между дц

Alexander
03.07.2018
09:08:47
а ну ок

Andor
03.07.2018
09:08:54
было очень полезно и наглядно

Google
Mi
03.07.2018
09:08:57
вообщем я так понимаю, что особо сильно народ не упарывается по втягиванию в прометей железа. буду тогда смотреть что-то другое

Alexander
03.07.2018
09:09:03
сезон хождения по ржавым граблям открыт!

Andor
03.07.2018
09:09:09
хотелось бы чего-то похожего с прометеем

причём метрики собрать - это даже не половина задачи

метрики-то я собирал

хотелось их рисовать красиво

Paul
03.07.2018
09:09:52
Mi
03.07.2018
09:10:30
инженер не может смотреть в тысячи графиков, поэтому в любом случае Alarm Event нужен. хотя частично ситуацию спасут агрегированные графики, но это полумера.

Zhenia
03.07.2018
09:10:37
а чем хитмап не ок?

Oleg
03.07.2018
09:10:39
не открывает у меня http://bit.ly/2AHQRa9

Sergey
03.07.2018
09:10:50
вообщем я так понимаю, что особо сильно народ не упарывается по втягиванию в прометей железа. буду тогда смотреть что-то другое
инженерная инфраструктура двух ЦОДов катит в определение по "втягиванию в прометей железа"?

Oleg
03.07.2018
09:12:03
+Vlan interface

Sergey
03.07.2018
09:12:47
сети у нас другая служба мониторит, нагиос во все поля

Mi
03.07.2018
09:13:48
ну т.е. каждый инструмент под свои задачи.

Sergey
03.07.2018
09:15:01
ну да... хотя они периодически меня спрашивают че да как в прометее, но перекатываться пока не хотят

да и не к чему эту, раз все работает и их все устраивает и так

Oleg
03.07.2018
09:20:46
народ у меня не открывается http://bit.ly/2AHQRa9 - может кто личкой кинуть текс из факю качательно influxdb

Andor
03.07.2018
09:21:08
http://telegra.ph/FAQ-dlya-Cerkvi-Metrik-v-01-11-29

Oleg
03.07.2018
09:21:32
telegra,ph как раз и не открывается

Google
Vladislav
03.07.2018
09:22:59
лучше не придумал

Oleg
03.07.2018
09:23:32
и тебе большое спс добрый человек

прочел - но чем заменить influx так и не нашел ( может postgresql поставить то тогда вопрос может ли icinga2 без костылей слать туда perfdata (нет)

Oleg
03.07.2018
09:33:31
в графит может
как понять в рафит может ? графит рисовалка графиков а сне надо куда нить складировать данные (перфдата)

Admin
ERROR: S client not available

Sergey
03.07.2018
09:35:41
как понять в рафит может ? графит рисовалка графиков а сне надо куда нить складировать данные (перфдата)
Боюсь, в качестве рисовалки чаще используют графану. Графит - API по работе с метриками. если быть точным, то там есть два формата - whisper и ceres. То, что ты называешь графитом-рисовалкой - это graphite-web.

Oleg
03.07.2018
09:42:39
whisper - тоже непонятная поделка,складывающая файлы с метриками - почему тупо не испольщовать PGsql стильно,модно,молодежно

к томуже надо определять временные периоды для метрик

Bogdan (SirEdvin)
03.07.2018
09:43:18
Предлагаю провести бенчмарк на запись и понять почему)

Oleg
03.07.2018
09:44:40
ну тамже можно затюнить и при innodb не будет после каждой записи делать sync

Bogdan (SirEdvin)
03.07.2018
09:45:14
Куча всяких реляционных штук, которые накладывают дополнительные оверхеды там, где их можно было бы избежать. Определенние временных периодов позволяет не хранить время, что сильно уменьшает размер точки.

А так есть такая штука: https://www.timescale.com/, не совсем postgres правда

Nklya
03.07.2018
09:46:11
whisper - тоже непонятная поделка,складывающая файлы с метриками - почему тупо не испольщовать PGsql стильно,модно,молодежно
Есть же живой пример владышева. Зачем ебашить на те же грабли чтобы доказать очевидные вещи?

Oleg
03.07.2018
09:47:59
...... пускай тогда у меня все склдывает в influx , паралельно буду искать подходящее хранилище для метрик

Andrey
03.07.2018
09:59:42
...... пускай тогда у меня все склдывает в influx , паралельно буду искать подходящее хранилище для метрик
озвучьте количество метрик, а то может по старинке, ручкой, в блокнотик?

Google
Oleg
03.07.2018
10:05:30
щас примерно посчитаю

прядка 8400 метрик в минуту

Andor
03.07.2018
12:02:46
оно рассыпается когда узлов больше десятка

Vladimir
03.07.2018
12:11:06
@bobstail в FAQ нет ответа на тему того что вместо, но просто не надо брать инфлакс

Andrey
03.07.2018
12:12:06
ой, да ладно, при таком то порядке метрик, не всё ли равно чем? вот чесно, ну... аки дети

Vladimir
03.07.2018
12:12:21
это да. тут хоть в json рядышком )

evix
03.07.2018
12:12:21
можно в блокнот

Vladimir
03.07.2018
12:12:36
ой, да ладно, при таком то порядке метрик, не всё ли равно чем? вот чесно, ну... аки дети
просто потом оно вырастет и инфлакс традиционно посыпется

Andrey
03.07.2018
12:13:19
а если не вырастет?

Petr
03.07.2018
12:13:28
Может они к тому времени уже стабилизируют его? )

Vladimir
03.07.2018
12:14:28
Petr
03.07.2018
12:14:43
они это 4 года сделать не могут
Ты не даешь им шанс! )

Vladimir
03.07.2018
12:15:20
@pmaskaluk да )

Sergey
03.07.2018
12:46:13
ну а вдруг к ним придет нормальный сеньер помидор и сделает красиво )

Nklya
03.07.2018
12:48:26
вдруг их купить оракел

Sergey
03.07.2018
12:49:19
прядка 8400 метрик в минуту
это целых 140 метрик в секунду, в данной церкви это вызывает... вообще никакой реакции - уже печатал чуть раньше что с такими нагрузками можно использовать что нравится а не пилить волшебные замки из костылей

Страница 577 из 681