@metrics_ru

Страница 27 из 681
Igor
08.09.2016
16:35:13
Ищите меня у одной высокопоставленной особы (c), ну

Ivan
08.09.2016
16:39:28
Имхо, для нормальной системе алертов и правда ничего нет

С мониторингом (набором данных/метрик) всё хорошо, а вот очень извращенное кастомное детектирование аномалий с вменяемым гуи нет

Гуи потому что люди сами себе настаивали, а не держать отдел людей которые только и умеют что правит текстовые когфиги нагиоса

Google
Aleksandr
08.09.2016
16:47:02
поделись :) ?
Завтра спрошу можно ли

Алексей
08.09.2016
16:47:12
спасиб

там реально с докой по роутингу плохо

и с примерами

Aleksandr
08.09.2016
16:49:04
По коду идешь и смотришь как оно работает. Оно грамотно написано

Алексей
08.09.2016
17:19:54
https://www.influxdata.com/influxdb-1-0-ga-released-a-retrospective-and-whats-next/

нет повода не выпить.

а

нет, есть повод не выпить. это же инфлюкс.

Phil
08.09.2016
17:22:01
а что?

Uncel
08.09.2016
21:58:56
Вопрос в бездну, кто чем мониторит solaris 10;11 sparc ?

Phil
08.09.2016
21:59:46
Я иногда глазами. Достаю раз в год диск, смотрю на него, убираю обратно в коробочку

Google
Uncel
08.09.2016
22:00:30
А это мысль

Phil
08.09.2016
22:01:01
скорее всего только collectd

Uncel
08.09.2016
22:02:58
Надеюсь оно умеет в зоны и прочие ораклоприколы

Phil
08.09.2016
22:12:49
нет конечно

Uncel
09.09.2016
00:33:16
Костыли-костылики

Igor
09.09.2016
00:33:24
И всё забезпладно, да

Есть чо купить? — я уже спрашивал ;)

Uncel
09.09.2016
00:40:02
Ca и oracle manager все еще всратые

Phil
09.09.2016
08:45:43
#мониторинг #начало #термины #overall #concept #terms Часть I. Я обещал полить чутка воды философской про мониторинг. Начну. Как правильно говорят коллеги, давайте определимся с терминами, определениями и общим концептом. Глобально мониторинг состоит из трёх Основных частей. 1 - таблицы состояний и их генерация, 2 - сбор данных для генерации состояний, 3 - нотификация об состояниях и их изменениях, включая визуализацию. В это модель вписываются практически все основные системы последние 20 лет, включая новейшие. Начнем для примера с банальщины - древний nagios. Чекалки нагиоса - это пункт (2), они опрашивают хосты, сервисы, чтотамещё на простейшие состояния. Чекалки реализованы простыми скриптами, которые выдают статус и/или метрики, которые можно записывать (Perfdata в терминах nagios). (1) реализуется внутри нагиоса, они включают всякие "зависимости" (не опрашимваются сервисы, которые "за" точкой в состоянии "я утонула"), иерархические связки (для наглядности, не всегда совпадающие с "зависимостями") и работу с этими состояниями - Acknowledge, Shedule downtime, Disable/Enable checks/notifications. В этой же части реализуется история состояний и выработка стабильного итогового. Нотификации в нагиос (3) включают в себя настройку кому, когда и какие нотификации высылать. Напоминаю, это не описание нагиоса, а попытка показать, что я имел ввиду в модели. Самое главное, на что я хотел обратить внимание - метрики это данные для состояний. Одни из. Итак 1 - ХРАНЕНИЕ СОСТОЯНИЙ И ИХ ИЗМЕНЕНИЙ, ВЫРАБОТКА СТАТУСОВ ПО МЕТРИКАМ ИЛИ СОСТОЯНИЯМ ИЛИ ПО ЗВЕЗДАМ 2 - СБОР И ХРАНЕНИЕ МЕТРИК, СБОР СОСТОЯНИЙ 3 - НОТИФИКАЦИЯ О СОСТОЯНИЯХ, ИХ ИЗМЕНЕНИЯХ

Alex Milushev
09.09.2016
08:56:55
кто какой сборщик метрик для графита использует?

ну или какой посоветуете?

ну и где хранить их для графаны?

Alex Milushev
09.09.2016
09:05:51
Коллектд
nodejs, brrr

Semyon
09.09.2016
09:06:46
Alex Milushev
09.09.2016
09:07:28
а сорри, перепутал

ptchol
09.09.2016
09:08:06
Э ?

Alex Milushev
09.09.2016
09:09:55
эм, тогда лучше не так, мне нужно сессионно снимать статистику с машин, и строить отчеты с графиками, этапы: 1. Стартуем сбор данных 2. Запускаем полезную нагрузку, ждем окончания работы 3. Останавливаем сбор данных 4. Генерим отчет и графики за сессию

вот такого вот странного хочется, есть идеи как правильно это можно сделать?

Google
Alex Milushev
09.09.2016
09:11:18
метрики: 1. LA 2. CPU 3. MEM 4. DiskIO 5. Network

Magistr
09.09.2016
09:11:52
это тесты гоняеете ?

Phil
09.09.2016
09:12:00
#мониторинг #начало #термины #overall #concept #terms Часть II. А теперь немного истории. Что хорошо, что плохо и что лучше. Мой предок Бату-хан сжег Козельск, скоро будем праздновать годовщину этого генерального сражения, практически покончившего с сепаратистами... Ой. Не в то окно :) Я буду утрировать, потому что не утрируя тут труд будет на курсовую. Я просто прошу учесть, что конечно же я это осознаю и не надо бездумно меня цитировать в обобщениях. Давным давно, когда Путин только стал Президентом, приложения мониторили отдельно, а сервера отдельно. Собственно приложения мало кто прямо мониторил и там где-то родился заббикс. Бородатые седые пыльные одмины использовали mrtg, nagios и cacti. Проблема была и в том, что серверов не было пачками, и что ОС не очень-то делились метриками - я до сих пор помню, попытки впихивать всё в SNMP (правда вроде только бсдя реально сделала), и в том, что визуализировать это всё не очень удачно получалось по тем технологиям и мощностям. До сих пор есть какие-то виндовые визуализаторы всего. Когда Путин был уже давно Президентом и начали плодится сервера и виртуалки, появился graphite (это полноценный сборщик метрик, со своей базой и визуализатором) и вылез из разработчиков заббикс. Но со взятием метрик всё было по прежнему плохо. Родился даже collectd (это серверная программка, выдеркивающая данные из ОС и могущая их или послать куда-то, или например записать в RRD, у них даже алертинг какой-то есть). Он закрывает много дырок в этом вопросе. Есть ещё разные такие монолитные штуки, например Mmonit (кстати, рекомендую просто посмотреть). А потом ядро Linux вдруг сделало старт ракетой и начало фигачить всякие правильные изменения сотнями. Начали появляться метрики такие, метрики сякие, неймспейсы, чорты в ступе, таро и жрицы. И разрабы полезли в админы. Появился DevOps (в том или ином виду уже наверное лет 6-7). Появились странные для админов идеологии мониторинга только по метрикам. Но зато как грибы пошли расти сборщики этих метрик, базы для метрик, визуализаторы. Т.е. всё то, что раньше было скрипуче и трудновато. Отвечу тут на вопрос @poige по рынку. Всё так меняется, что ни один коммерс не возьмётся бежать за этим. Сложно. А при том, что качество коммерческих решений зачастую даже хуже коммьюнити - ква.

Alex Milushev
09.09.2016
09:12:17
на еще и на эластик инстансах

в плане просто подключить их на мониторинг не вариант, так как нужно это все собрать воедино :(

и результаты тестов и метрики с машин, задача как Я понимаю распространенная — возможно кто сталкивался и может посоветовать

Magistr
09.09.2016
09:14:25
https://machinezone.github.io/mzbench/ вот такой фремворк где все сразу есть видел

ptchol
09.09.2016
09:14:25
А почему просто не пихать в графит, а потом просто в конце приходить к нему в апи и говорить, дай пнг по такой то метрике за такой то период и все ?

Alex Milushev
09.09.2016
09:16:40
как Я понимаю collectd сохраняет данные в rrd? можно просто натравить генератор статических страниц на него, если Я правильно понимаю?

Magistr
09.09.2016
09:17:30
тоже вариант конечно
в графите агрегацию еще тогда стоит отключить

ptchol
09.09.2016
09:18:13
тоже вариант конечно
Зато никаких примочек слева , у тя есть мониторинг как сервис, и ты просто берешь у него данные

Alex Milushev
09.09.2016
09:18:52
у меня уже есть мониторинг, а это нужно именно для CI и на динамически создаваемых машинах

которые подключать к мониторингу только мусор генерить

Phil
09.09.2016
09:19:47
#мониторинг #начало #термины #overall #concept #terms Часть III. Теперь о "горячих точках". Сирия... ой :))) Источники данных. Выбор огромен, но зачастую они все не покрывают всего. collectd, munin, ganglia, экспортеры prometheus, telegraf, snmp-серверы наконец. Как пример непокрытия приведу - чем вы на SmartOS собираете метрики ZFS? А на Ubuntu? А на FreeBSD? Базы метрик. Собственно или "теряются" - influx, prometheus, или агреггируются в жестко позиционные файлы - wisper (это графита база), rrd (было бы не смешно, если бы у неё было развитие и аналог какого-нибудь Carbon графита). Или простите MySQL :))) Проблема огромного количества метрик и их записи на диск, а потом анализа. Дашборд. Это важно. Админы хотят automation для мониторинга production. А разработчики хотят как раз "дать Васе руками добавить" для тестов и стейджинга. Конфликт интересов. Собственно битва за заббикс и алертинг внутри графиков - это всё про дашборд, а не про мониторинг. Нотификации. Роутинг. Расписание. Отмена. Кому, сколько, когда, какие. Пока лучше nagios/icinga2/shinken это никто не делает. Состояния собственно хостов и зависимости. Вот тут провал. Или метрики, или состояния. В одном одмины стоят на своём, в другом разрабы. И это пока пропасть. И люди очень часто именно в этом месте путают - ведь анализ метрик в итоге тоже порождает состояние и/или статус. И это глубокое недопонимание сторон

Алексей
09.09.2016
09:21:18
Phil
09.09.2016
09:22:13
Фуф

Magistr
09.09.2016
09:23:11
Фуф
Хорошо вышло, opentsdb забыл )

Google
Igor
09.09.2016
09:23:39
Полный бред

Как раз для коммерческого — лафа

Рынок

Алексей
09.09.2016
09:25:05
Игорь, поделитесь как и чем вы делаете мониторинг сейчас?

Phil
09.09.2016
09:25:06
Хорошо вышло, opentsdb забыл )
Не забыл. Нельзя забыть о том, чего не знал ;)

Igor
09.09.2016
09:25:23
Поэтому всякие там data dog'и и newrelic'и и вылезли

Phil
09.09.2016
09:25:56
Как раз для коммерческого — лафа
постоянная гонка за изменяемостью? ну ок - раз это лафа, я думаю ты быстро откроешь бизнес. тем более всё разжевано

Igor
09.09.2016
09:26:00
Но надоело.

Phil
09.09.2016
09:26:14
Как все, всяким говном и палками
Кстати + ) Вместе с "надоело" :)

Алексей
09.09.2016
09:26:44
Вон там пацаны из окметра постоянно пиарятся

Отечественный софт, все дела

Phil
09.09.2016
09:27:37
Так. Стоп. БЛЯТЬ!!! :)))) Я капсом в следующий раз буду писать. Мониторинг - это про состояния и статусы. И метрики только _ЧАСТЬ_ исходников для этого.

Это основополагающий принцип модели

Алексей
09.09.2016
09:29:56
Ага, там дашгенератор есть

Не уверен про статический правда

Но статику можно получить от графаны же

Google
Алексей
09.09.2016
09:30:34
Там есть снапшоты

Phil
09.09.2016
09:31:04
По хорошему сделать бы обзор по всем популярным системам из области мониторинга и рефрешить его

Alexander
09.09.2016
09:32:00
а так же выделить критерии оценки, их важность, провести оценку всех систем по этим критериям и вывести итоговый балл)

заббикс победит ведь? ?))

Phil
09.09.2016
09:32:57
Нет. Просто обзор "что это". Тезисно возможности и их реализация. Тезисно плюсы и минусы. Всё

Alexander
09.09.2016
09:33:33
ну, тогда всё равно самому придётся смотреть все системы

Alex Milushev
09.09.2016
09:33:42
Но статику можно получить от графаны же
это сколько тулов мне срастить надо?

Алексей
09.09.2016
09:34:35
Пром + нодеекспортер+ графана

Alex Milushev
09.09.2016
09:35:15
о, нормально, жить можно

с таким вариантом, на каждом инстансе мне можно сделать 1. колектд 2. графит 3. графана перед стартом тестов просто запоминать timestamp лить данные с помощью колектд в графит и рисовать графики графаной после окончания нагрузки делать api запрос к графане и генерить снапшот дашборда, этот снапшот как репорт аттачить к результатам тестов

Magistr
09.09.2016
09:40:51
2 и 3 можно на 1м инстансе

Alex Milushev
09.09.2016
09:40:53
при этом, 2 и 3 можно вынести на отдельный тазик

угу

или плюнуть и написать свой генератор отчетов по rrdb собранным collectd

что лениво, да

Maxim
09.09.2016
09:47:23
коллеги а вот у меня странный вопрос есть у меня есть куча мелких проектов (по два-три сервера на проект) вокруг этого прометей и консулы, все хорошо вопрос о сборе логов сейчас на каждой площадке стоит отдельная инсталляция грейлога это работает, но это больно, дорого и затратно хочется взять один толстый сервер и на нем взвести один общий коллектор есть ли в природе что-то вроде лося или грейлога, но с разделением прав доступа к дашборду? (типа спланка, но селф-хостед)

ptchol
09.09.2016
09:47:26
что лениво, да
да забейте вы.

я уже посмотрел апи нетдаты, она умеет графики экспортировать

Страница 27 из 681