@ru_devops

Страница 26 из 999
Semyon
20.08.2016
07:52:31
у меня сейчас так сделано

но у меня пока очень мало кода в римане

Кстати, уважаемые девопсы

тут кто-то ещё риманом пользуется?

Google
Алексей
20.08.2016
08:53:21
Неа. Но арт оф мониторинг про него

Уверен ты его уже читал

Semyon
20.08.2016
08:55:12
читал

просто риман настолько шикарен, что я не понимаю, почему про него никто не говорит

нагиос вон вспомнили

заббикс этот постоянно

Алексей
20.08.2016
09:06:48
а чо у римана есть граифиеский интерфейс конфигурирования через браузер ?

Semyon
20.08.2016
09:14:06
нит

а нафига он?

Алексей
20.08.2016
09:49:42
Он нужен для решения проблемы синтаксиса.

Алексей
20.08.2016
09:51:31
Пчел, у него нет ресурса в виде девелопера

Google
Алексей
20.08.2016
09:51:36
Хостинг же

ptchol
20.08.2016
09:51:42
Все приведенные примеры "как захуярить свои алерты" плохи очень многими вещами

во первых, ты через неделю захочишь на графиках видеть когда у тебя срабатывали алерты, тебе придется еще куда то складывать эвенты и тащить их на графики

во вторых у тебя уже есть сервис, который ходит в дата сорс и кешит дату

если у нас алертинг простой, по трешолду и функции а не по окну, почему бы это не делать той же хери что и графики рисует

в очередных не стоит недооценивать конфигурацию через клики мышек.

ptchol
20.08.2016
09:54:00
как бы мы за это ненавидили заббикс, обратное тоже плохо работает. У меня есть опыт скармливания Bosun девелоперам, и не полетело

в четвертых, в девлопменте есть одна постоянная большая жопа тестами

рано или поздно их становится дохуя они не работают. И здесь вступает в работу подход change it - graph it

кгда ты приучиваешь девелопера к тому, что каждое изменение свое он обрисовывает метричкой, он накидывает это сам в графане, и ему удобней там же 5 сек потратить и накинуть алерт, чем пиздовать куда то и писать описание алерта

в пятых - нету человеческого алертинга для графита до сих пор )))

ptchol
20.08.2016
09:57:07
Хм, потому что девелопер за сервис отвечает

ptchol
20.08.2016
09:57:45
В нормальном, который в 2016м а не в 2001м )

Алексей
20.08.2016
09:58:00
это в каком мире?
в том где девелоперы пишут код который они же ломают

Phil
20.08.2016
09:58:07
ptchol
20.08.2016
09:58:13
Мы форсим все алерты сначала девелоперам, а эскалация уже админам

Google
Semyon
20.08.2016
09:58:23
Он нужен для решения проблемы синтаксиса.
У меня профдеформация, я на Лиспе много писал, проблемы синтаксиса не понимаю :)

Phil
20.08.2016
09:58:25
в том где девелоперы пишут код который они же ломают
окей. если они отвечают за сервис, не вижу проблемы с нагиосом

ptchol
20.08.2016
09:58:29
тулза для алертинга по графиту

Phil
20.08.2016
09:58:52
тулза для алертинга по графиту
что такое алертинг по графиту? графит это вообще спецификация

ptchol
20.08.2016
09:59:05
окей. если они отвечают за сервис, не вижу проблемы с нагиосом
им в 2 места ходить надо, и там воркфлоу длинный получается

что такое алертинг по графиту? графит это вообще спецификация
http://graphiteapp.org/ Graphite is an enterprise-ready monitoring tool that runs equally well on cheap hardware or Cloud infrastructure.

Phil
20.08.2016
10:00:40
им в 2 места ходить надо, и там воркфлоу длинный получается
да хоть в три. не получается там никакого длинного воркфлоу. ну и вообще - нарисуй морду к нагиосу, интегруруй ей с гарфаной и всё. мы опять в виде срача вернулись прости к дашборду. один хер у всех харвестеров алертинг отдельным сервисом

ptchol
20.08.2016
10:00:59
И зачем ?

зачем мне писать отдельный сервис, а потом его обратно интегрировать ?

в чем плюсы данного решения ?

Воркфлоу длинный получается потому что после того как ты накидал график, тебе нужно написать чек, закоммитить его, его должен кто то аппрувнуть, а потом запустить деплой новой конфигурации.

Phil
20.08.2016
10:02:30
Да потому что у всех это всё равно отдельный сервис. Ни один мониторинг это не намащзывает. Ну может кроме заббикса. Другой вопрос, что как девелопер ты этого не видишь. Плюсы а том, что они полноценные алертеры

ptchol
20.08.2016
10:02:38
ну и после этого обнаружить что тебе нужен movingavg а не last5 )

ptchol
20.08.2016
10:03:23
а причем тут график вообще?
при то что, обычно сначала собирают метрику, смотрят на нее (визуализируют) и понимают как ее алертить лучше чтобы было меньше фолзпозитив \ негатив

или ты алерт создаешь еще до того как метрика собралась ? )

Phil
20.08.2016
10:04:26
при то что, обычно сначала собирают метрику, смотрят на нее (визуализируют) и понимают как ее алертить лучше чтобы было меньше фолзпозитив \ негатив
О! Именно так. Ты понимаешь какой какой евент создавть и её кто-то алертит. и отличе якобы разных подходов только в том - заебошил ты свой скрипт с этой же морды, или с соседней

ptchol
20.08.2016
10:05:46
ну и логичнее что удобно с одной нет ?

зачем мне переключение контекста, когда у меня алерт привязан вот к этой метрике которую я тока что нарисовал

Phil
20.08.2016
10:06:27
или ты алерт создаешь еще до того как метрика собралась ? )
Я алерчу по событию. Которое наступает или по цепочке каких=то подсобытий (но честно я так не делаю никогда) или по превышению/уменьшению какого-то параметра. Кои я беру из какой-то базы. Как-то так. Хотя обычно я по прямым параметрам смотрю превышения, но это я не прав и это мои проблемы

Google
Phil
20.08.2016
10:08:42
зачем мне переключение контекста, когда у меня алерт привязан вот к этой метрике которую я тока что нарисовал
Затем что в итоге сейчас никто не умеет делать это вместе по-человечески. Пойми меня правильно, если бы в дашборде графаны бал интеграция с icinga2 и можно было бы создавать события для алертинга прямо по значению на грфике, а ещё круче как следящую (вот ткой вот шаблон) - это было бы круто.

Но в 2016 году этого нет. И бегать вокруг полусервисов странновато. Это прости как брать пример с меня, который в 2016 году перлом по rrd графики строит

ptchol
20.08.2016
10:09:34
смотри. вот стандартный алерт у меня http://hastebin.com/ocagizajow.py

Phil
20.08.2016
10:10:09
И/

ptchol
20.08.2016
10:10:10
мне чтобы понять что тут все ок, полюбому приходится это дело визуалайзить,а потом копипастить в нагиос (по факту сейчас в босун) это геморой лишний и ненужный

Phil
20.08.2016
10:10:41
Ну так скажем, в идеальном мире можно было бы избежать

ptchol
20.08.2016
10:10:50
как ?

Admin
ERROR: S client not available

ptchol
20.08.2016
10:11:37
Сделай мейджор компакшн всех таблиц
не срабатывает, пробовал конечно

А у тебя locality сейчас везде 0, да?
да, я думал может как то 2 мастера на такое поведение влияет

Alex
20.08.2016
10:12:08
может на это как то HA негавтивно влияет...
Нет Скорее всего, mismatch длинных/коротких имен в DFS и на region servers

ptchol
20.08.2016
10:12:31
Alex
20.08.2016
10:12:44
А у тебя native libs есть и подхвачены? Unix socket включен в конфиге?

ptchol
20.08.2016
10:14:13
да, нет.

а второе зачем ?

Слушай) я ща заглянул там 44% ))

вероятно правка имен помогла )

Google
Vladimir
20.08.2016
10:48:01
А? Чо? Мойра?
Если у них бусун не взлетел, то мойра и подавно не взлетит

Десктоп уже умер
Жиф же, с чего умер? Вот только линукс на десктопе даже не рождался

Vladimir
20.08.2016
10:54:36
у нас кстати народ матерится, но использует...

ptchol
20.08.2016
10:54:56
народ материться и за них все делаю я .

но это тупиковый путь

Vladimir
20.08.2016
10:55:17
минус в том что в графите метаданных для мониторинга катастрофически не хватает

ptchol
20.08.2016
10:55:22
поэтому как в мастер вмерджат, буду тестировать

минус в том что в графите метаданных для мониторинга катастрофически не хватает
я сейчас прошу всех в эластик эвенты формализованные хоть как то кидать.

Vladimir
20.08.2016
10:56:23
я сейчас прошу всех в эластик эвенты формализованные хоть как то кидать.
эластик быстро загибается если его начать под алертинг брать )

а для метаданных не сильно спасает

Alex
20.08.2016
10:56:33
Посоны

ptchol
20.08.2016
10:56:50
эластик быстро загибается если его начать под алертинг брать )
не не не, чисто эвенты, чтобы не в графите хранить, и болше данных с эвентом нести

Alex
20.08.2016
10:56:53
А инициатива metrics 2.0 заглохла, да?

ptchol
20.08.2016
10:57:07
Да вроде нет.

Vladimir
20.08.2016
10:57:11
А инициатива metrics 2.0 заглохла, да?
нет мало-мальски быстрой базы которая бы это умела хранить и юзать

но все хотят

Страница 26 из 999