@metrics_ru

Страница 3 из 681
ptchol
20.08.2016
18:53:38
кого?
ну это когда метрика прыгает туда сюда

флапает )

Phil
20.08.2016
18:57:02
ну это когда метрика прыгает туда сюда
так. не понял вопроса. у того же нагиоса есть такое состояние сервиса

ptchol
20.08.2016
18:59:31
как его не обрабатывать сложным образом, и задавать его "поведение" если у тебя нет исторических данных

Google
Vladimir
20.08.2016
18:59:47
@schors не, ну если так формулировать, то мониторишь ты всегда состояние, вопрос в том какое

Vladimir
20.08.2016
19:02:05
а тогда какие претензии к босуну тому же?

ptchol
20.08.2016
19:03:40
а тогда какие претензии к босуну тому же?
Володь, а вы не билдили графану ручками чтобы посмотреть на алерты там ?

ptchol
20.08.2016
19:05:11
?
еще если аналитику рассматривать с технической точки зрения, вот тут по техникам ) http://www.bigdataanalyticsguide.com/2016/06/20/master-machine-learning-widely-used-analytics-techniques-and-algorithms/

Vladimir
20.08.2016
19:05:16
судя по их блогпостам они ничем принципиально не отличаются, даже менее функциональны

ptchol
20.08.2016
19:05:26
бестолковоая статеечка но ключевые слова все нужные )

судя по их блогпостам они ничем принципиально не отличаются, даже менее функциональны
они в коробке, как я говорил здесь уже, ты с босуном сначала собираешь метрики в графане, а потом по факту переносишь их в босун. А терь тут на соседней вкладке определил алерт и все.

по крайней мере у нас так поулчалось.

Dan
20.08.2016
19:06:57
добавил чяд в свой список

ptchol
20.08.2016
19:07:15
?
хотя я наверно нврал, перечитл и это длиже сайнтистам чем аналитикам =(

Google
ptchol
20.08.2016
19:07:39
у графаны есть плагин для анотаций по бусуну )
и дашборд есть там аха ) страшный как моя жизнь )

Алексей
20.08.2016
19:07:52
Vladimir
20.08.2016
19:08:13
я в этом плане немного скептически отношусь к алертингу графаной, потому что непонятно как оно будет масштабироваться и как вести себя если фронтэндов много

ptchol
20.08.2016
19:08:34
ну это же для таких как мы а не для таких как вы ) тыж понимаешь )

Alexander
20.08.2016
19:11:33
в универе был курс статистики, но я его как-то не очень хорошо изучил , сейчас немного жалею)) (сырые данные это ещё не информация,информацию стоит получить)

Алексей
20.08.2016
19:11:39
у меня почему то сложилось впечателиен что задача алертера сказать something going wrong.

Алексей
20.08.2016
19:12:34
а для этого надо строить высокоуровневые "бизнес" метрики

ptchol
20.08.2016
19:12:46
у них 130тб метрик.

Vladimir
20.08.2016
19:12:51
вы так говорите будто нужно мониторить и алертить по большому колву метрик...
Чем больше сервисов, тем больше метрики. И тут больше вопрос про отказоустойчивость мониторинга

Алексей
20.08.2016
19:12:54
и алертить по ним. остальное должно тупо быть доступно

ptchol
20.08.2016
19:13:16
тоесть там даже алертинг по нескольким десяткам тыщ

Vladimir
20.08.2016
19:13:30
и алертить по ним. остальное должно тупо быть доступно
Мониторинг на графит это математика над примерно 2к метрик

ptchol
20.08.2016
19:13:49
тюююю чо как мало )

Алексей
20.08.2016
19:13:50
10-12 штук ?

Vladimir
20.08.2016
19:14:17
Сейчас 200, потом умеьшим до 7

Google
Алексей
20.08.2016
19:15:24
есть набор вещей пр окоторые нельзя не алертить, типа кончается место на дб. остальное все очень лирично и палемично....

ptchol
20.08.2016
19:16:36
всмысле лирично ?

да там заглядываешь к девелоперам там очень частные метрики но без которых жить не возможно

Vladimir
20.08.2016
19:17:04
есть набор вещей пр окоторые нельзя не алертить, типа кончается место на дб. остальное все очень лирично и палемично....
есть прогнозы по месту на том же графитном сторадже - будут ли с ним проблемы в течении двух недель ближайших или нет

ptchol
20.08.2016
19:17:23
в духе "процент фейлов к какому то из десятка платежных шлюзов"

Vladimir
20.08.2016
19:17:27
жирные мониторинги это про сервисы. Например для веба это рассчет 99 процентиля ответов

когда фронтэндов много - запросов тоже много

там и идет выборка тысяч метрик и сведение их в 1-2

ptchol
20.08.2016
19:18:14
Алексей
20.08.2016
19:20:19
есть прогнозы по месту на том же графитном сторадже - будут ли с ним проблемы в течении двух недель ближайших или нет
мне такой не нужен. мне достаточно через 4 часа месту хана. у меня "облачное место". бесконечное.

в духе "процент фейлов к какому то из десятка платежных шлюзов"
это детализация. она появляется когда у тя есть метрика - падение постпупления бабла.

Vladimir
20.08.2016
19:21:17
а он не сам считается когда вы в статсайт пихаете ?
хм... целиком по сервису помоему нет

ptchol
20.08.2016
19:21:54
А как вы восстанавливаете кста ? )

или вы гистограммы засылаете ?

Vladimir
20.08.2016
19:22:09
А как вы восстанавливаете кста ? )
я не смотрел как они чекают )

ptchol
20.08.2016
19:22:46
я пока понял что для меня это геморно, и в случае с десятком фронтов можно пожить с отдельными алертами а не overall

Vladimir
20.08.2016
19:23:32
ну у нас фронтэнд жирный, народ посервисно мониторит

смирились с фактом что какой-то процент дохлых серверов это ок и мониторят по времени ответа и проценту неответов в среднем

Алексей
20.08.2016
20:41:12
Господа, если переходить от абстракций к конкретики. можно заставить прометей делать count({job})

хочу получить сколько заданий он сделал по каждому скрейперу

Google
Алексей
20.08.2016
20:41:48
не вижу в нем group_by

ох и наворотили они в этом вашем прекрасном прометеусе

Admin


Алексей
20.08.2016
20:55:41
count({job=~".+"}) by (job)

@demeliorator синтаксически prometheus - гавно.

Dan
20.08.2016
20:58:19
нужно больше синтаксического сахара богу синтаксического сахара! и разумеется monkey patch в kernel где-нибудь

на руби есть мониторинги?

Алексей
20.08.2016
20:58:46
уверен должны быть.

рубисты сильно в инфораструктуру залезли.

пока их от туда гошники не начали вымещать

Dan
20.08.2016
20:59:37
я категорически удивляюсь почему элексир не взлетел ) не пришло еще время?

тот же руби же только эрланг

вот на чём метрики делать сплошное удоаольвтсие

Alexander
20.08.2016
21:00:54
элексир - это что-то хипстерское очень

но я тоже удивляюсь, почему его не раскрутили нормально

но по факту, как был C, Java, Python, так и будут лет через 20 те же самые C, Java, Python

Dan
20.08.2016
21:06:23
согласен. хотя нет, Го еще туда надо приписать. а так - да, так и будет. а Элексир божественная задумка, но крайне невыгодно пропиареная. вот появятся какие-нибудь Elixir on Rails.. кто его знает )

Dan
20.08.2016
21:22:25
в фениксе не правильно реализованы скаффолдиг и activerecords )))))

Google
Алексей
21.08.2016
06:51:45
если наловчится, синтаксис прометеуса уже не выглядит таким уж отвратительным. но всё равно кажется так себе...

Zon
21.08.2016
07:10:54
если наловчится, синтаксис прометеуса уже не выглядит таким уж отвратительным. но всё равно кажется так себе...
Если регулярно перечитывать sre book, то прометеус кажется весьма подходящим решением

Алексей
21.08.2016
07:11:16
я боюсь читать книжку два и более раз.

Господа, а почему в prometheus rate10s может выдавать No datapoints found. варианты из гугла проверены

Притом если сделать 11секунд график есть

Но скрейп как бы 10...

@demeliorator куда копать?

блин такая фигня походу со всеми каунтерами.

ptchol
21.08.2016
12:47:59
просто прометеус гавно как и заббикс ) одной поле ягоды )

Алексей
21.08.2016
13:07:49
Эй, тогда остается только графит

И это не хорошо

ptchol
21.08.2016
13:10:31
привычка к возможности поправить сообщение в слаке \ скайпе, приводит к тому что постоянно пишу какую то ахинею.

Страница 3 из 681