@metrics_ru

Страница 28 из 681
Alex Milushev
09.09.2016
09:48:40
проблема в том, что у ноды есть таймаут перед выключением, и если в очереди появились тесты, они уйдут на ноду на которой уже были тесты до этого

и будет либо мусор, либо сохранять таймштампы

Maxim
09.09.2016
09:49:41
ну запускай в докере и стреляй в контейнеры

Alex Milushev
09.09.2016
09:50:55
так, идеи и направления для копания Я уже понял, спасибо большое, а то просить делать работу за меня дальше придется

Google
ptchol
09.09.2016
10:04:39
http://editor.swagger.io/#/?import=https://raw.githubusercontent.com/firehol/netdata/master/web/netdata-swagger.yaml

https://github.com/firehol/netdata

Alex Milushev
09.09.2016
10:05:07
ptchol
09.09.2016
10:05:21
там же можно svg забрать не ?

Alex Milushev
09.09.2016
10:06:14
о

спасибо

Dmitry
09.09.2016
11:51:07
в телекоме есть более разумное деление

fault management и performance management

метрики - pm

аварии и их корреляция - fm

Phil
09.09.2016
12:39:36
fault management и performance management
это простл другая плоскость рассмотрения.

Dmitry
09.09.2016
12:42:35
более четко формализованая

Google
Phil
09.09.2016
13:41:46
более четко формализованая
нет, просто это те же яйца вид в профиль. они. не отрицают моей модели и вписываются в нее

Maxim
09.09.2016
15:03:47
https://github.com/prometheus/alertmanager/releases/tag/v0.5.0-alpha.0 https://github.com/prometheus/alertmanager#high-availability

HA-alertmanager

Roman
10.09.2016
11:50:16
Омг

Maxim
10.09.2016
11:53:56
а по-моему - ништяк

Anton
11.09.2016
21:16:17
По хорошему сделать бы обзор по всем популярным системам из области мониторинга и рефрешить его
Было бы очень круто такое в гуглодоках запилить, и неофитам давать, чтобы клавиатурку не топтать по пол-дня каждый раз

Igor
11.09.2016
21:26:16
да ладнныы

ptchol
11.09.2016
22:57:59
сделали жже уже ребята из далматинера

Vladimir
12.09.2016
04:38:36
сделали жже уже ребята из далматинера
Тока там скоростные характеристики ояень странные :)

Nick
12.09.2016
05:24:26
а расскажите, у кого сделан звонок по телефону админу по факту наличия критических проблем в мониторинге - через что и как сделан этот звонок? функционально - я хочу примерно такое: по факту наличия проблемы N минут спустя после возникновения - чтобы через сип делался звонок и по кругу что-то говорилось с номером проблемы. Код до момента «звонить» у меня уже есть, нужно собственно звонить и нужно что-то говорить (текст ту спич? Или сборка заранее надиктованных фраз? Или есть готовый сервис?)

Nick
12.09.2016
05:26:45
цены не нравятся

Vladimir
12.09.2016
05:27:08
Тогда боюсь только самому писать

Nick
12.09.2016
05:28:20
а полуготовое что-то есть, чтобы поменьше самому писать? (или - тут есть чатики про воип?)

Vladimir
12.09.2016
05:28:55
https://tech.yandex.com/speechkit/

Вроде там можно текст в голос переделывать

А дальше курить то что умеет телефония

Календари с тем кому когда звонит можно на базе гугл календарей сделать

Google
Vladimir
12.09.2016
05:34:54
А pagerduty стоит же 9 баксов на юзера в месяц. Разве это дорого?

А... Там звонки стоят дорого, да

Nick
12.09.2016
05:37:47
и только US

Vladimir
12.09.2016
05:38:19
В варианте за 29-49-99$ по всему миру

Nick
12.09.2016
05:38:24
по всему миру - 25 в месяц и 49 за юзера вроде, закрыл уже страницу

Vladimir
12.09.2016
05:38:39
49 за юзера за анлим

Nick
12.09.2016
05:38:41
не вариант, в общем. Случается такое крайне редко

Vladimir
12.09.2016
05:38:46
25 звонков за 29

Ну хз. Если юзеров в пределах 10, то дешевле чем свое делать

Алексей
12.09.2016
05:39:22
есть @ru_voip вроде

Nick
12.09.2016
05:40:54
юзеров в пределах пяти, но они почти всегда замечают наличие проблемы сразу и исправляют её. Но небольшое количество раз в год случается так, что все отвлеклись и не прочитали алерты по всем каналам уведомлений.

25 или 49 баксов в месяц за юзера для пяти инцедентов в год - слегка перебор

Vladimir
12.09.2016
05:42:06
Ну кажется что в таком режиме выгоднее pagerduty

Даже в 9$ вараинте есть пуш уведомления в приложении

Дык можно 9ку платить и всех на телефоны заставить поставить приложение

И звонок

Nick
12.09.2016
05:43:25
толку от него, если человек прилег поспать на работе или в танчики поиграть и не увидел?

Vladimir
12.09.2016
05:43:36
Или платить 25 пока не сделаешь свою

То что по кругу люди его получат

И хоть 1 из 5 да проснется

Google
Vladimir
12.09.2016
05:45:45
И оправданность трат она зависит от того сколько это все сэкономит денег компании

Nick
12.09.2016
05:45:50
нюанс в том, что кггда в пределях пяти человек - ночью дежурный максимум один, а остальные штатно спят. сделать свое не кажется сложной проблемой. Как сделаю, если получится оторвать от остального кода - выложу на гитхаб )

Vladimir
12.09.2016
05:46:21
толку от него, если человек прилег поспать на работе или в танчики поиграть и не увидел?
А, и эт, у них есть вроде бы триал, пока пилите свою систему можете попытаться триал взять и отказаться потом

Nick
12.09.2016
05:50:23
Как показывает практика, ни СМС, не телеграм, не телефон их не будет. Мы пробовали sipp он и тестит сервис телефонный и звонит (сигнализация + запись чего сказать, но это не тривиально)
ну вот в конце - будят меня клиенты ) будет уже хорошо, даже если будить будут по прежнему меня, но мониторинг, а не клиенты.

И вот упал воип
это, на первый взгляд, легко решается двумя вдс в разных дц

Vladimir
12.09.2016
05:51:21
Nick
12.09.2016
05:51:50
это всё решаемые до какого-то предела проблемы

Aleksey
12.09.2016
05:52:22
И вот упал воип
Мы ставили модемы gsm на такой случай

Dmitry
12.09.2016
05:53:46
говорилку можно на asterisk сделать

Aleksey
12.09.2016
05:53:58
это всё решаемые до какого-то предела проблемы
Думаю, что с такими вопросами вам лучше с аплинками пообщаться, у них частенько есть переадресации условные и мониторинговые разные сигнализации, это собственного монитора не отменяет, по клиентам, конечно

Dmitry
12.09.2016
05:54:00
дешево и сердито

а его уже sip'ом цеплять

Anton
12.09.2016
06:01:05
Vladimir
12.09.2016
06:37:21
https://blog.dataloop.io/top10-open-source-time-series-databases

Google
Vladimir
12.09.2016
06:37:22
Но перформанс они не меняли а брали из документации и ишьюз на гитхабе

Без учета паттернов нагрузки, настроек и разницы в железе

Phil
12.09.2016
06:46:48
Дак это не то

Это только про метрики

Ну т.е. вообще не то о чем я

Я на хую простите уже ваши метрики вертел. Метрики ради метрик Богу метрик. Кроме нахуй никому не нужных метрик, есть ещё чекалки и алерты

Vladimir
12.09.2016
06:50:02
И метрики и алерты

И чекалки и коллекторы

Но проблем почекать нет особых

Есть ицинга-нагиос и они good enough

А вот с методиками проблема

А без метрик не сделать anomaly detection например

Phil
12.09.2016
06:53:37
Но проблем почекать нет особых
я говорил об общем описании, чтобы было примерно понятно кто что. суть была - общая картина, а не сравнение зранилок

Denis 災 nobody
12.09.2016
06:54:04
Vladimir
12.09.2016
06:54:19
я говорил об общем описании, чтобы было примерно понятно кто что. суть была - общая картина, а не сравнение зранилок
Алертинг и метрики они параллельно, поэтому я не думаю что можно сделать прям очень общее описание

да и хер с ним
Ну как сказать... Не очень то и хер

Страница 28 из 681