
Alex Milushev
09.09.2016
09:48:40
проблема в том, что у ноды есть таймаут перед выключением, и если в очереди появились тесты, они уйдут на ноду на которой уже были тесты до этого
и будет либо мусор, либо сохранять таймштампы

Maxim
09.09.2016
09:49:41
ну запускай в докере и стреляй в контейнеры

Alex Milushev
09.09.2016
09:50:55
так, идеи и направления для копания Я уже понял, спасибо большое, а то просить делать работу за меня дальше придется

Google

Alex Milushev
09.09.2016
10:03:37

ptchol
09.09.2016
10:04:39
http://editor.swagger.io/#/?import=https://raw.githubusercontent.com/firehol/netdata/master/web/netdata-swagger.yaml
https://github.com/firehol/netdata

Alex Milushev
09.09.2016
10:05:07

ptchol
09.09.2016
10:05:21
там же можно svg забрать не ?

Alex Milushev
09.09.2016
10:06:14
о
спасибо

Dmitry
09.09.2016
11:51:07
в телекоме есть более разумное деление
fault management и performance management
метрики - pm
аварии и их корреляция - fm

Phil
09.09.2016
12:39:36

Dmitry
09.09.2016
12:42:35
более четко формализованая

Google

Phil
09.09.2016
13:41:46

Maxim
09.09.2016
15:03:47
https://github.com/prometheus/alertmanager/releases/tag/v0.5.0-alpha.0
https://github.com/prometheus/alertmanager#high-availability
HA-alertmanager

Roman
10.09.2016
11:50:16
Омг

Maxim
10.09.2016
11:53:56
а по-моему - ништяк

Anton
11.09.2016
21:16:17

Igor
11.09.2016
21:26:16
да ладнныы

Phil
11.09.2016
21:27:54

ptchol
11.09.2016
22:57:59
сделали жже уже ребята из далматинера

Vladimir
12.09.2016
04:38:36

Nick
12.09.2016
05:24:26
а расскажите, у кого сделан звонок по телефону админу по факту наличия критических проблем в мониторинге - через что и как сделан этот звонок?
функционально - я хочу примерно такое: по факту наличия проблемы N минут спустя после возникновения - чтобы через сип делался звонок и по кругу что-то говорилось с номером проблемы. Код до момента «звонить» у меня уже есть, нужно собственно звонить и нужно что-то говорить (текст ту спич? Или сборка заранее надиктованных фраз? Или есть готовый сервис?)

Vladimir
12.09.2016
05:25:22
Туда заносишь бабло, они дают rest api

Nick
12.09.2016
05:26:45
цены не нравятся

Vladimir
12.09.2016
05:27:08
Тогда боюсь только самому писать

Nick
12.09.2016
05:28:20
а полуготовое что-то есть, чтобы поменьше самому писать? (или - тут есть чатики про воип?)

Vladimir
12.09.2016
05:28:55
https://tech.yandex.com/speechkit/
Вроде там можно текст в голос переделывать
А дальше курить то что умеет телефония
Календари с тем кому когда звонит можно на базе гугл календарей сделать

Google

Vladimir
12.09.2016
05:34:54
А pagerduty стоит же 9 баксов на юзера в месяц. Разве это дорого?
А... Там звонки стоят дорого, да

Nick
12.09.2016
05:37:47
и только US

Vladimir
12.09.2016
05:38:19
В варианте за 29-49-99$ по всему миру

Nick
12.09.2016
05:38:24
по всему миру - 25 в месяц и 49 за юзера вроде, закрыл уже страницу

Vladimir
12.09.2016
05:38:39
49 за юзера за анлим

Nick
12.09.2016
05:38:41
не вариант, в общем. Случается такое крайне редко

Vladimir
12.09.2016
05:38:46
25 звонков за 29
Ну хз. Если юзеров в пределах 10, то дешевле чем свое делать

Алексей
12.09.2016
05:39:22
есть @ru_voip вроде

Nick
12.09.2016
05:40:54
юзеров в пределах пяти, но они почти всегда замечают наличие проблемы сразу и исправляют её. Но небольшое количество раз в год случается так, что все отвлеклись и не прочитали алерты по всем каналам уведомлений.
25 или 49 баксов в месяц за юзера для пяти инцедентов в год - слегка перебор

Vladimir
12.09.2016
05:42:06
Ну кажется что в таком режиме выгоднее pagerduty
Даже в 9$ вараинте есть пуш уведомления в приложении
Дык можно 9ку платить и всех на телефоны заставить поставить приложение
И звонок

Nick
12.09.2016
05:43:25
толку от него, если человек прилег поспать на работе или в танчики поиграть и не увидел?

Vladimir
12.09.2016
05:43:36
Или платить 25 пока не сделаешь свою
То что по кругу люди его получат
И хоть 1 из 5 да проснется

Google

Vladimir
12.09.2016
05:45:45
И оправданность трат она зависит от того сколько это все сэкономит денег компании

Nick
12.09.2016
05:45:50
нюанс в том, что кггда в пределях пяти человек - ночью дежурный максимум один, а остальные штатно спят.
сделать свое не кажется сложной проблемой. Как сделаю, если получится оторвать от остального кода - выложу на гитхаб )

Vladimir
12.09.2016
05:46:21

Aleksey
12.09.2016
05:46:54
Будит* eveb

Vladimir
12.09.2016
05:47:57
И вот упал воип
Чо тогда делать?

Nick
12.09.2016
05:50:23

Vladimir
12.09.2016
05:51:21

Nick
12.09.2016
05:51:50
это всё решаемые до какого-то предела проблемы

Aleksey
12.09.2016
05:52:22

Dmitry
12.09.2016
05:53:46
говорилку можно на asterisk сделать

Aleksey
12.09.2016
05:53:58
это всё решаемые до какого-то предела проблемы
Думаю, что с такими вопросами вам лучше с аплинками пообщаться, у них частенько есть переадресации условные и мониторинговые разные сигнализации, это собственного монитора не отменяет, по клиентам, конечно

Dmitry
12.09.2016
05:54:00
дешево и сердито
а его уже sip'ом цеплять

Anton
12.09.2016
06:01:05

Phil
12.09.2016
06:31:31

Vladimir
12.09.2016
06:37:21
https://blog.dataloop.io/top10-open-source-time-series-databases

Google

Vladimir
12.09.2016
06:37:22
Но перформанс они не меняли а брали из документации и ишьюз на гитхабе
Без учета паттернов нагрузки, настроек и разницы в железе

Phil
12.09.2016
06:46:48
Дак это не то
Это только про метрики
Ну т.е. вообще не то о чем я
Я на хую простите уже ваши метрики вертел. Метрики ради метрик Богу метрик. Кроме нахуй никому не нужных метрик, есть ещё чекалки и алерты

Vladimir
12.09.2016
06:50:02
И метрики и алерты
И чекалки и коллекторы
Но проблем почекать нет особых
Есть ицинга-нагиос и они good enough
А вот с методиками проблема
А без метрик не сделать anomaly detection например

Phil
12.09.2016
06:53:37

Denis 災 nobody
12.09.2016
06:54:04

Vladimir
12.09.2016
06:54:19