
Anton
27.06.2018
13:02:26

evix
27.06.2018
13:02:46
зачем ты собираешь метрики, если не знаешь, что с ними делать?

Anton
27.06.2018
13:03:02
Не холивара ради, любопытва и опыта для

Google

Anton
27.06.2018
13:03:59
вплоть до того что пиши свою обвязку

evix
27.06.2018
13:04:06
каких? алертменеджера?

Anton
27.06.2018
13:04:17
в целом это интересно, но с точки зрения бизнеса и поодержки - адище
Сказали что алерт менеджер не умеет в карты эскалации

Andor
27.06.2018
13:04:36
а так есть пара штук которые (возможно) это решают

Anton
27.06.2018
13:05:17
ибо когда тебе надо решить администаритвную задачу, а ты для этого начинашь ebuild писать и ядро пересобирать уж как то зло

Andor
27.06.2018
13:06:26
по-моему alerta умеет
но я не юзал никогда
проще заплатить тем же pagerduty/opsgenie, у них и приложение есть и звонить и зачитывать текст алерта умеют

Anton
27.06.2018
13:07:06

Andor
27.06.2018
13:07:24
enterprise ready? написанное на go?

Google

Andor
27.06.2018
13:07:35
кажется это шутка

Anton
27.06.2018
13:07:46
Это уже утрирование
Но в эту сторону
и да есть сервисы enterprise на go =) даю гарантию )

Andor
27.06.2018
13:08:17
нет коробочного решения

Anton
27.06.2018
13:09:00
Еще бы в топик хорошие книги статьи закрепляли по системам мониторинга чем на ровном месте батхертить

Andor
27.06.2018
13:09:27
да это не батхёрт, это уже всем просто надоело
регулярно приходит какой-нибудь чувак и говорит "у меня З и всё классно!"
FAQ тоже не случайно появился

Nklya
27.06.2018
13:11:07
Надо бы выписать ro на месяц

Ванько
27.06.2018
13:11:29

Anton
27.06.2018
13:11:47
Ну вот я такого не говорил, однако на любое упомнинаие зябы тут же report летел

Andor
27.06.2018
13:12:03
ну так и репорты же не очень всерьёз

Anton
27.06.2018
13:12:17
просто не понятно не что

Ванько
27.06.2018
13:12:26
Ну и да. Докер на go написан

Andor
27.06.2018
13:12:47
докер как раз плохой пример

Anton
27.06.2018
13:12:48
У зябы тоже много чего докручивать и допиливать пришлось, но по моей оценке значительно меньше чем с прометеем придется

Ванько
27.06.2018
13:13:46

evix
27.06.2018
13:14:17

Google

Ванько
27.06.2018
13:14:30

buttno
27.06.2018
13:14:32

Anton
27.06.2018
13:14:49
да вот вам пример примеров - https://github.com/kubernetes/kubernetes
Go 88.4%

buttno
27.06.2018
13:15:11
а то барин с наскоку хочет все, что накрутил у себя с забиксом в прекрасный чудный новый мир

Anton
27.06.2018
13:15:50

buttno
27.06.2018
13:16:20
твоей оценки чего докурчивать

evix
27.06.2018
13:16:29
человекочасов

Ванько
27.06.2018
13:17:17
Или в принципе про Hashicorp?

GithubReleases
27.06.2018
13:17:38
grafana/grafana was tagged: v5.2.0
Link: https://github.com/grafana/grafana/releases/tag/v5.2.0
Release notes:
Grafana v5.2 brings new features, many enhancements and bug fixes. This article will detail the major new features and enhancements.
* [What's new in Grafana v5.2](http://docs.grafana.org/guides/whats-new-in-v5-2/)
* [Download](https://grafana.c...
More

Anton
27.06.2018
13:17:43

Anton
27.06.2018
13:18:32

buttno
27.06.2018
13:19:08

Andor
27.06.2018
13:19:24
я не помню как книга называется

buttno
27.06.2018
13:19:29
у меня не на одном сетапе решены эти вопросы с пром

evix
27.06.2018
13:19:38
еще можно перестать думать инструментом

Andor
27.06.2018
13:19:42
ну и как бы про всякие эскалации там не будет
это бизнес-логика
для этого нужна опердень

Google

Andor
27.06.2018
13:20:11
а опердень всегда кастомна под клиента

buttno
27.06.2018
13:20:22
https://www.prometheusbook.com/

Anton
27.06.2018
13:20:34

buttno
27.06.2018
13:20:45
все для тебя

Anton
27.06.2018
13:21:01
и в целом это гораздо важнее

Andor
27.06.2018
13:21:28
я не про бизнес-мониторинг

Admin
ERROR: S client not available

buttno
27.06.2018
13:21:31
ты удивишься, но и про это книгу написали

Andor
27.06.2018
13:21:35
я про бизнес-логику эскалации алертов

Anton
27.06.2018
13:21:37
чем сожранное cpu или закончившееся место, именно доступнсоть сервиса важна же
За сылку спасибо, если книга зайдет, пиво занесу

buttno
27.06.2018
13:22:22
давайте дадим человеку время почитать манускрипты, и вернемся к обеденным молитвам за метрики

evix
27.06.2018
13:22:49
ну упал вм/контеенер, поднялся новый, метрики как шли с тегом сервиса, так и идут. надо делать алерт/эскалацию/сальто?

Andor
27.06.2018
13:23:12
зависит от

Anton
27.06.2018
13:23:13

Andor
27.06.2018
13:23:20
и это тоже бизнес-логика алертинга под конкретного пользователя

Anton
27.06.2018
13:24:02

Andor
27.06.2018
13:24:40
нет универсального ответа на этот вопрос

lenar
27.06.2018
13:36:50

Google

Nklya
27.06.2018
13:40:10
В этом канале лежит

buttno
27.06.2018
13:40:36

Andor
27.06.2018
14:04:44
Кстати тут какое-то время назад рассказывали про использование исинги для алертов и эскалаций
А сами алерты из прометея-алертменеджера

Bogdan (SirEdvin)
27.06.2018
14:07:18

Andrey Zakharov
27.06.2018
14:28:12

Vasilii
27.06.2018
14:30:54
Одно дело задетектить инцидент и поднять алерт и совсем другое решать кто дежурный, кому эскалировать, как связываться итд. Это разными софтами удобно делать

Andor
27.06.2018
14:31:37

Andrey Zakharov
27.06.2018
14:32:21
по факту вебинтерфейс с календарём дежурных , и эскалации достаточно легко решаются
а вот к этому всему подключить телефонию - немного сложнее
хотя тоже возможно
взять какой нибудь gsm шлюз
и к нему костылями прибить
ну и симку с хорошим "правильным" тарифом ) если такие ещё остались

Andor
27.06.2018
14:33:57
SIP
Это не нерешаемая задача

Andrey Zakharov
27.06.2018
14:34:09
ну тоже вариант да

Andor
27.06.2018
14:34:13
Просто большой опердень

Nklya
27.06.2018
14:34:17
Любители З хотят такое же как там))