

Alexander
02.04.2018
15:08:54
Друзья,
Сообщество DevOps в России помогает готовить конференцию по DevOps и эксплуатации RootConf (http://rootconf.ru/), которая пройдёт в Москве, Сколково, 28 и 29 мая.
На конференции мы собираемся поговорить о разработке, тестировании и эксплуатации IT-проектов через призму DevOps: логгирование и мониторинг, технологии виртуализации и контейнеризации, управление конфигурацией, непрерывное развёртывание и деплой, технологии отказоустойчивости и катастрофоустойчивости, а также управление в эксплуатации.
Уже прошло много времени с тех пор, как мы озаботились мониторингом, а до сих пор мониторинг сакс, люди умеют настраивать системы мониторинга, но не знают как мониторить свой проект или наоборот. Так ли плох Zabbix и так ли хорош Prometheus, как уговорить разработчиков описывать свой продукт в виде метрик, как эти метрики разбирать — ничего непонятно. Если вам все понятно или хотя бы немного из этого или вы знаете людей, которые с чем-то разобрались, то мы ждем заявки на доклады и от вас и от них.
Приглашаем докладчиков! Я в ПК, готов помочь с выбором тем. Организаторы обещают сделать всё, что мы придумаем и привести всех докладчиков, кого мы придумаем, за свой счёт.


Алексей
02.04.2018
15:16:48
Друзья,
Сообщество DevOps в России помогает готовить конференцию по DevOps и эксплуатации RootConf (http://rootconf.ru/), которая пройдёт в Москве, Сколково, 28 и 29 мая.
На конференции мы собираемся поговорить о разработке, тестировании и эксплуатации IT-проектов через призму DevOps: логгирование и мониторинг, технологии виртуализации и контейнеризации, управление конфигурацией, непрерывное развёртывание и деплой, технологии отказоустойчивости и катастрофоустойчивости, а также управление в эксплуатации.
Уже прошло много времени с тех пор, как мы озаботились мониторингом, а до сих пор мониторинг сакс, люди умеют настраивать системы мониторинга, но не знают как мониторить свой проект или наоборот. Так ли плох Zabbix и так ли хорош Prometheus, как уговорить разработчиков описывать свой продукт в виде метрик, как эти метрики разбирать — ничего непонятно. Если вам все понятно или хотя бы немного из этого или вы знаете людей, которые с чем-то разобрались, то мы ждем заявки на доклады и от вас и от них.
Приглашаем докладчиков! Я в ПК, готов помочь с выбором тем. Организаторы обещают сделать всё, что мы придумаем и привести всех докладчиков, кого мы придумаем, за свой счёт.
Саша канал для конфы есть ?


Alexander
02.04.2018
15:27:39
Есть чатик конфы t.me/ritfest если ты об этом

Nikita
02.04.2018
15:28:52
У тех кто использует carbon-clickhouse, не было проблемы что часть путей метрик не пишется в graphite_tree?

Google

Alex
02.04.2018
15:31:07
Молюсь за вас, братие

Alexander
02.04.2018
15:35:42
В общем у кого есть, что рассказать, но не уверен, не знает, не готов, пишите мне, я помогу

Andrey
02.04.2018
15:40:58
Ребят, кто чем мониторит http endpoint’ы? Так чтобы, например, в yaml описать все и запустить (локально)? Нужно что-то вроде https://github.com/ivpusic/httpcheck

Bogdan (SirEdvin)
02.04.2018
15:41:54
prometheus + blackbox_exporter?

Andrey
02.04.2018
15:43:27
Локально!
В кластере и куб проверит

Gleb
02.04.2018
15:48:01
а почему из прометея убрали протобаф из коммуникации?

Andrey
02.04.2018
15:48:32

Bogdan (SirEdvin)
02.04.2018
15:49:18
Эм ... возможно я не совсем понимаю, но зачем мониторить что-то локально?

Serhio
02.04.2018
15:51:56

Andrey
02.04.2018
15:53:23

Nklya
02.04.2018
15:54:40
Ну есть же всякие InSpec для тестов

Bogdan (SirEdvin)
02.04.2018
15:55:06
Нагрузочное тестирование, что ли?

Google

Gleb
02.04.2018
15:56:26

Andrey
02.04.2018
16:00:01
Ну есть же всякие InSpec для тестов
Inspec это руби, нафиг руби. Хочется бинарь гошный) Мы уже писали такую утилиту, сейчас стоит вопрос поддерживать её дальше или не велосипедить

Paul
02.04.2018
16:00:38

Andrey
02.04.2018
16:01:00
У нас был в yaml/toml
Все отлично, кроме руби

Bogdan (SirEdvin)
02.04.2018
16:01:46
Locust?

Nklya
02.04.2018
16:01:51
https://github.com/aelsabbahy/goss
Уже кучу лет есть goss

Andrey
02.04.2018
16:07:31
Уже кучу лет есть goss
Есть, но он достаточно топорен. Нужна хотя бы валидация корректного xml/json. Подстановка доменов для теста. Он ближе к inspec’у, ориентирован на систему

Nklya
02.04.2018
16:07:52
Тогда возвращаемся к руби
А можно поконтрибутить в госс, чтобы не пилить свои велосипеды

Andrey
02.04.2018
16:09:27
Что не так? Ну да, у меня capistrano && chef, но еще и inspec, точно не хочу)

Paul
02.04.2018
16:12:16
У нас был в yaml/toml
это пока вам не нужно что-то по-настоящему сложное сделать. У меня этот ямл есть в ансибле, и от, к примеру, циклов мне хочется кричать

Nklya
02.04.2018
16:12:40
А шеф тестируется чем?

Andrey
02.04.2018
16:12:43
Так там сложное и не нужно
А шеф тестируется чем?
Ничем. Им сейчас только базовая настройка сервера производится, все остальное в контейнерах

Pablo
02.04.2018
16:16:16

Nik
02.04.2018
16:40:32
оч тупой вопрос. На go клиенте к прому, считаю latency. Оно же туда в наносекундах должно передаваться или нет?
latency.WithLabelValues("servcieProvider").Observe(float64(int64(date.GPS.GGNSTimestamp) - t.Unix()))

Google

Andor
02.04.2018
18:27:28

Nik
02.04.2018
18:27:44

Andor
02.04.2018
18:27:57
а должно быть в секундах
у тебя там float64, разница между секундами и наносекундами будет в множителе
https://www.robustperception.io/who-wants-seconds/

Nik
02.04.2018
18:35:58

Andor
02.04.2018
18:52:55
зачем писать метрики не в стандартных единицах?

Nik
02.04.2018
18:54:01
ну например, латенси меня интересует в микросекундах

Andor
02.04.2018
18:54:08
пиши в секундах
будет 0.000332сек

Nik
02.04.2018
18:54:17
с дробной частью?
в float

Алексей
02.04.2018
18:54:26
флоат дорогой очень

Andor
02.04.2018
18:54:33
то есть 3.32*10^-4
в прометее это так и так будет float64

Nik
02.04.2018
18:54:46
и еще он погрешности имеет

Andor
02.04.2018
18:55:51
он по-умолчанию не в golang клиенте
он по-умолчанию в прометее
других типов данных в прометее вообще нет

Google

Nik
02.04.2018
18:57:27
я пока не понимаю, в чем счастье делать секунды, если меня интересуют наносекунды

Admin
ERROR: S client not available

Andor
02.04.2018
18:57:43
тебя интересует время, а не наносекунды
инфа 100%

Nik
02.04.2018
18:57:45
дробная часть подарит мне только погрешность

Andor
02.04.2018
18:58:05
что такое "дробная часть", если у тебя _всегда_ float64
большая ли разница, записать в значение число 239.00000 (подразумевая наносекунды) или записать 0.000000239 (подразумевая секунды) ? и там и там тип данных будет float64

отделение
02.04.2018
19:01:59

Nik
02.04.2018
19:02:16
ладно, может я не шарю

отделение
02.04.2018
19:02:17
а разница в порядке дополнительной погрешности не даст

Nik
02.04.2018
19:02:20
пойду читать матчасть
погрешность появляется только на мат операциях?

Andor
02.04.2018
19:03:04
нет, она всегда есть при ieee754
и ты от него никуда не денешься в прометее, потому что всегда данные в float64

Nik
02.04.2018
19:04:09
спс
пойду читать

отделение
02.04.2018
19:06:29
но погрешность будет в любом случае
>>> math.frexp(239.00000)
(0.93359375, 8)
>>> math.frexp(0.000000239)
(0.501219328, -21)

Andrew
02.04.2018
20:12:32
есть грабли что поле $request может содержать битый unicode, и $status может быть 000 (если не обернуть в кавычки, а писать числом, то стандартный питонячий json на этом ломается)

Google

Sergey
02.04.2018
20:17:02

Andrew
02.04.2018
20:17:40
ты намекаешь на escape=json??)
класть такое в эластик - жирно) если логгировать "очень простые запросы" в эластик, то очень быстро понимаешь что логгирование это вычислительно более сложная операция чем собственно обработка запроса)
надо очень хорошо подумать, нужен ли собственно лог
вся эта пляска у меня с кликхаусом потому что эластиком с такими объемами очень дорого работать, я даже подумываю фронтовые логи оттуда убрать совсем, а в кликхаусе деградировать точность данных до минуты (впрочем в случае с кликхаусом можно и железа добавить, оно того стоит)


GithubReleases
02.04.2018
21:52:00
influxdata/telegraf was tagged: 1.6.0-rc1
Link: https://github.com/influxdata/telegraf/releases/tag/1.6.0-rc1
Release notes:
Telegraf 1.6.0-rc1
influxdata/telegraf was tagged: 1.6.0-rc1
Link: https://github.com/influxdata/telegraf/releases/tag/1.6.0-rc1
Release notes:
Arch
Platform
Package
SHA256
amd64
Debian
[`telegraf_1.6.0~rc1-1_amd64.deb`](https://dl.influxdata.com/telegraf/releases/telegraf_1.6.0%7Erc1-1_amd64.deb)
`3bf1b42ca9a8c54daf03627628b97e4640ac97d4c0d171dc685b7fdf6ada6104`...
More
influxdata/telegraf was tagged: 1.6.0-rc2
Link: https://github.com/influxdata/telegraf/releases/tag/1.6.0-rc2
Release notes:
Telegraf 1.6.0-rc2

Алексей
02.04.2018
23:39:08
быстро они

Vladimir
02.04.2018
23:41:45
да )