
Vladimir
14.10.2018
08:59:52

Psy
14.10.2018
09:00:47
Задача отлично на кх натягивается

George
14.10.2018
09:05:41

Google

Andor
14.10.2018
09:06:19
Я об этом не говорю
А опыта с прометеем уже три года скоро будет

George
14.10.2018
09:06:50
Я об этом не говорю
о чем? о долговременном хранении? Ну, расскажи, сколько у тебя всего прометеев, сколько в них данных лежит.
Правда, интересно

Andor
14.10.2018
09:11:31
Три недели у меня сейчас лежит

George
14.10.2018
09:11:51
и чтоб стабильно

Andor
14.10.2018
09:12:05
Ну сунь в танос если очень надо
Создатели прометея не ставили перед собой такую задачу, поэтому и не решили

George
14.10.2018
09:13:04
https://improbable.io/games/blog/thanos-prometheus-at-scale
положу ссылку. Мало ли кому пригодится.

Nklya
14.10.2018
09:13:47
И это тоже про танос

Google

Nklya
14.10.2018
09:13:48
Отличная публикация в блоге компании Monzo про то, как построена их новая система мониторинга на базе Prometheus+Alertmanager+Thanos+Grafana.
И как Thanos помогает распределять нагрузку по многим инстансам Prometheus и обеспечивать долговременное хранение метрик.
http://amp.gs/PrYE

Марк ☢
14.10.2018
09:15:04

Andor
14.10.2018
09:15:18
Над прометеем сейчас есть три проекта для лонг-терм сторейжа

George
14.10.2018
09:15:44

Andor
14.10.2018
09:15:59
Танос, м3 и вейв
Таймскейл не дают тебе мультинод в бесплатной версии
Лучшие практики инфлюкса

Nklya
14.10.2018
09:17:06
Не вейв, а кортекс кажется?

Марк ☢
14.10.2018
09:17:14
Хосспаде
Запилите ужо доку

George
14.10.2018
09:17:35
Хосспаде
https://prometheus.io/docs/prometheus/latest/storage/
Note that a limitation of the local storage is that it is not clustered or replicated. Thus, it is not arbitrarily scalable or durable in the face of disk or node outages and should thus be treated as more of an ephemeral sliding window of recent data. However, if your durability requirements are not strict, you may still succeed in storing up to years of data in the local storage.
сами разрабы предупреждают как бе
т.е., повторюсь, для оперативного мониторинга - ИДЕАЛЬНО
для долговременного (ну, типа, посмотреть данные за три месяца назад) - такое себе

Andor
14.10.2018
09:18:52

Марк ☢
14.10.2018
09:18:57

George
14.10.2018
09:19:02
плюс еще вопрос - как вы обеспечиваете отказоустойчивость. Получается, что нужно скрейпить данные как минимум двумя прометеями
а то один упал... и приплыли

Andor
14.10.2018
09:19:24
Ну перезапустил

Google

George
14.10.2018
09:19:44
если это не критично = ок

Andor
14.10.2018
09:22:39
Это же оперативный мониторинг, а не бизнес-данные

George
14.10.2018
09:24:23
и чтоб не ваять 5 разных мониторингов

bebebe
14.10.2018
09:24:53
одна история интереснее другой

George
14.10.2018
09:29:29
bebebe а свои истории есть?

bebebe
14.10.2018
09:30:08

George
14.10.2018
09:30:28
??

Bogdan (SirEdvin)
14.10.2018
09:56:37

Vladislav
14.10.2018
10:13:11
А вот подскажите, за какое время вы храните логи?
Неужели реально имеет смысл хранить логи 3 летней давности например

Psy
14.10.2018
10:14:54

Vladimir
14.10.2018
10:21:43
Кроме целесообразности запросов могут быть ещё законы

Vladislav
14.10.2018
10:22:29
Ну кроме законов
Законы, это необходимость и тз
А вот как вы определяете, сколько хранить те или иные логи

George
14.10.2018
10:43:11
ну, смотрите. У меня был кейс, когда мне нужно было смотреть метрики за полгода
т.к. была утечка памяти в коде, которая, если перезагружать сервера каждый день, не выявлялась

Google

George
14.10.2018
10:43:49
а там где полгода - там и год. Где год - там и три

Никита
14.10.2018
11:57:18

Admin
ERROR: S client not available

Vladimir
14.10.2018
12:46:04

Terminator
14.10.2018
14:10:46
Joe Black будет жить. Поприветствуем!
@ifireice будет жить. Поприветствуем!

Yuliy
14.10.2018
18:52:37
Коллеги. Глупый вопрос. Пока не нашел ответа в гугле. Какотключитьв индексе ненужные поля в еластике?
У меня идут поля что мне нужны и несктолько забралось лишних а где их рубануть не нашел

Deep Sea
14.10.2018
18:55:14

Yuliy
14.10.2018
18:55:26
Спасибо)

Terminator
15.10.2018
03:00:02
@truedevs будет жить. Поприветствуем!

Aliaksandr
15.10.2018
08:01:21

Nklya
15.10.2018
08:36:36
Инсайды?

Aliaksandr
15.10.2018
08:38:19
Здравый смысл :)

MSfixer
15.10.2018
08:38:53
А какие крупнейшие организации используют Prometheus как основное решение? Хоть как-то оценить масштаб.

buttno
15.10.2018
08:39:34
https://stackshare.io/prometheus

Nklya
15.10.2018
08:40:48
крупнейшие организации это что?
Вон сбер родил Z в 2018 и прется с этого, а в других банках какой-нибудь ХП.
Если на них смотреть, можно в говне купаться бесконечно

Aliaksandr
15.10.2018
08:41:47
Некоторые используют rrdtool и довольны

MSfixer
15.10.2018
08:42:00
Тиволи же

Google

Timur
15.10.2018
08:43:29
Тиволи же
прямо байка про "некий функционал" вспоминается :)

Denys ??
15.10.2018
08:44:26

MSfixer
15.10.2018
08:45:19
У нас Тиволи основное, но я ему не доверяю. Дошло до того что они из Prometheus хотят доставать мои метрики. Но тогда зачем все эти сложности.

Denys ??
15.10.2018
08:46:51
Но вообще Пром это не про большие организации, там сама концепция другая имхо.

Vladimir
15.10.2018
08:49:29
https://promcon.io/2017-munich/talks/monitoring-cloudflares-planet-scale-edge-network-with-prometheus/

Bogdan (SirEdvin)
15.10.2018
08:50:39
Здравый смысл :)
Кек чебурек. Сделайте хотя бы скидку на "работает - не трогам" или инерцию в принятии решений.

Denys ??
15.10.2018
08:50:45
А, ну да, я ж был на их докладе.
Ну они забавные.
У нас, грят, в каждом ДЦ две железки с промом

Vladimir
15.10.2018
08:51:43