@metrics_ru

Страница 668 из 681
Psy
14.10.2018
09:00:47
Задача отлично на кх натягивается

George
14.10.2018
09:05:41
А в чем жопность ?
все об этом гоорят. Нестабильно. Можно потерять даные

У прометея прокси есть. Тоесть пушишь в него а прометей потом выковыривает ужо с него
push gateway. Но он не для этого, ИМХО, а если сервис напрямую прометею недоступен (ну, там за НАТом или типа того)

Google
Andor
14.10.2018
09:06:19
Я об этом не говорю

А опыта с прометеем уже три года скоро будет

George
14.10.2018
09:06:50
Я об этом не говорю
о чем? о долговременном хранении? Ну, расскажи, сколько у тебя всего прометеев, сколько в них данных лежит.

Правда, интересно

Andor
14.10.2018
09:11:31
Три недели у меня сейчас лежит

George
14.10.2018
09:11:51
Три недели у меня сейчас лежит
речь о том, чтобы туда засунуть метрики за 2 года

и чтоб стабильно

Andor
14.10.2018
09:12:05
Ну сунь в танос если очень надо

Создатели прометея не ставили перед собой такую задачу, поэтому и не решили

George
14.10.2018
09:13:04
https://improbable.io/games/blog/thanos-prometheus-at-scale положу ссылку. Мало ли кому пригодится.

Создатели прометея не ставили перед собой такую задачу, поэтому и не решили
несомненно. Но нужно понимать, что платформа мониторинга - это чуть шире, чем просто прометеус. Она состоит из множества связанных компонентов. И есть у нас проект, в котором она будет имплементирована. Делаем выбор компонентов

Nklya
14.10.2018
09:13:47
И это тоже про танос

Google
Nklya
14.10.2018
09:13:48
Отличная публикация в блоге компании Monzo про то, как построена их новая система мониторинга на базе Prometheus+Alertmanager+Thanos+Grafana. И как Thanos помогает распределять нагрузку по многим инстансам Prometheus и обеспечивать долговременное хранение метрик. http://amp.gs/PrYE

Andor
14.10.2018
09:15:18
Над прометеем сейчас есть три проекта для лонг-терм сторейжа

George
14.10.2018
09:15:44
Над прометеем сейчас есть три проекта для лонг-терм сторейжа
я их перечислял вроде - M3DB, TimescaleDB и, видимо, Thanos?

Andor
14.10.2018
09:15:59
Танос, м3 и вейв

Таймскейл не дают тебе мультинод в бесплатной версии

Лучшие практики инфлюкса

Nklya
14.10.2018
09:17:06
Не вейв, а кортекс кажется?

Марк ☢
14.10.2018
09:17:14
Хосспаде

Запилите ужо доку

George
14.10.2018
09:17:35
Хосспаде
https://prometheus.io/docs/prometheus/latest/storage/

Note that a limitation of the local storage is that it is not clustered or replicated. Thus, it is not arbitrarily scalable or durable in the face of disk or node outages and should thus be treated as more of an ephemeral sliding window of recent data. However, if your durability requirements are not strict, you may still succeed in storing up to years of data in the local storage.

сами разрабы предупреждают как бе

т.е., повторюсь, для оперативного мониторинга - ИДЕАЛЬНО

для долговременного (ну, типа, посмотреть данные за три месяца назад) - такое себе

Andor
14.10.2018
09:18:52
George
14.10.2018
09:19:02
плюс еще вопрос - как вы обеспечиваете отказоустойчивость. Получается, что нужно скрейпить данные как минимум двумя прометеями

а то один упал... и приплыли

Andor
14.10.2018
09:19:24
Ну перезапустил

Google
George
14.10.2018
09:19:44
Ну перезапустил
ты потерял все данные между сбоем и перезапуском

если это не критично = ок

Andor
14.10.2018
09:22:39
Это же оперативный мониторинг, а не бизнес-данные

George
14.10.2018
09:24:23
Это же оперативный мониторинг, а не бизнес-данные
ваши предложения для бизнес-метрик, учитывая, что приложуха их отдает в том же прометей-формате?

и чтоб не ваять 5 разных мониторингов

bebebe
14.10.2018
09:24:53
одна история интереснее другой

George
14.10.2018
09:29:29
bebebe а свои истории есть?

bebebe
14.10.2018
09:30:08
bebebe а свои истории есть?
есть, но они такие, что у меня нет свободного времени их по воскресеньям в чатике рассказывать. простите.

George
14.10.2018
09:30:28
??

Bogdan (SirEdvin)
14.10.2018
09:56:37
ваши предложения для бизнес-метрик, учитывая, что приложуха их отдает в том же прометей-формате?
Вы же понимаете, что если не будете отсеивать 5% реально важных данных от всех остальных и хранить все как важные, будет больно?

Vladislav
14.10.2018
10:13:11
А вот подскажите, за какое время вы храните логи?

Неужели реально имеет смысл хранить логи 3 летней давности например

Psy
14.10.2018
10:14:54
Неужели реально имеет смысл хранить логи 3 летней давности например
у таких обычно на балконе и в гараже не протолкнуться...

Vladimir
14.10.2018
10:21:43
Кроме целесообразности запросов могут быть ещё законы

Vladislav
14.10.2018
10:22:29
Ну кроме законов

Законы, это необходимость и тз

А вот как вы определяете, сколько хранить те или иные логи

George
14.10.2018
10:43:11
ну, смотрите. У меня был кейс, когда мне нужно было смотреть метрики за полгода

т.к. была утечка памяти в коде, которая, если перезагружать сервера каждый день, не выявлялась

Google
George
14.10.2018
10:43:49
а там где полгода - там и год. Где год - там и три

Никита
14.10.2018
11:57:18
Неужели реально имеет смысл хранить логи 3 летней давности например
Капасити планнинг, но там не так много метрик надо, кмк.

Admin
ERROR: S client not available

Vladimir
14.10.2018
12:46:04
Terminator
14.10.2018
14:10:46
Joe Black будет жить. Поприветствуем!

@ifireice будет жить. Поприветствуем!

Yuliy
14.10.2018
18:52:37
Коллеги. Глупый вопрос. Пока не нашел ответа в гугле. Какотключитьв индексе ненужные поля в еластике?

У меня идут поля что мне нужны и несктолько забралось лишних а где их рубануть не нашел

Yuliy
14.10.2018
18:55:26
Спасибо)

Terminator
15.10.2018
03:00:02
@truedevs будет жить. Поприветствуем!

Nklya
15.10.2018
08:36:36
Инсайды?

Aliaksandr
15.10.2018
08:38:19
Здравый смысл :)

MSfixer
15.10.2018
08:38:53
А какие крупнейшие организации используют Prometheus как основное решение? Хоть как-то оценить масштаб.

buttno
15.10.2018
08:39:34
https://stackshare.io/prometheus

Nklya
15.10.2018
08:40:48
крупнейшие организации это что? Вон сбер родил Z в 2018 и прется с этого, а в других банках какой-нибудь ХП. Если на них смотреть, можно в говне купаться бесконечно

Aliaksandr
15.10.2018
08:41:47
Некоторые используют rrdtool и довольны

MSfixer
15.10.2018
08:42:00
Тиволи же

Google
Timur
15.10.2018
08:43:29
Тиволи же
прямо байка про "некий функционал" вспоминается :)

MSfixer
15.10.2018
08:45:19
У нас Тиволи основное, но я ему не доверяю. Дошло до того что они из Prometheus хотят доставать мои метрики. Но тогда зачем все эти сложности.

Denys ??
15.10.2018
08:46:51
А какие крупнейшие организации используют Prometheus как основное решение? Хоть как-то оценить масштаб.
Сходу вспоминается Soundcloud и DigitalOcean. Но Soundcloud – авторы изначального решения и DO раньше использовал Vulcan, на что переехали потом - непонятно.

Но вообще Пром это не про большие организации, там сама концепция другая имхо.

Vladimir
15.10.2018
08:49:29
https://promcon.io/2017-munich/talks/monitoring-cloudflares-planet-scale-edge-network-with-prometheus/

Bogdan (SirEdvin)
15.10.2018
08:50:39
Здравый смысл :)
Кек чебурек. Сделайте хотя бы скидку на "работает - не трогам" или инерцию в принятии решений.

Denys ??
15.10.2018
08:50:45
А, ну да, я ж был на их докладе.

Ну они забавные.

У нас, грят, в каждом ДЦ две железки с промом

Vladimir
15.10.2018
08:51:43
У нас, грят, в каждом ДЦ две железки с промом
Ну с учётом того что они понимают под ДЦ, суммарно это много

Страница 668 из 681