@metrics_ru

« Назад

Страница 526 из 681

Далее »

Alexander

02.05.2018
08:49:20

Я вообще думал на gitbook переделать. Вики на гитхабе так себе.

Что за gitbook?

Roman

02.05.2018
09:00:03

Сделал лэндинг, зацените http://akumuli.org/

Выглядит здорово! // поправьте ссылку на гит.

Evgeny

02.05.2018
09:10:39

Что за gitbook?

https://www.gitbook.com/

Выглядит здорово! // поправьте ссылку на гит.

Спасибо, действительно не работает ссылка

Google

Andrey

02.05.2018
09:27:02

Ну это потому что пакеты только под 14.04 собираются, т.к. Travis ci ещё не сделали 16.04

до сих пор?

Алексей

02.05.2018
10:36:13

Сделал лэндинг, зацените http://akumuli.org/

В боковом меню на андроиде адрес github без com

M

02.05.2018
10:41:44

ребят а ктото знает как правильно считать uptime сервера в % относительно первого числа января и текущего дня

ну тоесть основываясь на uptime

Andor

02.05.2018
10:42:26

странная хотелка

M

02.05.2018
10:42:41

ну это для начала

ну а как правильно считать uptime ?

Andor

02.05.2018
10:46:33

выводишь дату и всё

ну то есть time() - node_boot_time примерно

Igor

02.05.2018
10:50:42

берёшь время даунтайма в секундах за последние 365 дней и делишь на год в секундах. 1е января тут ни при чем

Sergey

02.05.2018
11:45:32

сла слашечки

Nklya

02.05.2018
11:49:45

И сло

buttno

02.05.2018
11:49:51

OLA уж тогда

Google

Nklya

02.05.2018
11:49:56

И сли

https://www.youtube.com/watch?v=tEylFyxbDLE

Alexander

02.05.2018
13:04:40

Это хорошая новость. в документации кажется этого вообще нет. запустил optimize, жду результата )

Если внимательно почитать доку. там написанно, что mergetree переодически, в фоне, запускает оптимайз если есть на это ресурсы. Нет стопроцентной вероятность, что он это будет делать часто, но делает. GraphiteMergeTree обладает теми же свойствами.

дорогие коллеги стоит задача технического мониторинга приложений (jvm в основном) и инфраструктуры (postgres, kafka, cassanrda) есть в команде упоротые фанаты ELK которые говорят что можно всё делать через metric beat, и графану поверх этого повесить я в целом не фетишист, но хотелось бы понять, чего ожидать и ещё вопрос, как алерты прикручивать поверх ELK если не брать xpack

Готовь террабайты дискового пространства - эластик далеко не самым оптимальным образом хранит данные, но правда отдает стату быстро.

Igor

02.05.2018
13:17:26

Если внимательно почитать доку. там написанно, что mergetree переодически, в фоне, запускает оптимайз если есть на это ресурсы. Нет стопроцентной вероятность, что он это будет делать часто, но делает. GraphiteMergeTree обладает теми же свойствами.

при необходимости в фоне запускает не optimize а слияние частей (разница в том, что в результате optimize получается одна часть в партишне - сливаются все части). Кроме того это частичное слияение не гарантирует того что все данные пройдут через него. Ну и кроме того - нигде не нашел информации что при слиянии в GraphiteMergeTree происходит rollup (это мог пропустить)

Alexander

02.05.2018
13:18:52

при необходимости в фоне запускает не optimize а слияние частей (разница в том, что в результате optimize получается одна часть в партишне - сливаются все части). Кроме того это частичное слияение не гарантирует того что все данные пройдут через него. Ну и кроме того - нигде не нашел информации что при слиянии в GraphiteMergeTree происходит rollup (это мог пропустить)

слияние это и есть optimize

Igor

02.05.2018
13:25:00

Не знаю чем они отличаются по коду. По данным на диске вижу что в партишне за прошлый месяц лежала куча частей. После optimize лежит одна часть. До optimize я вижу полные данные в таблмцах за даты из прошлого месяца, после оптимайза они огрубились так как ожидается

Юрий

02.05.2018
15:02:08

Кто-нибудь работал с ним?

https://github.com/kairosdb/kairosdb

?

02.05.2018
15:06:02

https://github.com/kairosdb/kairosdb

впервые вижу, но Fast Time Series Database on Cassandra уже неплохо)

Ilja

02.05.2018
15:06:34

Ребята подскажите плиз, у меня в бозуне стоит кверина $series = 100 - graphite("groupByNode(servers.*.cpu.*.percent.idle, 1, 'avg')", "30m", "", "host") как мне исключить группу хостов? Это вообще возможно? В доках не нашел Спасибо!

Sergey

02.05.2018
15:20:42

в графите есть функция exclude()

и в вызове скорее всего ошибка, нужно не host а .host, как и операция 100-набор подозреваю что не отработает... но лень проверить :)

Ilja

02.05.2018
15:23:39

спасибо, буду копаться

Sergey

02.05.2018
15:29:18

Общий совет: если можно уменьшить количество данных вываливающихся в бозон со стороны бекенда, то лучше так и делать (проще всего проверять тайминги отработки в логах бозона). Условные критерии для данного примера - если серверов 100, то норм, если 200+ то уже стоит поиграться, если их 1000+ то точно нужно думать и применять всякие MaximumAbove(), TOP() и прочие фильтры

бозон хоть и обладает математикой, но не особо шустр... и да это если бекендом carbonapi и go-carbon... если чистый графит то вполне возможна и обратная ситуация

Ilja

02.05.2018
15:31:20

все конфиги на коленке писаны, 7к хостов, хочу выкинуть big data, там CPU usage всегда в районе 98%. Остальное разносить буду по группам

Sergey

02.05.2018
15:33:32

ох уж этот триггер cpu.busy... сколько копий сломано

Maxim

02.05.2018
17:14:43

копий триггера?

M

02.05.2018
21:14:36

ребят а вот можно сделать вот так какой-то сервис регистрирует свой адрес в consule prometheus без перезагрузки сразу это видит и передаёт Black box exporter проверять эти сервисы по http тоесть своего рода health check

Google

M

02.05.2018
21:15:32

ну а black box тоже начинает проверять это все без перезагрузки конфига

Andor

02.05.2018
21:15:41

Можно

M

02.05.2018
21:16:11

я просто не делал связку prom + consule и не знаю как он считывает оттуда конфиги

Алексей

02.05.2018
21:25:31

господа. это грустно и плохо. как лучше ? prometheus > alertmanager > webhook > alerta > mattermost > bridge > telegram

Andor

02.05.2018
21:26:44

А нельзя вебхуком в телеграм слать? Вроде ж бот уже есть готовый?

Алексей

02.05.2018
21:26:54

я в россии.

Andor

02.05.2018
21:27:06

Лол

Аргумент

Алексей

02.05.2018
21:27:45

для мм нашелся https://github.com/42wim/matterbridge

конвертилко

Andor

02.05.2018
21:29:49

А маттермост не умеет в апи как в слаке?

Не юзал его

Алексей

02.05.2018
21:36:56

он умеет как раз именно в это api

Andor

02.05.2018
21:42:35

То есть тебе даже отдельный вебхук не надо, можно просто взять слак интеграцию в алертменеджере

Алексей

02.05.2018
21:43:28

для чего ?

для отправки в mm ? дак она есть и работает

Andor

02.05.2018
21:44:01

У тебя ж в схеме мм был

Не?

Или тебе алерта в схеме обязательна?

Алексей

02.05.2018
21:51:40

ну а где кроме как в алерте взять дашик ?

Google

Andor

02.05.2018
21:51:51

Хз

Я её не юзал

Алексей

02.05.2018
21:52:20

можно конечно копировать в сторону дашика. но разницы не оч много.

Andor

02.05.2018
21:52:29

А ваще в графане есть плагин для алертменеджера как датасорса

Алексей

02.05.2018
21:52:31

слишко много компонентов и всё слишком н епрозрачное

Andor

02.05.2018
21:52:44

Но хз подойдёт ли

Алексей

02.05.2018
21:52:55

ну графану еще в стек не хватает притащить с активным алертингом ага...

Andor

02.05.2018
21:53:36

У тебя есть пром но нет графаны?

https://raw.githubusercontent.com/camptocamp/grafana-prometheus-alertmanager-datasource/master/images/overview.png я вот это имел в виду

Admin

ERROR: S client not available

Алексей

02.05.2018
21:54:32

у меня есть и пром и графана. но в цепочке отификации графаны нету.

Andor

02.05.2018
21:55:00

Ну в данном случае она сбоку чисто для овервью

Алексей

02.05.2018
21:55:15

https://raw.githubusercontent.com/camptocamp/grafana-prometheus-alertmanager-datasource/master/images/overview.png я вот это имел в виду

графана не дашик. дашику надо иметь возможность агрегировать много алертманеджеров

Andor

02.05.2018
21:55:54

Хм

Алексей

02.05.2018
21:57:55

читать алерты удобно в телеге. смотреть списком удобно в дашике. посылать алерты удобно в слак. что за черт

Andor

02.05.2018
21:58:05

Беда

Значит каждый инструмент говно

По-своему

В общем-то это известный факт :)

Алексей

02.05.2018
21:59:39

надо больше json-а и еще немного yaml и тогда точно добавив чутьчуть toml станет всем хорошо. ведь jinja.

Google

Andor

02.05.2018
22:00:59

К слову, шаблонизировать ямль джинджей и гошными шаблонами - дно

Алексей

02.05.2018
22:01:31

Andor

02.05.2018
22:01:51

И отступы

Я в папете делал <%= @data.to_yaml %> и это было менее дно, потому что я структуру контролировал и валидировал

Sergey

03.05.2018
06:48:38

за маттербридж гранд мерси

Алексей

03.05.2018
07:24:52

за маттербридж гранд мерси

Я пока хз мерси или нет. Я пока только про его факт наличия знаю. Может оно не оч.

Sergey

03.05.2018
07:26:27

ну на го же :) если что доработаем напильником

У меня "шланг" мониторинга кстати длинее (или толще) смотря в какой проекции на него смотреть. Сейчас вот осталось редиску за динамит спрятать чтобы бозон стал условно отказоустойчивым и буду этим монстром хвастаца :)

Алексей

03.05.2018
07:36:33

У меня "шланг" мониторинга кстати длинее (или толще) смотря в какой проекции на него смотреть. Сейчас вот осталось редиску за динамит спрятать чтобы бозон стал условно отказоустойчивым и буду этим монстром хвастаца :)

развесистее ?

Sergey

03.05.2018
07:37:07

кластерность же... чтоб она у всех всегда стабильно работала

Vadim

03.05.2018
07:37:14

пацаны, я тут мимокрокодилом. а чего у вас за шлангомер тут, где взять?

Sergey

03.05.2018
07:37:56

ты там 4 версию Z продолжай пилить... неча к нам в огородик ходить и капусту грызть :)

вы хоть в 4 версии 50К NVPS преодолеете?

хоть это в принципе и не нужно для рынка который освоен Z

Vadim

03.05.2018
07:44:10

ты там 4 версию Z продолжай пилить... неча к нам в огородик ходить и капусту грызть :)

ну ок, не буду. придётся продолжать с нулём шланг сравнивать :(

Andor

03.05.2018
07:46:13

а что такое nvps?

Sergey

03.05.2018
07:46:35

а чего ты сравнить хочешь? коробочные решения надо сравнивать с другими коробочными решениями

и с ТЗ заказчика :)

это metric per sec но в другой церкви, там исторически возникло название new value per sec

Andor

03.05.2018
07:53:24

так 50к значений в секунду это ж для локалхоста

Алексей

03.05.2018
07:54:29

это metric per sec но в другой церкви, там исторически возникло название new value per sec

это в графитовской ?

Andor

03.05.2018
07:54:43

кажется в той что тут запрещена

« Назад

Страница 526 из 681

Далее »

Открыть в Telegram