@metrics_ru

Страница 218 из 681
Dmitry
26.07.2017
13:09:58
ну там же убрали in-memory index

:)

ладно, бобик сдох

Anton
26.07.2017
13:11:32
По моему инфлюкс в проде - это котёл в аду

Google
Vladimir
26.07.2017
13:12:55
@deniszh а вот там пишу что в ebay используется инфлюкс

в продакшене

Paul
26.07.2017
13:13:27
в ebay в продакшне даже монго используется

Vladimir
26.07.2017
13:13:59
в ebay в продакшне даже монго используется
а ты уверен что монго хуже? )

Denys ??
26.07.2017
13:15:06
eBay большой. Я думаю что в продакшене у нас можно найти что угодно

Paul
26.07.2017
13:16:40
а ты уверен что монго хуже? )
не знаю, я с инфлюксом не работал. С монго работал и нежно его ненавижу

Denys ??
26.07.2017
13:27:33
а вы из ebay?
йез, сортоф

vladimir
26.07.2017
13:36:52
сейчас заливаю исторические данные из графита в кликхаус, кликхаус легко переваривает 125 милионов метрик в минуту

графит на 12 у меня уже падал

Vladimir
26.07.2017
13:38:13
графит сильно зависит от конкретной имплементации и настройки я бы сказал )

Denys ??
26.07.2017
13:57:22
там жеж и юзкейсы есть - https://www.influxdata.com/project/ebay-customer-testimonial/

Monitoring of Elasticsearch as a service cluster – еще туда сюда

Google
Denys ??
26.07.2017
13:58:15
а остальное - аналитика

Vladimir
26.07.2017
13:58:37
ну вот тем не менее интересно с чего вы решили эту фигулину выбрать )

Denys ??
26.07.2017
13:58:56
Ну и какой нить платиновый мегасапорт контракт на 100500 серваков

Это не мы ?

http://www.ebaytechblog.com/2017/04/12/elasticsearch-cluster-lifecycle-at-ebay/

"Cluster monitoring is done by custom monitoring plug-in that pushes 70+ metrics from each Elasticsearch node to a back-end TSDB-based data store."

70 метрик с кластера! Мощъ!

Vladimir
26.07.2017
14:01:17
from each Elasticsearch node !

с ноды таки

Denys ??
26.07.2017
14:01:25
"We leverage an internal alert system that can be used to configure threshold-based alerts on data stored on OpenTSDB."

(ba-dum-tss!)

да, с ноды

для 10000 нод это будет 700000 метрик, ну с системными - миллиона полтора.

Ну из статьи не совсем понятно где там вообще "InfluxDB (open version)", если метрики хранятся в OpenTSDB.

Короче. К юзер саксес сториз надо относиться осторожно.

Иногда (всегда?) там не все так как рассказывает вендор.

Vladimir
26.07.2017
14:16:01
Ага

Я так читал саксес стори про друид

мы взяли друид, взяли 10 нод на амазоне, и смогли добиться миллиарада точек в день

хоп-хоп-хоп, посчитал, получилось 20 тысяч в секунду на ноду

Google
Vladimir
26.07.2017
14:17:54
читаешь дальше - они там читают десятки миллионов точек в секунду.

вчитываешься - с нод на которые нет записи при условии что все in-memory

ну ооок

или как-то в таком духе было

https://blog.project-fifo.net/the-lies-we-tell/ и вот напомню про хорошую статью про бенчмарки )

Aleksandr
26.07.2017
14:32:14
а подскажите, что годного почитать, кроме The Art Of Monitoring?

Vladimir
26.07.2017
14:37:01
https://landing.google.com/sre/book/chapters/monitoring-distributed-systems.html

можно так например

оно немного капитанское

ну и ваще sre book

Alexander
26.07.2017
14:39:48
Всем привет. Можно вопрос от того, кто ничего не понимает в метриках? Нужна активная работа с запросами + дашборды. Что выбрать?

Просто на одной стороне табикс, а на другой графана, а что имеющее функции и того и другого - не знаю.

Alexander
26.07.2017
14:41:09
С КХ конечно интеграция.

Vladimir
26.07.2017
14:42:48
@inv2004 еще можешь посмотреть на redash и superset

но я бы взял grafana + redash/superset :)

а не пытался бы выбрать имба-дэшборд

просто для запросов юзал бы одно

Alexander
26.07.2017
14:44:02
просто для запросов юзал бы одно
Ну те получается как табикс и графана одновременно?

Только табикс = суперсет (не понятно), или redash

Vladimir
26.07.2017
14:46:31
ну да

Google
Vladimir
26.07.2017
14:46:41
просто табикс все же stateless, что лично мне не очень нравится )

а redash/superset могут еще и простые графики делать

и могут в ряде случаев заменить тебе графану

Alexander
26.07.2017
14:48:40
Ок. А можно тогда ещё про redash и superset? Просто я начал ставить суперсет уже, но, увидев графану, переобулся на ходу из-за красоты последней, чем не блещет суперсет, он даже на гифках кажется тормозит :)

Alexander
26.07.2017
15:13:03
Понял, спасибо. А можно в двух словах redash vs superset? Ну может что-то ключевое. Для экономия дней изучения и того и другого :)

Admin
ERROR: S client not available

Vladimir
26.07.2017
15:15:31
а это не скажу

знаю что в cloudflare взяли superset и допилили, а я ставил тока redash

Alexander
26.07.2017
15:17:26
Спасибо, тогда изучу.

here1am
26.07.2017
15:53:26
посоны, поясните за риманн, зачем он нужен (кроме того, что афир - няшка) и что с ним сделать можно

Paul
26.07.2017
17:16:03
посоны, поясните за риманн, зачем он нужен (кроме того, что афир - няшка) и что с ним сделать можно
книжка Брендана Грегга объяснит очень детально. Она толстая, но того стоит.

here1am
26.07.2017
17:16:59
я мог и самого афира прочесть, будь мне не было жалко времени

учитывая, что мне бы понять, стоит ли копать вообще в эту сторону или нет, сразу за книгу хвататься не хочется

Paul
26.07.2017
17:24:07
стоит, если обычный мониторинг недостаточно гибкий, а времени - вагонетка. Я пытался внедрить в одном проекте, но потерпел неудачу из-за второго пункта

here1am
26.07.2017
17:24:42
ну то есть, гибкости в чём может не хватить?

Paul
26.07.2017
17:27:32
честно говоря - даже не представляю. Гибкость реймана абсолютна - он может мониторить абсолютно любые понятия и как угодно

here1am
26.07.2017
17:29:38
нет, я про гибкость "обычного мониторинга"

Google
Paul
26.07.2017
17:32:18
это может и будет зависить только от вашей задачи. У меня прометей и мне его хватает в 99% из 100 (вот плагины в node_exporter можно было бы и сделать, честное слово)

here1am
26.07.2017
17:33:16
а риман какую проблемы был призван решать?

Paul
26.07.2017
17:36:51
по-моему в первую очеред - not invented here

here1am
26.07.2017
17:38:31
а, ну норм

Andrei
26.07.2017
17:47:21
Для prometheus или opentsdb кто-нибудь использует anomaly detection? А то сейчас везде в тренде AI с машин лернингом, может уже есть что-то годное)

Ivan
26.07.2017
18:06:02
Как хорошо, что есть такой чатик, в котором я могу задавать свои дурацкие вопросы и, надеюсь, мне на них ответят.

Всем привет

here1am
26.07.2017
18:06:21
neprivet.ru

Paul
26.07.2017
18:06:51
neprivet.ru
это глупость и хамство. В данном конкретном случае

Ivan
26.07.2017
18:07:39
Господа, есть стремительно растущая сетка на 2к+ единиц сетевого оборудования (mikrotik). Чем их мониторить по нужным мне OID? Всю жизнь свою связал с заббиксом, но понимаю, что, под него нужно будет неимоверное железо для такого количества хостов.

это глупость и хамство. В данном конкретном случае
это привычка людей, которые считают, что они самые умные. Все норм, я привык.

И что бы желательно с графаной)

Я уже устал голову ломать в поисках решения

Ivan
26.07.2017
18:10:37
И не хочется покупать 3U двухпроцессорный сервер под систему мониторинга)

В общем, заббикс - сразу нет.

Начал читать про prometheus, но что то мне не понятно, как он работает с snmp. Мне вроде как объяснили, что нужно на каждое устройство будет ставить агента специального, но как то я не въеду.

Andrey
26.07.2017
18:17:08
купи циску :) а если серьёзно, то в общем то в чём вопрос?

Nikita
26.07.2017
18:17:39
А связка кх и графана- кто как метрики льет в? Бизнесовые например, у нас жавка

Страница 218 из 681