
Dmitry
26.07.2017
13:09:58
ну там же убрали in-memory index
:)
ладно, бобик сдох

Anton
26.07.2017
13:11:32
По моему инфлюкс в проде - это котёл в аду

Google

Vladimir
26.07.2017
13:12:55
@deniszh а вот там пишу что в ebay используется инфлюкс
в продакшене

Paul
26.07.2017
13:13:27
в ebay в продакшне даже монго используется

Vladimir
26.07.2017
13:13:59

Denys ??
26.07.2017
13:15:06
eBay большой. Я думаю что в продакшене у нас можно найти что угодно

Paul
26.07.2017
13:16:40

Denys ??
26.07.2017
13:27:33

vladimir
26.07.2017
13:36:52
сейчас заливаю исторические данные из графита в кликхаус, кликхаус легко переваривает 125 милионов метрик в минуту
графит на 12 у меня уже падал

Vladimir
26.07.2017
13:38:13
графит сильно зависит от конкретной имплементации и настройки я бы сказал )

Denys ??
26.07.2017
13:57:22
там жеж и юзкейсы есть - https://www.influxdata.com/project/ebay-customer-testimonial/
Monitoring of Elasticsearch as a service cluster – еще туда сюда

Google

Denys ??
26.07.2017
13:58:15
а остальное - аналитика

Vladimir
26.07.2017
13:58:37
ну вот тем не менее интересно с чего вы решили эту фигулину выбрать )

Denys ??
26.07.2017
13:58:56
Ну и какой нить платиновый мегасапорт контракт на 100500 серваков
Это не мы ?
http://www.ebaytechblog.com/2017/04/12/elasticsearch-cluster-lifecycle-at-ebay/
"Cluster monitoring is done by custom monitoring plug-in that pushes 70+ metrics from each Elasticsearch node to a back-end TSDB-based data store."
70 метрик с кластера! Мощъ!

Vladimir
26.07.2017
14:01:17
from each Elasticsearch node !
с ноды таки

Denys ??
26.07.2017
14:01:25
"We leverage an internal alert system that can be used to configure threshold-based alerts on data stored on OpenTSDB."
(ba-dum-tss!)
да, с ноды
для 10000 нод это будет 700000 метрик, ну с системными - миллиона полтора.
Ну из статьи не совсем понятно где там вообще "InfluxDB (open version)", если метрики хранятся в OpenTSDB.
Короче. К юзер саксес сториз надо относиться осторожно.
Иногда (всегда?) там не все так как рассказывает вендор.

Vladimir
26.07.2017
14:16:01
Ага
Я так читал саксес стори про друид
мы взяли друид, взяли 10 нод на амазоне, и смогли добиться миллиарада точек в день
хоп-хоп-хоп, посчитал, получилось 20 тысяч в секунду на ноду

Google

Vladimir
26.07.2017
14:17:54
читаешь дальше - они там читают десятки миллионов точек в секунду.
вчитываешься - с нод на которые нет записи при условии что все in-memory
ну ооок
или как-то в таком духе было
https://blog.project-fifo.net/the-lies-we-tell/ и вот напомню про хорошую статью про бенчмарки )

Aleksandr
26.07.2017
14:32:14
а подскажите, что годного почитать, кроме The Art Of Monitoring?

Vladimir
26.07.2017
14:37:01
https://landing.google.com/sre/book/chapters/monitoring-distributed-systems.html
можно так например
оно немного капитанское
ну и ваще sre book

Alexander
26.07.2017
14:39:48
Всем привет. Можно вопрос от того, кто ничего не понимает в метриках? Нужна активная работа с запросами + дашборды. Что выбрать?
Просто на одной стороне табикс, а на другой графана, а что имеющее функции и того и другого - не знаю.

Alexander
26.07.2017
14:41:09
С КХ конечно интеграция.

Vladimir
26.07.2017
14:42:48
@inv2004 еще можешь посмотреть на redash и superset
но я бы взял grafana + redash/superset :)
а не пытался бы выбрать имба-дэшборд
просто для запросов юзал бы одно

Alexander
26.07.2017
14:44:02
Только табикс = суперсет (не понятно), или redash

Vladimir
26.07.2017
14:46:31
ну да

Google

Vladimir
26.07.2017
14:46:41
просто табикс все же stateless, что лично мне не очень нравится )
а redash/superset могут еще и простые графики делать
и могут в ряде случаев заменить тебе графану

Alexander
26.07.2017
14:48:40
Ок. А можно тогда ещё про redash и superset? Просто я начал ставить суперсет уже, но, увидев графану, переобулся на ходу из-за красоты последней, чем не блещет суперсет, он даже на гифках кажется тормозит :)

Vladimir
26.07.2017
14:49:36
но они под аналитику
а графана под мониторинг

Alexander
26.07.2017
15:13:03
Понял, спасибо. А можно в двух словах redash vs superset? Ну может что-то ключевое. Для экономия дней изучения и того и другого :)

Admin
ERROR: S client not available

Vladimir
26.07.2017
15:15:31
а это не скажу
знаю что в cloudflare взяли superset и допилили, а я ставил тока redash

Alexander
26.07.2017
15:17:26
Спасибо, тогда изучу.

here1am
26.07.2017
15:53:26
посоны, поясните за риманн, зачем он нужен (кроме того, что афир - няшка) и что с ним сделать можно

Paul
26.07.2017
17:16:03

here1am
26.07.2017
17:16:59
я мог и самого афира прочесть, будь мне не было жалко времени
учитывая, что мне бы понять, стоит ли копать вообще в эту сторону или нет, сразу за книгу хвататься не хочется

Paul
26.07.2017
17:24:07
стоит, если обычный мониторинг недостаточно гибкий, а времени - вагонетка. Я пытался внедрить в одном проекте, но потерпел неудачу из-за второго пункта

here1am
26.07.2017
17:24:42
ну то есть, гибкости в чём может не хватить?

Paul
26.07.2017
17:27:32
честно говоря - даже не представляю. Гибкость реймана абсолютна - он может мониторить абсолютно любые понятия и как угодно

here1am
26.07.2017
17:29:38
нет, я про гибкость "обычного мониторинга"

Google

Paul
26.07.2017
17:32:18
это может и будет зависить только от вашей задачи. У меня прометей и мне его хватает в 99% из 100 (вот плагины в node_exporter можно было бы и сделать, честное слово)

here1am
26.07.2017
17:33:16
а риман какую проблемы был призван решать?

Paul
26.07.2017
17:36:51
по-моему в первую очеред - not invented here

here1am
26.07.2017
17:38:31
а, ну норм

Andrei
26.07.2017
17:47:21
Для prometheus или opentsdb кто-нибудь использует anomaly detection? А то сейчас везде в тренде AI с машин лернингом, может уже есть что-то годное)

Ivan
26.07.2017
18:06:02
Как хорошо, что есть такой чатик, в котором я могу задавать свои дурацкие вопросы и, надеюсь, мне на них ответят.
Всем привет

here1am
26.07.2017
18:06:21
neprivet.ru

Paul
26.07.2017
18:06:51
neprivet.ru
это глупость и хамство. В данном конкретном случае

Ivan
26.07.2017
18:07:39
Господа, есть стремительно растущая сетка на 2к+ единиц сетевого оборудования (mikrotik). Чем их мониторить по нужным мне OID? Всю жизнь свою связал с заббиксом, но понимаю, что, под него нужно будет неимоверное железо для такого количества хостов.
И что бы желательно с графаной)
Я уже устал голову ломать в поисках решения

Ivan
26.07.2017
18:10:18
Особого тюнинга тоже не проводил

Ivan
26.07.2017
18:10:37
И не хочется покупать 3U двухпроцессорный сервер под систему мониторинга)
В общем, заббикс - сразу нет.
Начал читать про prometheus, но что то мне не понятно, как он работает с snmp. Мне вроде как объяснили, что нужно на каждое устройство будет ставить агента специального, но как то я не въеду.

Andrey
26.07.2017
18:17:08
купи циску :) а если серьёзно, то в общем то в чём вопрос?

Nikita
26.07.2017
18:17:39
А связка кх и графана- кто как метрики льет в? Бизнесовые например, у нас жавка