
Vladimir
17.05.2017
15:15:14

Nick
17.05.2017
15:15:44
одно другому не мешает, можешь в нем и structured данные хранить
вопрос только в том, какого размера будет индекс

Andrey
17.05.2017
15:15:55
А clickhouse уже упоминали?)

Google

Nick
17.05.2017
15:15:59
в плане чтения он будет хорош

Алексей
17.05.2017
15:17:34

Nick
17.05.2017
15:17:46

Andrey
17.05.2017
15:18:16

Vladimir
17.05.2017
15:18:31

Nick
17.05.2017
15:18:36

Vladimir
17.05.2017
15:18:37
тогда поговорим )

Алексей
17.05.2017
15:18:49
а что за тесты? продукты то разные

Andrey
17.05.2017
15:19:20
на каком кеисе
Аналитика. Взять большой кусок данных, обработать, выдать.

Nick
17.05.2017
15:19:50

Andrey
17.05.2017
15:20:02

Алексей
17.05.2017
15:20:37

Nick
17.05.2017
15:20:41

Google

Andrey
17.05.2017
15:20:49

Nick
17.05.2017
15:21:15
постгрес может еще лочить row, не стоит забывать об этом

Andrey
17.05.2017
15:21:49
Я просто че его вспомнил. Он доя мониторинговых данных более чем ок
Такое, быстрое кладбище данных

Nick
17.05.2017
15:26:55
судя по всему даже некоторые юзают
https://www.elastic.co/blog/elasticsearch-as-a-time-series-data-store

Nikolay
17.05.2017
15:28:24

Nick
17.05.2017
15:28:39

Nikolay
17.05.2017
15:28:53

Nick
17.05.2017
15:29:23
я не вижу проблем в использовании elasticsearch для хранения метрик

Nikolay
17.05.2017
15:29:47
молодец

Nick
17.05.2017
15:29:55
вон у типа в статье он быстрее InfluxDB работал

Nikolay
17.05.2017
15:30:22
influxdb - кусок говна, который на рынке занял нишу только потому, что безрыбье
быть быстрее него - это, прямо скажем, так себе достижение

Nick
17.05.2017
15:30:47
тем не менее, использовать можно
как будет свободный сервер даже проверим

Nikolay
17.05.2017
15:30:56
можно, да, многие используют
но на prometheus тоже стоит посмотреть в целом
я не топлю за него, но по первому взгляду он мне понравился

Google

Nick
17.05.2017
15:32:09
первый взгляд? ты его не использовал?
а у нас он в проде

Nikolay
17.05.2017
15:32:21
я его использовал, но не на проде
так, играл с ним на тестовых проектах
но под довольно большой нагрузкой

Sergey
17.05.2017
15:33:01

Nikolay
17.05.2017
15:33:34

Sergey
17.05.2017
15:34:18
а нагрузка при выборке?

Nikolay
17.05.2017
15:34:45
выборку не мерял, я просто хотел его к графане подцепить и посмотреть, получится ли реалтаймовый график строить с обновлением раз в секунду
получилось

Sergey
17.05.2017
15:35:29
Проблемы то начинаются когда 30 человек по графане шарахаются, и выбирают всякого разного

Andrey
17.05.2017
15:35:31

Nikolay
17.05.2017
15:35:43

Sergey
17.05.2017
15:35:56
Эм. Логи?

Nikolay
17.05.2017
15:36:13
бинарный дамп трафика с пакетами в реалтайме
одна запись - один пакет

Andrey
17.05.2017
15:36:41
Мне кажется или бд не лучшее место для этого?)))

Sergey
17.05.2017
15:37:04
Может он художник - он так видит

Nikolay
17.05.2017
15:37:05
если хранить ограниченную по времени историю метрик - вполне себе место
например, несколько часов

Google

Andrey
17.05.2017
15:37:36
А что вы с этими пакетами делаете?

Nikolay
17.05.2017
15:37:54
аналитику строим по ним, они из кафки приходят

Andrey
17.05.2017
15:38:24
А какого рода аналитику? Что на выходе?

Тефтеля
17.05.2017
15:38:30
йо, в 2к17 slony не используют же?)

Nikolay
17.05.2017
15:38:59
А какого рода аналитику? Что на выходе?
если совсем конкретно - это примерно 30% мирового DNS-трафика, который к нам стримится с инсталляций нашего DNS-сервера у магистральных интернет-провайдеров
то есть, аналитика - это секьюрити и это детектирование аномалий

Andrey
17.05.2017
15:39:40
Ааааа, понял.

Sergey
17.05.2017
15:39:41
а аномалии чем ищете?

Admin
ERROR: S client not available

Nikolay
17.05.2017
15:40:07
дата саентисты пишут разные модельки, метрики считают
кластеризация там используется, например

Andrey
17.05.2017
15:40:21
А что ща контора? Не Qrator ли?

Nikolay
17.05.2017
15:40:28
нет, Nominum

Andrey
17.05.2017
15:40:52
А на чем пишут? На чем гоняете?

Nikolay
17.05.2017
15:41:18
C++, Python, Scala, Java
все подряд, много разных проектов

Andrey
17.05.2017
15:41:35
Spark и еже с ним?)

Nikolay
17.05.2017
15:41:52
пока что нет, но хотим попробовать spark streaming, да
а может даже и flink

Sergey
17.05.2017
15:42:12
А инфлакс гоняли под такими данными?

Google

Sergey
17.05.2017
15:42:20
чем не устроил?

Nikolay
17.05.2017
15:42:56
инфлакс не масштабируется от слова вообще, это просто писалка, которая толком ничего не умеет

Sergey
17.05.2017
15:43:24

Nikolay
17.05.2017
15:43:55
ну не знаю, я не увидел там ничего такого, что могло бы заставить нас его купить

Sergey
17.05.2017
15:43:59
ну, а чего ей уметь с верх того что она может?
И чего умеет prometheus

Nikolay
17.05.2017
15:49:26
выборки делать нормально, данные чинить руками при необходимости
я знаю, что influxdb умеет в урезанный SQL, но там все равно с этим проблемы были какие-то у аналитиков

Vladimir
17.05.2017
15:50:25
Там кластер за бабло
У чуваков проблемы с базовым функционалом (посмотри на жалобы на время рестарта сервера, например), им нет причин доверять бабло за кластер
плюс как бы кучи проблем в прошлом говорят что пусть поварится еще годика два, может станет лучше
@krasina15 я правда его тыкал последний раз во времена 0.13, но не в моих принципах слишком быстро перетестировать что-то (учитывая жалобы на то же время запуска, например), может к концу лета опять руки дойдут. Но для меня в нем плохо отсутствие кластеризации и то что те версии что я тыкал (0.7, 0.8, 0.13) работали просто отвратительно. Начиная от потерь данных, заканчивая скоростью записи и чтения.

87776
17.05.2017
15:56:26
Есть у кого гугл пикскель? Какой там мечсенжер по умолчанию?

Nikolay
17.05.2017
15:56:42
hangout небось

87776
17.05.2017
15:58:25
Пидоры
Я не понимаю что можно юзать вместо него

Nikolay
17.05.2017
15:58:40
так и нафиг он нужен

87776
17.05.2017
15:58:41
Одно говно

Nikolay
17.05.2017
15:59:01
телеграм и смски