
Aleksandr
11.09.2018
13:00:24
Ну как пример вот это)
https://blogs.oracle.com/datawarehousing/big-data-sql-quick-start-offloading-part2

kutepovfedor
11.09.2018
13:15:18
Здравствуйте
Уважаемые разработчики, кто-то работал с Aerospike? Мне бы проконсультироваться...

Sergey
11.09.2018
13:20:26
кто-то работал

sherzod
11.09.2018
13:21:55

Google

kutepovfedor
11.09.2018
13:30:50
Мне надо хранить версии документов с сортировкой по дате
В аэроспайк не увидел решений, там даже нет указания для порядка записи данных
Это вообще реально сделать на данной БД ?

KrivdaAllStars
11.09.2018
13:37:16
Можно ключ сделать
Если скажем не более одного документа в день

The mirror
11.09.2018
13:38:57

Alexander
11.09.2018
13:42:39
Что в данном случае представляет собой документ? Если набор атрибутов и есть HDFS, то версии есть у HBase из коробки.

Sergey
11.09.2018
13:46:48

kutepovfedor
11.09.2018
13:50:57
Спасибо, значит буду разруливать как-то. Может на другой БД
Ещё один вопрос: Аэроскпайк же платное решение? Не понятен этот момент: оплата за количество серверов или за ПО ?

Daniel
11.09.2018
13:52:32
есть комьюнити версия с некоторыми лимитами (по количеству объектов, до 6 серверов и еще что-то)
почему именно аэроспайк?

kutepovfedor
11.09.2018
13:56:35

Daniel
11.09.2018
13:57:07

kutepovfedor
11.09.2018
14:01:35

Google

Andrey
11.09.2018
14:32:28

Dan
11.09.2018
14:33:14

Nikolay
11.09.2018
14:34:16
Hbase же вроде умеет это
По версиям.
Вот и будет документ и его версии. По дате

Andrey
11.09.2018
14:36:54

kutepovfedor
11.09.2018
14:55:22
а сциллу не попробовали?
Вот после аэроспайка буду пробовать
Хотя, сутя по их лозунгу, мало что изменится при переходе на неё

Dan
11.09.2018
14:56:09

kutepovfedor
11.09.2018
15:01:11

Daniel
11.09.2018
15:09:01

Andrey
11.09.2018
15:11:02

Daniel
11.09.2018
15:12:57
А про кейс, я б глянул возможности udf. Напрашивается доки хранить по бинам, где дата имя бина.

Dan
11.09.2018
15:16:13

Andrey
11.09.2018
15:16:51
там много решений, ключ => id документа, value sorted map где ключ версия, а значение время
и у них есть метод get_index(-1) самое последнее и будет

kutepovfedor
11.09.2018
15:17:14

Andrey
11.09.2018
15:18:06

Dan
11.09.2018
15:18:56

Daniel
11.09.2018
15:20:41

Google

Daniel
11.09.2018
15:21:34

Andrey
11.09.2018
15:22:04
может быть упорядочена,
Elements are stored based on the map's ordering type. Unordered maps have no persisted ordering, while K-ordered maps are stored based on key ordering. KV-ordered maps are also K-ordered but may have an additional value-order index depending the namespace configuration. Performance for different map types are detailed below.
Element access can also be based on ordering - either through index (key ordering) or rank (value ordering).

Dan
11.09.2018
15:22:30

kutepovfedor
11.09.2018
15:23:21
Ну вот ElasticSearch работает как часы кстати

Dan
11.09.2018
15:27:15

kutepovfedor
11.09.2018
15:28:32

Andrey
11.09.2018
15:28:43

Dan
11.09.2018
15:33:25

Andrey
11.09.2018
15:37:29

Dan
11.09.2018
15:39:41

Andrey
11.09.2018
15:45:34
год назад на митапе в рамблере говорили что у них кластер под аналитику (спарк и т.д.) состоит из 40 серверов, а у тут тысячи это на два порядка больше, т.е. это уровень одноклассников/вк. Проблемы формулы 1 мало трогают обычных автолюбителей.

Dan
11.09.2018
16:19:58

kutepovfedor
11.09.2018
17:09:04
А платные решения какие есть, не подскажете?

Andrey
11.09.2018
17:56:49
он разве не сфокусирован на in memory?
вроде с двиком vinyl ram как кеш https://tarantool.io/ru/doc/1.9/book/box/engines/
документация конечно поражает, куски на русском языке, куски на английском

Stanislav
11.09.2018
18:09:58

Andrey
11.09.2018
18:17:51

Google

Stanislav
11.09.2018
18:18:29
Во всех смыслах, как разработчика

Andrey
11.09.2018
18:24:48
ага, приехать к метро аэропорт, и взять за грудки, с фразой когда пофиксишь баг?

Stanislav
11.09.2018
18:31:14
Почти что. В крайнем случае отминусовать карму очередной бравурной статьи на хабре

Andrey
11.09.2018
19:23:14

KrivdaAllStars
11.09.2018
19:58:04
Там на деньги яндексе его выкупили

Andrey
11.09.2018
20:03:14

Mitya
12.09.2018
12:48:18
#job
Всем привет!
Ищем Data engineer и Архитекторов в нашу команду в СИБУРе. Если в вашей голове назревает вопрос «Шта? И где там большие данные?», то поверьте - поле для творчества очень большое. Данных, конечно не как в кликстриме, но много - производство тоже их постоянно генерит.
У нас полный гринфилд, смелые эксперименты и последние технологии приветствуются. Пока мы строим, а все знают, что строить гораздо интересней, чем сопровождать. В плане источников есть всё, начиная от rdbms и заканчивая IIoT.
Есть вопросы или интерес? Велкам ко мне в личку!

Sergey
12.09.2018
14:20:28

Daniel
12.09.2018
14:20:59

Sergey
12.09.2018
14:21:30
при том что недалеко ушли и людей там больше, соответственно шансов найти

Daniel
12.09.2018
14:22:05
Лан, не буду на тему кто и как далеко ушел.

Sergey
12.09.2018
14:22:22
и те и те в хадупе кассандре ковыряются

Daniel
12.09.2018
14:23:36
Ок ок

Igor
12.09.2018
16:33:37
Привет! Кто-нибудь юзает спарк сабмит оператор в эйрфлоу?

Grigory
12.09.2018
17:31:51

Igor
12.09.2018
17:33:40
Да, было бы интересно, не первый раз слышу нелестные отзывы

Oleksandr
12.09.2018
17:37:02

Grigory
12.09.2018
17:38:06
Постоянно что-то отваливалось и они забили

Google

Oleksandr
12.09.2018
17:38:40
бгг, хорошо, что я так и не рискнул на нем
свой велосипед всяко приятнее

Grigory
12.09.2018
17:39:08
ну не знаю) в итоге авс завязка