
KrivdaTheTriewe
14.11.2016
17:35:34
https://docs.databricks.com/spark/latest/training/index.html
Прям смотри

Grigory
14.11.2016
17:36:16
Думаю в рамках форсирования сетов

KrivdaTheTriewe
14.11.2016
17:36:22
Блин, я твою аву разглядел

Google

KrivdaTheTriewe
14.11.2016
17:36:46
Я ещё не юзал , но придёте можно будет авровский коннектор в стриминге юзать
А это хорошо

Grigory
14.11.2016
17:36:51
еще раз скажу что хоть брайан и ходил еше с весны со своими дата сетами
никаокго профита нет от них
ток для питонопоклонников

KrivdaTheTriewe
14.11.2016
17:37:23
Ну разве они не научились быстро делать джоины ?

Grigory
14.11.2016
17:37:30
нет
нереально медленные джойны
огромные ограничения на типы джойна

KrivdaTheTriewe
14.11.2016
17:37:47
Пока hive наше все
Тогда

Grigory
14.11.2016
17:37:55
рдд быстро джойнятся
если ключ партиции верно задаешь

Google

KrivdaTheTriewe
14.11.2016
17:38:23
Только если забродкастишь

Vladislav
14.11.2016
17:38:36
никто не пошел в итоге на jug msk с Егором ?

Grigory
14.11.2016
17:38:40
что броадкастить?

KrivdaTheTriewe
14.11.2016
17:38:53
Табличку с которой джойнить будешь

Grigory
14.11.2016
17:38:54
ах да
я не таблцами)
у мя кв кв кв
ну и да супер фича у дата сетов есть
нельзя джойнить по "плохим" ключам

KrivdaTheTriewe
14.11.2016
17:39:24
Да можно не таблицу

Grigory
14.11.2016
17:39:31
джя джойна датасету нужны анкодеры и декодеры
они есть только для примитивов и продактов

KrivdaTheTriewe
14.11.2016
17:39:56
Ты из дца что ли ?

Grigory
14.11.2016
17:40:18
по бинарному он не сумеет
ну и в операциях на датасетах все должно быть cериализуемо
если у тебя бианрные форматы то это почти фатально значит kryo
ну и изза крайо он у тебя не сджойнит по бинарному ключу
тогда как рдд джойнятся

KrivdaTheTriewe
14.11.2016
17:41:17
Ну я так посмотрел, народ вокруг меня старается крио использовать

Grigory
14.11.2016
17:41:31
да крайо быстрее конечно

Google

Grigory
14.11.2016
17:41:50
да и кстате делать ds -> rdd join rdd -> ds быстрее чем ds join ds
что еще из минусов) :D продакты тоже не понятно сериализует; может это у меня баг какой словленый; ds join ds сработает а ds join ds join ds уже пишет продакт тайп мисметч
если ключ это продакт, разумеется
ну может для текстовых данных дс подходят конечно
и числовых

Dashok
14.11.2016
17:44:45

Grigory
14.11.2016
17:44:55

Vladislav
14.11.2016
17:45:19
А ты здесь что ли?)

Dashok
14.11.2016
17:46:23

Vladislav
14.11.2016
17:46:35

Dashok
14.11.2016
17:46:55
нет ) а он щас идёт что ли? )

KrivdaTheTriewe
14.11.2016
17:48:02
DCA типа ртб
Мне интересно, просто кто для чего использует и вообще , что кроме спарка сейчас есть

Grigory
14.11.2016
17:49:35
шторм, спарк, флинк, самза) (шаурма еще)

Vladislav
14.11.2016
17:50:09

Alex
14.11.2016
17:50:11
кафка стримз еще

Alexander
14.11.2016
17:50:11

Alex
14.11.2016
17:50:21
но то по сути вариация на тему самзы

Google

Grigory
14.11.2016
17:50:38
ну спарк стриминг удобный если вся инфраструктруа уже для спарка написана; и оч просто функции для рдд просто лифтануть до стримов / сетов и тп

Dashok
14.11.2016
17:50:55
Да
о, интересно, будут ли на этот раз холиварчики^^

KrivdaTheTriewe
14.11.2016
17:57:50
Кафка стримз говорят для совсем простого чего-то
А вместо шторма сейчас херон

Grigory
14.11.2016
18:00:55

Vladislav
14.11.2016
18:02:53
И скажу я вам, Егор нарвался на более трушных ООПшников
Которые ещё более упороты
Случилось невозможное!!!!
Жаль тут нету стрима
Я бы постримил вам)

Foo
14.11.2016
18:05:25
ну-ка ну-ка?

Dashok
14.11.2016
18:18:50

Vladislav
14.11.2016
18:19:03
Возможно!
О, у Егора есть Фреймворк takes.org

Artem
14.11.2016
18:21:05

Denis
14.11.2016
18:32:32
Кто это?

Lev
14.11.2016
18:33:08
надо больше регэксов

Dmitry
14.11.2016
18:33:34
regexjava?

Vladislav
14.11.2016
18:33:42
Ну я не уверен, что там прям регЭксп

Google

Vladislav
14.11.2016
18:33:48
Хоть класс так и называется )
Вообще, на спрей похоже чем то

Dmitry
14.11.2016
18:34:10
беги оттуда

Vladislav
14.11.2016
18:34:13
Нью убрать и скобочки другие

Lev
14.11.2016
18:34:31

Vladislav
14.11.2016
18:34:52

Lev
14.11.2016
18:35:20
неужели в той фигне нет алиасов для всяких [0-9] и [a-z]

Daniel
14.11.2016
18:35:31
У него вложенность почище монад в скалаз

Lev
14.11.2016
18:35:38

Dashok
14.11.2016
18:35:47
А потом (!= null) { != null { != null { != null ....}}}}}}}}}}}}

Lev
14.11.2016
18:36:23
они рекламируют отсутствие null в фреймворке
правда за XML/XSLT всё равно будут гореть в аду

Artem
14.11.2016
18:39:05
Я после московского jpoint его смотрел, выглядит так себе на самом деле

Dashok
14.11.2016
18:40:00