@scala_ru

Страница 224 из 1499
KrivdaTheTriewe
14.11.2016
17:35:34
https://docs.databricks.com/spark/latest/training/index.html

Прям смотри

Grigory
14.11.2016
17:36:16
Думаю в рамках форсирования сетов

KrivdaTheTriewe
14.11.2016
17:36:22
Блин, я твою аву разглядел

Google
KrivdaTheTriewe
14.11.2016
17:36:46
Я ещё не юзал , но придёте можно будет авровский коннектор в стриминге юзать

А это хорошо

Grigory
14.11.2016
17:36:51
еще раз скажу что хоть брайан и ходил еше с весны со своими дата сетами

никаокго профита нет от них

ток для питонопоклонников

KrivdaTheTriewe
14.11.2016
17:37:23
Ну разве они не научились быстро делать джоины ?

Grigory
14.11.2016
17:37:30
нет

нереально медленные джойны

огромные ограничения на типы джойна

KrivdaTheTriewe
14.11.2016
17:37:47
Пока hive наше все

Тогда

Grigory
14.11.2016
17:37:55
рдд быстро джойнятся

если ключ партиции верно задаешь

Google
KrivdaTheTriewe
14.11.2016
17:38:23
Только если забродкастишь

Vladislav
14.11.2016
17:38:36
никто не пошел в итоге на jug msk с Егором ?

Grigory
14.11.2016
17:38:40
что броадкастить?

KrivdaTheTriewe
14.11.2016
17:38:53
Табличку с которой джойнить будешь

Grigory
14.11.2016
17:38:54
ах да

я не таблцами)

у мя кв кв кв

ну и да супер фича у дата сетов есть

нельзя джойнить по "плохим" ключам

KrivdaTheTriewe
14.11.2016
17:39:24
Да можно не таблицу

Grigory
14.11.2016
17:39:31
джя джойна датасету нужны анкодеры и декодеры

они есть только для примитивов и продактов

KrivdaTheTriewe
14.11.2016
17:39:56
Ты из дца что ли ?

Grigory
14.11.2016
17:40:18
по бинарному он не сумеет

ну и в операциях на датасетах все должно быть cериализуемо

если у тебя бианрные форматы то это почти фатально значит kryo

ну и изза крайо он у тебя не сджойнит по бинарному ключу

тогда как рдд джойнятся

KrivdaTheTriewe
14.11.2016
17:41:17
Ну я так посмотрел, народ вокруг меня старается крио использовать

Grigory
14.11.2016
17:41:31
да крайо быстрее конечно

Google
Grigory
14.11.2016
17:41:50
да и кстате делать ds -> rdd join rdd -> ds быстрее чем ds join ds

что еще из минусов) :D продакты тоже не понятно сериализует; может это у меня баг какой словленый; ds join ds сработает а ds join ds join ds уже пишет продакт тайп мисметч

если ключ это продакт, разумеется

ну может для текстовых данных дс подходят конечно

и числовых

Dashok
14.11.2016
17:44:45
никто не пошел в итоге на jug msk с Егором ?
а что, тут есть его адепты? )

Grigory
14.11.2016
17:44:55
Ты из дца что ли ?
неа, не знаю кто это)

Vladislav
14.11.2016
17:45:19
а что, тут есть его адепты? )
Не обязательно быть адептом, чтобы послушать сходить)

А ты здесь что ли?)

Dashok
14.11.2016
17:46:23
Vladislav
14.11.2016
17:46:35
м?
Ну в смысле на докладе

Dashok
14.11.2016
17:46:55
нет ) а он щас идёт что ли? )

KrivdaTheTriewe
14.11.2016
17:48:02
неа, не знаю кто это)
Делают стримминг на чистой акке

DCA типа ртб

Мне интересно, просто кто для чего использует и вообще , что кроме спарка сейчас есть

Grigory
14.11.2016
17:49:35
шторм, спарк, флинк, самза) (шаурма еще)

Vladislav
14.11.2016
17:50:09
Alex
14.11.2016
17:50:11
кафка стримз еще

Alexander
14.11.2016
17:50:11
да и кстате делать ds -> rdd join rdd -> ds быстрее чем ds join ds
а есть где почитать подробней про то, о чем ты говоришь? про то когда лучше юзать рдд и т.д?

Alex
14.11.2016
17:50:21
но то по сути вариация на тему самзы

Google
Grigory
14.11.2016
17:50:38
ну спарк стриминг удобный если вся инфраструктруа уже для спарка написана; и оч просто функции для рдд просто лифтануть до стримов / сетов и тп

Dashok
14.11.2016
17:50:55
Да
о, интересно, будут ли на этот раз холиварчики^^

KrivdaTheTriewe
14.11.2016
17:57:50
Кафка стримз говорят для совсем простого чего-то

А вместо шторма сейчас херон

Grigory
14.11.2016
18:00:55
а есть где почитать подробней про то, о чем ты говоришь? про то когда лучше юзать рдд и т.д?
ну сам ток бенчмаркил, ну и это очевидно, если вся маркетинговая фишка по поводу дс в том что авто оптимизация того, что в сл с рдд оптимизируешь сам

Vladislav
14.11.2016
18:02:53
И скажу я вам, Егор нарвался на более трушных ООПшников

Которые ещё более упороты

Случилось невозможное!!!!

Жаль тут нету стрима

Я бы постримил вам)

Foo
14.11.2016
18:05:25
ну-ка ну-ка?

Vladislav
14.11.2016
18:19:03
Возможно!

О, у Егора есть Фреймворк takes.org

Artem
14.11.2016
18:21:05
Я бы постримил вам)
Пили текстовую трансляцию )

Denis
14.11.2016
18:32:32
Кто это?

Lev
14.11.2016
18:33:08
надо больше регэксов

Dmitry
14.11.2016
18:33:34
regexjava?

Vladislav
14.11.2016
18:33:42
Ну я не уверен, что там прям регЭксп

Google
Vladislav
14.11.2016
18:33:48
Хоть класс так и называется )

Вообще, на спрей похоже чем то

Dmitry
14.11.2016
18:34:10
беги оттуда

Vladislav
14.11.2016
18:34:13
Нью убрать и скобочки другие

Lev
14.11.2016
18:34:31
Вообще, на спрей похоже чем то
в спрее хоть шанс опечататься ниже

Vladislav
14.11.2016
18:34:52
в спрее хоть шанс опечататься ниже
Ну как...спорное утверждение )

Lev
14.11.2016
18:35:20
неужели в той фигне нет алиасов для всяких [0-9] и [a-z]

Daniel
14.11.2016
18:35:31
У него вложенность почище монад в скалаз

Lev
14.11.2016
18:35:38
Ну как...спорное утверждение )
рукописные экстракторы, опять же

Dashok
14.11.2016
18:35:47
А потом (!= null) { != null { != null { != null ....}}}}}}}}}}}}

Lev
14.11.2016
18:36:23
они рекламируют отсутствие null в фреймворке

правда за XML/XSLT всё равно будут гореть в аду

Artem
14.11.2016
18:39:05
они рекламируют отсутствие null в фреймворке
Они там точно были ещё в апреле )

Я после московского jpoint его смотрел, выглядит так себе на самом деле

Dashok
14.11.2016
18:40:00
они рекламируют отсутствие null в фреймворке
А, ну да Тогда заменить на !*.isEmpty()

Страница 224 из 1499