
Pavel
20.04.2017
02:48:28

Farruh
20.04.2017
02:48:45
Спасибо! ?

KrivdaTheTriewe
20.04.2017
15:52:44
Возникали ли у кого проблемы в спарке версией <1.6 когда допустим
case class Message(a:String)
sealed trait Result
case class Good(r:String) extends Result
case class Bad(r:String) extends Result
case class Exp(n:Int) extends Result
stream:DStream[Result]
stram.flatmap {
case Bad(a) => Some(a)
case _ => _
}
Сваливалось бы в Some(a) в случае если Good и Bad , но не Exp
@pomadchin вы shapless у себя используете?

Google

Grigory
21.04.2017
20:33:00
И сирка

Nick
21.04.2017
20:33:37
какой активный чатик

Grigory
21.04.2017
20:33:40
Нe о чeм рассказать по факту , ничeго интeрeсногл на нeм нeт; Поли функции и копродакты

Nick
21.04.2017
20:33:59
задам вопрос тут, может вы знаете распределенную fs чоткую

Grigory
21.04.2017
20:34:13
Хдфс да гластeр

Nick
21.04.2017
20:34:18
а серн

KrivdaTheTriewe
21.04.2017
20:34:58
что сейчас каноничней, хайв и орк или хайв и hbase

Oleg
21.04.2017
20:35:39
1с говорят четко работает)

Grigory
21.04.2017
20:35:54

Nick
21.04.2017
20:36:04
говорят хорошая штука

Grigory
21.04.2017
20:36:21

Google

Grigory
21.04.2017
20:37:00
А с хдупим совмeстима?)

Nick
21.04.2017
20:37:27
posix
наверное да)

KrivdaTheTriewe
21.04.2017
20:38:24
просто если начинает компания хранить где-то оно хранит только там

Grigory
21.04.2017
20:49:30
А для каких цeлeй хранить?

KrivdaTheTriewe
21.04.2017
20:51:04
аналитика
просто зависит от конфигурации

Maverick
23.04.2017
17:49:02
@krivdathetriewe, предлагаю продолжить обсуждение биллиотек для работы с партиционированными Hive таблицами в Spark на Scala тут
@krivdathetriewe
Я понмаю, что оно работает

KrivdaTheTriewe
23.04.2017
17:52:20

Maverick
23.04.2017
17:52:23
мне бы удобно
чтоб абстакции были повыше

KrivdaTheTriewe
23.04.2017
17:53:13
http://stackoverflow.com/questions/31341498/save-spark-dataframe-as-dynamic-partitioned-table-in-hive
http://stackoverflow.com/questions/40267953/hive-on-spark-list-all-partitions-for-specific-hive-table-and-adding-a-partition
Но, насколько помню, там были заморочки и останется только методом проб и ошибок всё разрешать

Maverick
23.04.2017
17:56:14
DataFrame - туповат. Полагается на порядок полей, а не на имена.

Google

Maverick
23.04.2017
17:56:23
И это напрягает.
Ну да ладно. Нет, дак нет.
Будем сами писать.

Dmitry
24.04.2017
14:31:11
тестирую Спарк. наткнулся на такой баг
https://issues.apache.org/jira/browse/SPARK-13747
у кого-то были такие проблемы? как с этим жить?)

Andrey
24.04.2017
16:10:27
запустил на кластере 1.6.2 - подобной ошибки нет

KrivdaTheTriewe
24.04.2017
16:11:47
Со спарком всегда магия пока что

Andrey
24.04.2017
16:16:39
пол года гдето используем спарк - все достаточно стабильно :)

KrivdaTheTriewe
24.04.2017
16:20:22

Andrey
24.04.2017
16:24:28
вероятно поэтому 2.0 только в tech preview в HDP

KrivdaTheTriewe
24.04.2017
16:27:26
http://www.datascience.in.ua/

Dmitry
24.04.2017
16:53:30
Попробую даунгрейднуть спарк и перетестить
не взлетело на 1.6.3, если просто по 2 запроса в секунду слать на протяжении 2 минут, то > failed 77 ( 32%)

Andrey
25.04.2017
11:57:03
а в каком режиме запускаете спарк?
standalone, yarn-cluster и т д?

Dmitry
25.04.2017
11:57:23
standalone
взял снапшот 2.2.0, с ним все ок
хоть это радует )

Google

Dmitry
25.04.2017
13:33:41
не очень-то и ок оказалось. но все-таки понял как обойти проблему - свичнул executor диспатчера на акке с ForkJoinPool на обычный thread-pool (отправляю таски в спарк через акка-хттп приложение). но то что спарк юзает thread-local переменные для состояния и говнокодит у себя что-то чтобы их менеджить - это зашквар

Andrey
25.04.2017
13:48:32
попробуйте этот эксперимент на кластере провести :) мне кажется этой проблемы там не будет

KrivdaTheTriewe
27.04.2017
15:56:47
прямая трансляция митапа по spark
https://l.timepad.ru/stat/l/ZBXzMQzFDCwnhppjZNTYTmSBNGMpyFDvuUwebwG088q3pShb7eY1RucXzoSo1NCw2tj4tGSl1HR3Tb3xwD37Sw,,/mail/207205445/
приятно , что про работу спарка с нуля рассказывают

Pavel
27.04.2017
16:55:14
https://m.facebook.com/story.php?story_fbid=1537521079605272&id=497026710321386

KrivdaTheTriewe
27.04.2017
16:55:46
правильная ссылка на трансляцию
Pavel Klemenkov:
https://m.facebook.com/story.php?story_fbid=1537521079605272&id=497026710321386

?Ivan
27.04.2017
16:57:39
они против scala, печаль ?

KrivdaTheTriewe
27.04.2017
17:01:42
Слайды (с купированым слайдом кривой рожи но с бонусными слайдами по кривые (не рожи) заполняющие пространства (и рожи)) (en)
https://www.slideshare.net/GrigoryPomadchin/geotrellis-gis-on-scala-75459066
Ноутбук (ru):
https://github.com/pomadchin/geotrellis-gis-on-scala
Доклад про оптимизацию решения gis поверх спарка

Alex
27.04.2017
17:03:55
А подскажите, плиз, а запись митапа ведется и будет ли выложена?

Pavel
27.04.2017
17:09:43
Да, ведётся феймбуком)
И нами)

Alex
27.04.2017
17:10:05
спасибо большое !!!

KrivdaTheTriewe
27.04.2017
17:36:46
а дайте ссылку пожалуйста на телеграм чат митапа

Pavel
27.04.2017
17:56:02
https://t.me/ramblerapachesparkbot
они против scala, печаль ?
Мы не против Скалы. Я сам её изучаю, мне нравится. Дело в том, что у нас эксперименты в прод тащат те, кто их делает. Поэтому на Питоше и удобней и разработка быстрей.

Farruh
28.04.2017
06:55:47
Кроме фейсбука, еще где нибудь можно трансляцую посмотреть?

?Ivan
28.04.2017
07:10:53

Pavel
28.04.2017
07:10:56
Запись есть, выложим.

KrivdaTheTriewe
28.04.2017
07:11:46

Google

Farruh
28.04.2017
07:12:40

KrivdaTheTriewe
28.04.2017
07:12:52
думал увижу у вас в докладе рассказ про эту штуку)
Друзья, всем привет! Нам поступает много вопросов о том, где можно посмотреть запись вчерашнего митапа, отвечаем, здесь - https://www.facebook.com/afishamansarda/videos/1537521079605272/ Просмотр видео доступен и для незарегистрированных пользователей. Презентации мы тоже обязательно выложим чуть позже в общих доступ и напишем вам про это.