Pavel
20.04.2017
02:48:28
Farruh
20.04.2017
02:48:45
Спасибо! ?
KrivdaTheTriewe
20.04.2017
15:52:44
Возникали ли у кого проблемы в спарке версией <1.6 когда допустим
case class Message(a:String)
sealed trait Result
case class Good(r:String) extends Result
case class Bad(r:String) extends Result
case class Exp(n:Int) extends Result
stream:DStream[Result]
stram.flatmap {
case Bad(a) => Some(a)
case _ => _
}
Сваливалось бы в Some(a) в случае если Good и Bad , но не Exp
@pomadchin вы shapless у себя используете?
Google
Grigory
21.04.2017
20:33:00
И сирка
Nick
21.04.2017
20:33:37
какой активный чатик
Grigory
21.04.2017
20:33:40
Нe о чeм рассказать по факту , ничeго интeрeсногл на нeм нeт; Поли функции и копродакты
Nick
21.04.2017
20:33:59
задам вопрос тут, может вы знаете распределенную fs чоткую
Grigory
21.04.2017
20:34:13
Хдфс да гластeр
Nick
21.04.2017
20:34:18
а серн
KrivdaTheTriewe
21.04.2017
20:34:58
что сейчас каноничней, хайв и орк или хайв и hbase
Oleg
21.04.2017
20:35:39
1с говорят четко работает)
Grigory
21.04.2017
20:35:54
Nick
21.04.2017
20:36:04
говорят хорошая штука
Grigory
21.04.2017
20:36:21
Google
Grigory
21.04.2017
20:37:00
А с хдупим совмeстима?)
Nick
21.04.2017
20:37:27
posix
наверное да)
KrivdaTheTriewe
21.04.2017
20:38:24
просто если начинает компания хранить где-то оно хранит только там
Grigory
21.04.2017
20:49:30
А для каких цeлeй хранить?
KrivdaTheTriewe
21.04.2017
20:51:04
аналитика
просто зависит от конфигурации
Maverick
23.04.2017
17:49:02
@krivdathetriewe, предлагаю продолжить обсуждение биллиотек для работы с партиционированными Hive таблицами в Spark на Scala тут
@krivdathetriewe
Я понмаю, что оно работает
KrivdaTheTriewe
23.04.2017
17:52:20
Maverick
23.04.2017
17:52:23
мне бы удобно
чтоб абстакции были повыше
KrivdaTheTriewe
23.04.2017
17:53:13
http://stackoverflow.com/questions/31341498/save-spark-dataframe-as-dynamic-partitioned-table-in-hive
http://stackoverflow.com/questions/40267953/hive-on-spark-list-all-partitions-for-specific-hive-table-and-adding-a-partition
Но, насколько помню, там были заморочки и останется только методом проб и ошибок всё разрешать
Maverick
23.04.2017
17:56:14
DataFrame - туповат. Полагается на порядок полей, а не на имена.
Google
Maverick
23.04.2017
17:56:23
И это напрягает.
Ну да ладно. Нет, дак нет.
Будем сами писать.
Dmitry
24.04.2017
14:31:11
тестирую Спарк. наткнулся на такой баг
https://issues.apache.org/jira/browse/SPARK-13747
у кого-то были такие проблемы? как с этим жить?)
Andrey
24.04.2017
16:10:27
запустил на кластере 1.6.2 - подобной ошибки нет
KrivdaTheTriewe
24.04.2017
16:11:47
Со спарком всегда магия пока что
Andrey
24.04.2017
16:16:39
пол года гдето используем спарк - все достаточно стабильно :)
KrivdaTheTriewe
24.04.2017
16:20:22
Andrey
24.04.2017
16:24:28
вероятно поэтому 2.0 только в tech preview в HDP
KrivdaTheTriewe
24.04.2017
16:27:26
http://www.datascience.in.ua/
Dmitry
24.04.2017
16:53:30
Попробую даунгрейднуть спарк и перетестить
не взлетело на 1.6.3, если просто по 2 запроса в секунду слать на протяжении 2 минут, то > failed 77 ( 32%)
Andrey
25.04.2017
11:57:03
а в каком режиме запускаете спарк?
standalone, yarn-cluster и т д?
Dmitry
25.04.2017
11:57:23
standalone
взял снапшот 2.2.0, с ним все ок
хоть это радует )
Google
Dmitry
25.04.2017
13:33:41
не очень-то и ок оказалось. но все-таки понял как обойти проблему - свичнул executor диспатчера на акке с ForkJoinPool на обычный thread-pool (отправляю таски в спарк через акка-хттп приложение). но то что спарк юзает thread-local переменные для состояния и говнокодит у себя что-то чтобы их менеджить - это зашквар
Andrey
25.04.2017
13:48:32
попробуйте этот эксперимент на кластере провести :) мне кажется этой проблемы там не будет
KrivdaTheTriewe
27.04.2017
15:56:47
прямая трансляция митапа по spark
https://l.timepad.ru/stat/l/ZBXzMQzFDCwnhppjZNTYTmSBNGMpyFDvuUwebwG088q3pShb7eY1RucXzoSo1NCw2tj4tGSl1HR3Tb3xwD37Sw,,/mail/207205445/
приятно , что про работу спарка с нуля рассказывают
Pavel
27.04.2017
16:55:14
https://m.facebook.com/story.php?story_fbid=1537521079605272&id=497026710321386
KrivdaTheTriewe
27.04.2017
16:55:46
правильная ссылка на трансляцию
Pavel Klemenkov:
https://m.facebook.com/story.php?story_fbid=1537521079605272&id=497026710321386
?Ivan
27.04.2017
16:57:39
они против scala, печаль ?
KrivdaTheTriewe
27.04.2017
17:01:42
Слайды (с купированым слайдом кривой рожи но с бонусными слайдами по кривые (не рожи) заполняющие пространства (и рожи)) (en)
https://www.slideshare.net/GrigoryPomadchin/geotrellis-gis-on-scala-75459066
Ноутбук (ru):
https://github.com/pomadchin/geotrellis-gis-on-scala
Доклад про оптимизацию решения gis поверх спарка
Alex
27.04.2017
17:03:55
А подскажите, плиз, а запись митапа ведется и будет ли выложена?
Pavel
27.04.2017
17:09:43
Да, ведётся феймбуком)
И нами)
Alex
27.04.2017
17:10:05
спасибо большое !!!
KrivdaTheTriewe
27.04.2017
17:36:46
а дайте ссылку пожалуйста на телеграм чат митапа
Pavel
27.04.2017
17:56:02
https://t.me/ramblerapachesparkbot
они против scala, печаль ?
Мы не против Скалы. Я сам её изучаю, мне нравится. Дело в том, что у нас эксперименты в прод тащат те, кто их делает. Поэтому на Питоше и удобней и разработка быстрей.
Farruh
28.04.2017
06:55:47
Кроме фейсбука, еще где нибудь можно трансляцую посмотреть?
?Ivan
28.04.2017
07:10:53
Pavel
28.04.2017
07:10:56
Запись есть, выложим.
KrivdaTheTriewe
28.04.2017
07:11:46
Google
Farruh
28.04.2017
07:12:40
KrivdaTheTriewe
28.04.2017
07:12:52
думал увижу у вас в докладе рассказ про эту штуку)
Друзья, всем привет! Нам поступает много вопросов о том, где можно посмотреть запись вчерашнего митапа, отвечаем, здесь - https://www.facebook.com/afishamansarda/videos/1537521079605272/ Просмотр видео доступен и для незарегистрированных пользователей. Презентации мы тоже обязательно выложим чуть позже в общих доступ и напишем вам про это.