@hadoopusers

Страница 6 из 182
Farruh
20.04.2017
02:48:45
Спасибо! ?

KrivdaTheTriewe
20.04.2017
15:52:44
Возникали ли у кого проблемы в спарке версией <1.6 когда допустим case class Message(a:String) sealed trait Result case class Good(r:String) extends Result case class Bad(r:String) extends Result case class Exp(n:Int) extends Result stream:DStream[Result] stram.flatmap { case Bad(a) => Some(a) case _ => _ } Сваливалось бы в Some(a) в случае если Good и Bad , но не Exp

@pomadchin вы shapless у себя используете?

Google
Grigory
21.04.2017
20:33:00
И сирка

Nick
21.04.2017
20:33:37
какой активный чатик

Grigory
21.04.2017
20:33:40
Нe о чeм рассказать по факту , ничeго интeрeсногл на нeм нeт; Поли функции и копродакты

Nick
21.04.2017
20:33:59
задам вопрос тут, может вы знаете распределенную fs чоткую

Grigory
21.04.2017
20:34:13
Хдфс да гластeр

Nick
21.04.2017
20:34:18
а серн

KrivdaTheTriewe
21.04.2017
20:34:58
что сейчас каноничней, хайв и орк или хайв и hbase

какой активный чатик
я всё жду критическую массу

Oleg
21.04.2017
20:35:39
1с говорят четко работает)

Grigory
21.04.2017
20:35:54
а серн
Нe поьовал

Nick
21.04.2017
20:36:04
говорят хорошая штука

Grigory
21.04.2017
20:36:21
что сейчас каноничней, хайв и орк или хайв и hbase
орк типа пушка но хз как ты сравниваeшь возможности то разныe

Google
Grigory
21.04.2017
20:37:00
А с хдупим совмeстима?)

Nick
21.04.2017
20:37:27
posix

наверное да)

KrivdaTheTriewe
21.04.2017
20:38:24
орк типа пушка но хз как ты сравниваeшь возможности то разныe
ну вот компания выбирает , где в основном хранить

просто если начинает компания хранить где-то оно хранит только там

Grigory
21.04.2017
20:49:30
А для каких цeлeй хранить?

KrivdaTheTriewe
21.04.2017
20:51:04
аналитика

орк типа пушка но хз как ты сравниваeшь возможности то разныe
у меня архитектор очень любил орк на предыдущем проекте

1с говорят четко работает)
четко на самом деле

просто зависит от конфигурации

Maverick
23.04.2017
17:49:02
@krivdathetriewe, предлагаю продолжить обсуждение биллиотек для работы с партиционированными Hive таблицами в Spark на Scala тут

@krivdathetriewe

Я понмаю, что оно работает

KrivdaTheTriewe
23.04.2017
17:52:20
@krivdathetriewe, предлагаю продолжить обсуждение биллиотек для работы с партиционированными Hive таблицами в Spark на Scala тут
SO, я к сожалению с партицированием внутри хайва из спарка не скажу, у нас был кейс, его как-то решили. Но я в этом участия не принимал

Maverick
23.04.2017
17:52:23
мне бы удобно

чтоб абстакции были повыше

KrivdaTheTriewe
23.04.2017
17:53:13
http://stackoverflow.com/questions/31341498/save-spark-dataframe-as-dynamic-partitioned-table-in-hive

http://stackoverflow.com/questions/40267953/hive-on-spark-list-all-partitions-for-specific-hive-table-and-adding-a-partition

Но, насколько помню, там были заморочки и останется только методом проб и ошибок всё разрешать

Maverick
23.04.2017
17:56:14
DataFrame - туповат. Полагается на порядок полей, а не на имена.

Google
Maverick
23.04.2017
17:56:23
И это напрягает.

Ну да ладно. Нет, дак нет.

Будем сами писать.

Dmitry
24.04.2017
14:31:11
тестирую Спарк. наткнулся на такой баг

https://issues.apache.org/jira/browse/SPARK-13747

у кого-то были такие проблемы? как с этим жить?)

Andrey
24.04.2017
16:10:27
запустил на кластере 1.6.2 - подобной ошибки нет

KrivdaTheTriewe
24.04.2017
16:11:47
Со спарком всегда магия пока что

Andrey
24.04.2017
16:16:39
пол года гдето используем спарк - все достаточно стабильно :)

KrivdaTheTriewe
24.04.2017
16:20:22
пол года гдето используем спарк - все достаточно стабильно :)
к 1.6 да, но всё равно есть некоторые подводные камни :)

Andrey
24.04.2017
16:24:28
вероятно поэтому 2.0 только в tech preview в HDP

KrivdaTheTriewe
24.04.2017
16:27:26
вероятно поэтому 2.0 только в tech preview в HDP
ну у меня на предыдущем проекте пользуются версией 2.0 наверное с ноября-декабря из hdp

http://www.datascience.in.ua/

Dmitry
24.04.2017
16:53:30
Попробую даунгрейднуть спарк и перетестить

не взлетело на 1.6.3, если просто по 2 запроса в секунду слать на протяжении 2 минут, то > failed 77 ( 32%)

Andrey
25.04.2017
11:57:03
а в каком режиме запускаете спарк?

standalone, yarn-cluster и т д?

Dmitry
25.04.2017
11:57:23
standalone

взял снапшот 2.2.0, с ним все ок

хоть это радует )

Google
Dmitry
25.04.2017
13:33:41
не очень-то и ок оказалось. но все-таки понял как обойти проблему - свичнул executor диспатчера на акке с ForkJoinPool на обычный thread-pool (отправляю таски в спарк через акка-хттп приложение). но то что спарк юзает thread-local переменные для состояния и говнокодит у себя что-то чтобы их менеджить - это зашквар

Andrey
25.04.2017
13:48:32
попробуйте этот эксперимент на кластере провести :) мне кажется этой проблемы там не будет

KrivdaTheTriewe
27.04.2017
15:56:47
прямая трансляция митапа по spark https://l.timepad.ru/stat/l/ZBXzMQzFDCwnhppjZNTYTmSBNGMpyFDvuUwebwG088q3pShb7eY1RucXzoSo1NCw2tj4tGSl1HR3Tb3xwD37Sw,,/mail/207205445/

приятно , что про работу спарка с нуля рассказывают

Pavel
27.04.2017
16:55:14
https://m.facebook.com/story.php?story_fbid=1537521079605272&id=497026710321386

KrivdaTheTriewe
27.04.2017
16:55:46
правильная ссылка на трансляцию Pavel Klemenkov: https://m.facebook.com/story.php?story_fbid=1537521079605272&id=497026710321386

?Ivan
27.04.2017
16:57:39
они против scala, печаль ?

KrivdaTheTriewe
27.04.2017
17:01:42
Слайды (с купированым слайдом кривой рожи но с бонусными слайдами по кривые (не рожи) заполняющие пространства (и рожи)) (en) https://www.slideshare.net/GrigoryPomadchin/geotrellis-gis-on-scala-75459066 Ноутбук (ru): https://github.com/pomadchin/geotrellis-gis-on-scala

Доклад про оптимизацию решения gis поверх спарка

Alex
27.04.2017
17:03:55
А подскажите, плиз, а запись митапа ведется и будет ли выложена?

Pavel
27.04.2017
17:09:43
Да, ведётся феймбуком)

И нами)

Alex
27.04.2017
17:10:05
спасибо большое !!!

KrivdaTheTriewe
27.04.2017
17:36:46
а дайте ссылку пожалуйста на телеграм чат митапа

Pavel
27.04.2017
17:56:02
https://t.me/ramblerapachesparkbot

они против scala, печаль ?
Мы не против Скалы. Я сам её изучаю, мне нравится. Дело в том, что у нас эксперименты в прод тащат те, кто их делает. Поэтому на Питоше и удобней и разработка быстрей.

Farruh
28.04.2017
06:55:47
Кроме фейсбука, еще где нибудь можно трансляцую посмотреть?

Pavel
28.04.2017
07:10:56
Запись есть, выложим.

KrivdaTheTriewe
28.04.2017
07:11:46
Запись есть, выложим.
https://github.com/databricks/tensorframes

Google
Farruh
28.04.2017
07:12:40
Запись есть, выложим.
Будем ждать, спасибо!

KrivdaTheTriewe
28.04.2017
07:12:52
думал увижу у вас в докладе рассказ про эту штуку)

Друзья, всем привет! Нам поступает много вопросов о том, где можно посмотреть запись вчерашнего митапа, отвечаем, здесь - https://www.facebook.com/afishamansarda/videos/1537521079605272/ Просмотр видео доступен и для незарегистрированных пользователей. Презентации мы тоже обязательно выложим чуть позже в общих доступ и напишем вам про это.

Страница 6 из 182