
Sergei
01.08.2018
19:37:16
Привет! Кто нибудь сталкивался с такой штукой для OLAP целей? Отзывы или личный опыт интересует..
http://kylin.apache.org

Andrei
01.08.2018
19:47:22
Да, мы сделали POC на нем. В целом отношение позитивное. Самое проблемное было запустить на нашей клаудере. А с интерфейсом построения кубов и наши аналитики разобрались. Пару раз за кривые конфигурации руки поотрывали и потом в целом работало. Из недостатков для полной миграции с MSSQL им не хватало поддержки каких-то аналитических функций и какие-то периодические проблемы с TableAu были.

Sergei
01.08.2018
19:51:32
Хм.. интересно, спасибо! Нормальная поддержка аналитических функций и вообще sql тут вещь редкая

Alexander
01.08.2018
20:29:23

Google

Andrei
01.08.2018
20:42:00
Немного деталей могу дать:
1. Данных для POC немного, в сумме около 4Тб
2. Куб на Spark, по цифрам не скажу, но примерно на 30%-50% быстрее чем MR. Полностью куб собирается за 5-6 часов, но он в отдельной зажатой очереди, чтобы ресурсов много не отъедал.
3. Примерно 50 dimensions и 10 measures. В Hbase построенный куб занимает 1Тб без учета реплика фактор.

Alexander
01.08.2018
20:57:14

Andrei
01.08.2018
20:58:16
Да не за что


Andrey
02.08.2018
02:07:00
The Site Reliability Workbook is the hands-on companion to the bestselling Site Reliability Engineering book and uses concrete examples to show how to put SRE principles and practices to work. This book contains practical examples from Google’s experiences and case studies from Google’s Cloud Platform customers. Evernote, The Home Depot, The New York Times, and other companies outline hard-won experiences of what worked for them and what didn’t. https://landing.google.com/sre/book.html
Свободно скачать можно до 23 августа
Businesses are going big with their big data strategy. According to a 2017 study by New Vantage partners, 37.2% of surveyed organizations have invested more than $100M in a big data strategy within the past five years, with 6.5% investing over $1B. https://www.import.io/post/ultimate-big-data-strategy/
This is an interesting look at Google Cloud Platform and how it compares to AWS https://www.deps.co/blog/google-cloud-platform-good-bad-ugly/?mkt_tok=eyJpIjoiWkRVNU5tWTJOMlF6TW1ObSIsInQiOiJ5cEk5OFwvaERrM0wrUWNvaENZaE1aRUlwazNCbDlJSFdodDJGYlFhcUFubEZmTW9WdGZjNjRxU0M1WEd4UTZ1M1E3eUpndUVMdzJcL2hhQXFmNUFENkV2eklxWlRJbVErQW9iWnBaZ1FHM1FyMnRDbUc5cGZHUERWa0QwTG9MdFY1In0%3D


Tsh
02.08.2018
09:40:43

Andrei
02.08.2018
09:42:26
Да, он свою версию спарка тянул, вроде 1.6 была. Мы делали свою сборку с зависимостями от клаудеры. В свежих версиях Кайлина с этим должно быть проще - у них уже есть готовая сборка для CDH

Stan
02.08.2018
11:25:10
Спасибо! А можешь отдельно zeppelin-env.sh прислать? Не могу его достать из джарника

Dmitry
02.08.2018
11:26:12
unzip xxx.jar

Grigory
02.08.2018
14:22:34
Рибята, спарку на 2.12 быть: https://issues.apache.org/jira/browse/SPARK-14220
Spark 2.4.0 ожидается с кросспаблишем

Google

Daniel
02.08.2018
14:30:18

Grigory
02.08.2018
14:31:29
зависит от того когда 2.3 запаблишется
новый
я хотел бы осенью)

KrivdaAllStars
02.08.2018
14:32:17
Есть предположение что не так все быстро будет

Daniel
02.08.2018
14:32:22

Grigory
02.08.2018
14:32:37
да могут и запаблишить забагованый релиз

Daniel
02.08.2018
14:32:53
Осенью не жди

Grigory
02.08.2018
14:32:55
а потом будет как с одним из спарков

Uncel
02.08.2018
14:33:32
Самое время бэкпортировать паркет с зстд

Александр
02.08.2018
14:34:15

KrivdaAllStars
02.08.2018
14:34:49

Александр
02.08.2018
14:35:39
по статусу же все блокеры закрыты

Grigory
02.08.2018
14:38:00

KrivdaAllStars
02.08.2018
14:39:15
Ну прост типа, пока основной тулчейн не переедет в дистрибуциях эт не появится

Grigory
02.08.2018
14:39:45
дистрибьюции это дистриьюции
все помнят как было с 2.11 и 2.10

Daniel
02.08.2018
14:41:42
Спарк это опенсорс в худшем (вру, хуже хадупы те же) виде. Конечно переедут. Это повод рубить бабла на саппорте и консалтинге.

Google

Александр
02.08.2018
15:03:59

Andrey
02.08.2018
15:08:47

Andrey
02.08.2018
15:09:39

Daniel
02.08.2018
15:11:10

Alexey
02.08.2018
15:11:14
его пилят не корпоративные программисты на зарплате, а фиг знает кто. без чётких гайдов и надзора. отсюда и велосипедостроение, и куча странных решений.
а корпорации паразитируют на коммерческой поддержке этого шалтай-болтая, да

Grigory
02.08.2018
15:11:52
вот это поворот
ахаххаахха

Alexey
02.08.2018
15:12:05
чё нет?

Grigory
02.08.2018
15:12:09
ниет

Daniel
02.08.2018
15:12:21

Grigory
02.08.2018
15:12:39
спарк до мозга костей тырпрайз или пытается им быть
он типичный апаче продукт, а почти за всеми крупными апаче продуктами крупные корпорации сидят
и пилят его конкретные люди

Alexey
02.08.2018
15:13:05
как-то у него хреновато получается быть тырпрайзом

Grigory
02.08.2018
15:13:21
а суть не предложить готовое решение в опенсорс

Daniel
02.08.2018
15:13:26

Grigory
02.08.2018
15:13:37
это типичная модель опенсорсного тырпрайза

Alexey
02.08.2018
15:13:47
плохая, плохая модель

Grigory
02.08.2018
15:13:49
нет

Google

Grigory
02.08.2018
15:13:51
она хорошая
весь опенсорс так живет

Alexey
02.08.2018
15:14:24
ну прям. я с этим ибм поимел секса в своё время. что j9, что вебсфера

Grigory
02.08.2018
15:14:25
опенсорс это не для пользователей опенсорсных всегда а для себя
чо ты как первый день какбудто в опенсорсе

Alexey
02.08.2018
15:16:04
ну, у каких-нить редхатов получается лучше, чем у ибм.

Stanislav
02.08.2018
15:17:05

Grigory
02.08.2018
15:17:13
одинаково все +-

Daniel
02.08.2018
15:17:37

Alexey
02.08.2018
15:24:16
а киньте ссылку на официальный роадмап спарка, если он есть. чё-то так просто не находится. интересно вот стало, какие там планы вообще

Grigory
02.08.2018
15:29:03
https://issues.apache.org/jira/browse/SPARK-23758?jql=project%20%3D%20SPARK%20AND%20status%20in%20(Open%2C%20%22In%20Progress%22%2C%20Reopened)%20AND%20text%20~%20%22roadmap%22
типа так

Alexey
02.08.2018
15:31:32
короче, нет его

Grigory
02.08.2018
15:32:06

Alexey
02.08.2018
15:33:12
а ещё опенсорс.

Grigory
02.08.2018
15:33:34
какбуд-то тебе что-то должны

Alexey
02.08.2018
15:34:05
даже у какого-нить прости господи дотнеткора есть публичный роадмап на два релиза вперёд

Grigory
02.08.2018
15:34:26
пользуйся им
опенсорс же

Google

Grigory
02.08.2018
15:34:37
тут нет обязанностей перед пользователями
или есть?
это пользователям дали возможность пользоваться кодом
а не для них делается

Alexey
02.08.2018
15:35:00
^^^^ к вопросу о качестве опенсорса.
типа, вот вам хрень, а дальше ебитесь сами.

Grigory
02.08.2018
15:35:38
все опенсорные либы такие
хочешь роадмап плати
я чет рил никак не пойму ты стебешлься или рили считаешь что спарк / хадуп / мезос / хбейз / аккумуло и тп пилят нонеймы в хаотичном порядке?

Alexey
02.08.2018
15:41:01
стебусь конечно.
просто неопределённость слегка вымораживает
изначальный вопрос ведь про что был. будет скала 2.12 или нет.
тут ведь новости такие, что jvm даже в lts варианте с поддержкой только по полгода начиная с 11й (дольше -- за деньги).
как-то оно не оч. новости
ну и хотелось бы знать, какие там у них планы по миграции на новые версиию. собсно, и весь вопрос.