Grigory
11.09.2017
08:11:06
но мое мнение - достаточно ci чтоб в контейнерах ранил все под нужной весрией оси / докера; локлаьно то в жопу вагрант)
Nick
11.09.2017
08:11:52
@pomadchin да все проще, юзай sbt nativepackager и пусть он делает образы)
Grigory
11.09.2017
08:12:17
а я кстате не сторонник его
Nick
11.09.2017
08:16:38
это лучше, чтоб дятлы докерфайл писали)
Google
Nick
11.09.2017
08:17:31
а вообще у меня ниразу не было таких проблем
у нас везде докеры прост новые
@pomadchin тащи уже к себе dcos
будем вместе контрибьютить
KrivdaTheTriewe
11.09.2017
08:27:17
докерсбт это оч хорошо, а что помадчин не юзает, так это всё уже (
Dmitry
11.09.2017
10:09:15
вопрос знатокам - https://stackoverflow.com/questions/46153105/how-to-get-kafka-offsets-with-spark-structured-streaming-api
решил попробовать заюзать structured streaming
KrivdaTheTriewe
11.09.2017
10:27:04
и как успехи?
Dmitry
11.09.2017
10:28:28
Пока только щупаю
KrivdaTheTriewe
11.09.2017
10:45:54
Пока только щупаю
как только появится свежая версия спарка впилю у нас и никому не скажу :D
Dmitry
11.09.2017
11:07:13
так в 2.2.0 вроде сказали, что production ready
ну честно говоря, смотрю на этот код есть такое чувство, что Спарк уже не тот
Proposed API
Some concerns:
The best way to keep Java compatibility is writing the API in java. It’s easy to deal with Java classes/interfaces in Scala, but not vice-versa.
Google
Daniel
11.09.2017
11:17:47
с одной стороны это нормально, кафка уже проходила через это
с другой стороны это больше айбиэмовских кодеров, так как он один из самых активных контрибьютеров %)
Dmitry
11.09.2017
11:20:29
ну вот есть подозрение, что будет куча каких-то абстракций и кровавый энтерпрайз в итоге
Oleksandr
11.09.2017
11:29:03
а то понагородют своих макроимплиситов, потом без пол-литра не разберешь?
Daniel
11.09.2017
11:33:39
зато после поллитры ты уже не понимаешь как жил без этого раньше))
Oleksandr
11.09.2017
11:35:05
эм, понимаю, чудесно жил)
Dmitry
11.09.2017
11:35:41
ну дело в том, что там что интерфейс, что подокапотные механизмы на джаве
кстати, из всего что я видел просто читаю код (сам не щупал только), то мне больше всего понравился Apache Flink
они хотя бы сразу вроде догадались унифицировать batch/streaming
и завезли себе apache calcite вместо самописного оптимизатора в спарке (хотя они гордятся что там всего-ничего скала кода)
Oleksandr
11.09.2017
11:37:40
дык в спарке тоже calcite
Dmitry
11.09.2017
11:38:23
https://github.com/apache/spark/search?utf8=%E2%9C%93&q=calcite&type=
что-то невидно его )
было у них в блоге, что мы сами наеб…ли на скале крутой оптимизатор
Oleksandr
11.09.2017
11:44:49
что-то да, я думал, там кальцит
Iaroslav
11.09.2017
11:56:41
рубрика ликбез по спарку http://www.russellspitzer.com/2017/09/01/Spark-Locality/
KrivdaTheTriewe
12.09.2017
22:01:43
что сейчас из дистрибуций канонично в облаке использовать?
Nick
12.09.2017
22:21:02
Dcos
Ты б хоть цели описал
KrivdaTheTriewe
13.09.2017
10:40:07
Вопрос скорее , к ак организовать привычный паплайн ( Спарк + ХБЕЙЗ + хайв + хдфс + кафка ) в амазоновском облаке,стоит класические дистрибутивы использовать или есть что-то по-лучше
Google
Daniel
13.09.2017
10:43:24
ХБЕЙЗ + хайв + хдфс собирать самому то еще удовольствие
спарк и кафка сбоку
Oleksandr
13.09.2017
10:51:27
а кто какие сборки юзает? (клаудера, хортон, мапр)
Andrey
13.09.2017
10:55:29
хортон
Linus
13.09.2017
10:59:19
хортон
Timur
13.09.2017
11:03:05
клаудера
Daniel
13.09.2017
11:06:33
Какие сборки с хадупом выиспользуете?
cloudera – 14
??????? 45%
horton – 11
?????? 35%
свое творчество – 3
?? 10%
другое – 3
?? 10%
mapr
▫️ 0%
? 31 people voted so far.
Oleksandr
13.09.2017
11:19:57
кто жмякнул "другое" — что именно?)
Daniel
13.09.2017
11:34:47
@krivdaallstarts @pomadchin запиньте опрос
Grigory
13.09.2017
11:35:08
а типа emr
это какая сборка
это "другое"?
типа все тут используют клаудеру и хортон; а амазон никто
Andrey
13.09.2017
11:36:18
где амазон и где кровавый энтерпрайз(
KrivdaTheTriewe
13.09.2017
11:36:27
Grigory
13.09.2017
11:36:49
добавь emr в опрос
Артем
13.09.2017
11:36:50
В России выгнать энтерпрайз в общее облако... Эх, мечты...
KrivdaTheTriewe
13.09.2017
11:37:13
Iaroslav
13.09.2017
11:37:24
а что если приходится поддерживать и клаудеру, и хортон, и emr, и даже ныне мертвый BigInsights, то что выбирать?
KrivdaTheTriewe
13.09.2017
11:38:18
хортон как-то более шустро развивается , если честно (имхо)
Iaroslav
13.09.2017
11:39:06
честно говоря, начиная с версии так 5.7 Cloudera Manager стала мне намного приятнее, чем Ambari
Google
Iaroslav
13.09.2017
11:39:33
с другой стороны, интегрировать сервисы юзай питон + API (Ambari) приятнее, чем bash (Cloudera)
KrivdaTheTriewe
13.09.2017
11:39:59
питон то питон, но там всё оч криво было
Iaroslav
13.09.2017
11:40:34
это тоже правда. интерфейсы, скажем так, не оч продуманы
KrivdaTheTriewe
13.09.2017
11:42:58
чтобы добавить в мониторинг новую джобу, нужно было извратиться
Daniel
13.09.2017
12:06:08
пусть амазон в другое падает, и так мало по цифрам
KrivdaTheTriewe
13.09.2017
17:10:31
https://www.safaribooksonline.com/public/cms2017-ense/?promotion_code=SAVEENSE
Oleksandr
13.09.2017
17:54:58
0 мапр, неплохо
Daniel
13.09.2017
18:09:45
не ожидал что столько хортона
хотя голосовало мало народу, многие возможно из одной организации
KrivdaTheTriewe
13.09.2017
18:20:22
Ruslan
13.09.2017
18:22:13
Мы тестировали обладеру
Nick
13.09.2017
18:22:18
@krivdaallstarts как вариант ты реально можешь поднять dcos, там в универсе есть и хадуп и кафка и все такое