
KrivdaAllStars
05.02.2018
15:17:55

Oleksandr
05.02.2018
15:25:01
к слову, @pomadchin, ты упоминал джобозапускалку на амазоне, можешь напомнишь?

Grigory
05.02.2018
15:25:10

Oleksandr
05.02.2018
15:25:15
ага, спасибо)

Google

Grigory
05.02.2018
15:25:27
у ажуры есть похожая тема, azure batch - она сыровата (мое мнение)
и я рейджанул и дропнул ее ):

Oleksandr
05.02.2018
15:25:56
ну вот, а я только хотел начать копать её

Grigory
05.02.2018
15:26:24
если и правда хотел начать копать - то в крадце - она работает

Oleksandr
05.02.2018
15:26:46
стоп, сыровата azure batch или aws batch?)

Grigory
05.02.2018
15:26:57
azure, aws у нас в проде

Oleksandr
05.02.2018
15:27:06
а, норм тогда

Grigory
05.02.2018
15:27:42
azure это для обожателей майкрософт
@krivdaallstars

Oleksandr
05.02.2018
15:27:56
да, я просто сперва прочитал его как aws

Andrey
05.02.2018
15:28:37
c такой штукой никто не сталкивался - WARN [main ()] org.apache.hadoop.hive.llap.daemon.impl.LlapDaemon: Failed to start LLAP Daemon with exception
java.lang.NoClassDefFoundError: com/ctc/wstx/io/InputBootstrapper
at org.apache.hadoop.hive.llap.daemon.impl.LlapDaemon.main(LlapDaemon.java:471) [hive-llap-server-2.3.2.jar:2.3.2]
Caused by: java.lang.ClassNotFoundException: com.ctc.wstx.io.InputBootstrapper ?

Grigory
05.02.2018
15:29:16

Andrey
05.02.2018
15:29:19
понятно, что либы не хватает

Google

Andrey
05.02.2018
15:29:45
но она есть в класспасе хадупа, есть в ярне и есть в слайдере

Grigory
05.02.2018
15:29:56
видимо нету
странно
а какие версии библиотек? (hadoop / что-то еще)

KrivdaAllStars
05.02.2018
15:30:38
это магия класспаса хадупа , есть подозрение, что в класспафе есть эта же либа , но другой версии

Grigory
05.02.2018
15:30:45
можешь еще явно в жирный джарник сунуть зависимость

Andrey
05.02.2018
15:30:53
hadoop 2.9, hive 2.3.2

Grigory
05.02.2018
15:31:09
попробуй добавить ее явно в твой джарник и зашейдь его в рамках всего проекта (можно и без шейдинга сначала, но скорее всего ничо не будет)

Andrey
05.02.2018
15:31:26
ты иемеешь ввиду hive-llap-server-2.3.2.jar перепаковать?

Grigory
05.02.2018
15:31:29
угу

Andrey
05.02.2018
15:32:42
ок, тогда другой вопрос, можно ли либы подсунуть в уже существующий архив, например распаковать, закинуть и запаковать?

KrivdaAllStars
05.02.2018
15:33:36
можн

Grigory
05.02.2018
15:33:55
делают обычно как: добавляют нужную весрию а джарник и ссылки jarjarом переименовывают
иначе те надо на каждой ноде распаковать и положить куда надо что надо

Andrey
05.02.2018
15:33:56
hadoop-metrics2-llapdaemon.properties.template hive-llap-server-2.3.2.jar llap-cli-log4j2.properties META-INF
hadoop-metrics2-llaptaskscheduler.properties.template hive-webapps llap-daemon-log4j2.properties org

Grigory
05.02.2018
15:34:11
хм

Andrey
05.02.2018
15:34:18
это содержимое пакета
куда ее кинуть?

Grigory
05.02.2018
15:35:01
да добавь в сборку твоего джарника сначало
а потом будем исходить из результата)
с самого глупого и простого можно начать

Google

Andrey
05.02.2018
15:36:01
у меня нет моего джарника - есть джарник, котороый стартует слайдер и этот джарник - часть хайва

Grigory
05.02.2018
15:55:29
а есть полный стектрейс?
@akozlenkov
и дистрибутивы ванилы или это хортон / кладуерра / что-то еще?

Andrey
05.02.2018
16:36:41
Это все, что пока удалось выудить
Хадуп ванильный

Ivan
05.02.2018
17:48:23
Всем привет. Подумываю перекатиться с жаба/котлин бэкенда на какой-нибудь ETL на scala/spark. Вопрос такой: быстро ли оно надоедает и превращается в рутину в сравнении с каким-нибудь энтерпрайзом?

Daniel
05.02.2018
18:00:59
ит дипендс
вкусовщина и проекты определяют
а рутина есть всегда (ну кроме ситуации, когда штампуем нагора, а там хоть огнем полыхай)

Tsh
05.02.2018
18:01:36
Быстро надоедает
Ибо обычно превращается в баг фиксы спарка и прочих хайвов
И попыткой продакт оунера реализовывать реляционную модель на nosql & parquet

Daniel
05.02.2018
18:03:36
это часть рутины)
но интересные задачи тоже могут быть - большая нагрузка, сложная предметная область
вон у @pomadchin в гео всё перемазано
мне как несведущему кажется весьма интересным

Tsh
05.02.2018
18:05:16
И вечные споры про выбор яп
Питон vs Scala vs Java

Старый
05.02.2018
18:06:19
котлин забыл

Daniel
05.02.2018
18:06:51
да тут и спорить нечего
петон ненужен, а там кто во что умеет *криваярожа*

Старый
05.02.2018
18:07:19
уж лучше ненужен раби и пхп

Tsh
05.02.2018
18:07:28
Да вот, появляется куча народу сбоку
Желающих поиграть в биг дату и машин лернинг

Google

Tsh
05.02.2018
18:08:22
А рояль носить никто не хочет

Старый
05.02.2018
18:08:25
особенно весело когда утверждают что монга в петабайт это круто

Ivan
05.02.2018
18:09:31
Понятно, в общем, спасибо за ответы

Tsh
05.02.2018
18:28:44

Grigory
05.02.2018
18:41:04
хотя по факту и ETL
дуализм ETL

Daniel
05.02.2018
18:41:51
ясно, тебе не хочется думать об этом как об ETL

Grigory
05.02.2018
18:42:10
я просто етлом не занимаюсь непосредственно, я пилю инстурментарий для того чтобы люди занимались етлом)

Daniel
05.02.2018
18:42:47

Grigory
05.02.2018
18:43:23
да думаю зависит от предметной области сильно

Daniel
05.02.2018
18:43:28
а теперь решил, что просто найти соответствующего человека в etl отдел, а самому пилить свои крипо-сервисы

Grigory
05.02.2018
18:44:35
да от специфики очень сильно зависит, прелесть гис в том, что там рнд много

Oleksandr
05.02.2018
19:30:37

Aleksandr
06.02.2018
05:21:29
Кто-то пробовал hadoop 3?

Danis
06.02.2018
10:02:11
Как заставить beeline-клиент сделать запросы в таблицы в рамках одного подключения?

Vasiliy
06.02.2018
11:01:16
а что такое beeline-клиент?

Grigory
06.02.2018
11:06:44

Google

Grigory
06.02.2018
11:07:10
https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-Beeline%E2%80%93CommandLineShell

Sergey
06.02.2018
11:37:53

Danis
06.02.2018
11:39:48

Sergey
06.02.2018
11:40:22
как именно делали одиночные запросы?

Danis
06.02.2018
11:40:39
Через ключ -е.
-e "use dbname; show create table tablename;"
Могу прислать полностью, если важно.

Sergey
06.02.2018
11:42:27
например. как я делаю:
1) kinit ...
2) beeline
3) beeline> !connect jdbc:hive2://bigdata-name1:10000/default;principal=hive/bigdata-name1.bla-bla-bla.ru@HADOOP;
4) beeline> select count(1) from table1;
5) beeline> select count(1) from table2;
6) ...
7) beeline> !closeall
8) beeline> !quit

Danis
06.02.2018
11:54:11
Меня интересует использование извне.
beeline -u "connect_string" -e "show databases;"