
Grigory
02.02.2018
21:05:53
Проклятие
плохая идея)) 20 мб это уже долго кафке

Nick
02.02.2018
21:06:47
да ты чоу)

Paul
02.02.2018
21:07:01
Можно exasol поюзать

Google

Grigory
02.02.2018
21:07:23

Nick
02.02.2018
21:07:31
не нужно ничего юзать, пока человек не поймет, что ему нужно

Grigory
02.02.2018
21:07:33
пета байт

Nick
02.02.2018
21:07:36
и какие требования он выдвигает)

Grigory
02.02.2018
21:07:59

Nick
02.02.2018
21:08:10
еле поймал)
оказалось прост потекла
@pomadchin я тебе не показывал? я тут стековерфлоу в гошке видел)

Grigory
02.02.2018
21:11:39
ага
Показывал
Ппц

??Dmitry????
02.02.2018
21:17:43
Можно exasol поюзать
у нас на тачке конечно дофига ОЗУ, но эгзасол имхо перебор
да и коммерческий он
я ставил его на бывшей работе, мне не понравилось

Google

Nick
02.02.2018
21:18:35
Так какая цель в итоге?

??Dmitry????
02.02.2018
21:18:52
ускорить скрипт на R
он в озу медленно работает
что именно он делает - я не знаю
девелопер попросил хадуп

Nick
02.02.2018
21:19:47
Лол
@pomadchin предложить ему spark r?)

Grigory
02.02.2018
21:21:42
я думаю отказаться от р
Ну спарк наверное нужен действительно
Может это имеет ввиду р девелопер

Egor
02.02.2018
21:23:14

Nick
02.02.2018
21:28:47
Предложить им надо пройти куда подальше

Andrey
03.02.2018
05:46:17

Oleg
03.02.2018
06:36:18
Если хочется "опробовать технологию" натыкай клаудера менеджер на виртуалках . Там далее-далее, виндастайл, ничего знать не надо. У меня тестинг так работает
В целом с таким количеством данных можно все там и оставить))

?Ivan
03.02.2018
06:41:14
можно просто скачать готовую виртаулку с клаудерой, там и hdfs и hive и всё что угодно. Поиграться разработчикам хватит и на одной, не разворачивая кластера.

??Dmitry????
03.02.2018
08:44:18

Daniel
03.02.2018
09:06:35
Что это?
Весьма специфичная СУБД, которую на волне хайпа пихают везде. Как например в этом "совете".

Egor
03.02.2018
09:23:35

Daniel
03.02.2018
09:26:18

Google

Egor
03.02.2018
09:28:46

Andrey
03.02.2018
10:35:39

?Ivan
03.02.2018
11:08:17

Oleg
03.02.2018
12:16:15
Один мой друг рекомендует ms access

KrivdaAllStars
04.02.2018
22:34:20
Опачки что подъехало
https://hortonworks.com/blog/first-class-support-long-running-services-apache-hadoop-yarn/

Sergey
04.02.2018
23:07:49

?Ivan
05.02.2018
06:34:50
A native YARN Timeline Service based on HBase to record lifecycle events and metrics and provide rich analytics APIs for users to fetch/query application details - вот как бы с этим проблем не было.

KrivdaAllStars
05.02.2018
14:23:44
скажите пожалуйста, а где нас так попиарили?

Anastasia
05.02.2018
14:24:14
Data Science Chat )

sherzod
05.02.2018
14:24:34
ссылку можно?) что-то не видел здесь такого

KrivdaAllStars
05.02.2018
14:24:35
а дайте ссылку что ли

sherzod
05.02.2018
14:25:02
к сожалению весь ru ds сидит в слаке

Павел Максимов
05.02.2018
14:25:31
https://t.me/datasciencechat

Anastasia
05.02.2018
14:25:48
https://t.me/datasciencechat
ну не самый полезный канал, чуть что)

Павел Максимов
05.02.2018
14:25:56
https://t.me/bigdata_ru

Kirill
05.02.2018
14:26:41

sherzod
05.02.2018
14:27:07
ну может к счастью)
там же opendatascience

Grigory
05.02.2018
14:28:01
там питон все больше

Google

KrivdaAllStars
05.02.2018
14:30:18

Oleksandr
05.02.2018
15:06:06
подскажите, есть чего для выгрузки из hdfs по sftp ?

sherzod
05.02.2018
15:06:25
flume
у него точно есть ftp, sftp коннектор даже если нет можно быстро написать

KrivdaAllStars
05.02.2018
15:07:23

Oleksandr
05.02.2018
15:07:38
flume
только у нас не юзается

KrivdaAllStars
05.02.2018
15:07:44
Я делал ози задачи на баше с использованием lftp

sherzod
05.02.2018
15:07:54
я могу соврать, но у меня коллега дня за три накидал и до сих пор работает насколько я знаю

Oleksandr
05.02.2018
15:08:13

KrivdaAllStars
05.02.2018
15:08:28
это наиболее продакшнреди решение

Oleksandr
05.02.2018
15:08:41
и он тоже не юзается)

sherzod
05.02.2018
15:08:50
и хорошо)

KrivdaAllStars
05.02.2018
15:08:50
ну его можно сбоку поставить на самом деле

Oleksandr
05.02.2018
15:08:55
та мне "хуяк-хуяк и готово" достаточно
в идеале, либка, которая по хдфс ходит и выгружает

KrivdaAllStars
05.02.2018
15:09:37
ну просто следует помнить о том, что если выгрузка делается, не хочется каждый раз думать, сделалась она или нет, в нифи можно уведомления поставить и так далее
ну самое простое, это крон + hadoop fs -get + lftp

sherzod
05.02.2018
15:10:10
норм)

Oleksandr
05.02.2018
15:10:11
ози, блин, фтп умеет, а для сфтп надо патчить

Google

Andrey
05.02.2018
15:10:32
Самое простое это HDFS fuse

KrivdaAllStars
05.02.2018
15:11:21

Andrey
05.02.2018
15:12:26
Да, а тут условие что контроля нет?

KrivdaAllStars
05.02.2018
15:12:42

Oleksandr
05.02.2018
15:13:13

KrivdaAllStars
05.02.2018
15:14:10
ну ози обычные шелл скрипты запускать умеет же , ну и с уборкой за собой не нужно париться

Andrey
05.02.2018
15:15:56
Кстати, хотел все спросить, никто не использует hadoop2.9 c slider ?