@hadoopusers

Страница 71 из 182
Grigory
02.02.2018
21:05:53
Проклятие

плохая идея)) 20 мб это уже долго кафке

Nick
02.02.2018
21:06:47
да ты чоу)

Paul
02.02.2018
21:07:01
Можно exasol поюзать

Google
Grigory
02.02.2018
21:07:23
да ты чоу)
Хотел сказать 20 гигабайт

Nick
02.02.2018
21:07:31
не нужно ничего юзать, пока человек не поймет, что ему нужно

Grigory
02.02.2018
21:07:33
пета байт

Nick
02.02.2018
21:07:36
и какие требования он выдвигает)

пета байт
у меня кафка тут не 1 мб падала

Grigory
02.02.2018
21:07:59
Nick
02.02.2018
21:08:10
еле поймал)

оказалось прост потекла

@pomadchin я тебе не показывал? я тут стековерфлоу в гошке видел)

Grigory
02.02.2018
21:11:39
ага

Показывал

Ппц

??Dmitry????
02.02.2018
21:17:43
Можно exasol поюзать
у нас на тачке конечно дофига ОЗУ, но эгзасол имхо перебор да и коммерческий он я ставил его на бывшей работе, мне не понравилось

Google
Nick
02.02.2018
21:18:35
Так какая цель в итоге?

??Dmitry????
02.02.2018
21:18:52
ускорить скрипт на R

он в озу медленно работает

что именно он делает - я не знаю

девелопер попросил хадуп

Nick
02.02.2018
21:19:47
Лол

@pomadchin предложить ему spark r?)

Grigory
02.02.2018
21:21:42
я думаю отказаться от р

Ну спарк наверное нужен действительно

Может это имеет ввиду р девелопер

Egor
02.02.2018
21:23:14
девелопер попросил хадуп
предложите им кликхаус

Nick
02.02.2018
21:28:47
Предложить им надо пройти куда подальше

Andrey
03.02.2018
05:46:17


Oleg
03.02.2018
06:36:18
Если хочется "опробовать технологию" натыкай клаудера менеджер на виртуалках . Там далее-далее, виндастайл, ничего знать не надо. У меня тестинг так работает

В целом с таким количеством данных можно все там и оставить))

?Ivan
03.02.2018
06:41:14
можно просто скачать готовую виртаулку с клаудерой, там и hdfs и hive и всё что угодно. Поиграться разработчикам хватит и на одной, не разворачивая кластера.

??Dmitry????
03.02.2018
08:44:18
Daniel
03.02.2018
09:06:35
Что это?
Весьма специфичная СУБД, которую на волне хайпа пихают везде. Как например в этом "совете".

Egor
03.02.2018
09:23:35
Весьма специфичная СУБД, которую на волне хайпа пихают везде. Как например в этом "совете".
любители джойнов/апдейтов подъехали, ну давайте предложим вертику это же бигдата)

Daniel
03.02.2018
09:26:18
любители джойнов/апдейтов подъехали, ну давайте предложим вертику это же бигдата)
Подъехали любители адекватных решений. В условиях общей задачи кх не подходит. У нас он как бы есть тоже, поэтому ваше ёрничество мимо кассы.

Google
Egor
03.02.2018
09:28:46
Подъехали любители адекватных решений. В условиях общей задачи кх не подходит. У нас он как бы есть тоже, поэтому ваше ёрничество мимо кассы.
по моему очень даже подходит есть 500гб csv по которым строиться аналитика на R. Засовываем все в кликхаус и делаем sql запросы

?Ivan
03.02.2018
11:08:17
по моему очень даже подходит есть 500гб csv по которым строиться аналитика на R. Засовываем все в кликхаус и делаем sql запросы
и надеемся что результат запроса (включая подзапрос в отдельности) влезет в память

Oleg
03.02.2018
12:16:15
Один мой друг рекомендует ms access

KrivdaAllStars
04.02.2018
22:34:20
Опачки что подъехало

https://hortonworks.com/blog/first-class-support-long-running-services-apache-hadoop-yarn/

Sergey
04.02.2018
23:07:49
https://hortonworks.com/blog/first-class-support-long-running-services-apache-hadoop-yarn/
Slider в YARN встроили или что-то другое?

?Ivan
05.02.2018
06:34:50
A native YARN Timeline Service based on HBase to record lifecycle events and metrics and provide rich analytics APIs for users to fetch/query application details - вот как бы с этим проблем не было.

KrivdaAllStars
05.02.2018
14:23:44
скажите пожалуйста, а где нас так попиарили?

Anastasia
05.02.2018
14:24:14
Data Science Chat )

sherzod
05.02.2018
14:24:34
ссылку можно?) что-то не видел здесь такого

KrivdaAllStars
05.02.2018
14:24:35
а дайте ссылку что ли

sherzod
05.02.2018
14:25:02
к сожалению весь ru ds сидит в слаке

Павел Максимов
05.02.2018
14:25:31
https://t.me/datasciencechat

Anastasia
05.02.2018
14:25:48
https://t.me/datasciencechat ну не самый полезный канал, чуть что)

Павел Максимов
05.02.2018
14:25:56
https://t.me/bigdata_ru

Kirill
05.02.2018
14:26:41
sherzod
05.02.2018
14:27:07
ну может к счастью) там же opendatascience

Grigory
05.02.2018
14:28:01
ну может к счастью) там же opendatascience
да там ниоч полезно (имхо)

там питон все больше

Google
KrivdaAllStars
05.02.2018
14:30:18
Oleksandr
05.02.2018
15:06:06
подскажите, есть чего для выгрузки из hdfs по sftp ?

sherzod
05.02.2018
15:06:25
flume

у него точно есть ftp, sftp коннектор даже если нет можно быстро написать

KrivdaAllStars
05.02.2018
15:07:23
у него точно есть ftp, sftp коннектор даже если нет можно быстро написать
на самом деле большой гиморой писать свой коннектор для sftp

Oleksandr
05.02.2018
15:07:38
flume
только у нас не юзается

KrivdaAllStars
05.02.2018
15:07:44
Я делал ози задачи на баше с использованием lftp

sherzod
05.02.2018
15:07:54
я могу соврать, но у меня коллега дня за три накидал и до сих пор работает насколько я знаю

Oleksandr
05.02.2018
15:08:13
Я делал ози задачи на баше с использованием lftp
вот походу к этого же и прийду, мне надо 1 небольшой файл раз в день выливать

KrivdaAllStars
05.02.2018
15:08:28
это наиболее продакшнреди решение

Oleksandr
05.02.2018
15:08:41
и он тоже не юзается)

sherzod
05.02.2018
15:08:50
и хорошо)

KrivdaAllStars
05.02.2018
15:08:50
ну его можно сбоку поставить на самом деле

Oleksandr
05.02.2018
15:08:55
та мне "хуяк-хуяк и готово" достаточно

в идеале, либка, которая по хдфс ходит и выгружает

KrivdaAllStars
05.02.2018
15:09:37
ну просто следует помнить о том, что если выгрузка делается, не хочется каждый раз думать, сделалась она или нет, в нифи можно уведомления поставить и так далее

ну самое простое, это крон + hadoop fs -get + lftp

sherzod
05.02.2018
15:10:10
норм)

Oleksandr
05.02.2018
15:10:11
ози, блин, фтп умеет, а для сфтп надо патчить

Google
Andrey
05.02.2018
15:10:32
Самое простое это HDFS fuse

KrivdaAllStars
05.02.2018
15:11:21
Самое простое это HDFS fuse
это если есть контроль нормальный над sftp хостом, разве нет?

Andrey
05.02.2018
15:12:26
Да, а тут условие что контроля нет?

KrivdaAllStars
05.02.2018
15:12:42
ози, блин, фтп умеет, а для сфтп надо патчить
ну в общем, я использовал lftp + ози, и lftp + крон, оба варианта рабочие и с докачкой , но бед дизайн

Да, а тут условие что контроля нет?
ну обычно это просто сторонняя организация

Oleksandr
05.02.2018
15:13:13
ну в общем, я использовал lftp + ози, и lftp + крон, оба варианта рабочие и с докачкой , но бед дизайн
копну в сторону через ози, походу быстрее всего будет, спасибо

KrivdaAllStars
05.02.2018
15:14:10
ну ози обычные шелл скрипты запускать умеет же , ну и с уборкой за собой не нужно париться

Andrey
05.02.2018
15:15:56
Кстати, хотел все спросить, никто не использует hadoop2.9 c slider ?

Страница 71 из 182