@hadoopusers

« Назад

Страница 102 из 182

Далее »

KrivdaAllStars

23.05.2018
08:21:31

Привет

П

23.05.2018
09:31:15

Кто-нибудь уже пользовался новой интеграцией с Spark SQL в metabase?

Iuliia

23.05.2018
10:45:33

Всем привет! Заранее извиняюсь, если для кого-то мое сообщение оказалось спамом! У меня идея летнего отпуска для тех, кто не хочет сидеть без дела: 11 дней на острове технарей. В рамках «Острова 10-21» мы возьмем желающих на настоящий остров, и там за 11 дней российские и зарубежные ученые, предприниматели и эксперты в области технического развития закачают вас знаниями по 15-ти направлениям, начиная с Big Data и AI и заканчивая личной эффективностью и HR, помогут сформировать проектные команды и завести нужные знакомства. Это будет действительно полезным отдыхом. Все, кому интересно, могут писать в ЛС, отвечу на все вопросы!

Старый

23.05.2018
16:32:22

Зато тепло

ну как успехи?

Google

Vishal

24.05.2018
09:45:04

how to convert flume data (twitter) to structured hive table format?

Sergey

24.05.2018
14:25:17

всем привет! подскажите, кто-то из присутствующих использует Oracle Big Data Appliance?

how to convert flume data (twitter) to structured hive table format?

1) load to HDFS (like this - https://www.rittmanmead.com/blog/2014/05/trickle-feeding-webserver-log-files-to-hdfs-using-apache-flume ) 2) create in Hive external table mapped with your HDFS dir of flume data 3) write HiveQL (with parsing) for loading into parquet/orc-based table from external table

Vishal

24.05.2018
18:32:37

thank you bro!!

Alexander

25.05.2018
05:57:38

#job #вакансия #москва #Senior Data Engineer Всем доброго времени суток. Я руковожу подразделением professional services в компании CleverDATA. Мы разрабатываем и внедряем решения для автоматизации digital-маркетинга с помощью ИИ и больших данных. Ищу себе в команду Senior Java-инженера в Москве. От кандидата ожидаю: - компетенции в Java, Hadoop, Spark, Kafka - знать, как решать задачи по обработке данных и интеграциям - высокую отдачу, ответственность, желание изучать технологии, желание делать “хорошо” - умение работать в команде и писать читаемый код Что могу дать взамен: - интересные и сложные задачи по параллельной обработке больших массивов данных, вычислении в реальном времени, разработке высоконагруженных и отказоустойчивых сервисов - возможность принимать самостоятельные решения в части реализации - дружную команду, которая любит свое дело, технологии и своих клиентов - возможность участвовать в релевантных конференциях (в т.ч. за пределами России) - офис в Москве м. Автозаводская - гибкий рабочий график и возможность один день в неделю работать удаленно - белую зп от 180 до 250 т.р. на руки Немного о компании: Трудовые будни команды CleverDATA - это создание продуктов для обработки терабайт данных в день и сотен тысяч запросов в секунду. Это разработка предиктивных моделей для повышения эффективности бизнеса на миллионы рублей в месяц. Это участие в качестве экспертов на конференциях и вебинарах по технологиям. Если вам это интересно или появились вопросы, пожалуйста, пишите в личку @AlexanderBolshakov.

Ksush

25.05.2018
08:50:25

Ребята, привет! Есть среди вас кто-то занимался задачами типа Spam Detection Classifier (http://bit.ly/2LvV179)? У меня есть схожая задача по выделению писем определенной тематики. Была бы рада с кем-то проконсультироваться по этой теме и возможно поработать.

Dmitry

25.05.2018
08:51:28

Это к саентологам скорей

Grigory

25.05.2018
08:51:42

да может тут тоже кто найдется

Ksush

25.05.2018
08:52:36

Это к саентологам скорей

почему так сразу?

Daniel

25.05.2018
08:52:43

пока только предстоит

Dmitry

25.05.2018
08:52:57

Ну тут про модель ж больше разговор

Ksush

25.05.2018
08:53:26

хм закину к ним в чатик

sherzod

25.05.2018
08:53:34

Ребята, привет! Есть среди вас кто-то занимался задачами типа Spam Detection Classifier (http://bit.ly/2LvV179)? У меня есть схожая задача по выделению писем определенной тематики. Была бы рада с кем-то проконсультироваться по этой теме и возможно поработать.

Лучше конкретный вопрос задать, тогда начнётся предметное обсуждение.

Google

sherzod

25.05.2018
08:53:58

хм закину к ним в чатик

Ну и есть opendatascience.slack.com очень мощное сообщество в слаке.

Dmitry

25.05.2018
08:54:36

Так то можно через гугловое апи прогонять

Daniel

25.05.2018
08:54:47

Ну и есть opendatascience.slack.com очень мощное сообщество в слаке.

да, там шансы на помощь с таким вопросом больше

Так то можно через гугловое апи прогонять

не всегда это возможно

Ksush

25.05.2018
08:55:44

Ну и есть opendatascience.slack.com очень мощное сообщество в слаке.

спасибо! я хочу найти человека, который присоединится к моей команде, поэтому хотелось бы, чтоб он по-русски говорил. не все разработчики англоязычные. но я попробую там

sherzod

25.05.2018
08:56:19

эт что хайринг))

Daniel

25.05.2018
08:56:54

спасибо! я хочу найти человека, который присоединится к моей команде, поэтому хотелось бы, чтоб он по-русски говорил. не все разработчики англоязычные. но я попробую там

это русскоязычное сообщество для поиска людей в проект там есть отдельный канал "_call_4_collaboration"

Dmitry

25.05.2018
09:00:13

не всегда это возможно

Ясное дело, но и задача абстрактная

Да и дорого это

Ksush

25.05.2018
09:00:46

эт что хайринг))

ну хз, если человек в этом разбирается и готов пилить проект со мной — пусть будет хайринг

Daniel

25.05.2018
09:00:54

ну в вопросе звучали "различные тематики" так что это не антиспам)

Ksush

25.05.2018
09:00:58

Так то можно через гугловое апи прогонять

про google prediction думали, но чет дороговато

Dmitry

25.05.2018
09:01:13

Там был движок для нлп

Который умел выделять топик

Ksush

25.05.2018
09:01:34

ну в вопросе звучали "различные тематики" так что это не антиспам)

да, верно. нужно определить письма конкретной тематики, не спам

Daniel

25.05.2018
09:01:36

если тексты русские то не оч верю в гугловый нлп

Ksush

25.05.2018
09:01:54

не русские, только английский

Dmitry

25.05.2018
09:02:54

если тексты русские то не оч верю в гугловый нлп

Вообще насколько я помню с русскими корпусами чот всё не оч

Или я не там смотрю

Я когда ner начинал делать, все было не оч. Википедию мучал

Google

KrivdaAllStars

25.05.2018
09:04:03

русские корпуса есть

Daniel

25.05.2018
09:04:12

ну в общем согласен с @sherzodv что надо справшивать в одс, там оч большое сообщество есть канал для общих вопросов, когда не знаешь куда "theory_and_practice" и тот что выше для поиска соратников на проект

Dmitry

25.05.2018
09:04:32

русские корпуса есть

Где взять?

Ksush

25.05.2018
09:05:15

ну в общем согласен с @sherzodv что надо справшивать в одс, там оч большое сообщество есть канал для общих вопросов, когда не знаешь куда "theory_and_practice" и тот что выше для поиска соратников на проект

спасибо, буду пробовать

KrivdaAllStars

25.05.2018
09:05:24

http://rusvectores.org/ru/about/

Dmitry

25.05.2018
09:05:49

ну в общем согласен с @sherzodv что надо справшивать в одс, там оч большое сообщество есть канал для общих вопросов, когда не знаешь куда "theory_and_practice" и тот что выше для поиска соратников на проект

На сколько они токсик? Относительно скалы, например

У меня одноклассник из основы, и чот сразу отбивает желание туда писать

Daniel

25.05.2018
09:07:34

На сколько они токсик? Относительно скалы, например

там все ок просто люди, гнобление только тем кто вакансии выкладывает)

но по бигдатным вопросам, имхо, лучше сюда здесь активнее и помогают чаще хотя там есть хорошие спецы

Ksush

25.05.2018
09:16:06

http://rusvectores.org/ru/about/

видели их! у нас есть еще проект, там как раз векторы строили, но опять же на английском

П

25.05.2018
09:50:39

Ну и есть opendatascience.slack.com очень мощное сообщество в слаке.

Как туда попасть? "Contact the workspace administrator for an invitation" эээ

sherzod

25.05.2018
09:51:07

Просто надо запросить invite (там разве не указано как?) Там быстро его дадут.

Как туда попасть? "Contact the workspace administrator for an invitation" эээ

http://ods.ai/

П

25.05.2018
09:53:03

Спасибо

Grigory

25.05.2018
09:54:55

там на самом деле была прямая ссылка на регу

но я не смог ее найти второй раз

Daniel

25.05.2018
09:56:10

ну и для hr навсякий, вас там забанят

Admin

Eduard

25.05.2018
11:29:46

Привет Есть у меня упавшее непонятно почему спарк приложение. В основном логе EMR оно пожаловалось, что не смогло в Caused by: java.lang.NoClassDefFoundError: Could not initialize class org.xerial.snappy.Snappy Я полез в history server чтобы посмотреть подробные логи, но на том экзекуторе, где произошли ошибки нет логов. Может сталкивался кто? Хочу посмотреть что именно там случилось. (После перезапуска все отработало успешно.)

Google

Eduard

25.05.2018
11:30:39

Svyatoslav

25.05.2018
14:39:22

Коллеги, привет! А кто-нибудь использовал flip-6 mode во flink?

Grigory

25.05.2018
14:43:16

Привет Есть у меня упавшее непонятно почему спарк приложение. В основном логе EMR оно пожаловалось, что не смогло в Caused by: java.lang.NoClassDefFoundError: Could not initialize class org.xerial.snappy.Snappy Я полез в history server чтобы посмотреть подробные логи, но на том экзекуторе, где произошли ошибки нет логов. Может сталкивался кто? Хочу посмотреть что именно там случилось. (После перезапуска все отработало успешно.)

у вас кассандра?

Eduard

25.05.2018
14:45:01

у вас кассандра?

Не, EMR , s3

Grigory

25.05.2018
14:45:33

странно ._.

Polina

26.05.2018
07:06:50

О, у меня тоже был Unable to locate logs...

Если пофиксите - напишите плиз)

Привет Есть у меня упавшее непонятно почему спарк приложение. В основном логе EMR оно пожаловалось, что не смогло в Caused by: java.lang.NoClassDefFoundError: Could not initialize class org.xerial.snappy.Snappy Я полез в history server чтобы посмотреть подробные логи, но на том экзекуторе, где произошли ошибки нет логов. Может сталкивался кто? Хочу посмотреть что именно там случилось. (После перезапуска все отработало успешно.)

Вы используете снаппи кодек? Я отключала кодеки на тачке, где живёт Спарк :( у меня был lzo и с ним не взлетало

Eduard

26.05.2018
07:09:20

Да испрльзуем

Polina

26.05.2018
07:10:09

А можете скинуть кусочек конфига, где вы задаете кодеки?

У вас cdh?

Eduard

26.05.2018
07:35:22

Amazon EMR, дефолтный конфиг) где его посмотреть?)

Polina

26.05.2018
08:29:08

По-моему, если не ошибаюсь, это в core-site.xml было

Или в mapred-site Я что-то запамятовала)

и там и там

Vova

27.05.2018
06:37:17

Google Big Query может кто поделится впечатлениями?

Eduard

28.05.2018
05:57:12

По-моему, если не ошибаюсь, это в core-site.xml было

core-site <property> <name>io.compression.codecs</name> <value>org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.BZip2Codec,org.apache.hadoop.io.compress.SnappyCodec,com.hadoop.compression.lzo.LzoCode c,com.hadoop.compression.lzo.LzopCodec</value> </property> <property> <name>io.compression.codec.lzo.class</name> <value>com.hadoop.compression.lzo.LzoCodec</value> </property>

Vishal

28.05.2018
11:17:58

how to do this ? Do this in hive. Problem Statement: • City wise list all the Condos which is not less than ten thousand. • In GALT city which residential type has more than 800sq__ft. Display their respective details street,sq__ft,sale_date,city. • Which is the cheapest Condo in CA. name the city,street and price for the Condo. • List top 5 residency details which lie in the budget of 60000-120000, an area more than 1450, sold after 17th may, min bedroom 3 and, min bathroom 2. • separate list of residential apartments with more than 2 beds. Also include columns in following order City,Baths,Sq_feet,Price,flat_type,Beds respectively.

guyz plz give me the solution

Grigory

28.05.2018
11:25:06

hey @Doodleman this is a group for questions and help; not for doing your homework for you. pls frame your questions better ¯\_(ツ)_/¯

Google

Vishal

28.05.2018
11:27:36

hey @Doodleman this is a group for questions and help; not for doing your homework for you. pls frame your questions better ¯\_(ツ)_/¯

sry mann...will try and post when i het into trouble

Andrey