@hadoopusers

Страница 69 из 182
Vera
31.01.2018
17:13:48
вот это да, спасибо

так всю книгу можно прочитать

KrivdaAllStars
31.01.2018
17:17:49
да\

я очень советую этот сервис

Google
KrivdaAllStars
31.01.2018
17:17:59
и подписку оформить

потому что там есть всегда книги очень актуальные, прям сейчас наверное можно найти книги, которые будут публиковать только в декабре

Noors
31.01.2018
18:16:11
Привет! Я читаю книгу «data algorithms» (Mahmoud Parsian) на Букмейте. Думаю, тебе может понравиться: https://bookmate.com/books/gFGrxIdM

так всю книгу можно прочитать
Тоже предлагаю сервис букмэйт. Месяц можно прочитать что угодно бесплатно без привязки карточки)

Vera
31.01.2018
18:23:06
Удобно, спасибо!

Paul
01.02.2018
08:37:37
Подскажите плиз, хочу развернуть для тестов хадуп стэк и меня спрашивают нужен ли прямой доступ к транзакционным системам или можно их изолировать и через 1 комп гонять данные в него?

Dmitry
01.02.2018
08:39:27
Для безопасности лучше изолировать нахер

Paul
01.02.2018
08:40:04
А Кафка или nifi тоже на отдельных машинах будут, и доступ нужен будет только им?

Sergey
01.02.2018
08:51:37
Подскажите плиз, хочу развернуть для тестов хадуп стэк и меня спрашивают нужен ли прямой доступ к транзакционным системам или можно их изолировать и через 1 комп гонять данные в него?
если будете перекачивать большие объемы данных из RDBMS в Hadoop с помощью Sqoop, то доступ к RDBMS будет нужен со всех дата-нод кластера

Oleg
01.02.2018
09:06:33
привет, нужен менеджер тасок в хадупе. Запускать по расписанию, запускать поочереди и в зависимости от результата предыдущей. кто что использует?

oozie?

KrivdaAllStars
01.02.2018
09:08:03
а что сейчас стоит

народ использует airflow

Google
KrivdaAllStars
01.02.2018
09:08:57
Ози, тоже как вариант, но если с веб интерфейсом каким( В ПОСТАВКЕ HUE идет)

Grigory
01.02.2018
09:10:07
народ использует airflow
мы выкинули его и полностью на aws batch переехали

sherzod
01.02.2018
09:10:15
oozie?
https://datamoth.github.io

KrivdaAllStars
01.02.2018
09:10:55
Grigory
01.02.2018
09:11:24
ВЕНДОРЕ ЛОКЕНУ
да там короче ребята сгорели и решили пока залочиться

Oleg
01.02.2018
09:11:36
спасибо

посмотрю туда

мля)

Grigory
01.02.2018
09:12:41
а чего сгорели?
https://github.com/raster-foundry/raster-foundry/blob/78ec045ccc89e29ce76295d0a766df49b7419629/docs/architecture/adr-0019-workflow-manager.md

Oleg
01.02.2018
09:13:16
сп с

Grigory
01.02.2018
09:13:59
причем, рибята питонисты сгорели и девопсы любители петона

KrivdaAllStars
01.02.2018
09:14:29
аааааааааааааааааааааааааааааааааааа

Есть подозрение, что всё таки с питоном если работаешь, то в вакансии указывают навык стрессоустойчивость

Grigory
01.02.2018
09:16:44
не знаю, я с питона сгораю с пол оборота, не для меня

Oleksandr
01.02.2018
09:17:07
мы выкинули его и полностью на aws batch переехали
а по функционалу как? аирфлоу немного тыкал, с batch не знаком

код на питоне писать нужно? ?

Grigory
01.02.2018
09:17:51
ну в крадце - не смогли добиться с эирфлоу стабильности и консолидации аутпутов / логов код над писать на питоне только, все даги питоновые а клиенты были

Oleksandr
01.02.2018
09:18:59
понял, спасибо)

Grigory
01.02.2018
09:21:04
отвелкся) а клиенты были и нужна была стабильность

Google
Grigory
01.02.2018
09:21:32
конечно Кривда верно заметил что нужно абстрагироваться от вендора

Grigory
01.02.2018
09:23:46
а можете пригласить в чат этих ребят? очень интересно их негативное мнение об Airflow
можно спросить в ишше на гитхабе; а то и язык не тот и телеграммом не пользуются

Sergey
01.02.2018
09:23:55
мы тоже вовсю его используем, мучаемся, но пока не сдаемся... реальных альтернатив не вижу

Grigory
01.02.2018
09:28:31
мы тоже вовсю его используем, мучаемся, но пока не сдаемся... реальных альтернатив не вижу
да не то что негативный опыт, устали с ним бороться и нужен был уже прод

Paul
01.02.2018
09:49:39
Здесь вопрос доступности. Много ли я смогу сделать, если между базами предприятия и хадупом будет мой комп

Sergey
01.02.2018
09:58:15
А как Sqoop в этом случае относится к плохим каналам связи?
плохо относится. суть Sqoop в том, что он генерирует по заданному SQL-запросу на извлечение данных из RDBMS MR-job из 4 (по дефолту) мапперов. каждый маппер запускается в рамках YARN на отдельном контейнере в дата-ноде. если связь между дата-нодой с зпущенным маппером и RDBMS будет плохой - маппер упадет. можно регулировать кол-во попыток перезапуска -Dmap.retry.numRetries=N -Dmapreduce.map.maxattempts=N

Sergey
01.02.2018
10:28:39
Возможно глупый вопрос, но как по-человечески останавливать spark streaming джобы?

KrivdaAllStars
01.02.2018
10:44:15
Yarn application -kill

Egor
01.02.2018
13:44:46
Daria
01.02.2018
14:18:02
а про телеграм канал полезный можно написать?

Pavel
01.02.2018
14:19:15
полезный кому?

Daniel
01.02.2018
14:19:50
полезный кому?
это тригернет маркетинговый рассказ правильный вопрос "о чем?"

Daria
01.02.2018
14:21:02
полезный тем, кто хочет не пропустить разные конференции, митапы, хакатоны, гранты и тдё

Pavel
01.02.2018
14:21:34
разные или какие-то конкретные?

не понятно зачем вот мне не пропускать конференцию по Js

Google
Pavel
01.02.2018
14:22:10
если я не профессионал в Js

Daria
01.02.2018
14:24:33
они с тегами, для it, для финтеха, для биотеха, по разным новым технологиям

https://t.me/startupchances

короче)

Daniel
01.02.2018
14:25:24
не про криптовалюту и на том спасибо

Daria
01.02.2018
14:27:00
))) их чего-то очень много

Akceptor
02.02.2018
09:41:23
Есть проект юзающий hive-exec 1.2.1 джарку и соответственно hive-metastore той же версии. Теперь стоит задача перевести все на свежие версии хайва. Нормально пользовать 2.3.2 или оно только для Hive2 актуально?

Andrey
02.02.2018
10:10:06
в hive-1.2.2 при апгрейде на hive -2.3.2 возникли проблемы

но у нас в 2.3.2 в качестве движка mapreduce, если будет tez - то возможно проблем не будет

проблемы решились обновлением hive-exec

Akceptor
02.02.2018
10:17:17
спасибо. у нас вроде тез на кластере

Andrey
02.02.2018
10:18:56
но тебе нужно будет полностью hive обновить, и метастор и хайвсервер2

Timur
02.02.2018
13:07:51
Господа, hive и impala поддерживают кириллицу в sql?

Andrey
02.02.2018
13:24:32
hive да

по крайней мере, с сериалайз енкодингом точно - ROW FORMAT SERDE ‘org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe’ WITH SERDEPROPERTIES(“serialization.encoding”=’UTF-8′);

Кто нибудь сравнивал hive+llap с impala ?

??Dmitry????
02.02.2018
14:42:52
всем привет

есть ли большая разница между процессом установки 2.х и 3.0?

и имеет ли смысл ставить мини кластер хадупа в виртуалки на один физический хост?

Google
??Dmitry????
02.02.2018
14:43:36
прототип хотим построить

KrivdaAllStars
02.02.2018
14:44:11
Быстрее взять клаудеру

??Dmitry????
02.02.2018
14:44:18
почему?

KrivdaAllStars
02.02.2018
14:44:20
Или хдп сандбоксы

Daniel
02.02.2018
14:44:34
клаудера втащила 3ку?

??Dmitry????
02.02.2018
14:44:34
клаудера афайк жадная

KrivdaAllStars
02.02.2018
14:44:46
клаудера афайк жадная
Ну вот ейдж ноды на виртуалки вынести можно

Daniel
02.02.2018
14:46:00
клаудера афайк жадная
если вы хотите саппортить сами, то нет разницы с коробкой без поддержки

??Dmitry????
02.02.2018
14:57:13
Прототип чего
хотим попробовать хадуп

девелоперы хотят

я сисадмин

и никогда с этой штукой дела не имел

Kirill
02.02.2018
14:57:59
хотим попробовать хадуп
HDP ставь через ambari, host os = Cent OS

KrivdaAllStars
02.02.2018
14:58:09
смотрите, попробовать можно и на локальной машине запустить, а если что - то прод реди , то нужно железо

Страница 69 из 182