
Vera
31.01.2018
17:13:48
вот это да, спасибо
так всю книгу можно прочитать

KrivdaAllStars
31.01.2018
17:17:49
да\
я очень советую этот сервис

Google

KrivdaAllStars
31.01.2018
17:17:59
и подписку оформить
потому что там есть всегда книги очень актуальные, прям сейчас наверное можно найти книги, которые будут публиковать только в декабре

Noors
31.01.2018
18:16:11
Привет!
Я читаю книгу «data algorithms» (Mahmoud Parsian) на Букмейте. Думаю, тебе может понравиться:
https://bookmate.com/books/gFGrxIdM

Vera
31.01.2018
18:23:06
Удобно, спасибо!

Paul
01.02.2018
08:37:37
Подскажите плиз, хочу развернуть для тестов хадуп стэк и меня спрашивают нужен ли прямой доступ к транзакционным системам или можно их изолировать и через 1 комп гонять данные в него?

Dmitry
01.02.2018
08:39:27
Для безопасности лучше изолировать нахер

Paul
01.02.2018
08:40:04
А Кафка или nifi тоже на отдельных машинах будут, и доступ нужен будет только им?

Sergey
01.02.2018
08:51:37

Oleg
01.02.2018
09:06:33
привет, нужен менеджер тасок в хадупе. Запускать по расписанию, запускать поочереди и в зависимости от результата предыдущей. кто что использует?
oozie?

KrivdaAllStars
01.02.2018
09:08:03
а что сейчас стоит
народ использует airflow

Google

KrivdaAllStars
01.02.2018
09:08:57
Ози, тоже как вариант, но если с веб интерфейсом каким( В ПОСТАВКЕ HUE идет)

Grigory
01.02.2018
09:10:07

sherzod
01.02.2018
09:10:15
oozie?
https://datamoth.github.io

KrivdaAllStars
01.02.2018
09:10:55

Grigory
01.02.2018
09:11:24

Oleg
01.02.2018
09:11:36
спасибо
посмотрю туда
мля)

KrivdaAllStars
01.02.2018
09:11:54

Grigory
01.02.2018
09:12:41
а чего сгорели?
https://github.com/raster-foundry/raster-foundry/blob/78ec045ccc89e29ce76295d0a766df49b7419629/docs/architecture/adr-0019-workflow-manager.md

Oleg
01.02.2018
09:13:16
сп с

Grigory
01.02.2018
09:13:59
причем, рибята питонисты сгорели и девопсы любители петона

KrivdaAllStars
01.02.2018
09:14:29
аааааааааааааааааааааааааааааааааааа
Есть подозрение, что всё таки с питоном если работаешь, то в вакансии указывают навык стрессоустойчивость

Grigory
01.02.2018
09:16:44
не знаю, я с питона сгораю с пол оборота, не для меня

Oleksandr
01.02.2018
09:17:07
код на питоне писать нужно? ?

Grigory
01.02.2018
09:17:51
ну в крадце - не смогли добиться с эирфлоу стабильности и консолидации аутпутов / логов
код над писать на питоне только, все даги питоновые
а клиенты были

Oleksandr
01.02.2018
09:18:59
понял, спасибо)

Grigory
01.02.2018
09:21:04
отвелкся) а клиенты были и нужна была стабильность

Google

Grigory
01.02.2018
09:21:32
конечно Кривда верно заметил что нужно абстрагироваться от вендора

Sergey
01.02.2018
09:23:10

Grigory
01.02.2018
09:23:46

Sergey
01.02.2018
09:23:55
мы тоже вовсю его используем, мучаемся, но пока не сдаемся...
реальных альтернатив не вижу

Grigory
01.02.2018
09:28:31

Paul
01.02.2018
09:29:22

Alex
01.02.2018
09:38:01

Paul
01.02.2018
09:49:39
Здесь вопрос доступности. Много ли я смогу сделать, если между базами предприятия и хадупом будет мой комп

Sergey
01.02.2018
09:58:15
А как Sqoop в этом случае относится к плохим каналам связи?
плохо относится. суть Sqoop в том, что он генерирует по заданному SQL-запросу на извлечение данных из RDBMS MR-job из 4 (по дефолту) мапперов. каждый маппер запускается в рамках YARN на отдельном контейнере в дата-ноде. если связь между дата-нодой с зпущенным маппером и RDBMS будет плохой - маппер упадет.
можно регулировать кол-во попыток перезапуска
-Dmap.retry.numRetries=N
-Dmapreduce.map.maxattempts=N

Alex
01.02.2018
10:04:08

Sergey
01.02.2018
10:28:39
Возможно глупый вопрос, но как по-человечески останавливать spark streaming джобы?

KrivdaAllStars
01.02.2018
10:44:15
Yarn application -kill

Egor
01.02.2018
13:44:46

Daria
01.02.2018
14:18:02
а про телеграм канал полезный можно написать?

Pavel
01.02.2018
14:19:15
полезный кому?

Daniel
01.02.2018
14:19:50
полезный кому?
это тригернет маркетинговый рассказ
правильный вопрос "о чем?"

Pavel
01.02.2018
14:20:15

Daria
01.02.2018
14:21:02
полезный тем, кто хочет не пропустить разные конференции, митапы, хакатоны, гранты и тдё

Pavel
01.02.2018
14:21:34
разные или какие-то конкретные?
не понятно зачем вот мне не пропускать конференцию по Js

Google

Pavel
01.02.2018
14:22:10
если я не профессионал в Js

Daria
01.02.2018
14:24:33
они с тегами, для it, для финтеха, для биотеха, по разным новым технологиям
https://t.me/startupchances
короче)

Daniel
01.02.2018
14:25:24
не про криптовалюту и на том спасибо

Daria
01.02.2018
14:27:00
))) их чего-то очень много

Sergey
01.02.2018
19:24:48

Akceptor
02.02.2018
09:41:23
Есть проект юзающий hive-exec 1.2.1 джарку и соответственно hive-metastore той же версии. Теперь стоит задача перевести все на свежие версии хайва. Нормально пользовать 2.3.2 или оно только для Hive2 актуально?

Andrey
02.02.2018
10:10:06
в hive-1.2.2 при апгрейде на hive -2.3.2 возникли проблемы
но у нас в 2.3.2 в качестве движка mapreduce, если будет tez - то возможно проблем не будет
проблемы решились обновлением hive-exec

Akceptor
02.02.2018
10:17:17
спасибо. у нас вроде тез на кластере

Andrey
02.02.2018
10:18:56
но тебе нужно будет полностью hive обновить, и метастор и хайвсервер2

Timur
02.02.2018
13:07:51
Господа, hive и impala поддерживают кириллицу в sql?

Andrey
02.02.2018
13:24:32
hive да
по крайней мере, с сериалайз енкодингом точно - ROW FORMAT SERDE ‘org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe’ WITH SERDEPROPERTIES(“serialization.encoding”=’UTF-8′);
Кто нибудь сравнивал hive+llap с impala ?

??Dmitry????
02.02.2018
14:42:52
всем привет
есть ли большая разница между процессом установки 2.х и 3.0?
и имеет ли смысл ставить мини кластер хадупа в виртуалки на один физический хост?

Google

??Dmitry????
02.02.2018
14:43:36
прототип хотим построить

KrivdaAllStars
02.02.2018
14:44:11
Быстрее взять клаудеру

??Dmitry????
02.02.2018
14:44:18
почему?

KrivdaAllStars
02.02.2018
14:44:20
Или хдп сандбоксы

Daniel
02.02.2018
14:44:34
клаудера втащила 3ку?

??Dmitry????
02.02.2018
14:44:34
клаудера афайк жадная

KrivdaAllStars
02.02.2018
14:44:46

Daniel
02.02.2018
14:46:00

??Dmitry????
02.02.2018
14:57:13
девелоперы хотят
я сисадмин
и никогда с этой штукой дела не имел

Kirill
02.02.2018
14:57:59

KrivdaAllStars
02.02.2018
14:58:09
смотрите, попробовать можно и на локальной машине запустить, а если что - то прод реди , то нужно железо