@hadoopusers

Страница 16 из 182
Nick
22.06.2017
07:48:28
Эт где такие ?

GNU/Patchouli
22.06.2017
07:49:00
Pavel
22.06.2017
07:49:21
Дзен или маркет? )

GNU/Patchouli
22.06.2017
07:50:20
Дзен или маркет? )
тцц, на это нда

Google
Grigory
22.06.2017
08:17:07
тулза от спотифай

+ была ищща на их трекере; хотят сделать это в кассандре 4 (но это не точно, шутка про финансирование кассандры)

GNU/Patchouli
22.06.2017
08:19:57
KrivdaTheTriewe
22.06.2017
08:40:11
тулза от спотифай
они теперь только гугол используют

Grigory
22.06.2017
08:40:36
?

Dmitry
22.06.2017
09:40:48
Случается. А что, ты хочешь спросить, стоит ли использовать компонент от DataBricks, и как с ним бороться?
ага, вроде для обычной загрузки ок. а вот если мне надо делать exactly-once delievery и хранить оффсеты с кафки в самом редшифте, то какой-то цирк с конями начинается

вопрос первоначальный на самом деле отпал - у них можно костыль засунуть в виде pre-action, post-action, чтобы все делать в рамках одной транзакции. но в принципе, если будут какие-то мысли по теме, то интерестно чем туда пишите/читаете, как делаете upsert'ы

vvvvvv
25.06.2017
06:21:08
@MoneyMafia - канал где бесплатно публикуются различные способы и схемы заработка, которые продаются на тематических форумах за бешенные деньги.

Andrei
27.06.2017
07:54:11
Господа, кто-то использует Anaconda3'вский дистрибютив в связке с Spark2 (Hortonworks)? Если да, то какую - базовую или enterprise?

Anton
27.06.2017
10:05:56
#вакансия Всем привет! Ищем Data Scientist в компанию разработчика онлайн-игр, офис в Краснодаре. Данных много, структурированы хорошо, проблемы конкретные, ресурсов хватает, модели в прод выводим быстро, перспективы масштабирования большие. Стэк - python. spark. Условия: • Компенсация релокации, лететь недалеко, климат южный, близко горы и море • Работа на результат, минимум бюрократии, менеджмент молодой и адекватный • Вилки нет, заплатим столько, сколько надо Подробное описание и форма отправки резюме здесь: http://company.plarium.com/career/russia-krasnodar/data-scientist/

Nick
27.06.2017
10:28:49
сколько надо? смогу каждый месяц красный феррари покупать?

Marina
27.06.2017
10:30:03
Описание заманчивое,молодцы))))

Google
Marina
27.06.2017
10:33:22
Мы тоде в Краснодар ищем разработчиков Big Data,сейчас Hadoop внедряем. Но размахам по зп похвастаться не можем... Зато задачи реально интересные и команда разработчиков активно развивающаяся))))Кому интересно,пишите. В Краснодаре реально хорошо?

Konstantin
27.06.2017
10:34:43
Онлайн игры? )

Anton
27.06.2017
10:38:49
Онлайн игры? )
Да, в основном ММО - мобильные, браузер, фейсбук

сколько надо? смогу каждый месяц красный феррари покупать?
Сможешь, если будут твои модели так хорошо работать :)

GNU/Patchouli
27.06.2017
10:44:12
Господа, есть ли смысл вообще переходить с юпитера на цеппелин?

Anton
27.06.2017
10:47:53
Господа, есть ли смысл вообще переходить с юпитера на цеппелин?
Последний раз когда сравнивали, цеппелин нам не подошел потому что авторизации не было, то есть вообще.

GNU/Patchouli
27.06.2017
10:52:14
ясненько

ag0n1k
27.06.2017
11:33:52
https://zeppelin.apache.org/docs/0.6.2/security/shiroauthentication.html#ldap

Marina
27.06.2017
14:49:07
Да,Информационные Технологии Магнит?

Nick
27.06.2017
15:15:49
Сможешь, если будут твои модели так хорошо работать :)
мои модели? я не хочу быть сутенером ?

Anton
27.06.2017
15:25:08
Да,Информационные Технологии Магнит?
:) ага, так и подумал. Ну что ж, можно найти несколько общих тем - хотя бы по технологиям. Напишу в личку тогда насчет совместного митапа - вдруг интересно будет.

мои модели? я не хочу быть сутенером ?
что ж, феррари будут скучать по тебе :)

Aleksander
27.06.2017
18:23:17
Майнеры лезут из всех щелей :)))

Что это за хайп такой ?:)

Grigory
27.06.2017
18:49:37
Отходил не сразу потер)

мамкины майнеры майнят и скупают карты

Aleksander
27.06.2017
19:23:48
Лучше пуская кодить учатся :)) Быстрее деньги майнятся :)

Google
Aleksander
01.07.2017
09:09:51
Ребятки:) а кто-нибудь пробовал вместо внедрения огромного стека технологий с хадупом и ко, внедрить аналитическую бд от Яндекса clickhouse ??

Daniel
01.07.2017
09:10:55
кликхаус далеко не для всех кейсов, скорее даже довольно узкий

лучше его доку на этот предмет поизучать

Aleksander
01.07.2017
09:12:57
Вот занимаюсь изучением. И похоже, что подходит под мой кейс, и есть даже драйвер для jdbc, что шикарно. Интересен опыт других, кто пробовал и чем это обернулось :)

Daniel
01.07.2017
09:17:06
У них есть официальный канал в телеграмме, если что

Aleksander
01.07.2017
09:18:06
У них есть официальный канал в телеграмме, если что
Оп-оп:) а название, что-то типа clickhouse?

Daniel
01.07.2017
09:18:49
ClickHouse не тормозит Обсуждаем clickhouse.yandex https://t.me/clickhouse_ru

Aleksander
01.07.2017
09:19:19
Спасибо !

Nick
01.07.2017
09:25:37
Клакхаус же как эластиксерч, для индексов. Как им можно заменить хадуп стек то

Aleksander
01.07.2017
09:52:35
Имелось в виду для хранения данных:)

Туда все класть, а не по файликам раскидывать

Ну или замену HBase

Daniel
01.07.2017
09:54:50
Он не для транзакционной нагрузки. Аналитические аггрегаты его кейс. Джоины весьма ограничены.

Nick
01.07.2017
09:58:08
Имелось в виду для хранения данных:)
Весь вопрос в том , сколько данных

Кликхаус явно не предназначен для хранения кучи гавна)

Aleksander
01.07.2017
09:59:07
Весь вопрос в том , сколько данных
Данных много, но пока не ясно точно. Не могу выйти на заданную мощность, потому, что предыдущее решение умирает:)

Nick
01.07.2017
10:03:04
Как раз для этого.
А разве не для того, чтобы уже подготовленные данные туда пихать?

Google
Daniel
01.07.2017
10:04:18
Философский вопрос, что считать говном.

Nick
01.07.2017
10:04:48
Лол

Daniel
01.07.2017
10:06:15
Я под говном понимаю данные без всякой ценности. Ты похоже про сырье говоришь.

Nick
01.07.2017
10:06:30
ну да

Daniel
01.07.2017
10:07:35
В этом плане само собой их нужно привести к нужному виду.

KrivdaTheTriewe
01.07.2017
10:17:47
Благодарен товарищу за ревью кликхауза Плюсы: 1) Колоночная база => круто сжимает 2) Основной тип таблиц: MergeTable хранит данные по кускам, внутри каждого куска данные отсортированы по индексу, поэтому очень быстро отвечает на запросы с использованием индексом. 3) Фулскан тоже довольно быстрый, но жрет много ресурсов 4) Эффективная работа со словарями из других баз, позволяющая избежать join-ов больших таблиц на маленькие, а просто хранить маленькие таблицы в оперативке и кверить их как хэшмапу Минусы: 1) Обязательная Date-колонка в таблице 2) Геморное с точки зрения постановки на поток создание распределенных таблиц 3) Нет поддержки Null-ов (пока) 4) Реализовать репликейшн фактор можно только с помощью докеров, сильно сложнее, чем у всяких Кассандр и Вертик

Daniel
01.07.2017
10:48:14
Про фактор репликации и докер что-то странное

Nick
01.07.2017
11:12:49
Лол

Как эт с докером то связано

KrivdaTheTriewe
01.07.2017
11:14:28
ну это мне рассказали , я с ним не работал

Nick
01.07.2017
11:19:50
Давай я тебе расскажу, что я работал со всем и самое крутое это хранить файлы в фтп

KrivdaTheTriewe
01.07.2017
11:21:23
Давай я тебе расскажу, что я работал со всем и самое крутое это хранить файлы в фтп
ты как то на личный счет воспринимаешь , тут какие - то другие пункты у тебя сомнение вызывают ?

Nick
01.07.2017
11:24:50
не, эт лишь тебе совет не слушать никого xD

ну либо слушать, но проверять

ну либо слушать и не проверять

KrivdaTheTriewe
01.07.2017
11:27:18
я не хочу , я видел что человек делал с этим кх

Nick
01.07.2017
16:51:47
вот что

Страница 16 из 182