
Nick
22.06.2017
07:48:28
Эт где такие ?

GNU/Patchouli
22.06.2017
07:49:00

Pavel
22.06.2017
07:49:21
Дзен или маркет? )

GNU/Patchouli
22.06.2017
07:50:20

Google

Grigory
22.06.2017
08:17:07
тулза от спотифай
+ была ищща на их трекере; хотят сделать это в кассандре 4 (но это не точно, шутка про финансирование кассандры)

GNU/Patchouli
22.06.2017
08:19:57

KrivdaTheTriewe
22.06.2017
08:40:11

Grigory
22.06.2017
08:40:36
?

Dmitry
22.06.2017
09:40:48
вопрос первоначальный на самом деле отпал - у них можно костыль засунуть в виде pre-action, post-action, чтобы все делать в рамках одной транзакции. но в принципе, если будут какие-то мысли по теме, то интерестно чем туда пишите/читаете, как делаете upsert'ы

vvvvvv
25.06.2017
06:21:08
@MoneyMafia - канал где бесплатно публикуются различные способы и схемы заработка, которые продаются на тематических форумах за бешенные деньги.

Andrei
27.06.2017
07:54:11
Господа, кто-то использует Anaconda3'вский дистрибютив в связке с Spark2 (Hortonworks)? Если да, то какую - базовую или enterprise?

Anton
27.06.2017
10:05:56
#вакансия
Всем привет! Ищем Data Scientist в компанию разработчика онлайн-игр, офис в Краснодаре. Данных много, структурированы хорошо, проблемы конкретные, ресурсов хватает, модели в прод выводим быстро, перспективы масштабирования большие. Стэк - python. spark.
Условия:
• Компенсация релокации, лететь недалеко, климат южный, близко горы и море
• Работа на результат, минимум бюрократии, менеджмент молодой и адекватный
• Вилки нет, заплатим столько, сколько надо
Подробное описание и форма отправки резюме здесь:
http://company.plarium.com/career/russia-krasnodar/data-scientist/

Nick
27.06.2017
10:28:49
сколько надо? смогу каждый месяц красный феррари покупать?

Marina
27.06.2017
10:30:03
Описание заманчивое,молодцы))))

Google

Marina
27.06.2017
10:33:22
Мы тоде в Краснодар ищем разработчиков Big Data,сейчас Hadoop внедряем. Но размахам по зп похвастаться не можем... Зато задачи реально интересные и команда разработчиков активно развивающаяся))))Кому интересно,пишите. В Краснодаре реально хорошо?

Andrew
27.06.2017
10:34:22

Konstantin
27.06.2017
10:34:43
Онлайн игры? )

Anton
27.06.2017
10:38:49

GNU/Patchouli
27.06.2017
10:44:12
Господа, есть ли смысл вообще переходить с юпитера на цеппелин?

Andrew
27.06.2017
10:44:56

Anton
27.06.2017
10:47:53

GNU/Patchouli
27.06.2017
10:52:14
ясненько

ag0n1k
27.06.2017
11:33:52
https://zeppelin.apache.org/docs/0.6.2/security/shiroauthentication.html#ldap

Marina
27.06.2017
14:49:07
Да,Информационные Технологии Магнит?

Nick
27.06.2017
15:15:49

Anton
27.06.2017
15:25:08
Да,Информационные Технологии Магнит?
:) ага, так и подумал. Ну что ж, можно найти несколько общих тем - хотя бы по технологиям. Напишу в личку тогда насчет совместного митапа - вдруг интересно будет.

Aleksander
27.06.2017
18:23:17
Майнеры лезут из всех щелей :)))
Что это за хайп такой ?:)

Grigory
27.06.2017
18:49:37
Отходил не сразу потер)
мамкины майнеры майнят и скупают карты

Aleksander
27.06.2017
19:23:48
Лучше пуская кодить учатся :)) Быстрее деньги майнятся :)

Google

Aleksander
01.07.2017
09:09:51
Ребятки:) а кто-нибудь пробовал вместо внедрения огромного стека технологий с хадупом и ко, внедрить аналитическую бд от Яндекса clickhouse ??

Daniel
01.07.2017
09:10:55
кликхаус далеко не для всех кейсов, скорее даже довольно узкий
лучше его доку на этот предмет поизучать

Aleksander
01.07.2017
09:12:57
Вот занимаюсь изучением. И похоже, что подходит под мой кейс, и есть даже драйвер для jdbc, что шикарно. Интересен опыт других, кто пробовал и чем это обернулось :)

Daniel
01.07.2017
09:17:06
У них есть официальный канал в телеграмме, если что

Aleksander
01.07.2017
09:18:06

Daniel
01.07.2017
09:18:49
ClickHouse не тормозит
Обсуждаем clickhouse.yandex
https://t.me/clickhouse_ru

Aleksander
01.07.2017
09:19:19
Спасибо !

Nick
01.07.2017
09:25:37
Клакхаус же как эластиксерч, для индексов. Как им можно заменить хадуп стек то

KrivdaTheTriewe
01.07.2017
09:50:52

Aleksander
01.07.2017
09:52:35
Имелось в виду для хранения данных:)
Туда все класть, а не по файликам раскидывать
Ну или замену HBase

Daniel
01.07.2017
09:54:50
Он не для транзакционной нагрузки. Аналитические аггрегаты его кейс. Джоины весьма ограничены.

Nick
01.07.2017
09:58:08
Кликхаус явно не предназначен для хранения кучи гавна)

Aleksander
01.07.2017
09:59:07

Daniel
01.07.2017
10:02:31

Nick
01.07.2017
10:03:04

Google

Daniel
01.07.2017
10:04:18
Философский вопрос, что считать говном.

Nick
01.07.2017
10:04:48
Лол

Daniel
01.07.2017
10:06:15
Я под говном понимаю данные без всякой ценности. Ты похоже про сырье говоришь.

Nick
01.07.2017
10:06:30
ну да

Daniel
01.07.2017
10:07:35
В этом плане само собой их нужно привести к нужному виду.

KrivdaTheTriewe
01.07.2017
10:17:47
Благодарен товарищу за ревью кликхауза
Плюсы:
1) Колоночная база => круто сжимает
2) Основной тип таблиц: MergeTable хранит данные по кускам, внутри каждого куска данные отсортированы по индексу, поэтому очень быстро отвечает на запросы с использованием индексом.
3) Фулскан тоже довольно быстрый, но жрет много ресурсов
4) Эффективная работа со словарями из других баз, позволяющая избежать join-ов больших таблиц на маленькие, а просто хранить маленькие таблицы в оперативке и кверить их как хэшмапу
Минусы:
1) Обязательная Date-колонка в таблице
2) Геморное с точки зрения постановки на поток создание распределенных таблиц
3) Нет поддержки Null-ов (пока)
4) Реализовать репликейшн фактор можно только с помощью докеров, сильно сложнее, чем у всяких Кассандр и Вертик

Daniel
01.07.2017
10:48:14
Про фактор репликации и докер что-то странное

Nick
01.07.2017
11:12:49
Лол
Как эт с докером то связано

KrivdaTheTriewe
01.07.2017
11:14:28
ну это мне рассказали , я с ним не работал

Nick
01.07.2017
11:19:50
Давай я тебе расскажу, что я работал со всем и самое крутое это хранить файлы в фтп

KrivdaTheTriewe
01.07.2017
11:21:23

Nick
01.07.2017
11:24:50
не, эт лишь тебе совет не слушать никого xD
ну либо слушать, но проверять
ну либо слушать и не проверять

KrivdaTheTriewe
01.07.2017
11:27:18
я не хочу , я видел что человек делал с этим кх

Andrey
01.07.2017
11:48:29

Nick
01.07.2017
16:51:47
вот что