
Andrey
16.06.2017
10:35:50
я бы на вашем месте заменил юпитер на цепелин

GNU/Patchouli
16.06.2017
10:37:13

Andrey
16.06.2017
10:37:22
ясно

Grigory
16.06.2017
11:12:11

Google

Grigory
16.06.2017
11:18:53
в чем беда джупитера?) я просто не занимаюсь питоном (обычно), интересно

Andrey
16.06.2017
11:42:30
у меня он плохо дружился со спарком

Andrew
16.06.2017
11:42:53
полгода полет нормальный

Andrey
16.06.2017
11:42:58
вылезала куча всяких мелких надоедливых ошибок - с переменными окружения, с доступами и т д
цеппелин тоже не подарок, но в целом показался мне более стабильно работающим
+ поддерживает скалу

Pavel
16.06.2017
11:44:19
Учитывая, что pyspark - это питонячий процесс, который через py4j в jvm ходит. То куча ошибок с правами доступа - это забавно

Andrey
16.06.2017
11:45:08
я уже точно не помню :)

Grigory
16.06.2017
11:54:58
Мы наоборот ушли от зепелина :д

Andrew
16.06.2017
11:55:52
Toree
и как, норм работает?

Grigory
16.06.2017
11:56:09
да мы в итоге питоно биндинги сделали из скалы
):

Google

Grigory
16.06.2017
11:56:23
Ахахаха

Andrew
16.06.2017
11:57:21
у меня с этим Toree прикол был, он упорно не хотел видеть apply из объекта-компаньена

Grigory
16.06.2017
11:57:37
Но вот тот ноутбук, который я на последнем митапе открывал, он на тори
Хз все ок и даже макросы)

Andrew
16.06.2017
11:58:37
интересно, что же я не так сделал)

KrivdaTheTriewe
16.06.2017
12:59:41
https://habrahabr.ru/post/330986/
https://databricks.com/blog/2017/06/06/simple-super-fast-streaming-engine-apache-spark.html
https://medium.com/netflix-techblog/evolving-the-netflix-data-platform-with-genie-3-598021604dda

Ann
19.06.2017
13:25:08
Всем привет!
Ищу Lead Data Science engineer в крупную авиакомпанию. Задачи как связанные с руководством командой, так и по разработке. Проектов много, например, по телеметрии данных с датчиков самолетов и прогнозированию поломок, проект по оптимизации складских запасов.
Стэк: Hadoop, Hive, Impala, Spark, Python (NumPy, Pandas, Scikit-learn)
Работа в офисе Москвы, полный рабочий день, белая ЗП до 300 т.р.
Подробности: https://hh.ru/vacancy/20612529 или в личных сообщениях, присылайте резюме!
#вакансия #офис #работа


KrivdaTheTriewe
19.06.2017
13:54:50
Всем привет!
В международное Рекламное Агентство требуется
Java Developer
Ключевые обязанности:
Внедрение, доработка и поддержка работоспособности маркетинговой платформы, включающей компоненты по управлению данными (Hadoop, Spark, Kafka и т.п.), компонент оптимизации и размещением рекламы и компонент сбора и разработки статистики;
Участие в разработке архитектуры продуктов;
Формирование и контроль исполнения технических требований к продуктам;
Участие в приемке результатов разработки внешних подрядчиков.
Обязательные требования:
Опыт работы 2-3 года;
Java SE 1.6-1.8 (collections, reflection, concurrent и т.п.);
Понимание того, как работает JVM (устройство памяти в JVM, принципы работы GC)
Умение работать с различными форматами данных (XML/JSON/YAML и т.п.);
Навыки работы с различными протоколами обмены данных (HTTP/SFTP/FTP и т.д.);
Опыт работы с VCS (Git/SVN) и трекинговыми системами (Jira/Redmine);
Опыт работы с Hadoop (MapReduce/HDFS/HBase).
Желательные требования:
Опыт работы со Spark и Kafka;
Опыт разработки на Python;
Опыт работы в сфере Digital или TV рекламы;
Английский не ниже Pre-Intermediate.
Условия:
- Полная занятость.
- Плюшки, печеньки и чай.
- Зарплатная вилка 150к-200к, готовы обсуждать с успешным кандидатом. Всё зависит от ваших умений.
- Тёплый и уютный офис в центре Москвы
Контакты: js@sm-hr.ru
Сделал канал куда будут размещаться все bigdata related вакансии , +репост с других групп/каналов.
@bigdatajobs
Команда Rambler объявляет старт приёма заявок на доклады на следующий Apache Spark meetup:
"Как мы и обещали на первой встрече, наш уютный митапчик становится регулярным. И мы начинаем принимать заявки на доклады! Если у вас есть что-то, о чем вы хотите рассказать нашему сообществу, то присылайте тему и короткую аннотацию мне ответным письмом. До части из вас я постараюсь достучаться адресно и попросить сделать доклад )
Планируемая дата следующей встречи – середина июля!"
Тем кому интересно что-то рассказать, следует писать на адрес p.klemenkov@rambler-co.ru


Aleksander
19.06.2017
15:09:33
А послушать можно всем желающим ?

KrivdaTheTriewe
19.06.2017
15:10:42

Aleksander
19.06.2017
15:11:04
А ссылки на регу ещё нет ?
:)

KrivdaTheTriewe
19.06.2017
15:14:23

Aleksander
19.06.2017
15:14:50
Принято

Pavel
19.06.2017
16:36:21
Регистрация будет открыта всем желающим. Ссылку на регистрацию анонсируем как только соберем доклады)

Grigory
19.06.2017
16:51:01

Google

KrivdaTheTriewe
19.06.2017
16:53:56

Grigory
19.06.2017
16:55:52
в слаке сообщество / чатик / хз как праивльно это говорить в отношении слака
я как-то регистрировался путем нахождения ссылки на регистрацию где-то в интернетах; а сейчас видать форма только, ссылку найти на прямую регистрацию не могу

KrivdaTheTriewe
19.06.2017
19:35:14

Val
20.06.2017
06:58:50
Гайз, открыта интересная позиция в СПБ. Ведущий разработчик JAVA||SCALA (hadoop, hdfs, spark) в направлении Advanced analytics и Machine learning. Главное очень профессиональная JAVA, по машинному и биг дате компания готова подтягивать на месте. По з/п нет ограничений, с 360 т.р смотрели и выше.
http://telegra.ph/Vedushchij-razrabotchik-JAVASCALA-SPB-ofis-m-CHyornaya-rechka-do-350-tr-06-20

Nick
20.06.2017
07:31:58
Ниху себе

Grigory
20.06.2017
07:39:19
Ниху себе
Ник сразу решил бросил натив и пошел писать ентерпруйз джаву с елементами скалы

Nick
20.06.2017
07:45:50
@optician_owl дароу, я думал ты тут уже есть

Daniel
20.06.2017
07:47:07
да этих чатов по хадупу...
и польза везде под вопросом
пока в слаке самое полезное

Grigory
20.06.2017
07:47:40
хз в слаке тож сомнительный опендата сайнс

Nick
20.06.2017
07:47:49
@optician_owl тут илита прост

Grigory
20.06.2017
07:48:04
ну у нас тут есть ник да сразу илитарность топ левел

Nikolai
20.06.2017
08:42:10
А кто-то тут работал с графаной?

Inna
20.06.2017
08:43:22
#Москва #Вакансия #Hadoop
Всем привет!
У меня есть несколько вакансий в крупном интеграторе на проект Big Data в банке, стек Hadoop/Java/Scala.
Основныеные требования:
Знание технологического стека Hadoop и опыт работы с ним (Sqoop/Flume/Kafka/Strom, etc), знание Java/Scala.
Условия:
- Полная занятость.
- Зарплата белая, возможно обсуждать до 170 000руб.
- Офис в шаговой доступности от метро
- Соц. пакет
По всем вопросам в личку)

Nick
20.06.2017
08:57:22

Inna
20.06.2017
08:58:39

Nick
20.06.2017
08:58:54

Google

Nikolai
20.06.2017
09:01:05
У меня датасорс - еластик. Данные типа {время:время, значение:значение}.
Можно ли как-то на уровне графаны поиграться со значением? Например если значение это стринг, матчить его реджексом например.
@gurinderu

Inna
20.06.2017
09:02:02
вот
Как есть, что ж уж поделаешь...

ag0n1k
20.06.2017
17:08:05
Всем привет! А тут разбирались авторизационные моменты?

KrivdaTheTriewe
20.06.2017
17:09:09

ag0n1k
20.06.2017
17:12:02
Ну мы сейчас пробуем ldapGroupMapping на hdfs(пока все хорошо), а вот дальше : kafka acls, hbase acls, impala... С группами будет почти нереально как мне видится, а вот с пользователями AD должно сработать.
Также вопрос: kerberos кто включал на 40+ нодах?

Dmitry
21.06.2017
10:03:17
а кто-то пишет со спарка в редшифт?

Евгений
21.06.2017
18:39:52

GNU/Patchouli
22.06.2017
07:42:34
Господа, тут кто-нибудь занимался автоматизацией процесса repair для кассандры?

Nick
22.06.2017
07:44:24
Какие у тебя интересные задачи