
Daniel
28.05.2018
14:52:52
че т я сомневаюсь что сломал
может наоборот несколько других спас

Александр
28.05.2018
15:10:47
Ждём работы на upwork за 10$

Andrew
28.05.2018
16:30:56
Кто-нибудь сталкивался с тем, что на pyspark'овом стриминге при попытке использовать checkpoint вылетает 'builtin_in_function_or_method' object has no attribute '__code__' ? Как это можно обойти?

Google

Константин
28.05.2018
16:32:28
я даже не слышал, что такое pyspark, но всё же задам вопрос
Какой у вас python?

Dmitry
28.05.2018
16:32:56
биндинг же к спарку

Константин
28.05.2018
16:33:54
aok

Andrew
28.05.2018
16:35:40
Питон 3.5.2, спарк 1.6.0

Константин
28.05.2018
16:35:50
Странненько
Могу подсказать лишь по питону(по спарку не разбираюсь), что что-то пытается достать "исходный код" у встроенной функции
Если это и было для вас очевидно, тогда ладно)

Andrew
28.05.2018
16:42:42
Спасибо и на этом)

Alexander
28.05.2018
16:44:42
Andrew, do you try to use a non-serializable function in your transformations? It sounds like a serialization problem during checkpointing when PySpark tries to save the lineage graph.

Andrew
28.05.2018
17:00:58
Похоже на то, видимо иерархии классов на abc не сериализуются

Alexander
28.05.2018
17:07:07
Try to get rid of that fucntion or change it appropriately.

Polina
28.05.2018
18:06:44

Google

Eduard
28.05.2018
18:10:14

Polina
28.05.2018
18:14:33
А можно как-то по job history server отследить? Возможно, падает на каких-то определенных тачках, где конфиги отличаются
Надо глянуть где запускался Application Master в интерфейсе JobHistoryServer

Alexander
28.05.2018
18:33:28

Anton
29.05.2018
07:51:58
Привет! Ищу руководителя отдела систем хранения больших данных (DWH). Буду признателен за любой совет или рекомендацию!

Илья
29.05.2018
08:10:29

Sergey
29.05.2018
08:16:02
Я)
поздравляю с хорошим бюджетом ;) подскажите, в BDA уже стоит Enterprise Parquet? сильно лучше поднимает данные с ячеек?

Anton
29.05.2018
08:16:30

Sergey
29.05.2018
08:17:15
и ещё: как-то справляетесь с проблемой обработки больших объёмов датасетов с 255+ столбцов?

Andrey
29.05.2018
08:24:09


Юлия
29.05.2018
08:27:18
#job #вакансия #Америка #Штаты
#SeniorDataEngineer #Data Engineer
#удаленная работа в калифорнийской компании #полная занятость
#Россия #Москва #Санкт- Петербург
ЗП от 180 000 р. до плюс бесконечности. Английский язык нужен обязательно.
Компания является создателями мощной технологической платформы, обеспечивающей возможность vpn подключения, конфиденциальности и свободы для миллионов людей во всем мире. Писать мне в личку или на почту yuliykirillova@yandex.ru
Обязанности:
Создавайте масштабируемый и надежный конвейер данных в реальном времени на технологиях с открытым исходным кодом, который собирает, преобразует, загружает и обрабатывает данные из различных внутренних и внешних источников данных
Создайте масштабируемое распределенное хранилище данных
Создавайте инструменты, которые помогают бизнес-пользователям быстрее извлекать, анализировать и визуализировать данные, а также аналитикам данных для создания сложных запросов и выполнения расширенного анализа.
Оцените новые технологии и создайте прототипы для непрерывного совершенствования Data Engineering
Партнерство с инженерными командами для обеспечения контроля, регистрации и мониторинга
ТРЕБУЕМЫЙ ОПЫТ:
Широкий опыт использования технологий с открытым исходным кодом Big Data Spark, Kafka, Hadoop и Hive
Опыт построения и мониторинга почти в реальном масштабе времени масштабируемых ETL-процессов управления хранилищами данных
Опыт работы с инструментами обработки данных, такими как AirFlow, Azkaban или Oozie
5-летний опыт работы с Java, Scala и Python
Более 5 лет опыта работы с SQL (MySQL, PostgreSQL, Oracle и т. Д.)
Опыт работы с оболочкой
Отличные письменные и устные навыки общения
BS или MS в области компьютерных наук или соответствующей технической области
Опыт работы с Tableau, Apache Superset или Apache Zeppelin станет плюсом
Опыт работы с Docker, Kubernetes и Linux Advanced Administration станет плюсом
Опыт работы с командой, распределенной по часовым поясам, будет плюсом


Nick
29.05.2018
08:30:31
@krivdathetriewe


Vladislav
29.05.2018
08:39:00
#job #вакансия #Америка #Штаты
#SeniorDataEngineer #Data Engineer
#удаленная работа в калифорнийской компании #полная занятость
#Россия #Москва #Санкт- Петербург
ЗП от 180 000 р. до плюс бесконечности. Английский язык нужен обязательно.
Компания является создателями мощной технологической платформы, обеспечивающей возможность vpn подключения, конфиденциальности и свободы для миллионов людей во всем мире. Писать мне в личку или на почту yuliykirillova@yandex.ru
Обязанности:
Создавайте масштабируемый и надежный конвейер данных в реальном времени на технологиях с открытым исходным кодом, который собирает, преобразует, загружает и обрабатывает данные из различных внутренних и внешних источников данных
Создайте масштабируемое распределенное хранилище данных
Создавайте инструменты, которые помогают бизнес-пользователям быстрее извлекать, анализировать и визуализировать данные, а также аналитикам данных для создания сложных запросов и выполнения расширенного анализа.
Оцените новые технологии и создайте прототипы для непрерывного совершенствования Data Engineering
Партнерство с инженерными командами для обеспечения контроля, регистрации и мониторинга
ТРЕБУЕМЫЙ ОПЫТ:
Широкий опыт использования технологий с открытым исходным кодом Big Data Spark, Kafka, Hadoop и Hive
Опыт построения и мониторинга почти в реальном масштабе времени масштабируемых ETL-процессов управления хранилищами данных
Опыт работы с инструментами обработки данных, такими как AirFlow, Azkaban или Oozie
5-летний опыт работы с Java, Scala и Python
Более 5 лет опыта работы с SQL (MySQL, PostgreSQL, Oracle и т. Д.)
Опыт работы с оболочкой
Отличные письменные и устные навыки общения
BS или MS в области компьютерных наук или соответствующей технической области
Опыт работы с Tableau, Apache Superset или Apache Zeppelin станет плюсом
Опыт работы с Docker, Kubernetes и Linux Advanced Administration станет плюсом
Опыт работы с командой, распределенной по часовым поясам, будет плюсом
5 лет баз и 5 лет программирования с разговорным английским и за это 180к?
смешно


_
29.05.2018
08:39:37
от 180 написано же

Юлия
29.05.2018
08:40:05
смешно
А вы читать умеете ? Там от 180 000р и без ограничений, у меня сейчас 5 кандидатов к ним на очередь собеседования стоит с зп 300 000р

Vladislav
29.05.2018
08:40:50
я вижу "от", только с такими требованиями вилка должна начинаться от 240к минимум

Эшер
29.05.2018
08:40:51

Юлия
29.05.2018
08:41:40

Google

Юлия
29.05.2018
08:42:10

Oleksandr
29.05.2018
08:42:28
ух, "я одна, а вас много"

Mi
29.05.2018
08:44:29
Да рекуртёры всегда людей за товар принимали
это их работа
и это грустно

Artem
29.05.2018
08:44:53
они тоже товар

The mirror
29.05.2018
08:45:42
А по-моему все честно
Это же рынок, не нравится - не подавайся, какие проблемы вообще
Если хочешь помочь, то конструктивно укажи на неточности

Artem
29.05.2018
08:46:58
не можешь сам делать из людей товары - будь товаром )

Oleksandr
29.05.2018
08:47:24

The mirror
29.05.2018
08:47:43


Grigory
29.05.2018
08:49:08
#job #вакансия #Америка #Штаты
#SeniorDataEngineer #Data Engineer
#удаленная работа в калифорнийской компании #полная занятость
#Россия #Москва #Санкт- Петербург
ЗП от 180 000 р. до плюс бесконечности. Английский язык нужен обязательно.
Компания является создателями мощной технологической платформы, обеспечивающей возможность vpn подключения, конфиденциальности и свободы для миллионов людей во всем мире. Писать мне в личку или на почту yuliykirillova@yandex.ru
Обязанности:
Создавайте масштабируемый и надежный конвейер данных в реальном времени на технологиях с открытым исходным кодом, который собирает, преобразует, загружает и обрабатывает данные из различных внутренних и внешних источников данных
Создайте масштабируемое распределенное хранилище данных
Создавайте инструменты, которые помогают бизнес-пользователям быстрее извлекать, анализировать и визуализировать данные, а также аналитикам данных для создания сложных запросов и выполнения расширенного анализа.
Оцените новые технологии и создайте прототипы для непрерывного совершенствования Data Engineering
Партнерство с инженерными командами для обеспечения контроля, регистрации и мониторинга
ТРЕБУЕМЫЙ ОПЫТ:
Широкий опыт использования технологий с открытым исходным кодом Big Data Spark, Kafka, Hadoop и Hive
Опыт построения и мониторинга почти в реальном масштабе времени масштабируемых ETL-процессов управления хранилищами данных
Опыт работы с инструментами обработки данных, такими как AirFlow, Azkaban или Oozie
5-летний опыт работы с Java, Scala и Python
Более 5 лет опыта работы с SQL (MySQL, PostgreSQL, Oracle и т. Д.)
Опыт работы с оболочкой
Отличные письменные и устные навыки общения
BS или MS в области компьютерных наук или соответствующей технической области
Опыт работы с Tableau, Apache Superset или Apache Zeppelin станет плюсом
Опыт работы с Docker, Kubernetes и Linux Advanced Administration станет плюсом
Опыт работы с командой, распределенной по часовым поясам, будет плюсом
удаленная работа в москве или питере; это значит, что офис?


Nick
29.05.2018
08:50:47
в америке

Юлия
29.05.2018
08:50:53

Nick
29.05.2018
08:51:06
надеюсь речь не про южную америку?

Grigory
29.05.2018
08:51:13
)))
все ясно

Юлия
29.05.2018
08:51:55
надеюсь речь не про южную америку?
Знаете че...если вам просто поговорить хочется, это не ко мне... Читать надо внимательно! Калифорня есть в южной Америке, или у вас по географии в школе двойка? )))

Google

Daniel
29.05.2018
08:52:36
Собес уже что ль начался?

Grigory
29.05.2018
08:52:53
Ну да, в мексику собесы начинаются с поста вакансии

Oleksandr
29.05.2018
08:53:13
редко вижу настолько наглых хрюш

Евгений
29.05.2018
08:53:47

Vladislav
29.05.2018
08:53:49

Nick
29.05.2018
08:53:58
хехе
ну да, это же полуостров

Юлия
29.05.2018
08:55:00

Nick
29.05.2018
08:56:14
а еще самое забавное, но в мексике тоже штаты
выходит, вакансия про мексику

_
29.05.2018
08:56:46
и в Индии )

Vladislav
29.05.2018
08:57:36
Нижегородская область особенно мне понравилась

Эшер
29.05.2018
08:58:25

_
29.05.2018
08:59:24

Vladislav
29.05.2018
09:03:16
вообще, попахивает каким-то унылым кадровым агенством, которое набирает базу кандидатов ?

Oleksandr
29.05.2018
09:05:54
а ты думаешь, сколько из 624 ботов и вот таких хрюш?

Vladislav
29.05.2018
09:06:16
от 30 до 50%

Oleksandr
29.05.2018
09:06:26
та больше
я думаю, до 80%

Google

Vladislav
29.05.2018
09:06:41
не, много просто заходят в чаты и сидят
причем непонятно зачем
просто тупо тыкают на ссылки и джойнятся

Oleksandr
29.05.2018
09:07:05
чтобы базу кандидатов собирать :)

Евгений
29.05.2018
09:09:28

Vladislav
29.05.2018
09:11:13

Александр
29.05.2018
09:20:53

Юлия
29.05.2018
09:21:39
Мексика южная Америка))) точно двойка по георграфии)))

Александр
29.05.2018
09:22:26

Эшер
29.05.2018
09:23:08
мы все овцы на вселенском поле боя, хватит меряться толщиной шерсти

Александр
29.05.2018
09:23:15
Глобализация понизила уровень ХР конечно, когда Рязань начала хантить в Мск и Питер на работу, стало немножечко грустно.

Андрей
29.05.2018
09:24:56
Рязань - топчик, ну Питер тоже ничё в принципе