@hadoopusers

Страница 103 из 182
Daniel
28.05.2018
14:52:52
че т я сомневаюсь что сломал

может наоборот несколько других спас

Александр
28.05.2018
15:10:47
Ждём работы на upwork за 10$

Andrew
28.05.2018
16:30:56
Кто-нибудь сталкивался с тем, что на pyspark'овом стриминге при попытке использовать checkpoint вылетает 'builtin_in_function_or_method' object has no attribute '__code__' ? Как это можно обойти?

Google
Константин
28.05.2018
16:32:28
я даже не слышал, что такое pyspark, но всё же задам вопрос Какой у вас python?

Dmitry
28.05.2018
16:32:56
биндинг же к спарку

Andrew
28.05.2018
16:35:40
Питон 3.5.2, спарк 1.6.0

Константин
28.05.2018
16:35:50
Странненько

Могу подсказать лишь по питону(по спарку не разбираюсь), что что-то пытается достать "исходный код" у встроенной функции

Если это и было для вас очевидно, тогда ладно)

Andrew
28.05.2018
16:42:42
Спасибо и на этом)

Alexander
28.05.2018
16:44:42
Andrew, do you try to use a non-serializable function in your transformations? It sounds like a serialization problem during checkpointing when PySpark tries to save the lineage graph.

Andrew
28.05.2018
17:00:58
Похоже на то, видимо иерархии классов на abc не сериализуются

Alexander
28.05.2018
17:07:07
Try to get rid of that fucntion or change it appropriately.

Google
Eduard
28.05.2018
18:10:14
И джоба падает не каждый раз? То есть иногда на тех же файлах успешно отрабатывает?
За 2 месяца раза 2 падало по такой причине, в день их штук 20 по расписанию

Polina
28.05.2018
18:14:33
А можно как-то по job history server отследить? Возможно, падает на каких-то определенных тачках, где конфиги отличаются

Надо глянуть где запускался Application Master в интерфейсе JobHistoryServer

Alexander
28.05.2018
18:33:28
А можно как-то по job history server отследить? Возможно, падает на каких-то определенных тачках, где конфиги отличаются
Spark uses distributed cache of jars so it shouldn't be caused by local confs. Did you have any AWS nodes problems? Suggest that you use the cluster mode.

Anton
29.05.2018
07:51:58
Привет! Ищу руководителя отдела систем хранения больших данных (DWH). Буду признателен за любой совет или рекомендацию!

Sergey
29.05.2018
08:16:02
Я)
поздравляю с хорошим бюджетом ;) подскажите, в BDA уже стоит Enterprise Parquet? сильно лучше поднимает данные с ячеек?

Anton
29.05.2018
08:16:30
Sergey
29.05.2018
08:17:15
и ещё: как-то справляетесь с проблемой обработки больших объёмов датасетов с 255+ столбцов?

Andrey
29.05.2018
08:24:09
и ещё: как-то справляетесь с проблемой обработки больших объёмов датасетов с 255+ столбцов?
df.select(shuffle(df.columns).take(10)).map(col(_)))обычно справляется с этим как нельзя лучше

Юлия
29.05.2018
08:27:18
#job #вакансия #Америка #Штаты #SeniorDataEngineer #Data Engineer #удаленная работа в калифорнийской компании #полная занятость #Россия #Москва #Санкт- Петербург ЗП от 180 000 р. до плюс бесконечности. Английский язык нужен обязательно. Компания является создателями мощной технологической платформы, обеспечивающей возможность vpn подключения, конфиденциальности и свободы для миллионов людей во всем мире. Писать мне в личку или на почту yuliykirillova@yandex.ru Обязанности: Создавайте масштабируемый и надежный конвейер данных в реальном времени на технологиях с открытым исходным кодом, который собирает, преобразует, загружает и обрабатывает данные из различных внутренних и внешних источников данных Создайте масштабируемое распределенное хранилище данных Создавайте инструменты, которые помогают бизнес-пользователям быстрее извлекать, анализировать и визуализировать данные, а также аналитикам данных для создания сложных запросов и выполнения расширенного анализа. Оцените новые технологии и создайте прототипы для непрерывного совершенствования Data Engineering Партнерство с инженерными командами для обеспечения контроля, регистрации и мониторинга ТРЕБУЕМЫЙ ОПЫТ: Широкий опыт использования технологий с открытым исходным кодом Big Data Spark, Kafka, Hadoop и Hive Опыт построения и мониторинга почти в реальном масштабе времени масштабируемых ETL-процессов управления хранилищами данных Опыт работы с инструментами обработки данных, такими как AirFlow, Azkaban или Oozie 5-летний опыт работы с Java, Scala и Python Более 5 лет опыта работы с SQL (MySQL, PostgreSQL, Oracle и т. Д.) Опыт работы с оболочкой Отличные письменные и устные навыки общения BS или MS в области компьютерных наук или соответствующей технической области Опыт работы с Tableau, Apache Superset или Apache Zeppelin станет плюсом Опыт работы с Docker, Kubernetes и Linux Advanced Administration станет плюсом Опыт работы с командой, распределенной по часовым поясам, будет плюсом

Nick
29.05.2018
08:30:31
@krivdathetriewe

Vladislav
29.05.2018
08:39:00
#job #вакансия #Америка #Штаты #SeniorDataEngineer #Data Engineer #удаленная работа в калифорнийской компании #полная занятость #Россия #Москва #Санкт- Петербург ЗП от 180 000 р. до плюс бесконечности. Английский язык нужен обязательно. Компания является создателями мощной технологической платформы, обеспечивающей возможность vpn подключения, конфиденциальности и свободы для миллионов людей во всем мире. Писать мне в личку или на почту yuliykirillova@yandex.ru Обязанности: Создавайте масштабируемый и надежный конвейер данных в реальном времени на технологиях с открытым исходным кодом, который собирает, преобразует, загружает и обрабатывает данные из различных внутренних и внешних источников данных Создайте масштабируемое распределенное хранилище данных Создавайте инструменты, которые помогают бизнес-пользователям быстрее извлекать, анализировать и визуализировать данные, а также аналитикам данных для создания сложных запросов и выполнения расширенного анализа. Оцените новые технологии и создайте прототипы для непрерывного совершенствования Data Engineering Партнерство с инженерными командами для обеспечения контроля, регистрации и мониторинга ТРЕБУЕМЫЙ ОПЫТ: Широкий опыт использования технологий с открытым исходным кодом Big Data Spark, Kafka, Hadoop и Hive Опыт построения и мониторинга почти в реальном масштабе времени масштабируемых ETL-процессов управления хранилищами данных Опыт работы с инструментами обработки данных, такими как AirFlow, Azkaban или Oozie 5-летний опыт работы с Java, Scala и Python Более 5 лет опыта работы с SQL (MySQL, PostgreSQL, Oracle и т. Д.) Опыт работы с оболочкой Отличные письменные и устные навыки общения BS или MS в области компьютерных наук или соответствующей технической области Опыт работы с Tableau, Apache Superset или Apache Zeppelin станет плюсом Опыт работы с Docker, Kubernetes и Linux Advanced Administration станет плюсом Опыт работы с командой, распределенной по часовым поясам, будет плюсом
5 лет баз и 5 лет программирования с разговорным английским и за это 180к?

смешно

_
29.05.2018
08:39:37
от 180 написано же

Юлия
29.05.2018
08:40:05
смешно
А вы читать умеете ? Там от 180 000р и без ограничений, у меня сейчас 5 кандидатов к ним на очередь собеседования стоит с зп 300 000р

Vladislav
29.05.2018
08:40:50
я вижу "от", только с такими требованиями вилка должна начинаться от 240к минимум

Юлия
29.05.2018
08:41:40
я вижу "от", только с такими требованиями вилка должна начинаться от 240к минимум
Не знаю кто у вас кому должен, как заказчик сказал так и пишу. Понимания потока нет, что вам не понятно.

Google
Юлия
29.05.2018
08:42:10
если сейчас так рекрутёры с людьми общаются, то не нужно, спасибо
Отлично. Вам не нужно, а ко мне от сюда стучаться тем,ккому нужно. С ними и беседую

Oleksandr
29.05.2018
08:42:28
ух, "я одна, а вас много"

Mi
29.05.2018
08:44:29
Да рекуртёры всегда людей за товар принимали

это их работа

и это грустно

Artem
29.05.2018
08:44:53
они тоже товар

The mirror
29.05.2018
08:45:42
А по-моему все честно

Это же рынок, не нравится - не подавайся, какие проблемы вообще

Если хочешь помочь, то конструктивно укажи на неточности

Artem
29.05.2018
08:46:58
не можешь сам делать из людей товары - будь товаром )

Oleksandr
29.05.2018
08:47:24
The mirror
29.05.2018
08:47:43
"не быть мудаком" сойдет?
Как нельзя точнее)

Grigory
29.05.2018
08:49:08
#job #вакансия #Америка #Штаты #SeniorDataEngineer #Data Engineer #удаленная работа в калифорнийской компании #полная занятость #Россия #Москва #Санкт- Петербург ЗП от 180 000 р. до плюс бесконечности. Английский язык нужен обязательно. Компания является создателями мощной технологической платформы, обеспечивающей возможность vpn подключения, конфиденциальности и свободы для миллионов людей во всем мире. Писать мне в личку или на почту yuliykirillova@yandex.ru Обязанности: Создавайте масштабируемый и надежный конвейер данных в реальном времени на технологиях с открытым исходным кодом, который собирает, преобразует, загружает и обрабатывает данные из различных внутренних и внешних источников данных Создайте масштабируемое распределенное хранилище данных Создавайте инструменты, которые помогают бизнес-пользователям быстрее извлекать, анализировать и визуализировать данные, а также аналитикам данных для создания сложных запросов и выполнения расширенного анализа. Оцените новые технологии и создайте прототипы для непрерывного совершенствования Data Engineering Партнерство с инженерными командами для обеспечения контроля, регистрации и мониторинга ТРЕБУЕМЫЙ ОПЫТ: Широкий опыт использования технологий с открытым исходным кодом Big Data Spark, Kafka, Hadoop и Hive Опыт построения и мониторинга почти в реальном масштабе времени масштабируемых ETL-процессов управления хранилищами данных Опыт работы с инструментами обработки данных, такими как AirFlow, Azkaban или Oozie 5-летний опыт работы с Java, Scala и Python Более 5 лет опыта работы с SQL (MySQL, PostgreSQL, Oracle и т. Д.) Опыт работы с оболочкой Отличные письменные и устные навыки общения BS или MS в области компьютерных наук или соответствующей технической области Опыт работы с Tableau, Apache Superset или Apache Zeppelin станет плюсом Опыт работы с Docker, Kubernetes и Linux Advanced Administration станет плюсом Опыт работы с командой, распределенной по часовым поясам, будет плюсом
удаленная работа в москве или питере; это значит, что офис?

Nick
29.05.2018
08:50:47
в америке

Юлия
29.05.2018
08:50:53
удаленная работа в москве или питере; это значит, что офис?
Это хетеги всего лишь. Написано удаленно для Американской компании. Хештеги ставиятся для того что бы ищущие быстрей нашли в Москве или Питере, например. Там еще Россия написана,что же вы на это слово не реагируете)))

Nick
29.05.2018
08:51:06
надеюсь речь не про южную америку?

Grigory
29.05.2018
08:51:13
)))

все ясно

Юлия
29.05.2018
08:51:55
надеюсь речь не про южную америку?
Знаете че...если вам просто поговорить хочется, это не ко мне... Читать надо внимательно! Калифорня есть в южной Америке, или у вас по географии в школе двойка? )))

Google
Daniel
29.05.2018
08:52:36
Собес уже что ль начался?

Grigory
29.05.2018
08:52:53
Ну да, в мексику собесы начинаются с поста вакансии

Oleksandr
29.05.2018
08:53:13
редко вижу настолько наглых хрюш

Евгений
29.05.2018
08:53:47
редко вижу настолько наглых хрюш
Смотри, пока не убежала!

Vladislav
29.05.2018
08:53:49
Знаете че...если вам просто поговорить хочется, это не ко мне... Читать надо внимательно! Калифорня есть в южной Америке, или у вас по географии в школе двойка? )))
Калифорния есть в Мексике, точнее наоборот. И хотя Мексика не относится к Южной Америке, многие её таковой считают

Nick
29.05.2018
08:53:58
хехе

ну да, это же полуостров

Юлия
29.05.2018
08:55:00
Nick
29.05.2018
08:56:14
а еще самое забавное, но в мексике тоже штаты

выходит, вакансия про мексику

_
29.05.2018
08:56:46
и в Индии )

Vladislav
29.05.2018
08:57:36


Нижегородская область особенно мне понравилась

Эшер
29.05.2018
08:58:25
_
29.05.2018
08:59:24
Vladislav
29.05.2018
09:03:16
вообще, попахивает каким-то унылым кадровым агенством, которое набирает базу кандидатов ?

Oleksandr
29.05.2018
09:05:54
а ты думаешь, сколько из 624 ботов и вот таких хрюш?

Vladislav
29.05.2018
09:06:16
от 30 до 50%

Oleksandr
29.05.2018
09:06:26
та больше

я думаю, до 80%

Google
Vladislav
29.05.2018
09:06:41
не, много просто заходят в чаты и сидят

причем непонятно зачем

просто тупо тыкают на ссылки и джойнятся

Oleksandr
29.05.2018
09:07:05
чтобы базу кандидатов собирать :)

Евгений
29.05.2018
09:09:28
причем непонятно зачем
чтоб было где вопрос по теме задать

Vladislav
29.05.2018
09:11:13
чтоб было где вопрос по теме задать
Неее, я видел как заходят в чаты с темами, которые людям просто не интересны

Александр
29.05.2018
09:20:53
Знаете че...если вам просто поговорить хочется, это не ко мне... Читать надо внимательно! Калифорня есть в южной Америке, или у вас по географии в школе двойка? )))
Вы очень умная женщина, как я погляжу. Обидно что это суровый мир заставляет вас такую умную с хорошими оценками по-географии писать нам в чатах а ведь могли бы код писать.

Александр
29.05.2018
09:22:26
могла бы )) я физ тех,если что ))
А я нет, но хантят все равно меня.

Эшер
29.05.2018
09:23:08
мы все овцы на вселенском поле боя, хватит меряться толщиной шерсти

Александр
29.05.2018
09:23:15
Глобализация понизила уровень ХР конечно, когда Рязань начала хантить в Мск и Питер на работу, стало немножечко грустно.

Андрей
29.05.2018
09:24:56
Рязань - топчик, ну Питер тоже ничё в принципе

Страница 103 из 182