@hadoopusers

Страница 127 из 182
Сергей
06.08.2018
19:09:36
Добрый вечер. Коллеги, не подскажете ссылку на какой-нибудь толковый материал по kafka mirror maker? Апачевская дока и hortonовский Best practis не помогают, валится зараза.

Ещё есть такое нехорошее подозрение, поскольку в Scala не силен, что один mirror maker создаёт только один producer или я ошибаюсь?

Сергей
06.08.2018
19:27:16
https://t.me/proKafka
Благодарю

Google
Alexander
06.08.2018
21:08:16
Благодарю
Там по Confluent как раз могут подсказать.

Andrey
07.08.2018
03:59:53
The incredible benefits of using infrastructure as code include being able to sleep at night—a pretty nice benefit indeed—knowing that you can redeploy to a given state safely. For your tools of choice, Nathan Malishev compares CloudFormation and Terraform. https://hackernoon.com/your-infrastructure-as-code-cloudformation-vs-terraform-34ec5fb5f044?mkt_tok=eyJpIjoiT0RneVkyRmpaamM0T1RNNCIsInQiOiJ2dmEzbEVcL0xLMmxkc1wvNlFLbmM5K0doK0pPTnRxN21DXC92WStPaWY1ZmxsaHRoaWhzUE5vdGRWbVJ2SHpZMzlkNTVYQzFnbnB5MUJFOGtxeWJTTnFtaURoV2hKbVNydXo3U280YjFjK280T3U4eWdZZ3BlUVk5ZXJ0WmZZeTNoXC8ifQ%3D%3D

Daniel
07.08.2018
08:50:27
Всем привет! Я так и не очухался, поэтому у нас сегодня новый ведущий и это... сюрприз-сюрприз... @krivdathetriewe! Трансляция будет доступна вот по этой ссылке https://moscowspark.github.io/

Dan
07.08.2018
09:43:11
https://www.scylladb.com/scylla-summit-2018/ кто едет?

Anna
07.08.2018
10:48:01
печалька
Ну почему же печалька) у нас хорошо на волгоградке.

Андрей
07.08.2018
11:09:01
Pavel
07.08.2018
11:10:07
Часть офиса уехала на Добрынинскую, но ИТ остались на Волгоградском проспекте.
Как обычно, айтишники в самом стремном офисе а самой жопе)

KrivdaAllStars
07.08.2018
11:14:26
Как обычно, айтишники в самом стремном офисе а самой жопе)
Оч круто было, что к нам в ibm бизнесс заходить на этаж не мог, а мы к бизнесу могли

Akceptor
07.08.2018
11:48:59
кто имел дело с Cloudera Navigator? оно умеет метадату из HBase достать? Или только Hive?

KrivdaAllStars
07.08.2018
12:00:40
У нас появилась возможность добавить людей в списки, кто не попал, но хочет придти?

Ilia
07.08.2018
14:05:16
А расскажите как правильно использовать метастор. Вот создаю датафрейм, делаю df.write.saveAsTable('event'), всё отрабатывает, но как потом в новой спарк сессии получить эту таблицу? Я думал всё автоматически должно работать, может что делаю не так

spark-sql говорит нет такой таблицы

Google
Alexander
07.08.2018
14:31:35
У тебя warehouse.dir корректно подтягивается (причем в общем случае для Spark и Hive они отличаются)? Spark в логе ее пишет.

Ilia
07.08.2018
14:46:48
У тебя warehouse.dir корректно подтягивается (причем в общем случае для Spark и Hive они отличаются)? Spark в логе ее пишет.
Вот да, уже добрался до того что надо warehouse.dir задать, полный путь конфига spark.sql.warehouse.dir ведь? Вообще, делаю так: запускаю pyspark --conf spark.sql.warehouse.dir='/tmp/spark_warehouse', потом делаю spark.read.parquet('...').write.saveAsTable('foo') и получаю ошибку типа java.io.FileNotFoundException: File file:/user/hive/warehouse/foo/_temporary/0 does not exist

Ako
07.08.2018
15:01:15
Ребятки, помогите, у меня в hive не агрегируются данные. Дано: Тип операции (varchar), id операции (varchar). Надо посчитать кол-во операций по типам опер. Select Oper_type ,count(operation_id) From table_name Group by oper_type

Ako
07.08.2018
15:04:03
group by oper_type не работает разве?
Да так и написал, тут сократил просто. Дело в том, что он выводит без агрегации Типа: перевод // 1 и т.д

И так миллионы строк, т.е не схлопывает однотипные операции

E
07.08.2018
15:05:02
Почему не сделать Select Oper_type ,count(operation_id) From table_name Group by Oper_type ?

Ako
07.08.2018
15:06:26
E
07.08.2018
15:07:17
Если сделать Select Oper_type ,count(*) From table_name Group by Oper_type аггрегированный результат выдает?

Ako
07.08.2018
15:46:54
Нет, к сожалению

Выводит также множество однотипных строк, без агрегации

Ilia
07.08.2018
15:47:50
Выглядит так как будто данные такие и есть

Андрей
07.08.2018
15:48:10
А в каунтах чо?

Ilia
07.08.2018
15:48:24
select count(*) from table_name where oper_type=...

Ako
07.08.2018
15:52:18


В смысле такие и есть?

Anna
07.08.2018
16:02:35
Как обычно, айтишники в самом стремном офисе а самой жопе)
Внутри у нас отличный офис, с ремонтом и всем необходимым на территории, включая бесплатную парковку, магазин с собственной продукцией, химчистка, аптека, кабинет врача, кафе, столовая

Ako
07.08.2018
16:16:29
Все, всем спасибо. Проблема была в дате

_
07.08.2018
16:16:45
Google
KrivdaAllStars
07.08.2018
16:36:31
Трансляция запущена

Grigory
07.08.2018
16:36:45
https://moscowspark.github.io/

Ako
07.08.2018
16:52:36
А можешь рассказать?
У меня есть поле с датой, которое в формате timestamp. хочу все данные сагрегировать oper_type, month, count(oper_id). Как понял ошибка в этом Если пишу так: Last_day(to_date(finish_dttm)) as month_dt То редактор выдает ошибку. Пишет, что month нет в таблице. Если без alias, то не группирует. Пока не придумал что делать

Alexander
07.08.2018
16:55:19
У тебя не группирует по alias от функции? Это корректно, alias можно использовать, например, при сортировке из-за логического порядка выполнения SQL Ну так подставь саму функцию в условие группировки. Или какой именно запрос не работает?

Ako
07.08.2018
17:03:44
Или обернуть в еще один select, который будет группировать
Да, тоже так думал. Но предложенный Александром вариант более рациональный.

Andrey
07.08.2018
17:19:05


_
07.08.2018
17:21:16
Да, тоже так думал. Но предложенный Александром вариант более рациональный.
А в чем рациональность, план такой же будет, только запрос понятнее

KrivdaAllStars
07.08.2018
20:47:23
Всем спасибо за митап

Nick
08.08.2018
04:28:11
Eduard
08.08.2018
06:24:01
А запись можно будет где-нибудь глянуть?

Pavel
08.08.2018
06:24:43
А запись можно будет где-нибудь глянуть?
Да, выложим все на этой неделе

Sasha
08.08.2018
06:50:58
Привет. Impala на Cloudera выдаёт Bad Health и такую ошибку: Audit Pipeline Tes Изначально сапорт подсказал посмотреть кодировки БД. Оказалось что база для Cloudera Navigator была закодирована в latin1, поменяли на utf8mb4, но все та же самая проблема. Кто-то сталкивался с подобным?

Sergioss
08.08.2018
14:54:28
ребята, есть кто с geomesa связан? точного вопроса нет по этому и вопрос не очень)

Grigory
08.08.2018
14:55:48
@Sergio_ss есть

пиши сюда

можешь писать также в их гиттер или в наше локейшн тех лобби; задавать вопросы можно также на локешнтех мейлинг листе

Andrei
08.08.2018
14:56:47
привет, а анонс конференции тут можно разместить?

Google
Grigory
08.08.2018
14:56:54
можно

Andrei
08.08.2018
14:57:06
Коллеги из Барселоны приглашают на https://www.dataengconf.com  Это 2-дневная конференция для технарей по data science, data-engineering и аналитике. Приглашены команды из Европы, США и Азии из таких компаний как Spotify, Uber, The New York Times, Datadog, Schibsted Media, Typeform, LINE, Criteo и т.д. Для представителей комьюнити скидка 30% по коду “MinskDS”. Ссылка на покупку билетов: https://www.eventbrite.com/e/dataengconf-bcn-18-tickets-47847605476?discount=MinskDS Море и солнце включены бесплатно!

Vova
08.08.2018
15:06:16
чот кроме Wes McKinney особо интересных нет... я буду в Spain как раз в эти даты, так что спасибо - для меня актуально

Dan
08.08.2018
15:21:51
a на конфу Сциллы никто не собирается в ноябре?

Grigory
08.08.2018
15:22:22
a на конфу Сциллы никто не собирается в ноябре?
я очень конечно в ней разочарован был в свое время

это который в сф будет?

Grigory
08.08.2018
15:22:46
когда это было и почему?
год наверн назад; медленная

ну я покрывал кассандра кейс; при одинаковых улсовиях сцилка просто падала

при том что ни касандру ни сциллу я особо не тюнил и не ковырял

Страница 127 из 182