
Сергей
06.08.2018
19:09:36
Добрый вечер. Коллеги, не подскажете ссылку на какой-нибудь толковый материал по kafka mirror maker? Апачевская дока и hortonовский Best practis не помогают, валится зараза.
Ещё есть такое нехорошее подозрение, поскольку в Scala не силен, что один mirror maker создаёт только один producer или я ошибаюсь?

Alexander
06.08.2018
19:25:53

Сергей
06.08.2018
19:27:16

Google

Alexander
06.08.2018
21:08:16
Благодарю
Там по Confluent как раз могут подсказать.

Andrey
07.08.2018
03:59:53
The incredible benefits of using infrastructure as code include being able to sleep at night—a pretty nice benefit indeed—knowing that you can redeploy to a given state safely. For your tools of choice, Nathan Malishev compares CloudFormation and Terraform. https://hackernoon.com/your-infrastructure-as-code-cloudformation-vs-terraform-34ec5fb5f044?mkt_tok=eyJpIjoiT0RneVkyRmpaamM0T1RNNCIsInQiOiJ2dmEzbEVcL0xLMmxkc1wvNlFLbmM5K0doK0pPTnRxN21DXC92WStPaWY1ZmxsaHRoaWhzUE5vdGRWbVJ2SHpZMzlkNTVYQzFnbnB5MUJFOGtxeWJTTnFtaURoV2hKbVNydXo3U280YjFjK280T3U4eWdZZ3BlUVk5ZXJ0WmZZeTNoXC8ifQ%3D%3D

Daniel
07.08.2018
08:50:27
Всем привет! Я так и не очухался, поэтому у нас сегодня новый ведущий и это... сюрприз-сюрприз... @krivdathetriewe! Трансляция будет доступна вот по этой ссылке https://moscowspark.github.io/

Dan
07.08.2018
09:43:11
https://www.scylladb.com/scylla-summit-2018/ кто едет?

Anna
07.08.2018
10:48:01
печалька
Ну почему же печалька) у нас хорошо на волгоградке.

Андрей
07.08.2018
11:09:01

Pavel
07.08.2018
11:10:07

KrivdaAllStars
07.08.2018
11:14:26

Андрей
07.08.2018
11:17:18

Akceptor
07.08.2018
11:48:59
кто имел дело с Cloudera Navigator? оно умеет метадату из HBase достать? Или только Hive?

KrivdaAllStars
07.08.2018
12:00:40
У нас появилась возможность добавить людей в списки, кто не попал, но хочет придти?

Ilia
07.08.2018
14:05:16
А расскажите как правильно использовать метастор. Вот создаю датафрейм, делаю df.write.saveAsTable('event'), всё отрабатывает, но как потом в новой спарк сессии получить эту таблицу? Я думал всё автоматически должно работать, может что делаю не так
spark-sql говорит нет такой таблицы

Google

Alexander
07.08.2018
14:31:35
У тебя warehouse.dir корректно подтягивается (причем в общем случае для Spark и Hive они отличаются)? Spark в логе ее пишет.

Ilia
07.08.2018
14:46:48

Ako
07.08.2018
15:01:15
Ребятки, помогите, у меня в hive не агрегируются данные. Дано: Тип операции (varchar), id операции (varchar). Надо посчитать кол-во операций по типам опер.
Select
Oper_type
,count(operation_id)
From table_name
Group by oper_type

Ilia
07.08.2018
15:03:03
Хотя хз может и так можно, не в курсе про такой синтаксис

Ako
07.08.2018
15:04:03
И так миллионы строк, т.е не схлопывает однотипные операции

E
07.08.2018
15:05:02
Почему не сделать
Select
Oper_type
,count(operation_id)
From table_name
Group by Oper_type ?

Ako
07.08.2018
15:06:26

E
07.08.2018
15:07:17
Если сделать Select
Oper_type
,count(*)
From table_name
Group by Oper_type
аггрегированный результат выдает?

Ako
07.08.2018
15:46:54
Нет, к сожалению
Выводит также множество однотипных строк, без агрегации

Ilia
07.08.2018
15:47:50
Выглядит так как будто данные такие и есть

Андрей
07.08.2018
15:48:10
А в каунтах чо?

Ilia
07.08.2018
15:48:24
select count(*) from table_name where oper_type=...

Ako
07.08.2018
15:52:18
В смысле такие и есть?

Anna
07.08.2018
16:02:35

Ako
07.08.2018
16:16:29
Все, всем спасибо. Проблема была в дате

_
07.08.2018
16:16:45

Google

KrivdaAllStars
07.08.2018
16:36:31
Трансляция запущена

Grigory
07.08.2018
16:36:45
https://moscowspark.github.io/

Ako
07.08.2018
16:52:36
А можешь рассказать?
У меня есть поле с датой, которое в формате timestamp. хочу все данные сагрегировать oper_type, month, count(oper_id). Как понял ошибка в этом
Если пишу так:
Last_day(to_date(finish_dttm)) as month_dt
То редактор выдает ошибку. Пишет, что month нет в таблице. Если без alias, то не группирует. Пока не придумал что делать

Alexander
07.08.2018
16:55:19
У тебя не группирует по alias от функции? Это корректно, alias можно использовать, например, при сортировке из-за логического порядка выполнения SQL Ну так подставь саму функцию в условие группировки. Или какой именно запрос не работает?

Ako
07.08.2018
16:59:53

_
07.08.2018
17:02:12

Ako
07.08.2018
17:03:44

Andrey
07.08.2018
17:19:05

_
07.08.2018
17:21:16

KrivdaAllStars
07.08.2018
20:47:23
Всем спасибо за митап

Nick
08.08.2018
04:28:11

Eduard
08.08.2018
06:24:01
А запись можно будет где-нибудь глянуть?

Pavel
08.08.2018
06:24:43

Eduard
08.08.2018
06:25:12

Sasha
08.08.2018
06:50:58
Привет.
Impala на Cloudera выдаёт Bad Health и такую ошибку:
Audit Pipeline Tes
Изначально сапорт подсказал посмотреть кодировки БД.
Оказалось что база для Cloudera Navigator была закодирована в latin1, поменяли на utf8mb4, но все та же самая проблема.
Кто-то сталкивался с подобным?

Sergioss
08.08.2018
14:54:28
ребята, есть кто с geomesa связан? точного вопроса нет по этому и вопрос не очень)

Grigory
08.08.2018
14:55:48
@Sergio_ss есть
пиши сюда
можешь писать также в их гиттер или в наше локейшн тех лобби; задавать вопросы можно также на локешнтех мейлинг листе

Andrei
08.08.2018
14:56:47
привет, а анонс конференции тут можно разместить?

Google

Grigory
08.08.2018
14:56:54
можно

Andrei
08.08.2018
14:57:06
Коллеги из Барселоны приглашают на https://www.dataengconf.com
Это 2-дневная конференция для технарей по data science, data-engineering и аналитике. Приглашены команды из Европы, США и Азии из таких компаний как Spotify, Uber, The New York Times, Datadog, Schibsted Media, Typeform, LINE, Criteo и т.д.
Для представителей комьюнити скидка 30% по коду “MinskDS”. Ссылка на покупку билетов:
https://www.eventbrite.com/e/dataengconf-bcn-18-tickets-47847605476?discount=MinskDS Море и солнце включены бесплатно!

Vova
08.08.2018
15:06:16
чот кроме Wes McKinney особо интересных нет...
я буду в Spain как раз в эти даты, так что спасибо - для меня актуально

Dan
08.08.2018
15:21:51
a на конфу Сциллы никто не собирается в ноябре?

Grigory
08.08.2018
15:22:22
это который в сф будет?

Dan
08.08.2018
15:22:37

Grigory
08.08.2018
15:22:46
ну я покрывал кассандра кейс; при одинаковых улсовиях сцилка просто падала
при том что ни касандру ни сциллу я особо не тюнил и не ковырял