@hadoopusers

Страница 32 из 182
Артем
24.08.2017
15:05:46
Теория DWH вообще не сильно меняется, так что действительно ничего страшного.

Jury
24.08.2017
15:05:50
главный плюс - гораздо меньше боли при развитии... когда новые сущности появляются и требования к пользе от DWH

Dmitry
24.08.2017
15:06:10
Ну Тинькофф вовсе про даталейк пишет

Мол классика не нужна

Google
Jury
24.08.2017
15:06:22
значит правильно путаю

там она тоже есть, в их lake, зачем от нее отказываться ) субд и DW на их базе много где есть применение

Артем
24.08.2017
15:23:30
Обычно пишут, что data lake в довесок к DWH, а не вместо. Типа грузим данные как они есть в источниках, а потом on-read создаём структура.

Вот только сам гугл от которого пошла идея Map reduce и иже с ним всё равно к реляционным бд вернулся. Так что никуда DWH не денется в ближайшее время)

Vova
24.08.2017
16:39:05
коллеги, правильно ли я понимаю что даталейк это в переводе на русский - свалка?

ну с key-value базами в основном

Daniel
24.08.2017
16:42:43
datalake - это мечта реальность - databog даталейк не говорит о технической имплементации, только о концепции на чем будет сделано - up to you

Jury
24.08.2017
19:46:45
++

по мне data lake - храним и накапливаем все что можем в родном формате и в сыром виде... а далее то что надо - в DWH

если что и за прошлые периоды вытащим

KrivdaTheTriewe
25.08.2017
00:29:19
@optician_owl спасибо

silencer
25.08.2017
00:29:19
@optician_owl спасибо
@pomadchin @krivdaallstarts clean time

Grigory
25.08.2017
04:32:24
Бот тоже еще не идеален) обращение в начале фразы почти всегда ведёт к алерту

Google
Grigory
25.08.2017
04:32:36
Спасибо ребят)

Daniel
25.08.2017
04:46:09
you are welcome to make pullrequests))

или хотя б ишью

Andrey
25.08.2017
05:00:13
а дайте ссылку на бота

покидаю ишшу покрайней мере

Grigory
25.08.2017
05:01:31
https://github.com/optician в гитхаб профиле

Ну чтоб не спамить ссылкой прямой

Daniel
25.08.2017
05:06:34
Уменьшил границу с 10 до 3 первых сообщений, которые проверяет бот у незнакомых ему. Через час обновлю. У него теперь относительно устойчивая локация деплоя и сбрасывать базу не буду больше. Должно стать получше в перспективе. В выхи сделаю небольшой рефакторинг и опишу схему работы, чтобы желающим проще было доработки делать.

Daniel
25.08.2017
09:43:20
не понял вопрос, там стейт (монада), который сохраняется в базу

Nick
25.08.2017
09:53:28
обмазался котами)

KrivdaTheTriewe
25.08.2017
10:01:33
не понял вопрос, там стейт (монада), который сохраняется в базу
https://github.com/optician/Telegram-Silencer/blob/master/src/main/scala/me/optician_owl/silencer/model/UserStats.scala#L16

Daniel
25.08.2017
10:03:37
https://github.com/optician/Telegram-Silencer/blob/master/src/main/scala/me/optician_owl/silencer/model/UserStats.scala#L16
и до сих пор не пойму, ты предлагаешь его мутабельным сделать или что?

KrivdaTheTriewe
25.08.2017
10:07:56
и до сих пор не пойму, ты предлагаешь его мутабельным сделать или что?
вообще предлагаю, но это наверное, меня мысль о том, что аллокация на каждое новое сообщение происходит коробит

Daniel
25.08.2017
10:08:28
бот пока только в одном реальном чате находится, тут о перформансе думать вообще не надо)

Andrey
25.08.2017
12:18:57
это же чат про хадуп, по другому и быть не может

Daniel
25.08.2017
12:25:43
надо запилить кафка коннектор для телеграмма

Oleksandr
25.08.2017
12:41:01
а кто-то юзал https://phoenix.apache.org/salted.html ?

боту надо ещё учиться :)

Google
Daniel
25.08.2017
12:58:39
пиши чаще, научится)

KrivdaTheTriewe
25.08.2017
12:59:09
@optician_owl пишу чаще , а он всё равно!

Daniel
25.08.2017
13:00:02
сейчас же не ругнулся

Andrey
25.08.2017
13:03:03
@_@

и правда не ругнулся

:)

Daniel
25.08.2017
13:06:37
а это и не ссылка)

@tenKe

Andrey
25.08.2017
13:07:28
с утра он ругался

на вот это @_@

Daniel
25.08.2017
13:09:20
а точно, здесь я не выпиливал старый механизм, потому что не ясно пока как отличать людей от каналов

Andrey
25.08.2017
13:13:40
а телеграм не отдает тип?

он же в глобал поиске показывает, что @hadoopusers это канал)

Daniel
25.08.2017
13:25:15
у него есть поле в теле сообщений, где он указывает ссылки внешние и свои и это точно те ссылки, который будут отрисованы в клиенте как ссылки но вот для собственных там нет разделения, возможно в других полях или другим методом можно получить, я еще не разбирался

KrivdaTheTriewe
25.08.2017
13:26:16
а было такое у кого, что после включения ттл и снаппи по hbase таблице начиналось медленное очен читать первые записи из таблицы

мердж регионов может спасти?

Daniel
25.08.2017
13:40:59
приложи хотя бы фотографию серверов, нужен какой-то предмет связанный с больным, чтобы почуствовать его энергетику

Страница 32 из 182