@bigdata_ru

Страница 126 из 327
Dan
22.08.2017
09:05:46
и да, предлагаю тему слияния чатов закрывать, это оффтоп

Vova
22.08.2017
09:12:31
в том числе для сбора огромного количества данных - это очень хорошее решение, т.к. позволяет отталкиваться именно от времени записи
проблема что большинство из них сырые и не то что бы в продакшене, в "примерке" вылезают косяки. А что вылезет потом... Я за жизнь понял - что нефункциональный продукт с комьюнити бывает важнее функционального но без. Да и к тому же оптимизация разная нужна. Кому то запись ускорить нужно, а вот мне TimeSeriesDB нужна для чтения. В итоге я остановился на надстройке над монго, под названием ArcticDB (гитхаб). Но это весьма специфическая бд (под мои нужды). Не для логов и не points in time.

Vova
22.08.2017
09:18:17
насчёт косяков... вот ярчайший пример https://jira.mongodb.org/browse/SERVER-14322

Google
Vova
22.08.2017
09:20:46
и это Монго - а баг 3 года висит. комьюнити огромное, среди KeyValue - точно . Я самолично на него напоролся. Что уж говорить, прото свежие БД или БД с меньшим количеством комьюнити - OpenTSDB, influx, или даже какой нить clickhouse.

Dan
22.08.2017
09:25:54
положим, clickhouse в разы интереснее выглядит, как минимум из-за шаговой доступности к разрабам ?

некоторые в контактлисте живут, так что удобно, да и идея у них крутанская

@fridabernghardt у нас вакансии запрещены :-/

Oleksandr
22.08.2017
09:45:29
положим, clickhouse в разы интереснее выглядит, как минимум из-за шаговой доступности к разрабам ?
их канал в ТГ — один из самый продуктивных, что я вижу вполне реально получить совет от разраба КХ за ~час

Oleksandr
22.08.2017
09:48:17
Dan
22.08.2017
22:22:16
Как же всё-таки прекрасно работать с действительно большим количеством данных, когда внезапно находятся настолько неочевидные, но крайне полезные и важные связи... Это я так, радость изливаю ?

Иван
22.08.2017
23:44:37
а подробнее этот пример можно, если не секрет?)

Kaspar
23.08.2017
04:29:23
И большие это сколько?

Vova
23.08.2017
04:54:37
И большие это сколько?
помом определение больших это "всё то что нельзя InMem 1 Instance". Понятно что граница постоянно отодвигается, т.к. инстансом в 100Гб RAM уже никого не удивишь. И даже 1ТБ RAM уже есть. Хотя заполнять этот Тб замучаешься...

Google
Aleksander
23.08.2017
09:30:03
А кто-нибудь использует Azure ML (тот, который с визуальным дизайнером и веб сервисами) в боевых задачах?

tonko
23.08.2017
09:31:34
+ к вопросу

выглядит наглядно

Dan
23.08.2017
11:14:33
Коллеги, прошу минуточку внимания, попросили порекомендовать одно бесплатное и интересное мероприятие.

Spark Ballet: открытый тренинг от EPAM 9 сентября в Петербурге ЕРАМ проведет открытый тренинг по Apache Spark для опытных Java-разработчиков, которые планируют работать или уже работают с Big Data. Алексей Зиновьев расскажет о том, какие компоненты Spark стоит использовать сразу, как настроить окружение и построить свой процесс ETL. Там же будет live coding, решение задач трансформации и анализа данных, работа с новейшей версией Spark и не только. Требования к участникам: базовые знания Linux, уверенные знания Java и SQL, плюсом будет опыт работы с Hadoop Регистрация уже открыта и обязательна: https://events.epam.com/events/spark-ballet

V
23.08.2017
11:23:03
Опять Петербург ;( В Москве будет подобное?

Dan
23.08.2017
11:34:18
А это кстати хорошая идея, провести большой митап по AI / ML в Москве

Я подумаю на эту тему

Anton
23.08.2017
11:35:54
а в регионах отличных от мск и питера такие мероприятия даже и не светят(

Холм
23.08.2017
11:36:37
а в регионах отличных от мск и питера такие мероприятия даже и не светят(
к сожалению и самим этим регионам ничего не светит...

Mikhail
23.08.2017
11:37:50
Все эти мероприятия на энтузиастах держутся

Tenni
23.08.2017
11:40:25
в регионах наберется худо-бедно человек 10 =) в бар разве что сходить

Mikhail
23.08.2017
11:41:05
и чо?

соберите 10

Tenni
23.08.2017
11:42:02
собирайте =) я лучше в питер сгоняю, если захочу

Dan
23.08.2017
11:42:14
а все почему-то думают что организаторы еще наживаются на таких вещах.

Kaspar
23.08.2017
11:42:16
сапсан же

Dan
23.08.2017
11:42:30
вот JUG может быть и наживается (сильно сомневаюсь) а остальные точно делают на чистом энтузиазме

Google
Tenni
23.08.2017
11:42:32
Dan
23.08.2017
11:43:03
все уже видели как вчера яндекс рассказал про свои достижения?

Tenni
23.08.2017
11:43:09
сапсан же
увы, я не из мск =) так бы конечно

но самолет недорого, было бы желание.

Tenni
23.08.2017
11:44:03
все уже видели как вчера яндекс рассказал про свои достижения?
поиск-то? клевый, надеюсь не как с погодой xD в регионах врет.

Anton
23.08.2017
11:44:24
Возьмите и сделайте
для начала нужно экспертизу хоть какую то иметь в этом вопросе, это я касательно о DS - а с этим есть некторые сложности

mrx
23.08.2017
11:44:36
все уже видели как вчера яндекс рассказал про свои достижения?
там 50 минут. я всё ждал человека, который стенографию проведёт

Mikhail
23.08.2017
11:45:43
Просто их собрать и делиться знаниями/идеями никто не запрещает

хоть в барчике за пивом

Tenni
23.08.2017
11:46:56
хоть в барчике за пивом
вот другое дело, а помещение искать, собирать доклады между 10 человеками как-то не совсем разумно =) если только в офисе каком-нибудь, то да, круто

помещение от 35 и выше нужно.

Mikhail
23.08.2017
11:47:26
а зачем сцена, помещение?

Вам шашечки или ехать?

я просто в офисе собирал всех

Tenni
23.08.2017
11:47:56
ну вот я удаленщик, где я соберу всех?

=)

Google
Anton
23.08.2017
11:48:00
Mikhail
23.08.2017
11:48:01
иногда давали большой зал в каком-нить универе

Ну вы только проблемы видите

Tenni
23.08.2017
11:48:32
я их не вижу, предвзятость с твоей стороны вижу =)

было бы желание =)

Mikhail
23.08.2017
11:49:05
Или я ивент менеджер хороший, или все это не так сложно. Всегда получалось пробить помещение, проектор и прочий стаф

Tenni
23.08.2017
11:49:17
прикинь, даже проектор есть =)

Mikhail
23.08.2017
11:49:41
Коворкинг пространства, или креативные площадки — первые кандидаты захостить такое мероприятие

Tenni
23.08.2017
11:49:53
антикафе

есть культурные залы и небольшие музеи

просто заморачиваться ради 10 человек это такое себе.

Mikhail
23.08.2017
11:51:41
я бы заморочился. вы друг друга замотивируете и будете поддерживать в дальнейшем. это бесценный профит

Tenni
23.08.2017
11:54:05
ну окей, попробуемс

если дойдет до реальных действий - напишу в чатик =)

Sergey
23.08.2017
12:10:44
Так скоро дата фест с трансляцией, не?

И пайдата

И в начале сентября митап Moscow data science

В сентябре много событий

Да и довольно часто в разных городах проводят мл тренировки

Google
Sergey
23.08.2017
12:11:41
Чём не митап)

yopp
23.08.2017
12:52:42
насчёт косяков... вот ярчайший пример https://jira.mongodb.org/browse/SERVER-14322
Ярчайший пример чего? Что люди тикеты не читают?

Вот кстати. Есть ли тут люди, которые хранят данные в монге и дальше используют их в ML пайплайнах?

Ну и в целом, поругайте монгу. Очень интересно послушать

Tenni
23.08.2017
13:03:20
хорошая db, чего ее ругать.

Страница 126 из 327