@bigdata_ru

Страница 50 из 327
Sergey
03.03.2017
21:14:18
На сколько мне изаето, будет даны обезличенные данные для ML

Dan
03.03.2017
21:18:11
Нет, ну в целом выглядит интересно, безусловно. А можно ли будет просто придти, послушать спикеров, посмотреть за ходом старта хакатона, если не удастся собрать команду и сделать достойную презентацию?

кстати, в традиции хакатонов есть еще объявления о наборе в команды - будут ли тут?

Google
Maksim
06.03.2017
06:12:57
ребята , привет! вопрос возможно не по теме, но можете посоветовать книгу по Ubuntu для новичков.

Igor
06.03.2017
06:21:43
https://wiki.archlinux.org/index.php/Main_page_(Русский)

Constantine
06.03.2017
06:45:52
не слушай их

@mfedin вот https://linuxjourney.com

Maksim
06.03.2017
06:51:07
@mfedin вот https://linuxjourney.com
большое спасибо!

Dan
06.03.2017
18:46:48
Коллеги, собираем первичные данные, интересует ваше мнение.

Как часто вы используете ботов в телеграме? Пробовал пару раз пользоваться ботами, не моё. – 16 ??????? 25% Время от времени, но ежедневно. Раз в день. – 15 ??????? 23% Редко, пару раз в неделю. – 15 ??????? 23% Очень редко. Может пару раз в месяц. – 13 ?????? 20% Постоянно и активно! Управляю проектами/слушаю музыку/управляю серверами/ищу рецепты еды – 6 ??? 9% ? 65 people voted so far.

Тееем
07.03.2017
07:56:35
Работал ли кто то с Computer vision. А так же с библиотекой SimpleCV , OpenCV в Python.

Fyodor
07.03.2017
07:57:06
Кто-то работал.

Тееем
07.03.2017
07:58:11
в частности вы?

Fyodor
07.03.2017
07:59:00
Да

Google
Fyodor
07.03.2017
08:01:00
Dont ask to ask
ну вот, в нейронных сетях не удержались и спросили что надо ((

Wes
07.03.2017
17:50:46
Народ, что скажите по поводу специализации на курсере "Машинное обучение и анализ данных" от МФТИ?

これはスタスか…ロマンですか
07.03.2017
17:54:30
Andrew Ng's Machine Learning

pls pin this, people keep asking same thing

Anton
07.03.2017
20:09:13
Народ, что скажите по поводу специализации на курсере "Машинное обучение и анализ данных" от МФТИ?
прохожу потихоньку. интересно. Но желательно вспомнить теорвер, линейку и статистику что бы успешно проходить

qwe
08.03.2017
04:39:11
Добрый день! Пытаюсь в очередной раз понять бустинг над деревьями. Читаю материал с документации xgboost https://xgboost.readthedocs.io/en/latest/model.html. И мне непонятно как выводится функция для оптимизации. В частности непонятно, что делается в этом преобразовании? Кто-нибудь может помочь понять что тут происходит?



Wes
08.03.2017
06:00:04
прохожу потихоньку. интересно. Но желательно вспомнить теорвер, линейку и статистику что бы успешно проходить
А того объема, что в своих материалах они дают в части математики не достаточно?

Просто они позиционируют, что вроде как сильных начальных знаний не надо...

Anton
08.03.2017
06:59:42
Просто они позиционируют, что вроде как сильных начальных знаний не надо...
Ну я все догонял в процессе. доп учебниками. Они дают действительно полную информацию по тому направлению о котором рассказывают. Но иногда мне лично не хватало базы что бы правильно понять что к чему. Но при этом я все равно считаю что этот курс понятный и с интересными заданиями. И скажем так маст хев

Constantine
08.03.2017
09:16:09
https://t.me/addmeto/1108

Evgeniy
08.03.2017
10:27:01
@theaspect действительно печально

Artem
08.03.2017
10:30:47
А кто может объяснить, что печального в том, что Гугол под себя Кагол подминает?

Nikolay
08.03.2017
10:31:24
например, гугл может заставить компании платить им маржу с призовых денег

ну и сейчас компании будут знать, что они данные не просто на сайт загружают, а отдают их в руки гуглу, который с ними может сделать, что угодно

Artem
08.03.2017
10:33:16
Ну да, довольно логично.

Arkadiy
08.03.2017
14:54:21
Добрый день) Такая ситуация - есть несколько десятков гигабайт сырых данных (с совершенно произвольными байтами). Нужно их хранить и переодически делать по ним поиск с помощью регулярок.

Google
Arkadiy
08.03.2017
14:54:51
Возможно как-нибудь реализовать подобное?)

Constantine
08.03.2017
14:54:52
байтами?

Arkadiy
08.03.2017
14:55:02
да

0-255 по ascii

Constantine
08.03.2017
14:55:29
посмотри lucene

Проксимов
08.03.2017
14:55:38
Байты искать регулярками?

Paul
08.03.2017
14:55:57
он имеет в виду, что алфавит = ascii

Constantine
08.03.2017
14:56:11
даже текст искать регулярками – плохая идея

Paul
08.03.2017
14:56:21
Чта

Constantine
08.03.2017
14:56:29
для регулярок не построить индекс

Arkadiy
08.03.2017
14:56:29
Байты искать регулярками?
я согласен, идея не сама крутая

Проксимов
08.03.2017
14:56:40
А что тогда ими искать?

Paul
08.03.2017
14:56:42
Нормальная идея

Admin
ERROR: S client not available

Arkadiy
08.03.2017
14:56:44
на самом деле я смог это сделать, с помощью mysql и её движка mariadb

Constantine
08.03.2017
14:56:55
>несколько десятков гигабайт сырых данных

Arkadiy
08.03.2017
14:56:56
она умеет искать по raw колонкам регулярками

Constantine
08.03.2017
14:57:02
удачи

Arkadiy
08.03.2017
14:57:06
но на 10гб она потеет

Google
Paul
08.03.2017
14:57:12
Кладёшь файлы рядом, потом mmap в память

Constantine
08.03.2017
14:57:40
ну тогда хадупу прикрутить

если мощности процессорной много

может тебе не нужны регулярки

и поисковые запросы ограничены

Paul
08.03.2017
14:58:13
Если искать нужно реально по всем 10 гигам, то регулярки лучший выбор

эффективнее дка тут ничего не будет

Да и затык не в регулярках, а в IO

Arkadiy
08.03.2017
14:58:49
и регулярки тоже на некоторых байтах умирают на самом деле

Paul
08.03.2017
14:58:50
Тут спасёт только данные положить последовательно в блоках

Arkadiy
08.03.2017
14:58:57
мне пришлось даже replace делать

Paul
08.03.2017
14:59:15
Это проблемы какой-то реализации, регулярки тут причём?

Arkadiy
08.03.2017
14:59:15
короче костылей я там знатно навешал

Constantine
08.03.2017
14:59:15
а что конкретно делать пытаешься

Paul
08.03.2017
14:59:27
Насрать какой алфавит

Arkadiy
08.03.2017
15:00:04
хранить данные трафик сетевого уровня и выше и искать по содержимому пакетов

Paul
08.03.2017
15:00:22
А ищешь что?

Constantine
08.03.2017
15:00:28
вооооот

это уже интереснее

DPI поди

Страница 50 из 327