
Sergey
03.03.2017
21:14:18
На сколько мне изаето, будет даны обезличенные данные для ML

Dan
03.03.2017
21:18:11
Нет, ну в целом выглядит интересно, безусловно. А можно ли будет просто придти, послушать спикеров, посмотреть за ходом старта хакатона, если не удастся собрать команду и сделать достойную презентацию?
кстати, в традиции хакатонов есть еще объявления о наборе в команды - будут ли тут?

Google

Maksim
06.03.2017
06:12:57
ребята , привет! вопрос возможно не по теме, но можете посоветовать книгу по Ubuntu для новичков.

Igor
06.03.2017
06:21:43
https://wiki.archlinux.org/index.php/Main_page_(Русский)

Paul
06.03.2017
06:35:06

Constantine
06.03.2017
06:45:52
не слушай их
@mfedin вот https://linuxjourney.com

Maksim
06.03.2017
06:51:07

Andrey
06.03.2017
07:07:09

Dan
06.03.2017
18:46:48
Коллеги, собираем первичные данные, интересует ваше мнение.
Как часто вы используете ботов в телеграме?
Пробовал пару раз пользоваться ботами, не моё. – 16
??????? 25%
Время от времени, но ежедневно. Раз в день. – 15
??????? 23%
Редко, пару раз в неделю. – 15
??????? 23%
Очень редко. Может пару раз в месяц. – 13
?????? 20%
Постоянно и активно! Управляю проектами/слушаю музыку/управляю серверами/ищу рецепты еды – 6
??? 9%
? 65 people voted so far.

Тееем
07.03.2017
07:56:35
Работал ли кто то с Computer vision. А так же с библиотекой SimpleCV , OpenCV в Python.

Fyodor
07.03.2017
07:57:06
Кто-то работал.

Тееем
07.03.2017
07:58:11
в частности вы?

Fyodor
07.03.2017
07:59:00
Да

Google

/dev
07.03.2017
07:59:10

Fyodor
07.03.2017
08:01:00
Dont ask to ask
ну вот, в нейронных сетях не удержались и спросили что надо ((

Wes
07.03.2017
17:50:46
Народ, что скажите по поводу специализации на курсере "Машинное обучение и анализ данных" от МФТИ?

これはスタスか…ロマンですか
07.03.2017
17:54:30
Andrew Ng's Machine Learning
pls pin this, people keep asking same thing

Anton
07.03.2017
20:09:13

qwe
08.03.2017
04:39:11
Добрый день! Пытаюсь в очередной раз понять бустинг над деревьями. Читаю материал с документации xgboost https://xgboost.readthedocs.io/en/latest/model.html. И мне непонятно как выводится функция для оптимизации. В частности непонятно, что делается в этом преобразовании?
Кто-нибудь может помочь понять что тут происходит?

Wes
08.03.2017
06:00:04
Просто они позиционируют, что вроде как сильных начальных знаний не надо...

Anton
08.03.2017
06:59:42
Просто они позиционируют, что вроде как сильных начальных знаний не надо...
Ну я все догонял в процессе. доп учебниками. Они дают действительно полную информацию по тому направлению о котором рассказывают. Но иногда мне лично не хватало базы что бы правильно понять что к чему. Но при этом я все равно считаю что этот курс понятный и с интересными заданиями. И скажем так маст хев

Constantine
08.03.2017
09:16:09
https://t.me/addmeto/1108

これはスタスか…ロマンですか
08.03.2017
09:16:50

Evgeniy
08.03.2017
10:27:01
@theaspect действительно печально

Artem
08.03.2017
10:30:47
А кто может объяснить, что печального в том, что Гугол под себя Кагол подминает?

Nikolay
08.03.2017
10:31:24
например, гугл может заставить компании платить им маржу с призовых денег
ну и сейчас компании будут знать, что они данные не просто на сайт загружают, а отдают их в руки гуглу, который с ними может сделать, что угодно

Artem
08.03.2017
10:33:16
Ну да, довольно логично.

Arkadiy
08.03.2017
14:54:21
Добрый день) Такая ситуация - есть несколько десятков гигабайт сырых данных (с совершенно произвольными байтами). Нужно их хранить и переодически делать по ним поиск с помощью регулярок.

Google

Arkadiy
08.03.2017
14:54:51
Возможно как-нибудь реализовать подобное?)

Constantine
08.03.2017
14:54:52
байтами?

Arkadiy
08.03.2017
14:55:02
да
0-255 по ascii

Constantine
08.03.2017
14:55:29
посмотри lucene

Проксимов
08.03.2017
14:55:38
Байты искать регулярками?

Paul
08.03.2017
14:55:57
он имеет в виду, что алфавит = ascii

Constantine
08.03.2017
14:56:11
даже текст искать регулярками – плохая идея

Paul
08.03.2017
14:56:21
Чта

Constantine
08.03.2017
14:56:29
для регулярок не построить индекс

Arkadiy
08.03.2017
14:56:29

Проксимов
08.03.2017
14:56:32

Проксимов
08.03.2017
14:56:40
А что тогда ими искать?

Paul
08.03.2017
14:56:42
Нормальная идея

Admin
ERROR: S client not available

Arkadiy
08.03.2017
14:56:44
на самом деле я смог это сделать, с помощью mysql и её движка mariadb

Constantine
08.03.2017
14:56:55
>несколько десятков гигабайт сырых данных

Arkadiy
08.03.2017
14:56:56
она умеет искать по raw колонкам регулярками

Constantine
08.03.2017
14:57:02
удачи

Arkadiy
08.03.2017
14:57:06
но на 10гб она потеет

Google

Paul
08.03.2017
14:57:12
Кладёшь файлы рядом, потом mmap в память

Constantine
08.03.2017
14:57:40
ну тогда хадупу прикрутить
если мощности процессорной много
может тебе не нужны регулярки
и поисковые запросы ограничены

Paul
08.03.2017
14:58:13
Если искать нужно реально по всем 10 гигам, то регулярки лучший выбор
эффективнее дка тут ничего не будет
Да и затык не в регулярках, а в IO

Arkadiy
08.03.2017
14:58:49
и регулярки тоже на некоторых байтах умирают на самом деле

Paul
08.03.2017
14:58:50
Тут спасёт только данные положить последовательно в блоках

Arkadiy
08.03.2017
14:58:57
мне пришлось даже replace делать

Paul
08.03.2017
14:59:15
Это проблемы какой-то реализации, регулярки тут причём?

Arkadiy
08.03.2017
14:59:15
короче костылей я там знатно навешал

Constantine
08.03.2017
14:59:15
а что конкретно делать пытаешься

Paul
08.03.2017
14:59:27
Насрать какой алфавит

Arkadiy
08.03.2017
15:00:04
хранить данные трафик сетевого уровня и выше и искать по содержимому пакетов

Paul
08.03.2017
15:00:22
А ищешь что?

Constantine
08.03.2017
15:00:28
вооооот
это уже интереснее
DPI поди