
Andrey
15.03.2017
15:43:55

Geronimo
15.03.2017
15:44:38
рыночек растет и будет расти еще долго

Maxim
15.03.2017
15:46:36
Есть кто из Сибири?

Google

Oleg
15.03.2017
15:46:56
статистически-есть )

Проксимов
15.03.2017
15:47:08

yopp
15.03.2017
15:47:08
Нужно там родиться, жить, жить сейчас? :)

Maxim
15.03.2017
15:47:35
сейчас )

Gabriel
15.03.2017
17:25:28

Ahm
15.03.2017
17:39:22

Dmitry
15.03.2017
20:03:41
Ребят, подскажите какую базу лучше использовать для text-mining? Есть большое количество текстов, сейчас нужно найти совпадения и частоту по каждому тексту большого количества фраз. Проблема в том что я не уверен какие будут задачи в будущем, решения типа elasticsearch не предоставляют данных например по частоте слова внутри конкретного текста (только по всей выборке), поэтому не понятно... Сейчас все лежит в mongodb и как-то хреново...
То есть нужен не просто поиск а извлечение отдельных характеристик по каждому тексту

Шустрый
16.03.2017
00:59:12

Dmitry
16.03.2017
03:56:56

Professor
16.03.2017
08:26:08

Dmitry
16.03.2017
08:28:07
Частоту употребления одних слов с другими?
Не совсем, например у нас есть фраза "speech recognition", мне нужно найти частоту этой фразы для каждого документа. Именно всей фразы в определенном порядке. Таких фраз будет больше тысячи.

Google

Dmitry
16.03.2017
08:30:11
То есть term vector может отдать частоту понятий speech и recognition для каждого документа, но это не совсем то.

Le0nX
16.03.2017
09:17:12
рыночек растет и будет расти еще долго
Имеет ли смысл из low level кода переходить в эту отрасль? Пока молодой, есть возможность на корню переучиться. Просто, как мне кажется, то поле для каких-то инноваций и открытий тут намного шире ,чем в том же osdev'e, откуда я пришёл.
И еще такой вопрос: реально ли на kaggle джоб-оффер получить, если активно принимать участие в соревнованиях? Или это уже за гранью реальности?

Andrey
16.03.2017
09:25:03
Оффер нужен же сразу с релокейтом, смотри сам, насколько это реально
Ну то есть насколько в США или еще где не хватает специалистов твоего уровня, чтобы оправдать такие затраты

Larleyt
16.03.2017
09:27:10

Le0nX
16.03.2017
09:27:46
Сейчас в мае результаты гринки будут известны, мб релокейт и не понадобится)
Да, тоже интересен момент с удаленкой

Andrey
16.03.2017
09:28:51
Дата саенс - это R&D, это то, что аутсорсят в последнюю очередь. Имхо - вне полностью распределенных команд серьезной работы по удаленке не будет

Шустрый
16.03.2017
09:35:35
там позицию терма тоже можно получить

Dmitry
16.03.2017
09:36:23

Шустрый
16.03.2017
09:36:30
да

Dmitry
16.03.2017
09:37:11
Вариант, просто думал может есть что-то такое же для match_phrase которая уже посчитана
По сути ES делает то же самое на match_phrase...но я хз как получить frequency

Шустрый
16.03.2017
09:38:00
хранить стату для всех фраз/словосочетаний кмк дороговато будет

Dmitry
16.03.2017
09:38:46
Хранить фразы нереально конечно, так как никогда не знаешь что такое фраза
Где она начинается и заканчивается

Леонид
16.03.2017
09:44:11
если добавлять dropout перестает обучаться
Это явно показывает две вещи. 1. Overfitting. 2. Процесс близок к случайному. Запомнить его можно, предсказать - нет.
Предсказывай на новостях, на Твиттере Трампа, например

Anton
16.03.2017
09:45:15

Google

Леонид
16.03.2017
09:45:26

Anton
16.03.2017
09:45:47

Шустрый
16.03.2017
09:46:45

Леонид
16.03.2017
09:47:30

Anton
16.03.2017
09:47:39
Леонид меня лично более волнует вопрос о том что предсказывать. направление следующего бара. спорно, реакция может быть через бар, а а может вообще все зависит от того по какой часовой зоне close price получен
Может как вариант предсказывать выбросы и аномалии. Может развороты
Может мувинг делать и его же предсказывать.

Леонид
16.03.2017
09:50:49

Anton
16.03.2017
09:52:00
я правильно понял идею?
А следующий временной отрезок - это следующий бар или несколько баров? Я об этом тоже задумывался

Леонид
16.03.2017
09:55:13
Да, верно. На два проще, но можно на три.
Следующий отрезок - любой полезный. Если торгуешь на длинных отрезках, то хоть день.

Anton
16.03.2017
09:56:57
да я не торгую. спортивный интерес)

Admin
ERROR: S client not available

no
16.03.2017
19:52:57
всем приветы, занимается ли кто рекомендационными системами? пишу диплом по этому, есть пару вопросов

Irina
16.03.2017
20:48:08

no
16.03.2017
21:57:14

Evgeny
17.03.2017
04:05:10
Господа, что почитать для базового ведения в нейронные сети?

Вася ?⚡️
17.03.2017
04:25:41
Народ
Всемпривет

Google

Вася ?⚡️
17.03.2017
04:26:21
Вы вкурсе что человечество создаёт огромные себе проблемы
Машина захочет вытеснить наш вид

Jerlis
17.03.2017
04:27:01
Я уже хочу вытеснить ваш вид.
Пойди делом займись, гомо-сапиенс.
Ты непродуктивен.

Проксимов
17.03.2017
04:31:48

Вася ?⚡️
17.03.2017
04:52:15

Petr
17.03.2017
06:16:00

Andrey
17.03.2017
06:17:47

Evgeny
17.03.2017
06:38:34
спасибо

Gleb
17.03.2017
09:55:32
Друзья,а где правила чата? Не могу найти?

Dan
17.03.2017
09:59:10

Gleb
17.03.2017
09:59:40
Ну как минимум с ними ознакомиться ?

Dan
17.03.2017
10:00:05
Здесь действует одно правило: правило адекватного, профессионального и релевантного чату общения.

Gleb
17.03.2017
10:01:12
Супер,спасибо;-)

Gabriel
17.03.2017
16:41:22

Вася ?⚡️
17.03.2017
20:36:18
Часть машины