@bigdata_ru

Страница 55 из 327
Andrey
15.03.2017
15:43:55
смысле надоел хайп?
Ну выше было негодование по причине хайпа

Geronimo
15.03.2017
15:44:38
Ну выше было негодование по причине хайпа
а чего негодовать то проблем море, бери решай, что много народа над этим сейчас трудится, ну это конечно снизит ставки, но не думаю что намного

рыночек растет и будет расти еще долго

Maxim
15.03.2017
15:46:36
Есть кто из Сибири?

Google
Oleg
15.03.2017
15:46:56
статистически-есть )

Проксимов
15.03.2017
15:47:08
yopp
15.03.2017
15:47:08
Есть кто из Сибири?
Критерии «Из Сибири» уточни

Нужно там родиться, жить, жить сейчас? :)

Maxim
15.03.2017
15:47:35
сейчас )

Dmitry
15.03.2017
20:03:41
Ребят, подскажите какую базу лучше использовать для text-mining? Есть большое количество текстов, сейчас нужно найти совпадения и частоту по каждому тексту большого количества фраз. Проблема в том что я не уверен какие будут задачи в будущем, решения типа elasticsearch не предоставляют данных например по частоте слова внутри конкретного текста (только по всей выборке), поэтому не понятно... Сейчас все лежит в mongodb и как-то хреново...

То есть нужен не просто поиск а извлечение отдельных характеристик по каждому тексту

Dmitry
16.03.2017
03:56:56
Это не то что тебе нужно ? https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-termvectors.html
Да, оказалось что кое-что есть, но мне нужно считать частоту не только понятий но и целых фраз. Получается нужно либо как-то считать её используя term vector с позициями либо искать другой способ.

Dmitry
16.03.2017
08:28:07
Частоту употребления одних слов с другими?
Не совсем, например у нас есть фраза "speech recognition", мне нужно найти частоту этой фразы для каждого документа. Именно всей фразы в определенном порядке. Таких фраз будет больше тысячи.

Google
Dmitry
16.03.2017
08:30:11
То есть term vector может отдать частоту понятий speech и recognition для каждого документа, но это не совсем то.

Le0nX
16.03.2017
09:17:12
рыночек растет и будет расти еще долго
Имеет ли смысл из low level кода переходить в эту отрасль? Пока молодой, есть возможность на корню переучиться. Просто, как мне кажется, то поле для каких-то инноваций и открытий тут намного шире ,чем в том же osdev'e, откуда я пришёл.

И еще такой вопрос: реально ли на kaggle джоб-оффер получить, если активно принимать участие в соревнованиях? Или это уже за гранью реальности?

Andrey
16.03.2017
09:25:03
Оффер нужен же сразу с релокейтом, смотри сам, насколько это реально

Ну то есть насколько в США или еще где не хватает специалистов твоего уровня, чтобы оправдать такие затраты

Larleyt
16.03.2017
09:27:10
Le0nX
16.03.2017
09:27:46
Сейчас в мае результаты гринки будут известны, мб релокейт и не понадобится) Да, тоже интересен момент с удаленкой

Andrey
16.03.2017
09:28:51
Дата саенс - это R&D, это то, что аутсорсят в последнюю очередь. Имхо - вне полностью распределенных команд серьезной работы по удаленке не будет

Dmitry
16.03.2017
09:36:23
tf + position ?
Да, и дальше это все считать в приложении?

Шустрый
16.03.2017
09:36:30
да

Dmitry
16.03.2017
09:37:11
Вариант, просто думал может есть что-то такое же для match_phrase которая уже посчитана

По сути ES делает то же самое на match_phrase...но я хз как получить frequency

Шустрый
16.03.2017
09:38:00
хранить стату для всех фраз/словосочетаний кмк дороговато будет

Dmitry
16.03.2017
09:38:46
хранить стату для всех фраз/словосочетаний кмк дороговато будет
Ну это да, я к тому что он считает фразы на лету, может он может и отдавать то что посчитал а не только то что нашёл

Хранить фразы нереально конечно, так как никогда не знаешь что такое фраза

Где она начинается и заканчивается

Леонид
16.03.2017
09:44:11
если добавлять dropout перестает обучаться
Это явно показывает две вещи. 1. Overfitting. 2. Процесс близок к случайному. Запомнить его можно, предсказать - нет. Предсказывай на новостях, на Твиттере Трампа, например

Google
Леонид
16.03.2017
09:45:26
если бы закономернеости были то ими пользовались бы все и тогда закономерности перестали бы действовать
На российском валютном рынке закономерности очевидны - валютные интервенции Центробанка. Не благодари :)

Шустрый
16.03.2017
09:46:45
Ну это да, я к тому что он считает фразы на лету, может он может и отдавать то что посчитал а не только то что нашёл
попробуй в explain посмотреть, что он на этот запрос отдаст, возможно там будет эта инфа

Anton
16.03.2017
09:47:39
Леонид меня лично более волнует вопрос о том что предсказывать. направление следующего бара. спорно, реакция может быть через бар, а а может вообще все зависит от того по какой часовой зоне close price получен

Может как вариант предсказывать выбросы и аномалии. Может развороты

Может мувинг делать и его же предсказывать.

Леонид
16.03.2017
09:50:49
Леонид меня лично более волнует вопрос о том что предсказывать. направление следующего бара. спорно, реакция может быть через бар, а а может вообще все зависит от того по какой часовой зоне close price получен
Я бы предсказывал величины типа "будет ли рост на 1% за следующий временной отрезок". Она как-то более осмысленная, чем следующая флунктуация. Но я не квант, мой совет может быть плох.

Anton
16.03.2017
09:52:00
я правильно понял идею?

А следующий временной отрезок - это следующий бар или несколько баров? Я об этом тоже задумывался

Леонид
16.03.2017
09:55:13
Да, верно. На два проще, но можно на три. Следующий отрезок - любой полезный. Если торгуешь на длинных отрезках, то хоть день.

Anton
16.03.2017
09:56:57
да я не торгую. спортивный интерес)

Admin
ERROR: S client not available

no
16.03.2017
19:52:57
всем приветы, занимается ли кто рекомендационными системами? пишу диплом по этому, есть пару вопросов

no
16.03.2017
21:57:14
Был такой опыт, пиши)
Мне уже один человек подсказал, но буду иметь ввиду, спасибо

Evgeny
17.03.2017
04:05:10
Господа, что почитать для базового ведения в нейронные сети?

Вася ?⚡️
17.03.2017
04:25:41
Народ

Всемпривет

Google
Вася ?⚡️
17.03.2017
04:26:21
Вы вкурсе что человечество создаёт огромные себе проблемы

Машина захочет вытеснить наш вид

Jerlis
17.03.2017
04:27:01
Я уже хочу вытеснить ваш вид.

Пойди делом займись, гомо-сапиенс.

Ты непродуктивен.

Проксимов
17.03.2017
04:31:48
Вася ?⚡️
17.03.2017
04:52:15
Evgeny
17.03.2017
06:38:34
спасибо

Gleb
17.03.2017
09:55:32
Друзья,а где правила чата? Не могу найти?

Dan
17.03.2017
09:59:10
Друзья,а где правила чата? Не могу найти?
С какой целью ты хочешь найти правила чата?

Gleb
17.03.2017
09:59:40
Ну как минимум с ними ознакомиться ?

Dan
17.03.2017
10:00:05
Здесь действует одно правило: правило адекватного, профессионального и релевантного чату общения.

Gleb
17.03.2017
10:01:12
Супер,спасибо;-)

Gabriel
17.03.2017
16:41:22
Господа, что почитать для базового ведения в нейронные сети?
Потом, для небазового, можно попробовать одолеть "Нейронные сети" Саймона Хайкина. Лучше в оригинале, потому что переведены они посредственно.

Вася ?⚡️
17.03.2017
20:36:18
Часть машины

Страница 55 из 327