
Andrey
26.10.2017
08:42:06
R тут сильно впереди питона окажется, думаю. Хотя я для питона и не искал библиотеки для этих целей

Vitalii
26.10.2017
13:27:43
Приветствую.
Как можно определить похожие строки типо "Other", "Other (Specify)", "Other Specify'?
word2vec слишком большой. Нужно что-то маленькое. Типо кластеризации. Спасибо

Lev
26.10.2017
13:34:51
split по словам или буквам и кластеризация по количеству общих слов или букв?
слова похожи семантически или буквами? в этом вся сложность

Google

Vitalii
26.10.2017
13:36:06

alex
26.10.2017
13:39:02
Коэффициент Жаккара может попробовать?
или биграммы

Vitalii
26.10.2017
13:43:08

PaRaDiSe
26.10.2017
13:43:44
Левенштейн + Иерархическая кластеризация

alex
26.10.2017
13:44:40
Мне кажется, левенштейн здесь плохо зайдет

MIkhail
26.10.2017
13:44:58
см. Soundex, он в коробке спарка

alex
26.10.2017
13:46:53
поставь sphinxsearch и поиграйся с разными ранкерами )

Vitalii
26.10.2017
13:47:41
Хорошо. Всем спасибо!

Aleksander
26.10.2017
13:49:00

Oleksandr
26.10.2017
13:52:39

Evgeniy
26.10.2017
15:55:38
Бишоп или Мерфи для студентов которые хотят учит ML?

Alexey
26.10.2017
16:00:26
Хасти

Google

Drino
26.10.2017
16:14:18
Он неплохо ставит теорию.

Evgeniy
26.10.2017
16:15:24

Andre
26.10.2017
17:36:15
Так Бишоп это как классика, там нет этих всех модных глубоких обучений
Тесть хороша для сути алгебры итд

Evgeniy
26.10.2017
17:37:14

Andre
26.10.2017
17:37:47
Незнаю, не читал

Pavlo
27.10.2017
00:39:49
кто-нибудь здесь занимался задачей хватания незнакомых предметов роботизированной конечностью? что-то более актуальное чем вот такие подходы:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.79.9107&rep=rep1&type=pdf
нынче есть?

ramees
28.10.2017
02:57:48
only Russian?

Viktor
28.10.2017
04:12:33
Коллеги, вопрос по графикам. Сейчас изучаю сет с ~600к экземпляров и строю 2d графики чтобы увидеть какие-то зависимости между фичами. Строю с помощью seaborn. Происходит это довольно медленно. За полдня вчера успел построить около 160 и осталось еще гораздо больше. По htop заметил что используется только одно ядро. Можно ли как-то ускорить seaborn или лучше его заменить на какой-то аналог?

Andre
28.10.2017
06:51:35
А питоновский matplotlib пробовал?

Pavel
28.10.2017
07:52:36

Andrey
28.10.2017
08:25:39

Pavlo
28.10.2017
08:38:46

Evgeniy
28.10.2017
08:40:27

dot
28.10.2017
08:51:28
Скажите вот этот метод сколько раз выполнится Object.assign({}, baseData[Math.floor(Math.random() * 4)]); Тоесть он в пустой {} только однозначение запишет или нет ?
из массива baseData

Nick
28.10.2017
09:01:01
Одно, но свалится с IndexError, если не найдёт элемент со случайным индексом в baseData. Не делайте так, это плохой код, почитайте доку по random

dot
28.10.2017
09:19:06
Все понял спасибо, да я просто пок чужой код пытаюсь разобрать

Antonio
28.10.2017
15:17:01
Подскажите пожалуйста, помимо обучения с подкреплением какие ещё существуют методы обучения для частично наблюдаемых сред ?