
Ruslan
29.08.2018
15:37:30
Использую там GridSearchCV, скармливаю в cv KFold из sklearn.model_selection, а мне пишет на фите 'KFold' object is not iterable
А вариант из sklearn.cross_validation даёт невалидные ответы

TILTED
29.08.2018
19:07:39
добрейший вечерочек

Google

TILTED
29.08.2018
19:08:17
подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

alex
29.08.2018
19:09:24
?

Artyom
29.08.2018
19:19:11

Mike
29.08.2018
19:35:28

Проксимов
29.08.2018
19:41:23
Неважно какие данные и какая задача!

Dmitry
29.08.2018
20:06:55
То есть тот который из model_selection с 3 параметрами (как на скрине в примере для версии 18.0.1 и выше) выдаёт not iterable ?

Скрудж
29.08.2018
21:19:35
Подскажите, почему в In[6] для identity_hate показатели ROC-AUC уже 0.5?
https://github.com/ikopeykin/IBA/blob/master/BOW.ipynb
База с kaggle. Не понимаю, почему для других - показатели хорошие, 0.75 там, а для identity_hate нет

Проксимов
29.08.2018
21:22:00
Еее, дата саенс

Скрудж
29.08.2018
21:22:51

Nikolay
29.08.2018
21:53:24

Google

Скрудж
29.08.2018
21:55:36

Nikolay
29.08.2018
21:56:18

Скрудж
29.08.2018
21:56:44

49060
30.08.2018
00:21:48
Кинь монетку
подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

Скрудж
30.08.2018
00:23:05
лес

Ruslan
30.08.2018
03:07:46

Tuyen
30.08.2018
06:58:24

Maxim
30.08.2018
07:24:39
Всем привет! А кто-нибудь ставил себе библиотеку fancyimpute?

Mike
30.08.2018
07:26:54

Tuyen
30.08.2018
07:29:57
Нам задачи классификации большего количества классов (~200 классов)
причем > 20 рекордов для каждого класса в trainset

Artyom
30.08.2018
08:05:06
Всем привет
Надеюсь, что вопрос по теме
Кто-нибудь знает алгоритмы поиска плагиата в документы среди некоторой выборки документов (сплощной текст)?

49060
30.08.2018
09:12:18
Нейронная сеть - такой абстрактный объект
Ибо из нейронной сети можно построить любой алгоритм

Roman
30.08.2018
09:13:17

49060
30.08.2018
09:13:48
Это как спросить, что ты любишь кушать: один назовет борщ, а другой ингредиенты не только для борща, но и для любого другого супа.

alex
30.08.2018
09:14:01
троллейбус из буханки.jpg

Mike
30.08.2018
11:39:21
Кто-то встречал сервис, где скармливаешь картинку с текстом - а НС возвращает текст? (вопрос про multilanguage), но просто eng тоже покатит

Скрудж
30.08.2018
11:53:19
Или нужна распознавалка печатного текста?

Google

alex
30.08.2018
11:54:11
EAST тебе в помощь

Mike
30.08.2018
11:54:14
ну OCR на мультиленгвич)

alex
30.08.2018
11:54:55
https://habr.com/post/312714/

Дима
30.08.2018
11:55:03
https://www.captionbot.ai

Скрудж
30.08.2018
11:55:07

alex
30.08.2018
11:55:08
вот тут небольшой обзор платформ

Mike
30.08.2018
11:57:55

49060
30.08.2018
12:05:38
Такие вещи в паблик вряд ли выкладывают
Потому что нормальные организации покупают подобный софт от 200к
Ну я имею ввиду сейчас распознавалку паспорта какую нибудь, что примерно с таким же функционалом, правда там шрифт во многих полях разный и разной толщины.

Tsh
30.08.2018
15:10:01

Marianna
30.08.2018
15:36:00
Всем привет! Встречал ли кто-то инфу, как можно запредиктить пропущеное слово в тексте?

Скрудж
30.08.2018
16:07:31
Ребят, SVC можно обучить для X, [y1, y2, y3, ...]?
У меня есть X = [x1, x2, x3, ...] комменты, после векторизации. Есть Y, где каждый элемент это лейбл, характеризующий этот текст. Я пишу svm.SVC()
svc.fit(X, Y)
Но:
Found input variables with inconsistent numbers of samples: [20000, 6]
Прим.: для каждого отдельного лейбла все ОК работает. Поэтому спрашиваю

Vova
30.08.2018
17:19:03
Из 3х картинок одну смогла, чашку, правда со сложным изображением на боку
Слабовато для практического

Rassulzhan
30.08.2018
18:30:34
Всем привет. Разбираюсь в алгоритме K-Nearest-Neighbor. Не могу понять, почему
X2-X1 = A.
Y2-Y1 = B.
Может кто нибудь направить в правильное русло?
Тут X2 это элемент из массива features?

Google

Dmitry
30.08.2018
18:39:57
Если я правильно понял твой вопрос, то да. Признаки это по сути координаты объекта в n мерном пространстве. Пример как на видео это плоскость с двумя координатами. Ты считаешь просто евклидово расстояние там

Ruslan
30.08.2018
18:47:00

Скрудж
30.08.2018
18:48:40
Ап
Он же платный. Я могу так помочь, сейчас как раз пишу проект по анализу текста :) Задавай вопрос — откликнуться

Ruslan
30.08.2018
18:49:13
Дак проходить-то бесплатно можно) Сертификат только за бабло

Скрудж
30.08.2018
18:50:12
Разве? Мне предложило 7 дней бесплатно и сертификат за 79$ с оплатой за обучение

Arturo
31.08.2018
02:05:57
Скрудж ?:
ABBYY finereader. Платная. Есть кейген на торренте

Ruslan
31.08.2018
04:07:38

Скрудж
31.08.2018
11:08:39

Ruslan
31.08.2018
11:15:39
Хрен знает, где там у тебя и чё предлагалось
Мне этот курс за 1800 предлагался там
Или не этот
Но на 7 дней мне не предлагали его
И вообще, факт в том, что это задание у меня не принимает ответы, которые принимались в августе... Не понимаю, что происходит вообще там

Витя
31.08.2018
14:15:22
Привет, при замене пропущенных значений в случае, когда медиана довольно сильно отличается от среднего, как обычно поступают?

Sewerin
31.08.2018
14:39:59
Заменяют не средним и не медианой! Есть методы импутации с помощью knn, например.

Maxim
31.08.2018
14:52:35
Knn долгий ( если данных много, то плохо работает
Слышал, что можно применять сглаженное среднее
Ем-алгоритм вроде тоже есть.
Есть ещё кегловская техника, out of range называется. Когда пропуски заполняем аномально большим значением, типа 9999. Хз почему, но иногда срабатывает и удаётся улучшить качество модели