@bigdata_ru

Страница 304 из 327
Ruslan
29.08.2018
15:37:30
Использую там GridSearchCV, скармливаю в cv KFold из sklearn.model_selection, а мне пишет на фите 'KFold' object is not iterable

А вариант из sklearn.cross_validation даёт невалидные ответы



TILTED
29.08.2018
19:07:39
добрейший вечерочек

Google
TILTED
29.08.2018
19:08:17
подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

alex
29.08.2018
19:09:24
?

Mike
29.08.2018
19:35:28
Проксимов
29.08.2018
19:41:23
вот и метавопрос подоспел
Это просто тупой вопрос XD

Неважно какие данные и какая задача!

Dmitry
29.08.2018
20:06:55
То есть тот который из model_selection с 3 параметрами (как на скрине в примере для версии 18.0.1 и выше) выдаёт not iterable ?

Скрудж
29.08.2018
21:19:35
Подскажите, почему в In[6] для identity_hate показатели ROC-AUC уже 0.5? https://github.com/ikopeykin/IBA/blob/master/BOW.ipynb База с kaggle. Не понимаю, почему для других - показатели хорошие, 0.75 там, а для identity_hate нет

Скрудж
29.08.2018
21:22:51
«for i in range(len(data))»
Как по нему проходиться? Если формат [key][ind] Это неважно, в принципе. Меня интересует другой момент)

Google
Скрудж
29.08.2018
21:55:36
enumerate()
один костыль на другой? :)

Nikolay
29.08.2018
21:56:18
один костыль на другой? :)
нет, это правильный способ итерироваться по спискам, на это и намекал Проксим

Скрудж
29.08.2018
21:56:44
нет, это правильный способ итерироваться по спискам, на это и намекал Проксим
Мне без разницы. У меня проблема блин в другом, чес слово))

49060
30.08.2018
00:21:48
Кинь монетку

подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

Скрудж
30.08.2018
00:23:05
лес

Maxim
30.08.2018
07:24:39
Всем привет! А кто-нибудь ставил себе библиотеку fancyimpute?

Mike
30.08.2018
07:26:54
Tuyen
30.08.2018
07:29:57
Нам задачи классификации большего количества классов (~200 классов)

причем > 20 рекордов для каждого класса в trainset

Artyom
30.08.2018
08:05:06
Всем привет Надеюсь, что вопрос по теме Кто-нибудь знает алгоритмы поиска плагиата в документы среди некоторой выборки документов (сплощной текст)?

49060
30.08.2018
09:12:18
Нейронная сеть - такой абстрактный объект

Ибо из нейронной сети можно построить любой алгоритм

Roman
30.08.2018
09:13:17
49060
30.08.2018
09:13:48
Это как спросить, что ты любишь кушать: один назовет борщ, а другой ингредиенты не только для борща, но и для любого другого супа.

alex
30.08.2018
09:14:01
троллейбус из буханки.jpg

Mike
30.08.2018
11:39:21
Кто-то встречал сервис, где скармливаешь картинку с текстом - а НС возвращает текст? (вопрос про multilanguage), но просто eng тоже покатит

Скрудж
30.08.2018
11:53:19
Или нужна распознавалка печатного текста?

Google
alex
30.08.2018
11:54:11
EAST тебе в помощь

Mike
30.08.2018
11:54:14
ну OCR на мультиленгвич)

alex
30.08.2018
11:54:55
https://habr.com/post/312714/

Дима
30.08.2018
11:55:03
https://www.captionbot.ai

Скрудж
30.08.2018
11:55:07
ну OCR на мультиленгвич)
ABBYY finereader. Платная. Есть кейген на торренте

alex
30.08.2018
11:55:08
вот тут небольшой обзор платформ

Mike
30.08.2018
11:57:55
https://www.captionbot.ai
потестил, 0 из 5 картинок)

49060
30.08.2018
12:05:38
Такие вещи в паблик вряд ли выкладывают

Потому что нормальные организации покупают подобный софт от 200к

Ну я имею ввиду сейчас распознавалку паспорта какую нибудь, что примерно с таким же функционалом, правда там шрифт во многих полях разный и разной толщины.

Tsh
30.08.2018
15:10:01
https://habr.com/post/312714/
Ibm blue mix уже давно такое предоставляют, т.е. будущее уже состоялось позавчера

Marianna
30.08.2018
15:36:00
Всем привет! Встречал ли кто-то инфу, как можно запредиктить пропущеное слово в тексте?

Скрудж
30.08.2018
16:07:31
Ребят, SVC можно обучить для X, [y1, y2, y3, ...]? У меня есть X = [x1, x2, x3, ...] комменты, после векторизации. Есть Y, где каждый элемент это лейбл, характеризующий этот текст. Я пишу svm.SVC() svc.fit(X, Y) Но: Found input variables with inconsistent numbers of samples: [20000, 6] Прим.: для каждого отдельного лейбла все ОК работает. Поэтому спрашиваю

Vova
30.08.2018
17:19:03
Из 3х картинок одну смогла, чашку, правда со сложным изображением на боку

Слабовато для практического

Rassulzhan
30.08.2018
18:30:34
Всем привет. Разбираюсь в алгоритме K-Nearest-Neighbor. Не могу понять, почему X2-X1 = A. Y2-Y1 = B. Может кто нибудь направить в правильное русло?



Тут X2 это элемент из массива features?

Google
Dmitry
30.08.2018
18:39:57
Если я правильно понял твой вопрос, то да. Признаки это по сути координаты объекта в n мерном пространстве. Пример как на видео это плоскость с двумя координатами. Ты считаешь просто евклидово расстояние там

Скрудж
30.08.2018
18:48:40
Ап
Он же платный. Я могу так помочь, сейчас как раз пишу проект по анализу текста :) Задавай вопрос — откликнуться

Ruslan
30.08.2018
18:49:13
Дак проходить-то бесплатно можно) Сертификат только за бабло

Скрудж
30.08.2018
18:50:12
Разве? Мне предложило 7 дней бесплатно и сертификат за 79$ с оплатой за обучение

Arturo
31.08.2018
02:05:57
Скрудж ?: ABBYY finereader. Платная. Есть кейген на торренте

Ruslan
31.08.2018
04:07:38
Скрудж
31.08.2018
11:08:39
Смотря какой курс. Курсы из специализации такие, да
Не тупи. Я про твой курс говорю, а не про какие-то отдельные

Ruslan
31.08.2018
11:15:39
Хрен знает, где там у тебя и чё предлагалось

Мне этот курс за 1800 предлагался там

Или не этот

Но на 7 дней мне не предлагали его

И вообще, факт в том, что это задание у меня не принимает ответы, которые принимались в августе... Не понимаю, что происходит вообще там

Витя
31.08.2018
14:15:22
Привет, при замене пропущенных значений в случае, когда медиана довольно сильно отличается от среднего, как обычно поступают?

Sewerin
31.08.2018
14:39:59
Заменяют не средним и не медианой! Есть методы импутации с помощью knn, например.

Maxim
31.08.2018
14:52:35
Knn долгий ( если данных много, то плохо работает

Слышал, что можно применять сглаженное среднее

Ем-алгоритм вроде тоже есть.

Есть ещё кегловская техника, out of range называется. Когда пропуски заполняем аномально большим значением, типа 9999. Хз почему, но иногда срабатывает и удаётся улучшить качество модели

Страница 304 из 327