@bigdata_ru

Страница 304 из 327

Ruslan

29.08.2018
15:37:30

Использую там GridSearchCV, скармливаю в cv KFold из sklearn.model_selection, а мне пишет на фите 'KFold' object is not iterable

А вариант из sklearn.cross_validation даёт невалидные ответы

TILTED

29.08.2018
19:07:39

добрейший вечерочек

Google

TILTED

29.08.2018
19:08:17

подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

alex

29.08.2018
19:09:24

?

Artyom

29.08.2018
19:19:11

подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

вот и метавопрос подоспел

Mike

29.08.2018
19:35:28

вот и метавопрос подоспел

Успех и фейспалм

Проксимов

29.08.2018
19:41:23

вот и метавопрос подоспел

Это просто тупой вопрос XD

подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

Линейная регрессия конечно. Работает как часы

Неважно какие данные и какая задача!

Dmitry

29.08.2018
20:06:55

То есть тот который из model_selection с 3 параметрами (как на скрине в примере для версии 18.0.1 и выше) выдаёт not iterable ?

Скрудж

29.08.2018
21:19:35

Подскажите, почему в In[6] для identity_hate показатели ROC-AUC уже 0.5? https://github.com/ikopeykin/IBA/blob/master/BOW.ipynb База с kaggle. Не понимаю, почему для других - показатели хорошие, 0.75 там, а для identity_hate нет

Проксимов

29.08.2018
21:22:00

Подскажите, почему в In[6] для identity_hate показатели ROC-AUC уже 0.5? https://github.com/ikopeykin/IBA/blob/master/BOW.ipynb База с kaggle. Не понимаю, почему для других - показатели хорошие, 0.75 там, а для identity_hate нет

«for i in range(len(data))»

Еее, дата саенс

Скрудж

29.08.2018
21:22:51

«for i in range(len(data))»

Как по нему проходиться? Если формат [key][ind] Это неважно, в принципе. Меня интересует другой момент)

Nikolay

29.08.2018
21:53:24

Как по нему проходиться? Если формат [key][ind] Это неважно, в принципе. Меня интересует другой момент)

enumerate()

Google

Скрудж

29.08.2018
21:55:36

enumerate()

один костыль на другой? :)

Nikolay

29.08.2018
21:56:18

один костыль на другой? :)

нет, это правильный способ итерироваться по спискам, на это и намекал Проксим

Скрудж

29.08.2018
21:56:44

нет, это правильный способ итерироваться по спискам, на это и намекал Проксим

Мне без разницы. У меня проблема блин в другом, чес слово))

49060

30.08.2018
00:21:48

Кинь монетку

подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

Скрудж

30.08.2018
00:23:05

лес

Ruslan

30.08.2018
03:07:46

То есть тот который из model_selection с 3 параметрами (как на скрине в примере для версии 18.0.1 и выше) выдаёт not iterable ?

Так точно

Tuyen

30.08.2018
06:58:24

подскажите, какой мл алгоритм имеет наивысшую точность предсказывания

для меня - нейронная сеть, потом SVM

Maxim

30.08.2018
07:24:39

Всем привет! А кто-нибудь ставил себе библиотеку fancyimpute?

Mike

30.08.2018
07:26:54

для меня - нейронная сеть, потом SVM

в яких задачах?)

Tuyen

30.08.2018
07:29:57

Нам задачи классификации большего количества классов (~200 классов)

причем > 20 рекордов для каждого класса в trainset

Artyom

30.08.2018
08:05:06

Всем привет Надеюсь, что вопрос по теме Кто-нибудь знает алгоритмы поиска плагиата в документы среди некоторой выборки документов (сплощной текст)?

49060

30.08.2018
09:12:18

Нейронная сеть - такой абстрактный объект

Ибо из нейронной сети можно построить любой алгоритм

Roman

30.08.2018
09:13:17

Ибо из нейронной сети можно построить любой алгоритм

И хинди-миллера можно?

49060

30.08.2018
09:13:48

Это как спросить, что ты любишь кушать: один назовет борщ, а другой ингредиенты не только для борща, но и для любого другого супа.

alex

30.08.2018
09:14:01

троллейбус из буханки.jpg

Mike

30.08.2018
11:39:21

Кто-то встречал сервис, где скармливаешь картинку с текстом - а НС возвращает текст? (вопрос про multilanguage), но просто eng тоже покатит

Скрудж

30.08.2018
11:53:19

Или нужна распознавалка печатного текста?

Google

alex

30.08.2018
11:54:11

EAST тебе в помощь

Mike

30.08.2018
11:54:14

ну OCR на мультиленгвич)

alex

30.08.2018
11:54:55

https://habr.com/post/312714/

Дима

30.08.2018
11:55:03

https://www.captionbot.ai

Скрудж

30.08.2018
11:55:07

ну OCR на мультиленгвич)

ABBYY finereader. Платная. Есть кейген на торренте

alex

30.08.2018
11:55:08

вот тут небольшой обзор платформ

Mike

30.08.2018
11:57:55

https://www.captionbot.ai

потестил, 0 из 5 картинок)

вот тут небольшой обзор платформ

спасибо

49060

30.08.2018
12:05:38

Такие вещи в паблик вряд ли выкладывают

Потому что нормальные организации покупают подобный софт от 200к

Ну я имею ввиду сейчас распознавалку паспорта какую нибудь, что примерно с таким же функционалом, правда там шрифт во многих полях разный и разной толщины.

Tsh

30.08.2018
15:10:01

https://habr.com/post/312714/

Ibm blue mix уже давно такое предоставляют, т.е. будущее уже состоялось позавчера

Marianna

30.08.2018
15:36:00

Всем привет! Встречал ли кто-то инфу, как можно запредиктить пропущеное слово в тексте?

Скрудж

30.08.2018
16:07:31

Ребят, SVC можно обучить для X, [y1, y2, y3, ...]? У меня есть X = [x1, x2, x3, ...] комменты, после векторизации. Есть Y, где каждый элемент это лейбл, характеризующий этот текст. Я пишу svm.SVC() svc.fit(X, Y) Но: Found input variables with inconsistent numbers of samples: [20000, 6] Прим.: для каждого отдельного лейбла все ОК работает. Поэтому спрашиваю

Admin

ERROR: S client not available

Vova

30.08.2018
17:19:03

https://www.captionbot.ai

Из 3х картинок одну смогла, чашку, правда со сложным изображением на боку

Слабовато для практического

Rassulzhan

30.08.2018
18:30:34

Всем привет. Разбираюсь в алгоритме K-Nearest-Neighbor. Не могу понять, почему X2-X1 = A. Y2-Y1 = B. Может кто нибудь направить в правильное русло?

Google

Rassulzhan

30.08.2018
18:31:41

Тут X2 это элемент из массива features?

Dmitry

30.08.2018
18:39:57

Если я правильно понял твой вопрос, то да. Признаки это по сути координаты объекта в n мерном пространстве. Пример как на видео это плоскость с двумя координатами. Ты считаешь просто евклидово расстояние там

Ruslan

30.08.2018
18:47:00

А кто-нибудь тут проходил "Введение в машинное обучение" от яндеха на coursera? Есть вопрос по анализу текста..

Ап

Скрудж

30.08.2018
18:48:40

Ап

Он же платный. Я могу так помочь, сейчас как раз пишу проект по анализу текста :) Задавай вопрос — откликнуться

Ruslan

30.08.2018
18:49:13

Дак проходить-то бесплатно можно) Сертификат только за бабло

Скрудж

30.08.2018
18:50:12

Разве? Мне предложило 7 дней бесплатно и сертификат за 79$ с оплатой за обучение

Arturo

31.08.2018
02:05:57

Скрудж ?: ABBYY finereader. Платная. Есть кейген на торренте

Ruslan

31.08.2018
04:07:38

Разве? Мне предложило 7 дней бесплатно и сертификат за 79$ с оплатой за обучение

Смотря какой курс. Курсы из специализации такие, да

Скрудж

31.08.2018
11:08:39

Смотря какой курс. Курсы из специализации такие, да

Не тупи. Я про твой курс говорю, а не про какие-то отдельные

Ruslan

31.08.2018
11:15:39

Хрен знает, где там у тебя и чё предлагалось

Мне этот курс за 1800 предлагался там

Или не этот

Но на 7 дней мне не предлагали его

И вообще, факт в том, что это задание у меня не принимает ответы, которые принимались в августе... Не понимаю, что происходит вообще там

Витя

31.08.2018
14:15:22

Привет, при замене пропущенных значений в случае, когда медиана довольно сильно отличается от среднего, как обычно поступают?

Sewerin

31.08.2018
14:39:59

Заменяют не средним и не медианой! Есть методы импутации с помощью knn, например.

Maxim

31.08.2018
14:52:35

Knn долгий ( если данных много, то плохо работает

Слышал, что можно применять сглаженное среднее

Ем-алгоритм вроде тоже есть.

Есть ещё кегловская техника, out of range называется. Когда пропуски заполняем аномально большим значением, типа 9999. Хз почему, но иногда срабатывает и удаётся улучшить качество модели

« Назад

Страница 304 из 327

Далее »

Открыть в Telegram