@bigdata_ru

Страница 230 из 327
Drino
19.02.2018
22:12:30
blob тут значит "мешок с цифрами фиксиованного размера, пригодный для скармливания классификатору"

Он делает грейскейл, вычитает среднее, приводит картинку к конкретному размеру.

*пардон, он не делает грейскейл

Если верить этому блогу - всё, что он делает - вычитает (104,117,123) из R G и B слоёв и потом делит их на 1.0 (второй аргумент)

Google
Drino
19.02.2018
22:17:03
Ну и скейлит картинку в 244x244, сохраняя при этом три канала

dot
19.02.2018
22:27:22
Аа все понял , спасибо огромное за помощь

тоесть он делает из картинки по сути мешок слов да а потом передает их классификатору ?

Drino
19.02.2018
22:29:03
Не мешок слов. Он просто рескейлит картинку в 244x244, а потом вычитает из каждого слоя 104, 117 и 123 (среднее)

Поскольку это уже не совсем картинка (всё-таки RGB-каналы в нормальной картинке неотрицательны) они называют это блобом.

dot
19.02.2018
22:30:12
а рескейлит это в смысле уменьшает изображение ?

Drino
19.02.2018
22:30:28
Ну, если оно было больше 244x244 - уменьшает. Было меньше - увеличивает.

dot
19.02.2018
22:31:17
аа ясно просто не соображу никак по какому алгоритму он определяет что на картинке

Drino
19.02.2018
22:32:10
Он никак этого пока что не делает. Это подготовка данных.

dot
19.02.2018
22:32:54
аа все понял спасибо большое , щас дальше поразбираюсь

V
20.02.2018
15:32:25
Ребят, помощь нужна. Слегка далёк от machineLearning, но вот пришлось начать разбираться для дисера) надо сделать sentimentAnalysis политических новостей, но не могу найти подходящего датасета, если тренировать через дату из твиттера или просто “bucketofwords”, то слишком много ошибочных классификаций, подскажите пожалуйста как обойти эту проблему или где датасет нормальный найти????

Нууу reviews не очень подходит, слишком много ошибок, твиттер тоже

Alexandr
20.02.2018
16:54:24
https://gwu-libraries.github.io/sfm-ui/posts/2016-11-30-election-dataset

Google
Alexandr
20.02.2018
16:54:39
2016 United States Presidential Election Tweet Ids dataset

На русском - вряд ли такое есть. Возможно - всякие группы нэвэльного или ходорковского такое собирали

V
20.02.2018
16:56:41
Мне как раз на английском надо) только я обрабатываю статьи, а не твиты, они гораздо длиннее, и поэтому на твитах тренировать вроде не очень

Pavel
20.02.2018
20:58:55
Pavel Kashchenko: Добрый вечер. Под скажите пожалуйста, может кому-то встречался датасет содержащий разметку новостных текстов по полярности высказываемого мнения относительно курса того или иного финансового инструмента или курса валюты.

Vyaches
20.02.2018
22:28:27
народ, не подскажете, гитхаб лежит, или это у меня проблемы?

Dan
20.02.2018
22:32:32
Вроде всё работает

Vyaches
20.02.2018
22:35:26
внезапно заработало, спасибо

Andrey
21.02.2018
10:04:29
https://lemlist.com/

dot
21.02.2018
10:23:43
Всем привет , а может ктонибудь объяснить что делает третий параметр функции cv2.dnn.blobFromImage в описании написано Here we supply the spatial size that the Convolutional Neural Network expects. For most current state-of-the-art neural networks this is either 224×224, 227×227, or 299×299. я понял что это матрица каакято а для чего она нужна ?

Alexey
21.02.2018
10:26:52
Это входной размер матрицы для нейросети

Т е картинка сначала ресайзится (и не только) для правильного входа в нейросеть

dot
21.02.2018
10:27:31
эмм а что в нее будет записываться ?

Alexey
21.02.2018
10:27:49
Не понял.

dot
21.02.2018
10:28:14
или она потом после того как отресайзиться записывается в эту матрицу ?

Alexey
21.02.2018
10:29:10
blobFromImage возмращает нужную нам матрицу конечно

Потом юзаешь примерно так

net.setInput(blob); Mat detections = net.forward();

dot
21.02.2018
10:31:02
да я это понял, но я вот не понимаю ,вы пишете``` Это входной размер матрицы для нейросети ` я не понимаю тоесть что будет хранится в этоматрице, которую мы в третьем параметре передаем ?

Alexey
21.02.2018
10:31:52
напишите сигнатуру функции, я не понял тогда про какой такой третий параметр вы говорите

Я вижу, что третий параметр это просто размер

Google
dot
21.02.2018
10:32:54
там только такое cv::dnn::blobFromImage (InputArray image, double scalefactor=1.0, const Size &size=Size(), const Scalar &mean=Scalar(), bool swapRB=true, bool crop=true)

Alexey
21.02.2018
10:33:12
const Size &size=Size()

Это просто размер

dot
21.02.2018
10:36:08
аа все понял , походу это тупо размер выходной картинки , щас потестю

хмм странно чем больше я ее размеры задаю тем больше объектор распознается. Я просто вот как тут делаю https://www.pyimagesearch.com/2017/09/11/object-detection-with-deep-learning-and-opencv/

аа кажется понял ,чем больше матрица тем больше туда данных можно вписать и тем больше объектов можно будет распознать, вообщем походу это та часть изображения которая как бы сканируется :)

Alexey
21.02.2018
11:03:14
Это размер до которого будет скейлиться исходный фрейм

dot
21.02.2018
12:36:28
ааа все понял, в нем и будут искаться объекты ,хотя надо еще поразбираться конечно

Alexey
21.02.2018
15:10:14
Да в выходной матрице которая поступит на вход сверточной нейросеть будут находиться объекты

Vyaches
21.02.2018
16:11:47
Ребят, подскажите кто-нибудь алгоритм извлечения признаков из последовательности, чтобы при этом порядок не был важен. К примеру, [1,2,3] и [1,3,2] — одно и то же.

Vyaches
21.02.2018
16:12:45
maybe

Henadz
21.02.2018
16:14:59
это я, если что, подход предложил, а не спрашивал )

Vyaches
21.02.2018
16:16:27
я понял, гуглю :)

Кстати, кто-нибудь знает как статьи на arxiv заливают? :D

Vladimir
21.02.2018
17:36:28
Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?: Intel Xeon Intel Xeon Phi NVidia Tesla NVidia Kepler И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

Andrey
21.02.2018
17:38:16
Нвидиа процессоры не делает пока

Henadz
21.02.2018
17:39:16
Andrey
21.02.2018
17:40:03
Это SOC

Admin
ERROR: S client not available

Google
Andrey
21.02.2018
17:40:35
В списке выше точно не процессоры

Pavlo
21.02.2018
17:40:35
Нвидиа процессоры не делает пока
а GPU это типа не процессор?

в аббревиатурах CPU, GPU, TPU вторые две буквы ни на что не намекают?

Henadz
21.02.2018
17:41:39
Это SOC
и что? процесор в этом СоКе тоже их разработка

Andrey
21.02.2018
17:42:37
По-русски процессором называют CPU

Henadz
21.02.2018
17:43:06
По-русски процессором называют CPU
Я его по русски называю ЦПУ

Pavlo
21.02.2018
17:43:11
неграмотно процессором называют CPU. а некоторые люди неграмотно процессором ещё и системный блок называют

так и что теперь, перенимать плохие привычки неграмотных людей?

Vladimir
21.02.2018
17:56:32
Andrey
21.02.2018
17:56:46
не густо

в одной GTX1080ti их 3584

Google
Dmitry
21.02.2018
18:38:50
зависимость может быть нелинейной
много что может быть, гфлопсы довольно искусственно меряются, но как первое приближение подойдет

Pipito
21.02.2018
19:04:32
ребят есть возможность при работе с алгоритмом вывести не в виде вероятности принадлежности объекта X к классу Y, а скорее в виде какого-то суммарного количества очков, которое набрал тот или иной объект класса X. Пример абстрактной задачи: Есть 10 футбольных команд и необходимо предсказать какая из этих команд займет 1-ое место в турнире. То что хотелось бы получить - это список команд в таком виде: Команда 1: 250 очков. Команда 2: 190 очков. Команда 3: 100 очков. ... Команда 10: 20 очков

Но это не задача регрессии, потому что -изначально переменная Y содержит 2 класса(Победа/Поражение)

Boris
21.02.2018
19:08:58
вероятность тоже можно интерпретировать как количество очков. ты не определил что значат очки в твоем случае

как только определишь сразу поймешь как их подсчитать )

Страница 230 из 327