@bigdata_ru

« Назад

Страница 230 из 327

Далее »

Drino

19.02.2018
22:12:30

blob тут значит "мешок с цифрами фиксиованного размера, пригодный для скармливания классификатору"

Он делает грейскейл, вычитает среднее, приводит картинку к конкретному размеру.

*пардон, он не делает грейскейл

Если верить этому блогу - всё, что он делает - вычитает (104,117,123) из R G и B слоёв и потом делит их на 1.0 (второй аргумент)

Google

Drino

19.02.2018
22:17:03

Ну и скейлит картинку в 244x244, сохраняя при этом три канала

dot

19.02.2018
22:27:22

Аа все понял , спасибо огромное за помощь

тоесть он делает из картинки по сути мешок слов да а потом передает их классификатору ?

Drino

19.02.2018
22:29:03

Не мешок слов. Он просто рескейлит картинку в 244x244, а потом вычитает из каждого слоя 104, 117 и 123 (среднее)

Поскольку это уже не совсем картинка (всё-таки RGB-каналы в нормальной картинке неотрицательны) они называют это блобом.

dot

19.02.2018
22:30:12

а рескейлит это в смысле уменьшает изображение ?

Drino

19.02.2018
22:30:28

Ну, если оно было больше 244x244 - уменьшает. Было меньше - увеличивает.

dot

19.02.2018
22:31:17

аа ясно просто не соображу никак по какому алгоритму он определяет что на картинке

Drino

19.02.2018
22:32:10

Он никак этого пока что не делает. Это подготовка данных.

dot

19.02.2018
22:32:54

аа все понял спасибо большое , щас дальше поразбираюсь

V

20.02.2018
15:32:25

Ребят, помощь нужна. Слегка далёк от machineLearning, но вот пришлось начать разбираться для дисера) надо сделать sentimentAnalysis политических новостей, но не могу найти подходящего датасета, если тренировать через дату из твиттера или просто “bucketofwords”, то слишком много ошибочных классификаций, подскажите пожалуйста как обойти эту проблему или где датасет нормальный найти????

Нууу reviews не очень подходит, слишком много ошибок, твиттер тоже

Alexandr

20.02.2018
16:54:24

https://gwu-libraries.github.io/sfm-ui/posts/2016-11-30-election-dataset

Google

Alexandr

20.02.2018
16:54:39

2016 United States Presidential Election Tweet Ids dataset

На русском - вряд ли такое есть. Возможно - всякие группы нэвэльного или ходорковского такое собирали

V

20.02.2018
16:56:41

Мне как раз на английском надо) только я обрабатываю статьи, а не твиты, они гораздо длиннее, и поэтому на твитах тренировать вроде не очень

Pavel

20.02.2018
20:58:55

Pavel Kashchenko: Добрый вечер. Под скажите пожалуйста, может кому-то встречался датасет содержащий разметку новостных текстов по полярности высказываемого мнения относительно курса того или иного финансового инструмента или курса валюты.

Vyaches

20.02.2018
22:28:27

народ, не подскажете, гитхаб лежит, или это у меня проблемы?

Dan

20.02.2018
22:32:32

Вроде всё работает

Vyaches

20.02.2018
22:35:26

внезапно заработало, спасибо

Andrey

21.02.2018
10:04:29

https://lemlist.com/

dot

21.02.2018
10:23:43

Всем привет , а может ктонибудь объяснить что делает третий параметр функции cv2.dnn.blobFromImage в описании написано Here we supply the spatial size that the Convolutional Neural Network expects. For most current state-of-the-art neural networks this is either 224×224, 227×227, or 299×299. я понял что это матрица каакято а для чего она нужна ?

Alexey

21.02.2018
10:26:52

Это входной размер матрицы для нейросети

Т е картинка сначала ресайзится (и не только) для правильного входа в нейросеть

dot

21.02.2018
10:27:31

эмм а что в нее будет записываться ?

Alexey

21.02.2018
10:27:49

Не понял.

dot

21.02.2018
10:28:14

или она потом после того как отресайзиться записывается в эту матрицу ?

Alexey

21.02.2018
10:29:10

blobFromImage возмращает нужную нам матрицу конечно

Потом юзаешь примерно так

net.setInput(blob); Mat detections = net.forward();

dot

21.02.2018
10:31:02

да я это понял, но я вот не понимаю ,вы пишете``` Это входной размер матрицы для нейросети ` я не понимаю тоесть что будет хранится в этоматрице, которую мы в третьем параметре передаем ?

Alexey

21.02.2018
10:31:52

напишите сигнатуру функции, я не понял тогда про какой такой третий параметр вы говорите

Я вижу, что третий параметр это просто размер

Google

dot

21.02.2018
10:32:54

там только такое cv::dnn::blobFromImage (InputArray image, double scalefactor=1.0, const Size &size=Size(), const Scalar &mean=Scalar(), bool swapRB=true, bool crop=true)

Alexey

21.02.2018
10:33:12

const Size &size=Size()

Это просто размер

dot

21.02.2018
10:36:08

аа все понял , походу это тупо размер выходной картинки , щас потестю

хмм странно чем больше я ее размеры задаю тем больше объектор распознается. Я просто вот как тут делаю https://www.pyimagesearch.com/2017/09/11/object-detection-with-deep-learning-and-opencv/

аа кажется понял ,чем больше матрица тем больше туда данных можно вписать и тем больше объектов можно будет распознать, вообщем походу это та часть изображения которая как бы сканируется :)

Alexey

21.02.2018
11:03:14

Это размер до которого будет скейлиться исходный фрейм

dot

21.02.2018
12:36:28

ааа все понял, в нем и будут искаться объекты ,хотя надо еще поразбираться конечно

Alexey

21.02.2018
15:10:14

Да в выходной матрице которая поступит на вход сверточной нейросеть будут находиться объекты

Vyaches

21.02.2018
16:11:47

Ребят, подскажите кто-нибудь алгоритм извлечения признаков из последовательности, чтобы при этом порядок не был важен. К примеру, [1,2,3] и [1,3,2] — одно и то же.

Henadz

21.02.2018
16:12:29

Ребят, подскажите кто-нибудь алгоритм извлечения признаков из последовательности, чтобы при этом порядок не был важен. К примеру, [1,2,3] и [1,3,2] — одно и то же.

bag of elements?

Vyaches

21.02.2018
16:12:45

maybe

Henadz

21.02.2018
16:14:59

это я, если что, подход предложил, а не спрашивал )

Vyaches

21.02.2018
16:16:27

я понял, гуглю :)

Кстати, кто-нибудь знает как статьи на arxiv заливают? :D

Vladimir

21.02.2018
17:36:28

Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?: Intel Xeon Intel Xeon Phi NVidia Tesla NVidia Kepler И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

Andrey

21.02.2018
17:38:16

Нвидиа процессоры не делает пока

Henadz

21.02.2018
17:39:16

Нвидиа процессоры не делает пока

в смысле? а Tegra

Andrey

21.02.2018
17:40:03

Это SOC

Admin

ERROR: S client not available

Google

Andrey

21.02.2018
17:40:35

В списке выше точно не процессоры

Pavlo

21.02.2018
17:40:35

Нвидиа процессоры не делает пока

а GPU это типа не процессор?

в аббревиатурах CPU, GPU, TPU вторые две буквы ни на что не намекают?

Henadz

21.02.2018
17:41:39

а GPU это типа не процессор?

+

Это SOC

и что? процесор в этом СоКе тоже их разработка

Andrey

21.02.2018
17:42:37

По-русски процессором называют CPU

Henadz

21.02.2018
17:43:06

По-русски процессором называют CPU

Я его по русски называю ЦПУ

Pavlo

21.02.2018
17:43:11

неграмотно процессором называют CPU. а некоторые люди неграмотно процессором ещё и системный блок называют

так и что теперь, перенимать плохие привычки неграмотных людей?

Andrey

21.02.2018
17:45:21

Речь о заказе мощностей железа. Там Intel Xeon, Intel phi и ускорители nvidia не являются взаимозаменяемыми

Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?: Intel Xeon Intel Xeon Phi NVidia Tesla NVidia Kepler И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

128 ядер CUDA?

Vladimir

21.02.2018
17:56:32

128 ядер CUDA?

Да

Andrey

21.02.2018
17:56:46

не густо

в одной GTX1080ti их 3584

Uncel

21.02.2018
17:59:25

Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?: Intel Xeon Intel Xeon Phi NVidia Tesla NVidia Kepler И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

Платформу с nvlink

Если именно невидию хочется

( dgx-1 как пример )

Или такой ящик https://www.supermicro.com/products/system/4U/4028/SYS-4028GR-TVRT.cfm

/dev

21.02.2018
18:11:34

Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?: Intel Xeon Intel Xeon Phi NVidia Tesla NVidia Kepler И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

Советовал бы NVidia архитектуры Volta дождаться, если терпит

Dmitry

21.02.2018
18:31:11

Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?: Intel Xeon Intel Xeon Phi NVidia Tesla NVidia Kepler И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

Запустить задачу на своей пеке, замерить время, узнать, сколько там флопсов, прикинуть с запасом

Google

Henadz

21.02.2018
18:37:06

Запустить задачу на своей пеке, замерить время, узнать, сколько там флопсов, прикинуть с запасом

зависимость может быть нелинейной

Dmitry

21.02.2018
18:38:50

зависимость может быть нелинейной

много что может быть, гфлопсы довольно искусственно меряются, но как первое приближение подойдет

Pipito

21.02.2018
19:04:32

ребят есть возможность при работе с алгоритмом вывести не в виде вероятности принадлежности объекта X к классу Y, а скорее в виде какого-то суммарного количества очков, которое набрал тот или иной объект класса X. Пример абстрактной задачи: Есть 10 футбольных команд и необходимо предсказать какая из этих команд займет 1-ое место в турнире. То что хотелось бы получить - это список команд в таком виде: Команда 1: 250 очков. Команда 2: 190 очков. Команда 3: 100 очков. ... Команда 10: 20 очков

Но это не задача регрессии, потому что -изначально переменная Y содержит 2 класса(Победа/Поражение)

Boris

21.02.2018
19:08:58

вероятность тоже можно интерпретировать как количество очков. ты не определил что значат очки в твоем случае

как только определишь сразу поймешь как их подсчитать )

« Назад

Страница 230 из 327

Далее »

Открыть в Telegram