
Drino
19.02.2018
22:12:30
blob тут значит "мешок с цифрами фиксиованного размера, пригодный для скармливания классификатору"
Он делает грейскейл, вычитает среднее, приводит картинку к конкретному размеру.
*пардон, он не делает грейскейл
Если верить этому блогу - всё, что он делает - вычитает (104,117,123) из R G и B слоёв и потом делит их на 1.0 (второй аргумент)

Google

Drino
19.02.2018
22:17:03
Ну и скейлит картинку в 244x244, сохраняя при этом три канала

dot
19.02.2018
22:27:22
Аа все понял , спасибо огромное за помощь
тоесть он делает из картинки по сути мешок слов да а потом передает их классификатору ?

Drino
19.02.2018
22:29:03
Не мешок слов. Он просто рескейлит картинку в 244x244, а потом вычитает из каждого слоя 104, 117 и 123 (среднее)
Поскольку это уже не совсем картинка (всё-таки RGB-каналы в нормальной картинке неотрицательны) они называют это блобом.

dot
19.02.2018
22:30:12
а рескейлит это в смысле уменьшает изображение ?

Drino
19.02.2018
22:30:28
Ну, если оно было больше 244x244 - уменьшает. Было меньше - увеличивает.

dot
19.02.2018
22:31:17
аа ясно просто не соображу никак по какому алгоритму он определяет что на картинке

Drino
19.02.2018
22:32:10
Он никак этого пока что не делает. Это подготовка данных.

dot
19.02.2018
22:32:54
аа все понял спасибо большое , щас дальше поразбираюсь

V
20.02.2018
15:32:25
Ребят, помощь нужна. Слегка далёк от machineLearning, но вот пришлось начать разбираться для дисера) надо сделать sentimentAnalysis политических новостей, но не могу найти подходящего датасета, если тренировать через дату из твиттера или просто “bucketofwords”, то слишком много ошибочных классификаций, подскажите пожалуйста как обойти эту проблему или где датасет нормальный найти????
Нууу reviews не очень подходит, слишком много ошибок, твиттер тоже

Alexandr
20.02.2018
16:54:24
https://gwu-libraries.github.io/sfm-ui/posts/2016-11-30-election-dataset

Google

Alexandr
20.02.2018
16:54:39
2016 United States Presidential Election Tweet Ids dataset
На русском - вряд ли такое есть. Возможно - всякие группы нэвэльного или ходорковского такое собирали

V
20.02.2018
16:56:41
Мне как раз на английском надо) только я обрабатываю статьи, а не твиты, они гораздо длиннее, и поэтому на твитах тренировать вроде не очень

Pavel
20.02.2018
20:58:55
Pavel Kashchenko:
Добрый вечер. Под скажите пожалуйста, может кому-то встречался датасет содержащий разметку новостных текстов по полярности высказываемого мнения относительно курса того или иного финансового инструмента или курса валюты.

Vyaches
20.02.2018
22:28:27
народ, не подскажете, гитхаб лежит, или это у меня проблемы?

Dan
20.02.2018
22:32:32
Вроде всё работает

Vyaches
20.02.2018
22:35:26
внезапно заработало, спасибо

Andrey
21.02.2018
10:04:29
https://lemlist.com/

dot
21.02.2018
10:23:43
Всем привет , а может ктонибудь объяснить что делает третий параметр функции cv2.dnn.blobFromImage в описании написано
Here we supply the spatial size that the Convolutional Neural Network expects. For most current state-of-the-art neural networks this is either 224×224, 227×227, or 299×299.
я понял что это матрица каакято а для чего она нужна ?

Alexey
21.02.2018
10:26:52
Это входной размер матрицы для нейросети
Т е картинка сначала ресайзится (и не только) для правильного входа в нейросеть

dot
21.02.2018
10:27:31
эмм а что в нее будет записываться ?

Alexey
21.02.2018
10:27:49
Не понял.

dot
21.02.2018
10:28:14
или она потом после того как отресайзиться записывается в эту матрицу ?

Alexey
21.02.2018
10:29:10
blobFromImage возмращает нужную нам матрицу конечно
Потом юзаешь примерно так
net.setInput(blob);
Mat detections = net.forward();

dot
21.02.2018
10:31:02
да я это понял, но я вот не понимаю ,вы пишете```
Это входной размер матрицы для нейросети
` я не понимаю тоесть что будет хранится в этоматрице, которую мы в третьем параметре передаем ?

Alexey
21.02.2018
10:31:52
напишите сигнатуру функции, я не понял тогда про какой такой третий параметр вы говорите
Я вижу, что третий параметр это просто размер

Google

dot
21.02.2018
10:32:54
там только такое
cv::dnn::blobFromImage (InputArray image, double scalefactor=1.0, const Size &size=Size(), const Scalar &mean=Scalar(), bool swapRB=true, bool crop=true)

Alexey
21.02.2018
10:33:12
const Size &size=Size()
Это просто размер

dot
21.02.2018
10:36:08
аа все понял , походу это тупо размер выходной картинки , щас потестю
хмм странно чем больше я ее размеры задаю тем больше объектор распознается. Я просто вот как тут делаю https://www.pyimagesearch.com/2017/09/11/object-detection-with-deep-learning-and-opencv/
аа кажется понял ,чем больше матрица тем больше туда данных можно вписать и тем больше объектов можно будет распознать, вообщем походу это та часть изображения которая как бы сканируется :)

Alexey
21.02.2018
11:03:14
Это размер до которого будет скейлиться исходный фрейм

dot
21.02.2018
12:36:28
ааа все понял, в нем и будут искаться объекты ,хотя надо еще поразбираться конечно

Alexey
21.02.2018
15:10:14
Да в выходной матрице которая поступит на вход сверточной нейросеть будут находиться объекты

Vyaches
21.02.2018
16:11:47
Ребят, подскажите кто-нибудь алгоритм извлечения признаков из последовательности, чтобы при этом порядок не был важен.
К примеру, [1,2,3] и [1,3,2] — одно и то же.

Henadz
21.02.2018
16:12:29

Vyaches
21.02.2018
16:12:45
maybe

Henadz
21.02.2018
16:14:59
это я, если что, подход предложил, а не спрашивал )

Vyaches
21.02.2018
16:16:27
я понял, гуглю :)
Кстати, кто-нибудь знает как статьи на arxiv заливают? :D

Vladimir
21.02.2018
17:36:28
Какой процессор лучше для задач машинного обучения (до 100 тыс объектов, до 10 тыс признаков)?:
Intel Xeon
Intel Xeon Phi
NVidia Tesla
NVidia Kepler
И сколько просить ядер? (максимум 128), так чтобы хватило, но не запросить слишком много
Нужно заполнить заявку на универский кластер, а я ни в зуб ногой в этом вопросе)

Andrey
21.02.2018
17:38:16
Нвидиа процессоры не делает пока

Henadz
21.02.2018
17:39:16

Andrey
21.02.2018
17:40:03
Это SOC

Admin
ERROR: S client not available

Google

Andrey
21.02.2018
17:40:35
В списке выше точно не процессоры

Pavlo
21.02.2018
17:40:35
в аббревиатурах CPU, GPU, TPU вторые две буквы ни на что не намекают?

Henadz
21.02.2018
17:41:39
Это SOC
и что? процесор в этом СоКе тоже их разработка

Andrey
21.02.2018
17:42:37
По-русски процессором называют CPU

Henadz
21.02.2018
17:43:06

Pavlo
21.02.2018
17:43:11
неграмотно процессором называют CPU. а некоторые люди неграмотно процессором ещё и системный блок называют
так и что теперь, перенимать плохие привычки неграмотных людей?

Andrey
21.02.2018
17:45:21
Речь о заказе мощностей железа. Там Intel Xeon, Intel phi и ускорители nvidia не являются взаимозаменяемыми

Vladimir
21.02.2018
17:56:32

Andrey
21.02.2018
17:56:46
не густо
в одной GTX1080ti их 3584

Uncel
21.02.2018
17:59:25
Если именно невидию хочется
( dgx-1 как пример )
Или такой ящик https://www.supermicro.com/products/system/4U/4028/SYS-4028GR-TVRT.cfm

/dev
21.02.2018
18:11:34

Dmitry
21.02.2018
18:31:11

Google

Henadz
21.02.2018
18:37:06

Dmitry
21.02.2018
18:38:50

Pipito
21.02.2018
19:04:32
ребят есть возможность при работе с алгоритмом вывести не в виде вероятности принадлежности объекта X к классу Y, а скорее в виде какого-то суммарного количества очков, которое набрал тот или иной объект класса X.
Пример абстрактной задачи:
Есть 10 футбольных команд и необходимо предсказать какая из этих команд займет 1-ое место в турнире. То что хотелось бы получить - это список команд в таком виде:
Команда 1: 250 очков.
Команда 2: 190 очков.
Команда 3: 100 очков.
...
Команда 10: 20 очков
Но это не задача регрессии, потому что -изначально переменная Y содержит 2 класса(Победа/Поражение)

Boris
21.02.2018
19:08:58
вероятность тоже можно интерпретировать как количество очков. ты не определил что значат очки в твоем случае
как только определишь сразу поймешь как их подсчитать )