
Pipito
21.02.2018
19:10:11
[[ 1.00000000e+00 7.69558688e-28]
[ 1.00000000e+00 8.59683971e-30]
[ 1.00000000e+00 4.92047575e-26]
[ 1.00000000e+00 5.97378874e-32]
[ 1.00000000e+00 5.97378874e-32]
[ 4.03179274e-15 1.00000000e+00]
[ 1.00000000e+00 5.97378874e-32]
[ 1.00000000e+00 1.80989507e-28]
[ 1.00000000e+00 2.09082606e-31]
[ 7.95189204e-08 9.99999920e-01]
[ 1.00000000e+00 3.82322479e-30]
[ 1.00000000e+00 2.03603687e-31]
[ 1.00000000e+00 1.21282661e-30]
[ 1.00000000e+00 2.29446927e-24]
[ 1.00000000e+00 9.45997501e-24]]
predict_proba Binary Bayes

Boris
21.02.2018
19:13:52
TrueSkill
трускилл на выходе дает прогноз в виде вероятности, как получить "очки"?

Sergey
21.02.2018
19:15:22
Ranks тоже может отдавать

Google

dot
22.02.2018
07:25:23
Всем привет , а можете подсказать откуда взять инфу о том в какие элементы массива куда кладутся в результате распознований изображения для сети которая вызывается так
cv2.dnn.readNetFromCaffe(prototxt,model) net.setInput(blob)
detections = net.forward()
и вот в этом detections как раз проблема, а в официальном тутриале просто тупо пишется что это массивы и все(я это и без них знаю)
блин точнее detections.shape[2] дает чило распознанных изображенийцъ
извиняюсь сбивчиво пишу, просто вот в этом detections.shape[2] отображается число найденных объектов,
box=detections[0,0,i,3:7]*np.array([w,h,w,h])
срез от 3 до 7 даст координаты обнаруженого объекта, но есть еще какие то параметры которые я не знаю. Где их можно посмотреть ?

CrAzZy_
22.02.2018
13:40:29
хай гайс
не подкините юпитер-ноутбук с конспектом по pandas и sclearn?

Anton
22.02.2018
14:13:13
Всем привет, а может кто подскажет какую-нибудь статью по одноклассовой классификации текста с помощью нейронных сетей?)

Артем
22.02.2018
14:16:44
а зачем вам классифицировать текст с помощью нейронных сетей? Чем обычные методы не устраивают?

Alexey
22.02.2018
14:17:12

Anastasia
22.02.2018
14:18:11

CrAzZy_
22.02.2018
14:28:46
оооо, длагодарю

Сергей
22.02.2018
14:29:51

Anastasia
22.02.2018
14:30:17
наверное, что одному доку соответствует только один класс

Anton
22.02.2018
14:31:56

Сергей
22.02.2018
14:32:22
Спс

Google

Vyaches
22.02.2018
17:02:19

Jerlis
22.02.2018
17:39:41
ребята, подскажите чатики по AR

Влада
22.02.2018
17:43:43
Ребят, всем привет. Подскажите, заработают ли свертки в решении задач сегментации, если просто ставить "точку"- пиксель в центре объекта.
Хочу попробовать выделять вихри (циклоны-антициклонв) на спутниковых снимках, но как размечать - чтото пока не особо понимаю.

Andrey
22.02.2018
17:47:59
нужна бинарная маска

Влада
22.02.2018
17:53:40
Та блин, это ясное дело. Я про то как именно эту маску размечать. Какие объекты выделять.

Andrey
22.02.2018
18:04:14
рекомендую http://www.robots.ox.ac.uk/~vgg/software/via/

Nagendra
23.02.2018
08:56:50
Looking for datascience training

Владимир
23.02.2018
10:09:13
Добрый день!
Появилась необходимости написать инструмент, который будет "предсказывать" исход события, на основании большой статистической базы данных.
Есть две таблицы: группа сущностей; список самих сущностей. От сущностей в группах зависит результат группы. С течением времени эти сущности могут переходить в разные группы.
Необходимо предсказывать результат группы, учитывая большое количество разных факторов.
Я перечитал уже много разной литературы, но по-прежнему затрудняюсь определиться, с чего таки мне начинать. Разделов много, направлений тоже.
Какое направление/решение подойдёт для воплощения этой задачи?
Я full stack разработчик, со знанием языков программирования всё в порядке, мне только необходима помощь в выборе правильного направления.
Благодарю заранее.


Сергей
23.02.2018
10:18:47
Softmax-регрессия
Но.. Это не точно...
Там, вроде, как раз множество исходов по входному вектору
Вообще, если я правильно понял, есть множество характеристик и меток, да можно и нейросеть пробовать
Но вот то что они "гуляют" с течением времени - нехорошо
Я хз чо с этим делать, мб переучивать

Drino
23.02.2018
10:48:48

Artyom
23.02.2018
10:51:42
4 зээ

Drino
23.02.2018
10:52:07
Я бы предложил градиентный бустинг. XGBoost, lightgbm, catboost. Но пайплайн в принципе обыкновенный - поделить на трейн и тест (с учётом специфики - тест будет позже по времени), попробовать все эти модели (не забыть гридсёрч по параметрам) и выкатить лучшую

Владимир
23.02.2018
11:01:28

Drino
23.02.2018
11:05:55

Google

Drino
23.02.2018
11:09:44
Если да, то могу предложить два варианта - сделать обычную (бустинг, логрегрессия) модель на статистиках внутри групп (среднее значение признака внутри группы, сумма признака, отклонения и т.п.), либо взять в руки какой-нибудь фреймворк для нейросетей и там сделать более "умную" агрегацию - свёрткой, например.
Но тут все зависит от природы данных

dot
23.02.2018
11:16:27
Всем привет , а ктонибудь знает что такое пулинг ? это понятие используется в компьютерном зрении. Я блин забыл для чего это нужно :( В блоге пишут
We can use the MaxPooling2D class for max-pooling operations.
Случайно не для объеденения нескольких операций свертки в одну ?

Drino
23.02.2018
11:18:08
Из окошка

dot
23.02.2018
11:18:21
аа все понял спасибо :)

Владимир
23.02.2018
11:22:10
я позже пример данных распишу
а что скажете за TensorFlow ? его так рекламируют..
я так понимаю, что он достаточно сырой и медленнее

Anastasia
23.02.2018
13:26:04
медленнее чего?

Viktor
23.02.2018
13:27:50
сырее чего?

Владимир
23.02.2018
13:28:36
медленнее чего?
того же xgboost. сам не проверял – в интернете тесты откопал :)

Anastasia
23.02.2018
13:29:14
а ну просто tensorflow это не только градиентный спуск

Henadz
23.02.2018
13:30:09

Владимир
23.02.2018
13:31:19

Admin
ERROR: S client not available

Владимир
23.02.2018
13:31:29
а что есть каша, а что винтовка, в этом случае? :)

Henadz
23.02.2018
13:32:02
неважно, главное, что они неособо сравнимы

Google

Henadz
23.02.2018
13:32:50
tensorflow, как следует из названия, создан для эффективных тензорных вычислений
к которым сводится обучение большинства нейронок

Владимир
23.02.2018
13:34:22

Henadz
23.02.2018
13:34:35
зависит от специфики
картинки тоже многомерны
тем не менее с ними работают свёрточными сетками

Владимир
23.02.2018
13:38:05

Henadz
23.02.2018
13:38:37
ну если признаки сильно разнородны, то наврядли нейронки вам зайдут
практика показывает, что НС лучше работают с однородными данными

Vlad
23.02.2018
14:20:23
у меня две таблицы с данными :))
так а что за задача? какой результат группы? какоето число или категория? количество сущностей в группе фиксировано или меняется от группы к группе? есть ли датасет с описанием группы и результатом группы, тоесть это решается супервайзд или не супервайзд

Владимир
23.02.2018
16:49:48
нашёл хороший пример, но в этом случае данных мало, я бы хотел ещё туда игроков подвязать, погодные условия и т.д.

dot
23.02.2018
19:01:18
Всем привет :) Подскажите пожалуйста что означает ошибка ValueError: Found input variables with inconsistent numbers of samples: [0,1] в функции train_test_split ? Суть самой функции я так понял в разделении данных на тестовые данные и тренировочные.

Drino
23.02.2018
19:11:53
Сделай reshape на целевую функцию

Anatoly
23.02.2018
19:12:04
количество тестовых данных и ответов не совпало

Drino
23.02.2018
19:12:29
Или перегони из пандас.дф в нампайный массив
Двумерный, обязательно

dot
23.02.2018
19:13:17
хмм щас попробую разобраться как это сделать , всем спасибо за ответы :)
данные у них и так получается из нампи берутся
data = np.array(data, dtype="float") / 255.0

Google

Ivan
23.02.2018
19:24:02
С чего, помимо английского языка, начать обучение в больших данных?

Henadz
23.02.2018
19:26:21

Drino
23.02.2018
19:31:31

dot
23.02.2018
19:33:02
да я уже понял где там косяк был, смутно правда но понял , размерность массивов data и labels была разная , изза этого та ошибка и выбивалась