@bigdata_ru

Страница 231 из 327

Pipito

21.02.2018
19:10:11

[[ 1.00000000e+00 7.69558688e-28] [ 1.00000000e+00 8.59683971e-30] [ 1.00000000e+00 4.92047575e-26] [ 1.00000000e+00 5.97378874e-32] [ 1.00000000e+00 5.97378874e-32] [ 4.03179274e-15 1.00000000e+00] [ 1.00000000e+00 5.97378874e-32] [ 1.00000000e+00 1.80989507e-28] [ 1.00000000e+00 2.09082606e-31] [ 7.95189204e-08 9.99999920e-01] [ 1.00000000e+00 3.82322479e-30] [ 1.00000000e+00 2.03603687e-31] [ 1.00000000e+00 1.21282661e-30] [ 1.00000000e+00 2.29446927e-24] [ 1.00000000e+00 9.45997501e-24]]

predict_proba Binary Bayes

Boris

21.02.2018
19:13:52

TrueSkill

трускилл на выходе дает прогноз в виде вероятности, как получить "очки"?

Sergey

21.02.2018
19:15:22

Ranks тоже может отдавать

Google

dot

22.02.2018
07:25:23

Всем привет , а можете подсказать откуда взять инфу о том в какие элементы массива куда кладутся в результате распознований изображения для сети которая вызывается так cv2.dnn.readNetFromCaffe(prototxt,model) net.setInput(blob) detections = net.forward() и вот в этом detections как раз проблема, а в официальном тутриале просто тупо пишется что это массивы и все(я это и без них знаю)

блин точнее detections.shape[2] дает чило распознанных изображенийцъ

извиняюсь сбивчиво пишу, просто вот в этом detections.shape[2] отображается число найденных объектов, box=detections[0,0,i,3:7]*np.array([w,h,w,h]) срез от 3 до 7 даст координаты обнаруженого объекта, но есть еще какие то параметры которые я не знаю. Где их можно посмотреть ?

CrAzZy_

22.02.2018
13:40:29

хай гайс не подкините юпитер-ноутбук с конспектом по pandas и sclearn?

Anton

22.02.2018
14:13:13

Всем привет, а может кто подскажет какую-нибудь статью по одноклассовой классификации текста с помощью нейронных сетей?)

Артем

22.02.2018
14:16:44

а зачем вам классифицировать текст с помощью нейронных сетей? Чем обычные методы не устраивают?

Alexey

22.02.2018
14:17:12

хай гайс не подкините юпитер-ноутбук с конспектом по pandas и sclearn?

ви ду нот хев линкс лайк ю вонт

Anastasia

22.02.2018
14:18:11

хай гайс не подкините юпитер-ноутбук с конспектом по pandas и sclearn?

https://github.com/emeraldic/data_sciense

CrAzZy_

22.02.2018
14:28:46

оооо, длагодарю

Сергей

22.02.2018
14:29:51

Всем привет, а может кто подскажет какую-нибудь статью по одноклассовой классификации текста с помощью нейронных сетей?)

А что значит одноклассовая классификация?

Anastasia

22.02.2018
14:30:17

наверное, что одному доку соответствует только один класс

Anton

22.02.2018
14:31:56

А что значит одноклассовая классификация?

Это значит,что имеется только один класс и нам нужно установить, принадлежит ли текст к этому классу или нет

Сергей

22.02.2018
14:32:22

Спс

Google

Vyaches

22.02.2018
17:02:19

Это значит,что имеется только один класс и нам нужно установить, принадлежит ли текст к этому классу или нет

помоему твоя одноклассовая классификация не такая уж и одноклассовая :DD

Jerlis

22.02.2018
17:39:41

ребята, подскажите чатики по AR

Влада

22.02.2018
17:43:43

Ребят, всем привет. Подскажите, заработают ли свертки в решении задач сегментации, если просто ставить "точку"- пиксель в центре объекта.

Хочу попробовать выделять вихри (циклоны-антициклонв) на спутниковых снимках, но как размечать - чтото пока не особо понимаю.

Andrey

22.02.2018
17:47:59

нужна бинарная маска

Влада

22.02.2018
17:53:40

Та блин, это ясное дело. Я про то как именно эту маску размечать. Какие объекты выделять.

Andrey

22.02.2018
18:04:14

рекомендую http://www.robots.ox.ac.uk/~vgg/software/via/

Nagendra

23.02.2018
08:56:50

Looking for datascience training

Владимир

23.02.2018
10:09:13

Добрый день! Появилась необходимости написать инструмент, который будет "предсказывать" исход события, на основании большой статистической базы данных. Есть две таблицы: группа сущностей; список самих сущностей. От сущностей в группах зависит результат группы. С течением времени эти сущности могут переходить в разные группы. Необходимо предсказывать результат группы, учитывая большое количество разных факторов. Я перечитал уже много разной литературы, но по-прежнему затрудняюсь определиться, с чего таки мне начинать. Разделов много, направлений тоже. Какое направление/решение подойдёт для воплощения этой задачи? Я full stack разработчик, со знанием языков программирования всё в порядке, мне только необходима помощь в выборе правильного направления. Благодарю заранее.

Сергей

23.02.2018
10:18:47

Softmax-регрессия

Но.. Это не точно...

Там, вроде, как раз множество исходов по входному вектору

Вообще, если я правильно понял, есть множество характеристик и меток, да можно и нейросеть пробовать

Но вот то что они "гуляют" с течением времени - нехорошо

Я хз чо с этим делать, мб переучивать

Drino

23.02.2018
10:48:48

Добрый день! Появилась необходимости написать инструмент, который будет "предсказывать" исход события, на основании большой статистической базы данных. Есть две таблицы: группа сущностей; список самих сущностей. От сущностей в группах зависит результат группы. С течением времени эти сущности могут переходить в разные группы. Необходимо предсказывать результат группы, учитывая большое количество разных факторов. Я перечитал уже много разной литературы, но по-прежнему затрудняюсь определиться, с чего таки мне начинать. Разделов много, направлений тоже. Какое направление/решение подойдёт для воплощения этой задачи? Я full stack разработчик, со знанием языков программирования всё в порядке, мне только необходима помощь в выборе правильного направления. Благодарю заранее.

А характеристики с течением времени меняются?

Artyom

23.02.2018
10:51:42

4 зээ

Drino

23.02.2018
10:52:07

Я бы предложил градиентный бустинг. XGBoost, lightgbm, catboost. Но пайплайн в принципе обыкновенный - поделить на трейн и тест (с учётом специфики - тест будет позже по времени), попробовать все эти модели (не забыть гридсёрч по параметрам) и выкатить лучшую

Владимир

23.02.2018
11:01:28

А характеристики с течением времени меняются?

характеристики сущностей – нет. но от состава сущностей в группах меняется общий результат группы.

Drino

23.02.2018
11:05:55

характеристики сущностей – нет. но от состава сущностей в группах меняется общий результат группы.

О, тогда сложнее. А у всей группы одинаковый результат?

Google

Drino

23.02.2018
11:09:44

Если да, то могу предложить два варианта - сделать обычную (бустинг, логрегрессия) модель на статистиках внутри групп (среднее значение признака внутри группы, сумма признака, отклонения и т.п.), либо взять в руки какой-нибудь фреймворк для нейросетей и там сделать более "умную" агрегацию - свёрткой, например.

Но тут все зависит от природы данных

dot

23.02.2018
11:16:27

Всем привет , а ктонибудь знает что такое пулинг ? это понятие используется в компьютерном зрении. Я блин забыл для чего это нужно :( В блоге пишут We can use the MaxPooling2D class for max-pooling operations.

Случайно не для объеденения нескольких операций свертки в одну ?

Drino

23.02.2018
11:18:08

Всем привет , а ктонибудь знает что такое пулинг ? это понятие используется в компьютерном зрении. Я блин забыл для чего это нужно :( В блоге пишут We can use the MaxPooling2D class for max-pooling operations.

Это просто взятие максимума

Из окошка

dot

23.02.2018
11:18:21

аа все понял спасибо :)

Владимир

23.02.2018
11:22:10

О, тогда сложнее. А у всей группы одинаковый результат?

да

я позже пример данных распишу

а что скажете за TensorFlow ? его так рекламируют..

я так понимаю, что он достаточно сырой и медленнее

Anastasia

23.02.2018
13:26:04

медленнее чего?

Viktor

23.02.2018
13:27:50

сырее чего?

Владимир

23.02.2018
13:28:36

медленнее чего?

того же xgboost. сам не проверял – в интернете тесты откопал :)

Anastasia

23.02.2018
13:29:14

а ну просто tensorflow это не только градиентный спуск

Henadz

23.02.2018
13:30:09

того же xgboost. сам не проверял – в интернете тесты откопал :)

ну вы сравнили конечно кашу с винтовкой )

Владимир

23.02.2018
13:31:19

ну вы сравнили конечно кашу с винтовкой )

пытаюсь разобраться что к чему, никогда с этим не сталкивался :)

Admin

ERROR: S client not available

Владимир

23.02.2018
13:31:29

а что есть каша, а что винтовка, в этом случае? :)

Henadz

23.02.2018
13:32:02

неважно, главное, что они неособо сравнимы

Google

Henadz

23.02.2018
13:32:50

tensorflow, как следует из названия, создан для эффективных тензорных вычислений

к которым сводится обучение большинства нейронок

Владимир

23.02.2018
13:34:22

tensorflow, как следует из названия, создан для эффективных тензорных вычислений

но я так понимаю, что мне этот вариант не подходит, в связи с многомерностью моих данных. верно?

Henadz

23.02.2018
13:34:35

но я так понимаю, что мне этот вариант не подходит, в связи с многомерностью моих данных. верно?

не знаю

зависит от специфики

картинки тоже многомерны

тем не менее с ними работают свёрточными сетками

Владимир

23.02.2018
13:38:05

картинки тоже многомерны

у меня две таблицы с данными :))

Henadz

23.02.2018
13:38:37

ну если признаки сильно разнородны, то наврядли нейронки вам зайдут

практика показывает, что НС лучше работают с однородными данными

Vlad

23.02.2018
14:20:23

у меня две таблицы с данными :))

так а что за задача? какой результат группы? какоето число или категория? количество сущностей в группе фиксировано или меняется от группы к группе? есть ли датасет с описанием группы и результатом группы, тоесть это решается супервайзд или не супервайзд

Владимир

23.02.2018
16:49:48

так а что за задача? какой результат группы? какоето число или категория? количество сущностей в группе фиксировано или меняется от группы к группе? есть ли датасет с описанием группы и результатом группы, тоесть это решается супервайзд или не супервайзд

https://github.com/AndrewCarterUK/football-predictor

нашёл хороший пример, но в этом случае данных мало, я бы хотел ещё туда игроков подвязать, погодные условия и т.д.

dot

23.02.2018
19:01:18

Всем привет :) Подскажите пожалуйста что означает ошибка ValueError: Found input variables with inconsistent numbers of samples: [0,1] в функции train_test_split ? Суть самой функции я так понял в разделении данных на тестовые данные и тренировочные.

Drino

23.02.2018
19:11:53

Сделай reshape на целевую функцию

Anatoly

23.02.2018
19:12:04

количество тестовых данных и ответов не совпало

Drino

23.02.2018
19:12:29

Или перегони из пандас.дф в нампайный массив

Двумерный, обязательно

dot

23.02.2018
19:13:17

хмм щас попробую разобраться как это сделать , всем спасибо за ответы :)

данные у них и так получается из нампи берутся data = np.array(data, dtype="float") / 255.0

Google

Ivan

23.02.2018
19:24:02

С чего, помимо английского языка, начать обучение в больших данных?

Henadz

23.02.2018
19:26:21

С чего, помимо английского языка, начать обучение в больших данных?

с хадупа?

Drino

23.02.2018
19:31:31

данные у них и так получается из нампи берутся data = np.array(data, dtype="float") / 255.0

Решейпнуть, чтобы массив двумерным был

dot

23.02.2018
19:33:02

да я уже понял где там косяк был, смутно правда но понял , размерность массивов data и labels была разная , изза этого та ошибка и выбивалась

« Назад

Страница 231 из 327

Далее »

Открыть в Telegram