@bigdata_ru

Страница 231 из 327
Pipito
21.02.2018
19:10:11
[[ 1.00000000e+00 7.69558688e-28] [ 1.00000000e+00 8.59683971e-30] [ 1.00000000e+00 4.92047575e-26] [ 1.00000000e+00 5.97378874e-32] [ 1.00000000e+00 5.97378874e-32] [ 4.03179274e-15 1.00000000e+00] [ 1.00000000e+00 5.97378874e-32] [ 1.00000000e+00 1.80989507e-28] [ 1.00000000e+00 2.09082606e-31] [ 7.95189204e-08 9.99999920e-01] [ 1.00000000e+00 3.82322479e-30] [ 1.00000000e+00 2.03603687e-31] [ 1.00000000e+00 1.21282661e-30] [ 1.00000000e+00 2.29446927e-24] [ 1.00000000e+00 9.45997501e-24]]

predict_proba Binary Bayes

Boris
21.02.2018
19:13:52
TrueSkill
трускилл на выходе дает прогноз в виде вероятности, как получить "очки"?

Sergey
21.02.2018
19:15:22
Ranks тоже может отдавать

Google
dot
22.02.2018
07:25:23
Всем привет , а можете подсказать откуда взять инфу о том в какие элементы массива куда кладутся в результате распознований изображения для сети которая вызывается так cv2.dnn.readNetFromCaffe(prototxt,model) net.setInput(blob) detections = net.forward() и вот в этом detections как раз проблема, а в официальном тутриале просто тупо пишется что это массивы и все(я это и без них знаю)

блин точнее detections.shape[2] дает чило распознанных изображенийцъ

извиняюсь сбивчиво пишу, просто вот в этом detections.shape[2] отображается число найденных объектов, box=detections[0,0,i,3:7]*np.array([w,h,w,h]) срез от 3 до 7 даст координаты обнаруженого объекта, но есть еще какие то параметры которые я не знаю. Где их можно посмотреть ?

CrAzZy_
22.02.2018
13:40:29
хай гайс не подкините юпитер-ноутбук с конспектом по pandas и sclearn?

Anton
22.02.2018
14:13:13
Всем привет, а может кто подскажет какую-нибудь статью по одноклассовой классификации текста с помощью нейронных сетей?)

Артем
22.02.2018
14:16:44
а зачем вам классифицировать текст с помощью нейронных сетей? Чем обычные методы не устраивают?

Alexey
22.02.2018
14:17:12
CrAzZy_
22.02.2018
14:28:46
оооо, длагодарю

Anastasia
22.02.2018
14:30:17
наверное, что одному доку соответствует только один класс

Anton
22.02.2018
14:31:56
А что значит одноклассовая классификация?
Это значит,что имеется только один класс и нам нужно установить, принадлежит ли текст к этому классу или нет

Сергей
22.02.2018
14:32:22
Спс

Google
Vyaches
22.02.2018
17:02:19
Это значит,что имеется только один класс и нам нужно установить, принадлежит ли текст к этому классу или нет
помоему твоя одноклассовая классификация не такая уж и одноклассовая :DD

Jerlis
22.02.2018
17:39:41
ребята, подскажите чатики по AR

Влада
22.02.2018
17:43:43
Ребят, всем привет. Подскажите, заработают ли свертки в решении задач сегментации, если просто ставить "точку"- пиксель в центре объекта.

Хочу попробовать выделять вихри (циклоны-антициклонв) на спутниковых снимках, но как размечать - чтото пока не особо понимаю.

Andrey
22.02.2018
17:47:59
нужна бинарная маска

Влада
22.02.2018
17:53:40
Та блин, это ясное дело. Я про то как именно эту маску размечать. Какие объекты выделять.

Andrey
22.02.2018
18:04:14
рекомендую http://www.robots.ox.ac.uk/~vgg/software/via/

Nagendra
23.02.2018
08:56:50
Looking for datascience training

Владимир
23.02.2018
10:09:13
Добрый день! Появилась необходимости написать инструмент, который будет "предсказывать" исход события, на основании большой статистической базы данных. Есть две таблицы: группа сущностей; список самих сущностей. От сущностей в группах зависит результат группы. С течением времени эти сущности могут переходить в разные группы. Необходимо предсказывать результат группы, учитывая большое количество разных факторов. Я перечитал уже много разной литературы, но по-прежнему затрудняюсь определиться, с чего таки мне начинать. Разделов много, направлений тоже. Какое направление/решение подойдёт для воплощения этой задачи? Я full stack разработчик, со знанием языков программирования всё в порядке, мне только необходима помощь в выборе правильного направления. Благодарю заранее.

Сергей
23.02.2018
10:18:47
Softmax-регрессия

Но.. Это не точно...

Там, вроде, как раз множество исходов по входному вектору

Вообще, если я правильно понял, есть множество характеристик и меток, да можно и нейросеть пробовать

Но вот то что они "гуляют" с течением времени - нехорошо

Я хз чо с этим делать, мб переучивать

Drino
23.02.2018
10:48:48
Добрый день! Появилась необходимости написать инструмент, который будет "предсказывать" исход события, на основании большой статистической базы данных. Есть две таблицы: группа сущностей; список самих сущностей. От сущностей в группах зависит результат группы. С течением времени эти сущности могут переходить в разные группы. Необходимо предсказывать результат группы, учитывая большое количество разных факторов. Я перечитал уже много разной литературы, но по-прежнему затрудняюсь определиться, с чего таки мне начинать. Разделов много, направлений тоже. Какое направление/решение подойдёт для воплощения этой задачи? Я full stack разработчик, со знанием языков программирования всё в порядке, мне только необходима помощь в выборе правильного направления. Благодарю заранее.
А характеристики с течением времени меняются?

Artyom
23.02.2018
10:51:42
4 зээ

Drino
23.02.2018
10:52:07
Я бы предложил градиентный бустинг. XGBoost, lightgbm, catboost. Но пайплайн в принципе обыкновенный - поделить на трейн и тест (с учётом специфики - тест будет позже по времени), попробовать все эти модели (не забыть гридсёрч по параметрам) и выкатить лучшую

Владимир
23.02.2018
11:01:28
А характеристики с течением времени меняются?
характеристики сущностей – нет. но от состава сущностей в группах меняется общий результат группы.

Drino
23.02.2018
11:05:55
Google
Drino
23.02.2018
11:09:44
Если да, то могу предложить два варианта - сделать обычную (бустинг, логрегрессия) модель на статистиках внутри групп (среднее значение признака внутри группы, сумма признака, отклонения и т.п.), либо взять в руки какой-нибудь фреймворк для нейросетей и там сделать более "умную" агрегацию - свёрткой, например.

Но тут все зависит от природы данных

dot
23.02.2018
11:16:27
Всем привет , а ктонибудь знает что такое пулинг ? это понятие используется в компьютерном зрении. Я блин забыл для чего это нужно :( В блоге пишут We can use the MaxPooling2D class for max-pooling operations.

Случайно не для объеденения нескольких операций свертки в одну ?

dot
23.02.2018
11:18:21
аа все понял спасибо :)

Владимир
23.02.2018
11:22:10
я позже пример данных распишу

а что скажете за TensorFlow ? его так рекламируют..

я так понимаю, что он достаточно сырой и медленнее

Anastasia
23.02.2018
13:26:04
медленнее чего?

Viktor
23.02.2018
13:27:50
сырее чего?

Владимир
23.02.2018
13:28:36
медленнее чего?
того же xgboost. сам не проверял – в интернете тесты откопал :)

Anastasia
23.02.2018
13:29:14
а ну просто tensorflow это не только градиентный спуск

Henadz
23.02.2018
13:30:09
того же xgboost. сам не проверял – в интернете тесты откопал :)
ну вы сравнили конечно кашу с винтовкой )

Владимир
23.02.2018
13:31:19
ну вы сравнили конечно кашу с винтовкой )
пытаюсь разобраться что к чему, никогда с этим не сталкивался :)

Admin
ERROR: S client not available

Владимир
23.02.2018
13:31:29
а что есть каша, а что винтовка, в этом случае? :)

Henadz
23.02.2018
13:32:02
неважно, главное, что они неособо сравнимы

Google
Henadz
23.02.2018
13:32:50
tensorflow, как следует из названия, создан для эффективных тензорных вычислений

к которым сводится обучение большинства нейронок

Владимир
23.02.2018
13:34:22
tensorflow, как следует из названия, создан для эффективных тензорных вычислений
но я так понимаю, что мне этот вариант не подходит, в связи с многомерностью моих данных. верно?

Henadz
23.02.2018
13:34:35
зависит от специфики

картинки тоже многомерны

тем не менее с ними работают свёрточными сетками

Владимир
23.02.2018
13:38:05
картинки тоже многомерны
у меня две таблицы с данными :))

Henadz
23.02.2018
13:38:37
ну если признаки сильно разнородны, то наврядли нейронки вам зайдут

практика показывает, что НС лучше работают с однородными данными

Vlad
23.02.2018
14:20:23
у меня две таблицы с данными :))
так а что за задача? какой результат группы? какоето число или категория? количество сущностей в группе фиксировано или меняется от группы к группе? есть ли датасет с описанием группы и результатом группы, тоесть это решается супервайзд или не супервайзд

dot
23.02.2018
19:01:18
Всем привет :) Подскажите пожалуйста что означает ошибка ValueError: Found input variables with inconsistent numbers of samples: [0,1] в функции train_test_split ? Суть самой функции я так понял в разделении данных на тестовые данные и тренировочные.

Drino
23.02.2018
19:11:53
Сделай reshape на целевую функцию

Anatoly
23.02.2018
19:12:04
количество тестовых данных и ответов не совпало

Drino
23.02.2018
19:12:29
Или перегони из пандас.дф в нампайный массив

Двумерный, обязательно

dot
23.02.2018
19:13:17
хмм щас попробую разобраться как это сделать , всем спасибо за ответы :)

данные у них и так получается из нампи берутся data = np.array(data, dtype="float") / 255.0

Google
Ivan
23.02.2018
19:24:02
С чего, помимо английского языка, начать обучение в больших данных?

Drino
23.02.2018
19:31:31
dot
23.02.2018
19:33:02
да я уже понял где там косяк был, смутно правда но понял , размерность массивов data и labels была разная , изза этого та ошибка и выбивалась

Страница 231 из 327