@bigdata_ru

« Назад

Страница 301 из 327

Далее »

Скрудж

22.08.2018
22:41:11

https://www.twitch.tv/dota2ti оно ведь?

Сорри, если такие ссылки запрещены. Могу удалить

Evgeniy

22.08.2018
22:41:31

https://www.twitch.tv/dota2ti оно ведь?

оно но там счас другая игра

Скрудж

22.08.2018
22:42:05

ну то есть если мы построим рок, то идеальный случай это когда она проходит через 0,1 а худший, когда она проходит через 1,0

Да, понимаю. Можно дальше?

Google

Evgeniy

22.08.2018
22:42:32

Да, понимаю. Можно дальше?

соответсвенно если площадь под рок большая это хорошо

если маленькая плохо

Скрудж

22.08.2018
22:42:47

соответсвенно если площадь под рок большая это хорошо

это auc?

Evgeniy

22.08.2018
22:42:55

это auc?

да

area under curve

Скрудж

22.08.2018
22:43:15

Окей, тогда что означает roc auc метрика? Качество?

Evgeniy

22.08.2018
22:43:47

Окей, тогда что означает roc auc метрика? Качество?

ну в целом да

Скрудж

22.08.2018
22:44:27

Ребят, привет. sckit-learn roc_auc_score выдает, скажем так, значение, которое разделяет вероятность 0 и 1? Например, roc_auc_score дал результат 0.80, значит то, что меньше 0.80 это 0, а больше - 1?

значит, roc_auc_score возвращает качество бинарной классификации? Но как это понять, если я даю тренировочный сет, получаю результат

Evgeniy

22.08.2018
22:44:50

значит, roc_auc_score возвращает качество бинарной классификации? Но как это понять, если я даю тренировочный сет, получаю результат

что значит "как понять"

1 хорошо

0 плохо

Скрудж

22.08.2018
22:46:22

что значит "как понять"

Evgeniy

22.08.2018
22:46:37

нет не значит

Google

Evgeniy

22.08.2018
22:46:50

значит что площадь под roc 0.75

Скрудж

22.08.2018
22:47:25

И все?) Понял

Evgeniy

22.08.2018
22:47:35

?

Скрудж

22.08.2018
22:47:43

?

Спасибо огромное

Emil

23.08.2018
04:43:41

?

Евгений, да вы прям как учитель объяснили ?

Sewerin

23.08.2018
04:44:34

Площадь roc auc должна стремиться к единице, верно?

И всё.

49060

23.08.2018
06:59:28

Roc_auc она хорошо работает для тех случаев, когда данные сбалансированы

Если данные не сбалансированы лучше f1_score

Потому что площадь может быть одинаковой при большом FPR и маленьком TPR и наоборот, если важен меньший класс (что достаточно часто, так как события например в мед диагностике идут с соотношением 1:10) - лучше выбрать другую метрику. Как правило следят и за roc_auc, и за f1, f1 это типа среднее гармоническое между recall и precision.

Меня кстати на защите тоже спросили а почему большой roc_auc - хорошо, объяснял в том же стиле, что сверху написали?

Dan

23.08.2018
14:54:17

Витя

23.08.2018
16:22:32

Как на кегле понять, хотят от тебя predict или predict_proba?

Artyom

23.08.2018
16:44:04

ну вообще-то на кеггле метрику хотят от вас)

надо accuracy, смотрим predict

надо auc, берем predict_proba

ну это такое, конечно, объяснение

Admin

ERROR: S client not available

Artyom

23.08.2018
16:45:25

по чукотски

Витя

23.08.2018
17:24:47

ну вообще-то на кеггле метрику хотят от вас)

Ну да, я это имел ввиду) Я уже увидел в описании, разобрался, спасибо!

Google

Sewerin

23.08.2018
21:46:52

А кто-нибудь использовал бустинг с бустером Dart? Какие значение rate и skip drop обычно наиболее адекватно? Можете пояснить про соотношение?

Скрудж

24.08.2018
13:14:37

Ребят, простите за тупейший вопрос. Kaggle это комьюнити по МЛ и DC, где есть куча данных для тренировки и развития навыков? Просто у меня все datasets с kaggle говорят загружать(учусь в ML), вот я и не могу понять, что это такое

Артем

24.08.2018
13:34:05

почти) https://www.kaggle.com/

Сергей

24.08.2018
14:05:56

Подскажите, я правильно понял разницу (в tensorflow) : в tf.variable можно что-то положить и изменять, а в tf.placeholder - только продолжить и использовать?

Dmitry

24.08.2018
14:16:36

Плейсхолдер - обещание что-то подходящее положить, а вэрибл - положить сразу

Сергей

24.08.2018
14:36:23

То есть, теоретически, не обязательно что-то определенное использовать? К примеру веса в нейронках - variable, можно попробовать placeholder?

Seva

25.08.2018
00:54:38

Всем привет, такой вопрос. У меня есть десятки тысяч тайм серий. Все они примерно одной природы (скажем производные от данных со свитчей). Хочу построить какие-нибудь легковесные модельки, которые бы позволяли находить тайм серии, которые ведут себя странно на фоне других. Видел ли кто-нибудь работы на подобную тему? Или сам сталкивался?

На всякий случай, ключевое отличие, что тайм серия не одна.

Чуть более конкретный вопрос. Есть некая Copula Theory. Я с ней не очень знаком, но может кто-то пытался применить на практике. Ее имеет смысл изучить?

CrAzZy_

25.08.2018
05:11:35

Всем привет, такой вопрос. У меня есть десятки тысяч тайм серий. Все они примерно одной природы (скажем производные от данных со свитчей). Хочу построить какие-нибудь легковесные модельки, которые бы позволяли находить тайм серии, которые ведут себя странно на фоне других. Видел ли кто-нибудь работы на подобную тему? Или сам сталкивался?

https://arxiv.org/abs/1802.06360

Аналогичных работ масса по запросу "anomaly detection"

Seva

25.08.2018
06:36:14

Это очевидно не то

Seva

25.08.2018
06:36:55

Хотя бы в силу природы. Я не верю, что картинки и тайм серии будут идти через одну архитектуру.

+ вопрос к тому, насколько легковесна сама модель

« Назад

Страница 301 из 327

Далее »

Открыть в Telegram