
Скрудж
22.08.2018
22:41:11
https://www.twitch.tv/dota2ti оно ведь?
Сорри, если такие ссылки запрещены. Могу удалить

Evgeniy
22.08.2018
22:41:31

Скрудж
22.08.2018
22:42:05

Google

Evgeniy
22.08.2018
22:42:32
если маленькая плохо

Скрудж
22.08.2018
22:42:47

Evgeniy
22.08.2018
22:42:55
area under curve

Скрудж
22.08.2018
22:43:15
Окей, тогда что означает roc auc метрика? Качество?

Evgeniy
22.08.2018
22:43:47

Скрудж
22.08.2018
22:44:27
Ребят, привет. sckit-learn roc_auc_score выдает, скажем так, значение, которое разделяет вероятность 0 и 1? Например, roc_auc_score дал результат 0.80, значит то, что меньше 0.80 это 0, а больше - 1?
значит, roc_auc_score возвращает качество бинарной классификации? Но как это понять, если я даю тренировочный сет, получаю результат

Evgeniy
22.08.2018
22:44:50
1 хорошо
0 плохо

Скрудж
22.08.2018
22:46:22

Evgeniy
22.08.2018
22:46:37
нет не значит

Google

Evgeniy
22.08.2018
22:46:50
значит что площадь под roc 0.75

Скрудж
22.08.2018
22:47:25
И все?) Понял

Evgeniy
22.08.2018
22:47:35
?

Скрудж
22.08.2018
22:47:43

Emil
23.08.2018
04:43:41
?
Евгений, да вы прям как учитель объяснили ?

Sewerin
23.08.2018
04:44:34
Площадь roc auc должна стремиться к единице, верно?
И всё.

49060
23.08.2018
06:59:28
Roc_auc она хорошо работает для тех случаев, когда данные сбалансированы
Если данные не сбалансированы лучше f1_score
Потому что площадь может быть одинаковой при большом FPR и маленьком TPR и наоборот, если важен меньший класс (что достаточно часто, так как события например в мед диагностике идут с соотношением 1:10) - лучше выбрать другую метрику. Как правило следят и за roc_auc, и за f1, f1 это типа среднее гармоническое между recall и precision.
Меня кстати на защите тоже спросили а почему большой roc_auc - хорошо, объяснял в том же стиле, что сверху написали?

Dan
23.08.2018
14:54:17

Витя
23.08.2018
16:22:32
Как на кегле понять, хотят от тебя predict или predict_proba?

Artyom
23.08.2018
16:44:04
ну вообще-то на кеггле метрику хотят от вас)
надо accuracy, смотрим predict
надо auc, берем predict_proba
ну это такое, конечно, объяснение

Admin
ERROR: S client not available

Artyom
23.08.2018
16:45:25
по чукотски

Витя
23.08.2018
17:24:47

Google

Sewerin
23.08.2018
21:46:52
А кто-нибудь использовал бустинг с бустером Dart? Какие значение rate и skip drop обычно наиболее адекватно? Можете пояснить про соотношение?

Скрудж
24.08.2018
13:14:37
Ребят, простите за тупейший вопрос. Kaggle это комьюнити по МЛ и DC, где есть куча данных для тренировки и развития навыков?
Просто у меня все datasets с kaggle говорят загружать(учусь в ML), вот я и не могу понять, что это такое

Артем
24.08.2018
13:34:05
почти) https://www.kaggle.com/

Сергей
24.08.2018
14:05:56
Подскажите, я правильно понял разницу (в tensorflow) : в tf.variable можно что-то положить и изменять, а в tf.placeholder - только продолжить и использовать?

Dmitry
24.08.2018
14:16:36
Плейсхолдер - обещание что-то подходящее положить, а вэрибл - положить сразу

Сергей
24.08.2018
14:36:23
То есть, теоретически, не обязательно что-то определенное использовать? К примеру веса в нейронках - variable, можно попробовать placeholder?

Seva
25.08.2018
00:54:38
Всем привет, такой вопрос. У меня есть десятки тысяч тайм серий. Все они примерно одной природы (скажем производные от данных со свитчей). Хочу построить какие-нибудь легковесные модельки, которые бы позволяли находить тайм серии, которые ведут себя странно на фоне других.
Видел ли кто-нибудь работы на подобную тему? Или сам сталкивался?
На всякий случай, ключевое отличие, что тайм серия не одна.
Чуть более конкретный вопрос. Есть некая Copula Theory. Я с ней не очень знаком, но может кто-то пытался применить на практике. Ее имеет смысл изучить?

CrAzZy_
25.08.2018
05:11:35
Аналогичных работ масса по запросу "anomaly detection"

Seva
25.08.2018
06:36:14
Это очевидно не то

Seva
25.08.2018
06:36:55
Хотя бы в силу природы. Я не верю, что картинки и тайм серии будут идти через одну архитектуру.
+ вопрос к тому, насколько легковесна сама модель