@bigdata_ru

Страница 294 из 327
Dan
09.08.2018
09:11:45
Так и есть

Subdust
09.08.2018
09:12:17
Я просто хочу услышать аргументы противоположной стороны, чтобы возможно зарулить на вышку.

Dan
09.08.2018
09:13:17
Важный момент: увлечение ML пришло к нам "оттуда", а значит они как минимум на шаг впереди. А это значит что у них более проработанная (и подтверждённая опытом) методика, более детализированный и декомпозированный план обучения, и более широкое во всех смыслах коммьюнити.

На вопрос "Зачем оно нужно?" - ответить очень трудно, потому что на этот вопрос ответить можешь только ты сам себе. Однако, практика показывает, что если ты очень упорный, усердный, и умеешь самостоятельно контролировать процесс обучения - то тебе точно не нужны никакие университеты. Но и наставника не будет рядом, который подскажет, поможет, да и вообще сделает из тебя датасатаниста.

Google
Dan
09.08.2018
09:15:02
Подумай об этом

Tsh
09.08.2018
09:16:23
Ничему особому не учат, та же компиляция документации и примеров, задачки с каггла, тервер и матстат не лучше чем у нас , все равно надо читать самому статьи и ковыряться

Единственный плюс - среди цунами китайских и индусских резюме , сразу выхватывает взгляд диплом

Subdust
09.08.2018
09:33:45
На вопрос "Зачем оно нужно?" - ответить очень трудно, потому что на этот вопрос ответить можешь только ты сам себе. Однако, практика показывает, что если ты очень упорный, усердный, и умеешь самостоятельно контролировать процесс обучения - то тебе точно не нужны никакие университеты. Но и наставника не будет рядом, который подскажет, поможет, да и вообще сделает из тебя датасатаниста.
А сложно в неакадемической среде ресерчем заниматься? Я думаю это реально только если это самостоятельный ресерч. Другой вопрос - насколько это реально, одному ресерчи делать. Думаю, шансы на какие-то результаты невелики. А без результатов на работу не возьмут, и к коллективным ресерчам доступа не будет. В общем, может ещё поэтому образование нужно. В группе со студентами намного легче результаты показать, и дальше двигаться, уже имея какое-то имя.

Dan
09.08.2018
09:35:24
Собственно, так везде и почти во всех сферах деятельности. Если ты хочешь более крутых результатов - нужно быть "в тусовке"

(образно выражаясь)

Dan
09.08.2018
09:43:00
В MIT тоже самое

Dan
09.08.2018
10:13:59
Кстати, коллеги, кто готов стать наставником в частном порядке - дайте пожалуйста знать в лс, а лучше напишите @musit о своём опыте и условиях наставничества :) Я думаю что наш чат может стать внезапно очень полезным и для профессионалов, и для тех, кто очень желает научиться и прямо вот попрактиковаться :)

Google
Dan
09.08.2018
10:20:20
А что нужно будет делать?
Наставничать :) Предполагается, что интересующися новичок самостоятельно и методично изучает какие-либо вопросы, и обращается к наставнику за заданиями. А наставник, соотстветственно, предоставляет практику, проверяет результаты, и направляет знания в нужное русло. Как мне думается, в выигрыше в итоге могут остаться все: наставник получит себе хорошего ученика и помощника, а еще $$ за частную преподавательскую деятельность :), новичок обретёт знания и практические умения, бесценный опыт

Или я идеализирую?

Paul
09.08.2018
10:23:29
Так то я думаю попробовать такую идею реализовать можно. Только есть два момента, это время, которого очень мало и есть ли желающие новички уже?

Mikhail
09.08.2018
10:24:36
@hitmaker классная идея

Dan
09.08.2018
10:25:11
Новички есть всегда, но они не всегда "желающие". Потому что для них есть два фактора: 1. они очень любят когда их водят за ручку, а наставничество этого не предполагает. ожидается самостоятельное и ответственное поведение от ученика :) 2. их ограничивающий фактор - внутренний конфликт и непонимание ценности наставничества, страх перед неизвестным, и как следствие - борьба с "жабой": а не дорого ли наставник просит за свои "наставления"...

Artyom
09.08.2018
10:26:08
Написал. Ну и в своей группе у меня тоже есть менторство. Будет интересно ссылку в группу дам. Там есть платные и бесплатные варианты. Но только максимум 3 человека

Dan
09.08.2018
10:26:22
А у наставников тоже есть нюансы: это время, и компетентность. Я знавал некоторых не очень компетентных людей, которые были не просто уверены, а убеждены в своей безупречной компетентности. А это "ложное академичество" порождает глупость среди юных натуралистов :)

Artyom
09.08.2018
10:27:02
кстати, мы обновляем Learning pandas в режиме реального времени

Artyom
09.08.2018
10:27:22
https://github.com/Gewissta/Learning_Pandas_russian_translation

и вот там я хочу принципиально дать больше кейсов по предподготовке данных

именно как это "происходит в жизни" без всяких этих адаптаций, упрощенчества

кейсы будут в виде отдельных приложений оформлятся

Denis
09.08.2018
10:30:34
Ищу наставника по dl cv

Dan
09.08.2018
10:46:25
Ищу наставника по dl cv
Мы тоже ищем. А вот когда найдём всех наставников - тогда и предложим пути развития :)

Mikhail
09.08.2018
10:48:19
предлагаю ввести теги #джедай #падаван. Тогда быстрым поиском по чату все наставники и желающие учиться будут искаться. Например: ищу наставника по ML #падаван

Dan
09.08.2018
10:48:38
Можно и так

У меня-то была идея как-то систематезировать и каталогизировать. Чтоб можно было выбрать специализацию или конкретный предмет. У нас тематика широкая же

Google
Mikhail
09.08.2018
10:51:11
можно начать с такой каталогизации. когда станет сложно найти по такой схеме потребуется ее улучшить

Проксимов
09.08.2018
10:52:11
Чаты не для этого

Dan
09.08.2018
10:53:52
Это да, но тут как раз идея в том, чтобы немного выйти за рамки чата :)

Именно в этом ключе.

Анна
09.08.2018
11:35:02
Интересует тема прогнозирования (задачи предиктивной аналитики - прогнозирование отказов оборудования по имеющимся показаниям датчиков). Смотрела про временные ряды, соответственно, в специализации, в ODS, DMIA, Воронцова. В книгах, которые попадались, эта тема поднимается редко и очень поверхностно. Можете порекомендовать еще годные источники (будет совсем гуд, если теория будет сопровождаться практическими примерами на python)?

yopp
09.08.2018
11:57:17
Дальше ищите predictive maintenance в вашей прикладной области. Все очень сильно зависит от имеющихся данных. Побуду капитаном: определитесь что для вас значит «предсказание», какие требования к false positive, какое временное окно. Поменять заслонку на нефтяном кусте в тайге не тоже самое что поменять жёсткий диск в ДЦ в центре Москвы. В общем виде, задача сведётся к поиску «нормальных» показателей с учетом всех возможных колебаний и корреляции «ненормальных» показателей с каким-то классами отказов.

И ещё: начните с экономической модели отказов и сфокусируйтесь на самых дорогих. Учитывайте не только ущерб от отказа, но и стомость устранения отказа. Не все отказы приводят к ущербу, не все отказы требуют немедленного устранения. За большими массивами данных, это очень легко теряется и легко можно оказаться в ситуации, когда система точно предсказывает перегоревшие лампочки и забившиеся воздушные фильтры, но не позволяет предсказать износ подшипника или щёток мотора :)

Анна
09.08.2018
12:54:07
Спасибо за рекомендации!

Nick
09.08.2018
13:00:11
Подскажите метод или что делать, если поломки очень редки, меньше 1% от всех случаев, но достаточно дорогИ? Хочется знать заранее, когда подходом близко к поломке.

Gennadiy
09.08.2018
13:01:45
Roc auc?

49060
09.08.2018
20:56:23
F1

Smote, tomek

Adasyn

Это к

Подскажите метод или что делать, если поломки очень редки, меньше 1% от всех случаев, но достаточно дорогИ? Хочется знать заранее, когда подходом близко к поломке.

Admin
ERROR: S client not available

Vova
10.08.2018
06:55:14
Google
Vova
10.08.2018
06:58:43
http://www.lce.hut.fi/~ssarkka/course_k2009/slides_2.pdf

Как раз пример хорошего дидактического материала

Alex
10.08.2018
07:16:28
Никто не хочет прицепить свои наработки к сети и получать эфир за это?

49060
10.08.2018
07:32:00
Я сверху и написал методы) это наверное не мне.

F1

Smote, tomek

Adasyn

для начала читать про oversampling / undersampling https://en.wikipedia.org/wiki/Oversampling_and_undersampling_in_data_analysis

Кстати хорошо работает комбинирование tomek+smote

Aleksandr
10.08.2018
09:33:19
Приветствую. Посоветуйте, как лучше начать изучать data science. С каких статей, курсов лучше начать. Сейчас прохожу учебный курс по машинному обучению от kaggle, есть смысл продолжать или лучше поискать другой курс?

Paul
10.08.2018
10:14:39
Смысл есть. Можно параллельно читать книжку Граса Data Science наука о данных, вроде неплохая для старта

Vova
10.08.2018
10:59:49
ЧТо это за ад?

yopp
10.08.2018
11:00:33
Китайские спамботы. Который месяц уже

Vova
10.08.2018
11:00:41
А понял

yopp
10.08.2018
11:00:52
Я суммарно уже больше сотни их забанил на всех каналах

Vova
10.08.2018
11:01:15
Я чуток испугался, думал ломанули что то

Dan
10.08.2018
11:01:34
Не, у них волнами. Они уже давно так ломятся

То затишье, то во все чаты сразу

Arslan
10.08.2018
11:11:40
А можно тут спросить про организацию работы проекта и про рабочую этике в ML?)

Google
Nikolay
10.08.2018
11:22:58
Кожаные эти самые этики по отношению к нам AI не придерживаются :(

Arslan
10.08.2018
11:28:46
СР! УВЧ!
5 букв, а так много нового узнал

Dan
10.08.2018
11:32:17
Это классика

Denis
10.08.2018
11:35:12
СР! УВЧ!
А что это? (длянубов)

Страница 294 из 327