@bigdata_ru

Страница 210 из 327
Bogdan
09.01.2018
05:53:28
у питона очень много структур данных

относительно другх ЯП

dot
09.01.2018
05:55:13
Понял спасибо за ответ :)

Dmitry
09.01.2018
05:55:26
язык должен быть динамическим, чтобы не париться над типами при прототипировании, что там на рынке было - python, ruby, groovy, js. JS был совсем убогим еще лет 5 назад, остальные совсем маргинальные были. То есть он достаточно неплох в отсутствии альтернатив. Если бы ML появился сейчас, скорее всего все было бы на JS

Google
Dmitry
09.01.2018
05:56:28
Потому что бабки в JS вкладываются немеряные (из-за браузерности), очень хороший компилятор, но на питоне уже все написано и вряд ли кто-то побежит переписывать все начиная с numpy

Vladislav
09.01.2018
05:57:19
js был, есть и будет ужасным

Тут нужна картинка про работу типов данных в js

Dmitry
09.01.2018
06:02:46
да на это уже точно плевать в нашей области. последний стандарт в который завезли list comprehensions вполне нормален, хотя без перегрузки операторов нормальный numpy не сделаешь, так что да, единственной теоретической альтернативой питону был бы ruby, но не сложилось. и уже не сложится

Dmitry
09.01.2018
06:10:48
самое главное больше пассивной агрессивности

Andrey
09.01.2018
06:23:57
Шта?

Denis
09.01.2018
08:44:34
всем привет. у меня есть несколько моделей и мне нужно сделать отчет, чтобы пользователь мог следить за прогрессом скоринга каждой модели. Время запуска, кол-во наблюдений, время завершения, ещё всякие метрики... может у кого есть пример или кто делал такое?

Herman
09.01.2018
11:11:01
Знаю не по наслышке

Очень странный язык

Ну это и ясно, обратная совместимость

Google
Dmitry
09.01.2018
11:26:33
callback hell вообще не релевантен если говорить о python vs js. Перегрузка операторов критична, но ее потому и нет, что она никому не нужна. Так-то это простой сахар

Алексей
09.01.2018
11:28:10
Dima
09.01.2018
11:28:50
я сейчас на typescript пишу для одного веб проекта. Приколы свои есть, но на коллбэк хэлл не натыкался

хотя неожиданно почему в этой конфе вспомнили про js

Dmitry
09.01.2018
11:31:51
я написал о том, что если бы ML появился сейчас, то все писалось бы скорее всего на JS, а так питон безальтернативен практически

Dima
09.01.2018
11:32:16
хм... я сейчас прохожу курсы по питону

т.е стоит ли оно того тогда? Сама по себе штука забавная на самом деле

и куча книг по анализу данных, машинному обучению и прочему идут либо с примерами на R либо на Python

Dmitry
09.01.2018
11:33:47
что стоит, питон? да выбора нет как бы. pypy вполне быстр по сравнению с v8

Serhii
09.01.2018
11:34:12
расскажите о том как js не кактит Andrej Karpathy, который CNN на джаваскриптах для броузера запилил

Dima
09.01.2018
11:34:18
я говорю про книги, где описывается сама разработка и тд с точки зрения программирования. Потому что в книгах которые идут сугубо по теории и математике никакой ЯП не нужен

я про питон говорил, да

а вот на эту бы тему я пообщался

расскажите о том как js не кактит Andrej Karpathy, который CNN на джаваскриптах для броузера запилил

Serhii
09.01.2018
11:35:57
то что в мл В ОСНОВНОМ используется пайтон - ну, так сложилось исторически (и я например не вижу в этом проблемы)

Dmitry
09.01.2018
11:36:20
ну, в жс корпорации вложили миллиарды, чтобы получить быстрый язык в браузере. Это его основное преимущество. Для динамического языка он _очень_ быстрый. А дальше начинаются недостатки языка, который разрабатывали 2 недели, которые постепенно исправляют

Dima
09.01.2018
11:37:04
так уж вышло, что я пока студент и зарабатываю тем, что пишу фронт и немножко бэк для проекта одного. И в сущности я знаю пару фремйворков (Angular, Vue, Express) для js, ts, java ну и html, css, bootstrap. Но вот душа стремится к чему-то высокому

а поэтому узнать о том, как применяется машинное обучение в вебе и его аспекты было бы интересно

Google
Serhii
09.01.2018
11:38:24
а вот на эту бы тему я пообщался
если про cnn в браузере, то кроме его реализации я на гх еще несколько встречал, причем вроде как недавно даже к этому какими то нечеловеческими костылями gpu ускорение прикрутили (через webgl как я понимаю)

Dima
09.01.2018
11:38:53
ух ты, ну если где-то завалялись ссылки, то поделитесь я бы с удовольствием глярнул

Henadz
09.01.2018
11:39:23
вообще смешно слышать про МЛ на питоне

Serhii
09.01.2018
11:39:30
то, что это никак практически особо не применишь - кроме "гыгы, можно в броезере сетку запустить))00" - это другой вопрос)

Henadz
09.01.2018
11:39:38
когда там в основном сишные либы с питоновской оберткой)

Dima
09.01.2018
11:39:53
ясно, печаль

ну с таким подходом можно всё к си свести на самом деле

Henadz
09.01.2018
11:40:44
ну просто что мешает написать привязку к любому другому языку?

ничего

Dima
09.01.2018
11:40:48
ну в том плане, что си сам по себе очень мощный язык

Serhii
09.01.2018
11:40:49
ясно, печаль
на штуковину с гпу - ускорением ссылку сейчас не найду( а просто либы на жс - brainjs, mindjs (кажется)

Henadz
09.01.2018
11:41:03
так и делают для R

Henadz
09.01.2018
11:41:15
можно и для ЖС сделаиь

Dima
09.01.2018
11:41:15
да, согласен, важна голова, а не инструмент

Serhii
09.01.2018
11:42:12
http://cs.stanford.edu/people/karpathy/convnetjs/ вот сверточная сеть которую вы можете видеть когда заходите на cs231

Dima
09.01.2018
11:43:25
о спасибо большое

этих курсов так много, а на такой я не натыкался. Хотя всё моё знакомство началось с этого курса:

https://www.coursera.org/learn/machine-learning

неплохой, но пишется там всё в матлабе

Mikhail
09.01.2018
11:53:38
Кстати, а есть те, кто работает с МЛ в Wolfram Lang?

Google
Mikhail
09.01.2018
11:54:00
Это же довольно мощный язык, заряженый всеми необходимыми либами

Andrey
09.01.2018
11:56:56
Это бесполезная поделка с нечитаемым синтаксисом

Для всего кроме собственно символьных вычислений не пригодна

Алексей
09.01.2018
11:59:42
Mikhail
09.01.2018
12:00:34
Для всего кроме собственно символьных вычислений не пригодна
прислушался бы, если бы знал о твоем опыте с ним, и о том, чем ты вообще занимаешься, чтобы такое утверждать

Admin
ERROR: S client not available

Andrey
09.01.2018
12:01:33
Чтобы такое утверждать, достаточно своими глазами посмотреть на сделанное на этом языке

Dmitry
09.01.2018
12:03:16
потому что я частенько переписываю питоний код на с++ для продакшена, и получаю весомый рост производительности

Алексей
09.01.2018
12:03:36
это странно

Dmitry
09.01.2018
12:04:31
нет, cpython настолько тормоз, что даже в роли клея для сишных библиотек он умудряется порядочно тормозить весь процесс

Алексей
09.01.2018
12:05:06
но как? он же фактически не производит вычислений

обычно же вызываются всякие функции, которые долго что-то на той же видеокарте считают

Andrey
09.01.2018
12:06:58
Кстати, для диплернинга на видеокарте узким местом бывает препроцессинг на процессоре и чтение с диска

Dmitry
09.01.2018
12:07:22
ну он раз в 40 медленнее аналогичного кода на С++. соответственно если вот этот "клей" занимает 1/40 часть логики, то с учетом тормозов получается 50% времени проводится в библиотеке, а 50% - в питоне, при переписывании рост идет в два раза.

например, мне перед отправкой на GPU batch'а нужно наложить фильтр и еще кое-как испортить данные. в питоне приходится делать это заранее, полчаса готовя датасет, иначе он просто не успевает за видюхой. впрочем с pypy все намного веселее, но все равно до js не дотягивает

Dmitry
09.01.2018
12:14:35
рад за тебя, а у меня нет, что дальше будем делать?

Google
Алексей
09.01.2018
12:15:29
видимо клей не такой уж и клей, если он не пренебрежим

Evgeniy
09.01.2018
12:15:30
Viktor
09.01.2018
12:15:43
а как в С++ обстоят дела с библиотеками для ML/DS? интересуют аналоги pandas, numpy, etc

Dmitry
09.01.2018
12:19:17
видимо клей не такой уж и клей, если он не пренебрежим
так о том и речь. даже если питон занимает 1/40 логики, он будет сравним с с++ по суммарному времени процессора. а 1/40 логики - это ни о чем. но миф живуч, потому что мало кто на самом деле профайлит свой код

Dan
09.01.2018
12:20:21
А вообще вы очень ленивые жопы

https://github.com/josephmisiti/awesome-machine-learning#cpp-general-purpose

На гитхабе вообще всё есть

Dmitry
09.01.2018
12:22:27
откуда вообще взялось магическое число 40?
конкретный опыт. вот тут можно посмотреть какие-то цифры https://julialang.org/benchmarks/

Алексей
09.01.2018
12:23:30
вообще на самом деле надо глядеть на конкретный код

просто если например там циклами по большим массивам/матрицам пробегаетесь, то явно будут проблемы

Dmitry
09.01.2018
12:25:26
а как в С++ обстоят дела с библиотеками для ML/DS? интересуют аналоги pandas, numpy, etc
для матриц есть eigen, но мне возможностей opencv достаточно, насчет pandas - а надо ли, я вовсе не апологет С++ в ML

Viktor
09.01.2018
12:30:42
а почему не апологет? я смотрю на список по ссылке Дена и там весьма впечатляющий набор. по крайней мере есть с чем начинать пробовать и разбираться. если все так хорошо с С++ то почему все говорят только про пару R/Python? только из-за стоимости разработчиков?

Dmitry
09.01.2018
12:34:35
а почему не апологет? я смотрю на список по ссылке Дена и там весьма впечатляющий набор. по крайней мере есть с чем начинать пробовать и разбираться. если все так хорошо с С++ то почему все говорят только про пару R/Python? только из-за стоимости разработчиков?
потому что по мне 2-3-кратная просадка в производительности не стоит десяти-двадцатикратной во времени разработки. Я бы хотел, чтобы у питона был нормальный JIT, чтобы можно было писать циклы когда это удобно, а не векторизовать вещи там, где это превращается в нечитаемую кашу, но этого нет. По ссылке, кстати, есть ROOT, рекомендую посмотреть, C++-REPL из ЦЕРН, они на коллайдере гигабайты статистики обрабатывают, вот такую штуку себе и придумали

Страница 210 из 327