@bigdata_ru

Страница 7 из 327
Dan
25.08.2016
10:28:34
кстати, коллеги, кто использует R в повседневной работе? что можете интересного рассказать из практического опыта?

ибо в теории всё сказочно волшебно, сплошные единороги и радуги :)

Lepus
25.08.2016
10:28:57
Он немного стрёмный

хотя бы потому, что массивы нумеруются с 1

Google
Lepus
25.08.2016
10:29:08
и это немного бесит

честно

Dan
25.08.2016
10:29:32
эммм, массивы с 1 ??? вот тут я уже хорошо удивился )

Lepus
25.08.2016
10:29:48
Да. Первый элемент массива имеет номер 1.

Andrew
25.08.2016
10:30:16
В Паскале (привет первому курсу универа) - аналогично.

Dan
25.08.2016
10:30:58
я обошёл стороной паскаль, в универе не давали, а в колледже получил автоматом. мы в си углублялись )

но это было в ... эмм... давно что-то очень

Lepus
25.08.2016
10:31:19
Ну R весь такой заточенный под Няуку

у обычного погромиста от Эр будет немного подгорать

Удобен тем, что имеет дофиганга стат плюшек и заточен под матрично-фигачные вычисления

Andrew
25.08.2016
10:34:23
А с биг датой у него как? Юзал кто Spark R - какие впечатления?

Lepus
25.08.2016
10:34:57
спарк не юзала

но с бигдатой вроде нормально всё

Google
Lepus
25.08.2016
10:35:32
но он не супер-производительный

Ahm
25.08.2016
10:35:46
если совсем big, то надо иметь ввиду, чтo R все держит в оперативке, не на всяком компе поработаешь

Andrew
25.08.2016
10:36:24
а если вычисления на кластере?

Lepus
25.08.2016
10:37:06
У меня была одна задачка, которую ни эр, ни питон не потянули по оперативке

на кластере

Джумурат
25.08.2016
10:38:11
так ставь спарк на локальный комп, он что хочешь переварит

Вот тут инструкция, как установить спарк и даже привязать его к Jupyter ноутбуку http://aleksandr-dzhumurat.blogspot.ru/2016/08/apache-spark-jupyter-notebook.html

Lepus
25.08.2016
10:40:11
Там объемы данных такие, что у меня на жёсткий не поместятся

Andrew
25.08.2016
10:40:59
если не секрет - какие?

Lepus
25.08.2016
10:41:12
nda

ptchol
25.08.2016
10:44:47
У меня была одна задачка, которую ни эр, ни питон не потянули по оперативке
у нас ребята на R жалуются что переиспользуемость сильно низкая.

в рамках проектов вцелом.

Lepus
25.08.2016
10:46:16
Это, скорее, проблема проектирования

а не языка

ptchol
25.08.2016
10:47:04
ну куча же другого кода в стеке вцелом.

на джавке \ питоне, и во всяких там своих приложениях, штормах \ спарках код переиспользуется, а R никуда не впихнуть )

YL
25.08.2016
10:48:37
посоветуйте ресурсы для новичков

Andrey
25.08.2016
10:49:09
у обычного погромиста от Эр будет немного подгорать
Подгорать будет от обычного лиспа. А это лисп с человеческим лицом, можно сказать.

Google
Lepus
25.08.2016
10:49:16
на питоне тоже можно такого накодировать

Lepus
25.08.2016
10:51:33
Лучше учить Julia

@parallel

Andrey
25.08.2016
10:53:31
посоветуйте ресурсы для новичков
Кабаков R в действии или оригинал на английском, как раз вышло новое издание. И оф. документация. И все книги Hadley Wickham

Lepus
25.08.2016
10:53:32
и всё такое

Andrey
25.08.2016
10:54:42
Лучше учить Julia
+100500. Учите все джулию, не мешайте зарабатывать погромистам на более классических языках

Paul
25.08.2016
10:56:31
но вообще ИМХО R - это мир большой науки, как пролог. Обычным людям там делать нечего.

Джумурат
25.08.2016
10:57:39
R это эксель в мире большой науки, скорее

Paul
25.08.2016
10:58:23
R это эксель в мире большой науки, скорее
ну да. Хотя пайтон там тоже очень любят и уважают, я свидетель

/dev
25.08.2016
10:58:48
R for hipsteRs

Andrey
25.08.2016
10:59:41
Не знаю, при грамотном преподавании его можно в школе вместо паскаля давать даже

То есть любую автоматизацию типа переименования файлов он позволят легко делать, картинки для какой-нить лабы - снова запросто

Paul
25.08.2016
11:01:17
нет, проблема Р, ИМХО, в его очень нетипичном для большинства языков программирования поведении. Зная пайтон - можно легко учить руби. Зная джаву - скалу или го. А вот зная Р или пролог - другие языки прийдется учить с нуля

Andrey
25.08.2016
11:01:52
Можно примеры нетипичного поведения?

Google
Andrey
25.08.2016
11:02:09
Не трололо ради, реально интересно

Lepus
25.08.2016
11:02:18
Питон для ленивых, на самом деле

Andrey
25.08.2016
11:03:15
И может я смогу даже объяснить, откуда ноги растут

Paul
25.08.2016
11:12:18
Можно примеры нетипичного поведения?
ну вот выше упоминали массив с 1. Это мелочь, но пугает

я довольно давно учил R, и совсем не писал на нем с той поры. Но помню, что многое в нем меня удивляло

Dan
25.08.2016
11:13:12
А можно поинтересоваться относительно материалов по R?

Для общего развития, так сказать )

Paul
25.08.2016
11:13:48
А можно поинтересоваться относительно материалов по R?
был курс на курсере. Назывался, по-моему, компьютерная статистика и обработка больших данных. Но 80% курса - это именно про R

nick
25.08.2016
11:14:56
Как вы интегрируете R с другим стэком технологий? Есть что-то внятное для написании REST API ? кажется что самая большая проблема R в деплое и интеграции , так для анализа и жанглирования данными очень даже

Andrey
25.08.2016
11:15:32
Блог Сергея Мастицкого и его же книгу также рекомендую. Самого себя рекомендовать не буду :)

Сам делаю проще: shiny-приложений мне достаточно

Andrey
25.08.2016
11:19:11
А, еще есть пакет jug

IH
25.08.2016
11:20:21
А можно задать вопрос по нейросетям? Я гуманитарий, перешедший в программисты. Вроде понимаю все, а как доходит до нейросетей и высшей математики - теряюсь. Есть что-нибудь вроде Machine Learning для полнейших идиотов?

Paul
25.08.2016
11:22:28
подпишусь на ответы

Andrey
25.08.2016
11:23:22
А в чем состоит вопрос-то?

nick
25.08.2016
11:24:24
спасибо. да, видел их раньше. В облаках с этим у R попроще и aws и azure дают делать сервисы на R легко и непринужденно. Но тут нужно на своем железе поднять, раньше смотрел и jug и opencpu и Rserve , все это какой-то каменный век . Мои поиски остановились на rpy2

Google
Andrey
25.08.2016
11:26:29
Rpy2 - то есть с интернетами сообщается питон, и уже код на питоне вызывает функции R?

nick
25.08.2016
11:26:39
ага

Andrey
25.08.2016
11:27:43
Толково!

IH
25.08.2016
11:27:51
Вопрос в том, есть ли материалы, которые помогут разобраться в терминах вроде backpropagation, укажет, когда и сколько нейронов использовать, зачем используются функции, как написать нейросеть с нуля. Туториалы вроде: берем эти 15 библиотек, импортируем и пишем run() -как-то не дают нормального понимания сути.

ptchol
25.08.2016
11:27:56
крайне спорное заявление
ничо спорного ) я про реальную ситуацию.

IH
25.08.2016
11:33:41
Еще блог karpathy.github.io/neuralnets
Во, спасибо. Здесь вроде начало понятно)) Жаль на русском нет)

Dan
25.08.2016
11:34:10
https://github.com/josephmisiti/awesome-machine-learning

кстати

Andrey
25.08.2016
11:34:39
Зато на русском есть Хайкин Нейронные сети и Кохонен Самоорганизующиеся карты. Вот где вывих мозга!

nick
25.08.2016
11:39:26
Еще блог karpathy.github.io/neuralnets
Тока хотел скинуть) От karpathy есть еще отличный курс http://cs231n.stanford.edu https://www.youtube.com/playlist?list=PLwQyV9I_3POsyBPRNUU_ryNfXzgfkiw2p . в нашем деле без инглиша никуда, как по мне знание английского автоматически повышает твой уровень программирования, анализа на пару пунктов. перед тобой открываются огромные объемы полезной инфы.

Tom
25.08.2016
11:43:52
С R больше анализируешь, чем программируешь. С Python— наоборот. Собственно, уметь хорошо оба, лучшие ребята из data science так и делают.

Насчет переиспользуемости R-кода— это фича проектирования, а не языка, правильно сказали выше. В AirBnB с переиспользуемостью всё ОК— через те же библиотеки. Ну и говорить, что R— это Эксель— значит расписатья с собственном плохом владении R^^ Кстати, в Эксель тоже можно Хадуп и не краснеть за свою работу.

Andrey
25.08.2016
11:51:29
Я думал, что R сравнивают с икселем в хорошем смысле, типа такой же популярный и доступный...

В икселе можно и R запустить :)

ptchol
25.08.2016
11:54:07
Насчет переиспользуемости R-кода— это фича проектирования, а не языка, правильно сказали выше. В AirBnB с переиспользуемостью всё ОК— через те же библиотеки. Ну и говорить, что R— это Эксель— значит расписатья с собственном плохом владении R^^ Кстати, в Эксель тоже можно Хадуп и не краснеть за свою работу.
я честно не понимаю при чем тут проектирование, если ряд платформ просто не умеют на себе гонять код R ) в таком случае часть кода у тебя может быть задублированна на нескольких языках, либо появятся дополнительные слои делающие decoupling и выделение какой то части кода в сервис для переиспользования.

Tom
25.08.2016
11:55:42
О чём вы говорите? Windows из коробки не умеет ничего: ни Python, ни R, %say_something%

Ставьте R куда надо— все дела

Страница 7 из 327