@bigdata_ru

Страница 8 из 327
ptchol
25.08.2016
11:56:44
Ставьте R куда надо— все дела
а, ну если так оценивать )

Tom
25.08.2016
11:56:56
А как? Что значит часть платформ?

ptchol
25.08.2016
11:57:23
spark / storm ?

Google
Tom
25.08.2016
11:57:44
SparkR как минимум

Andrey
25.08.2016
11:57:49
x86 и arm тоже платформы...

ptchol
25.08.2016
11:57:50
он тока в двойке же

Andrew
25.08.2016
11:58:49
если память не изменяет, Spark R c 1.4 появился

Tom
25.08.2016
11:58:53
R-Strom

Andrey
25.08.2016
11:59:05
Просто реально непонятно, где это он прям совсем не работает

Pavel
25.08.2016
11:59:16
Ох, синтаксис у R просто мозгодробительный и нумерация с единицы – наименьшая из бед.

Andrey
25.08.2016
11:59:40
Чем плох синтаксис?

Tom
25.08.2016
11:59:41
Ну кто-то и от Java+Hadoop прётся

ptchol
25.08.2016
11:59:56
если память не изменяет, Spark R c 1.4 появился
да, вы правы. как то не замечал ))

R-Strom
это вы загуглили или вы жили с этим ? )

Pavel
25.08.2016
12:00:49
Синтаксис плох тем, что он непредсказуем/неинтуитивен.

Google
Tom
25.08.2016
12:01:11
Это я знаю, но не работал со Strom

SparkR работает отлично

Andrew
25.08.2016
12:02:15
забавно. вот возьму книжку, например, на итальянском, ни фига не пойму, и выкину её нафиг. потому что все не так, как в русском.

Andrey
25.08.2016
12:02:32
Часто вижу сравнения, что дескать в питоне синтаксис ок, а в R - УГ. Я так и не научился бегло читать вызовы методов через точку, а R с оператором %>% позволяет писать наиболее человекочитаемый код из всего, что видел

Синтаксис плох тем, что он непредсказуем/неинтуитивен.
Синтаксис всех языков неинтуитивен в том смысле, что методом тыка в нем не разобраться

Предсказуемость - свойство поведения программы, а не синтаксиса.

Pavel
25.08.2016
12:04:47
Синтаксис всех языков неинтуитивен в том смысле, что методом тыка в нем не разобраться
Количество информации, которую нужно держать в голове, чтобы распарсить синтаксис и пользоваться им – различается.

Andrey
25.08.2016
12:05:28
В R все существующее - объекты, а все действия - вызовы функций.

Куда проще?

Побочные эффекты - чтение и запись файлов да рисование на устройстве вывода

ptchol
25.08.2016
12:07:02
Второй живой человек из букинга )

Pavel
25.08.2016
12:07:06
Я знаю этот прием ведения спора – чуть-чуть меняем предмет обсуждения и делаем из него нужный вывод. :) По делу – объектами и вызовами все далеко не ограничивается.

Ahm
25.08.2016
12:07:20
кривая обучения R довольно крутая, не всякий осилит

Pavel
25.08.2016
12:09:29
Ну нет – так нет. :)

Andrey
25.08.2016
12:11:59
Алексей
25.08.2016
12:12:04
Всем привет

Да, какого букинга?

ptchol
25.08.2016
12:14:34
booking ? )

Pavel
25.08.2016
12:14:52
booking.com

Google
Andrey
25.08.2016
12:16:14
А связь с R и бигдатой тут какая?

nick
25.08.2016
12:16:42
Смотря с чем сравнивать. Python просто один из немногих языков где синтаксис прост до безумия, но при этом не мешает писать высокоуровневый код, спускаясь ниже когда нужно, с ним трудно соперничать. Мое мнение Python и Clojure из популярных языков лучше остальных в синтаксие. Но вот сравнивая с Scala, Java, C#, JavaScript по мне R проще

Andrey
25.08.2016
12:17:37
Вот, полностью согласный.

/dev
25.08.2016
12:17:48
ставить С#/Java, JavaScript и R в один ряд — то ещё безумие

Ahm
25.08.2016
12:18:11
Это копипаст, извините

Ну вот тебе пример мнения "за Питон". Питон — это язык программирования, который дизайнил человек, умеющий дизайнить языки программирования с целью сдизайнить хороший язык программирования. R (а точнее его моральный предшественник S) — это язык программирования, который дизайнил человек, хорошо разбирающийся в статистике, с целью сделать чуть более удобную для него версию Фортрана. В итоге как калькулятор оба работают эквивалентно. Как система вербализации абстракций произвольной сложности Питон лучше т.к. более продуман изначально. В реальности выбор упирается в привычку–умение–моду–peer pressure–контекст. Я неплохо ориентируюсь в обоих системах и готов выбирать то, что лучше подходит к задаче, но на мой взгляд на данный момент есть очень мало ситуаций, где использование R имеет какие–либо преимущества перед Питоном (да и там они довольно эфемерны и упираются либо в экзотические пакеты, либо в "наш статистик другого не знает"), тогда как я могу назвать уйму ситуаций, где Питон решает проблемы лучше R. Поэтому это не "застарелая ненависть", а тупо опыт. вроде уже и не важно особо на чем именно вы это сделали... и там и там почти все есть. Бери шире — можно и на голом ассемблере фигачить, да и брейнфак тоже Turing–complete. Всё так или иначе упирается в продуктивность, и абсолютного "не важно на чем писать" не бывает.

Andrey
25.08.2016
12:19:53
Взаимоисключающие параграфы детектед.

То все упирается в привычку, то снова питон форева

Pavel
25.08.2016
12:22:04
А это не взаимоисключающие. )

Andrey
25.08.2016
12:22:28
При этом плохо сдизайненый R более совместим c S 30-летней давности, чем хорошо сдизайненый питон 2 с таким же питоном 3

Pavel
25.08.2016
12:22:39
Одно форева не мешает по привычке пользоваться другим не-форева.

Andrey
25.08.2016
12:23:24
Так и я пользуюсь, и многие пользуются.

Pavel
25.08.2016
12:23:55
Ну давайте поищем еще что-нибудь совместимое с чем-нибудь так 40-летней давности и будем этим пользоваться, потому что совместимо. )

Tom
25.08.2016
12:24:46
Холивар по сути не лучше применение своего таланта)

Я смог делать одинаковое на R и Python, чувствую себя прекрасно. Значит, все смогут)

Andrew
25.08.2016
12:27:29
SparkR работает отлично
а как там сейчас дела с r-packages для спарка?

Pavel
25.08.2016
12:28:21
Просто кто-то очень хочет в чем-то других убедить и пользуется для этого всеми немыслимыми средствами. )

Andrey
25.08.2016
12:31:58
Да тут кагбэ все пытаются убедить всех, что они знают и используют только все самое лучшее, а плохое не используют потому, что оно плохое, а не из-за неумения сделать из него хорошее.

Tom
25.08.2016
12:33:12
В ссмысле, с библиотеками, типа, dplyr? Норм, ставится без проблем.

Другое дело, что код в Спарке не желательно, чтобы нарушал идеологию самого Спарка: df, rdd. Иначе, смысла в нём будет очень мало.

Google
Tom
25.08.2016
12:38:34
Кстати, это признак здравомыслящего человека) Мне всегда режет ухо российский телевизор, если как-то попадает в ухо, и болтовня официальных лиц.

Pavel
25.08.2016
12:38:40
Это под номером 0, или под номером 1 посчитано?
А вот это уже троллинг. Гудбай.

Andrey
25.08.2016
12:40:56
Одним Д'Артаньяном меньше.

Timur
25.08.2016
12:48:49
Остались лишь пидорасы?

Dan
25.08.2016
12:49:23
коллеги

давайте больше по-существу, тема хорошая, интересная, глубокая. если вы хотите обсудить любые другие вещи - пожалуйста, в информации есть ссылка на подборку каналов, чатов и ботов. там их больше сотни на любую тему ?

а кто у нас тут в комсомоле матом ругаться будет, того нахуй выгоним из комсомола. договорились?

про мат я разумеется образоно ?

Andrey
25.08.2016
12:52:19
Остались лишь пидорасы?
Остались тролли, жЫрность 146%

Dan
25.08.2016
12:53:27
кстати на питоне либы есть очень хорошие для бигдаты. тотже пипай вроде умеет хорошо. я деталей сейчас уже не вспомню, но могу поискать материалы с трёхлетней давности конференции по python, где как раз обсуждали работу с CUDA на python и обработке реально больших данных

очень кстати был интересный доклад. точно нужно поискать

Andrey
25.08.2016
12:53:51
В свое оправдание скажу, что я не только лишь вызываю троттлинг, но и пощу всякую годноту.

Dan
25.08.2016
12:55:57
"реально больших данных" - это примерно сколько?
там ребята просчитывали капилляры, и вроде они из Минска

Dan
25.08.2016
12:56:26
и кстати доклад был не совсем на тему CUDA, а скорее на тему что узкие места они заменяли с кода на питоне кодом на Си

)))

в кулуарах после чего обсужадали скорости в узких местах.

Google
Dan
25.08.2016
12:56:57
как впрочем обычная практика, на встрече рельсовиков мериться RPS-ами )

Andrey
25.08.2016
12:57:20
А вот поделитесь подходами, как быть с задачами типа сборки геномов

Andrew
25.08.2016
12:57:36
объем данных какой? десятки, сотни терабайт?

Dan
25.08.2016
12:58:15
объем данных какой? десятки, сотни терабайт?
про капилляры не помню, поэтому не скажу, чтобы не соврать.

но интуитивно догадываюсь что речь о десятках Тб

Andrey
25.08.2016
12:58:51
Там все данные обычно в ОЗУ должны быть, т.к. строится громадный граф и распределить процесс эффективно не получается

Andrew
25.08.2016
13:04:16
раз уж речь про CUDA зашла - нет ли здесь, случайно, людей, осиливших распараллелить обучение нейросетки (Tensorflow+Keras) на несколько видеокарт?

Andrey
25.08.2016
13:05:23
У меня нескольких видеокарт нету, но видел занятный промо-ролик нвидиа

Там где они DIGITS рекламируют. Был некий веб-интерфейс, из которого все настраивалось для работы на нужном количестве видях

Andrew
25.08.2016
13:07:26
это не под CuDNN ?

Andrey
25.08.2016
13:09:11
Это надстройка над cuDNN

Andrew
25.08.2016
13:11:16
занятная штука. спасибо

Vladislav
25.08.2016
13:23:51
Что выбираем? R+Python – 19 ??????? 44% Python – 17 ?????? 40% R – 6 ?? 14% Other – 1 ▫️ 2% ? 43 people voted so far.

Элегантно и просто ?

Andrey
25.08.2016
13:27:59
101% в сумме:)

Vladislav
25.08.2016
13:28:39
101% в сумме:)
округление, оно такое ?

Страница 8 из 327