@scala_ru

Страница 1170 из 1499
Oleksandr
26.12.2017
14:53:39
по сравнению с, скажем, спаркмльный или нампаевскими аналогами

Vasiliy
26.12.2017
14:54:58
нампай ты имеешь в виду питоновский или nd4s ?

просто nd4s недоработан и не работает с последними версиями скалы

Oleksandr
26.12.2017
14:57:53
np.array

Google
Denis
26.12.2017
14:58:15
Оффтоп, зацените компиляцию простой алгебры в LLVM на лету https://github.com/llvm-hs/llvm-hs-examples/blob/master/arith/Arith.hs#L52

Vasiliy
26.12.2017
14:58:55
np.array
а, ну мы же про скалу говорим, всё что мне нужно он делал, но я не так плотно использовал

а про спаркмл, он же мллиб, он довольно ущербный

Vasiliy
26.12.2017
15:00:08
ну вот мы же с него сейчас начали )

вот тебе мллиб сгенерил кучу векторов. И что с ними делать?

sherzod
26.12.2017
15:02:28
не ну векторы там нужны для распределённых матриц, и главным образом для разреженных векторов, dense там присутствует только для симметрии, мне кажется. то есть нужно распредёленно умножить две матрицы, или какой-нибдудь PCA посчитать. это для этого же абстракция

Просто API крайне неудобно-громоздкое. И качество mllib алгоритмов очень хреновое, сходимость тоже плохая. По сравнению с sklearn

Vasiliy
26.12.2017
15:03:38
np.array
https://github.com/scalanlp/breeze/wiki/Linear-Algebra-Cheat-Sheet

вот тут сравнение апишек можно глянуть

sherzod
26.12.2017
15:04:35
а breeze же вроде не распределённый еще.. или я путаю

Google
Oleksandr
26.12.2017
15:04:53
https://github.com/scalanlp/breeze/wiki/Linear-Algebra-Cheat-Sheet
видел, меня больше интересует личное впечатление, в духе "жить можно" или "хрен чего запилишь" на более нетривиальных задачах

Vasiliy
26.12.2017
15:05:22
я говорю, не очень плотно использовал, но то что использовал, довольно удобно, быстро привыкаешь

sherzod
26.12.2017
15:05:23
не знаю допотопные или нет. на практике деревья, boosting очень плохо работают. гораздо хуже чем sklearn

sherzod
26.12.2017
15:08:02
это не python vs scala это sklearn vs spark mllib

Vasiliy
26.12.2017
15:15:52
https://github.com/apache/spark/blob/v2.2.1/mllib/src/main/scala/org/apache/spark/mllib/linalg/Vectors.scala

ктати, есть же метод asBreeze

если всё-таки там вектор org.apache.spark.mllib.linalg.Vector

Alex
26.12.2017
15:17:06
это не python vs scala это sklearn vs spark mllib
А pyspark sklearn не как обертка работает?

sherzod
26.12.2017
15:17:24
нет это python API к спарку

Vasiliy
26.12.2017
15:17:24
а, блин, правда он приватный для пакета

sherzod
26.12.2017
15:18:56
Alex, вообще про все это можно здесь поспрашивать: https://t.me/hadoopusers , там больше про спарк хадуп

Alex
26.12.2017
15:20:46
а, блин, правда он приватный для пакета
Да я думаю что легче обычные Array через стандартную либу сгенерировать, а потом обернуть в нужную структуру уже.

Vasiliy
26.12.2017
15:22:29
да, конечно

Oleksandr
26.12.2017
15:44:59
scala> trait T { type TT; val t: TT } defined trait T scala> class C extends T { type TT = Int; val t = 42 } defined class C scala> class AC (c: C)(data: Array[c.TT]) <console>:13: error: not found: value c class AC (c: C)(data: Array[c.TT]) подскажите, реально ли это завести?

и, собсно, почему тут c оно не находит

Nikolay
26.12.2017
15:49:25
реально сделать чтобы был def AC(c: C)(data: Array[c.TT]) = new AC(c, data)

можно в companion object у AC сделать apply такого вида

Google
Vasiliy
26.12.2017
15:50:45
Daniel
26.12.2017
15:53:12
У меня один проект только был, в итоге nd4j полностью в лес ушел, а бриз пришлось тащить из-за решения линейных уравнений. Все остальное сам говнокодил на джавовых массивах.

Vasiliy
26.12.2017
15:53:52
на джавовских массивах не должны получиться эффективные операции с векторами

а, ну я понял, поэтому бриз был

я просто думал, есть хорошая замена

Daniel
26.12.2017
15:55:20
На удивление (моим рукам), было сравнимо с бризом, намного быстрее nd4j.

Daniel
26.12.2017
15:56:13
У бриза косяк, что он не умеет в многомерные вектора.

Oleg
26.12.2017
15:57:02
или что ты имеешь в виду под "эффективными"?

GPU?

Daniel
26.12.2017
15:58:56
За эффективным надо бласы. А жвм не оч с хождением в нейтив.

Векторизацию вычислений тоже не сделать.

Oleksandr
26.12.2017
15:59:43
реально сделать чтобы был def AC(c: C)(data: Array[c.TT]) = new AC(c, data)
кое-как прибил молотком инстансофов, сейчас попробую это

Oleg
26.12.2017
16:02:50
Daniel
26.12.2017
16:08:50
а вот как же -XX:+UseSuperWord
Мне не помогло догнать нампи. Без нее я не сравнивал. Что в действительности оно делает тоже хз, может под это особо надо код подстраивать.

Vasiliy
26.12.2017
16:09:13
This option is enabled by default.

да, интересно, как должен выглядеть код в java, чтобы эффективно сложить два вектора

Google
Vasiliy
26.12.2017
16:14:36
цикл
ага, понял, надо в эту сторону покопать, ты хочешь сказать, что java по-умолчанию умеет линалг не хуже всяких бласов?

Vasiliy
26.12.2017
16:15:48
Vasiliy
26.12.2017
16:17:21
вероятно, хуже. Однако, не то, чтобы векторизации не
а за счёт чего хуже? Мне просто интересно. Если я в бласе перемножу два вектора и в java, за счёт чего блас выиграет?

Yury
26.12.2017
16:18:27
/stat@combot

Combot
26.12.2017
16:18:27
combot.org/chat/-1001034178083

Oleksandr
26.12.2017
16:19:56
в джаве есть гарантированная нативная векторизация?

Admin
ERROR: S client not available

Oleg
26.12.2017
16:20:49
а за счёт чего хуже? Мне просто интересно. Если я в бласе перемножу два вектора и в java, за счёт чего блас выиграет?
Я-то полчаса назад узнал про этот флаг, но полагаю за счёт того, что БЛАС обложен хинтами компилятору, какими-нибудь промежуточными ансейфовыми копированиями оптимального размера и т.п. А твоя джава станет таким кодом, каким JIT захочет

Oleksandr
26.12.2017
16:23:59
Alex
26.12.2017
16:36:31
насколько я помню основная фича всех этих бласов это что размеры блоков под размер кеша подогнаны

Combot
26.12.2017
16:39:07
combot.org/chat/-1001034178083

Nick
26.12.2017
17:13:01
https://github.com/danielmiessler/SecLists/pull/155

KrivdaTheTriewe
26.12.2017
21:38:15
Ник

Боян жи

Nick
26.12.2017
21:57:42
Ага

Я медленный

Mikhael
27.12.2017
04:51:02
Всем привет. А у кого-нибудь есть pdf 'Apache Spark for Data Science Cookbook'?

Google
Mikhael
27.12.2017
04:56:27
или другой кукбук по спарку.

Eugene
27.12.2017
05:39:26
Такая есть

Mikhael
27.12.2017
05:46:04
Такая есть
такая на русском у меня есть. но английский вариант не помешает, приложите, пожалуйста.

Grigory
27.12.2017
06:12:42
Mikhael

Daniel
27.12.2017
06:16:55
копирайтеров на тебя нет

Oleg
27.12.2017
06:44:20
Надо бы предупреждение о копирайте куда-то в описание канала

Скоро будет снова тысячный мембер

Anatoliy
27.12.2017
06:47:16
копирайтеров на тебя нет
и хорошо наверное что нет?)

Mikhael
27.12.2017
06:50:25
есть ведь книги, которые легально выкладываются на сайтах. https://www.confluent.io/resources/

Daniel
27.12.2017
07:13:14
Я не вспомню настолько же ущербного апи как у бриза.
Я передумал. Бриз получает 2ое место. 1ое с отрывом получает hbase.

Daniel
27.12.2017
07:14:51
давно в нем ковырялся, забыл уже как дня 3 по сорцам лазил... а тут пришось "по-быстрому" накидать утилитку

Grigory
27.12.2017
07:15:29
да знаешь у него еще более или менее апи на самом деле

Daniel
27.12.2017
07:16:15
да? как достать ключ из Record без deprecated api?

Страница 1170 из 1499