
Oleksandr
26.12.2017
14:53:39
по сравнению с, скажем, спаркмльный или нампаевскими аналогами

Vasiliy
26.12.2017
14:54:58
нампай ты имеешь в виду питоновский или nd4s ?
просто nd4s недоработан и не работает с последними версиями скалы

Oleksandr
26.12.2017
14:57:53
np.array

Google

Denis
26.12.2017
14:58:15
Оффтоп, зацените компиляцию простой алгебры в LLVM на лету
https://github.com/llvm-hs/llvm-hs-examples/blob/master/arith/Arith.hs#L52

Vasiliy
26.12.2017
14:58:55
np.array
а, ну мы же про скалу говорим, всё что мне нужно он делал, но я не так плотно использовал
а про спаркмл, он же мллиб, он довольно ущербный

Oleksandr
26.12.2017
14:59:24

Vasiliy
26.12.2017
15:00:08
ну вот мы же с него сейчас начали )
вот тебе мллиб сгенерил кучу векторов. И что с ними делать?

sherzod
26.12.2017
15:02:28
не ну векторы там нужны для распределённых матриц, и главным образом для разреженных векторов, dense там присутствует только для симметрии, мне кажется.
то есть нужно распредёленно умножить две матрицы, или какой-нибдудь PCA посчитать. это для этого же абстракция
Просто API крайне неудобно-громоздкое. И качество mllib алгоритмов очень хреновое, сходимость тоже плохая. По сравнению с sklearn

Vasiliy
26.12.2017
15:03:38
np.array
https://github.com/scalanlp/breeze/wiki/Linear-Algebra-Cheat-Sheet
вот тут сравнение апишек можно глянуть

sherzod
26.12.2017
15:04:35
а breeze же вроде не распределённый еще.. или я путаю

Alex
26.12.2017
15:04:35

Google

Oleksandr
26.12.2017
15:04:53

Vasiliy
26.12.2017
15:05:22
я говорю, не очень плотно использовал, но то что использовал, довольно удобно, быстро привыкаешь

sherzod
26.12.2017
15:05:23
не знаю допотопные или нет. на практике деревья, boosting очень плохо работают. гораздо хуже чем sklearn

Oleksandr
26.12.2017
15:05:49

Alex
26.12.2017
15:07:37

sherzod
26.12.2017
15:08:02
это не python vs scala
это sklearn vs spark mllib

Vasiliy
26.12.2017
15:15:52
https://github.com/apache/spark/blob/v2.2.1/mllib/src/main/scala/org/apache/spark/mllib/linalg/Vectors.scala
ктати, есть же метод asBreeze
если всё-таки там вектор org.apache.spark.mllib.linalg.Vector

Alex
26.12.2017
15:17:06

sherzod
26.12.2017
15:17:24
нет это python API к спарку

Vasiliy
26.12.2017
15:17:24
а, блин, правда он приватный для пакета

sherzod
26.12.2017
15:18:56
Alex, вообще про все это можно здесь поспрашивать: https://t.me/hadoopusers , там больше про спарк хадуп

Alex
26.12.2017
15:20:46

Vasiliy
26.12.2017
15:22:29
да, конечно

Oleksandr
26.12.2017
15:44:59
scala> trait T { type TT; val t: TT }
defined trait T
scala> class C extends T { type TT = Int; val t = 42 }
defined class C
scala> class AC (c: C)(data: Array[c.TT])
<console>:13: error: not found: value c
class AC (c: C)(data: Array[c.TT])
подскажите, реально ли это завести?
и, собсно, почему тут c оно не находит

Nikolay
26.12.2017
15:49:25
реально сделать чтобы был def AC(c: C)(data: Array[c.TT]) = new AC(c, data)
можно в companion object у AC сделать apply такого вида

Google

Daniel
26.12.2017
15:50:20

Vasiliy
26.12.2017
15:50:45

Daniel
26.12.2017
15:53:12
У меня один проект только был, в итоге nd4j полностью в лес ушел, а бриз пришлось тащить из-за решения линейных уравнений. Все остальное сам говнокодил на джавовых массивах.

Vasiliy
26.12.2017
15:53:52
на джавовских массивах не должны получиться эффективные операции с векторами
а, ну я понял, поэтому бриз был
я просто думал, есть хорошая замена

Daniel
26.12.2017
15:55:20
На удивление (моим рукам), было сравнимо с бризом, намного быстрее nd4j.

Vasiliy
26.12.2017
15:55:44

Daniel
26.12.2017
15:56:13
У бриза косяк, что он не умеет в многомерные вектора.

Oleg
26.12.2017
15:57:02
или что ты имеешь в виду под "эффективными"?
GPU?

Daniel
26.12.2017
15:58:56
За эффективным надо бласы. А жвм не оч с хождением в нейтив.
Векторизацию вычислений тоже не сделать.

Oleksandr
26.12.2017
15:59:43

Oleg
26.12.2017
16:02:50

Daniel
26.12.2017
16:08:50
а вот как же -XX:+UseSuperWord
Мне не помогло догнать нампи. Без нее я не сравнивал. Что в действительности оно делает тоже хз, может под это особо надо код подстраивать.

Vasiliy
26.12.2017
16:09:13
This option is enabled by default.
да, интересно, как должен выглядеть код в java, чтобы эффективно сложить два вектора

Oleg
26.12.2017
16:10:40

Google

Vasiliy
26.12.2017
16:14:36
цикл
ага, понял, надо в эту сторону покопать, ты хочешь сказать, что java по-умолчанию умеет линалг не хуже всяких бласов?

Alex
26.12.2017
16:15:37

Vasiliy
26.12.2017
16:15:48

Oleg
26.12.2017
16:16:42

Vasiliy
26.12.2017
16:17:21

Yury
26.12.2017
16:18:27
/stat@combot

Combot
26.12.2017
16:18:27
combot.org/chat/-1001034178083

Oleksandr
26.12.2017
16:19:56
в джаве есть гарантированная нативная векторизация?

Admin
ERROR: S client not available

Oleg
26.12.2017
16:20:49

Oleksandr
26.12.2017
16:23:59

Alex
26.12.2017
16:36:31
насколько я помню основная фича всех этих бласов это что размеры блоков под размер кеша подогнаны

Combot
26.12.2017
16:39:07
combot.org/chat/-1001034178083

Nick
26.12.2017
17:13:01
https://github.com/danielmiessler/SecLists/pull/155

KrivdaTheTriewe
26.12.2017
21:38:15
Ник
Боян жи

Nick
26.12.2017
21:57:42
Ага
Я медленный

Mikhael
27.12.2017
04:51:02
Всем привет. А у кого-нибудь есть pdf 'Apache Spark for Data Science Cookbook'?

Google

Mikhael
27.12.2017
04:56:27
или другой кукбук по спарку.

Eugene
27.12.2017
05:39:26
Такая есть

Mikhael
27.12.2017
05:46:04
Такая есть
такая на русском у меня есть. но английский вариант не помешает, приложите, пожалуйста.

Grigory
27.12.2017
06:12:42
Mikhael

Daniel
27.12.2017
06:16:55
копирайтеров на тебя нет

Oleg
27.12.2017
06:44:20
Надо бы предупреждение о копирайте куда-то в описание канала
Скоро будет снова тысячный мембер

Daniel
27.12.2017
06:45:25

Anatoliy
27.12.2017
06:47:16

Mikhael
27.12.2017
06:50:25
есть ведь книги, которые легально выкладываются на сайтах. https://www.confluent.io/resources/

Grigory
27.12.2017
06:51:31

Daniel
27.12.2017
07:13:14

Grigory
27.12.2017
07:13:45

Daniel
27.12.2017
07:14:51
давно в нем ковырялся, забыл уже как дня 3 по сорцам лазил...
а тут пришось "по-быстрому" накидать утилитку

Grigory
27.12.2017
07:15:29
да знаешь у него еще более или менее апи на самом деле

Daniel
27.12.2017
07:16:15
да? как достать ключ из Record без deprecated api?