
Alex
05.08.2017
21:34:09
?

Dan
05.08.2017
21:38:23
Коллеги, нужна помощь. Обратился хороший человек с таким вопросом:
"Рекомендательная система для клиентов банка.
Много разнородных данных. Я взял клиенты и транзакции(описание транзакций)
Кластеризация на 5-10 классов
Фичами сделал: количество транзакций определенного класса
описание транзакций очень захломленное, убрал большую часть хлама, но все равно осталось много
я хотел сделать кросс-таб и на нем обучить кнн хотя бы
то есть фичами взял не особо захломленные описания транзакций"
"хотел понизить размерность с помощью свд, но компьютер старый и не тянет это даже"

Google

Dan
05.08.2017
21:39:49
если у вас есть какие-либо соображения по этому поводу - пожалуйста дайте знать мне, или @BobaZooba
заранее большое спасибо

Kamalkhan
05.08.2017
22:14:08
Есть такой вопрос, возможно ли создать SLURM систему на сервере DigitalOcean с самым минимальным пакетом?
Просто для решения задач с GPU нужен хороший сервак, а ноут не тянет.
Спасибо

Sergey
05.08.2017
22:16:59
А откуда на DigitalOcean возьмется GPU?
Самый минимальный тариф DigitalOcean или других VPS наверняка будет очень заметно слабее ноута (даже если ноут довольно старый)

Dima
05.08.2017
22:30:46
В школе нам как раз регрессию и градиент не давали
Хотя он прост
А за совет спасибо
А какие серьезные книги по теме можете привести?
Дуда и Харт?

Mikhail
06.08.2017
03:31:28
У кого локальный компьютер не терять, можно что-то типа такого использовать
Ээээ
Чот слишком активная резалка у вас
https://www.paperspace.com/ml

Google

Kaspar
06.08.2017
06:22:07
Можно легко банить просто по слову заработок

?
06.08.2017
06:42:55
Не только

Maxim
06.08.2017
07:22:54
https://www.paperspace.com/ml
у меня одна их только главная страница весь проц отъела - видимо, чтобы люди побыстрее осознали ущербность своих локальных компов
Вопрос - кто использует ReLU, вы проверяете как-то сеть на наличие dead ReLU, которые ушли в ноль и никогда не активируются? Сколько их обычно процентов получается в типичной сети? Я слышал про число 20%

Mikhail
06.08.2017
07:37:48
ребята, где вопрос про компьютерное зрение можно задать? Есть специализированные чатики по OpenCV?

Никита
06.08.2017
07:38:06
Mikhail смотри слак

Mikhail
06.08.2017
07:40:02
какой слак канал?

Kaspar
06.08.2017
07:48:37


Vova
06.08.2017
12:47:41
"хотел понизить размерность с помощью свд, но компьютер старый и не тянет это даже"
установите IPython (jupiter) на любую сильную VPSку с дешёвой почасовой оплатой (которую можно выключать, и платить только за диски), загрузите туда данные и можете эксперементировать за умеренную плату (потом инстанс выключать). N.B. Есть провайдеры, которые дерут шкуру за все ресерсы выключенного VPS инстанса, например Vultr. Облачных провайдеров много. От DO до Scaleway. Мощные инстансы на >10 ядер обходятся в доллары час. Но там и памяти и 120 гиг и выше. Поигрались-выключили. Дисковое пространство (если у вас не совсем совсем big data) стоит недорого (у scaleway, например 1 евро в месяц 50Gb). Сможете и размерность сокращать и что хотите делать.
https://www.paperspace.com/ml
кстати, я полностью живу в облаках. В частности даже десктопный Телеграм в котором я пишу - это удалённый RDP с инстансом в облаке.


Mikhail
06.08.2017
12:57:28
Слушай, а не лагает? Latency важно в UI

Vova
06.08.2017
12:58:39

Mikhail
06.08.2017
12:58:59
Меня иногда локального компа тормоза раздражают

Vova
06.08.2017
12:59:10
в C# интеллисенс чуть-чуть медленнее чем в реале, чуть чуть

Mikhail
06.08.2017
12:59:11
а вообще норм идея в облаке работать
лишь бы канал хороший был

Vova
06.08.2017
12:59:58
да, хороший канал дома, и хорошая локация "там" поближе к точке обмена траффиком

Mikhail
06.08.2017
13:00:16
я иногда по sshfs монтирую удаленные сервера и в редакторе работаю
пока на оптике — как на своей машине, а на LTE рвется канал постоянно

Google

Mikhail
06.08.2017
13:00:42
бесит

Vova
06.08.2017
13:00:43
т.е. RDP, конечно в США, не стоит. А европа - норм.
RDP не для LTE, да это правда
но iPython - отлично

Mikhail
06.08.2017
13:01:49
браузер локально открыт для ipython?
или тоже удаленно?

Vova
06.08.2017
13:01:58
да
и так и так

Mikhail
06.08.2017
13:02:27
а если headless машина, то что делаешь?

Vova
06.08.2017
13:02:47
в основном - через RDP (не парит), но если канал плохой, то локальным браузером (так было один ращз, когда в отпуске был)

Mikhail
06.08.2017
13:03:05
я вот виртуальный дисплей через Xvfb запускаю иногда, и VNC клиент

Vova
06.08.2017
13:03:11

Admin
ERROR: S client not available

Mikhail
06.08.2017
13:03:28
Но VNC жутко нестабильная технлогия

Vova
06.08.2017
13:03:41
RDP - супер
у меня в десктопных виртуалках винды
есть такая винда "Hyper-V Server" о ней мало кто знает, она бесплатная. У неё вырезан GUI, но не под ноль, поэтому много GUI-программ запускается
я пользуюсь ей
у меня такой вопрос к комьюнити, просто KYC (know your colleagues), кто реально работает с Big Data, т.е. (raw?) data size» RAM ? У меня - пограничная ситуация. Так то данных терабайт на 6, но сократив их из raw, я получаю десятки гигабат (до 100-200) и их уже можно покрутить на одной машине. Интересны люди которые реально большие кейсы рулят. безальтернативная бигдата, так сказать

Google

Denis
06.08.2017
14:02:03
есть у кого-нибудь чат по hive? похожий на этот

Dan
06.08.2017
14:18:10
но я не помню что-то такого названия вроде

Denis
06.08.2017
14:19:46

Dan
06.08.2017
14:20:02

Denis
06.08.2017
14:34:14

Vlad
06.08.2017
15:39:45
Всем привет. Может кто-то поделиться и инструментами для анализа веб-поиска или анализа кучи ключевиков. К примеру есть список компаний и надо найти на каждую описание и понять чем она занимается.

Роман
06.08.2017
15:48:38
яндекс карты можно потыкать

Sergey
06.08.2017
16:05:36

Nick
07.08.2017
12:02:47
Подскажите, где взять купон на курс Andrew Ng на курсере?

Nikolay
07.08.2017
12:03:24
на kupikupon.ru

Nick
07.08.2017
12:04:27
Он к России как-то привязан или можно из любой страны использовать?

Nikolay
07.08.2017
12:05:05
да не, я шучу
просто никогда в жизни не слышал про купоны для курсеры

Olya
07.08.2017
12:12:39
А зачем? Там же бесплатный курс