
Arslan
07.06.2017
08:33:02
Википедию советую: берёте статью на английском и открываете русский вариант. А вообще да -- горите в аду, кто переводит термины с английского

Ivan
07.06.2017
08:33:28
На machinelearning.ru есть словарик, но он не полный

Andrey
07.06.2017
08:45:42
Ага, пишите все на суржике. Facepalm.jpg
Так удобнее будет отличать реально шарящих от нахватавшихся предисловий

Google

Anton
07.06.2017
09:26:13
я не сварщик, кто может помочь с расчетом железа, под примерно такое:
40тб данных с приростом на 10тб в год.
hadoop без MapReduce, на Spark
формат данных Parquet
СУБД Hive

Vitaly
07.06.2017
09:31:52
Нужно свое железо или облачное?

これはスタスか…ロマンですか
07.06.2017
09:34:31

Anton
07.06.2017
09:35:44

Проксимов
07.06.2017
09:36:46

Rishab
07.06.2017
09:56:37
Hey guys Do anyone of you know English?
I am doing my masters in Data Analytics and need to purpose a research question on machine learning or AI or Big data.
Any help will be much appreciated
Regards

Yury
07.06.2017
10:38:14

Konstantin
07.06.2017
10:53:45

Проксимов
07.06.2017
18:30:01
Похоже ему больно

Dan
07.06.2017
18:31:20
?

Проксимов
07.06.2017
18:32:32

Dan
07.06.2017
18:33:43

Google

Проксимов
07.06.2017
18:34:45

Anton
08.06.2017
08:28:59
у нас hr активизировались, может кому будет интересно - https://rambler-co.ru/jobs?vacancy_id=441
если надо зааплаить, пишете в пм

Dan
08.06.2017
08:40:52

Anton
08.06.2017
08:42:57
@hitmaker не скажу, я совсем в другом департаменте
может что-то есть на гласдоре

Denis
08.06.2017
09:23:54
для всяких тензорфлоу, керас и т д какая убунту лучше? 14 или 16?

Evgeniy
08.06.2017
09:24:15

Denis
08.06.2017
09:24:32

Aldar
08.06.2017
12:02:57
кто нибудь знает чат про R?

Evgeniya
08.06.2017
12:08:57
#вакансия #москва #devops
Коллеги, привет!
Отличная вакансия для тех, кто давно мечтал окунуться в мир Big Data! Мы ищем специалиста на администрирование парка Big Data систем (Apache Hadoop, Vertica, Pentaho), готовы смотреть людей без опыта, но реально готовых учиться. В начале задачи будут преимущественно по Big Data, затем и по Linux инфраструктуре.
Обязателен отличный опыт работы с *nix системами, виртуализацией, также приветствуется опыт в разработке архитектурных решений.
Самостоятельность — ОБЯЗАТЕЛЬНО.
Если интересно, пишите на e.kikoina@youdo.ru

Andrey
08.06.2017
12:31:44

Aldar
08.06.2017
12:33:04
рисую в R boxplot(df$Smt, df$Bool), где Bool это boolean переменная, получаю для нее значения 1 и 2, почему?

Andrey
08.06.2017
12:33:32
Потому что она автоматом стала фактором
А факторы автоматом имеют метки начиная с 1

Aldar
08.06.2017
12:35:11
как сделать чтобы значения были TRUE, FALSE, или хотя бы 0 или 1?

Andrey
08.06.2017
12:35:18
Если сделать из df$bool фактор вручную, указав levels = c(0, 1) и labels = c(0, 1), все будет ок

Aldar
08.06.2017
12:35:45
ок, спс

Andrey
08.06.2017
12:36:23
Или labels = c("TRUE", "FALSE")

Асхат
08.06.2017
13:09:06
всем привет.
я делаю рекомендательную систему.
у нас есть данные о выбранных продуктах на каждый месяц, оценка качества рекомендации происходит с помощью метрик ранжирования, как задавать этот самый ранг для валидации модели?

Sergey
08.06.2017
13:22:54
если я правильно понял, это обычный supervised learning же. В одном датасете должны храниться данные о продуктах (будут как x), а также данные о этой самой оценке (будут как y). Их сплитить на трейн/тест, либо разбивать на КФолды, тренировать модель и смотреть оценку
Если выбран питон в качестве языка для машинного обучения, то рекомендую что-то подобное прочитать в начале, да и в принципе полно статей даже на русском про scikit-learn на том же хабре: http://mlbootcamp.ru/article/tutorial/

Google

Oleg
08.06.2017
13:34:58

Асхат
08.06.2017
13:43:35
проблема в ранге, в какой-то момент пользователь приобрёл новый продукт, а остальные не приобрёл, значит этот продукт будет иметь наивысший ранг, а какие ранги задать остальным продуктам?
если рассматривать задачу как многоклассовую классификацию, то задача понятна, а если рассматривать как задачу ранжирования, то тогда мне не понятно как мерить качество

/dev
08.06.2017
13:47:31

Асхат
08.06.2017
13:48:09
нет частичного порядка
есть только данные о пользовании продуктом в каждый месяц
я туплю, для вычисления метрики не нужен порядок на тестовых данных, достаточно знать, релевантна ли каждая рекомендация

Danil
08.06.2017
17:01:01
Возможно ли не имя никакой степени получить коммерческий опыт в области AI и всего с ним смежного? Просто реальные истории не нашел, поэтому хотелось у вас спросить

Boris
08.06.2017
17:01:37

Danil
08.06.2017
17:02:57

Admin
ERROR: S client not available

Aldar
08.06.2017
18:06:47
Вопрос по R, какую функцию применить к логическому вектору, чтобы получить количество TRUE?

?
08.06.2017
18:07:15

Aldar
08.06.2017
18:07:36
точняк, TRUE это ж 1, а FALSE - 0

?
08.06.2017
18:07:44
угу

Evgeniy
08.06.2017
18:49:02
Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour https://research.fb.com/publications/imagenet1kin1h/

Aleksander
08.06.2017
20:35:23
Andrey спасибо тебе, очень помог с наталкиванием на путь истинный. Пишу имплементацию уже кластеризации через dtw для спарка

Koder25
09.06.2017
03:38:59
@marvel_dc_official Лучший канал о вселенной Marvel & DC, подпишись и зови друзей?

Проксимов
09.06.2017
05:17:45
@hitmaker @dd_bb спам

Oleksandr
09.06.2017
09:44:37
https://i.redd.it/ro7j9zngfh2z.png

Google

Проксимов
09.06.2017
09:46:52

Nikolay
09.06.2017
10:09:47
и тут тоже продублирую - го все к нам на третий митап :) https://www.meetup.com/PyData-Moscow/

nsdkfhudorgihn
10.06.2017
22:39:41
привет, работаю с керас, не понимаю как выглядит структура сети
насколько это близко к правде?
нигде не могу найти материал, где это объяснялось бы

Albert
11.06.2017
00:28:05
Если Керас, то ты ведь можешь запустить tensorboard и посмотреть на вычислительный граф, или нет? Когда-то он дал мне небольшой intuition

nsdkfhudorgihn
11.06.2017
00:49:24
я читал про это, но так и не понял как с ним работать
нужно ставить платформу?
нашел, https://stackoverflow.com/questions/42112260/how-do-i-use-the-tensorboard-callback-of-keras, круто
спасибо


Bogdan
12.06.2017
06:15:14
Не знаю обсуждали ли тут уже AlphaGo, меня очень впечатлила статья.
ИИ теперь сильнее человека играет в го
https://geektimes.ru/post/289875/
Немного офтопа сегодня. Просто великолепная статья об AlphaGo, триумфе гугла и о будущем ИИ. Есть о чем поразмыслить!
Меня впечатлил тот факт, что лучшие мировые игроки унаследовали новые стратегии игры, наблюдая за партиями AlphaGo. То есть, что получается? Программа вначале обучилась на истории игр людей в го, потом натренировалась в играх сама с собой. Далее, топовые игроки перенимают стратегии и обучаются у алгоритма.
Ходы AlphaGo не всегда понимают даже самые сильные игроки. То есть, лучшее решение иногда (или часто — зависит от сферы применения) человеку кажется непонятным или глупым из-за ограниченности вычислительных возможностей мозга.
Еще вопрос напрашивается: а стоит ли заниматься алготрейдингом (да и в принципе трейдингом), если существуют такие гиганты как DeepMind (читай гугл)? Думаю, что смысл все же есть. Во-первых, сфера ИИ только начинает развиваться. Во-вторых, в основном, рынок является инструментом совершения сделок между различными людьми/компаниями, а значит спекулянты на нем пока второстепенны. То есть, если даже у мировых гигантов есть тысячи торговых роботов, вряд ли они пока на столько сильно влияют на рынок и вносят в него энтропию. Шума, конечно же, будет все больше и больше, но радует наличие инструментов на которых заметно влияние именно людей, а не роботов. Инструменты, поведение которых довольно логично и пока еще не очень хаотично.
SNP500 — растет вместе с экономикой и падает во время кризиса. Для многих этот инструмент является основным объектом инвестирования.
Биткоин — объект всеобщей любви и подражания, растет эйфорически, экспоненциально! Каждый рост стабильно сопровождается сильным падением из-за жадности и страха его держателей.
На эти размышления меня натолкнула статья. Если вы занимаетесь ИИ, машинным обучением, нейросетями — очень советую к прочтению.
#ссылки #офтоп