@bigdata_ru

Страница 316 из 327
Evgeniy
02.10.2018
00:48:35
зацените мою новую статью)

NICE: Noise Injection and Clamping Estimation for Neural Network Quantization https://arxiv.org/abs/1810.00162

Oleg
02.10.2018
07:01:43
Если пройти по ссылке «this https URL» в статье, то будет лишняя точка в конце и 404 ошибка

Google
yopp
02.10.2018
11:11:54
зацените мою новую статью)
Поздравляю, Хаимевгенийавиалександр ;)

Weights are quantized to 4 bits, activations to 8 bits, and biases and the input image to 16 bits. The resource utilization is amounted to 222K LUTs, 650 DSP Blocks and 35.3 Mb of on-chip RAM. With the maximum clock frequency of 240MHz, the processing of a single image takes 250ms. In terms of power, the FPGA requires 30W while an NVIDIA Titan X GPU requires 160W .

мне вот не очень понятно утверждение «In terms of power, the FPGA requires 30W while an NVIDIA Titan X GPU requires 160W»

я или пропустил, или нет сравнения скорости обработки на титане

на мой взгляд более показательным было бы сравнить скорость и суммарное энегопотребление при обработке какого-то датасета

берём 1000 тестовых изображений, делаем измерительную станцию для контроля энергоптребления, запускаем обработку, фиксируем суммарное потребление за время обработки

Арсений
02.10.2018
21:49:30
Добрый вечер, господа дата-сайнтисты. Сам в ML - 0, поэтому спрашиваю у вас совета. Допустим у нас есть данные, о том что Вася слушает какой-то список групп, Петя слушает какой-то другой список групп, и так далее. Чем более схожие вкусы у двух людей, тем более похож их список. Вопрос, как мы можем получить распределение групп по жанрам? Ведь если какой-то группе людей нравится примерно похожий список групп, то эти группы, вероятно, из одного жанра. Решения этой задачи не прошу, прошу только подсказать в какую сторону копать

tonko
02.10.2018
21:54:00
>Ведь если какой-то группе людей нравится примерно похожий список групп, то эти группы, вероятно, из одного жанра Вот тут не уверен. И как вы распределение по жанрам без информации о связи жанров с группами получите?

Dan
02.10.2018
22:01:46
Гхм

Условно говоря нужно вручную каждой композиции дать тэги. А вот дальше сопоставление этих тэгов и даст результаты. Этим занимаются все без исключения рекомендательные сервисы.

Яндекс музыка, спотифай, гугл музыка, apple music, и так далее

У каждого - свой набор тэгов. Не знаю точно как, но например у Spotify количество тэгов для одной композиции МОЖЕТ БЫТЬ БОЛЕЕ 500 !!!

Google
Dan
02.10.2018
22:04:51
Но там учитываются вообще все возможные варианты. Типа: медленная, пианино, вокал, первый куплет без вступления, гитара, тихие барабаны, 100 bpm, и так далее. И таких характеристик - десятки и даже сотни

походу подобная база данных самая дорогая интеллектуальная собственность
Я предполагаю что эта база и есть основной актив Spotify :)

Vova
02.10.2018
22:05:18
угу

Dan
02.10.2018
22:05:23
Я б такой базой не делился даже за большие деньги

Vova
02.10.2018
22:05:34
я тоже :)

Dan
02.10.2018
22:05:50
Самому только если создавать. Но вообще тэгирование это крутая тема. А ещё более крутая, это нейронное автоматическое тегирование :)

Vova
02.10.2018
22:06:24
вообще самая гениальное - это заставлять такую базу людей заполнять бесплатно

Вот например Гугль....))

Dan
02.10.2018
22:06:35
Но это настолько высший пилотаж, что... Впрочем, это ещё никто не реализовал. Даже Shazam пока до такого не дошёл. Анализировать музыку чтобы автоматически протегировать - пока ещё никому не удавалось

Vova
02.10.2018
22:07:07
я щас намекаю на Капчу

Dan
02.10.2018
22:07:09
вообще самая гениальное - это заставлять такую базу людей заполнять бесплатно
Ты не поверишь, но некоторые готовы платить за то, чтобы тэгировать музыку :) Тот же спотифай, например - подписчики платят, и сами отправляют характеристики тоннами

ivan
02.10.2018
22:07:13
А, все Уже есть ответ) Блин, вот это больше

Dan
02.10.2018
22:07:38
Частично из открытых источников

Рекомендательный сервис === тэги

Арсений
02.10.2018
22:08:21
Понятно, очень сложно. Но по сути если сравнить слушателей двух групп, если схожесть будет большая, то вероятно группы похожи, и наоборот, так ведь?

Dan
02.10.2018
22:08:24
Личные предпочтения всегда можно переписать характеристиками, и сделать подбор по ним

Google
Vova
02.10.2018
22:08:44
на самом деле эта история началась относительно давно, психологи платили респондентам за участие во всяких опросах. В некотором смысле это то же самое, и этому уже многие десятилетия.

Dan
02.10.2018
22:09:07
Vova
02.10.2018
22:09:46
Понятно, очень сложно. Но по сути если сравнить слушателей двух групп, если схожесть будет большая, то вероятно группы похожи, и наоборот, так ведь?
Вероятно очень много степеней свободы у этой конструкции, поэтому нужно много факторов, а раз много факторов (тем более в шуме) то нужно много данных.

Dan
02.10.2018
22:09:51
Общественное мнение до сих пор собирают. Некоторые даже не гнушаются делать "холодные обзвоны" с опросами

Суть такова: если есть две группы, то они могут быть похожи, а могут и не быть. Нужно декомпозировать характеристики (тэги) и прописать в каждую из композиций. И если эти характеристики совпадут - значит и группы одинаковые. НО... характеристик должно быть реально очень много. Вплоть до самых малозначимых мелочей. Потому что для нас, человеков, мелочи - пшик, и мы ими часто пренебрегаем. А вот для компьютера важна каждая деталь.

Vova
02.10.2018
22:11:32
Я сторонник того, что добыча данных, не из данных, а из "реальности" - ключевое во всей этой возне с данными. В конце концов возню заменит AutoML )))) А вот данные нужно собирать

Dan
02.10.2018
22:12:36
В обозримом будущем, когда машины поработят человеков (СР! УВЧ!) - нас оставят работать на фермах для сбора данных. Мы будем их собирать, и решать капчи. А машины - главенствовать

Собственно, так уже и есть... Если задуматься

Vova
02.10.2018
22:14:13
Идёш такой по улице, ... пёрнул, и бац сразу в наушниках реклама таблеток от вздутия живота:)

Микрофоны и распознование звуков!

Арсений
02.10.2018
22:15:02
А если так, допустим есть группа A, B и С, и у каждой какое-то количество слушателей. И допустим 20% слушателей группы A слушают также группу B, а группу C слушает ну например 5%. Из этого ведь можно сделать вывод о том что группы A и B более похожи. Мне нужно не сами группы сравнивать, а их слушателей

Dan
02.10.2018
22:15:03
????

Арсений
02.10.2018
22:15:56
То есть мне не нужно знать насколько похожа их музыка, как в случае с вышеупомянутом тэгированием

Vova
02.10.2018
22:17:48
У меня есть такая теория, что скоро все будут носить бороды или маски (ну которые от гриппа и тп). ну я кажется рассказывал. Но повторюсь. Почему? Потому что заипут лицо рапознавать уличных камеры. К любовнице не зайдёшь, косо на портрет "нацлидера" не взглянешь и тп А если у всех будет одинаковая по форме борода - вот тут то алго будет тяжело. Ну и в таком роде ... то есть все в будущем будут одеваться-выглядеть абсолютно одинаково.

Dan
02.10.2018
22:18:04
Тем что их слушают те же люди? Ну так себе...

Арсений
02.10.2018
22:19:30
да, так

знаю что точность будет низкой, но пойдет и так

Тут есть какие-нибудь способы? Я в принципе могу перебрать каждую пару и получить этот процент без ML, но кажется это будет ужасно долго и неэффективно

ivan
03.10.2018
00:03:35
А есть какие-то материалы с практикой сразу по всяким numpy, matplotlib, pandas, scikit-learn и тд. Самому себе задачи придумывать конечно прикольно, но не то Мб книги какие-то или сайты, посвящённые ds(кроме kaggle)

Google
Oleg
03.10.2018
07:18:19
Привет, Ivan, не знаю - можно-ли кидать ссылки на udemy. недавно проходил курс - здорово помог разобраться в тех технологиях что ты спрашиваешь

https://www.udemy.com/python-for-data-science-and-machine-learning-bootcamp/learn/v4/t/lecture/5733360?start=0

Artem
03.10.2018
07:23:10
https://www.udemy.com/python-for-data-science-and-machine-learning-bootcamp/learn/v4/t/lecture/5733360?start=0
кто же эти люди, что покупают онлайн курсы за 195 евриков

Nikolay
03.10.2018
07:24:34
Ну считай что это 195 руб. Или даже 1950 руб. При зп 70к не так уж и дорого

Oleg
03.10.2018
07:27:19
у меня этот курс стоит 12$ сейчас, я покупал за 9$

Boris
03.10.2018
07:31:41
На удеми курсы классные, но надо покупать их только при распродаже по 10 долл, распродажи там раз в месяц минимум

Vova
03.10.2018
07:34:22
кто же эти люди, что покупают онлайн курсы за 195 евриков
Секрет udemy в том, что периодически они устраивают распродажи в 10% от изначальной стоимости. На всякие общеизвестные даты.

Oleg
03.10.2018
07:34:40
Курс мне понравился очень + совпало что я на работе стал применять, однозначно я очень доволен

там и теория и сразу практика с подготовленными данными

Vova
03.10.2018
07:36:17
Я как то на $100 накупил столько ... что до сих пор непросмотрю. Ещё и себя поругиваю - нафига оно мне надо. Но как то наткнулся на распродажу и как то льстило что за $100 покупаешь курсов на $1000.

Ну и есть вот такие штуки, кому хочется бюджетно - https://skladchik.com , там чтотолько не шарят по ценнику... помоёму только нетфликс не скачали и\или не расшарили.

Dan
03.10.2018
08:17:04
На udemy почти всегда распродажи, и курсы можно получить либо вообще бесплатно, либо за $5-10

TILTED
03.10.2018
08:23:15
А лучше вообще с торента скачать!

Dan
03.10.2018
08:26:59
TILTED
03.10.2018
08:28:01
Мы против пиратства
Извините. Бедным студентам тут не место, я понял.

Dan
03.10.2018
08:28:49
Извините. Бедным студентам тут не место, я понял.
Нет. Я и сам за свободу информации. Но пиратство это реально плохо. Даже если ты нищий.

Страница 316 из 327