@bigdata_ru

Страница 138 из 327
Kassymkhan
12.09.2017
11:07:21
Всем привет, я учусь в университете и разбираюсь сейчас с machine learning. Вопрос такой - хотелось бы сделать распознавание рукописных нот. На курсе Andrew Ng делал распознавание цифр. Можете подсказать куда копать, на какие задачи нужно разбить эту проблему. Основной инструмент питон.

tonko
12.09.2017
11:10:28
1. Найти размеченные данные (картинки нот на стане, сопоставленные с их записью в привычном виде) 2. Подобрать модель и обучить.

Maxim
12.09.2017
11:14:55
1. Найти размеченные данные (картинки нот на стане, сопоставленные с их записью в привычном виде) 2. Подобрать модель и обучить.
Проблема в том, что ноты на стане это и есть их привычный вид записи :) Поэтому возникает вопрос, что во что хочет распознавать автор. В midi файл, может быть, или в какой-то машинный формат нот. Наверное, проще в обратную сторону нагенерировать себе синтетических данных из midi в виде скриншотов картинок с нотами (или одной нотой), а потом на этом датасете и учить

Google
Maxim
12.09.2017
11:20:40
Ну тогда да, без датасета не обойтись. Но для обучения ML автору, думаю, будет интересно и такую задачу решить. Может быть, можно найти псевдо-рукописный "шрифт" для нот какой-нить

Andrey
12.09.2017
11:21:17
Я удивлен, что файнридер ноты не распознает

Andrey
12.09.2017
11:24:35
Для простоты можно рукописные образцы привести к mnist-формату, затем предобучить сеть на рукописных текстах вообще и дообучить на нотах. Пары сотен примеров каждой ноты должно хватить

Kassymkhan
12.09.2017
11:31:38
Для простоты можно рукописные образцы привести к mnist-формату, затем предобучить сеть на рукописных текстах вообще и дообучить на нотах. Пары сотен примеров каждой ноты должно хватить
Мне интересна более техническая сторона, опыта в таких приложениях нет, например если я будумодель тренировать на картинках в каком то разрешений как должно происходить распознование не одной ноты а целого произведения где много нот, то есть это уже кажется другая задача(мне кажется я глупые вещи спрашиваю но надеюсь на снисходительность)

Andrey
12.09.2017
11:34:14
Для целой страницы нот - или сразу object detection, или сводить к задаче классификации отдельных нот путем нарезки на квадратики с нотами

Andrey
12.09.2017
11:34:41
Но сделать end-to-end решение задачи OCR - сложно

Google
Kassymkhan
12.09.2017
11:36:09
Есть)

Andrey
12.09.2017
11:36:37
С точки зрения извлечения релевантных низкоуровневых фич лучше предобучать на любых рукописных текстах

Kassymkhan
12.09.2017
11:36:46
Andrey
12.09.2017
11:37:15
То есть это нужно проверить, но теоретически - даже с аугментацией печатные ноты будут хуже

Еще можно предобучить модель в режиме автокодировщика

yopp
12.09.2017
11:40:15
Есть)
окей, чтоб всякие лиги и тремоло и прочие штуки не стали сюрпризом :)

банально лиги



дуга сверху и снизу

Kassymkhan
12.09.2017
11:49:54
дуга сверху и снизу
Да, из за них задача мне очень сложной кажется

yopp
12.09.2017
11:50:09
я бы начал итеративно

сначала отдельные ноты и знаки

потом аккорды

и так дальше

я бы действительно начал с генерированных данных, максимально простых

Kassymkhan
12.09.2017
11:55:19
Спасибо всем ?

Google
Maxim
12.09.2017
16:21:00
А кто-нибудь в мире делал что-то типа deep deblure для фоточек? Не чтобы идеи посмотреть, а чтобы пользоваться, так сказать для себя. Вроде бы задача простая, а из утилит готовых ничего на остнове ML даже в виде онлайн сервисов нету вроде (правда, не все пишут технологию)

Никита
12.09.2017
16:22:23
звучит как коллапсирование в ганах

Maxim
12.09.2017
16:24:03
Ну размытые фоточки восстанавливать

Наверное, ганы самое то, да

Anna
12.09.2017
16:36:56
Всем привет! А можно супер-вакансию разместить?

Artem
12.09.2017
16:37:42
Админ рьяно против обычно :)

Artem
12.09.2017
16:38:57
Он вроде против агенств и хр

bellicose
12.09.2017
16:39:41
Пока его нет, кидай хД без указания вилки пошлют , кто куда?

Artem
12.09.2017
16:47:48
Не вышло :)

Dan
12.09.2017
16:48:04
Всем привет! А можно супер-вакансию разместить?
А вакансии у нас запрещены, вы уж поймите нас

Artem
12.09.2017
17:18:45
А вакансии у нас запрещены, вы уж поймите нас
Это можно в описание группы добавить, наверное, меньше вопросов будет :)

Maxim
12.09.2017
17:30:42
Надо написать бота, который при слове "вакансии" будет отвечать что нельзя

Andrey
12.09.2017
17:49:47
А кто-нибудь умеет в Octave? У меня вопрос - как прочитать файлы в gdf-формате при помощи BioSig toolbox (https://lampx.tugraz.at/~bci/database/001-2014/description.pdf)

Vova
12.09.2017
17:56:48
я вижу тут есть музыканты, подскажите плиз - если есть записанная фортепианная партия (соло или , например, со скрипкой), произведение непростое, есть ли софт способный всё разложить в ноты качественно?

Dan
12.09.2017
18:00:08
Тут намного интереснее задача - из микса выделять ноты

Vova
12.09.2017
18:07:02
Понял. Спасибо

Dan
12.09.2017
18:14:39
Я попробую поднять старые архивы, я уже как-то озадачивался какое-то время назад вопросом вытаскивания мелодии и её последующий анализ. Тогда я делал абсолютно в тупую, т.к. известна высота тона любой ноты - можно просто снять с stdin значения тонов, и перевести в ноты. Но я точно помню что видел намного более изящный вариант

Не то готовая либа на C++, не то какой-то чудной алгоритм

Google
V
12.09.2017
19:12:27
Ребята, а кто-нибудь надумывал создать нейронку, которой можно скармливать тексты для копирайтеров?))

yopp
12.09.2017
19:13:56
Резкие изменения курсов валют, прогнозы погоды и вот это всё. В гугле по запросу AI content generation будет много интересного.

Страница 138 из 327