
Kassymkhan
12.09.2017
11:07:21
Всем привет, я учусь в университете и разбираюсь сейчас с machine learning. Вопрос такой - хотелось бы сделать распознавание рукописных нот. На курсе Andrew Ng делал распознавание цифр. Можете подсказать куда копать, на какие задачи нужно разбить эту проблему. Основной инструмент питон.

tonko
12.09.2017
11:10:28
1. Найти размеченные данные (картинки нот на стане, сопоставленные с их записью в привычном виде)
2. Подобрать модель и обучить.

Maxim
12.09.2017
11:14:55

tonko
12.09.2017
11:15:29

Google

tonko
12.09.2017
11:15:50

Andrey
12.09.2017
11:18:48

Maxim
12.09.2017
11:20:40
Ну тогда да, без датасета не обойтись. Но для обучения ML автору, думаю, будет интересно и такую задачу решить. Может быть, можно найти псевдо-рукописный "шрифт" для нот какой-нить

Andrey
12.09.2017
11:21:17
Я удивлен, что файнридер ноты не распознает

Kassymkhan
12.09.2017
11:24:25

Andrey
12.09.2017
11:24:35
Для простоты можно рукописные образцы привести к mnist-формату, затем предобучить сеть на рукописных текстах вообще и дообучить на нотах. Пары сотен примеров каждой ноты должно хватить

Kassymkhan
12.09.2017
11:31:38

Andrey
12.09.2017
11:34:14
Для целой страницы нот - или сразу object detection, или сводить к задаче классификации отдельных нот путем нарезки на квадратики с нотами

Henadz
12.09.2017
11:34:17
сначало надо сегментацию провести
задетектить ноты
и потом их уже скармливать распознавателю

Andrey
12.09.2017
11:34:41
Но сделать end-to-end решение задачи OCR - сложно

Google

yopp
12.09.2017
11:35:03

Kassymkhan
12.09.2017
11:36:09
Есть)

Andrey
12.09.2017
11:36:37
С точки зрения извлечения релевантных низкоуровневых фич лучше предобучать на любых рукописных текстах

Kassymkhan
12.09.2017
11:36:46

Andrey
12.09.2017
11:37:15
То есть это нужно проверить, но теоретически - даже с аугментацией печатные ноты будут хуже
Еще можно предобучить модель в режиме автокодировщика

yopp
12.09.2017
11:40:15
Есть)
окей, чтоб всякие лиги и тремоло и прочие штуки не стали сюрпризом :)
банально лиги
дуга сверху и снизу

Kassymkhan
12.09.2017
11:49:54

yopp
12.09.2017
11:50:09
я бы начал итеративно
сначала отдельные ноты и знаки
потом аккорды
и так дальше
я бы действительно начал с генерированных данных, максимально простых

Kassymkhan
12.09.2017
11:55:19
Спасибо всем ?

Google

Maxim
12.09.2017
16:21:00
А кто-нибудь в мире делал что-то типа deep deblure для фоточек? Не чтобы идеи посмотреть, а чтобы пользоваться, так сказать для себя. Вроде бы задача простая, а из утилит готовых ничего на остнове ML даже в виде онлайн сервисов нету вроде (правда, не все пишут технологию)

Никита
12.09.2017
16:22:23
звучит как коллапсирование в ганах

Maxim
12.09.2017
16:24:03
Ну размытые фоточки восстанавливать
Наверное, ганы самое то, да

Anna
12.09.2017
16:36:56
Всем привет! А можно супер-вакансию разместить?

Artem
12.09.2017
16:37:42
Админ рьяно против обычно :)

Artem
12.09.2017
16:38:57
Он вроде против агенств и хр

bellicose
12.09.2017
16:39:41
Пока его нет, кидай хД без указания вилки пошлют , кто куда?

Artem
12.09.2017
16:47:48
Не вышло :)

Dan
12.09.2017
16:48:04

Artem
12.09.2017
17:18:45

Maxim
12.09.2017
17:30:42
Надо написать бота, который при слове "вакансии" будет отвечать что нельзя

Andrey
12.09.2017
17:49:47
А кто-нибудь умеет в Octave? У меня вопрос - как прочитать файлы в gdf-формате при помощи BioSig toolbox (https://lampx.tugraz.at/~bci/database/001-2014/description.pdf)

Vova
12.09.2017
17:56:48
я вижу тут есть музыканты, подскажите плиз - если есть записанная фортепианная партия (соло или , например, со скрипкой), произведение непростое, есть ли софт способный всё разложить в ноты качественно?

Dan
12.09.2017
18:00:08
Тут намного интереснее задача - из микса выделять ноты

Vova
12.09.2017
18:07:02
Понял. Спасибо

Dan
12.09.2017
18:14:39
Я попробую поднять старые архивы, я уже как-то озадачивался какое-то время назад вопросом вытаскивания мелодии и её последующий анализ. Тогда я делал абсолютно в тупую, т.к. известна высота тона любой ноты - можно просто снять с stdin значения тонов, и перевести в ноты. Но я точно помню что видел намного более изящный вариант
Не то готовая либа на C++, не то какой-то чудной алгоритм

Google

V
12.09.2017
19:12:27
Ребята, а кто-нибудь надумывал создать нейронку, которой можно скармливать тексты для копирайтеров?))

yopp
12.09.2017
19:13:56
Резкие изменения курсов валют, прогнозы погоды и вот это всё. В гугле по запросу AI content generation будет много интересного.