@bigdata_ru

Страница 242 из 327
unknownperson
07.03.2018
19:41:01
Whore Amazing
08.03.2018
12:08:44
Здравствуйте, уважаемые господа. Решил попробовать себя в нейросетях, начать решил не с готовых примеров, а с собственного датасета. Вот у меня есть набор аудиофайлов. Я их перегнал в массивы numpy, но из-за разной длительности получились разные размерности. Приводить все файлы к одинаковой длительности не очень хочется, может, есть способы дополнить формы всех массивов до самого крупного? Где почитать примеров? Спасибо.

Whore Amazing
08.03.2018
12:12:16
А зачем так? Аудиофайлов надо через рекурентную сеть обрабатывать по моему(ни разу в нецросети чистый теоретик)
Ну, захотелось попробовать так. Поставил задачу, для выполнения которой многослойный персептрон вполне годится (задача не пустая, есть реальное применение).

Google
Whore Amazing
08.03.2018
12:12:34
Т.е. не реалтайм.

Roman
08.03.2018
12:12:55
Whore Amazing
08.03.2018
12:13:30
Я вот что-то не смог нагуглить. Видимо, как-то не так гуглил...

Sergey
08.03.2018
12:14:01
Sequence padding

Whore Amazing
08.03.2018
12:14:51
Спасибо! Век бы не догадался, что это так называется, пришлось бы всю доку шерстить.

Tsh
08.03.2018
12:17:48
Четкий ник, я думал что ты бот

Whore Amazing
08.03.2018
12:25:49
Почему?

Tsh
08.03.2018
12:36:38
Бот рекламирующий бордели

Whore Amazing
08.03.2018
12:40:23
Если честно, твой ник куда больше похож на ботовский, уж прости.

Вроде все получилось, но моя нищенская видеокарта не вывозит это скомпилить. Завтра буду пробовать на онлайн-машинах, а пока, если у кого-то есть время и желание, проверьте, пожалуйста, код и скажите, есть ли какие-то существенные косяки (кроме маленького размера датасета). Буду благодарен. https://pastebin.com/QUXSND8m

Whore Amazing
08.03.2018
13:20:49
Да, это обычное решение на коленке, чтобы не заморачиваться правильно. Так быстрее, я же не это тестирую, а сеть. Плэтому правильностью остального можно пренебречь.

Google
Viktor
08.03.2018
18:40:41
for i in ("1","2","3","4","5","6","7","8","9","10","11","12")
Это в тему частых разговоров о том, что дата инженерам не надо хорошо знать программирование.

Drino
08.03.2018
20:52:54
for digit in (str(i) for i in range(1,13)):
for digit in map(str, range(1, 13)):

Vyaches
08.03.2018
20:53:33
for digit in (str(i) for i in range(1,13)):
а защем? там нужно то: for i range(12): #read mp3 file mp3 = pydub.AudioSegment.from_mp3("test%s.mp3"%(i))

Проксимов
08.03.2018
20:53:53
Vyaches
08.03.2018
20:54:06
стринговые переменные дороже стоят

Dan
08.03.2018
20:54:08
?

Проксимов
08.03.2018
20:54:11
Vyaches
08.03.2018
20:54:45
Но меня знатно всё это улыбнуло))

Drino
08.03.2018
20:54:48
Это хуже
Это читабельней двух вложенных for'ов.

Проксимов
08.03.2018
20:54:52
for digit in map(str, range(1, 13)):
Ещё и ошибку выкинет

map object not iterable

Egor
08.03.2018
20:55:33
ну лист дописать перед map

Drino
08.03.2018
20:55:53
3.5, for i in map(str, range(1, 13)): print(i) прекрасно работает

2.7, та же фигня

Google
Donaudampf
08.03.2018
20:57:21
Egor
08.03.2018
20:58:02
просто первое что пришло в голову, не запускал код

Проксимов
08.03.2018
20:58:07
Странная функциональщина

Ну да ладно, она не нужна всё равно

Drino
08.03.2018
20:58:40
Странная функциональщина
Она не странная, она работает с итераторами

Donaudampf
08.03.2018
20:59:09
Init signature: map(self, /, *args, **kwargs) Docstring: map(func, *iterables) --> map object Make an iterator that computes the function using arguments from each of the iterables. Stops when the shortest iterable is exhausted. ничего странного

Vyaches
08.03.2018
20:59:21
Есть те кому нужна помощь в каком-либо проекте? Хочу куда-нибудь вписаться.. А то сижу дома, скучаю(( Задачку бы интересную порешать.

Admin
ERROR: S client not available

Drino
08.03.2018
21:01:11
is exhausted Мило))))
"Исчерпан", наверное? The mine can also be exhausted

Whore Amazing
08.03.2018
22:10:00
Whore Amazing
08.03.2018
22:10:36
и писать его быстрее
ну мне было быстрее так написать суть-то не в этом как заставлю работать - обязательно перепишу нормально

Donaudampf
09.03.2018
00:38:47
ну мне было быстрее так написать суть-то не в этом как заставлю работать - обязательно перепишу нормально
это быстрее написать? о_О Я бы заморочился поиском нормальной конструкции уже даже ради того, чтобы не набирать вручную весь этот ряд чисел с кавычками

Whore Amazing
09.03.2018
05:17:42
это быстрее написать? о_О Я бы заморочился поиском нормальной конструкции уже даже ради того, чтобы не набирать вручную весь этот ряд чисел с кавычками
Готов потратить неделю, чтобы решить за пять минут то, что можно решить за десять минут? Похвально, но у меня нет столько времени.

Whore Amazing
09.03.2018
06:14:17
Смотрите дети, вот так и появляется говнокод
Это же просто тест. Когда будет проверена работоспособность, я исправлю говнокодные моменты.

Ну честно!

Ivan
09.03.2018
07:34:59
нну так-то лучше написать говнокод, чем не написать ничего

Mike
09.03.2018
07:47:55
нну так-то лучше написать говнокод, чем не написать ничего
Спорно.потом попадаешь читать говнокод- и бедааа)))

Google
Vyaches
09.03.2018
08:11:22
Да, это обычное решение на коленке, чтобы не заморачиваться правильно. Так быстрее, я же не это тестирую, а сеть. Плэтому правильностью остального можно пренебречь.
Денойзер? Что? У тебя я так понял два вида аудиофайлов: окей. Ты ЗАЧЕМ ТО О_О берешь mp3 аудиофайл, дальше перегоняешь в wav[И ТАК КАЖДЫЙ РАЗ ПРИ ЗАПУСКЕ СКРИПТА]. Ну, окей. Дальше получаешь цифирки из аудиофайла. ОКЕЙ. Дальше ты разбиваешь массив своих цифирок на выборку размером [n,12381696](ОТКУДА ЭТО ЧИСЛО?? ПОЧЕМУ ИМЕННО ОНО??).. Ладно, не важно. Едем дальше. Что ты пытаешься сделать после этого? Однослойный персептрон. С Релу. С кросс-ентропией. Для всего этого дела. @_@

Whore Amazing
09.03.2018
08:34:58
Денойзер? Что? У тебя я так понял два вида аудиофайлов: окей. Ты ЗАЧЕМ ТО О_О берешь mp3 аудиофайл, дальше перегоняешь в wav[И ТАК КАЖДЫЙ РАЗ ПРИ ЗАПУСКЕ СКРИПТА]. Ну, окей. Дальше получаешь цифирки из аудиофайла. ОКЕЙ. Дальше ты разбиваешь массив своих цифирок на выборку размером [n,12381696](ОТКУДА ЭТО ЧИСЛО?? ПОЧЕМУ ИМЕННО ОНО??).. Ладно, не важно. Едем дальше. Что ты пытаешься сделать после этого? Однослойный персептрон. С Релу. С кросс-ентропией. Для всего этого дела. @_@
Я его всего один раз запущу, сеть обучить. Очевидно же. Потом модель сохраню. Число взято как размерность тензора из самого длинного файла. Насчет топологии вот не уверен, да. Но это первый опыт. По идее, в файлах вида test*.mp3 у меня звук с примешанным шумом, в test*l.mp3 - чистый звук. Сеть должна научиться отделять шум и выкидывать, выдавая файл без шума. Поправь, что я не так изобрел.

Сергей
09.03.2018
08:38:19
всем привет, кто-нибудь знает где можно скачать базу картинок для обучения нейросетки, но мне нужно небольшую, нашел на kaggle но там 55 Gb, мне этого много

Сергей
09.03.2018
08:39:01
я только mnist naitk

нашел *

Vyaches
09.03.2018
08:41:28
Я его всего один раз запущу, сеть обучить. Очевидно же. Потом модель сохраню. Число взято как размерность тензора из самого длинного файла. Насчет топологии вот не уверен, да. Но это первый опыт. По идее, в файлах вида test*.mp3 у меня звук с примешанным шумом, в test*l.mp3 - чистый звук. Сеть должна научиться отделять шум и выкидывать, выдавая файл без шума. Поправь, что я не так изобрел.
Свою сеть ты не так изобрел. Сначала изучи основы хотя-бы. Нейронные сети это не искусственный интеллект, в который можно пихать всё как в помойку и после этого ждать какого-либо результата. Это алгоритм который просто может найти приближенное решение по размеченным данным. Во первых - у тебя сеть однослойная. Ей не хватит выразительности сделать задуманное тобой. Во вторых - почитай про categorical_crossentropy и для чего она вообще используется. Я думаю, тебе всё станет ясно.

я только mnist naitk
Какая задача? Может проще предобученные веса взять и дообучить на конкретную задачу?

Страница 242 из 327