@bigdata_ru

Страница 197 из 327
Andrey
15.12.2017
06:23:36
Копировать объекты смысла нет. Есть смысл добавлять объект - среднее между двумя объектами одного класса (SMOTE)

Antonio
15.12.2017
08:33:26
подскажите пожалуйста, нейросети ведь пофиг на каком языке генерировать текст? я вот пытаюсь запустить пример https://github.com/spro/practical-pytorch/tree/master/char-rnn-generation и там в файле helpers.py файл читается и преобразовывается в транслит с помощью unidecode def read_file(filename): file = unidecode.unidecode(open(filename).read()) return file, len(file) я изменил эту функцию и убрал unidecode: def read_file(filename): file = open(filename, 'r', encoding='utf-8').read() return file, len(file) но генерирует он мне всё равно в транслите

Andrey
15.12.2017
08:38:31
Обучено оно на чем?

Вы искренне верите, что там внутре волшебные фиксики сидят и что-то вам печатают?

Google
mrx
15.12.2017
08:41:04
Antonio
15.12.2017
08:41:08
всмысле обучено? сеть в процессе обучается на тексте и сразу же генерирует

Andrey
15.12.2017
08:41:47
В процессе обучается на тексте?

Сколько времени работает скрипт?

Antonio
15.12.2017
08:42:26
тренируется на тексте, минут 9

Andrey
15.12.2017
08:42:53
На CPU, без видяхи?

Antonio
15.12.2017
08:43:45
какая разница если нет ни единого русского символа?

Serhii
15.12.2017
08:44:22
Алсо, я брал seq2seq из доки TF и учил на цпу на русскоязычном датасете, оно обучалось и генерировало на русском предложения

Antonio
15.12.2017
08:44:33


Serhii
15.12.2017
08:44:42
(Насколько осмысленные - другой вопрос)

Antonio
15.12.2017
08:44:46
это не готовая сеть

я тренирую сеть на русском тексте, он мне выдает на трнаслите

Andrey
15.12.2017
08:45:21
Значит, захардкодили отображение циферок в буковки для английского алфавита

Google
Antonio
15.12.2017
08:45:24
ВТФ?

Serhii
15.12.2017
08:46:51
Ты изменил юникод в том месте где оно читает из файла (как я понел). Погляди там где оно пишет (в файл или консоль)

Погляди как вообще происходит генерация

Antonio
15.12.2017
08:47:48
Значит, захардкодили отображение циферок в буковки для английского алфавита
где захаркорили? вот модель import torch import torch.nn as nn from torch.autograd import Variable class RNN(nn.Module): def __init__(self, input_size, hidden_size, output_size, n_layers=1): super(RNN, self).__init__() self.input_size = input_size self.hidden_size = hidden_size self.output_size = output_size self.n_layers = n_layers self.encoder = nn.Embedding(input_size, hidden_size) self.gru = nn.GRU(hidden_size, hidden_size, n_layers) self.decoder = nn.Linear(hidden_size, output_size) def forward(self, input, hidden): input = self.encoder(input.view(1, -1)) output, hidden = self.gru(input.view(1, 1, -1), hidden) output = self.decoder(output.view(1, -1)) return output, hidden def init_hidden(self): return Variable(torch.zeros(self.n_layers, 1, self.hidden_size))

Serhii
15.12.2017
08:53:07


Так раз уж я тред зашёл - посоны, что там новенького и интересного появилось в мире CNN / GAN'во, кроме CapsNet? Что почитать можно?

Antonio
15.12.2017
08:58:05
Спасибо, буду копать

Serhii
15.12.2017
08:59:44
кучу всего)
Например? )

Evgeniy
15.12.2017
09:00:42
Например? )
что конкретно интересует

Serhii
15.12.2017
09:05:33
да просто почитать, посмотреть что еще интересного и нового делают в мире сверточных сетей. или если есть ганы, которые можно тренировать без боли и хоть сколько нибудь предсказуемо (со времен wgan) - тоже пойдет)

Evgeniy
15.12.2017
09:39:16
https://github.com/NVIDIA/pix2pixHD

Artem
15.12.2017
10:13:15
всем привет. Подскажите, пожалуйста, есть ли какая-то возможность передать в R/Python скрипт Web Service параметр в Azure Machine Learning Studio ?

dot
15.12.2017
11:05:02
Привет :) Посоветуйте плиз книги по распознованию образов пот еории ?

Antonio
15.12.2017
11:08:59
https://ru.stackoverflow.com/a/683632

Лепский А.Е., Броневич А.Г. Математические методы распознавания образов: Курс лекций Местецкий Л.М. Математические методы распознавания образов Курс лекций Шлезингер М.И. Десять лекций по статистическому и структурному распознаванию образов

dot
15.12.2017
11:10:50
Спасибо большое !!! :)

Dan
15.12.2017
11:17:30
Я вам тут кое-что принёс: 1. http://vectors.nlpl.eu/repository/ 2. https://nlpub.ru/Russian_Distributional_Thesaurus 3. http://opencorpora.org/?page=downloads 4. http://rusvectores.org/ru/models/ Корпуса и векторные модели для Natural Language Processing и всего такого. На русском языке, пожалуй, самые большие базы #полезное #nlp

James
15.12.2017
11:29:45
Йо, ребят. Очень интересна тема computational geometry and machine learning (applications in 3d modeling). Хотелось бы написать диссертацию по этой теме. Какие есть исследования? С чего нужно начать осваивать? Есть ли хорошие книги? Буду благодарен за ответ!

Google
James
15.12.2017
11:30:58
Научника нету прямо сейчас....

Которые специализируются на этой теме

Простите... Че-то баг в программе по ходу

Сорри...

начинать с поиска научника)
Так можете дать какие-то наводки?

Evgeniy
15.12.2017
11:35:07
я хз, какие у вас реалии, у нас без научника делать что-то нормальное дохлый номер

Так можете дать какие-то наводки?
какой уровень знаний, какие конкретно вещи интересуют

Расул
15.12.2017
11:37:26
Я читал Delaunay Triangulation

Интересны алгоритмы в ML

Можете почитать

James
15.12.2017
11:40:31
Object detection in 3d

Antonio
15.12.2017
12:20:02
в общем действительно дело в all characters, там используется константа printable из питоновского модуля string, которая содержит 100 печатаемых символов ASCI. Так вот если вместо этой константы использовать например all_characters = '0123456789бвгдежзийклмнопрструфхцчшщьыъэюяАБВГДЕЖЗИЙКЛМНОПРСТРУФХЦЧШЩЬЫЪЭЮЯ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~ \t\n\r\x0b\x0c' то озбуждается исключение ValueError, если искомый фрагмент не входит в строку. Что использовать в переменной all_characters что бы нейронная сеть работала с кириллицей?



Google
Admin
ERROR: S client not available

Evgeniy
15.12.2017
12:29:05
недавно ковырял

Antonio
15.12.2017
12:45:55
ну я ещё чтение файла фиксил, что бы траслитерацию отключить, читает у меня вот так: def read_file(filename): file = open(filename, 'r', encoding='utf-8').read() return file, len(file)

Можешь пробелами до длинны 100 свою переменную добить ( но выйдет ли из этого что-то годное - хз)
ну вот ровно 100 символов использую: all_characters = '0123456789бвгдежзийклмнопрструфхцчшщьыъэюяАБВГДЕЖЗИЙКЛМНОПРСТРУФХЦЧШЩЬЫЪЭЮЯ!"#$%&\()*+,-./:;<=>?@\t\n\r' и все равно эта ошибка



Djenny
15.12.2017
13:38:36
Всем привет! Коллеги, есть здесь кто-нибудь работающий с Hadoop? С чего вы начинали изучать? Опыта никакого, но партия сказала надо, комсомол как обычно ответил есть! И скинул установку на изучение. Материала полно, не знаю с чего начать.

Dmitry Tron
15.12.2017
13:49:47
http://shop.oreilly.com/product/0636920033448.do

Kek
15.12.2017
13:54:45
В орайли как всегда обложка будет сильно лучше содержания

Dmitry Tron
15.12.2017
14:00:25
критикуешь предлагай

Dan
15.12.2017
14:06:34
В орайли как всегда обложка будет сильно лучше содержания
Что за бред. Одно из лучших тематических издательств.

Andrey
15.12.2017
14:17:36
Оно даже в переводе есть

Павел
15.12.2017
14:33:25
Что за бред. Одно из лучших тематических издательств.
Теперь почувствуй превосходство обложки!

Denis
15.12.2017
14:36:08
кто-нибудь читал Data Science From scratch от Дж.Граса? тоже O'reilly

хочу почитать по теме ML

нашел ее

Andrey
15.12.2017
14:41:04
Читал

ed
15.12.2017
19:08:06
Привет, возникла необходимость написать что-то типо антиплагиата. Пока что щупаю технологии, полскажите пожалуйста материал о том как лучше это хранить в базе (конрольные суммы и пр.) или OpenSource проект в котором можно это подсмотреть/использовать. Спасибо!

Елена
16.12.2017
06:06:25
У кого-нибудь была ошибка ERR_CONNECTION_TIMED_OUT при попытке соединиться с jupyter notebook, развернутом на vm google cloud ? Если да, то как вы её решили? Следовала этому гайду https://habrahabr.ru/post/341446/

Google
Мисс
16.12.2017
10:41:39
блокчейн!)
аве блокчейн

Vova
16.12.2017
22:41:39
виртуальная машина запущена?

по SSH " jupyter notebook —ip=0.0.0.0 —port=8888 —no-browser" выдаёт что запустился токен выдаёт?

проверьте "Прокси" (брандмауэр) - чаще всего в нём проблемы (настроен не так, тэг не тот)

Antonio
16.12.2017
23:33:58
как установить пайточ для анаконды? нашёл только вот такое: conda install -c peterjc123 pytorch https://anaconda.org/peterjc123/pytorch не знаю правильно ли, спрашиваю потому что долбаный пример так и не запустился на убунту, хотя на винде работает

Страница 197 из 327