
Andrey
15.12.2017
06:23:36
Копировать объекты смысла нет. Есть смысл добавлять объект - среднее между двумя объектами одного класса (SMOTE)

Antonio
15.12.2017
08:33:26
подскажите пожалуйста, нейросети ведь пофиг на каком языке генерировать текст? я вот пытаюсь запустить пример https://github.com/spro/practical-pytorch/tree/master/char-rnn-generation и там в файле helpers.py файл читается и преобразовывается в транслит с помощью unidecode
def read_file(filename):
file = unidecode.unidecode(open(filename).read())
return file, len(file)
я изменил эту функцию и убрал unidecode:
def read_file(filename):
file = open(filename, 'r', encoding='utf-8').read()
return file, len(file)
но генерирует он мне всё равно в транслите

Andrey
15.12.2017
08:38:31
Обучено оно на чем?
Вы искренне верите, что там внутре волшебные фиксики сидят и что-то вам печатают?

Google

mrx
15.12.2017
08:41:04

Antonio
15.12.2017
08:41:08
всмысле обучено? сеть в процессе обучается на тексте и сразу же генерирует

Andrey
15.12.2017
08:41:47
В процессе обучается на тексте?
Сколько времени работает скрипт?

Antonio
15.12.2017
08:42:26
тренируется на тексте, минут 9

Andrey
15.12.2017
08:42:53
На CPU, без видяхи?

Antonio
15.12.2017
08:43:45
какая разница если нет ни единого русского символа?

Serhii
15.12.2017
08:44:22
Алсо, я брал seq2seq из доки TF и учил на цпу на русскоязычном датасете, оно обучалось и генерировало на русском предложения

Antonio
15.12.2017
08:44:33

Serhii
15.12.2017
08:44:42
(Насколько осмысленные - другой вопрос)

Antonio
15.12.2017
08:44:46
это не готовая сеть
я тренирую сеть на русском тексте, он мне выдает на трнаслите

Andrey
15.12.2017
08:45:21
Значит, захардкодили отображение циферок в буковки для английского алфавита

Google

Antonio
15.12.2017
08:45:24
ВТФ?

Serhii
15.12.2017
08:46:51
Ты изменил юникод в том месте где оно читает из файла (как я понел). Погляди там где оно пишет (в файл или консоль)
Погляди как вообще происходит генерация


Antonio
15.12.2017
08:47:48
Значит, захардкодили отображение циферок в буковки для английского алфавита
где захаркорили?
вот модель
import torch
import torch.nn as nn
from torch.autograd import Variable
class RNN(nn.Module):
def __init__(self, input_size, hidden_size, output_size, n_layers=1):
super(RNN, self).__init__()
self.input_size = input_size
self.hidden_size = hidden_size
self.output_size = output_size
self.n_layers = n_layers
self.encoder = nn.Embedding(input_size, hidden_size)
self.gru = nn.GRU(hidden_size, hidden_size, n_layers)
self.decoder = nn.Linear(hidden_size, output_size)
def forward(self, input, hidden):
input = self.encoder(input.view(1, -1))
output, hidden = self.gru(input.view(1, 1, -1), hidden)
output = self.decoder(output.view(1, -1))
return output, hidden
def init_hidden(self):
return Variable(torch.zeros(self.n_layers, 1, self.hidden_size))


Serhii
15.12.2017
08:53:07
Так раз уж я тред зашёл - посоны, что там новенького и интересного появилось в мире CNN / GAN'во, кроме CapsNet? Что почитать можно?

Evgeniy
15.12.2017
08:58:03

Antonio
15.12.2017
08:58:05
Спасибо, буду копать

Serhii
15.12.2017
08:59:44

Evgeniy
15.12.2017
09:00:42

Serhii
15.12.2017
09:05:33
да просто почитать, посмотреть что еще интересного и нового делают в мире сверточных сетей. или если есть ганы, которые можно тренировать без боли и хоть сколько нибудь предсказуемо (со времен wgan) - тоже пойдет)

Evgeniy
15.12.2017
09:39:16
https://github.com/NVIDIA/pix2pixHD

Artem
15.12.2017
10:13:15
всем привет. Подскажите, пожалуйста, есть ли какая-то возможность передать в R/Python скрипт Web Service параметр в Azure Machine Learning Studio ?

dot
15.12.2017
11:05:02
Привет :) Посоветуйте плиз книги по распознованию образов пот еории ?

Antonio
15.12.2017
11:08:59
https://ru.stackoverflow.com/a/683632
Лепский А.Е., Броневич А.Г. Математические методы распознавания образов: Курс лекций
Местецкий Л.М. Математические методы распознавания образов Курс лекций
Шлезингер М.И. Десять лекций по статистическому и структурному распознаванию образов

dot
15.12.2017
11:10:50
Спасибо большое !!! :)

Dan
15.12.2017
11:17:30
Я вам тут кое-что принёс:
1. http://vectors.nlpl.eu/repository/
2. https://nlpub.ru/Russian_Distributional_Thesaurus
3. http://opencorpora.org/?page=downloads
4. http://rusvectores.org/ru/models/
Корпуса и векторные модели для Natural Language Processing и всего такого. На русском языке, пожалуй, самые большие базы
#полезное #nlp

James
15.12.2017
11:29:45
Йо, ребят.
Очень интересна тема computational geometry and machine learning (applications in 3d modeling). Хотелось бы написать диссертацию по этой теме. Какие есть исследования? С чего нужно начать осваивать? Есть ли хорошие книги? Буду благодарен за ответ!

Google

Evgeniy
15.12.2017
11:30:15

James
15.12.2017
11:30:58
Научника нету прямо сейчас....
Которые специализируются на этой теме
Простите... Че-то баг в программе по ходу
Сорри...

Evgeniy
15.12.2017
11:35:07
я хз, какие у вас реалии, у нас без научника делать что-то нормальное дохлый номер

Расул
15.12.2017
11:37:26
Я читал Delaunay Triangulation
Интересны алгоритмы в ML
Можете почитать

James
15.12.2017
11:40:31
Object detection in 3d

James
15.12.2017
11:40:53
Очень интересно

Antonio
15.12.2017
12:20:02
в общем действительно дело в all characters, там используется константа printable из питоновского модуля string, которая содержит 100 печатаемых символов ASCI. Так вот если вместо этой константы использовать например
all_characters = '0123456789бвгдежзийклмнопрструфхцчшщьыъэюяАБВГДЕЖЗИЙКЛМНОПРСТРУФХЦЧШЩЬЫЪЭЮЯ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~ \t\n\r\x0b\x0c'
то озбуждается исключение ValueError, если искомый фрагмент не входит в строку. Что использовать в переменной all_characters что бы нейронная сеть работала с кириллицей?

Serhii
15.12.2017
12:21:11

Evgeniy
15.12.2017
12:29:02

Google

Admin
ERROR: S client not available

Evgeniy
15.12.2017
12:29:05
недавно ковырял

Antonio
15.12.2017
12:45:55
ну я ещё чтение файла фиксил, что бы траслитерацию отключить, читает у меня вот так:
def read_file(filename):
file = open(filename, 'r', encoding='utf-8').read()
return file, len(file)

Djenny
15.12.2017
13:38:36
Всем привет! Коллеги, есть здесь кто-нибудь работающий с Hadoop? С чего вы начинали изучать? Опыта никакого, но партия сказала надо, комсомол как обычно ответил есть! И скинул установку на изучение. Материала полно, не знаю с чего начать.

Dmitry Tron
15.12.2017
13:49:47
http://shop.oreilly.com/product/0636920033448.do

Kek
15.12.2017
13:54:45
В орайли как всегда обложка будет сильно лучше содержания

Dmitry Tron
15.12.2017
14:00:25
критикуешь предлагай

Dan
15.12.2017
14:06:34

Kek
15.12.2017
14:08:47

Andrey
15.12.2017
14:17:36
Оно даже в переводе есть

Павел
15.12.2017
14:33:25

Denis
15.12.2017
14:36:08
кто-нибудь читал Data Science From scratch от Дж.Граса? тоже O'reilly
хочу почитать по теме ML
нашел ее

Andrey
15.12.2017
14:41:04
Читал

ed
15.12.2017
19:08:06
Привет, возникла необходимость написать что-то типо антиплагиата.
Пока что щупаю технологии, полскажите пожалуйста материал о том как лучше это хранить в базе (конрольные суммы и пр.) или OpenSource проект в котором можно это подсмотреть/использовать.
Спасибо!

Елена
16.12.2017
06:06:25
У кого-нибудь была ошибка ERR_CONNECTION_TIMED_OUT при попытке соединиться с jupyter notebook, развернутом на vm google cloud ? Если да, то как вы её решили? Следовала этому гайду https://habrahabr.ru/post/341446/

Denis
16.12.2017
08:40:10

Google

Drino
16.12.2017
10:37:22

Мисс
16.12.2017
10:41:39

Vova
16.12.2017
22:41:39
виртуальная машина запущена?
по SSH " jupyter notebook —ip=0.0.0.0 —port=8888 —no-browser" выдаёт что запустился токен выдаёт?
проверьте "Прокси" (брандмауэр) - чаще всего в нём проблемы (настроен не так, тэг не тот)

Antonio
16.12.2017
23:33:58
как установить пайточ для анаконды? нашёл только вот такое:
conda install -c peterjc123 pytorch
https://anaconda.org/peterjc123/pytorch
не знаю правильно ли, спрашиваю потому что долбаный пример так и не запустился на убунту, хотя на винде работает

Evgeniy
16.12.2017
23:44:28