Serhii
24.09.2017
15:58:08
О, и ещё один вопрос появился. Если G - энкодер-декодер, мы же можем в качестве энтодера взять предобученную сеть (на имеджнете), заморозить веса и не трогать? На выходе то будет картинка кодированная в latent space что в случае предобученной сети что в случае если мы с 0 тренируем
Drino
24.09.2017
16:06:16
Наверное можно - явных проблем в таком подходе не вижу.
Черный Мойведь
25.09.2017
14:41:38
как етот дмк-пресс в плане оперативности доставки по городу Москва?
Максим
25.09.2017
19:06:36
180к?? Чет пздц
Google
Максим
25.09.2017
19:07:44
Было вроде 150
Alexander
25.09.2017
21:10:01
Подскажите, нужно сделать категоризацию товаров с чеков. Скажем, на вход дается "Кока-Кола" нужно сказать, что это -- напиток, а "Lays Острые" -- чипсы. Наименования должны быть на русском языке, знает ли кто-нибудь готовые базы для этого и что можно погуглить?
Max
26.09.2017
04:46:46
Господа, нужна помощь, пишу проект который будет наполнятся с других ресурсов, нужно придумать механизм который реализует углубленную проверку на дубли, который основывается на анализе текста и полнотекстовом поиске. Возможно кто-то сталикивался уже и есть какие-то готовые решения ?
Andrey
26.09.2017
04:58:08
Все системы антиплагиата, не?
Alex
26.09.2017
07:14:55
Andrey
26.09.2017
10:26:29
Ребят, привет.
Кто-нибудь сталкивался с задачей запуска INSERT и UPDATE в sql базу из pyspark?
Задача такая, берем таблицу из базы, всасываем в Df. Колбасим, в итоге получаем несколько записей которые в этой таблице нужно изменить. Количество измененных строк на уровне 1%, по этому просто запись DF с mode override не оч подходит своим оверхедом.
Alex
26.09.2017
11:14:46
Всем привет. Подскажите, как в CatBoostClassifier перебирать параметры по типу - GridSearchCV?
tonko
26.09.2017
11:20:53
Обернуть катбуст в модель sklearn, вроде base_classifier класс называется. В домашках ods пример был.
これはスタスか…ロマンですか
26.09.2017
11:31:36
Rostislav
26.09.2017
13:55:30
Ребят, привет. А кто-нибудь занимался DQN или обучением с подкреплением вообще? Хочу проконсультироваться
Antonio
26.09.2017
20:06:58
подскажите пожалуйста, для нейронных сетей условие дифференцируемости обязательно?
Nikolay
26.09.2017
20:07:30
Google
Andrey
26.09.2017
20:07:51
какая у вас база исходная?
Я уже высмотрел все что выдает гугл. И чет ощущение что никто с таким не сталкивался.
проблема у нас абстрактна от конкретной базы по сути. Нужен просто способ долбить кастомные инсерты/апдейты из спарка. А я пока ничего кроме write с разными mode не нашел, а этот вариант нам не модходит потому что он либо пропускает ошибки, либо полностью переписывает таблицу
Nikolay
26.09.2017
20:13:48
а много таких записей, которые нужно изменить. То, что их 1% это понятно, но большой ли обьем в штуках( магабайтах)?
можно черех foreach вызывать jdbc и записывать пачками через PraparedStatement. Из вариантов похуже - записывать в стэйджинговую табицу на стороне постгресса и вызывать процесс перезаписи на сервере. В оракле можно было бы сделать триггер на эту stg таблицу, но лучше попробовать первый вариант с foreach.
suren
26.09.2017
20:22:22
Nikolay
26.09.2017
20:22:28
хотел ссылку на чатик по спарку скинуть, но видать такие сообщения режут
Antonio
26.09.2017
20:23:01
suren
26.09.2017
20:25:35
я отредактировал свое сообщение, случайно раньше времени отправил
Andrey
26.09.2017
20:28:43
Nikolay
26.09.2017
20:29:38
могу завтра написать, но на джаве
Andrey
26.09.2017
20:30:28
Что меня удивляет, задача то вроде достаточно очевидная. Нежуели никто не сталкивался(
Nikolay
26.09.2017
20:39:13
https://stackoverflow.com/questions/34643200/spark-dataframes-upsert-to-postgres-table
Вот там есть пример. Он последний в списке ответов.
Andrey
26.09.2017
20:42:57
Antonio
26.09.2017
22:28:58
список книг кстати обновился, добавлена книга Дж. Вандер Плас Python для сложных задач. Наука о данных и машинное обучение
https://ru.stackoverflow.com/a/683632/1084
Andrey
27.09.2017
07:40:39
Antonio
27.09.2017
08:25:41
https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%9D%D1%8C%D1%8E%D1%82%D0%BE%D0%BD%D0%B0
"Также метод Ньютона может быть использован для решения задач оптимизации, в которых требуется определить нуль первой производной либо градиента в случае многомерного пространства."
Andrey
27.09.2017
08:34:19
Я именно об этом
Google
Alexey
27.09.2017
08:36:41
Товарищи, для Caffe2 существуют ли книги на русском?
Павел
27.09.2017
08:37:46
Всем привет. А тут кто нибудь делает финтех проекты? Интересно познакомиться
Nick
27.09.2017
11:32:05
Подскажите пожалуйста, имеет ли смысл тестировать модель с помощью метода Монте-Карло?
Mike
28.09.2017
11:22:14
Ребят,а кто подскажет - в word2vec (doc2vec) модели, если документы корпуса меньше окна, это сильно сказывается на результате? Mikolov в "Distributed Representations of Sentences and Documents" пишет: "If the paragraph has less than 9 words, we pre-pad with a special NULL word symbol." Может кто уже интересовался, отпишитесь)
Andrey
28.09.2017
12:12:38
Не должно сильно влиять
NULL в эмбеддинге будет кагбэ маркером "короткости"
Oleksandr
28.09.2017
20:45:04
https://groups.google.com/forum/#!topic/theano-users/7Poq8BZutbY
Antonio
28.09.2017
21:32:10
список книг снова обновился, добавлена книга Джулли А., Пал С. Библиотека Keras - инструмент глубокого обучения
https://ru.stackoverflow.com/a/683632/1084
Beka
28.09.2017
22:19:08
Привет комрады. Мы работаем над Видео серсивом. Онлайн ТВ, У нас есть проблема и думаю мы могли бы решить эту проблему эффективнее с помошью МЛ. Проблема состоит из:
Клиенты качают куски видео длинной 4 секнд. *.ts файлы(Далее Сегмент). Представте себе ситуацию.
Средная скачка сегмента для битрейта 720 - 300 миллисекунд в среднем
Происходит так.
1.ts - 300 мс
2.ts - 300 мс
3.ts - 300 мс
4.ts - 5000 мс (Тут интересно, наш бэкэнд не смог передать сегмент быстро по неопределенным причинам)
5.ts - 300 мс
これはスタスか…ロマンですか
28.09.2017
22:26:15
Beka
28.09.2017
22:26:33
Как вы видите для 4 ого сегмента у нас время скачки прыгает на верх. И алгоритм выборки адаптивного битрейта думает сеть ухудшился.
И начинает качать не 720 видео а скажем 240. Качество видео сильно падает. Хотя сеть тот же.
Могу ли я предугадать по определенным патернам что это тупо проблема моего бэкэнда.
Это можно понять через обучение?
これはスタスか…ロマンですか
28.09.2017
22:30:14
почини бэкенд
вина его или сети, в любом слючае throughput пвдает, логично уменьшить битрейт
Beka
28.09.2017
22:31:42
Эти сегменты не всегда так быстро достаются. Это еще зависит от других сервисов который мы не имеем контроля.
これはスタスか…ロマンですか
28.09.2017
22:33:26
если бэкенд састревает пусть пошлёт "сорри, меня не ждите"
Beka
28.09.2017
22:36:31
Google
Beka
28.09.2017
22:36:50
Это же совсем нонсенс. пропускать 4 секунд куска видео.
Nick
28.09.2017
22:43:33
Если у вас последовательное чтение кусков из какого-то источника данных, вы можете доставать кадры из кеша, работающего на опережение
これはスタスか…ロマンですか
28.09.2017
22:44:57
Beka
28.09.2017
23:06:55
Идет 4 секунды.