
Andrey
11.11.2017
11:54:11
в Украине в 2 раза выше доход, чем в России
Даже если принять на веру (чего делать не следует), то для Украины имеем 21 респондента, которые банально могут работать на аутсорс. Своего рынка труда для сайентологов тут нет, инфа 100%

Herman
11.11.2017
11:57:19

Alexander
11.11.2017
12:25:57
объясните пожалуйста, я погуглил и не нашел ответ. Для доступа к колонкам в pandas DataFrame я могу использовать квадратные скобки и loc/iloc. Какие скрытые камни, что когда предпочтительнее?

Kirill
11.11.2017
12:40:32
https://stackoverflow.com/questions/31593201/pandas-iloc-vs-ix-vs-loc-explanation

Google

Kirill
11.11.2017
12:40:39
смотри два первых ответа

Alexander
11.11.2017
12:51:24

Kirill
11.11.2017
12:55:09

Andrey
11.11.2017
14:31:52

Antonio
11.11.2017
14:33:00
конечно, ведь майнинг это стабильность! (сарказм)

Tony
11.11.2017
15:47:29
Камера снимает стол. Задача — распознать грязные тарелки
Что почитать и в какую сторону думать?

Kirill
11.11.2017
15:50:03
так просто же задача классификации изображения . типа три класса грязная тарелка, с едой и чистая. наверное тут как раз модный дипленинг может хорошо помочь, если изображений не три штуки)

Tony
11.11.2017
15:51:25

Kirill
11.11.2017
15:52:27
ну видео - это много картинок , идущих друг за другом)

Tony
11.11.2017
15:52:40
Задача классификации изображения, значит

Kirill
11.11.2017
15:52:45
можно какой-то отдельный кадр просто обрабатывать

Tony
11.11.2017
15:52:51
Метод: дипленинг

Google

Tony
11.11.2017
15:53:00
Я так предполагал
Keras или tensor flow?

Ivan
11.11.2017
15:57:35
хм, т.к. этот чат и по big data, спрошу тут: это нормально, когда csv файл весит 1.5 гигов, а соответствующая таблица кассандры - 1 гиг? Ожидал существенно меньших размеров таблички.

Vyaches
11.11.2017
17:12:21
Мужики, кто может обьяснить применение fit_generator'a на примере работы со speach recognition. Че эт вообще такое и с чем его едят? Чет не могу понять нифига

Andrey
11.11.2017
17:42:17
Обучает на батчах, которые создает функция-генератор. В общем-то все

Arslan
11.11.2017
17:51:00

Tony
11.11.2017
17:51:31

Arslan
11.11.2017
17:57:42
Ну, собсна, tensorflow и theano это библиотеки для работы с тензорами, keras api для быстрой сборки, по самой задаче ничего подсказывать не буду, ибо сам ещё только из пелёнок вылез?

Vyaches
11.11.2017
19:00:29
Народ, может быть кто-нибудь подскажет... Сталкнулся с такой проблемой:
Пытаюсь обучать сетку на keras'e под tensorflow-gpu. В мануалах пишут, что gpu при установленной cude и tf-gpu видяшка должна подключаться автоматом.
в девайсах тоже отображается, что видяшка подключена.
но тем не менее сетки обучаются долго, а в nvuidia-smi загруженность gpu 0%. делаю вывод что вычисления происходя все таки на cpu... но как тогда быть? хочца то быстрее))

Andrey
11.11.2017
19:25:46
значит, неверно что-то собрано/установлено. Нет cuDNN, не прописаны все нужные пути в переменных окружения

Tony
11.11.2017
19:31:06
А есть какие-то гайды по тензору?

Andrey
11.11.2017
19:38:32
сотни их

Tony
11.11.2017
19:39:22
Задача простая: определить, пустой ли стакан

Артем
12.11.2017
06:42:34
Коллеги, подскажите, встречал ли кто-нибдуь алгоритм определения типа данных из строки. Пример "01.05.2011" - дата, "1654" - целое число, "1351.1" - число с десятичной дробью, "true" - булевое и т.д.

Constantine
12.11.2017
06:59:50
Набор эвристик на регэкспах накидать
В порядке вероятности появления

Anton
13.11.2017
01:58:01
https://www.google.ru/amp/embedded?v=7.14.21.21.arm64&hl=ru-RU#vgi=https%3A%2F%2Ftproger.ru%2Fnews%2Fgoogle-tangent%2Famp%2F&=https%253A%252F%252Ftproger.ru%252Fnews%252Fgoogle-tangent%252Famp%252F&idx=0

Antonio
13.11.2017
05:15:23
Подскажите пожалуйста, в каком алгоритме обучения с учителем можно учитывать не только положительные примеры, но и отрицательные?

Kirill
13.11.2017
05:28:01
в любом?) не очень понятен вопрос

Google

Antonio
13.11.2017
05:32:02
желательно что бы был основан на нейронных сетях

/dev
13.11.2017
05:35:20

Antonio
13.11.2017
05:36:12
не, на это пофиг

Timofey
13.11.2017
06:17:12
(ну, такие есть, но я думаю, что это не то, что ты хочешь)

Tony
13.11.2017
06:18:45
:D

Timofey
13.11.2017
06:19:36
Ну, есть и реально применяемые методы, для детекции аномалий

Antonio
13.11.2017
06:28:44
Вообще я хочу определять понравится мне статья или нет.
Это можно будет представить бинарной классификацией? Или это задача ранжирования? Я чего то запутался

Igor
13.11.2017
06:35:49
Когда наступит точка невозврата на пути к господству роботов над Человечеством?
Когда у программиста Алексея руки дойдут. – 36
??????? 31%
Когда роботы будут эволюционировать сами по себе. – 25
????? 21%
Очнитесь. Точка невозврата уже пройдена. – 20
???? 17%
Когда робот Вера приобретет за криптовалюту Алису. – 15
??? 13%
Когда робот будет не только получать гражданство, но и выдавать. – 10
?? 9%
Когда общество расколется в вопросах отношения к ИИ и роботам. – 7
? 6%
Свой вариант в комментариях. – 4
? 3%
? 117 people voted so far.

Sergey
13.11.2017
06:39:21
В принципе, если линейная модель тип лог рега, то даже сойдет для ранжирования
Она хорошо сортирует по вероятностям

Antonio
13.11.2017
06:41:28
Пасиб!

Andrey
13.11.2017
07:21:29
Сортировка по вероятности не очень подходит.
Один класс получит максимум вероятности, для остальных вероятности будут околонулевыми

Sergey
13.11.2017
07:23:12
Для остальных - для негативного? А какая разница?

Andrey
13.11.2017
08:06:07
Классов бывает больше 2
2 зачем ранжировать?

Google

Antonio
13.11.2017
08:15:51
ну просто есть документы вообще не похожие на нужную тему, есть похожие на нужную тему, а есть очень похожие, но они являются отрицательными примерами

Tony
13.11.2017
09:12:52
тензорфлоу шикарная штука

Andrey
13.11.2017
09:17:54

D
13.11.2017
10:32:49
Ребз! Подскажите, пожалуйста, нормальные NLP пакеты с поддержкой русского языка для питона или R

Ivan
13.11.2017
10:43:18

Andrey
13.11.2017
11:32:58

D
13.11.2017
11:33:56
Признаков нет, отвечаю!)

A
13.11.2017
11:45:12

Lepus
13.11.2017
11:47:02
Пайморфи -- морфологический анализатор
Там существительные-прилагательные выделять

A
13.11.2017
11:53:54

tonko
13.11.2017
11:54:24
хороший пос-теггер - обученный пос-теггер
(контекстный)

D
13.11.2017
11:57:11

Lepus
13.11.2017
11:57:15
Главное -- читайте лицензии

A
13.11.2017
11:58:31
томиту не знал, благодарю.
мне для домашних пет-прожектов, сомневаюсь что какая-либо лицензия запретит.

Maxim
13.11.2017
18:08:48
https://arxiv.org/abs/1711.03543 DLPaper2Code: Auto-generation of Code from Deep Learning Research Papers. "Experiments on the simulated dataset show that the proposed framework provide more than 93% accuracy in flow diagram content extraction." ??