
tonko
31.08.2017
10:41:56

Проксимов
31.08.2017
10:42:14

tonko
31.08.2017
10:42:24
сообщений сколько самих

Проксимов
31.08.2017
10:42:58
Не понимаю вопроса

Google

Проксимов
31.08.2017
10:43:15
Есть текст от 0 до ~350 символов
Нужно определить его соответствие заданной теме

tonko
31.08.2017
10:43:44
Текст-то один чтоли?

Проксимов
31.08.2017
10:44:22
Это имеет значение?
Возможно текстов несколько будет

tonko
31.08.2017
10:45:27
В общем, если текст один, то лучше использовать готовый классификатор, который знает какое слово в общем к какой теме относится, типа как словарь. Но если у тебя есть 50-1к текстов, то можешь свой классификатор обучать.

Проксимов
31.08.2017
10:46:10
Готовый классификатор этот где взять? Какая либа под питон? Я тогда пойду по ней доки курить
И ещё, если в тексте будут сокращения типа AI/ML он поймёт это?

tonko
31.08.2017
10:47:23
Надо гуглить, я для тематического моделирования не искал, но есть, например обученные модели word2vec, их можно использовать например.

Проксимов
31.08.2017
10:54:16
https://www.analyticsvidhya.com/blog/2016/08/beginners-guide-to-topic-modeling-in-python/
Lda тут не подойдёт?

tonko
31.08.2017
11:05:38
Можно поискать датасет схожий с твоими текстами, чтобы тематики были общие, словарь включал AI/ML и пообучать на нем lda и другие модели. В качестве датасета подойдут логи чатиков, мне кажется.

Проксимов
31.08.2017
11:08:09

tonko
31.08.2017
11:08:51
Сложность по большей части в оценке качества модели

Google

tonko
31.08.2017
11:09:09
Для этого нужен размеченный датасет

Vova
31.08.2017
11:09:21

tonko
31.08.2017
11:09:32
Но можно просто собрать побольше данных, например еще с хабра и потыкать наудачу)
Можно кстати попробовать срезать
Взять предобученную модель, накидать руками небольшой словарь ml-related терминов и оценивать по нему
Еще можно автоматически достать синонимы из предобученных моделек word2vec, например с rusvectores

Vladimir
31.08.2017
11:12:02
Ребят, доброго всем дня. Подскажите пожалуйста, с чего лучше начать в машинном обучении?

tonko
31.08.2017
11:12:18
Но это все костыльно и неточно будет

sic transit
31.08.2017
11:12:31

tonko
31.08.2017
11:14:23
Насколько это сложная задача?
Твою задачу можно свести к " определить относится текст к датасаенсу или нет?" Или у тебя есть еще какие то темы, которые ты собираешься определять?

Проксимов
31.08.2017
11:14:47
Тема одна
Возможно там даже ключевые слова есть

Vlad
31.08.2017
11:15:21
Math
Линал, теорвер? Просто в запиненом материалы есть, а именно последовательности нет

Artem
31.08.2017
11:15:52
В любом, наверное
Линал и тервер не особо связаны

Проксимов
31.08.2017
11:16:24

Artem
31.08.2017
11:16:28
Еще матанализ наверное надо почитать

Vladimir
31.08.2017
11:17:50
А если все перечисленное выше изучал в универе?

tonko
31.08.2017
11:18:01
Да, можно
тогда я бы на твоем месте пособирал хотябы 200-300 различных предложений, разметил их вручную (относится-не относитя) и пообучал бы на нём lstm

sic transit
31.08.2017
11:18:18

Google

Dmitriy
31.08.2017
11:18:39
Начни с курса Andrew Ng
Он мне кажется ровно тот объем математики дает, который нужно вспомнить, чтобы начать что-то делать

Vladimir
31.08.2017
11:21:59
Всем спасибо)

Vova
31.08.2017
11:28:57
Ребят, доброго всем дня. Подскажите пожалуйста, с чего лучше начать в машинном обучении?
Со статистики. Выборки, распределения, доверительные интервалы, правила трёх сигма, оценки (смещённые и проч.), дисперсии, меры разброса. Потом перейти к регрессиям - линейным. Потом к факторному анализу, методу анализа главных компонент, дискриминантному анализу, корреляциям и тп. Потом уже заходить на ML Начиная с логистической регрессии (на самом деле список очень стандартный).

Ivan
31.08.2017
13:11:38
ах да, еще теория вероятности, что бы от зубов отскакивала

Vyaches
31.08.2017
13:32:17
Всем привет! Может ктонибудь подсказать, реально ли обучить нейронную сеть на интерполяцию поля значений из нерегулярных узлов сетки в узлы регулярной сетки?
Может кто-нибудь в ЛС проконсультировать? Спасибо! :)

Evgeny
31.08.2017
13:52:10
www.codingdojo.com
сор, промахнулся

Technology
31.08.2017
14:27:16
можно тут от чайников вопросы? anaconda-project add-packages python виснет, это из-за того что скорость интернета низкая? или я что то не так делаю?

Maksym
31.08.2017
14:28:35

Technology
31.08.2017
14:29:20

Maksym
31.08.2017
14:34:35

Andrey
31.08.2017
14:35:17
В анаконде окружения надо юзать

Technology
31.08.2017
14:35:45

Andrey
31.08.2017
14:38:01
Из обычной командной строки все работает
Что винда, что линукс

Technology
31.08.2017
14:38:47

Максим
31.08.2017
14:53:10
Ребят а есть у кого нибудь эта книжка в хорошем качестве?

Google

Максим
31.08.2017
14:53:31
Начал читать - невозможно, пдф печать качество не очень

I
31.08.2017
14:55:41


Николай
31.08.2017
14:56:21

Максим
31.08.2017
14:57:09
У меня столько же гдет
Но херобора гольная

I
31.08.2017
14:57:32

Максим
31.08.2017
14:58:06
Все двоится

tonko
31.08.2017
14:58:46
Остановись

I
31.08.2017
15:00:34
Кстати, на курсере видел курсы по машиному обучению и анализу данных от Яндекс, кто-нибудь их проходил? Хотелось бы услышать отзывы?

Максим
31.08.2017
15:01:17
Проходи, с чувством с толком с расстановкой

I
31.08.2017
15:02:30

Anton
31.08.2017
15:02:34
там на картинках самая боль начинается

Arthur
31.08.2017
15:13:22

I
31.08.2017
15:14:23

Arthur
31.08.2017
15:16:35

Google

Arthur
31.08.2017
15:17:00
Задания интересные
Для вхождения в эту специфику - самый раз

I
31.08.2017
15:17:37

Arthur
31.08.2017
15:18:20
Также я очень въедливый
Поэтому очень много времени тратил на изучение данного материала и в других источниках
Чтобы подробней изучить вопрос

I
31.08.2017
15:20:15

Arthur
31.08.2017
15:20:34
Через slack
Там группа у них есть
Но мне, например, не приходилось
Вникал до "соплей", чтобы самому разобраться с задачами или спорными вопросами
Тут все от личностного подхода зависит