Dmit
23.08.2016
12:36:41
Lepus
23.08.2016
12:39:36
и как?
я у себя посмотрела (в маленькой БД по БД), там нетю
если не нашёл
Google
Dmit
23.08.2016
12:40:43
и как?
Ну Данные от ФСН не совсем то,что мне нужно)
Lepus
23.08.2016
12:41:36
http://www.forecast.ru/
https://habrastorage.org/getpro/habr/post_images/7c7/5aa/64d/7c75aa64d9f93564c0cd9cb90f041007.png
Dmit
23.08.2016
13:03:29
Lepus
23.08.2016
13:05:13
ну бананьев нема
берите что есть
в уисе посмотри
берешь такой сервер с дохрена памяти
качаешь туда дохрена кусков вконтактика через открытую часть по москве
?????
профит.
Google
Lepus
23.08.2016
13:17:03
Можно ещё какой-нибудь сайт типа Таймаут распарсить
и получить бд ресторанов москвы с отзывами
и сентимент анализис на это навернуть
или заставить машину искать почему рестораны нравятся пиплу
Dmit
23.08.2016
13:34:51
Kalash
23.08.2016
13:46:53
Ребят, есть задача интересная(мб?), но бюджета нет. Кто хочет поковырять клиентскую базу (20 к строк) юр лиц, и около 20-30 столбцов по каждой компании. Надо на основании истории заключения сделок(продажа фин продуктов) построить модель которая ранжирует базу по вероятности заключения сделки.
Lepus
23.08.2016
13:50:14
Magic
23.08.2016
13:53:53
серьезно?
Kalash
23.08.2016
13:54:26
Magic
23.08.2016
13:55:46
А догадайся, построй модель на основании халявы в интернете и отношения к серьезным задачам без бюджета
Dmit
23.08.2016
13:56:00
Нетути
Дратути) В контакти тогда))
Vladislav
23.08.2016
13:56:09
Ilya
23.08.2016
13:57:27
Vladislav
23.08.2016
13:57:48
Andrey
23.08.2016
14:26:24
Kalash
23.08.2016
14:26:43
Lepus
23.08.2016
14:28:30
Aleksei
23.08.2016
14:32:48
И если можно - сюда обращённый результат - получилось что-нить найти или нет
Google
Dan
23.08.2016
14:33:30
Да, было бы неплохо в итоге какой-то результат опубликовать, в виде статьи желательно ?
Andrey
23.08.2016
14:33:42
Я вот пока не понял, откуда там можно взять метрику качества для самого ранжирования.
Kalash
23.08.2016
14:33:51
Статью можно, но без упоминания клиента )
Dan
23.08.2016
14:34:13
разумеется, главное не кто клиент, а детали реализации
Andrey
23.08.2016
14:34:52
На ум приходит бинарная классификация с ее метриками качества и ранжирование по сырым вероятностям
Lepus
23.08.2016
14:35:52
Dan
23.08.2016
14:35:54
Стандартная задача по теорверу
Lepus
23.08.2016
14:36:01
может, стоит решающие деревья попробовать
Andrey
23.08.2016
14:36:03
Dan
23.08.2016
14:36:20
Графы же,не?
Lepus
23.08.2016
14:36:32
Yury
23.08.2016
14:37:02
Kalash
23.08.2016
14:37:18
Уточню - Есть 18к компаний и 80к встреч с ними. по встречам есть результаты - продано 10 продуктов на 100000р
Andrey
23.08.2016
14:37:24
biostat-r.blogspot.com
Lepus
23.08.2016
14:39:12
ну, условно можно считать, что для той компании, которой не продано, сделка не заключена
Kalash
23.08.2016
14:39:38
ну есть оценка результата в количестве продуктов и из маржинальности
Lepus
23.08.2016
14:39:49
если всего 10 продаж на 80к встреч — это странно немного, честно
Google
Dmit
23.08.2016
14:40:05
Kalash
23.08.2016
14:40:06
это я для примера с 1 встречи
Andrey
23.08.2016
14:40:53
Вероятность сделки как таковой и расчет профита, это кагбэ разные вещи
Dan
23.08.2016
14:41:12
Dmit
23.08.2016
14:41:19
Andrey
23.08.2016
14:42:22
Вообще я подобную задачу решал на конкурсе: сначала делил на два класса, потом в одном предсказывал количественную переменную отклика
Lepus
23.08.2016
15:31:22
Там датасет по аренде велосипедов
Плюс, классическое приложение МО -- задача кредитного скоринга
Решай задачу за два часа
Andrey ?
23.08.2016
16:59:31
а че такое big data?)
Dan
23.08.2016
17:00:46
вот.
с таких вопросов начинается глубокое погружение в целую вселенную бигдаты
Dmit
23.08.2016
17:01:18
Dan
23.08.2016
17:01:35
и назад уже дороги нет, потому что даже выйдя из чата бигдата будет преследовать тебя
Lepus
23.08.2016
17:01:39
Dan
23.08.2016
17:01:53
дважды
Semyon
23.08.2016
17:02:08
Когда брат программировал?
Google
Andrey ?
23.08.2016
17:03:26
так скажет кто нибудь что это такое?
Dan
23.08.2016
17:03:55
https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5
для начала
https://habrahabr.ru/hub/bigdata/
вот дальше
Andrey ?
23.08.2016
17:05:35
с хабра нужно было начинать
Lepus
23.08.2016
17:05:54
Нет бигдаты