
Dmit
23.08.2016
12:36:41

Lepus
23.08.2016
12:39:36
и как?
я у себя посмотрела (в маленькой БД по БД), там нетю
если не нашёл

Google

Dmit
23.08.2016
12:40:43
и как?
Ну Данные от ФСН не совсем то,что мне нужно)

Lepus
23.08.2016
12:41:36
http://www.forecast.ru/
https://habrastorage.org/getpro/habr/post_images/7c7/5aa/64d/7c75aa64d9f93564c0cd9cb90f041007.png

Dmit
23.08.2016
13:03:29

Lepus
23.08.2016
13:05:13
ну бананьев нема
берите что есть
в уисе посмотри
берешь такой сервер с дохрена памяти
качаешь туда дохрена кусков вконтактика через открытую часть по москве
?????
профит.

Google

Lepus
23.08.2016
13:17:03
Можно ещё какой-нибудь сайт типа Таймаут распарсить
и получить бд ресторанов москвы с отзывами
и сентимент анализис на это навернуть
или заставить машину искать почему рестораны нравятся пиплу

Dmit
23.08.2016
13:34:51

Kalash
23.08.2016
13:46:53
Ребят, есть задача интересная(мб?), но бюджета нет. Кто хочет поковырять клиентскую базу (20 к строк) юр лиц, и около 20-30 столбцов по каждой компании. Надо на основании истории заключения сделок(продажа фин продуктов) построить модель которая ранжирует базу по вероятности заключения сделки.

Lepus
23.08.2016
13:50:14

Magic
23.08.2016
13:53:53
серьезно?

Kalash
23.08.2016
13:54:26

Magic
23.08.2016
13:55:46
А догадайся, построй модель на основании халявы в интернете и отношения к серьезным задачам без бюджета

Dmit
23.08.2016
13:56:00
Нетути
Дратути) В контакти тогда))

Vladislav
23.08.2016
13:56:09

Ilya
23.08.2016
13:57:27

Vladislav
23.08.2016
13:57:48

Andrey
23.08.2016
14:26:24

Kalash
23.08.2016
14:26:43

Lepus
23.08.2016
14:28:30

Aleksei
23.08.2016
14:32:48
И если можно - сюда обращённый результат - получилось что-нить найти или нет

Google

Dan
23.08.2016
14:33:30
Да, было бы неплохо в итоге какой-то результат опубликовать, в виде статьи желательно ?

Andrey
23.08.2016
14:33:42
Я вот пока не понял, откуда там можно взять метрику качества для самого ранжирования.

Kalash
23.08.2016
14:33:51
Статью можно, но без упоминания клиента )

Dan
23.08.2016
14:34:13
разумеется, главное не кто клиент, а детали реализации

Andrey
23.08.2016
14:34:52
На ум приходит бинарная классификация с ее метриками качества и ранжирование по сырым вероятностям

Lepus
23.08.2016
14:35:52

Dan
23.08.2016
14:35:54
Стандартная задача по теорверу

Lepus
23.08.2016
14:36:01
может, стоит решающие деревья попробовать

Andrey
23.08.2016
14:36:03

Dan
23.08.2016
14:36:20
Графы же,не?

Lepus
23.08.2016
14:36:32

Yury
23.08.2016
14:37:02

Kalash
23.08.2016
14:37:18
Уточню - Есть 18к компаний и 80к встреч с ними. по встречам есть результаты - продано 10 продуктов на 100000р

Andrey
23.08.2016
14:37:24
biostat-r.blogspot.com

Lepus
23.08.2016
14:39:12
ну, условно можно считать, что для той компании, которой не продано, сделка не заключена

Kalash
23.08.2016
14:39:38
ну есть оценка результата в количестве продуктов и из маржинальности

Lepus
23.08.2016
14:39:49
если всего 10 продаж на 80к встреч — это странно немного, честно

Google

Dmit
23.08.2016
14:40:05

Kalash
23.08.2016
14:40:06
это я для примера с 1 встречи

Andrey
23.08.2016
14:40:53
Вероятность сделки как таковой и расчет профита, это кагбэ разные вещи

Dan
23.08.2016
14:41:12

Dmit
23.08.2016
14:41:19

Andrey
23.08.2016
14:42:22
Вообще я подобную задачу решал на конкурсе: сначала делил на два класса, потом в одном предсказывал количественную переменную отклика

Lepus
23.08.2016
15:31:22
Там датасет по аренде велосипедов
Плюс, классическое приложение МО -- задача кредитного скоринга
Решай задачу за два часа

Andrey ?
23.08.2016
16:59:31
а че такое big data?)

Dan
23.08.2016
17:00:46
вот.
с таких вопросов начинается глубокое погружение в целую вселенную бигдаты

Dmit
23.08.2016
17:01:18

Dan
23.08.2016
17:01:35
и назад уже дороги нет, потому что даже выйдя из чата бигдата будет преследовать тебя

Lepus
23.08.2016
17:01:39

Dan
23.08.2016
17:01:53
дважды

Semyon
23.08.2016
17:02:08
Когда брат программировал?

Google

Andrey ?
23.08.2016
17:03:26
так скажет кто нибудь что это такое?

Dan
23.08.2016
17:03:55
https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5
для начала
https://habrahabr.ru/hub/bigdata/
вот дальше

Andrey ?
23.08.2016
17:05:35
с хабра нужно было начинать

Lepus
23.08.2016
17:05:54
Нет бигдаты