@bigdata_ru

Страница 227 из 327
Alexey
10.02.2018
13:14:24
Товарищи. По статистике вопрос могу тут задать?

Alexey
10.02.2018
13:24:34
Спасибо! Можно ли применять критерий Т Уилкоксона, если нетипичный сдвиг отсутсвует? Т е изменения переменных только в положительную сторону.

Google
Aleksandr
10.02.2018
16:37:23
Приветствую, коллеги! Подскажите пожалуйста с чего начинать обучение данной области? Есть какой-то roud map? Заранее спасибо.

Aleksandr
10.02.2018
16:44:10
@Progfiles Спасибо. А с чего начинать обучение в первую очередь? Есть ли какие-то толковые доки, книги, видео и тд.

Alexey
10.02.2018
16:44:43
Смотрите в чате были ссылки на стековерфлоу

Проксимов
10.02.2018
16:53:43
Ого, джава там каким боком

Oleg
10.02.2018
17:06:28
ребят а что это за курс? Как он называется?

Dan
10.02.2018
17:07:00
Alexey
10.02.2018
17:07:11
Там же написано. Но он в след году начнётся

Oleg
10.02.2018
17:07:36
Степик, анализ данных же
просто я его там не вижу

Там же написано. Но он в след году начнётся
ну тогда понятно почему не вижу ))) спасибо!

Aleksandr
10.02.2018
17:09:32
Что-то много всего учить надо:( только на пайтон времени хз сколько надо

Alexey
10.02.2018
17:10:02
Главное начать. Это видимо для нормального уровня вхождения

Google
Aleksandr
10.02.2018
17:10:49
Искал литературу, почти вся англоязычная

Alexey
10.02.2018
17:11:30
Да тут ссылка где то была в чате - норм и на русском есть

на степике курсы бесплатны

на курсере тоже

Donaudampf
10.02.2018
17:12:49
на курсере тоже
Там сейчас куда ни ткнись - бесплатно только лекции, без заданий

Alexey
10.02.2018
17:13:14
попробуйте, вполне есть задания автоматические

Donaudampf
10.02.2018
17:15:26
Полностью бесплатные тоже есть, но мало. Периодически захожу интересные курсы посмотреть - в основном только аудит

Evgeniy
10.02.2018
17:17:34
Что-то много всего учить надо:( только на пайтон времени хз сколько надо
а хотелось бы за недельку на уровень доктора наук выйти и еще за недельку на уровень чела с 5 годами в индустрии

Aleksandr
10.02.2018
17:17:52
Нужно будет с ноута чат открыть и ссылки посмотреть. А вообще, какие задачи у специалистов? Какие требования?

Сергей
10.02.2018
17:36:14
Я правильно понял что, судя по этой карте, можно миновать матан?

Alexey
10.02.2018
17:36:47
Вроде там есть матан но в жедательных

Сергей
10.02.2018
17:53:11
Странно, это ж фундамент, градиентный спуск

Evgeniy
10.02.2018
17:54:23
делать курс по матану чтобы понять градиентный спуск

Evgeniy
10.02.2018
17:57:10
градиент на пальцах объяснить несколько часов, формально два семестра матана

Сергей
10.02.2018
17:58:08
градиент на пальцах объяснить несколько часов, формально два семестра матана
Да там вообще все можно на пальцах за день объяснить

Pavel
10.02.2018
17:58:08
Я правильно понял что, судя по этой карте, можно миновать матан?
Насколько я помню, в курсе по нейронкам есть саммари по линалу и, возможно, матану. Целая отдельная неделя.



Сергей
10.02.2018
18:01:14
А как этот курс называется?

Pipito
10.02.2018
18:06:34
ребят может кто с pandas помочь ?

Google
Pipito
10.02.2018
18:08:34
Если в одной ячейке может быть от 1 до 20 значений. Я разбиваю сплитом, потом у меня получается список, так вот как сделать бинарную матрицу 1/0 из этого ?

Сергей
10.02.2018
18:19:29
А как этот курс называется?
https://stepik.org/course/401/syllabus

Сергей
10.02.2018
18:20:41
Pipito
10.02.2018
18:46:31
get_dummies?
честно

вот только что попробовал

pd.get_dummies(data['golden_globes_nominee_categories'].apply(pd.Series).stack()).sum(level=0)

но до этого еба*** часа 2 с этим

а это сразу сработало

Anton
10.02.2018
19:02:01
а если курс прошел, где работать?

Anton
10.02.2018
21:08:09
Ребят, кто-нибудь помогите разобраться с применением lsa и нейросетью. В инете статьи только про lsa удалось найти. Вообще в результате lsa мы получаем что-то типо вектора документа или что ?

Peter
11.02.2018
09:36:55
Добрый день! Подскажите что лучше всего использовать для извлечения текста из pdf файла? Где можно найти дата сет научных статей на русском языке?

alex
11.02.2018
09:43:56
try pdfminer

Peter
11.02.2018
10:12:59
Не очень хороший результат дает

alex
11.02.2018
10:28:59
А что не вышло?

Viktor
11.02.2018
10:47:05
Как можно использовать статистику о проезде легковушек/грузовиков/трамваев/велосипедистов по участку улицы? Начинаю копать вглубь трекинга объектов и хотелось бы сделать что-то полезное. Какие мысли и идеи?

Google
Viktor
11.02.2018
11:06:04
Были мысли вычислять зависимость загрязнения воздуха (где-то была ссылка на ресурс с данными) от интенсивности движения транспорта но это как-то натянуто выглядит

Admin
ERROR: S client not available

Pipito
11.02.2018
11:11:38
или вы хотите найти какие-то новые интересные корреляции, которые могут быть не правой ?

Сергей
11.02.2018
11:16:48
но это ты уже яндекс создаешь какой-то
А он уже начал что-то прогнозировать? Я думал только текущую ситуацию показывает

Pipito
11.02.2018
11:17:32
я думаю яндекс навигатор как-то понимает, что не надо строить маршрут где через 15 минут будет пробка

к примеру если час пик будет

они же в НС там все долбят, думаю нашли такое применение

Сергей
11.02.2018
11:19:49
они же в НС там все долбят, думаю нашли такое применение
Имхо, если бы их навигатор мог предсказать дорожную ситуацию то они это на каждом шагу бы рекламировали

Pipito
11.02.2018
11:20:07
ну с яндекс музыкой они не рекламят вроде

она мне треки подюирает, которые реально заходят

вычисляет что мне нрав

Viktor
11.02.2018
11:21:02
Улица центральная одного из районов города. Поэтому по загруженности можно что-то предсказать/посчитать. Наверно. Вот сижу и думаю что именно к этим распределениям прикручивать

Pipito
11.02.2018
11:22:18
мне это напоминает как на хакатон с ребятами ездили

дали нам датасет в парметрами погоды и количеством энергии, которую солнечная батарея аккумулирует

сделали тип прогноз того, скок будет выработка и сколько будет расти спрос на эту энергию

чтобы было понятно сколько в перспетиве закупить оборудования

Google
Pipito
11.02.2018
11:23:59
ну такое себе)

анализ ради анализа я бы сказал

Сергей
11.02.2018
11:24:20
И что вы использовали как метод?

Сергей
11.02.2018
11:25:00
метод?
Ну да

Pipito
11.02.2018
11:25:21
алгоритм ?

я чет просто не понял

Сергей
11.02.2018
11:25:42
Можно же регрессию, например

Или извратиться и нейронку

Pipito
11.02.2018
11:26:23


вообще трабл в том что просили в MS_Azure делать

Сергей
11.02.2018
11:27:18
А, я не пользовался азуром

Pipito
11.02.2018
11:27:19
а модели разные были

Страница 227 из 327