@bigdata_ru

Страница 201 из 327
Очень добрый
25.12.2017
06:56:02
Господа, вопрос к реально практикующим и успешным дата саентистам и дата майнерам

Aleksandr
25.12.2017
06:56:03
Всем привет. Подскажите не сильно сложный учебник по теории вероятностей и матстатистике... в институте изучал, нужно вспомнить максимально быстро, не особо глубоко углубляясь в выводы формул...

Очень добрый
25.12.2017
06:56:44
Пандас - имеет ли практическое применение ? Используете ли в продакшене? Какие еще библиотеки необходимы к изучению для дата саентиста/майнера?

Evgeniy
25.12.2017
06:59:28
лол

Google
Очень добрый
25.12.2017
07:07:36
чтоб стать джуном

сейчас нет речь и аи и мл

нет речи*

контекст исключительно в работе с данными, отборе, фильтре и последующей визуализации - если я правильно понимаю работу дата саентиста

Artem
25.12.2017
07:17:47
Ребята, может где то есть гайд или инструкция, что нужно знать и уметь джуниору? Похоже актуальный вопрос.

Очень добрый
25.12.2017
07:19:43
насколько я понимаю, pandas и matplotlib для работы с данными и визуализации это обязательно + для более комильфошных манипуляций numpy, hadoop, madreduce

мидлы или сеньоры, поправьте

это если питон

и это еще без мл

Очень добрый
25.12.2017
07:52:47
знал бы, - не спрашивал бы

Google
Alexander
25.12.2017
08:08:12
Очень добрый
25.12.2017
08:08:38
Так-то он mapreduce
я уже заггулил что вы к названию пристали, вы лучше на вопрос ответьте

tonko
25.12.2017
08:10:57
Да странный у тебя вопрос

Спрашиваешь реально успешных датасаентистов, но при этом исключаешь тех кто занимается мл

Irina Vasileva
25.12.2017
08:13:37
Мне кажется, что он для себя пока исключает, а спрашивает тех, кто не исключает :)

Очень добрый
25.12.2017
08:14:10
я пока изучаю только работу с данными без мл. Мл для меня пока темный лес

Просто у меня есть накомых, который занимается одним лишь дата майнингом, вот почему я спрашиваю

исключаа мл

чая*

Irina Vasileva
25.12.2017
08:15:49
Ну да, я думаю, что тебе стоит подождать, ребята, кто сейчас онлайн, не могут ответить на твой вопрос, очевидно же. Чекни вечером :) и удачи

Очень добрый
25.12.2017
08:16:39
обидно сказал

ну ладно

Damir
25.12.2017
08:17:08
чая*
Что там с чаем? Обед через час

Irina Vasileva
25.12.2017
08:19:41
обидно сказал
Не обижайся :) лучше воодушевляйся, все у тебя получится)

Serhii
25.12.2017
08:42:24
Имхо начни с более фундаментальных вещей - матстат, теорвер, линейная алгебра. А либы - пандас, нампай и тд при наличии скиллов программирования и понимания структур данных - не то чтобы космическая задача. Правда я не датасаентист, я у мамы фронтендер, так что хз насколько мое мнение релевантно

Drino
25.12.2017
08:49:59
О, Nvidia хочет бабла!

Personal bot for tenni
25.12.2017
08:50:07
drino_drunker Ваше сообщение было удалено в связи с высокой активностью спамеров, оно выглядит подозрительно.

Evgeniy
25.12.2017
08:50:43
/dev
25.12.2017
08:52:36
О, Nvidia хочет бабла!
О, $commercial_company_name хочет бабла!

Serhii
25.12.2017
09:00:02
Ну, может Opencl допилят до готовности и тогда будет альтернатива (что не отменяет того факта что амд тоже хочет бабла)

Google
Serhii
25.12.2017
09:09:04
Ну пол года назад команда tensorflow обещала добавить поддержку опенсл, да и где то в недрах гх уже тогда видел как то (не факт что хорошо) работающие решения.

Drino
25.12.2017
09:12:52
Пришло время обучать нейросети через блокчейн!

Serhii
25.12.2017
09:13:36
"Сенсация! Нейронную сеть научили майнить бетховены!"

Serhii
25.12.2017
09:15:40
есть давно
Тогда почему маловероятно?

Evgeniy
25.12.2017
09:17:07
Тогда почему маловероятно?
потому что производительность

Tony
25.12.2017
13:05:23
На hiveOS ставил кто тензорфлоу?

Mikhael
26.12.2017
09:23:30
Здравствуйте, товарищи. Я новичок в биг дате и маш обучении. Вроде как задач не было или я не понимал, что это именно те самые задачи. Сейчас задача появилась - в проекте на Java нужно прикрутить карту точек доступа, координаты в point mysql, регион Россия, тысячи точек. Нужно нарисовать на карте точки, объединить их в облачка городов, районов, кварталов, чтобы при изменении масштаба на карте (из тайлов яндекса, гугла, опенстрит ) были не отдельные тд, а один круг на 10 тд. Как я понимаю, нужен алгоритм кластеризации точек. С чего начать? В языке R, вроде, есть то что нужно. Может стоит посмотреть другие решения, которые красиво дойдут в Java проект.

Anton
26.12.2017
09:25:35
Я чёт хз зачем тут мл и биг дата. Есть либа для андроида google maps extensions

Admin
ERROR: S client not available

Anton
26.12.2017
09:25:42
В ней есть кластеризация

Anton
26.12.2017
09:25:49
Скопипасти

[Anonymous]
26.12.2017
13:59:00
Может кто-нибудь помочь? Мне интересно есть ли разница между: а) кластеризующими и кластерными деревьями; б) деревьями регрессии и регрессионными деревьями

Svyatoslav
26.12.2017
14:12:25
Кто-нибудь подключал GPU от AMD?

Вроде старенькой HD7950

Andrey
26.12.2017
14:16:36
В plaidml можно попробовать завести

Viktor
26.12.2017
14:18:41
Кто-нибудь уже смотрел Intel AI Academy? Очередной Титаник и цветы ириса или что-то реальное?

Svyatoslav
26.12.2017
14:19:04
Есть что-то типо FireStream

Google
Svyatoslav
26.12.2017
14:19:18
От AMD. Если никто не работал, то пойду сам рыть.

suren
26.12.2017
23:10:06
нет, это просто словоблудие, разведённое графоманами
а также деревья решений и решающие деревья

Mikhael
27.12.2017
02:22:56
вот же : https://developers.google.com/maps/documentation/javascript/marker-clustering?hl=en
да. что-то такое мне и нужно. но у меня тысячи точек wi-fi по карте. и мне нужно не просто 'шарик = N ТД' показать, а общее число клиентов на них, присутствие аварийных ТД в 'шарике'...

в идеале хотелось бы совместить алгоритм кластеризации данных и агрегацию (max, sum, как в любимом sql)

Devanya
27.12.2017
03:22:03
https://www.inc.com/tim-leberecht/18-new-years-resolutions-of-an-ai.html

Artem
27.12.2017
07:41:08
в идеале хотелось бы совместить алгоритм кластеризации данных и агрегацию (max, sum, как в любимом sql)
Но ведь у Вас не задача разбить на классы, о какой кластеризации речь?

Mikhael
27.12.2017
07:48:31
Но ведь у Вас не задача разбить на классы, о какой кластеризации речь?
вы же прикрепили ссылку. это именно то, что мне нужно. но только желательно сделать не в javascript'е гугла, а выбрать это все из базы. и еще посчитать max, sum по величинам, характеризующим каждую точку, прицепившуюся в этот кластер.

select x(coordinates), y(coordinates), max(online), sum(online) from geotable group by <what?>

Henadz
27.12.2017
07:53:15
госпади

Страница 201 из 327