@bigdata_ru

Страница 325 из 327
Alexandr
22.10.2018
21:57:52
Ребята

есть кто живой

кто может помочь разобраться со Статистикой?

завтра нужно лабу сдать по кластерному анализу

Google
Alexandr
22.10.2018
22:03:15


Скрудж
22.10.2018
22:06:01
ну, график растет

Alexandr
22.10.2018
22:07:35
то есть,продажи с каждым днем увеличиваются?

Nesovsemenot
22.10.2018
22:09:11
у тебя по оси Х продажи и даты

Seva
22.10.2018
22:09:11
Там же месяцы

Nesovsemenot
22.10.2018
22:09:33
может для начала надо хотя бы один параметр оставить, либо добавить сегрегацию по цвету

Alexandr
22.10.2018
22:15:11
окей,я понял, еще один вопрос,чуточку посложнее. Есть статистика ста студентов по 10 предметам



что в данном случае происходит?

как это описать?

Nesovsemenot
22.10.2018
22:17:05
ось игрик это что?

Alexandr
22.10.2018
22:19:32
сам не понимаю,если честно,по моим преположениям это номер предмета

а

Google
Alexandr
22.10.2018
22:20:27
либо оценка

Nesovsemenot
22.10.2018
22:25:10
кол-во оценок в кейсах. может тогда по оси У, опять же показать уровень оценок, а не кол-во их.

melancholiac
22.10.2018
22:27:33
ты со статистикой разбираешься или с визуализацией?

Nesovsemenot
22.10.2018
22:28:08
Alexandr
22.10.2018
22:28:17
логично,ведь оценки выше 7 не подымаются,но почему тогда оно определило,что макс оценка 9?

а не,пардон

у некоторых студентов все же есть максимальный балл,исходя из таблицы

сложна...

то есть,это просто средний балл на определенное к-во студентов,я правильо понимаю?

Alezander
23.10.2018
01:05:27
косплей моего препода

Leo
23.10.2018
02:37:20


Олег
23.10.2018
05:52:35
Привет IT-легендам ??

как поживаете?

Denis
23.10.2018
11:41:38
Привет IT-легендам ??
Почему легендам?

Andrey
23.10.2018
11:58:48
Бигдата - это как подростковый секс все о ней говорят, но никто не пробовал наверное поэтому

Evgeniy
23.10.2018
14:22:14
Всем привет, кто-нибудь знает хорошую альтернативу Neo4j?

Nick
23.10.2018
14:55:25
а в чем Neo4J плох? Из графовых только InfoGrid и Infinite Graph вроде в голову приходят, но своего опыта с ними не было

yopp
23.10.2018
15:06:27
Всем привет, кто-нибудь знает хорошую альтернативу Neo4j?
для всех «хорошая» имеет совершенно разное значение. графовых бд не так много. на википедии почти полный список :) https://en.wikipedia.org/wiki/Graph_database

Evgeniy
23.10.2018
15:50:57
а в чем Neo4J плох? Из графовых только InfoGrid и Infinite Graph вроде в голову приходят, но своего опыта с ними не было
В целом не плох, но наш продукт должен с него переехать по разным причинам, ищем замену

Google
melancholiac
23.10.2018
18:14:31
что значит ситуация когда mlp выдает одинаковые выходы для всей обучающей выборки?

и как её лечить?

alex
23.10.2018
18:18:04
А классы сбалансированы?

Ну хоть чуть-чуть? )

melancholiac
23.10.2018
18:20:21
что значит сбалансированы?

alex
23.10.2018
18:21:59
Соотношение классов в обручающей выборке какое?

melancholiac
23.10.2018
18:22:09
здесь зеленых меньше но на сгенерированной 1:1:1 с 50 точек в кадом классе наблюдалась такая же картина

точки получены после PCA, в сети 10 слове по 20 нейронов, 100.000 эпох, кодировал классы как -1, 0, 1

alex
23.10.2018
18:27:16
Ну могло просто переобучиться под один класс, а уж почему - надо копать

melancholiac
23.10.2018
18:29:28
скорее всего так и вышло (вылетают небольшие числа в окресности нуля), как это править?

alex
23.10.2018
18:33:16
Обязательно mlp? Вроде неплохо разделяются, можно попробовать хоть svm

alex
23.10.2018
18:34:20
: (

Evgeniy
23.10.2018
18:34:35
melancholiac
23.10.2018
18:36:31
mini batch?
да, если я понял правильно

Evgeniy
23.10.2018
18:37:36
да, если я понял правильно
ну то есть на одном минибетче 100% асс?

melancholiac
23.10.2018
18:38:26
нет, не понял видимо

Google
Evgeniy
23.10.2018
18:39:23
нет, не понял видимо
ограничь данные небольшим набором из, скажем 6 семплов, проверь что работает

melancholiac
23.10.2018
18:39:39
сейчас

[[9.97483539e-01] [9.97807410e-01] [2.50480100e-04] [2.07201702e-04] [7.79335022e-06] [8.34355333e-06]]

судя по порядкам разделило оно правильно

но в общем все печально на меньшей размерности выборки все работало

Dasha Shvec
23.10.2018
19:23:12
Друзья.... а как простым языком можно обьяснить кто такой Big Data Engineer ? Какими скилами он должен владеть??

Nesovsemenot
23.10.2018
19:24:38
Друзья.... а как простым языком можно обьяснить кто такой Big Data Engineer ? Какими скилами он должен владеть??
давеча был видос от оупен дата сайнтист. Такие штуки в первом докладе там рассказывали

Boris
24.10.2018
05:58:33
Друзья.... а как простым языком можно обьяснить кто такой Big Data Engineer ? Какими скилами он должен владеть??
Быть послушным слугой дата саентиста, с радостью браться за унылые рутинные задачи, и ни в коем случае не думать о каком-то развитии в сторону дата саентиста,)

yopp
24.10.2018
16:48:37
Ilya
25.10.2018
05:56:14
дата инженер это секрет за волшебными алгоритмами дата саентиста

он дополняет этот алгоритм, порой вытесняя его совсем

Страница 325 из 327