@bigdata_ru

« Назад

Страница 237 из 327

Далее »

Алексей

28.02.2018
08:33:02

Нет.

Для такого новичка как он и так сойдёт

Serhii

28.02.2018
08:34:13

PyTorch поинтереснее, правда.

При том что не сильно то и сложнее tf

(Ну то есть если python не вызывает ужаса в глазах то пайторч и тф +- одинаковы в своей learning curve)

Google

Алексей

28.02.2018
08:37:04

так есть же Keras

там вообще всё очень просто и для новичков самое оно

Serhii

28.02.2018
08:38:25

Keras ограничивает во первых. И слишком много инкапсулирует

Алексей

28.02.2018
08:38:55

я предлагал инстурменты явному новичку

ему надо то, что попроще, а не то, что помощнее

Serhii

28.02.2018
08:43:25

Я ж на своем опыте говорю - рандомное наслаивание слоёв в керасе и fit в конце не особо добавляет понимания происходящего)

Mike

28.02.2018
08:51:00

Ребят, всем привет. Есть вопрос: есть БД с набором имен( имена могут состоять из нескольких слов). Есть сайт с полем First name + Last name. Как лучше с точки зрения проверки на фейковое имя сделать проверку? Простое вхождление и проверочки по маленьким кусочкам не предлагать =)

Samosvalkin

28.02.2018
09:05:11

Ребят, всем привет. Есть вопрос: есть БД с набором имен( имена могут состоять из нескольких слов). Есть сайт с полем First name + Last name. Как лучше с точки зрения проверки на фейковое имя сделать проверку? Простое вхождление и проверочки по маленьким кусочкам не предлагать =)

а как определяется "фейковость" имени?

Mike

28.02.2018
09:05:49

а как определяется "фейковость" имени?

наличие имени в БД

Samosvalkin

28.02.2018
09:07:00

сделать отдельный столбец с именем, проиндексировать и искать по нему

точнее отдельную таблицу

Alex

28.02.2018
11:54:14

подскажите такой момент. генератор = class_mode='categorical', Dense(10) , Activation('sigmoid'), loss='binary_crossentropy' в таком случае я получу для каждого класса бинарную классификацию?

Mike

28.02.2018
16:48:51

сделать отдельный столбец с именем, проиндексировать и искать по нему

просто name(db) in user_input?

Google

Вадим

28.02.2018
17:29:33

Подскажите: обучение дерева решений зависит от порядка признаков в таблице? Когда я, например, возраст перемещаю в конец, то дерево другим получается, это нормально?

Dmitry

28.02.2018
17:39:24

Подскажите: обучение дерева решений зависит от порядка признаков в таблице? Когда я, например, возраст перемещаю в конец, то дерево другим получается, это нормально?

Нет, это не нормально

Вадим

28.02.2018
17:40:26

random_state фиксирован

Dmitry

28.02.2018
17:40:33

У вас падает точность при перемещении столбцов?

Вадим

28.02.2018
17:40:50

Не смотрел

Dmitry

28.02.2018
17:41:05

А что вас тогда смущает?

Вадим

28.02.2018
17:42:10

Мне нужно указать, какой признак в корне, а он меняется

Dmitry

28.02.2018
17:43:51

а если n_estimators=1 поставить, тоже меняется?

У вас бустинговые деревья или обычный ансабль?

Вадим

28.02.2018
17:45:33

я обучаю через DecisionTreeClassifier, там такого параметра нет

Вот

Dmitry

28.02.2018
17:46:29

У вас будет 100 деревьев к примеру. О каком из 100 корней вы говорите?

Вадим

28.02.2018
17:46:48

Я одно дерево только обучил

Потому что сам еще только обучаюсь этому делу)

Dmitry

28.02.2018
17:49:43

Одно дерево по идее он должен всегда делать одинаково

Надо залезть в код, посмотреть как они делают деление…

Вадим

28.02.2018
17:50:57

Вот

Разница в том, что я засунул пол в центр

Google

Pipito

28.02.2018
17:51:31

а где ты так делаешь ?

Вадим

28.02.2018
17:51:44

jupyter

Или про что вопрос?

Dmitry

28.02.2018
17:52:06

а у вас там gini одинаковый, он может и так и так делить — результат один

Pipito

28.02.2018
17:52:15

пол года в нем сижу и первый раз вижу что так можно

Вадим

28.02.2018
17:52:39

Причем он делит в абсолютно равном соотношении

Очень странно

dot

28.02.2018
17:54:38

Скажите а что проверяет вот такое условие if imutils.is_cv2() ?

Dmitry

28.02.2018
18:00:03

У вас случайно столбцы не продубилированы?

Вадим

28.02.2018
18:02:17

Ой, на этом примере да)

Но уже было так раз 5

Я посмотрел 5-6 комбинаций

Вадим

28.02.2018
18:02:43

Даже вот сейчас

Dmitry

28.02.2018
18:03:27

Такое впечатление, что вы ему подсовываете данные, которые дублируют друг-друга и ему всё-равно как делать дерево

поэтому он делает раз так, раз так

Вадим

28.02.2018
18:04:40

Даже без дублированных одинаково делит

А может ли быть баг с ОС?

Еще меня смущает, что он делит в таком же количестве, а названия признаков меняет

В узлах

Google

Dmitry

28.02.2018
18:12:28

А как вы колонки переставляете?

случайно не так? df.columns = […]

Вадим

28.02.2018
18:13:55

У меня есть основная таблица с данными, я беру таким образом: new_df = df[['asdas' , ...]]

Dmitry

28.02.2018
18:14:25

У меня есть основная таблица с данными, я беру таким образом: new_df = df[['asdas' , ...]]

так правильно

Вадим

28.02.2018
18:15:16

МОжет быть проблема в том, что я сохраняю граф в файл *.dot, потом открываю его через блокнот и визуализирую уже на сайте?

Admin

ERROR: S client not available

Dmitry

28.02.2018
18:16:41

Маловероятно

а что выдаёт np.mean(new_df[‘ap_hi_1’]==new_df[‘ap_hi_2’])?

только там кавычки поставьте правильные

tg их переделывает на свой манер

MD

28.02.2018
18:18:56

В dot graph порядок составления вершин в графе зависит от порядка появления рёбер в файле, но если файл не меняется, то после компиляции вид должен быть одинаковый.

Дима Мотлль, привет).

Вадим

28.02.2018
18:21:34

а что выдаёт np.mean(new_df[‘ap_hi_1’]==new_df[‘ap_hi_2’])?

0 в ap_hi_1 и ap_hi_2

В принципе, ожидаемо

а, ты ведь имел в виду new_df[new_df[‘ap_hi_1’]==new_df[‘ap_hi_2’]].mean() ?

потому что иначе он суммирует массив из True и False

Dmitry

28.02.2018
18:25:26

он пишет среднее

если массивы совпадают, то будет 1.0

Вадим

28.02.2018
18:26:11

Да, у меня получилось ~0.25

Dmitry

28.02.2018
18:26:25

значит не совпадают

Google

Вадим

28.02.2018
18:26:45

Ну вроде с данными всё нормально, я много раз уже их перепроверил

Перекомпилил

Dmitry

28.02.2018
18:27:26

а может проще сразу в jupyter notebook выводить

Есть вроде какая-та для этого библиотечка для визуализации decision trees

Вадим

28.02.2018
18:27:58

export_graphviz?

Dmitry

28.02.2018
18:28:10

да, graphviz

Вадим

28.02.2018
18:28:22

она на windows не рисует в jupyter

Или я не смог загуглить

Dmitry

28.02.2018
18:29:42

А вы через это строите? http://webgraphviz.com

Вадим

28.02.2018
18:39:42

Да

Сергей

28.02.2018
20:15:48

Всем привет, почему пандас не читает первую колонку:

О, а почему админ мне запретил присылать медиа?

Yehor

28.02.2018
20:17:37

Я бы предложил кинуть мне в личку, чтобы переслать

Но боюсь меня тоже забанят

Сергей

28.02.2018
20:20:49

А что случилось-то, я тут, вроде, далее давно не писал

Открыть в Telegram