@bigdata_ru

Страница 237 из 327
Алексей
28.02.2018
08:33:02
Нет.
Для такого новичка как он и так сойдёт

Serhii
28.02.2018
08:34:13
PyTorch поинтереснее, правда.

При том что не сильно то и сложнее tf

(Ну то есть если python не вызывает ужаса в глазах то пайторч и тф +- одинаковы в своей learning curve)

Google
Алексей
28.02.2018
08:37:04
так есть же Keras

там вообще всё очень просто и для новичков самое оно

Serhii
28.02.2018
08:38:25
Keras ограничивает во первых. И слишком много инкапсулирует

Алексей
28.02.2018
08:38:55
я предлагал инстурменты явному новичку

ему надо то, что попроще, а не то, что помощнее

Serhii
28.02.2018
08:43:25
Я ж на своем опыте говорю - рандомное наслаивание слоёв в керасе и fit в конце не особо добавляет понимания происходящего)

Mike
28.02.2018
08:51:00
Ребят, всем привет. Есть вопрос: есть БД с набором имен( имена могут состоять из нескольких слов). Есть сайт с полем First name + Last name. Как лучше с точки зрения проверки на фейковое имя сделать проверку? Простое вхождление и проверочки по маленьким кусочкам не предлагать =)

Mike
28.02.2018
09:05:49
Samosvalkin
28.02.2018
09:07:00
сделать отдельный столбец с именем, проиндексировать и искать по нему

точнее отдельную таблицу

Alex
28.02.2018
11:54:14
подскажите такой момент. генератор = class_mode='categorical', Dense(10) , Activation('sigmoid'), loss='binary_crossentropy' в таком случае я получу для каждого класса бинарную классификацию?

Google
Вадим
28.02.2018
17:29:33
Подскажите: обучение дерева решений зависит от порядка признаков в таблице? Когда я, например, возраст перемещаю в конец, то дерево другим получается, это нормально?

Вадим
28.02.2018
17:40:26
random_state фиксирован

Dmitry
28.02.2018
17:40:33
У вас падает точность при перемещении столбцов?

Вадим
28.02.2018
17:40:50
Не смотрел

Dmitry
28.02.2018
17:41:05
А что вас тогда смущает?

Вадим
28.02.2018
17:42:10
Мне нужно указать, какой признак в корне, а он меняется

Dmitry
28.02.2018
17:43:51
а если n_estimators=1 поставить, тоже меняется?

У вас бустинговые деревья или обычный ансабль?

Вадим
28.02.2018
17:45:33
я обучаю через DecisionTreeClassifier, там такого параметра нет

Вот

Dmitry
28.02.2018
17:46:29
У вас будет 100 деревьев к примеру. О каком из 100 корней вы говорите?

Вадим
28.02.2018
17:46:48
Я одно дерево только обучил

Потому что сам еще только обучаюсь этому делу)

Dmitry
28.02.2018
17:49:43
Одно дерево по идее он должен всегда делать одинаково

Надо залезть в код, посмотреть как они делают деление…

Вадим
28.02.2018
17:50:57
Вот





Разница в том, что я засунул пол в центр

Google
Pipito
28.02.2018
17:51:31
а где ты так делаешь ?

Вадим
28.02.2018
17:51:44
jupyter

Или про что вопрос?

Dmitry
28.02.2018
17:52:06
а у вас там gini одинаковый, он может и так и так делить — результат один

Pipito
28.02.2018
17:52:15
пол года в нем сижу и первый раз вижу что так можно

Вадим
28.02.2018
17:52:39
Причем он делит в абсолютно равном соотношении

Очень странно

dot
28.02.2018
17:54:38
Скажите а что проверяет вот такое условие if imutils.is_cv2() ?

Dmitry
28.02.2018
18:00:03
У вас случайно столбцы не продубилированы?

Вадим
28.02.2018
18:02:17
Ой, на этом примере да)

Но уже было так раз 5

Я посмотрел 5-6 комбинаций

Вадим
28.02.2018
18:02:43
Даже вот сейчас



Dmitry
28.02.2018
18:03:27
Такое впечатление, что вы ему подсовываете данные, которые дублируют друг-друга и ему всё-равно как делать дерево

поэтому он делает раз так, раз так

Вадим
28.02.2018
18:04:40
Даже без дублированных одинаково делит

А может ли быть баг с ОС?

Еще меня смущает, что он делит в таком же количестве, а названия признаков меняет

В узлах

Google
Dmitry
28.02.2018
18:12:28
А как вы колонки переставляете?

случайно не так? df.columns = […]

Вадим
28.02.2018
18:13:55
У меня есть основная таблица с данными, я беру таким образом: new_df = df[['asdas' , ...]]

Вадим
28.02.2018
18:15:16
МОжет быть проблема в том, что я сохраняю граф в файл *.dot, потом открываю его через блокнот и визуализирую уже на сайте?

Admin
ERROR: S client not available

Dmitry
28.02.2018
18:16:41
Маловероятно

а что выдаёт np.mean(new_df[‘ap_hi_1’]==new_df[‘ap_hi_2’])?

только там кавычки поставьте правильные

tg их переделывает на свой манер

MD
28.02.2018
18:18:56
В dot graph порядок составления вершин в графе зависит от порядка появления рёбер в файле, но если файл не меняется, то после компиляции вид должен быть одинаковый.

Дима Мотлль, привет).

Вадим
28.02.2018
18:21:34
В принципе, ожидаемо

а, ты ведь имел в виду new_df[new_df[‘ap_hi_1’]==new_df[‘ap_hi_2’]].mean() ?

потому что иначе он суммирует массив из True и False

Dmitry
28.02.2018
18:25:26
он пишет среднее

если массивы совпадают, то будет 1.0

Вадим
28.02.2018
18:26:11
Да, у меня получилось ~0.25

Dmitry
28.02.2018
18:26:25
значит не совпадают

Google
Вадим
28.02.2018
18:26:45
Ну вроде с данными всё нормально, я много раз уже их перепроверил

Перекомпилил

Dmitry
28.02.2018
18:27:26
а может проще сразу в jupyter notebook выводить

Есть вроде какая-та для этого библиотечка для визуализации decision trees

Вадим
28.02.2018
18:27:58
export_graphviz?

Dmitry
28.02.2018
18:28:10
да, graphviz

Вадим
28.02.2018
18:28:22
она на windows не рисует в jupyter

Или я не смог загуглить

Dmitry
28.02.2018
18:29:42
А вы через это строите? http://webgraphviz.com

Вадим
28.02.2018
18:39:42
Да

Сергей
28.02.2018
20:15:48
Всем привет, почему пандас не читает первую колонку:

О, а почему админ мне запретил присылать медиа?

Yehor
28.02.2018
20:17:37
Я бы предложил кинуть мне в личку, чтобы переслать

Но боюсь меня тоже забанят

Сергей
28.02.2018
20:20:49
А что случилось-то, я тут, вроде, далее давно не писал

Даже*

Страница 237 из 327