
Nail
03.08.2018
15:35:41
или может ктото может как задачу за вознаграждение взять ?


Влад
03.08.2018
15:36:20
import numpy as np
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.svm import LinearSVC
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.multiclass import OneVsRestClassifier
from sklearn.preprocessing import LabelBinarizer
import pandas as pd
df = pd.read_csv("file.csv",sep=',',encoding='utf-8')
X_train = df['query']
y_train_text = df['xid']
X_test = np.array(['Активный кальций A.A.G с магнием 330мл | Active Asia Gold OOO, Узбекистан',
'Авизол капс. 50мг N6 | Авантика Медекс, ИНДИЯ'
])
mlb = LabelBinarizer()
Y = mlb.fit_transform(y_train_text)
classifier = Pipeline([
('vectorizer', CountVectorizer()),
('tfidf', TfidfTransformer()),
('clf', OneVsRestClassifier(LinearSVC()))])
classifier.fit(X_train, Y)
predicted = classifier.predict(X_test)
all_labels = mlb.inverse_transform(predicted)
for item, labels in zip(X_test, all_labels):
print([item,labels])
for i in 'Нош-па 0,04 N50 Само OOO "SAMO" - ID'.split('-'):
i[0].count('Сюда id')
'Нош-па 0,04 N50 Само OOO "SAMO" - ID'.split('-') - по факту это массив


Maxim
03.08.2018
15:36:25

Nail
03.08.2018
15:36:28
df = pd.read_csv("file.csv",sep=',',encoding='utf-8') - тут я засовываю csv из 50000 правилно указанных строк вида: строка - ID

Google

Влад
03.08.2018
15:36:36
можно взять просто csv модуль и в чтение

Tigran
03.08.2018
15:36:46

Nail
03.08.2018
15:37:27
то есть надо отдать скрипту Нош-па 0,04 N50 Само OOO "SAMO и получить ID по мастер дате
гдето ношпа гдето 0,44 4,0 гдето транслитом написан производитель
понимаете ?
САМО -SAMO
вот все эти разнонаписанные варианты есть в базе накоплены запоминанием выбора менеджера в ручную
я левинштейном прогоняю выборку получанную sphinx и оставляю менеджеру выбор из 10 вариантов
вот этот выбор из надо автоматизирвоать

Tigran
03.08.2018
15:39:58

Nail
03.08.2018
15:40:13
спс ознакомлюсь

Bogdan (SirEdvin)
03.08.2018
15:40:22
Немного наркоманский вопрос, кто-то может видел eventloop, который бы шарился между тредами в python?) Что бы event loop мог одновременно пользоватся несколькими тредами и в случае, если где-то внутри корутины снимался лок на GIL делал даже вид, что eventloop получился многопоточный?

Nail
03.08.2018
15:41:36

Google

Tigran
03.08.2018
15:41:49
без нейросеток
но с моделями

Nail
03.08.2018
15:43:28
да это изучать и изучать, может есть примеры кода которые можно уже юзать ? задача вроде распространненая ?

Nikolay
03.08.2018
15:43:28

Tigran
03.08.2018
15:43:29
правильное направление - это открыть google scholar и гуглить свою проблему

Nikolay
03.08.2018
15:43:53

Tigran
03.08.2018
15:44:22

Bogdan (SirEdvin)
03.08.2018
15:44:39

Nikolay
03.08.2018
15:49:43
Но вообще смысла мало в этом

Tigran
03.08.2018
15:51:50
неправильные ответы? )
а, понял
ну, квадратичные алгоритмы - они такие
не поможет, если ты линейный алгоритм не сделал
http://e-maxx.ru/algo/prefix_function

Мой любимый
03.08.2018
15:57:55
Что это за задачи? Ссылку можно?

Denis
03.08.2018
15:59:09
А просить помощи по идущему контесту, между прочим, правилами запрещено и карается баном

Bogdan (SirEdvin)
03.08.2018
15:59:42
use numba

Мой любимый
03.08.2018
15:59:50
Роман задача решается на сервере?

Google

Rustem
03.08.2018
16:01:15
Ребят, посоветуйте хороший ноутбук в диапазоне 50-100к.

Denis
03.08.2018
16:02:05

Nikolay
03.08.2018
16:02:45

Rustem
03.08.2018
16:03:43

Renat
03.08.2018
16:04:11
Ну 50-100 хороший диапазон, может поточнее?

Oleg
03.08.2018
16:04:23
Для работы выбираю)
Заголовок чата не смущает? Нахуя офтопить? Вылези из окна и спроси на всю улицу. Эффективнее будет.

Essentuki
03.08.2018
16:06:31

Rustem
03.08.2018
16:08:15

Мой любимый
03.08.2018
16:08:33
Спасибо))

Mike
03.08.2018
16:08:46
+2 к производительности
+3 к комфорту

Мой любимый
03.08.2018
16:09:03
Для какой работы тебе ноут нужен?

Essentuki
03.08.2018
16:09:03

Denis
03.08.2018
16:09:04
Это уже не 50-100

Essentuki
03.08.2018
16:09:30
100 баксов + линуксоид
даже 89

CthUlhUzzz
03.08.2018
16:11:01
Всем привет! Есть предложение для разработчиков/начинающих стартаперов.
Я – senior product дизайнер по enterprise/SaaS/веб/мобилкам (ui/ux).
Сейчас нахожусь в активном поиске работы уже несколько месяцев, потому что мне постоянно то компания, то проекты, то оплата не подходит. Но я не могу не заниматься дизайном и простаивать. Я делаю или бесплатно или очень дорого. Поэтому предложение:
Готов бесплатно выделять +-8 часов в неделю на разработку вашего продукта, начиная от полного проектирования по бизнес-процессам/идеям и заканчивая hi-fi мокапами. Вы разработчик, который хочет сделать проект для портфолио с крутым дизайном? Пишите мне. Вы стартапер, у которого нет бюджета на хороший дизайн? Пишите мне.
С вас какие-то гарантии, что проект будет в продакшене и отсутствие NDA.


Oleg
03.08.2018
16:11:02
Это уже не 50-100
Питон потянет и 12-дюймовый макбук. В 100к уложишься.
Но выбирать ноутбук в чате про питон - это пиздец. Ты уж прости.
Ещё попроси машину тебе подобрать на которой ездишь на работу, где пишешь на питоне ?

Denis
03.08.2018
16:11:56

Мой любимый
03.08.2018
16:11:59
посоветуйте, в какой кафешке лучше кодить

Google

Denis
03.08.2018
16:12:06
в маке

Мой любимый
03.08.2018
16:12:10
на маке

Maxim
03.08.2018
16:12:20
Посоветуй, что делать, если я за 2 часа решил только 1 задачу?

Admin
ERROR: S client not available

M ?????
03.08.2018
16:12:49
Любопытно, что в чате по ML и DS обсуждение железа и подбор его достаточно популярная и нормальная тема, а в просто питон чате это вызывает бурю негодования.

Denis
03.08.2018
16:12:51

Мой любимый
03.08.2018
16:13:27
В википедии есть реализация кнута-пратта, в чем проблема?

CthUlhUzzz
03.08.2018
16:13:32
удали
Я правила не нарушал. Вдруг кому-то пригодится

Denis
03.08.2018
16:13:34

Maxim
03.08.2018
16:13:57

Мой любимый
03.08.2018
16:14:06
ван момент!

Denis
03.08.2018
16:14:17
на емаксе и код есть, но он не сильно поможет в этой задаче

Мой любимый
03.08.2018
16:14:38
Да, сорян, не википедия, бесы путают. Но тоже вики!
https://ru.wikibooks.org/wiki/%D0%A0%D0%B5%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%BE%D0%B2/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0%9A%D0%BD%D1%83%D1%82%D0%B0_%E2%80%94_%D0%9C%D0%BE%D1%80%D1%80%D0%B8%D1%81%D0%B0_%E2%80%94_%D0%9F%D1%80%D0%B0%D1%82%D1%82%D0%B0

Denis
03.08.2018
16:16:40
там даже за квадрат искать можно

Maxim
03.08.2018
16:17:52

Мой любимый
03.08.2018
16:22:53
скролишь вниз, пока не увидишь слово PYTHON
потом ctrl+C и ctrl+V

Denis
03.08.2018
16:23:09
зачем питон, там хаскель есть

Мой любимый
03.08.2018
16:24:09
я думал, надо на питоне. Так-то там и С есть

Google

Боязид
03.08.2018
16:26:04
Посоветуте библиотеку для разработки ботов тг

Denis
03.08.2018
16:26:30

Боязид
03.08.2018
16:26:51

Maxim
03.08.2018
16:27:32

Влад
03.08.2018
16:32:04

Oleg
03.08.2018
16:34:06

Denis
03.08.2018
16:34:50
Зачем телеграм боту настоящий асинк?

Aragaer
03.08.2018
16:35:45
слушать stdin и одновременно мониторить чатики
а в telepot нет настоящего асинка чтле?

Oleg
03.08.2018
16:36:43

Denis
03.08.2018
16:36:44
Зачем боту стдин?

CthUlhUzzz
03.08.2018
16:37:20

Oleg
03.08.2018
16:37:48

Maxim
03.08.2018
16:38:11
Что такое yield?