
Terminator
29.01.2019
12:14:52
@subdose будет жить. Поприветствуем!

Santiago
29.01.2019
12:15:28
Гайс, такой вопрос. Мне надо определить, содержится ли подстрока в строке, но загвоздка в том, что эта самая строка может быть очень сильно искажена (например, одно слово разрезано на два, второе вообще пропало, а третье заменено на похожее). Обычный fuzzy matching (типа FuzzyWuzzy) в принципе что-то как-то матчит, но в зависимости от treshold получается либо неприятно большое число false negatives, либо огромное число false positives. Мне кажется, что результаты можно как-то улучшить с помощью машинного обучения, но я почти не знаком с этой темой. Можете что-нибудь посоветовать, куда вообще копать?
Совет от кореша который занимается парсингом соц сетей: "Можно просто ебануть расстояние левенштейна или прогнать морфологический анализ при помощи какого-нибудь pymorphy и не ебать себе мозг нейросетями сложными."

Max
29.01.2019
12:17:09

Google

Terminator
29.01.2019
12:44:14
@vadimka4920 будет жить. Поприветствуем!

Tishka17
29.01.2019
12:48:39
@pytest.mark.usefixtures
а чет не понимаю как это юзать.
Вот у меня есть фикстура db_name, возвращает строку. Она уже юзается во всяких тестах и на оснвое нее строится соединение.
Теперь я хочу собрать suite, чтобы где-то перед запуском каждого теста создавалось соединение и клалось в атрибут класса. Как это сделать?

Andrew
29.01.2019
12:50:59

Tima
29.01.2019
12:51:28
У меня уже мозг взрывается, у меня есть многопоточный ехо сервер, класс EchoServer наследуется Thread(юзаю модуль threading), и когда я хочу чтобы программа завершилась я нажимаю ctrl+c и в программе пытаюсь ловить ексепшн KeyboardInterrupt, но в итоге ексепшн игнориться и выдает ошибку: "Exception ignored in: <module 'threading' from '/usr/lib/python3.6/threading.py'>", подскажите плз


Evgeniya
29.01.2019
12:51:37
#работа #вакансия #python #middle #Москва #офис #fulltime
Компания: Mos.ru
Город: Москва, м. Таганская, Марксистская, Китай-город
Формат: офис, фуллтайм
ЗП: 150-180 т.р. на руки
Что будем делать: разрабатывать инфраструктуру поиска (движок Elastic), настраивать подсистемы поиска, рефакторить код, переводить часть сервисов на асинхронщину.
Вы: разрабатываете веб-сервисы на Python 3+ не менее 1.5-2 лет, работали с очередями (Apache Kafka, RabbitMQ или что-то в этом духе), знаете про Docker не только в теории, имеете опыт работы с реляционными БД и покрываете свой код юнит-тестами.
Подробнее можно почитать тут: https://hh.ru/vacancy/29529736
Откликнуться: там же или @JaneProvotorova

Tishka17
29.01.2019
12:51:38

Alex
29.01.2019
12:52:54

Santiago
29.01.2019
12:53:00

Tishka17
29.01.2019
12:53:12

Alex
29.01.2019
12:53:20
так это с pytest

Tishka17
29.01.2019
12:53:26
хм

Tima
29.01.2019
12:53:29

Alex
29.01.2019
12:54:07

Google

Tishka17
29.01.2019
12:54:34
просто все доки какие-то наизнанку вывернутые

Alex
29.01.2019
12:54:53
вообще в стиле пайтест ты бы должен был сделать фикстуру, которая возвращает тебе подключение
но это не обязательно

Tishka17
29.01.2019
12:55:20
да хоть фикстуру, мне она нужна в одной сюите
не дублировать же в каждую функцию параметр

Santiago
29.01.2019
12:56:24

Andrew
29.01.2019
12:56:47

Tishka17
29.01.2019
12:56:56
порядок?
зачем мне порядок

Dark
29.01.2019
12:57:13
https://pastebin.com/nw5Q7qkP
подскажите пожалуйста, почему dlib ругается на установку либы?

Andrew
29.01.2019
12:57:41
зачем мне порядок
Ну при условной инициализации класса тестсюиты создать подключение не подходит?

Tishka17
29.01.2019
12:58:09
инициализации класса? нет, спасибо
пусть на каждый тест создает

Andrew
29.01.2019
12:58:21

Tishka17
29.01.2019
12:58:31
чтобы я мог если че в параллель запустить

Andrew
29.01.2019
12:58:44
это не мешает

Tishka17
29.01.2019
12:58:55
ну надо не в классе, а в объекте как минимум
и я хз, этот pytest создает ли объект сюиты на каждый тест или реюзает

Terminator
29.01.2019
12:59:30
@gorinars будет жить. Поприветствуем!

Tishka17
29.01.2019
13:00:33
короче, лучше сделать фикстуру, ок

Google

Terminator
29.01.2019
13:01:04
@Vladyslav1 будет жить. Поприветствуем!

Vladyslav
29.01.2019
13:01:42

Tishka17
29.01.2019
13:02:05
вроде да

Santiago
29.01.2019
13:02:11

Tishka17
29.01.2019
13:02:16
коннекшн может реально не закрыться, а вернуться в пул

Dark
29.01.2019
13:02:49

Terminator
29.01.2019
13:06:31
Ekaterina Lazareva будет жить. Поприветствуем!

Tima
29.01.2019
13:13:14

Student
29.01.2019
13:19:24
В питончике можно не использовать i = 0 и i += 1
Можно так:
for i, entry in enumerate(result):

Vladyslav
29.01.2019
13:19:56

Alex
29.01.2019
13:20:37
во-первых тебе надо узнать что нельзя использовать форматирование строк для запросов

Vladyslav
29.01.2019
13:21:06

Alex
29.01.2019
13:21:17
еще один

Tishka17
29.01.2019
13:21:44

Alex
29.01.2019
13:22:33
во-вторых использовал бы ты контекстные менеджеры, горя бы не знал

Jentry
29.01.2019
13:23:32

Dk
29.01.2019
13:24:15
https://habr.com/ru/post/321510/

Маришка
29.01.2019
13:24:16
where_value = "'DROP TABLE {table} —"
кхе

Admin
ERROR: S client not available

Student
29.01.2019
13:24:26
Лучше уже использовать ORM https://python-scripts.com/peewee а не писать самому запросы.

Google

Tishka17
29.01.2019
13:24:37
не надо рекомендовать ORM

Dk
29.01.2019
13:24:40

Tishka17
29.01.2019
13:24:48
он не всегда подходит

Terminator
29.01.2019
13:25:03
Sergey Zykin будет жить. Поприветствуем!

Student
29.01.2019
13:25:13

Terminator
29.01.2019
13:26:53
Алексей будет жить. Поприветствуем!

Tishka17
29.01.2019
13:30:21
??
Курсор очень даже надо закрывать
Если в пределах одного соединения юзаются несколько

Alex
29.01.2019
13:30:59
херню сказал

Tishka17
29.01.2019
13:31:01
Пока ты его не закроешь нельзя создавать новый с тем же именем, например

Pythonprogrammer
29.01.2019
13:31:16
Забаньте, прошу
Срочно

Николай
29.01.2019
13:32:22

Dmitry
29.01.2019
13:32:23
Не верьте, это небось его девушка пишет :)


Arseniy
29.01.2019
13:40:59
#работа Всем привет.
Ищу к себе в команду Behavox (www.behavox.com)
Senior Python ML Backend Engineer с нотками девопса и оттенками системного архитектора, желающего сделать жизнь команды Data Science проще и беззаботнее, а создаваемые командой сервисы - более надежными, быстрыми и легко масштабируемыми.
Офис на выбор: Спб: (м. Петроградская), Мск: (м. Войковская).
Релокация в Монреаль ~через 3-6 месяцев работы в компании.
Занимаемся
анализом разнообразных коммуникаций (аудио, текст, трейдинг) в т.ч. для compliance (детектирование нарушения финансовых регуляций), mifid (аналитика по трейдинговым данным), в целом комплексного анализа работы компании по данным коммуникаций сотрудников.
Задачи:
- улучшение бэкенда платформы аналитики. Оптимизация ML процессинга. Сейчас используем gunicorn с моделями tensorflow, keras, pytorch, xgboost, scikit-learn и т.п.
- разработка и поддержка микросервисной архитектуры (декомпозиция монолита и все, что с этим связано) - сейчас начинаем использовать mesos/docker для некоторых сервисов, в планах kubernetes и серьезные изменения архитектуры
- оптимизация взаимодействия java приложения и питон сервера
- улучшение механизмов мониторинга, A/B тестирования, онлайн обучения моделей, версионирования, и т.д.
- работа с базами данных, улучшение механизмов синхронизации сервисов
- работа над IDE для аналитиков (аналог google cloud ML / Amazon sagemaker, который ставится клиентам вместе с платформой)
Минимальные требования:
- опыт разработки питон бекэнда от 3 лет
- наличие набитых шишек при разработке и внедрении распределенных высоконагруженных сервисов на питоне
- базовые знания языка java или желание освоить
- опыт работы с базами данных MySQL / redis
- понимание стека Hadoop & Spark
Желательно также увидеть:
- опыт создания распределенных архитектур обработки данных с использованием ML
- опыт программирования на C++, оборачивания C библиотек питоном
- опыт написание кода на cython
- базовые знания ML библиотек
- опыт работы с DevOps инфраструктурой (Ansible, jenkins, AWS, Docker)
- опыт работы, или понимание принципов таких продуктов, как Google cloud ML, AWS Sagemaker, IBM Watson Studio, etc.
От нас:
- Официальное трудоустройство
- З/П белая в зависимости от опыта: 190 000 - 290 000 руб/мес (Gross).
- ДМС после испытательного срока (3 мес)
- Уютный и просторный офис
- Возможность как углубиться в область, так и поработать с другими компонентами системы (коллектив открытый, система сильно горизонтальная)
- Релокация в Монреаль через 3-6 месяцев работы в компании. Полное сопровождение процесса релокации от компании для всей семьи сотрудника (визы, билеты, жилье на первое время и помощь с поиском своего, релокационный бонус и многое другое). ЗП после - от 100 000 CAD Gross в год (подробнее лучше обсудить с HR)
Ссылка на описание вакансии на HH: https://hh.ru/vacancy/28929024
Если появятся вопросы - постараюсь ответить я, или наш HR Екатерина (ekaterina.lazareva@behavox.com).
После собеседования с HR будет собеседование с Chief Data Scientist, затем нужно выполнить тестовое задание и пройти финальное собеседование с технической командой.


Philipp
29.01.2019
13:53:53
Подскажите пожалуйста, что я делаю не так?
Как добиться того, чтобы у меня были 2 разные фигуры?
#opencv2

Tishka17
29.01.2019
13:55:25
как узнать на маке, откуда взялся файл /usr/local/bin/py.test?

Provotok [Воркаю]
29.01.2019
13:56:03

Google

Provotok [Воркаю]
29.01.2019
13:56:08
Посмотри сам файл.
cat /path/to/file/

Tishka17
29.01.2019
13:56:18
ну я хочу его снести и поставить для тетьего