Pavel
хотя это всё уже набило оскомину, вопрос выглядит как XY problem
Tishka17
Я пишу библиотеку для фильтрации мата: https://github.com/rominf/profanity-filter Я кеширую цензурированные слова. Решил добавить новую возможность - получение слова, из-за которого слово было зацензурировано (например: sh1t -> `shit`). Чтобы сделать красиво, решил использовать dataclasses: @dataclass(frozen=True) class CensoredWord: word: str censored: str original_profane_word: str Можно сделать словарь из слова, на которое сработал фильтр, на CensoredWord. Но я тут подумал: может быть есть решение, которое позволит сделать что-то вроде: censored_words = DataclassesCollection(CensoredWord, indexes=['word', 'original_profane_word']) censored_words.search(word='sh1t') # [CensoredWord(word='sh1t', censored='****', original_profane_word='shit')] censored_words.search(original_profane_word='shit') # [CensoredWord(word='sh1t', censored='****', original_profane_word='shit')] Вообще, эта штука ещё может уметь делать MongoDB-style запросы, но мне это не надо. Я погуглил, но ничего такого не нашёл. Я плохо искал или такая штука никому не нужна?
вот вопрос, а оно умеет фильтровать мат тиа "Х-У-Й"?
Ilya
в i что будет?
дллинное имя файла, в котором возможно есть имя нужного мне девайса А у меня только имена девайсов и нуджны файлы с этих девайсов Вот пример i NAME5_stats_20190523_114000_MSK_5_5.csv а у меня есть только NAME5 А файлов много например до NAME100, а мне надо только 1,13,5,24 к примеру
Tishka17
Да.
мм
Tishka17
Да.
спасибо
Denis
есть функция имитирующая работу функции сплит. как сделать чтобы в случае если на вход подается пустая строка функция возвращала пустую строку? def split(s, sep = string.whitespace): words = [] word = [] for c in s: if c not in sep: word.append(c) else: if word: words.append(''.join(word)) word = [] if word: words.append(''.join(word)) return words
Ilya
давай-ка тогда объясни что ты вообще пытаешься добиться
у меня есть список с именами фалов Там есть нудные мне фалы в имени которых есть имена нужных мне устройств и я хочу эти имена файлов(в имени которых нужные мне девайсы) записать в другой список ну и есть список с нужными устройствами Пока работает очень уродливо с конструкцией if ('dev_name1' in i) or ('dev_name2' in i) or
Roman
спасибо
Но вот б л я не умеет пока. Хочу добавить это, а так же срабатывание на: вы уху ели?
Roman
Но вот б л я не умеет пока. Хочу добавить это, а так же срабатывание на: вы уху ели?
И вообще ориентироваться на звуковую похожесть в том числе: с помощью простого Левенштейна не выловить йопаный по оригинальному слову (слишком много отличий), а по звучанию можно.
Pavel
metaphone или что-то в этом духе
Roman
metaphone или что-то в этом духе
Ну это достаточно примитивный алгоритм и только для латиницы, насколько я помню.
Roman
вот это не смотрел? https://github.com/elastic/elasticsearch-analysis-phonetic
Нет, спасибо. Но я уже знаю, как реализовать. Пробовал руками и работает.
Roman
вот это не смотрел? https://github.com/elastic/elasticsearch-analysis-phonetic
Java не интересно. Я хотел по максимуму на готовом выехать.
Tishka17
да там похоже тупо
Roman
да там похоже тупо
Если тупо, значит плохо работает. Хорошие алгоритмы достаточно сложны. Тем более, если на много языков.
Tishka17
ну я гланул сорцы, как будто тупо таблица замен для английского
Pavel
Если тупо, значит плохо работает. Хорошие алгоритмы достаточно сложны. Тем более, если на много языков.
есть мнение, что алгоритмы под разные языки скорее всего должны отличаться
SHADRIN
есть сайт melbet.com
Ооооо я в доль и поперек пропарсил в свое время этот сайт
Roman
ну я гланул сорцы, как будто тупо таблица замен для английского
Ну мне надо на много языков. Да и неизвестно, справляется ли оно с doom, door.
Pavel
soundex не катит?
для саундекса, как и для метафона, транслитерируют в ингриш предварительно
Pavel
это, конечно же, сильно бьёт по точности
Tishka17
для саундекса, как и для метафона, транслитерируют в ингриш предварительно
https://github.com/roddar92/russian_soundex/blob/master/fonetika/soundex.py вроде нет
Roman
soundex не катит?
Нет. Забей, я уже нашёл хорошее решение для кучи языков, просто руки не доходят.
Ilya
any((x in i) for x in blablabla)
что-то не понимаю В общем постараюсь точнее описать проблему Есть два списка Первый: ['NAME5_stats_20190523_114000_MSK_5_5.csv', 'NAME67_stats_20190523_114000_MSK_5_5.csv', 'NAME22_stats_20190523_114000_MSK_5_5.csv'] Второй: ['NAME67'] Мне надо получить новый список с элементом 'NAME67_stats_20190523_114000_MSK_5_5.csv'
Tishka17
[ a for a in first if any(b in a for b in second) ]
Ilya
[ a for a in first if any(b in a for b in second) ]
да, оно работает, но я не понимаю как Читаю про функцию any() но понятнее не стало, она вроде True \ False
Ilya
[ a for a in first if any(b in a for b in second) ]
часть понимаю добавляем в лист элемент из первого листа если True - которое должно вернуть any() а в any() тоже происходит дествие Перечитал еще пару раз пока печатал сообщение вроде доходит В any() делается таже проверка что и делал я if name in file_name, а вот что затуп вызвало, так это определение b в твоем коде так как оно идет после использования b==name и мы идем по списку с именами В общем мозгодробительно, но интересно Спасибо
Anonymous
Добрый день друзья. Хочу с нуля научиться программировать, мне 28 лет. С чего начать, может быть кто то обучает?
Дмитрий
Всем привет! Перевожу один небольшой проект с flask на aiohttp, микросервис-апи к паре таблиц в постгре. В инете нашел советы вместо psycopg взять asyncpg - есть ли в этом смысл?
koder
ну ты же все равно не можешь использовать синхронный драйвер из асинхронного кода эффективно
Eugene
Добрый день друзья. Хочу с нуля научиться программировать, мне 28 лет. С чего начать, может быть кто то обучает?
Это точно не здесь...для начала определись - для какой цели тебе нужен язык...а потом заходишь на рутрекер и качаешь курс по душе....
Tishka17
это что на рутрекере, книжки или дамп степика?
Eugene
Co(n)stantine👨‍🔬
💰
Eugene
это что на рутрекере, книжки или дамп степика?
Щас вышел крутой кус у udemy - питон для пентестинга...стоящая вещь..
Дмитрий
aiopg это асинхронная обёртка над psycopg, так что на неё можно посмотреть
не, вопрос скорее в том, насколько оправданнее будет переходить на асинхронный драйвер в целом. я пока в этой теме второй день только разбираюсь (проект не особо нагруженный, так что перевожу скорее чтоб разобраться - благо время есть), примерно понял какие плюсы у асинхронной обработки запросов, теперь хочется как-то понять, насколько синхронные походы в БД это все затормозят
Ivan
ну смотри - пока у тебя приложение будет ходить базу, всё остальное приложение работать не будет в это время
Ivan
и параллельно будет обрабатываться только один запрос к базе
Дмитрий
все
Дмитрий
понял
Дмитрий
потому что в запросе к БД нет переключений контекста
Maria_rm
Всем привет! Напомню, что уже в эту субботу (25 мая) в Воронеже будет открытый митап по Machine Learning. 👉🏼 Если бы искусственный интеллект писал бы сценарий “Игры Престолов”, кого бы он посадил на Железный Трон? Обсудим это, и другие возможности искусственного интеллекта и особенности его обучения на митапе. ✅ Участие бесплатное, но просим вас зарегистрироваться заранее (зал не резиновый) Кроме докладов каждого ждёт вкуснейшая 🍕, а самые активные участники митапа получат подарки от партнеров Организаторы: Компании Evrone.com и DataArt
Дмитрий
соотв нет возможности пустить на выполнение другой поток
Дмитрий
спасибо всем)
Andrew
Кто-то работал с TurboGears?
Andrew
Окей Расскажите, пожалуйста, сильно ли отличаются в пользовании Django, TurboGears и DRF и какой из них больше подойдет для бэкенда для мобильного приложения?
fs
Привет всем, нужно на flask использовать autoindex, и при выборе в autoindex какого-то текстового файлика обработать его самым flask-ом, например открыть другую страницу и загрузить этот файлик в какой-то блок, вопрос, есть ли вообще такая возможность? или AutoIndex(app, browse_root=os.path.curdir, add_url_rules=True) Не предоставляет такой возможности? не могу понять как выбраный файлик передать flask-у на обработку...
A
Господа, чем данные сгенерировать тестовые? названия, адреса, ИНН, ОКПО
Dmitry
Щас вышел крутой кус у udemy - питон для пентестинга...стоящая вещь..
а какой именно, там их несколько можешь кинуть ссылку?
Dmitry
Щас вышел крутой кус у udemy - питон для пентестинга...стоящая вещь..
этот https://www.udemy.com/python-for-offensive-security-practical-course/ ?
Andrew
TurboGears разве не отдельно от джанги?
Отдельно. Мне и интересно, какой из них все же стоит выбрать
Andrew
Приложение предназначено для большого кол-ва юзеров и работы с объёмной базой
SHADRIN
.
Tishka17
хз даже
Tishka17
я бы ручками при таком написал
Andrew
Ручками это каким образом?
Andrew
Сокеты?
Tishka17
а, не
Tishka17
ну взял бы что-то максимально тупое
Tishka17
даже без ОРМ, если надо оптимизировать