Roman
Оно даже так умеет (пример из README): pf.censor("Да бля, это просто shit какой-то!") # "Да ***, это просто **** какой-то!"Это притом, что слова shit нет в словаре русского мата.
Tigran
pf.censor("подстрахуй пока буду употреблять") # "подстра*** пока буду употре*****"
Roman
А вот буллщит не поймёт. В планах есть.
Roman
pf.censor("подстрахуй пока буду употреблять") # "подстра*** пока буду употре*****"
Это провакация! In [13]: pf.censor("подстрахуй пока буду употреблять") Out[13]: 'подстрахуй пока буду употреблять'
Tigran
я предположил. )
Tigran
а так мне, получается, достаточно склеивать слова, чтобы мат перестал палиться?
Roman
я предположил. )
У меня умный алгоритм. Я много предусмотрел.
Tishka17
Нет. Давай, скидывай примеры.
>>> pf.censor("трипиздоблядская") 'трипиздоблядская'
Roman
>>> pf.censor("сучечка на велосипедике") 'сучечка на велосипедике'
In [14]: pf.censor("сучечка на велосипедике") Out[14]: '******* на ************'
Tigran
жоска
SetazeR
многочлен
Pavel
бессмысленно и беспощадно (с)
Tishka17
У меня чёт не работает
Roman
>>> pf.censor("трипиздоблядская") 'трипиздоблядская'
In [15]: pf.censor_word('трипиздоблядская') Out[15]: Word(uncensored='трипиздоблядская', censored='****************', original_profane_word='пиздопляска')
Tigran
многочлен
и туда же «малочлен»
Roman
многочлен
Это словарное слово.
Crystal Melting Dot
Член не ругательство
Tigran
Это словарное слово.
одночлен, двучлен, трёхчлен тоже?
Roman
У меня чёт не работает
Плохо читал README. Там нетривиальная установка, к сожалению, пока.
Anonymous
Кто юзал pipenv? Поделитесь впечатлениями.
Tigran
СОЧЛЕНЕНИЕ???
Roman
СОЧЛЕНЕНИЕ???
Это нормальное слово.
Pavel
Кто юзал pipenv? Поделитесь впечатлениями.
своеобразно. удобненько, но с ростом числа либ превращается в слоупока на локе
Roman
словари поставил
Скинь сессию Python.
Tishka17
Плохо читал README. Там нетривиальная установка, к сожалению, пока.
$ python3 -m spacy download en ru Collecting ru Downloading https://files.pythonhosted.org/packages/37/5c/79825053daedfc6bc6baab82dbdb237703755cb0c0edc76bccbfcd0964be/ru-0.0.0.tar.gz Collecting en_core_web_sm==2.1.0 from https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.1.0/en_core_web_sm-2.1.0.tar.gz#egg=en_core_web_sm==2.1.0 Downloading https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.1.0/en_core_web_sm-2.1.0.tar.gz (11.1MB) 100% |████████████████████████████████| 11.1MB 14.7MB/s Installing collected packages: ru, en-core-web-sm Running setup.py install for ru ... done Running setup.py install for en-core-web-sm ... done Successfully installed en-core-web-sm-2.1.0 ru-0.0.0 ✔ Download and installation successful You can now load the model via spacy.load('en_core_web_sm') ✔ Linking successful /usr/local/lib/python3.7/site-packages/en_core_web_sm --> /usr/local/lib/python3.7/site-packages/spacy/data/en You can now load the model via spacy.load('en') $ python3 -m spacy download ru ✘ No compatible model found for 'ru' (spaCy v2.1.1).
Tishka17
ЧЯДНТ?
Tishka17
а
Roman
ЧЯДНТ?
Не читаешь README полностью. Там есть пример работы с русским языком.
Tishka17
у
Tishka17
installatyion - это оказывается только для английского
Roman
installatyion - это оказывается только для английского
Да. Я рассчитываю на большую часть аудитории.
Roman
installatyion - это оказывается только для английского
И да, хорошо бы сделать оглавление, чтобы можно было заметить, что там отдельно про русский написано.
Anonymous
poetry лучше!
похоже на pip-tools?
Roman
похоже на pip-tools?
Не знаю, что такое pip-tools. Могу только впечатлениями от pipenv и poetry поделиться.
Roman
И можно ещё Docker образ попробовать.
Tishka17
надо чинить feck и мопедики
NO
Народ, а подскажите, в pyqt можно сделать QMessageBox без кнопок?
Roman
а «хуепутало» работает? 🤔
In [18]: pf.censor_word('хуепутало') Out[18]: Word(uncensored='хуепутало', censored='*********', original_profane_word='хует')
SetazeR
хует?
Tigran
а что с original_profane_word? 🤔
м_м
хуемыслие хуенек хуеплёт хуерык хуесос хует
Roman
надо чинить feck и мопедики
Это проблема Hunspell словарей. Я не могу починить. Пользователь может передавать свои словари в конструктор.
м_м
словарь
SetazeR
хуемыслие - 1984 2.0
Roman
а что с original_profane_word? 🤔
Словарь мата использую чужой (см. README). Если бы этого слова не было, то оно сказало бы, что хуй. Я уверен.
Roma
когда дело касается матов - тут мы непобедимы)
Tishka17
А как насчёт "остопиздело"?
SetazeR
ога, неподебилы
Tishka17
Не уверен, куда ударение
SetazeR
я на и ставлю ударение
Roman
хуемыслие хуенек хуеплёт хуерык хуесос хует
Word(uncensored='хуемыслие', censored='*********', original_profane_word='хуемыслие') Word(uncensored='хуенек', censored='******', original_profane_word='хуенек') Word(uncensored='хуеплёт', censored='*******', original_profane_word='хуеплёт') Word(uncensored='хуерык', censored='******', original_profane_word='хуерык') Word(uncensored='хуесос', censored='******', original_profane_word='хуесос') Word(uncensored='хует', censored='****', original_profane_word='хует')
Roman
Извините, всё было в словаре. Но оно бы просто со словарём из хуй справилось бы.
Roman
А как насчёт "остопиздело"?
In [23]: pf.censor_word("остопиздело") Out[23]: Word(uncensored='остопиздело', censored='***********', original_profane_word='остопиздеть')
Tishka17
Круто
Vladimir
ещё в феврале они предлагали 4-5 тысяч :)
Но почему-то вакансия до сих пор не закрыта
м_м
Извините, всё было в словаре. Но оно бы просто со словарём из хуй справилось бы.
я словарь и смотрел. вижу MorphAnalyzer из pymorphy2, приводит слова к лемме (лемматизация) и работает уже далее.
Nikolay
Но почему-то вакансия до сих пор не закрыта
Потому что все скиловые работают
Roman
Так он из словаря и скопипастил
Ааа... Ну тогда всё ясно. У меня в планах интеллектуально уменьшить словарь. В идеале должно всё свестить к паре десятков слов.
Roman
Э! Я ожидал, что сейчас посмотрю, а у меня +10 звёздочек на GitHub по крайней мере. А нифига - ни одной новой :(
Anonymous
Подскажите пожалуйста, группу телеграмм для скачивания книг.
Tishka17
СКажите, а есть хоть одна прична делать select count…, и потом update если больше 0, вместо просто update?
Nikolay
Есть же штука в самой СУБД которая тайминг показывает
Nikolay
Может и есть кейсы, где это не связано со временем
Tishka17
нагуглил
Tishka17
если есть триггер на апдейт, он может выстрелить даже если ничего не обновлено