Andrii
01, 0011, 000111, 00001111, 0000011111, ...— классический пример того, чего не может регэксп
Andrii
а что с этим нужно сделать на регексах?
Просто написать regexp, который будет определять, строка удовлетворяет этому паттерну или нет. Вначале идут n нулей, потом n единиц
Тумаш
Люди можете сказать по братске, чем отличаются спецификаторы доступа, от модефикаторов доступа.
Адъютант
Адъютант
Господи все просто
Адъютант
вот тебе и текст в миллионе твоих дивов
Andrii
pattern = "<div>[\w]{.*}<div>" re.findall(pattern, test)
Он поймайет <div></div></div>
Адъютант
Он поймайет <div></div></div>
все кроме спецсимволов a-z
Адъютант
не важно
Адъютант
не придирайся
Адъютант
это не сложно
Адъютант
для этого и есть регексп
Andrii
все кроме спецсимволов a-z
Тогда не поймает <div><div></div></div>
Dmitry
https://t.me/joinchat/VzPl53V0dWY1MmMy
Адъютант
зачем ему дивы
Адъютант
ему текст нужен
Виталик Голоенко
Andrii
зачем ему дивы
Задача: найти regexp, коотрый прочитает innerHTML для заданного div. Она нерешаема
Адъютант
Адъютант
я уверен что есть возможность
Igor
Он поймайет <div></div></div>
Это еще пол беды :) вам еще нужно будет комментарии обрабатывать :)
Andrii
Конвертишь строку в нужные нули и единицы - ищешь по этой конвертации
Можно и без регэкспов всё написать. Любой рекурсивный спуск
Igor
писать парсинг на regex это онанизм
Dmitry
Что это?
Ссылка
Адъютант
Можно и без регэкспов всё написать. Любой рекурсивный спуск
регексп тебе найдет нужный текст нужной длины
Andrii
Это еще пол беды :) вам еще нужно будет комментарии обрабатывать :)
Коментарии как раз можно получить регэкспом, это не проблема
Виталик Голоенко
Ссылка
Зачем?
Andrii
писать парсинг на regex это онанизм
Regex используются как лексеры
Адъютант
если тебе нужен стандартизированный тип типа рсс то очень помогает
Igor
комменты внутри тега комментов
вы устаните подобные вещи описывать
Roman
Никто не проходил тесты на типы личности? А то Джордана Питерсона насмотрелся, стало интересно
Igor
давайте вы напишете регекс который обработает таги и мы попробуем его сломать уверен ломаться он будте гораздо проще чем писаться
Адъютант
вы устаните подобные вещи описывать
если ты хочешь спарсить весь интернет то да. А если тебе нужны ссылки на картинки, то ре.файндолл тебе найдет все твои ахрефы
Roman
Этож фигня-_-
ну типа ДА) но если есть кейсы, то интересно
Igor
Тогда давайте натреним уже неронку, пусть машины будут этим сексом трахатся
для этого есть специализированные библиотеки я думаю это тот случай когда велосипед неуместен
Andrii
если ты хочешь спарсить весь интернет то да. А если тебе нужны ссылки на картинки, то ре.файндолл тебе найдет все твои ахрефы
Ой, я лучше по DOM пройдуешь в Selenium. Протому что ссылки на картинки могут быть динамические. Но твоё решение всё равно частное, оно будет работать, но если сайт захочет тебя обмануть, то обманет. Например, <script>var s = '<a href="google.com">la-la-la</a>;
Igor
да кстати regex жадный <div> <\div> <div> <\div> найдет не два дива а один со внутрянкой <\div> <div> как с этим предлагаете бороться?
Адъютант
ну я бы не взялся спарсить картинки регексом сколько он займет?
html = requests.get("blablabla.net") pattern = 'href[\S]{.*}=[\S]{.*}"[\w]{.*}' result = re.findall(html, pattern).group(0)
Igor
отсеивай ифами
начинаааается :)
Andrii
Есть жадный .*, есть нежадный. .*? Но... Проще говоря, если есть текст <div><div></div></div></div> то мы может получить или три закрывающих дива, либо один. Но не два :)
Igor
как будто в селениум тебе не надо регексами юзатся?
конечно нет он будет по дому ходить
Адъютант
но я бы постарался найти
Igor
хз, мне щас лень это решать
вопрос не в решать или не решать вопрос в том что все подводные камни учесть будет очень сложно
Andrii
но я бы постарался найти
Есть математическая теорема, что нельзя. Поэтом не найдёшь
Степан
Ситуация значит Перехожу в 11 класс, хочу стать программистом. Учился в Яндекс Лицее(работали с Python, Flask, PyQt, Telegram), всё очень понравилось и понял что моё. Сейчас стоит вопрос о том, куда дальше и что делать. Проблема вся в том, что нет желания идти на вышку, платить деньги тоже, ума не хватает при всем желании. Нахожусь в регионе в котором никаких перспектив и прочее. Самому хочется чему-то научиться, но при всём этом не хватает силы воли. Кто может также сталкивался с такими сложностями в профессии и что с этим делать, когда хочется, но не можется. Осознания дальнейших планов на жизнь нет, просто нет слов.
Адъютант
Адъютант
Dr1ver
тупа в аквапарк попал
Dr1ver
Когда лектор МГУ отвечает на вопрос: сколько будет 15 процентов из 100 - 12,5. Ну вы уж простите, кхм...
Dr1ver
Когда лектор МГУ отвечает на вопрос: сколько будет 15 процентов из 100 - 12,5. Ну вы уж простите, кхм...
Хахах. Скорее всего, да. Есть видеоролик у Понасенкова, можно найти отрывок. Он же сам в МГУ учился
Виталик Голоенко
Dr1ver
За этот же год можно, по сути, столько сделать, если не дрочить это ЕГЭ, а про 4 года и не пишу даже
Адъютант
Из соцсетей столько инфы прокачивают шо там вся жизнь у людей с прошлого поколения за год пролетает
Адъютант
Обычный - из шараги универа и тд
Адъютант
это плохо ?)
это прекрасно. Тебе не нужно задрачиватся пере преподом
Адъютант
Ты делаешь и валидация - твои результаты в практике
Dr1ver
Я бы задолбался ехать в этот центр Питера, 2 часа туда-обратно. С ума сойти можно. 4 часа только дорога!