@ru_python

Страница 9721 из 9768
Проксимов
27.07.2019
17:25:59
Tishka17
27.07.2019
17:26:58
Ну так что в регулярке не так?
https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags

@moscowpythonconf
И такое есть

А. Уже была ссылка на со

Google
Shieldy
27.07.2019
17:32:33
Добро пожаловать, Sergey! Не забудь ознакомиться с правилами чата. https://t.me/ru_python/802295

Sergey
27.07.2019
17:35:41
Доброго вечера. Подскажите можно ли как то расшифровать данный фрагмент кода. Script = Огромное количество цифр и букв Exec_encoded(scrypt) Print (script) Или же способ и тип кодировки указан в другом файле которого у меня нет ?

Sergey
27.07.2019
17:37:49
А фото части кода можно?

Проксимов
27.07.2019
17:38:01
Alexander
27.07.2019
17:38:11
А фото части кода можно?
Лучше скриншот, конечно

Проксимов
27.07.2019
17:38:51
Alexander
27.07.2019
17:39:33
codephoto.ru
господи, это потрясно. Как вы это сделали?

Проксимов
27.07.2019
17:39:43
Tishka17
27.07.2019
17:40:03
господи, это потрясно. Как вы это сделали?
Я просто с зарплаты нанял индусов

Они сидят и фоткают

Google
Проксимов
27.07.2019
17:40:44
Да он врёт, там ардуинка и несколько мониторов

Tishka17
27.07.2019
17:41:58
:'-(

Не дают пошутить

Alexander
27.07.2019
17:42:32
:'-(
Только зачем там выбор языков, если ничего не меняется, кроме двух экранов?

Tishka17
27.07.2019
17:42:49
В смысле? Подсветка синтаксиса меняется

Sergey
27.07.2019
17:43:42


Проксимов
27.07.2019
17:45:49
Красава. Это весь код?

Tishka17
27.07.2019
17:46:32
Кажется нет

Там """ потерялись

Sergey
27.07.2019
17:47:00
Кажется нет
К сожалению весь не могу предоставить.

Там """ потерялись
В конце строки перер энкодом

Проксимов
27.07.2019
17:50:14
Попробуй нанять хакера9000

Но только в даркнете

?
27.07.2019
17:51:43
И такое есть
Как мне тогда вытащить текст через bs4 + чтобы в нем была сылка?

get_text() берет только текст, без <a>

Проксимов
27.07.2019
17:51:59
?
27.07.2019
17:52:11
Проксимов
27.07.2019
17:52:59
Как мне тогда вытащить текст через bs4 + чтобы в нем была сылка?
Обратится к документации? Я пока не вижу вопроса нормального. Что есть, что надо кратко опиши

Google
?
27.07.2019
17:54:00
Задача спарсить сайта с новостями текст статьи + вставить ссылки в формате <a href="URL">SOMETEXT</a> = SOMETEXT[URL]

Поэтому я и использовал регулярки

?
27.07.2019
17:55:58
Я то сам не знал

Да7

Думаю, ай да напишу сюда, пока доки читаю

через bs4 я могу либо взять href как атрибут и сохранить

Либо получить текст

А если у меня будет страница <a href="domain.com">SOMETEXTDUP</a>ANYTEXT SOMETEXTDUP

Shieldy
27.07.2019
17:57:22
Добро пожаловать, Ирина Юдина! Не забудь ознакомиться с правилами чата. https://t.me/ru_python/802295

?
27.07.2019
17:57:33
То я сохраню ссылку, и как мне узнать к какому из SOMETEXTDUP она относится?!

Yurii
27.07.2019
18:00:29
?
Всякое бывает

?
27.07.2019
18:00:40
Еще один самый умный :/

Yurii
27.07.2019
18:01:31
То я сохраню ссылку, и как мне узнать к какому из SOMETEXTDUP она относится?!
Сохраняй больше данных о ссылке, в чем проблема?

?
27.07.2019
18:01:53
Сохраняй больше данных о ссылке, в чем проблема?
Каких данных, дядя? У тебя есть текст ссылки и сама ссылка

после get_text() у тебя только текст

каких данных?!

Google
Yurii
27.07.2019
18:02:51
Есть текст, есть ссылка

Проксимов
27.07.2019
18:03:22
Тебе в @ru_python_beginners

?
27.07.2019
18:03:35
Словарь? Ебать
У тебя два одинаковых слова

и к одному из них привязана ссылка

после get_text остается только слово

Причем тут словарь?

Проксимов
27.07.2019
18:04:15
после get_text остается только слово
Что за хуйню ты несёшь...

?
27.07.2019
18:06:17
Что за хуйню ты несёшь...
Может действительно я не понимаю?

Проксимов
27.07.2019
18:06:24
?
27.07.2019
18:06:34
Вот у тебя есть страница https://pastebin.com/hEARZqfw В ней есть ссылки привязанные к словам

Проксимов
27.07.2019
18:06:39
Что мешает получить сначала ссылку, а потом текст?

?
27.07.2019
18:07:00
Что мешает получить сначала ссылку, а потом текст?
Ничего, но задача отформатировать текст так, чтобы было WORD[URL]

?
27.07.2019
18:07:22
А если будет 2 и более одинаковых WORD, то как мне явно указать, к какому из них принадлежит ссылка?

?
27.07.2019
18:08:06
И как эту проблему решает регулярка?
re.sub(r'<a href="([^\"]*)" [^>]+>([^</a>]+)</a>', r'\2[\1]', copy_item)

Но на выходе это уже не объект BS4, а тупо текст

И тогда приходится распарсивать все теги

чтобы засейвить ссылки

Google
?
27.07.2019
18:09:41
Теперь ты понял проблему?

Проксимов
27.07.2019
18:11:01
Нихуя не понял, сорри, щас не в состоянии вникать

Но я тебе гарантирую что всё можно сделать без регулярки просто подумав

?
27.07.2019
18:11:44
Ну вот я не смог додуматься

Как мне вытащить ссылку из текста и приклеить к слову, к которому эта ссылка относится

Только по регам

?
27.07.2019
18:12:35
И че мне это даст?

Ты чат читал выше?

Nikolay
27.07.2019
18:13:10
import bs4

Остальное сам читай в доке

?
27.07.2019
18:13:33
Остальное сам читай в доке
Круто, долго думал?

Nikolay
27.07.2019
18:13:50
Круто, долго думал?
Нет, просто вижу, что ты не умеешь документацию читать

Рекомендую попробовать ещё раз

Проксимов
27.07.2019
18:14:22
Ну вот я не смог додуматься
Попробуй отдохнуть. Потом попробуй метод уточки

Страница 9721 из 9768