@ru_python

Страница 2334 из 9768
melancholiac
24.02.2017
13:19:00
просто отсекай строку до конца начиная с / и :

Johnnie
24.02.2017
13:19:19
Urlparse

https://docs.python.org/3.0/library/urllib.parse.html

Sergey❄️
24.02.2017
13:25:45
Привет

Google
Проксимов
24.02.2017
13:30:03
офк
Получилось))

word = re.sub(r"(<a href=(\'|\"))|((\'|\")*></a>)|(\w*(://))|((/|:)[a-zA-Z0-9\"\']*)","",word)

достаточно простая регулярка

melancholiac
24.02.2017
13:30:43
йоптыть

Проксимов
24.02.2017
13:39:32
****,не работает чёто

Задание:Вашей программе на вход подается ссылка на HTML файл. Вам необходимо скачать этот файл, затем найти в нем все ссылки вида <a ... href="..." ... > и вывести список сайтов, на которые есть ссылка. Сайтом в данной задаче будем называть имя домена вместе с именами поддоменов. То есть, это последовательность символов, которая следует сразу после символов протокола, если он есть, до символов порта или пути, если они есть, за исключением случаев с относительными ссылками вида <a href="../some_path/index.html">. Сайты следует выводить в алфавитном порядке. Пример HTML файла: <a href="http://stepic.org/courses"> <a href='https://stepic.org'> <a href='http://neerc.ifmo.ru:1345'> <a href="ftp://mail.ru/distib" > <a href="ya.ru"> <a href="www.ya.ru"> <a href="../skip_relative_links"> Пример ответа: mail.ru neerc.ifmo.ru stepic.org www.ya.ru ya.ru

Вот мой говнокод: http://pastebin.com/uaQAcKTv

Но при проверке у меня wrong answer

melancholiac
24.02.2017
13:44:05
****,не работает чёто
Что пишет? PerlException: ваш код переполнен перлом, питон отказался его запускать?

Проксимов
24.02.2017
13:44:27
пишет неправильный ответ

валидация

на сайте

melancholiac
24.02.2017
13:45:02
и все?

Google
melancholiac
24.02.2017
13:45:40
а в терминале все ок?

Проксимов
24.02.2017
13:46:04
Да

melancholiac
24.02.2017
13:47:01
а ты на интупе/оутпете не проебался?

Проксимов
24.02.2017
13:48:38
Может проблема в 6-8 строке?

Vaderoff
24.02.2017
13:48:48
Помогите плз

Привет, парсер выводит повторяющееся товары, как сделать чтобы он их пропускал?

http://pastebin.com/r7FrqRP2

Проксимов
24.02.2017
13:49:49
а ты на интупе/оутпете не проебался?
а хз, в терминале всё правильно

melancholiac
24.02.2017
13:53:10
Проксимов
24.02.2017
13:56:04
Капец, помогите кто-нибудь

))))

сложно

melancholiac
24.02.2017
13:57:14
юрлпарс выше советовали

пробовал?

Vaderoff
24.02.2017
14:00:16
добавлять их в сет, например?
Если в сет добавляю, то у меня просто все название по буквам раскладывается, не совсем понимаю что внутрь set добавлять, можешь пояснить на моем примере? Код я скинул

melancholiac
24.02.2017
14:01:11
s = {} s.append(smth)

Проксимов
24.02.2017
14:01:23
Вроде проблема в регулярке

Она не до конца отрабатывает

Google
Vladimir
24.02.2017
14:03:05
s = {} s.append(smth)
s.add(smth) это же set

Vaderoff
24.02.2017
14:05:25
пишет что dict не имеет атрибута add или append

Pavel
24.02.2017
14:05:40
.update

Vaderoff
24.02.2017
14:08:08
вот такое выдает dictionary update sequence element #0 has length 1; 2 is required

arisu
24.02.2017
14:08:49
what

Люди находят в питоне что-то новое для меня

Никогда не видел такой ошибки

Василий
24.02.2017
14:16:06
Добрый день всем, кто-нибудь может помочь с установкой pyqt5 под третий питон? У меня при установке ошибка c SIP: " Could not find a version that satisfies the requirement sip>=4.19.1 (from pyqt5) (from versions: ) No matching distribution found for sip>=4.19.1 (from pyqt5) "

Проксимов
24.02.2017
14:16:42
Короч, нужна регулярка для проверки строки на урлу

У кого есть?

b0g3r
24.02.2017
14:17:11
melancholiac
24.02.2017
14:17:39
b0g3r
24.02.2017
14:17:50
так может посмотреть задания и видеолекции до?

b0g3r
24.02.2017
14:18:32
в конце концов, вроде бы в этом и есть задание, в чем смысл готового ответа?

Maksim
24.02.2017
14:19:27
это ты все еще тег вытаскиваешь?

Проксимов
24.02.2017
14:20:38
так может посмотреть задания и видеолекции до?
Ой да ладно, думаешь я не смотрел

b0g3r
24.02.2017
14:20:59
Google
Проксимов
24.02.2017
14:21:11
Тупо про requests

b0g3r
24.02.2017
14:21:25
кидай

Проксимов
24.02.2017
14:22:32
лекции?

b0g3r
24.02.2017
14:27:40
ага

ссылку на урок

Admin
ERROR: S client not available

Проксимов
24.02.2017
14:30:50
тем регаться нужно чтобы посмотреть

b0g3r
24.02.2017
14:30:58
пугаешь?

Проксимов
24.02.2017
14:33:34
https://stepik.org/lesson/%D0%9E%D0%B1%D0%B7%D0%BE%D1%80%D0%BD%D0%BE-%D0%BE%D0%B1-%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%D0%B5-http-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D1%8B-html-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D1%8B-%D0%B8-requests-24471/step/5?course=Python-%D0%BE%D1%81%D0%BD%D0%BE%D0%B2%D1%8B-%D0%B8-%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5&unit=6780

лови

Тёма
24.02.2017
14:35:59
Ребят, может кто воообще совсем на пальцах объяснить что такое вейвлет-преобразование? В сравнении с fft Для человека, который так и не смог в матан

Сорри за очередной оффтоп, просто вообще хз куда еще спрашивать такие вещи

Maxim
24.02.2017
14:37:13
https://habrahabr.ru/post/168517/

не?

Maxim
24.02.2017
14:37:20
как раз на пальцах))

Тёма
24.02.2017
14:37:39
https://habrahabr.ru/post/168517/
Мне в контексте звука бы(

Artem
24.02.2017
14:37:55
http://math.stackexchange.com/questions/279980/difference-between-fourier-transform-and-wavelets а тут ответ вроде без супер матана

Проксимов
24.02.2017
14:40:57
Помогите, регулярка(search), которая будет искать тег a в тексте

Google
melancholiac
24.02.2017
14:41:35
юрлпарс выше советовали

пробовал?

Проксимов
24.02.2017
14:42:11
Да мне регуляркой нада

melancholiac
24.02.2017
14:42:32
<a href=(\S+)\s*>

вроде так

Maxim
24.02.2017
14:44:08
https://mathiasbynens.be/demo/url-regex

Artem
24.02.2017
14:46:35
Помогите, регулярка(search), которая будет искать тег a в тексте
html не надо парсить регулярками, это плохая практика

Maxim
24.02.2017
14:46:49
у него квест такой

Проксимов
24.02.2017
14:47:09
<a href=(\S+)\s*>
так ещё между a и href может быть куча мусора типа класса и тд

Artem
24.02.2017
14:49:49
r'<a .*?>'

Проксимов
24.02.2017
14:51:09
Это я уже понял

осталось понять как из этого

<a id="top"></a> <td colspan="5" class="menutop"><a class="menutop" href="../information/index.html">Information</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../subregions/index.html">Subregions</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../regional/index.html">Regional Contest</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../past/index.html">Past</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../contacts/index.html">Contacts</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../links/index.html">Links</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../oc/index.html">Organizing Committee</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="http://neerc.ifmo.ru/forum">Forum</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/index.html">Home</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/about.html">About NEERC</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/contest-rules.html">Contest rules</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/selection-rules.html">Selection rules</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/bank.html">Bank information</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/registration-rules.html">Registration rules</a></td> <td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/calendar.html">Calendar</a></td> <a href="http://icpc.baylor.edu/acmicpc/">ACM International <a href="http://www.ifmo.ru/" target="_top">St.Petersburg Russia the Siberian group at <a href="http://oasis.secna.ru/" target="_top">Altai State Technical University</a> was organized <a href="http://www.gtu.edu.ge/index_e.htm" target="_top">Georgian Technical University</a>,

вытащить все домены

Ioann
24.02.2017
14:54:20
Проксимов
24.02.2017
14:54:29
Я уже стал тупить, как удалить все символы до href

Страница 2334 из 9768