
melancholiac
24.02.2017
13:19:00
просто отсекай строку до конца начиная с / и :

Johnnie
24.02.2017
13:19:19
Urlparse
https://docs.python.org/3.0/library/urllib.parse.html

Sergey❄️
24.02.2017
13:25:45
Привет

Google

Проксимов
24.02.2017
13:30:03
word = re.sub(r"(<a href=(\'|\"))|((\'|\")*></a>)|(\w*(://))|((/|:)[a-zA-Z0-9\"\']*)","",word)
достаточно простая регулярка

melancholiac
24.02.2017
13:30:43
йоптыть


Проксимов
24.02.2017
13:39:32
****,не работает чёто
Задание:Вашей программе на вход подается ссылка на HTML файл.
Вам необходимо скачать этот файл, затем найти в нем все ссылки вида <a ... href="..." ... > и вывести список сайтов, на которые есть ссылка.
Сайтом в данной задаче будем называть имя домена вместе с именами поддоменов. То есть, это последовательность символов, которая следует сразу после символов протокола, если он есть, до символов порта или пути, если они есть, за исключением случаев с относительными ссылками вида
<a href="../some_path/index.html">.
Сайты следует выводить в алфавитном порядке.
Пример HTML файла:
<a href="http://stepic.org/courses">
<a href='https://stepic.org'>
<a href='http://neerc.ifmo.ru:1345'>
<a href="ftp://mail.ru/distib" >
<a href="ya.ru">
<a href="www.ya.ru">
<a href="../skip_relative_links">
Пример ответа:
mail.ru
neerc.ifmo.ru
stepic.org
www.ya.ru
ya.ru
Вот мой говнокод: http://pastebin.com/uaQAcKTv
Но при проверке у меня wrong answer


melancholiac
24.02.2017
13:44:05

Проксимов
24.02.2017
13:44:27
пишет неправильный ответ
валидация
на сайте

melancholiac
24.02.2017
13:45:02
и все?

Google

melancholiac
24.02.2017
13:45:40
а в терминале все ок?

Проксимов
24.02.2017
13:46:04
Да

melancholiac
24.02.2017
13:47:01
а ты на интупе/оутпете не проебался?

Проксимов
24.02.2017
13:48:38
Может проблема в 6-8 строке?

Vaderoff
24.02.2017
13:48:48
Помогите плз
Привет, парсер выводит повторяющееся товары, как сделать чтобы он их пропускал?
http://pastebin.com/r7FrqRP2

Проксимов
24.02.2017
13:49:49

Maxim
24.02.2017
13:52:47

melancholiac
24.02.2017
13:53:10

Roman
24.02.2017
13:53:27

Проксимов
24.02.2017
13:56:04
Капец, помогите кто-нибудь
))))
сложно

melancholiac
24.02.2017
13:57:14
юрлпарс выше советовали
пробовал?

Vaderoff
24.02.2017
14:00:16
добавлять их в сет, например?
Если в сет добавляю, то у меня просто все название по буквам раскладывается, не совсем понимаю что внутрь set добавлять, можешь пояснить на моем примере? Код я скинул

melancholiac
24.02.2017
14:01:11
s = {}
s.append(smth)

Проксимов
24.02.2017
14:01:23
Вроде проблема в регулярке
Она не до конца отрабатывает

Google

Vladimir
24.02.2017
14:03:05

Vaderoff
24.02.2017
14:05:25
пишет что dict не имеет атрибута add или append

Pavel
24.02.2017
14:05:40
.update

Vaderoff
24.02.2017
14:08:08
вот такое выдает dictionary update sequence element #0 has length 1; 2 is required

arisu
24.02.2017
14:08:49
what
Люди находят в питоне что-то новое для меня
Никогда не видел такой ошибки

Василий
24.02.2017
14:16:06
Добрый день всем, кто-нибудь может помочь с установкой pyqt5 под третий питон? У меня при установке ошибка c SIP: "
Could not find a version that satisfies the requirement sip>=4.19.1 (from pyqt5) (from versions: )
No matching distribution found for sip>=4.19.1 (from pyqt5)
"

Проксимов
24.02.2017
14:16:42
Короч, нужна регулярка для проверки строки на урлу
У кого есть?

b0g3r
24.02.2017
14:17:11

melancholiac
24.02.2017
14:17:39

b0g3r
24.02.2017
14:17:50
так может посмотреть задания и видеолекции до?

arisu
24.02.2017
14:18:16
На самом деле нет

b0g3r
24.02.2017
14:18:32
в конце концов, вроде бы в этом и есть задание, в чем смысл готового ответа?

Maksim
24.02.2017
14:19:27
это ты все еще тег вытаскиваешь?

Василий
24.02.2017
14:20:14

Проксимов
24.02.2017
14:20:38

b0g3r
24.02.2017
14:20:59

Google

Проксимов
24.02.2017
14:21:11
Тупо про requests

b0g3r
24.02.2017
14:21:25
кидай

Проксимов
24.02.2017
14:22:32
лекции?

b0g3r
24.02.2017
14:27:40
ага
ссылку на урок

Admin
ERROR: S client not available

Проксимов
24.02.2017
14:30:50
тем регаться нужно чтобы посмотреть

b0g3r
24.02.2017
14:30:58
пугаешь?

Проксимов
24.02.2017
14:33:34
https://stepik.org/lesson/%D0%9E%D0%B1%D0%B7%D0%BE%D1%80%D0%BD%D0%BE-%D0%BE%D0%B1-%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%D0%B5-http-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D1%8B-html-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D1%8B-%D0%B8-requests-24471/step/5?course=Python-%D0%BE%D1%81%D0%BD%D0%BE%D0%B2%D1%8B-%D0%B8-%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5&unit=6780
лови

Тёма
24.02.2017
14:35:59
Ребят, может кто воообще совсем на пальцах объяснить что такое вейвлет-преобразование?
В сравнении с fft
Для человека, который так и не смог в матан
Сорри за очередной оффтоп, просто вообще хз куда еще спрашивать такие вещи

Maxim
24.02.2017
14:37:13
https://habrahabr.ru/post/168517/
не?

melancholiac
24.02.2017
14:37:18

Maxim
24.02.2017
14:37:20
как раз на пальцах))

Тёма
24.02.2017
14:37:39

Artem
24.02.2017
14:37:55
http://math.stackexchange.com/questions/279980/difference-between-fourier-transform-and-wavelets а тут ответ вроде без супер матана

Тёма
24.02.2017
14:38:11

Проксимов
24.02.2017
14:40:57
Помогите, регулярка(search), которая будет искать тег a в тексте

Google

melancholiac
24.02.2017
14:41:35
юрлпарс выше советовали
пробовал?

Проксимов
24.02.2017
14:42:11
Да мне регуляркой нада

melancholiac
24.02.2017
14:42:32
<a href=(\S+)\s*>
вроде так

Maxim
24.02.2017
14:44:08
https://mathiasbynens.be/demo/url-regex

Artem
24.02.2017
14:46:35

Maxim
24.02.2017
14:46:49
у него квест такой

Проксимов
24.02.2017
14:47:09

Artem
24.02.2017
14:49:49
r'<a .*?>'


Проксимов
24.02.2017
14:51:09
Это я уже понял
осталось понять как из этого
<a id="top"></a>
<td colspan="5" class="menutop"><a class="menutop" href="../information/index.html">Information</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../subregions/index.html">Subregions</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../regional/index.html">Regional Contest</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../past/index.html">Past</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../contacts/index.html">Contacts</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../links/index.html">Links</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="../oc/index.html">Organizing Committee</a><img src="../img/p.gif" width="12" height="1" alt=""><a class="menutop" href="http://neerc.ifmo.ru/forum">Forum</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/index.html">Home</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/about.html">About NEERC</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/contest-rules.html">Contest rules</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/selection-rules.html">Selection rules</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/bank.html">Bank information</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/registration-rules.html">Registration rules</a></td>
<td class="menuleftbullet"><img alt="*" height="10" width="10" src="../img/d.gif"></td><td class="menuleft"><a class="menuleft" href="../information/calendar.html">Calendar</a></td>
<a href="http://icpc.baylor.edu/acmicpc/">ACM International
<a href="http://www.ifmo.ru/" target="_top">St.Petersburg
Russia the Siberian group at <a href="http://oasis.secna.ru/" target="_top">Altai State Technical University</a> was organized
<a href="http://www.gtu.edu.ge/index_e.htm" target="_top">Georgian Technical University</a>,
вытащить все домены


Ioann
24.02.2017
14:54:20

Проксимов
24.02.2017
14:54:29
Я уже стал тупить, как удалить все символы до href