@ru_python

Страница 2335 из 9768
Artem
24.02.2017
14:55:26


Artem
24.02.2017
14:56:48
Я уже стал тупить, как удалить все символы до href
изи же {urlparse(x.group(1)).netloc for x in re.finditer(r'href="(.+?)"', data)}

Игорь
24.02.2017
14:57:12
CthUlhUzzz
24.02.2017
14:59:19
"http://([^/]*)/"
"https?://([^/]+)"

Google
Ioann
24.02.2017
14:59:39
хорошая идея, но мне нужно регуляркой
я как-то давно вот так делал вроде работало re.findall('href="(http://.+?)"', content)

Игорь
24.02.2017
15:00:07
Проксимов
24.02.2017
15:00:22
Спасибо, я знаю

Игорь
24.02.2017
15:00:57
я как-то давно вот так делал вроде работало re.findall('href="(http://.+?)"', content)
Так все найдет, начиная от первого http и до конца

Ioann
24.02.2017
15:01:48
Так все найдет, начиная от первого http и до конца
помоему там нет, там не жадный алгоритм

надо проверить

но раньше работало

Проксимов
24.02.2017
15:04:09
"http://([^/]*)/"
Вот только они с чего угодно начинаться могут

с www, ftp

Ок я немного подколдавал и вроде всё работает

Отлично

2 тест пройден

b0g3r
24.02.2017
15:34:24
в алфавитном порядке выводишь?

Google
b0g3r
24.02.2017
15:36:54
<li><a href="http://redir.rbc.ru/cgi-bin/redirect.cgi?http://hc.ru/ru/">Хостинг</a></li> <li><a href="http://www.m-2.ru/">M2</a></li> <a target="_top" href="http://banner.rbc.ru/banredir.cgi?lid=firstpage_left" empty="true" style="display:none"></a></div> <li><a href="http://www.biztorg.ru/search.shtml?cfg=biztorg&type=S">Предложения о продаже</a></li> <li><a href="http://biztorg.ru:80/main_services_new.shtml">Оценка бизнеса</a></li> <a href="http://static.feed.rbc.ru/rbc/internal/rss.rbc.ru/rbcdaily.ru/mainnews.rss" class="flRight small" style="margin:0 0 0 5px;">

banner.rbc.ru biztorg.ru redir.rbc.ru static.feed.rbc.ru www.biztorg.ru www.m-2.ru

Проксимов
24.02.2017
15:38:56
Да в алфавитном

Уже без понятия в чём проблема

http://pastebin.com/uaQAcKTv

Вссё переписал

b0g3r
24.02.2017
15:41:17
проверь тест сверху

Проксимов
24.02.2017
15:41:38
ща

gjntcnbk

Маришка
24.02.2017
15:45:31
Такс, ребята. Кто теперь может зачитать лекцию про регулярки :D

Проксимов
24.02.2017
15:45:43
Проверил

Aragaer
24.02.2017
15:45:46
а чо там зачитывать?

есть токены, есть квантификаторы

Проксимов
24.02.2017
15:46:05
banner.rbc.ru почему то не выводит

I
24.02.2017
15:46:06
Строишь конечный автомат

Aragaer
24.02.2017
15:46:12
есть сопоставление, есть захват

I
24.02.2017
15:46:12
И все Оки

Потом упрощаешь

Проксимов
24.02.2017
15:48:00
выводит

Google
Проксимов
24.02.2017
15:49:39
Но тест всё равно не проходит

{jnz cnjg

не выводит biztorg.ru

b0g3r
24.02.2017
15:54:09
Проксимов
24.02.2017
15:54:19
?

re.findall(r"://([^/:]*)/"

arisu
24.02.2017
15:54:58
Проксимов
24.02.2017
15:55:49
чего

Aragaer
24.02.2017
15:56:01
чопарсим?

Проксимов
24.02.2017
15:56:01
эта регулярка не пропускает с портом

но если убрать двоеточие

то пропустит

Проксимов
24.02.2017
15:56:25
но порт не уберёт

re.findall(r"://([^/]*)/"

как тогда убрать порт

re.findall(r"://([^/]*)(\|:)"

так жалуется на ошибку

Igor
24.02.2017
16:00:23
а че те сматчить надо?

Aragaer
24.02.2017
16:00:26
:?

Igor
24.02.2017
16:00:27
хост только?

Google
arisu
24.02.2017
16:00:27
Попробуй без регулярок

Aragaer
24.02.2017
16:00:36
но вы да, скажите, что надо

arisu
24.02.2017
16:00:45
urlparse

Igor
24.02.2017
16:01:34
вот да, тоже хотел urlparse предложить

или urllib.parse

arisu
24.02.2017
16:01:53
Вечно какие-то решения уровня пхп

На регулярках

Igor
24.02.2017
16:02:13
уровня перл*

arisu
24.02.2017
16:02:35
ну пхп это ж перл для домашних страниц

Проксимов
24.02.2017
16:02:38
НУЖНЫ РЕГУЛЯРКИ

Admin
ERROR: S client not available

Igor
24.02.2017
16:02:53
НУЖНЫ РЕГУЛЯРКИ
ЗАЧЕМ? УСЛОВИЕ ЗАДАЧИ ТАКОЕ?

Проксимов
24.02.2017
16:02:57
сматчить домен

Igor
24.02.2017
16:02:59
ПОКАЖИ УСЛОВИЕ ЗАДАЧИ

Проксимов
24.02.2017
16:03:09
Игорь
24.02.2017
16:03:09
больше регулярок богу регулярок

Sergey❄️
24.02.2017
16:03:19
Чё такое регулярки

Igor
24.02.2017
16:03:27
Чё такое регулярки
регулярные выражения

какие условия на матчинг доменов? должен соответствовать рфц?

Проксимов
24.02.2017
16:03:31
Помогите. а то я сдохну скоро

Google
Sergey❄️
24.02.2017
16:03:40
регулярные выражения
Что такое регулярные выражения?

Игорь
24.02.2017
16:03:43
Чё такое регулярки
это женщины регулировщики

Igor
24.02.2017
16:03:46
melancholiac
24.02.2017
16:04:37
Проксимов
24.02.2017
16:05:03
кароч это хуита re.findall(r"://([^/]*)/" матчит <a href="http://redir.rbc.ru/cgi-bin/redirect.cgi?http://hc.ru/ru/"> <a href="http://www.m-2.ru/"> <a target="_top" href="http://banner.rbc.ru/banredir.cgi?lid=firstpage_left" empty="true" style="display:none"> <a href="http://www.biztorg.ru/search.shtml?cfg=biztorg&type=S"> <a href="http://biztorg.ru:80/main_services_new.shtml"> <a href="http://static.feed.rbc.ru/rbc/internal/rss.rbc.ru/rbcdaily.ru/mainnews.rss" class="flRight small" style="margin:0 0 0 5px;"> НО выводит banner.rbc.ru biztorg.ru:80 redir.rbc.ruhc.ru static.feed.rbc.ru www.biztorg.ru www.m-2.ru

Игорь
24.02.2017
16:05:06
прям Python_beginners какой-то

Igor
24.02.2017
16:05:28
Проксимов
24.02.2017
16:05:46
а мне нужно чтобы biztorg.ru выводился без :80

Что в регулярке нужно подправить

Игорь
24.02.2017
16:06:26
а мне нужно чтобы biztorg.ru выводился без :80
так добавь двоеточие в исключения

Aragaer
24.02.2017
16:06:40
(http|ftp)://([^/]+)(:\d+)?

Игорь
24.02.2017
16:06:52
Aragaer
24.02.2017
16:07:04
есть еще варианты user@host и еще user:password@host

но это для любителей

Igor
24.02.2017
16:07:46
://([^/]*?)(?::\d+)?/

так, как вариант

Проксимов
24.02.2017
16:08:02
так добавь двоеточие в исключения
АГа. Тогда не выведеться

Igor
24.02.2017
16:08:05
https://regex101.com/r/wfkiSt/1

Проксимов
24.02.2017
16:08:29
://([^/]*?)(?::\d+)?/
Помогло спс

Маришка
24.02.2017
16:08:44
Тааакс, а помогите тогда мне идиотке с регуляркой xd

Igor
24.02.2017
16:08:59
Тааакс, а помогите тогда мне идиотке с регуляркой xd
задавай вопрос сразу, че морозиться )

Проксимов
24.02.2017
16:09:44
Помогло спс
DA YOBANA/ с этим примером помогла два остальных которые раньше работали сломало

Как у меня горит

Страница 2335 из 9768