
John
07.03.2017
16:12:15
Не спешу пока там некоторый хаос с заданиями, к концу недели гляну, вдруг что-то исправят
Формулировки например

Sergey
07.03.2017
16:13:10

John
07.03.2017
16:15:33

Google

Sergey
07.03.2017
16:16:31

UnkownUSR
07.03.2017
16:32:03
Как из списка вида <img src="http://www.example.ru/risn/12.jpg"/> удалить всё, чтобы осталось только http://www.example.ru/risn/12.jpg ?
Верней для каждого элемента списка

John
07.03.2017
16:34:00
re.

Маришка
07.03.2017
16:35:38
lxml ?

UnkownUSR
07.03.2017
16:36:29
bs4

Маришка
07.03.2017
16:36:51
А оно тебе зачем

wf
07.03.2017
16:37:01

UnkownUSR
07.03.2017
16:37:19
Есть какая-то альтернатива?

stonepig
07.03.2017
16:37:35
черещ get

Denis
07.03.2017
16:37:57
.split('"')[1]

Маришка
07.03.2017
16:38:00

Google

stonepig
07.03.2017
16:38:11
get("src")
циклом для каждого элемента
el.get("src")

UnkownUSR
07.03.2017
16:40:00

Маришка
07.03.2017
16:40:07
А вообще была такая ерунда в другом чатике, но там было лишь задание использовать re, и пришли к этой ерунде в итоге r"://([^/]*?)(?::\d+)?/"

stonepig
07.03.2017
16:40:12
покажи список

wf
07.03.2017
16:41:41
Регулярки медленно работают
str = '<img src="http://www.example.ru/risn/12.jpg"/><img src="http://www.example.ru/risn/12.jpg"/><img src="http://www.example.ru/risn/12.jpg"/><img src="http://www.example.ru/risn/12.jpg"/><img src="http://www.example.ru/risn/12.jpg"/><img src="http://www.example.ru/risn/12.jpg"/><img src="http://www.example.ru/risn/12.jpg"/>'
def findall(str):
result = []
p = 0
while True:
s = str.find(' src="', p)
if s >= 0:
e = str.find('"', s+6)
p = e + 1
result.append(str[s+6:e])
else:
break
return result
print findall(str)

Denis
07.03.2017
16:42:01
Ууу, второй питон


UnkownUSR
07.03.2017
16:42:11
<img alt="ÐÑÑÑие, ÑамÑе ÑÑÑекÑивнÑе диеÑÑ Ð´Ð»Ñ Ð¿Ð¾Ñ
ÑдениÑ" src="http://example.com/_Wra5A7aOaPU/TNSuMIZG8vI/AAAAAAAAIUU/B7vIpoAJa7I/s400/baked-apples.jpg"/>
<img src="http://example.com/wp-content/uploads/2014/08/getty_rf_photo_of_mature_co.jpg"/>
<img src="http://example.com/images/434/1.jpg"/>
<img src="http://example.com/556/412/745/-449996978-1sefbnd-jjpkm1k4eh7pqbk/preview/avatar.jpg"/>
<img src="http://example.com/better/images/5086579.png"/>
<img src="http://example.com/images/attach/c/8/99/272/99272442_dff88df5941c391bf9e5c846c6bc011d.jpg"/>
<img src="http://example.com/misc/i/gallery/22797/773357.jpg"/>
<img src="http://example.com/risn/12.gif"/>
<img src="http://example.com/wp-content/uploads/2015/08/Ananas_2-e1441005021878-340x252.jpg"/>
<img src="http://example.com/images/attach/c/0/120/856/120856192_37208161.jpg"/>
<img src="http://example.com/upload/medialibrary/56b/56b5add53569136a46b2ba41fb6f50c0.jpg"/>
<img src="http://example.com/images/attach/c/11/115/949/115949621_1.jpg"/>
Вот список
На кодировку сбитую не смотрите


stonepig
07.03.2017
16:42:29

wf
07.03.2017
16:42:40

Маришка
07.03.2017
16:42:42

stonepig
07.03.2017
16:42:48
если не найдешь решения

melancholiac
07.03.2017
16:43:07
а норм если вместо кода квадратики?

Pavel
07.03.2017
16:43:25


melancholiac
07.03.2017
16:44:04
дыа

Google

melancholiac
07.03.2017
16:44:11
десктоп версия

Denis
07.03.2017
16:44:20
УМВР

UnkownUSR
07.03.2017
16:44:20

Pavel
07.03.2017
16:44:25
дыа
Шрифты какие-нибудь поставить надо.

melancholiac
07.03.2017
16:44:31

Маришка
07.03.2017
16:44:54

Pavel
07.03.2017
16:45:01

Маришка
07.03.2017
16:45:11
И да щас бы build-in типу задавать значение

wf
07.03.2017
16:45:30

melancholiac
07.03.2017
16:45:36
чертовы квадратики

Denis
07.03.2017
16:45:54

Pavel
07.03.2017
16:46:04

Маришка
07.03.2017
16:46:19

wf
07.03.2017
16:46:20

Pavel
07.03.2017
16:46:45

UnkownUSR
07.03.2017
16:46:51

wf
07.03.2017
16:47:18

UnkownUSR
07.03.2017
16:47:42
Ну так что, есть еще альтернативы?

Маришка
07.03.2017
16:47:58
Модули

Google

Маришка
07.03.2017
16:48:05
bs4 lxml

wf
07.03.2017
16:48:26

UnkownUSR
07.03.2017
16:48:56

Pavel
07.03.2017
16:49:20
Определенно
Это же html
И что? Кавычки вообще не обязательны если значение из одного слова, а одинарныевсе или двойные - не факт

UnkownUSR
07.03.2017
16:50:57

Pavel
07.03.2017
16:51:00
почему?
>>> re.search('a.*c', 'abbbbcbbbc').group()
'abbbbcbbbc'
>>> re.search('a.*?c', 'abbbbcbbbc').group()
'abbbbc'

wf
07.03.2017
16:51:54

Admin
ERROR: S client not available

wf
07.03.2017
16:52:42
во!

Pavel
07.03.2017
16:52:50
жадное - жрём всё что есть. Антоним к жадности - non greedy

wf
07.03.2017
16:53:12

Igor
07.03.2017
16:55:03
или ленивость, такк привычней, да

Pavel
07.03.2017
16:55:28
ленность :)
ну ленивость же вообще из другой оперы, вы что.

Igor
07.03.2017
17:00:13
почему?
а ниче, что non-greedy так и называется, lazy?

Pavel
07.03.2017
17:01:07

Igor
07.03.2017
17:01:13
да много где :)

Google

Igor
07.03.2017
17:01:26
http://www.regular-expressions.info/repeat.html
например

Aleksey
07.03.2017
17:02:09
Как из Чубайса сделать ide
Из сублайма*

Denis
07.03.2017
17:02:38
Из Чубайса никак

Igor
07.03.2017
17:02:46

Denis
07.03.2017
17:02:53
А из саблайма не надо

Pavel
07.03.2017
17:03:02
ленивые вычисления - это ленивые вычисления, жадные регекспы - это жадные/не жадные, зачем смешивать два понятния — не ясно. похоже, в английском вообще слова кончаются.

Aleksey
07.03.2017
17:03:31
Спасибо

Igor
07.03.2017
17:05:31
ну, то есть, может действительно это не самое лучшее определение для такого поведения в регекспах, но оно уж точно устоявшееся

Pavel
07.03.2017
17:07:08
да, был не прав.

wf
07.03.2017
17:07:19
хз, каждый называет как ему удобно ))
я лично жадные и ленивые

Pavel
07.03.2017
17:07:47

wf
07.03.2017
17:08:36
есть еще "ревнивые"

Igor
07.03.2017
17:09:40
>>> re.match('A++')
Exception: ОПЯТЬ ТЫ С ЭТОЙ ШЛЮХОЙ ДА?

Johnnie
07.03.2017
17:13:06
BitchException

Igor
07.03.2017
17:21:31
@eliners лан, серьезно, давай здесь

UnkownUSR
07.03.2017
17:21:44
Ок

Igor
07.03.2017
17:21:54
участок в квадратных скобках называется "списковое выражение", оно же list comprehension
у тебя там было где-то в коде
for img in soup.find_all('img'):
Эта группа больше не существует