
Маришка
28.10.2018
12:23:15
//td[contains(@class, "cer-4")].text
Опять вы с ебучими регулярками для хтмл, нельзя хпатх взять?

Nikolay
28.10.2018
12:23:16
Far Cry 5

Iliya
28.10.2018
12:23:57

?? Eugene
28.10.2018
12:24:17

Google

?? Eugene
28.10.2018
12:24:26
иначе найдешь 123a1234
хотя в твоем случае, вряд ли такое встретится, но все же, это неправильно)

Iliya
28.10.2018
12:25:26

?? Eugene
28.10.2018
12:25:58
ну поставь 3%7634

Nikolay
28.10.2018
12:26:22
Bs4

?? Eugene
28.10.2018
12:26:26
а еще твой вариант не найдет целые числа
да

Маришка
28.10.2018
12:26:53

?? Eugene
28.10.2018
12:27:28
благо есть bs4

Iliya
28.10.2018
12:27:55
хпатх -это что

Маришка
28.10.2018
12:29:51

Iliya
28.10.2018
12:30:14

Google

?? Eugene
28.10.2018
12:30:15
реально, с bs4 это выглядело бы так:
soup.find("td", {"class": "cer-4"}).get_text()

Маришка
28.10.2018
12:30:27
//td[contains(@class, "cer-4")]/text()

Iliya
28.10.2018
12:30:58

?? Eugene
28.10.2018
12:31:11

Маришка
28.10.2018
12:31:41

?? Eugene
28.10.2018
12:32:17
столько боли в одном сообщении

Iliya
28.10.2018
12:34:07

Маришка
28.10.2018
12:35:36

?? Eugene
28.10.2018
12:35:40
bs4 все-таки лучше, хпатх нечитаем

Iliya
28.10.2018
12:36:40
Не поверите, но я еще и строку получаю requests.get().text

Маришка
28.10.2018
12:37:27

?? Eugene
28.10.2018
12:37:51

Iliya
28.10.2018
12:38:25

Маришка
28.10.2018
12:38:47
текст элементов td которые имеют класс "cer-4"

Nikolay
28.10.2018
12:39:01
Xpath

Iliya
28.10.2018
12:39:33

?? Eugene
28.10.2018
12:39:51

Iliya
28.10.2018
12:40:05
Как парсить HTML на python
bs4, xpath, lxml
Из этого я беру красивый суп :)
Сохраню на память

Google

Nikolay
28.10.2018
12:40:17
Wargaming из Белоруссии

Маришка
28.10.2018
12:40:26
ну у lxml есть parse

?? Eugene
28.10.2018
12:40:29

Маришка
28.10.2018
12:40:30
который сразу сайт может читать

?
28.10.2018
12:43:06

Маришка
28.10.2018
12:43:26
Как парсить HTML на python
bs4, xpath, lxml
Из этого я беру красивый суп :)
Сохраню на память
>>> import lxml.html
>>> doc = lxml.html.parse('http://google.com')
>>> doc
<lxml.etree._ElementTree object at 0x019809E0>
>>> doc.xpath('//input')
[<InputElement 39625d0 name='ie' type='hidden'>, <InputElement 3962600 name='hl' type='hidden'>, <InputElement 3962630 name='source' type='hidden'>, <InputElement 3962660 name='biw' type='hidden'>, <InputElement 3962690 name='bih' type='hidden'>, <InputElement 39626c0 name='q' type='text'>, <InputElement 39626f0 name='btnG' type='submit'>, <InputElement 3962720 name='btnI' type='submit'>, <InputElement 3962750 name='gbv' type='hidden'>]
>>>

Sergey
28.10.2018
12:43:57

?? Eugene
28.10.2018
12:44:45
ну это интересно
если простенький парсер, без пост запросов, хидеров, форм, проксей и всего остального

Маришка
28.10.2018
12:46:15

Sergey
28.10.2018
12:56:02

Iliya
28.10.2018
13:22:34

Nikolay
28.10.2018
13:23:03
1. Завозишь lxml; 2. Завозишь BS4. 3. Используешь lxml как бекенд для BS4
lxml можно заменить builtin html.parser

?? Eugene
28.10.2018
13:23:54

Nikolay
28.10.2018
13:24:17

Iliya
28.10.2018
13:24:23

Nikolay
28.10.2018
13:24:35
Можно css селекторами вытягивать, можно xpath пути
можно вообще что-то вроде .find('div', attr={'id': 'block'})

Google

Nikolay
28.10.2018
13:26:08
Я использую css селекторы и через select(...) & select_one(...)

Iliya
28.10.2018
13:26:57
Понял, тогда буду читать, спасибо за разъяснение

Mike
28.10.2018
13:40:41
Поставил питон 3.6 на linux в google cloud, перезапустил консоль, а его уже нет. Почему так, не подскажите?

Admin
ERROR: S client not available

Nikolay
28.10.2018
13:45:42
как перезапустил? хост тот же?

Mike
28.10.2018
13:50:13

Nikolay
28.10.2018
13:50:39
?

?
28.10.2018
13:52:30

Тимофей
28.10.2018
13:53:09
help
что делать с этой ошибкой ?
устанавливал библиотеку pygame
вышла эта ошибка

Винни
28.10.2018
13:53:52
попробуй в конце добавить --user
но у меня чот пуинсталлер из-за этого юзера из консоли не вызывается
мудачество

Тимофей
28.10.2018
13:55:04
не
не помогает

Mike
28.10.2018
13:55:25

Alexander
28.10.2018
13:57:18

Google

Alexander
28.10.2018
13:57:22
юзер поруски
поруски убери удали

Тимофей
28.10.2018
13:57:56
?
нормально скажи что сдлеать можно
не понял что сказал ты

Alexander
28.10.2018
13:58:20
папки по русски не называй
глянь путь
он ебанулся на кириллице

Nikolay
28.10.2018
13:58:52
Ты что не в России?
Какой еще английский

Alexander
28.10.2018
13:59:10
слава России

Тимофей
28.10.2018
13:59:18
а как это мешает то ?