@ru_python

« Назад

Страница 6867 из 9768

Далее »

Маришка

28.10.2018
12:23:15

//td[contains(@class, "cer-4")].text Опять вы с ебучими регулярками для хтмл, нельзя хпатх взять?

Nikolay

28.10.2018
12:23:16

Far Cry 5

Iliya

28.10.2018
12:23:57

точку-то экранировать нужно

не, мне же надо число, оно там не целое, потом я просто во float(regout[0]) и получаю значение для расчетов

?? Eugene

28.10.2018
12:24:17

не, мне же надо число, оно там не целое, потом я просто во float(regout[0]) и получаю значение для расчетов

все верно, точку нужно экранировать

Google

?? Eugene

28.10.2018
12:24:26

иначе найдешь 123a1234

хотя в твоем случае, вряд ли такое встретится, но все же, это неправильно)

Iliya

28.10.2018
12:25:26

все верно, точку нужно экранировать

?? Eugene

28.10.2018
12:25:58

ну поставь 3%7634

Nikolay

28.10.2018
12:26:22

Bs4

?? Eugene

28.10.2018
12:26:26

а еще твой вариант не найдет целые числа

да

Маришка

28.10.2018
12:26:53

Всем привет, что-то я запустался в регулярке Надо простое действие В этой строке <td class="cer-4">3.7634</td> Хочу получить только 3.7634 Делаю так r'<td class=\"cer-4\">\d*</td>' Не получается, пробовал и w и c чтобы потом конвернтну во float но никак Подскажите пожалуйста, в чем ошибка

У тебя есть хтмл и ты его парсишь регулярками? Чем тебе не понравился хпатх?

?? Eugene

28.10.2018
12:27:28

У тебя есть хтмл и ты его парсишь регулярками? Чем тебе не понравился хпатх?

мне не понравился хпатх :<

благо есть bs4

Iliya

28.10.2018
12:27:55

хпатх -это что

Маришка

28.10.2018
12:29:51

хпатх -это что

язык запросов к дереву [X]HTML грубо говоря

Iliya

28.10.2018
12:30:14

язык запросов к дереву [X]HTML грубо говоря

уже нашел :) https://stackoverflow.com/questions/11465555/can-we-use-xpath-with-beautifulsoup

Google

?? Eugene

28.10.2018
12:30:15

реально, с bs4 это выглядело бы так: soup.find("td", {"class": "cer-4"}).get_text()

Маришка

28.10.2018
12:30:27

//td[contains(@class, "cer-4")]/text()

Iliya

28.10.2018
12:30:58

реально, с bs4 это выглядело бы так: soup.find("td", {"class": "cer-4"}).get_text()

ну это красивый суп ставить надо :)

?? Eugene

28.10.2018
12:31:11

ну это красивый суп ставить надо :)

ага, лучше в регулярки упарываться

Маришка

28.10.2018
12:31:41

ага, лучше в регулярки упарываться

https://stackoverflow.com/a/1732454

?? Eugene

28.10.2018
12:32:17

https://stackoverflow.com/a/1732454

читал)

столько боли в одном сообщении

Iliya

28.10.2018
12:34:07

https://stackoverflow.com/a/1732454

Да, тоже читал раньше :) но блин тут дело на 2 сек, курс валюты цепануть, это я для себя скриптец накидал для простоты расчетов

Маришка

28.10.2018
12:35:36

Да, тоже читал раньше :) но блин тут дело на 2 сек, курс валюты цепануть, это я для себя скриптец накидал для простоты расчетов

>>> from lxml import etree >>> elem = etree.fromstring('<td class="cer-4">3.7634</td>') >>> elem.xpath('//td[contains(@class, "cer-4")]/text()') ['3.7634'] >>>

?? Eugene

28.10.2018
12:35:40

Да, тоже читал раньше :) но блин тут дело на 2 сек, курс валюты цепануть, это я для себя скриптец накидал для простоты расчетов

Так все и начинается. А потом уходишь в запой

bs4 все-таки лучше, хпатх нечитаем

Iliya

28.10.2018
12:36:40

Не поверите, но я еще и строку получаю requests.get().text

Маришка

28.10.2018
12:37:27

Не поверите, но я еще и строку получаю requests.get().text

ой

?? Eugene

28.10.2018
12:37:51

Не поверите, но я еще и строку получаю requests.get().text

дело твоё, как говорится =)

Iliya

28.10.2018
12:38:25

bs4 все-таки лучше, хпатх нечитаем

Согласен, даже в этом примере elem.xpath('//td[contains(@class, "cer-4")]/text()') не совсем все понятно....что за text()

Маришка

28.10.2018
12:38:47

текст элементов td которые имеют класс "cer-4"

Nikolay

28.10.2018
12:39:01

Xpath

Iliya

28.10.2018
12:39:33

дело твоё, как говорится =)

какие есть предложения, сделать это лучше, проще, быстрее? Просто это была первая мысль, так и реализовал

?? Eugene

28.10.2018
12:39:51

какие есть предложения, сделать это лучше, проще, быстрее? Просто это была первая мысль, так и реализовал

вот тебе уже два предложения поступило

Iliya

28.10.2018
12:40:05

Как парсить HTML на python bs4, xpath, lxml Из этого я беру красивый суп :) Сохраню на память

Google

Nikolay

28.10.2018
12:40:17

Wargaming из Белоруссии

Маришка

28.10.2018
12:40:26

ну у lxml есть parse

?? Eugene

28.10.2018
12:40:29

Wargaming из Белоруссии

ну

Маришка

28.10.2018
12:40:30

который сразу сайт может читать

?

28.10.2018
12:43:06

Wargaming из Белоруссии

Там Женёк

Маришка

28.10.2018
12:43:26

Как парсить HTML на python bs4, xpath, lxml Из этого я беру красивый суп :) Сохраню на память

>>> import lxml.html >>> doc = lxml.html.parse('http://google.com') >>> doc <lxml.etree._ElementTree object at 0x019809E0> >>> doc.xpath('//input') [<InputElement 39625d0 name='ie' type='hidden'>, <InputElement 3962600 name='hl' type='hidden'>, <InputElement 3962630 name='source' type='hidden'>, <InputElement 3962660 name='biw' type='hidden'>, <InputElement 3962690 name='bih' type='hidden'>, <InputElement 39626c0 name='q' type='text'>, <InputElement 39626f0 name='btnG' type='submit'>, <InputElement 3962720 name='btnI' type='submit'>, <InputElement 3962750 name='gbv' type='hidden'>] >>>

Sergey

28.10.2018
12:43:57

который сразу сайт может читать

то есть без запроса к нему через реквестс какой нибудь ?

?? Eugene

28.10.2018
12:44:45

ну это интересно

если простенький парсер, без пост запросов, хидеров, форм, проксей и всего остального

Маришка

28.10.2018
12:46:15

то есть без запроса к нему через реквестс какой нибудь ?

сообщением выше посмотри

Sergey

28.10.2018
12:56:02

сообщением выше посмотри

?

Iliya

28.10.2018
13:22:34

>>> import lxml.html >>> doc = lxml.html.parse('http://google.com') >>> doc <lxml.etree._ElementTree object at 0x019809E0> >>> doc.xpath('//input') [<InputElement 39625d0 name='ie' type='hidden'>, <InputElement 3962600 name='hl' type='hidden'>, <InputElement 3962630 name='source' type='hidden'>, <InputElement 3962660 name='biw' type='hidden'>, <InputElement 3962690 name='bih' type='hidden'>, <InputElement 39626c0 name='q' type='text'>, <InputElement 39626f0 name='btnG' type='submit'>, <InputElement 3962720 name='btnI' type='submit'>, <InputElement 3962750 name='gbv' type='hidden'>] >>>

Попробовал поиграться с lxml....вообще ничего не выходит.... Ни с etree ни с html.parse

Nikolay

28.10.2018
13:23:03

1. Завозишь lxml; 2. Завозишь BS4. 3. Используешь lxml как бекенд для BS4

lxml можно заменить builtin html.parser

?? Eugene

28.10.2018
13:23:54

1. Завозишь lxml; 2. Завозишь BS4. 3. Используешь lxml как бекенд для BS4

Таки да, лучший вариант)

Nikolay

28.10.2018
13:24:17

Iliya

28.10.2018
13:24:23

1. Завозишь lxml; 2. Завозишь BS4. 3. Используешь lxml как бекенд для BS4

а, так их в паре с BS4 надо юзать? А я пробовал только с import lxml

Nikolay

28.10.2018
13:24:35

а, так их в паре с BS4 надо юзать? А я пробовал только с import lxml

Документация BS4

Можно css селекторами вытягивать, можно xpath пути

можно вообще что-то вроде .find('div', attr={'id': 'block'})

Google

Nikolay

28.10.2018
13:26:08

Я использую css селекторы и через select(...) & select_one(...)

Iliya

28.10.2018
13:26:57

Понял, тогда буду читать, спасибо за разъяснение

Mike

28.10.2018
13:40:41

Поставил питон 3.6 на linux в google cloud, перезапустил консоль, а его уже нет. Почему так, не подскажите?

Admin

ERROR: S client not available

Nikolay

28.10.2018
13:45:42

как перезапустил? хост тот же?

Mike

28.10.2018
13:50:13

как перезапустил? хост тот же?

Закрыл браузер, через несколько часов открыл

Nikolay

28.10.2018
13:50:39

?

28.10.2018
13:52:30

Закрыл браузер, через несколько часов открыл

надо было через день открыть, а не через несколько часов?

Тимофей

28.10.2018
13:53:09

help

что делать с этой ошибкой ?

устанавливал библиотеку pygame

вышла эта ошибка

Винни

28.10.2018
13:53:52

попробуй в конце добавить --user

но у меня чот пуинсталлер из-за этого юзера из консоли не вызывается

мудачество

Тимофей

28.10.2018
13:55:04

не

не помогает

Mike

28.10.2018
13:55:25

надо было через день открыть, а не через несколько часов?

?

Alexander

28.10.2018
13:57:18

что делать с этой ошибкой ?

ебать

Google

Alexander

28.10.2018
13:57:22

юзер поруски

поруски убери удали

Тимофей

28.10.2018
13:57:56

?

нормально скажи что сдлеать можно

не понял что сказал ты

Alexander

28.10.2018
13:58:20

не понял что сказал ты

Тима

папки по русски не называй

глянь путь

он ебанулся на кириллице

Nikolay

28.10.2018
13:58:52

Ты что не в России?

Какой еще английский

Alexander

28.10.2018
13:59:10

Ты что не в России?

я патриот Росси

слава России

Тимофей

28.10.2018
13:59:18

а как это мешает то ?

« Назад

Страница 6867 из 9768

Далее »

Открыть в Telegram