@ru_python

Страница 6867 из 9768
Маришка
28.10.2018
12:23:15
//td[contains(@class, "cer-4")].text Опять вы с ебучими регулярками для хтмл, нельзя хпатх взять?

Nikolay
28.10.2018
12:23:16
Far Cry 5

Iliya
28.10.2018
12:23:57
точку-то экранировать нужно
не, мне же надо число, оно там не целое, потом я просто во float(regout[0]) и получаю значение для расчетов

Google
?? Eugene
28.10.2018
12:24:26
иначе найдешь 123a1234

хотя в твоем случае, вряд ли такое встретится, но все же, это неправильно)

?? Eugene
28.10.2018
12:25:58
ну поставь 3%7634

Nikolay
28.10.2018
12:26:22
Bs4

?? Eugene
28.10.2018
12:26:26
а еще твой вариант не найдет целые числа

да

?? Eugene
28.10.2018
12:27:28
благо есть bs4

Iliya
28.10.2018
12:27:55
хпатх -это что

Маришка
28.10.2018
12:29:51
хпатх -это что
язык запросов к дереву [X]HTML грубо говоря

Iliya
28.10.2018
12:30:14
язык запросов к дереву [X]HTML грубо говоря
уже нашел :) https://stackoverflow.com/questions/11465555/can-we-use-xpath-with-beautifulsoup

Google
?? Eugene
28.10.2018
12:30:15
реально, с bs4 это выглядело бы так: soup.find("td", {"class": "cer-4"}).get_text()

Маришка
28.10.2018
12:30:27
//td[contains(@class, "cer-4")]/text()

Iliya
28.10.2018
12:30:58
?? Eugene
28.10.2018
12:31:11
ну это красивый суп ставить надо :)
ага, лучше в регулярки упарываться

Маришка
28.10.2018
12:31:41
?? Eugene
28.10.2018
12:32:17
столько боли в одном сообщении

Iliya
28.10.2018
12:34:07
https://stackoverflow.com/a/1732454
Да, тоже читал раньше :) но блин тут дело на 2 сек, курс валюты цепануть, это я для себя скриптец накидал для простоты расчетов

Маришка
28.10.2018
12:35:36
Да, тоже читал раньше :) но блин тут дело на 2 сек, курс валюты цепануть, это я для себя скриптец накидал для простоты расчетов
>>> from lxml import etree >>> elem = etree.fromstring('<td class="cer-4">3.7634</td>') >>> elem.xpath('//td[contains(@class, "cer-4")]/text()') ['3.7634'] >>>

?? Eugene
28.10.2018
12:35:40
bs4 все-таки лучше, хпатх нечитаем

Iliya
28.10.2018
12:36:40
Не поверите, но я еще и строку получаю requests.get().text

?? Eugene
28.10.2018
12:37:51
Iliya
28.10.2018
12:38:25
bs4 все-таки лучше, хпатх нечитаем
Согласен, даже в этом примере elem.xpath('//td[contains(@class, "cer-4")]/text()') не совсем все понятно....что за text()

Маришка
28.10.2018
12:38:47
текст элементов td которые имеют класс "cer-4"

Nikolay
28.10.2018
12:39:01
Xpath

Iliya
28.10.2018
12:39:33
дело твоё, как говорится =)
какие есть предложения, сделать это лучше, проще, быстрее? Просто это была первая мысль, так и реализовал

Iliya
28.10.2018
12:40:05
Как парсить HTML на python bs4, xpath, lxml Из этого я беру красивый суп :) Сохраню на память

Google
Nikolay
28.10.2018
12:40:17
Wargaming из Белоруссии

Маришка
28.10.2018
12:40:26
ну у lxml есть parse

?? Eugene
28.10.2018
12:40:29
Маришка
28.10.2018
12:40:30
который сразу сайт может читать

?
28.10.2018
12:43:06
Маришка
28.10.2018
12:43:26
Как парсить HTML на python bs4, xpath, lxml Из этого я беру красивый суп :) Сохраню на память
>>> import lxml.html >>> doc = lxml.html.parse('http://google.com') >>> doc <lxml.etree._ElementTree object at 0x019809E0> >>> doc.xpath('//input') [<InputElement 39625d0 name='ie' type='hidden'>, <InputElement 3962600 name='hl' type='hidden'>, <InputElement 3962630 name='source' type='hidden'>, <InputElement 3962660 name='biw' type='hidden'>, <InputElement 3962690 name='bih' type='hidden'>, <InputElement 39626c0 name='q' type='text'>, <InputElement 39626f0 name='btnG' type='submit'>, <InputElement 3962720 name='btnI' type='submit'>, <InputElement 3962750 name='gbv' type='hidden'>] >>>

Sergey
28.10.2018
12:43:57
который сразу сайт может читать
то есть без запроса к нему через реквестс какой нибудь ?

?? Eugene
28.10.2018
12:44:45
ну это интересно

если простенький парсер, без пост запросов, хидеров, форм, проксей и всего остального

Маришка
28.10.2018
12:46:15
Nikolay
28.10.2018
13:23:03
1. Завозишь lxml; 2. Завозишь BS4. 3. Используешь lxml как бекенд для BS4

lxml можно заменить builtin html.parser

Nikolay
28.10.2018
13:24:17


Iliya
28.10.2018
13:24:23
1. Завозишь lxml; 2. Завозишь BS4. 3. Используешь lxml как бекенд для BS4
а, так их в паре с BS4 надо юзать? А я пробовал только с import lxml

Nikolay
28.10.2018
13:24:35
Можно css селекторами вытягивать, можно xpath пути

можно вообще что-то вроде .find('div', attr={'id': 'block'})

Google
Nikolay
28.10.2018
13:26:08
Я использую css селекторы и через select(...) & select_one(...)

Iliya
28.10.2018
13:26:57
Понял, тогда буду читать, спасибо за разъяснение

Mike
28.10.2018
13:40:41
Поставил питон 3.6 на linux в google cloud, перезапустил консоль, а его уже нет. Почему так, не подскажите?

Admin
ERROR: S client not available

Nikolay
28.10.2018
13:45:42
как перезапустил? хост тот же?

Mike
28.10.2018
13:50:13
как перезапустил? хост тот же?
Закрыл браузер, через несколько часов открыл

Nikolay
28.10.2018
13:50:39
?

?
28.10.2018
13:52:30
Закрыл браузер, через несколько часов открыл
надо было через день открыть, а не через несколько часов?

Тимофей
28.10.2018
13:53:09
help



что делать с этой ошибкой ?

устанавливал библиотеку pygame

вышла эта ошибка

Винни
28.10.2018
13:53:52
попробуй в конце добавить --user

но у меня чот пуинсталлер из-за этого юзера из консоли не вызывается

мудачество

Тимофей
28.10.2018
13:55:04
не

не помогает

Alexander
28.10.2018
13:57:18
Google
Alexander
28.10.2018
13:57:22
юзер поруски

поруски убери удали

Тимофей
28.10.2018
13:57:56
?

нормально скажи что сдлеать можно

не понял что сказал ты

Alexander
28.10.2018
13:58:20
папки по русски не называй

глянь путь

он ебанулся на кириллице

Nikolay
28.10.2018
13:58:52
Ты что не в России?

Какой еще английский

Alexander
28.10.2018
13:59:10
Ты что не в России?
я патриот Росси

слава России

Тимофей
28.10.2018
13:59:18
а как это мешает то ?

Страница 6867 из 9768