@ru_python

« Назад

Страница 266 из 9768

Далее »

Festour

02.02.2016
23:21:07

из 0110 в 6

Viktor

02.02.2016
23:21:13

а устройство реле знаешь?

Festour

02.02.2016
23:21:39

Как реле пользоваться, я знаю

Больше нет

Google

Festour

02.02.2016
23:21:52

Больше, не знаю

Viktor

02.02.2016
23:22:05

поищи

кратко — катушка + переключатель

Festour

02.02.2016
23:22:17

Попозже

Viktor

02.02.2016
23:22:43

как катушку на проводах сделать понимаешь? А как переключатель?

Ну и всё

Festour

02.02.2016
23:24:22

Погуглю попозже, честно

Viktor

02.02.2016
23:24:55

ок)

rabbitkate

03.02.2016
01:05:03

всем привет

есть вопрос

пишу парсер, в html есть 2 блока с одним названием. код выбирает из двух как раз тот, который мне не нужен. как выбрать нужный?

Pavel

03.02.2016
01:10:07

Екатерина, чем разбираете Html? руками с нуля или как?

rabbitkate

03.02.2016
01:12:32

чем разбираю? супом

Google

rabbitkate

03.02.2016
01:12:48

или о чем ты

я сейчас могу немного тупить, заранее извиняюсь

Pavel

03.02.2016
01:13:14

меня смутила фраза "пишу парсер", есть тут любители велосипедов.

ок, а блоки выбираешь по id, class или...?

rabbitkate

03.02.2016
01:14:54

https://github.com/rabbitkate/learn_python/blob/master/my_first_parser.py

вот код на данный момент

я вот с классами не могу определиться

косяк где-то

Pavel

03.02.2016
01:16:37

а хтмл где-то можно посмотреть?

rabbitkate

03.02.2016
01:17:01

http://sutd.ru/publishing/stylestudent/

Pavel

03.02.2016
01:18:08

в 11 строке ;)

rabbitkate

03.02.2016
01:18:20

это понятно

Pavel

03.02.2016
01:18:21

ico - icon

rabbitkate

03.02.2016
01:18:33

ой блин

всё равно что-то не то

вот смотри

ща я гит обновлю

ошибки нет

но он выводит только первый файд

файл

Google

rabbitkate

03.02.2016
01:21:09

а мне надо все

и findAll не могёт

и find_all тоже

Pavel

03.02.2016
01:25:47

проблема в том, что я не работал с BS, поэтому таких тонкостей не скажу. но судя по доке, findAll('li', attrs={"class" : "ico-pdf"}) должен сработать.

rabbitkate

03.02.2016
01:26:06

ща попробую

Pavel

03.02.2016
01:27:26

или даже просто findAll('li', 'ico-pdf')

rabbitkate

03.02.2016
01:28:23

увы

ни то ни то

ни вариации обоих

блин

Pavel

03.02.2016
01:29:22

а просто findall('li') найдёт хоть что-то?

rabbitkate

03.02.2016
01:30:13

опа

rabbitkate

03.02.2016
01:30:14

да

блин

как отсечь этот левый блок

который назван так же, но мне не нужен

Pavel

03.02.2016
01:34:00

findall(...)[1], например

rabbitkate

03.02.2016
01:34:29

что это

Pavel

03.02.2016
01:35:17

findall() вернёт массив из нескольких блоков, [1] - пропустит ненужный нулвой

rabbitkate

03.02.2016
01:36:56

аа ща

Google

rabbitkate

03.02.2016
01:37:05

я поняла

только мне там не 1, а 5 блоков убрать пришлось

спасибо большое!

Pavel

03.02.2016
01:50:45

спасибо большое!

Не за что. Как погода там у вас?

rabbitkate

03.02.2016
01:51:54

ну я сейчас в Краснодаре у родителей в гостях, тут ливни, ветер. а дома в Питере, говорят, солнечно было и тепло, а щас опять метель дождь

Dan

03.02.2016
02:14:22

доброе утро

rabbitkate

03.02.2016
02:15:23

доброе утро

доброе. ты с beautiful soup не работал?

Dan

03.02.2016
02:15:41

было как то

rabbitkate

03.02.2016
02:17:09

я немного застряла на том, как убрать теги и оставить просто текст. куда совать собсна text. посмотришь код?

Dan

03.02.2016
02:17:26

давай

Admin

ERROR: S client not available

rabbitkate

03.02.2016
02:17:55

https://github.com/rabbitkate/learn_python/blob/master/my_first_parser.py

вот

Dan

03.02.2016
02:20:14

нужно текст ссылок ?

rabbitkate

03.02.2016
02:20:19

да

Dan

03.02.2016
02:23:55

на сколько я помню pdf.findAll('a') возвращает нам не тег а массив тегов

те если там несколько тегов по ним тоже надо пройтись в цикле

а потом print(cols.string)

rabbitkate

03.02.2016
02:25:23

вот что сейчас

santa

03.02.2016
02:25:55

О

Юнити

Google

santa

03.02.2016
02:26:16

Вам снятся цветные сны?

rabbitkate

03.02.2016
02:26:27

даже слишком цветные

time

03.02.2016
02:28:00

снятся

я их записываю теперь

Dan

03.02.2016
02:28:41

for pdf in soup.findAll('li')[5?: print(pdf.a.string) print(pdf.span.string)

так попробуй

time

03.02.2016
02:29:05

для кода очень удобно ставить `

ой, три тильды в начале и в конце

не тильды, а backquote, то есть

rabbitkate

03.02.2016
02:29:34

for pdf in soup.findAll('li')[5?: print(pdf.a.string) print(pdf.span.string)

я тебя обожаю

спасибо, чувак

Dan

03.02.2016
02:29:55

всегда к вашим услушам :)

rabbitkate

03.02.2016
02:29:59

я минут 30 уже на это залипала и не могла понять

а кто-нибудь знает, как вытащить размер пдф из самого пдф или может из переменной со span

Dan

03.02.2016
02:50:52

а тебе просто как строку ?

rabbitkate

03.02.2016
02:51:44

мне нужно вытащить эти цифры, сравнить их потом и вывести в эксель

Dan

03.02.2016
02:55:29

m = re.search('(\d+,\d)', pdf.span.string) m.group(0)

как вариант

только еще надо импорт сделать

import re

rabbitkate

03.02.2016
02:59:48

о, работает

это надо будет запомнить

« Назад

Страница 266 из 9768

Далее »

Открыть в Telegram