@ru_python

Страница 266 из 9768
Festour
02.02.2016
23:21:07
из 0110 в 6

Viktor
02.02.2016
23:21:13
а устройство реле знаешь?

Festour
02.02.2016
23:21:39
Как реле пользоваться, я знаю

Больше нет

Google
Festour
02.02.2016
23:21:52
Больше, не знаю

Viktor
02.02.2016
23:22:05
поищи

кратко — катушка + переключатель

Festour
02.02.2016
23:22:17
Попозже

Viktor
02.02.2016
23:22:43
как катушку на проводах сделать понимаешь? А как переключатель?

Ну и всё

Festour
02.02.2016
23:24:22
Погуглю попозже, честно

Viktor
02.02.2016
23:24:55
ок)

rabbitkate
03.02.2016
01:05:03
всем привет

есть вопрос

пишу парсер, в html есть 2 блока с одним названием. код выбирает из двух как раз тот, который мне не нужен. как выбрать нужный?

Pavel
03.02.2016
01:10:07
Екатерина, чем разбираете Html? руками с нуля или как?

rabbitkate
03.02.2016
01:12:32
чем разбираю? супом

Google
rabbitkate
03.02.2016
01:12:48
или о чем ты

я сейчас могу немного тупить, заранее извиняюсь

Pavel
03.02.2016
01:13:14
меня смутила фраза "пишу парсер", есть тут любители велосипедов.

ок, а блоки выбираешь по id, class или...?

rabbitkate
03.02.2016
01:14:54
https://github.com/rabbitkate/learn_python/blob/master/my_first_parser.py

вот код на данный момент

я вот с классами не могу определиться

косяк где-то

Pavel
03.02.2016
01:16:37
а хтмл где-то можно посмотреть?

rabbitkate
03.02.2016
01:17:01
http://sutd.ru/publishing/stylestudent/

Pavel
03.02.2016
01:18:08
в 11 строке ;)

rabbitkate
03.02.2016
01:18:20
это понятно

Pavel
03.02.2016
01:18:21
ico - icon

rabbitkate
03.02.2016
01:18:33
ой блин

всё равно что-то не то

вот смотри

ща я гит обновлю

ошибки нет

но он выводит только первый файд

файл

Google
rabbitkate
03.02.2016
01:21:09
а мне надо все

и findAll не могёт

и find_all тоже

Pavel
03.02.2016
01:25:47
проблема в том, что я не работал с BS, поэтому таких тонкостей не скажу. но судя по доке, findAll('li', attrs={"class" : "ico-pdf"}) должен сработать.

rabbitkate
03.02.2016
01:26:06
ща попробую

Pavel
03.02.2016
01:27:26
или даже просто findAll('li', 'ico-pdf')

rabbitkate
03.02.2016
01:28:23
увы

ни то ни то

ни вариации обоих

блин

Pavel
03.02.2016
01:29:22
а просто findall('li') найдёт хоть что-то?

rabbitkate
03.02.2016
01:30:13
опа

rabbitkate
03.02.2016
01:30:14
да

блин

как отсечь этот левый блок

который назван так же, но мне не нужен

Pavel
03.02.2016
01:34:00
findall(...)[1], например

rabbitkate
03.02.2016
01:34:29
что это

Pavel
03.02.2016
01:35:17
findall() вернёт массив из нескольких блоков, [1] - пропустит ненужный нулвой

rabbitkate
03.02.2016
01:36:56
аа ща

Google
rabbitkate
03.02.2016
01:37:05
я поняла

только мне там не 1, а 5 блоков убрать пришлось

спасибо большое!

Pavel
03.02.2016
01:50:45
спасибо большое!
Не за что. Как погода там у вас?

rabbitkate
03.02.2016
01:51:54
ну я сейчас в Краснодаре у родителей в гостях, тут ливни, ветер. а дома в Питере, говорят, солнечно было и тепло, а щас опять метель дождь

Dan
03.02.2016
02:14:22
доброе утро

rabbitkate
03.02.2016
02:15:23
доброе утро
доброе. ты с beautiful soup не работал?

Dan
03.02.2016
02:15:41
было как то

rabbitkate
03.02.2016
02:17:09
я немного застряла на том, как убрать теги и оставить просто текст. куда совать собсна text. посмотришь код?

Dan
03.02.2016
02:17:26
давай

Admin
ERROR: S client not available

Dan
03.02.2016
02:20:14
нужно текст ссылок ?

rabbitkate
03.02.2016
02:20:19
да

Dan
03.02.2016
02:23:55
на сколько я помню pdf.findAll('a') возвращает нам не тег а массив тегов

те если там несколько тегов по ним тоже надо пройтись в цикле

а потом print(cols.string)

rabbitkate
03.02.2016
02:25:23
вот что сейчас

santa
03.02.2016
02:25:55
О

Юнити

Google
santa
03.02.2016
02:26:16
Вам снятся цветные сны?

rabbitkate
03.02.2016
02:26:27
даже слишком цветные

time
03.02.2016
02:28:00
снятся

я их записываю теперь

Dan
03.02.2016
02:28:41
for pdf in soup.findAll('li')[5?: print(pdf.a.string) print(pdf.span.string)

так попробуй

time
03.02.2016
02:29:05
для кода очень удобно ставить `

ой, три тильды в начале и в конце

не тильды, а backquote, то есть

rabbitkate
03.02.2016
02:29:34
спасибо, чувак

Dan
03.02.2016
02:29:55
всегда к вашим услушам :)

rabbitkate
03.02.2016
02:29:59
я минут 30 уже на это залипала и не могла понять

а кто-нибудь знает, как вытащить размер пдф из самого пдф или может из переменной со span

Dan
03.02.2016
02:50:52
а тебе просто как строку ?

rabbitkate
03.02.2016
02:51:44
мне нужно вытащить эти цифры, сравнить их потом и вывести в эксель

Dan
03.02.2016
02:55:29
m = re.search('(\d+,\d)', pdf.span.string) m.group(0)

как вариант

только еще надо импорт сделать

import re

rabbitkate
03.02.2016
02:59:48
о, работает

это надо будет запомнить

Страница 266 из 9768