
Festour
02.02.2016
23:21:07
из 0110 в 6

Viktor
02.02.2016
23:21:13
а устройство реле знаешь?

Festour
02.02.2016
23:21:39
Как реле пользоваться, я знаю
Больше нет

Google

Festour
02.02.2016
23:21:52
Больше, не знаю

Viktor
02.02.2016
23:22:05
поищи
кратко — катушка + переключатель

Festour
02.02.2016
23:22:17
Попозже

Viktor
02.02.2016
23:22:43
как катушку на проводах сделать понимаешь?
А как переключатель?
Ну и всё

Festour
02.02.2016
23:24:22
Погуглю попозже, честно

Viktor
02.02.2016
23:24:55
ок)

rabbitkate
03.02.2016
01:05:03
всем привет
есть вопрос
пишу парсер, в html есть 2 блока с одним названием. код выбирает из двух как раз тот, который мне не нужен. как выбрать нужный?

Pavel
03.02.2016
01:10:07
Екатерина, чем разбираете Html? руками с нуля или как?

rabbitkate
03.02.2016
01:12:32
чем разбираю? супом

Google

rabbitkate
03.02.2016
01:12:48
или о чем ты
я сейчас могу немного тупить, заранее извиняюсь

Pavel
03.02.2016
01:13:14
меня смутила фраза "пишу парсер", есть тут любители велосипедов.
ок, а блоки выбираешь по id, class или...?

rabbitkate
03.02.2016
01:14:54
https://github.com/rabbitkate/learn_python/blob/master/my_first_parser.py
вот код на данный момент
я вот с классами не могу определиться
косяк где-то

Pavel
03.02.2016
01:16:37
а хтмл где-то можно посмотреть?

rabbitkate
03.02.2016
01:17:01
http://sutd.ru/publishing/stylestudent/

Pavel
03.02.2016
01:18:08
в 11 строке ;)

rabbitkate
03.02.2016
01:18:20
это понятно

Pavel
03.02.2016
01:18:21
ico - icon

rabbitkate
03.02.2016
01:18:33
ой блин
всё равно что-то не то
вот смотри
ща я гит обновлю
ошибки нет
но он выводит только первый файд
файл

Google

rabbitkate
03.02.2016
01:21:09
а мне надо все
и findAll не могёт
и find_all тоже

Pavel
03.02.2016
01:25:47
проблема в том, что я не работал с BS, поэтому таких тонкостей не скажу.
но судя по доке, findAll('li', attrs={"class" : "ico-pdf"}) должен сработать.

rabbitkate
03.02.2016
01:26:06
ща попробую

Pavel
03.02.2016
01:27:26
или даже просто findAll('li', 'ico-pdf')

rabbitkate
03.02.2016
01:28:23
увы
ни то ни то
ни вариации обоих
блин

Pavel
03.02.2016
01:29:22
а просто findall('li') найдёт хоть что-то?

rabbitkate
03.02.2016
01:30:13
опа

rabbitkate
03.02.2016
01:30:14
да
блин
как отсечь этот левый блок
который назван так же, но мне не нужен

Pavel
03.02.2016
01:34:00
findall(...)[1], например

rabbitkate
03.02.2016
01:34:29
что это

Pavel
03.02.2016
01:35:17
findall() вернёт массив из нескольких блоков, [1] - пропустит ненужный нулвой

rabbitkate
03.02.2016
01:36:56
аа ща

Google

rabbitkate
03.02.2016
01:37:05
я поняла
только мне там не 1, а 5 блоков убрать пришлось
спасибо большое!

Pavel
03.02.2016
01:50:45

rabbitkate
03.02.2016
01:51:54
ну я сейчас в Краснодаре у родителей в гостях, тут ливни, ветер. а дома в Питере, говорят, солнечно было и тепло, а щас опять метель дождь

Dan
03.02.2016
02:14:22
доброе утро

rabbitkate
03.02.2016
02:15:23

Dan
03.02.2016
02:15:41
было как то

rabbitkate
03.02.2016
02:17:09
я немного застряла на том, как убрать теги и оставить просто текст. куда совать собсна text. посмотришь код?

Dan
03.02.2016
02:17:26
давай

Admin
ERROR: S client not available

rabbitkate
03.02.2016
02:17:55

Dan
03.02.2016
02:20:14
нужно текст ссылок ?

rabbitkate
03.02.2016
02:20:19
да

Dan
03.02.2016
02:23:55
на сколько я помню pdf.findAll('a') возвращает нам не тег а массив тегов
те если там несколько тегов по ним тоже надо пройтись в цикле
а потом print(cols.string)

rabbitkate
03.02.2016
02:25:23
вот что сейчас

santa
03.02.2016
02:25:55
О
Юнити

Google

santa
03.02.2016
02:26:16
Вам снятся цветные сны?

rabbitkate
03.02.2016
02:26:27
даже слишком цветные

time
03.02.2016
02:28:00
снятся
я их записываю теперь

Dan
03.02.2016
02:28:41
for pdf in soup.findAll('li')[5?:
print(pdf.a.string)
print(pdf.span.string)
так попробуй

time
03.02.2016
02:29:05
для кода очень удобно ставить `
ой, три тильды в начале и в конце
не тильды, а backquote, то есть

rabbitkate
03.02.2016
02:29:34
спасибо, чувак

Dan
03.02.2016
02:29:55
всегда к вашим услушам :)

rabbitkate
03.02.2016
02:29:59
я минут 30 уже на это залипала и не могла понять
а кто-нибудь знает, как вытащить размер пдф из самого пдф или может из переменной со span

Dan
03.02.2016
02:50:52
а тебе просто как строку ?

rabbitkate
03.02.2016
02:51:44
мне нужно вытащить эти цифры, сравнить их потом и вывести в эксель

Dan
03.02.2016
02:55:29
m = re.search('(\d+,\d)', pdf.span.string)
m.group(0)
как вариант
только еще надо импорт сделать
import re

rabbitkate
03.02.2016
02:59:48
о, работает
это надо будет запомнить