
53r63rn4r
26.05.2016
21:08:50
Вся суть ппарсеров

Sasha
26.05.2016
21:09:20
Так и не понял задачу

drjackild
26.05.2016
21:09:21
кто-нибудь вообще понял, что они юзают на фронте? это же не ангуляр?

Google

53r63rn4r
26.05.2016
21:09:53
Ты скажи что тебе нужно спарсить
Для начала

drjackild
26.05.2016
21:10:06
Sasha зайди по ссылке. это категория, мне надо все продукты из нее. как отобразить больше продуктов и как переключать страницы?

Sasha
26.05.2016
21:10:24
а чо используешь scrapy?
*что
Сказал, как удмурт

53r63rn4r
26.05.2016
21:10:35

drjackild
26.05.2016
21:10:35
да
но не суть, можно и реквестс и граб, и аиохттп, пох короче
@serbernar1 ?

Sasha
26.05.2016
21:11:23
эм, ну там же в гет запросе есть page

drjackild
26.05.2016
21:12:04
ты вообще зашел туда ?
открой консоль и посмотри, что происходит, когда страницы переключаешь, либо кол-во товара на странице

Google

drjackild
26.05.2016
21:12:32
там пост отправляется

53r63rn4r
26.05.2016
21:12:32
Ну ты же стрелочки можешь нажимать..

drjackild
26.05.2016
21:12:36
на ту же страницу

53r63rn4r
26.05.2016
21:12:44
Да?
Можешь?..

.
26.05.2016
21:12:55

Sasha
26.05.2016
21:12:57
http://exist.ru/Catalog/Goods/1/90?page=17

drjackild
26.05.2016
21:13:03
@serbernar1 ну да
Sasha ты меня тролишь что-ли?

53r63rn4r
26.05.2016
21:13:33
Вот, переходишь на последнюю страницу, а дальше идешь просто обратно и всё

drjackild
26.05.2016
21:13:35
первая страница по такому запросу

53r63rn4r
26.05.2016
21:13:38
До первой страницы

drjackild
26.05.2016
21:14:00
@serbernar1 бля, вы вдвоем меня троллите походу

Sasha
26.05.2016
21:14:15
короче в скрэпи ты можешь сделать просто:
там в __init__ есть start_urls и rules.
и дальше
self.rules = (
Rule(LinkExtractor(allow=r'products/\d+'), callback='parse_product', follow=True, ),
)И в коллбэке уже что обрабатываешь
По страницам - там реально page в GET pfпросе явно
*запросе

drjackild
26.05.2016
21:14:51
да нет же, блять. вопрос не в этом. ну отпарсил я первую страницу, как вторую вызвать?
НЕТ!

53r63rn4r
26.05.2016
21:15:06
Жмакнуть на неё, нет?

drjackild
26.05.2016
21:15:29
@serbernar1 ага

Google

53r63rn4r
26.05.2016
21:15:40
Ну, так и жмакай в цикле

Sasha
26.05.2016
21:15:54
start_urls = ["www.example.com/page1"]
rules = ( Rule (SgmlLinkExtractor(restrict_xpaths=('//a[@class="next_page"]',))
, follow= True),
Rule (SgmlLinkExtractor(restrict_xpaths=('//div[@class="foto_imovel"]',))
, callback='parse_call')
)
По стилям сам уж там ищи, но это делается через rules

drjackild
26.05.2016
21:16:16
@serbernar1 я без headless браузера граблю, так что js не выполняется

53r63rn4r
26.05.2016
21:16:36
Ну, тогда мой тебе костыльный совет
Берешь питон и селениум.вебдрайвер
Парсишь
?!?!-!-!
Профффит

drjackild
26.05.2016
21:17:37
Sasha это не сработает. страницы переключаются, контент остается тот же)
сам попробуй

Sasha
26.05.2016
21:17:58
Не, я спать хочу уж

Sasha
26.05.2016
21:18:05
Лежу вот, какао пью

drjackild
26.05.2016
21:18:32
@serbernar1 ненавижу это костыльное дерьмо, под названием селениум. а тем более, дружить его со скрапи

53r63rn4r
26.05.2016
21:18:55
Азачем тебе скрапи тогда? Лол

drjackild
26.05.2016
21:19:41
даже не знаю, что тебе ответить на это

53r63rn4r
26.05.2016
21:19:53
Ну, хз, у меня многопоточный бот, который парсит 3 сайта и еще и ставки делает и расчеты, лучше костылей я не нашел

Υπερβορεία
26.05.2016
21:20:20

53r63rn4r
26.05.2016
21:20:30
Плюс гуи еще на кутэ

Google

drjackild
26.05.2016
21:20:51
ужсккй

53r63rn4r
26.05.2016
21:20:52
И логи пишет
Потом я эти логи со временем буду обрабатывать...
Это будет пизда, наверное

Υπερβορεία
26.05.2016
21:23:17
Давным давно

53r63rn4r
26.05.2016
21:23:39
Нуэто мой первый опыт
И первые эти..ну..деньги за погроммирование

Υπερβορεία
26.05.2016
21:24:19
А по какой формуле он рассчитывает доходность?

Admin
ERROR: S client not available

53r63rn4r
26.05.2016
21:24:43
По вилкам

Υπερβορεία
26.05.2016
21:24:49
А, понял

53r63rn4r
26.05.2016
21:24:52
Ну, там..ну, формула

Υπερβορεία
26.05.2016
21:25:02
Разница в кф

53r63rn4r
26.05.2016
21:25:06
Ага
Но там не всё так чисто
Как хотелось бы
Но вообще это не моя идея, да и мне это не особо интересно
Не хочу доить корову

Google

53r63rn4r
26.05.2016
21:26:16
Хочу быть коровой
Ну или быком и ебать коров
Но хотя бы коровкой

Υπερβορεία
26.05.2016
21:26:47
Это тебе в Форекс
Будешь хоть быком, хоть медведем

53r63rn4r
26.05.2016
21:27:13
Не, я не шарю в этих всех делах
Дыбил, одним словом

Artem
26.05.2016
21:38:48
Кто то работал pyqt5 +pycharm последних сборок?
Чет они вообще не совместимы, хотя у меня кривые руки. Не могу никак связать их. Да и в целом, перегнать из ui в py
?

drjackild
26.05.2016
21:42:08
в смысле, IDE несовместима с либой? теплое с мяшким же, нет?

Alexander
26.05.2016
21:42:50
Всем привет

Artem
26.05.2016
21:46:36
"Несовместимы", имею ввиду, что pycharm в списке модулей не отображает pyqt5, 4ю версию отказывается ставить. Погуглив че да как, в большинстве видео просто ui перегоняют в Py, так и работают. Но то, как они это делают , не понятно.

drjackild
26.05.2016
21:47:08
а, ну да, берешь, делаешь ui в конструкторе, а потом импортишь в питоновский модуль
но, уже не помню, как я делал, давненько уже не работал с гуи вообще

Artem
26.05.2016
21:47:26
Короче, кто может объяснить банально - нужно сделать простую программу с интерфейсом. Питон, и насколько я понимаю кроме QT адекватного мало.

drjackild
26.05.2016
21:48:04
киви норм, плюс у него лицензия гораздо дружелюбнее

Kirill
26.05.2016
21:48:14
подпишусь на тред

drjackild
26.05.2016
21:48:19
есть еще wxWidgets, я с ней не работал, но вроде ок
ну и классика - Tk ?

Artem
26.05.2016
21:48:38
Окей, я смогу потом просто с ним работать лишь над технической частью? И в итоге скомпилить в exe?

Aleksey
26.05.2016
21:49:07
Gtk