
Nikolay
14.02.2017
07:44:26
поэтому трудно эмулировать

Sheridan
14.02.2017
07:45:13

Nikolay
14.02.2017
07:45:19
301 всего лишь указыват на новый урл, который надо запросить

Google

Sheridan
14.02.2017
07:45:31
точнее код ответа

Nikolay
14.02.2017
07:45:33
и все реквестеры умеют ходить по редиректам
я не понял, в чем твоя идея

Sheridan
14.02.2017
07:46:06

Nikolay
14.02.2017
07:46:21
это уже все сделано за нас

Sheridan
14.02.2017
07:46:39

Nikolay
14.02.2017
07:46:54

Sheridan
14.02.2017
07:46:57
тот же фантом не умеет нопример

Nikolay
14.02.2017
07:47:07
ну вот я и говорю - фантом не нужен
в большинстве случаев
только если без js никуда

Sheridan
14.02.2017
07:47:35
точнее его можно научить конечно, но по умолчанию не редиректицца сам

Google

Nikolay
14.02.2017
07:47:41
а таких случаев мало

Sheridan
14.02.2017
07:47:56
жабаскрипт сейчас чуть менее чем везде

Nikolay
14.02.2017
07:47:58
ну, ты взял косяки фантома и попытался в них обвинить питон :) не надо так

Alex
14.02.2017
07:48:25
Лучше фантома ничего нет. Подключил jquery и выбираешь нужные данные, scrapy такого удобства не даст+ не известно придетя ли тебе собирать spa приложения. А так уже заточена будет архитектура сбора

Nikolay
14.02.2017
07:48:28

Alex
14.02.2017
07:48:47
Что сравнивать, это реальный браузер

Nikolay
14.02.2017
07:48:48
просто потому что механизм http не меняется от того, через js ты его дергаешь или рукамии
реальный браузер, который нафиг не нужен для задач обычного парсинга

Alex
14.02.2017
07:49:15

Mikhail
14.02.2017
07:49:22
хочу сказать, Grab - отличная штука, не такой накрученный как Scrapy, есть свой многопоточный модуль

Nikolay
14.02.2017
07:49:35

Sheridan
14.02.2017
07:49:42

Alex
14.02.2017
07:50:04
Это дальновидно
Иначе придется все переписывать

Aleksandr
14.02.2017
07:50:26
если список сайтов не определён, что там может понадобится парсить, если всё будет нестандартизировано?

Nikolay
14.02.2017
07:50:34

Sheridan
14.02.2017
07:50:55

Nikolay
14.02.2017
07:51:15
а если он вообще заранее не определен - то там выполнение js не поможет

Google

Aleksandr
14.02.2017
07:51:16

Alex
14.02.2017
07:51:39
отслеживание склорра, кликов

Sheridan
14.02.2017
07:52:02

Nikolay
14.02.2017
07:52:07

Mikhail
14.02.2017
07:52:14

Alex
14.02.2017
07:52:18

Aleksandr
14.02.2017
07:52:23

Nikolay
14.02.2017
07:52:25
и ни разу мне не приходилось js юзать при парсинге
или ты придумал свой http?

Sheridan
14.02.2017
07:52:46

Alex
14.02.2017
07:53:03
И не теряй времени тонну
Нет, ничего ты толком не парсил и не аггрегировал
Иначе бы такой ахинеи не нес

Nikolay
14.02.2017
07:53:25
ерунду пишешь

Aleksandr
14.02.2017
07:53:36

Nikolay
14.02.2017
07:53:44

Google

Alex
14.02.2017
07:54:02

Nikolay
14.02.2017
07:54:24
я даже могу рассказать тебе, как в общем случае делается такой парсинг, там используется алгоритм сравнения содержимого

Alex
14.02.2017
07:54:36

Nikolay
14.02.2017
07:54:47
а у меня питон справляется

Alex
14.02.2017
07:55:17

Sheridan
14.02.2017
07:55:25

Nikolay
14.02.2017
07:55:36
тебе так или иначе контент парсить надо, с js или без
и без него это делать проще

Alex
14.02.2017
07:56:06
В том числе и аякс тот же примитивный

Nikolay
14.02.2017
07:56:22

Alex
14.02.2017
07:56:28
А уж про эмуляцию поведения юзера молчу

Nikolay
14.02.2017
07:56:33
за исключением упоротых случаев, когда реакт какой-нибудь

Aleksandr
14.02.2017
07:56:38

Nikolay
14.02.2017
07:56:44
тогда надо один урл посмотреть и все

Alex
14.02.2017
07:57:02

Nikolay
14.02.2017
07:57:02

Google

Alex
14.02.2017
07:57:23

Nikolay
14.02.2017
07:57:45
я на питончике быстрее распаршу, чем ты текст фантомом достанешь

Sheridan
14.02.2017
07:58:03

Nikolay
14.02.2017
07:58:04
так что не выпендривайся

Alex
14.02.2017
07:58:30

Nikolay
14.02.2017
07:58:42
более нужным он для ежедневных задач от этого не стал

Alex
14.02.2017
07:58:55

Nikolay
14.02.2017
07:59:11

Sheridan
14.02.2017
07:59:11

Nikolay
14.02.2017
07:59:18
а ты не умеешь - так и скажи
запрос со смещением это обычно, который выцепляется за минуту и потом просто берешь контент

Aleksandr
14.02.2017
08:00:39
очевидно, один из вас парсит агрессивно и часто наталкивается на сайты, где за ботовское поведение банят,
а другой парсит более щадящим образом сайты, где не банят

Alex
14.02.2017
08:00:45
Просто не компетентен

Nikolay
14.02.2017
08:01:07