@ru_python

Страница 9134 из 9768
elessar
24.05.2019
16:04:47
TpouHuK
24.05.2019
16:04:47
и статья почему это плохо

срезы
? if i in range(999999999)[40:70+1]

Google
Fargo
24.05.2019
16:06:33
Господа, вынужден обратиться к вам за помощью в виде совета, какие то хулиганы которые работают в авито банят IP из за моего безобидного парсинга, посоветуйте как бы избежать такой досадной ситуации? Установить задержку между запросами? или поколдовать ещё с headers ?

Fargo
24.05.2019
16:09:15
попробовать пользоваться API?
посмотрю API но маловероятно что они бесплатно позволят парсить данные, ведь на их сайте это как услуга продаётся

Fargo
24.05.2019
16:10:14
Потому что не надо парсить
ну как это не надо если надо =)) потерпят немного =)

?
24.05.2019
16:11:06
номера телефонов поди

Fargo
24.05.2019
16:11:14
А что ты парсишь?
отслеживаю определенную марку авто, парсинг через bs4 и request

F̦̮̦͍́ o̹̟̩r̨̮͈ ̘͕̥͓d̙͓̀ ̖̱̟en͖͍̼̘̺̣̘
24.05.2019
16:11:21
И как?
РЕГУЛЯРКАМИ ХТМЛ

Zerogoki
24.05.2019
16:11:32
Для начала поставь там все заголовки как у браузера

И рандомизируй user-agent

Google
?
24.05.2019
16:11:54
Для начала поставь там все заголовки как у браузера
там скорее всего кол-во запросов в мин

Zerogoki
24.05.2019
16:11:56
И еще прикрути тор, раз в несколько минут обновляй IP

?
24.05.2019
16:11:57
не поможет

Fargo
24.05.2019
16:12:02
И рандомизируй user-agent
у меня стоит но без рандома

Zerogoki
24.05.2019
16:12:06
Fargo
24.05.2019
16:12:27
Тогда задержки
вот хотелось бы знать какая задержка их устроит

Тогда задержки
задержка я так понимаю тоже рандомная должна быть?

Zerogoki
24.05.2019
16:13:19
Лучше так, конечно

Просто sleep со случайным значением секунд в определенном пределе

Fargo
24.05.2019
16:14:37
Просто sleep со случайным значением секунд в определенном пределе
буду пробовать, пока эксперементируюю боюсь окончательно забанять мой ip, может через прокси лучше делать?

Zerogoki
24.05.2019
16:14:48
И обновляй identity

С тором работать просто — это прокси localhost:9050

А для управления есть порт специальный

Под питон есть уже либа готовая, разберешься

Fargo
24.05.2019
16:15:54
С тором работать просто — это прокси localhost:9050
никогда этим не пользовался пойду гуглить про тор =)

Zerogoki
24.05.2019
16:16:11
Лол, не знать про тор в 2019

Даже школьники знают

Fargo
24.05.2019
16:16:33
Лол, не знать про тор в 2019
ДА я тот ещё динозавр =)

Даже школьники знают
Спасибо за советы, не знаю что бы делал без вас

Google
Taras Malyarchuk
24.05.2019
16:19:26
Даже школьники знают
я хз))), я так то не очень в программировании

Fargo
24.05.2019
16:19:38
Jentry
24.05.2019
16:19:52
Я же написал, что через тор
exit nod’ы это ограниченное множество, в конечном счете они и их забанят тоже, и это плохой совет

Taras Malyarchuk
24.05.2019
16:20:04
ну не будьте так категоричны, должен же я где то практиковатся в парсинге =)
блин, а потом из-за таких как Вы, я не могу ставку на фрилансе сделать)

Zerogoki
24.05.2019
16:20:38
Fargo UPD: у них все exit-ноды заблочены, походу, я сейчас чекнул

У меня есть теперь другое предложение

Придётся тебе использовать мобильный интернет

Zerogoki
24.05.2019
16:21:27
Суть в том, что у операторов IP каждый раз новый выдается при регистрации в сети

Jentry
24.05.2019
16:21:36
это мамкиных хакиров чат теперь?

Zerogoki
24.05.2019
16:22:15
Используй телефон в режиме тетеринга по USB, скриптом через adb можешь передергивать режим полёта, чтобы перерегистрироваться в сети и получить новый IP

Taras Malyarchuk
24.05.2019
16:22:25
в смысле? как я вам мешаю?
я хочу зарабатывать парсингом, ибо я школота и мозгов на большее не хватит, вы парсерщик и я парсерщик, хоть еще и не работаю пока, это значит, что есть конкуренция, есть конкуренция - сложнее работу найти

Zerogoki
24.05.2019
16:22:28
Я так регулярно обхожу баны

Taras Malyarchuk
24.05.2019
16:23:08
вы все тут такие умные, я ниче не шарю, даже стьдно стало)

Google
Fargo
24.05.2019
16:25:07
она нарастает)
да пусть нарастает как хочет, программировать могут многие а хорошо кодить еденицы, быдлокодеры сами отсеятся

Admin
ERROR: S client not available

Zerogoki
24.05.2019
16:25:55
Есть интересная идея — поставь себе user-agent гуглобота

Taras Malyarchuk
24.05.2019
16:26:02
так что , чем больше людей в этой сфере, тем сложнее в ней зарабатывать,

а на freelancehunt вообще заказов на 2 страницы

?? Eugene
24.05.2019
16:26:23
РЕГУЛЯРКАМИ ХТМЛ
В парсинге без регулярок никак)

Zerogoki
24.05.2019
16:26:29
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Fargo
24.05.2019
16:26:44
Есть интересная идея — поставь себе user-agent гуглобота
я видел в видео по php чел просто куки в header добавил из браузера и всё заработало но я не очень понял как

Zerogoki
24.05.2019
16:27:03
Так ты даже куки не ставишь?

Тогда неудивительно, что банят

Fargo
24.05.2019
16:27:13
Zerogoki
24.05.2019
16:27:21
Твоя задача — максимально быть похожим на браузер

Если тебе сервер отправляет куку, то тебе следует её запомнить и использовать

Fargo
24.05.2019
16:27:48
Тогда неудивительно, что банят
ну так ожет весь header скопировать туда и всё ?

Zerogoki
24.05.2019
16:27:58
Ты используешь requests?

response.cookies есть поле

Fargo
24.05.2019
16:28:09
Zerogoki
24.05.2019
16:28:17
В request тоже есть параметр cookies

Fargo
24.05.2019
16:28:20
response.cookies есть поле
куки не использую

Google
Zerogoki
24.05.2019
16:28:29
Короче, пирожок, иди читай доки

Fargo
24.05.2019
16:28:33
В request тоже есть параметр cookies
в него добавить куки браузера?

Zerogoki
24.05.2019
16:28:56
requests

в него добавить куки браузера?
Которые тебе дал сервер

?? Eugene
24.05.2019
16:29:11
фигачь селениумом

Zerogoki
24.05.2019
16:29:11
Ты чот основ не знаешь

фигачь селениумом
Это пушкой по воробьям

Его стоит юзать только для всякой сложной херни типо защиты cloudflare

Fargo
24.05.2019
16:29:56
Ты чот основ не знаешь
не знаю к сожалению, буду гуглить =)

Которые тебе дал сервер
до этого моменда accept и user-agent прокатывало а тут вон оно как =)

Zerogoki
24.05.2019
16:31:54
Там еще дохера заголовков

Страница 9134 из 9768