@ru_python

Страница 1637 из 9768
b0g3r
18.10.2016
16:37:12
возможно лишний пробел в начале

Nikolay
18.10.2016
16:39:11
сюда md завезут нет?

Pavel
18.10.2016
16:47:55
Обратные кавычки давно есть

b0g3r
18.10.2016
16:57:40
Google
Belskikh
18.10.2016
16:58:01
Всем привет. Накидайте, плз, идей, на чем прокачаться в краулинге, чтобы на апворк начать зарабатывать от 50$ в минуту? Ну или просто хотя бы начать что-то зарабатывать... Хоть немного..?

Belskikh
18.10.2016
17:03:02
Это смешная шуточка

Dmitry
18.10.2016
17:03:31
"зарабатывать от 50$ в минуту" Это легально?
я в фильме видел, там хакера заставили скачивать деньги из банка, он даже быстрее качал! )

Игорь
18.10.2016
17:03:43
"зарабатывать от 50$ в минуту" Это легально?
на трейдерстве можно зарабатывать $100000 в минуту в 100500 транзакций

Игорь
18.10.2016
17:04:04
и еще $99000 терять в еще 100500 транзакций

Belskikh
18.10.2016
17:04:04
Если серьезно - какие навыки натренить, чтобы начать получать заказы га апворке

Игорь
18.10.2016
17:04:08
параллельно!

Aragaer
18.10.2016
17:04:11
о, надо будет сходить еще раз на апворк, мож найдется мне там какая работа

Игорь
18.10.2016
17:04:14
в одну минуту!

Aragaer
18.10.2016
17:04:16
а то ну ваще ничего

Alex
18.10.2016
17:04:32
в одну минуту!
Умеешь или нет, а?

Google
Alex
18.10.2016
17:05:58
Если серьезно - какие навыки натренить, чтобы начать получать заказы га апворке
Иди на тот же Upwork и ищи задания. Например, напарсить товары из категории на Amazon.

Игорь
18.10.2016
17:06:17
Умеешь или нет, а?
с хуя ли? не умею и не стремлюсь, да и если бы — там одно железо стоит миллионы

Alex
18.10.2016
17:07:24
Если серьезно - какие навыки натренить, чтобы начать получать заказы га апворке
И вот напарсь тысяч 100 товаров из какой-нибудь категории.

Реальное задание, встречал подобное на Upwork.

Belskikh
18.10.2016
17:08:23
Збазиба…?

Alex
18.10.2016
17:09:53
Про XPath почитай.

А я тебя вообще правильно понял? Что такое краулинг? ?

Yuryhalf
18.10.2016
17:10:53
?

Я пока знаю как потратить 50 бачей за минуту,обратному хотелось бы научиться?

Belskikh
18.10.2016
17:11:52
Песня линкинпарка

Yuryhalf
18.10.2016
17:12:12
Alex
18.10.2016
17:12:23
Этому тебя в армии научат!

Yuryhalf
18.10.2016
17:12:50
Я уже был

Не научили

?

Alex
18.10.2016
17:14:20
Песня линкинпарка
Ты не стесняйся, расскажи, каким краулингом интересуешься.

Belskikh
18.10.2016
17:20:59
Веб краулинг

Добыча данных с сайтов в автоматических режимах

Возможно, с обходом капчи и тп. Асинхронно там, с большой скоростью

Google
Belskikh
18.10.2016
17:22:42
Хочу краулить на уровне лучших чуваков мира

Alex
18.10.2016
17:22:58
Ясно. На мой взгляд, самый простой способ это изучить Scrapy. Кому-то Grab больше нравится, но я его не пробовал. Капчи разгадываются сервисами типа антигейта. Scrapy асинхронный. Достаточно быстрый.

Belskikh
18.10.2016
17:23:00
Без регистрации и смс, разумеется?

Yuryhalf
18.10.2016
17:23:13
В медиалогии краулят дофига

Belskikh
18.10.2016
17:23:19
Скрапи асинхронный уже?

Alex
18.10.2016
17:23:20
Без регистрации и смс, разумеется?
Это не факт. Прокси нужны будут.

Он на Twisted сделан.

"Scrapy is built on top of the Twisted asynchronous networking library"

Belskikh
18.10.2016
17:23:52
Огонь

Без регистрации и смс, разумеется?
Это ещё одна смешная шуточка была

Alex
18.10.2016
17:24:26
В медиалогии краулят дофига
Работаешь там? Чем известны?

Yuryhalf
18.10.2016
17:24:48
Друг работает,у них была система которой пользовался кремль

Belskikh
18.10.2016
17:24:54
А вообще спасибо, дай обниму

Alex
18.10.2016
17:24:58
Это ещё одна смешная шуточка была
Можешь не уточнять, я тебя понимаю. Но прокси нужны всё равно.

Yuryhalf
18.10.2016
17:24:58
Аналитика

Упоминания в сми ,соц сетях и тд

А щас чинуши чето другое начали юзать

Google
Alex
18.10.2016
17:27:01
Что такое 10к единиц и не меньше?

Yuryhalf
18.10.2016
17:27:05
Насколько я понял это норм бизнес,данные краулеров продают причем весьма успешно всяким аналитическим агентствам

Alex
18.10.2016
17:27:19
А щас чинуши чето другое начали юзать
Не знаешь, что начали юзать?

Nikolay
18.10.2016
17:27:51
нормальный стек: selenium + js (экстрактнуть линки в файл txt), потом wget/curl выкачать эти паги, потом python+bs4 и тогда есть уверенность что всё будет как надо, без косяков со стороны либы/фреймворка по типу scrapy

амазон не дураки; там за чаще чем 3 req/s заглушку ставят

Alex
18.10.2016
17:28:48
Yuryhalf
18.10.2016
17:28:55
Не знаешь, что начали юзать?
Контора называется М13

Nikolay
18.10.2016
17:29:05
а прокси они не заглушат, да?

Yuryhalf
18.10.2016
17:29:15
Ее поделка зовется "Катюшей"?

Admin
ERROR: S client not available

Alex
18.10.2016
17:29:43
а прокси они не заглушат, да?
Много прокси. Или у тебя какой-то хитрый метод скрейпинга амазонов с одного IP без прокси?

Делись

Nikolay
18.10.2016
17:30:20
не жадничать; sleep ставить; я селениумом его одолеваю

максимум что было это 10к ASIN-ов; за 3 дня неспешно одолел

пока я смотрел фильмы

пока течет мой любимый кетчуп

Nikolay
18.10.2016
17:32:21
плюс очень полезно для такого типа деятельности иметь vps в usa и где-нибудь в германии

Alex
18.10.2016
17:32:24
Ну так если много прокси, то это быстрее же. Быстрее выполняешь работу, значит можешь выполнять больше заказов. Т.е. зарабатывать больше денег.

Или я чего-то не понимаю? Так же не жадничая на каждом прокси качаешь и льешь кетчуп.

Google
Yuryhalf
18.10.2016
17:33:16
Валидные прокси нужны только

И лучше https

Alex
18.10.2016
17:33:34
Очевидно

Yuryhalf
18.10.2016
17:33:40
:)

Nikolay
18.10.2016
17:33:44
Ну так если много прокси, то это быстрее же. Быстрее выполняешь работу, значит можешь выполнять больше заказов. Т.е. зарабатывать больше денег.
я еще не разгребал, как селениум работает с проксями; это просто голый браузер, прокся перед запуском паарметром указывается же; каждые 2 запроса перезапускать браузер? no-way;

не знай как у других, у меня хромдрайвер скрипя мозгами запускается

images/js disabled

Yuryhalf
18.10.2016
17:34:43
Я видел краулер на ie???

Это нечто

Nikolay
18.10.2016
17:34:53
Yuryhalf
18.10.2016
17:35:10
100500 окон браузера

На вин7

Alex
18.10.2016
17:35:55
Напиши

Yuryhalf
18.10.2016
17:36:17
Это возможно?

Не в теории

Nikolay
18.10.2016
17:36:45
поидее можно хостом локалхост с портом указать, на локалхосте py-скрипт склушает и в бесконечно цикле next-ит из листа по кругу хосты на каждое обращение

Bo0oM
18.10.2016
17:36:51
А phantomjs? У меня в нем гулялка

Nikolay
18.10.2016
17:37:59
Yuryhalf
18.10.2016
17:38:39
Arcady
18.10.2016
17:38:49
Всем привет) Похоже в pypi магия творится..

Страница 1637 из 9768