
b0g3r
18.10.2016
16:37:12
возможно лишний пробел в начале

Nikolay
18.10.2016
16:39:11
сюда md завезут нет?

Pavel
18.10.2016
16:47:55
Обратные кавычки давно есть

b0g3r
18.10.2016
16:57:40

Google

Belskikh
18.10.2016
16:58:01
Всем привет. Накидайте, плз, идей, на чем прокачаться в краулинге, чтобы на апворк начать зарабатывать от 50$ в минуту? Ну или просто хотя бы начать что-то зарабатывать... Хоть немного..?

Alex
18.10.2016
17:02:37

Belskikh
18.10.2016
17:03:02
Это смешная шуточка

Dmitry
18.10.2016
17:03:31

Игорь
18.10.2016
17:03:43

Alex
18.10.2016
17:03:59

Игорь
18.10.2016
17:04:04
и еще $99000 терять в еще 100500 транзакций

Belskikh
18.10.2016
17:04:04
Если серьезно - какие навыки натренить, чтобы начать получать заказы га апворке

Игорь
18.10.2016
17:04:08
параллельно!

Aragaer
18.10.2016
17:04:11
о, надо будет сходить еще раз на апворк, мож найдется мне там какая работа

Игорь
18.10.2016
17:04:14
в одну минуту!

Aragaer
18.10.2016
17:04:16
а то ну ваще ничего

Alex
18.10.2016
17:04:32

Google

Alex
18.10.2016
17:05:58

Игорь
18.10.2016
17:06:17
Умеешь или нет, а?
с хуя ли?
не умею и не стремлюсь, да и если бы — там одно железо стоит миллионы

Alex
18.10.2016
17:07:24
Реальное задание, встречал подобное на Upwork.

Belskikh
18.10.2016
17:08:23
Збазиба…?

Alex
18.10.2016
17:09:53
Про XPath почитай.
А я тебя вообще правильно понял? Что такое краулинг? ?

Yuryhalf
18.10.2016
17:10:53
?
Я пока знаю как потратить 50 бачей за минуту,обратному хотелось бы научиться?

Belskikh
18.10.2016
17:11:52
Песня линкинпарка

Yuryhalf
18.10.2016
17:12:12

Alex
18.10.2016
17:12:23
Этому тебя в армии научат!

Yuryhalf
18.10.2016
17:12:50
Я уже был
Не научили
?

Alex
18.10.2016
17:14:20

Belskikh
18.10.2016
17:20:59
Веб краулинг
Добыча данных с сайтов в автоматических режимах
Возможно, с обходом капчи и тп. Асинхронно там, с большой скоростью

Google

Belskikh
18.10.2016
17:22:42
Хочу краулить на уровне лучших чуваков мира

Alex
18.10.2016
17:22:58
Ясно. На мой взгляд, самый простой способ это изучить Scrapy. Кому-то Grab больше нравится, но я его не пробовал.
Капчи разгадываются сервисами типа антигейта.
Scrapy асинхронный. Достаточно быстрый.

Belskikh
18.10.2016
17:23:00
Без регистрации и смс, разумеется?

Yuryhalf
18.10.2016
17:23:13
В медиалогии краулят дофига

Belskikh
18.10.2016
17:23:19
Скрапи асинхронный уже?

Alex
18.10.2016
17:23:20
Он на Twisted сделан.
"Scrapy is built on top of the Twisted asynchronous networking library"

Belskikh
18.10.2016
17:23:52
Огонь

Alex
18.10.2016
17:24:26

Yuryhalf
18.10.2016
17:24:48
Друг работает,у них была система которой пользовался кремль

Belskikh
18.10.2016
17:24:54
А вообще спасибо, дай обниму

Alex
18.10.2016
17:24:58

Yuryhalf
18.10.2016
17:24:58
Аналитика
Упоминания в сми ,соц сетях и тд
А щас чинуши чето другое начали юзать

Nikolay
18.10.2016
17:26:20
вот когда чуваку надо, допустим, 10к единиц и не меньше - надежды нет
он много теряет

Google

Alex
18.10.2016
17:27:01
Что такое 10к единиц и не меньше?

Yuryhalf
18.10.2016
17:27:05
Насколько я понял это норм бизнес,данные краулеров продают причем весьма успешно всяким аналитическим агентствам

Alex
18.10.2016
17:27:19

Nikolay
18.10.2016
17:27:51
нормальный стек: selenium + js (экстрактнуть линки в файл txt), потом wget/curl выкачать эти паги, потом python+bs4 и тогда есть уверенность что всё будет как надо, без косяков со стороны либы/фреймворка по типу scrapy
амазон не дураки; там за чаще чем 3 req/s заглушку ставят

Alex
18.10.2016
17:28:48

Yuryhalf
18.10.2016
17:28:55

Nikolay
18.10.2016
17:29:05
а прокси они не заглушат, да?

Yuryhalf
18.10.2016
17:29:15
Ее поделка зовется "Катюшей"?

Admin
ERROR: S client not available

Alex
18.10.2016
17:29:43
Делись

Nikolay
18.10.2016
17:30:20
не жадничать; sleep ставить; я селениумом его одолеваю
максимум что было это 10к ASIN-ов; за 3 дня неспешно одолел
пока я смотрел фильмы
пока течет мой любимый кетчуп

Alex
18.10.2016
17:31:06

Nikolay
18.10.2016
17:32:21
плюс очень полезно для такого типа деятельности иметь vps в usa и где-нибудь в германии

Alex
18.10.2016
17:32:24
Ну так если много прокси, то это быстрее же. Быстрее выполняешь работу, значит можешь выполнять больше заказов. Т.е. зарабатывать больше денег.
Или я чего-то не понимаю? Так же не жадничая на каждом прокси качаешь и льешь кетчуп.

Google

Yuryhalf
18.10.2016
17:33:16
Валидные прокси нужны только
И лучше https

Alex
18.10.2016
17:33:34
Очевидно

Yuryhalf
18.10.2016
17:33:40
:)

Nikolay
18.10.2016
17:33:44
не знай как у других, у меня хромдрайвер скрипя мозгами запускается
images/js disabled

Yuryhalf
18.10.2016
17:34:43
Я видел краулер на ie???
Это нечто

Nikolay
18.10.2016
17:34:53

Yuryhalf
18.10.2016
17:35:10
100500 окон браузера
На вин7

Alex
18.10.2016
17:35:31

Nikolay
18.10.2016
17:35:50

Alex
18.10.2016
17:35:55
Напиши

Yuryhalf
18.10.2016
17:36:17
Это возможно?
Не в теории

Nikolay
18.10.2016
17:36:45
поидее можно хостом локалхост с портом указать, на локалхосте py-скрипт склушает и в бесконечно цикле next-ит из листа по кругу хосты на каждое обращение

Bo0oM
18.10.2016
17:36:51
А phantomjs? У меня в нем гулялка

Nikolay
18.10.2016
17:37:59

Yuryhalf
18.10.2016
17:38:39

Arcady
18.10.2016
17:38:49
Всем привет) Похоже в pypi магия творится..