@python_beginnersЭта группа больше не существует

Страница 922 из 1885
Константин
14.12.2016
14:55:15
или у тебя "уникальный контент"?

Aleksey
14.12.2016
14:58:50
или у тебя "уникальный контент"?
Да "уникальный", лучше чтобы, зайти сразу в несколько акков и поочередно в ассихронном виде утескивать пока напарсил ак -> пока отдыхает, другой парсит, потом те отдыхают , третий парсит, потом снова 1 парсит

Константин
14.12.2016
15:00:02
тогда действуй по алгоритму, описанному выше

+ async

Google
Константин
14.12.2016
15:00:51
привет хованскому

Vadim
14.12.2016
15:03:09
Какому бля

Aleksey
14.12.2016
15:03:11
тогда действуй по алгоритму, описанному выше
Дак получается для каждого аккаунта придется по несколько раз выполнять логин и логаут?

Какому бля
Хованский ака пес защеканский

Константин
14.12.2016
15:05:25
Дак получается для каждого аккаунта придется по несколько раз выполнять логин и логаут?
нет конечно, ты дашь csv из 30 логинов и тебе дадут пять разных сессий на это

ну не тупи, конечно придется каждый раз логиниться

либо не терять сессию

Pavel
14.12.2016
15:06:04
Дак получается для каждого аккаунта придется по несколько раз выполнять логин и логаут?
Логаут делать не надо. Сохраняй куки каждого аккаунта, и будет хорошо.

Aleksey
14.12.2016
15:07:38
либо не терять сессию
Куки и сессию для каждого акка сохранять в файле

Константин
14.12.2016
15:08:59
куки

Pavel
14.12.2016
15:09:15
Dmitriy
14.12.2016
15:09:22
Главное не злоупотреблять

Google
Dmitriy
14.12.2016
15:09:28
Иначе нарвешься на капчу

Pavel
14.12.2016
15:09:56
Иначе нарвешься на капчу
На ютубе все ещё простая графическая капча?

Aleksey
14.12.2016
15:10:22
Иначе нарвешься на капчу
На край можно антикапчу прикрутить

Dmitriy
14.12.2016
15:10:29
На ютубе все ещё простая графическая капча?
Сейчас не знаю, ip статичный, давно не видел

Константин
14.12.2016
15:10:48
Dmitriy
14.12.2016
15:11:10
Года 3 назад видел, на мтс модеме вроде простую

Pavel
14.12.2016
15:11:37
не совсем)
Ну расскажи мне про разницу со стороны клиента. ?

Aleksey
14.12.2016
15:12:15
А если бы golang взять, то все шепело не по детски, там типо горутины?

Aleksey
14.12.2016
15:12:53
Бери кресты вообще
Кресты сложна

Константин
14.12.2016
15:13:01
Ну расскажи мне про разницу со стороны клиента. ?
со стороны клиенты и https от http мало чем отличается

только вопросы глупые заадет про сертификаты

Pavel
14.12.2016
15:14:04
только вопросы глупые заадет про сертификаты
requests умеет игнорировать косячные сертификаты.

Константин
14.12.2016
15:14:36
значит протоколы в принципе равны?

Pavel
14.12.2016
15:15:06
значит протоколы в принципе равны?
Для питон кода, который грабает страницу - да.

Константин
14.12.2016
15:15:26
facepalm

Dmitriy
14.12.2016
15:15:27
Гм. Через тор ютуб нормально работает, а тот же гугловский поисковик иногда выдает 2 вида капч

Константин
14.12.2016
15:15:29
.pjg

jpg*

Google
Pavel
14.12.2016
15:16:26
jpg*
Слова-то есть, или на картинки переходим?

Aleksey
14.12.2016
15:17:07
requests умеет игнорировать косячные сертификаты.
В requests можно залогиниться сразу в нескольких аккаунтов , штучек 10, эта либа не подвиснит??? Или лучше взять новую http либу для python 3.5(не помню как она называется, но поскорости круче нод жс)

Константин
14.12.2016
15:17:23
на личности, на самом деле не вижу поля для дискуссии с тобой

Для питон кода, который грабает страницу - да.
для кода может быть, для rfc вряд ли

Denis
14.12.2016
15:18:03
А при чем тут rfc?

Pavel
14.12.2016
15:18:20
import requests requests. get('http://ya.RU') requests. get ('https://ya.RU')

Константин
14.12.2016
15:18:25
мы про http и https говорили, человек сказал, что в принципе по хуй

я отойду на 10 минут

но обязательно вернусь

Pavel
14.12.2016
15:18:52
Похуй для питон кода грабера

И даже код показал.

Zart
14.12.2016
15:20:17
скорость твоего бана на сервисе вряд ли будет зависеть от скорости питона/го

Aleksey
14.12.2016
15:20:46
import requests requests. get('http://ya.RU') requests. get ('https://ya.RU')
Я хз, asinc + iohttp в 20 раз быстрее requests

Denis
14.12.2016
15:21:03
Zart
14.12.2016
15:21:15
какими потоками...

Denis
14.12.2016
15:21:47
requests в 20 потоков довольно быстро работает, если бан не волнует

Dmitriy
14.12.2016
15:22:55
Aleksey
14.12.2016
15:23:21
Это с потоками?
вот видео http://www.youtube.com/watch?v=M8Z65tAl5l4

Alex
14.12.2016
15:23:50
requests в 20 потоков довольно быстро работает, если бан не волнует
если юзать еще сессии в requests то будет еще чуток быстрее.

Denis
14.12.2016
15:24:23
вот видео http://www.youtube.com/watch?v=M8Z65tAl5l4
5.98 против 4.42, где тут 20 раз?

Google
Aleksey
14.12.2016
15:24:32
Точная арифметика
Это так от балды, виде выше посмотри

Dmitriy
14.12.2016
15:25:41
Это так от балды, виде выше посмотри
В этом случае могут параметры соединения с сервером влиять на результат

Если у тебя аккаунтов сто и диалап, то никакого профита практически не будет

Также и с особо быстрым соединением, но это маленько другая история

Aleksey
14.12.2016
15:30:04
5.98 против 4.42, где тут 20 раз?
Сорри имел в виду новую супер http либу uvloop

Константин
14.12.2016
15:31:32
Сорри имел в виду новую супер http либу uvloop
вот как человек заговорил, сорян за грубость

Denis
14.12.2016
15:31:50
Тебя все равно забанят раньше, чем твой uvloop успеет разогнаться

Константин
14.12.2016
15:32:56
если сделать несколько впн и каждый поток через разны тащить?

Aleksey
14.12.2016
15:34:45
Admin
ERROR: S client not available

Dmitriy
14.12.2016
15:35:45
Вот как раз прокси то могут уже быть забанены

Aleksey
14.12.2016
15:36:06
Denis
14.12.2016
15:36:29
Zart
14.12.2016
15:37:04
самое главное - не забудьте для своей хуйни нарисовать логотип. красненький патаму шта БЫСТРЕЕ

twwlf
14.12.2016
15:37:25
RED GOES FASTA

Pavel
14.12.2016
15:37:27
Не падайте раньше выстрела.

Константин
14.12.2016
15:37:37
Aleksey тебе какие данные нужны в итоге?

на газете без меня

Aleksey
14.12.2016
15:38:21
самое главное - не забудьте для своей хуйни нарисовать логотип. красненький патаму шта БЫСТРЕЕ
Ахаааа)хацкер, лучше бы норм рекомендации дал, как построить архитектуру

Google
Anton
14.12.2016
15:40:20
привет. такой вопрос. Есть csv файл. В каждой строке по 5 значений через запятую. Если 4 значение равно 0 , строку нужно удалить. Как это можно реализовать?

Aleksey
14.12.2016
15:40:57
Или просто лучше взять requests + thred + multiprocessing ???

Константин
14.12.2016
15:41:14
1.смотришь строку 2. равно 0? = удаляешь 3. следующая строка

Pavel
14.12.2016
15:41:32
Anton
14.12.2016
15:41:53
можно пример кода?) вот я прочел через readlines

Aleksey
14.12.2016
15:41:59
Anton
14.12.2016
15:41:59
получил список

Older
14.12.2016
15:42:24
Робяты, кто-нибудь заморачивался по подсчету CRC?

Pavel
14.12.2016
15:42:29
можно пример кода?) вот я прочел через readlines
Ну и зря, есть модуль CSV для этого.

Older
14.12.2016
15:46:23
что за адлер?

Aleksey
14.12.2016
15:47:12
берешь скрапи. профит
Скрапи да, не детская библиотека , как следует дает жару . А если ее сравнить, например с с#, даст прикурить али нет?

Igor
14.12.2016
15:47:24
что за адлер?
город такой рядом с сочи

Михаил
14.12.2016
15:50:18
import shutil in_file = 'in.csv' tmp_file = 'tmp.csv' with open(in_file, 'r') as csv: with open(tmp_file, 'w') as csv_out: for l in csv: s = l.split(',') if len(s) >= 4 and s[3].strip() != '0': csv_out.write(l) shutil.move(tmp_file, in_file)

Zart
14.12.2016
15:50:23
что за адлер?
алгоритм CRC, используемый в zip

https://docs.python.org/3/library/zlib.html#zlib.adler32

Михаил
14.12.2016
15:52:25
ага только не endswith а 4-й столбец

Страница 922 из 1885

Эта группа больше не существует Эта группа больше не существует