
Alexey
12.09.2017
12:25:11
Блядь, ты меня учить сейчас будешь что ли?

Eugine
12.09.2017
12:25:45
эхехе

Ilya
12.09.2017
12:25:55
чот мы не поняли друг друга, я поддержал тебя скорее

Zart
12.09.2017
12:26:10
я слишком груб для этого мира^W^Wбегиннерсов 8(

Google

Roman
12.09.2017
12:26:20
=))

Alexey
12.09.2017
12:27:36
Я тебе о том, что говнотор не даст на две недели скорости нужной и гарантированных нод, а ты мне — что мне надо сделать, чтобы оно заработало?
Зачем? У меня три миллиона проксей в базе и постоянно живых десяток тысяч проверенных полчаса назад максимум.
А тут — треды завези.

Ilya
12.09.2017
12:28:49
ну так условия сразу прописывай, про 2 стабильных недели
Шикарно, мне такую бд всё не дают сделать)
Проще забить уже, ниочём срач же

Alexey
12.09.2017
12:31:08
Ну так ты хуйню говоришь, а потом такой — срач ни о чём. :)

Ilya
12.09.2017
12:31:34
тоже правда есть

Alexey
12.09.2017
12:31:36
Всё сразу было написано. Я просто не совсем представляю как ты сделаешь сорок миллионов запросов последовательно, получишь сотню килобайт с каждого и уложишься в указанный срок.
А вообще, саммари: 2.7, гивенты, риквестсы, ≈2.5 терабайта сырых данных, 450 гигабайт на диске дамп.
Жался дамп в ztsd=9, средняя степень компрессии 6.1х. По качеству как gzip, по скорости стократ пизже. Ещё смотрел в brotli, lz4, lzof, lzma и ещё горку совсем экзотики. zstd рекомендую после этого опыта.
Через неделю-две освобожусь, возьму ещё денег и уже раскидаю в csv это всё.

Google

Alexey
12.09.2017
12:38:56
Если когда-нибудь будет снова такой таск — сделаю динамический пул сразу, потому что днём оптимум был ≈50 тредов, а ночью сотка. Автоподстройку латенси сделал сразу для отбора проксей из горячего пула, а вот на автоподстройке пула воркеров мне стало так впадлу, тем более пиздинг шёл с опережением естимейта во много раз.
Днём постоянно приходилось подстраиваться и принудительно снижать производительность, т.к. у сервиса начали расти таймауты и иногда вылетать бэд гейтвеи.

Andrei
12.09.2017
12:46:27

Alexey
12.09.2017
12:46:34
Нет, они падали.

Andrei
12.09.2017
12:46:39
=D

Alexey
12.09.2017
12:47:08
Они заподозрили когда я бенчмаркал вообще как там чо какие цифры можно выбить и в 50 тредов начал забирать напрямую в начале. После ≈10к запроса бан.

Andrei
12.09.2017
12:49:02
интересно, автоматом бан прилетел что ли

Alexey
12.09.2017
12:49:14
Да, автоматика, это тоже проверял.
Банить глупо. Я когда меня парсят — автоматом начинаю отдавать всё, что угодно, кроме целевой страницы. Пусть парсят на здоровье, лолушки, и таймауты поднимаю, чтобы никуда не торопились от меня уходить.

luchezar
12.09.2017
12:51:13

Alexey
12.09.2017
12:51:36
Ну так ты или парси как положено — не доводя до высокой нагрузки и не мешая никому, или сам страдай, идиот.

luchezar
12.09.2017
12:51:43
чтоб совсем охуели надол еще поднимать страницы похожие по тэгам на целевые но со всякой хуетой вынутри
э

Alexey
12.09.2017
12:51:50
Так естественно.

ultranoise ?
12.09.2017
12:52:13
Нагонять трафик ща чужой счёт лол

Alexey
12.09.2017
12:52:29
Ещё рандомный ответ выкидывается, хошь 200, хошь 201, хошь 276 (не спрашивай меня что это), хошь I'm a teapot.

ultranoise ?
12.09.2017
12:52:57
:(

Alexey
12.09.2017
12:53:24
Не слышал ни разу, чтобы при тупом „скачать, dom разобрать, взять по xpath вот тут и тут” кто-нибудь эвалил жс просто так и подгятивал скрипты.

Google

Alexey
12.09.2017
12:53:28

luchezar
12.09.2017
12:55:25
а вот хуеты налить - будут часами ее выуживать

Alexey
12.09.2017
12:56:32
Именно. :3
Придут снова — снова получат какой-нибудь фортель.
Придут нормально и не мешая работать — да пожалуйста.
Короче, не будь пидором, делай нормально и нормально будет.

Andrei
12.09.2017
14:46:57
стикер даже сварганил

Alexey
12.09.2017
14:49:38
Этому стикеру сто лет.

Eugine
12.09.2017
14:50:45
если ты понимаешь о чем я

Andrei
12.09.2017
15:05:22
http://prosto.toys/catalog/vovka-i-pechka.html

Eugine
12.09.2017
15:06:31
вот я и нашел нового маскота на работу, блэт

Andrei
12.09.2017
15:07:51

Eugine
12.09.2017
15:08:02
этих профессиональных праздников - как говна
простите

Alexey
12.09.2017
15:08:10
2 ** 8
?

Andrei
12.09.2017
15:08:48
ага
год не високосный, так что...

Alexey
12.09.2017
15:11:02
Отмечать надо 255 день.

Google

Alexey
12.09.2017
15:11:10
Т.е. 256 — это уже 2**9.

Andrei
12.09.2017
15:11:40
ну заметь там же декабрь 31

Alexey
12.09.2017
15:11:48
Уговорил.

Andrei
12.09.2017
15:12:21
уговорил

Admin
ERROR: S client not available

Andrei
12.09.2017
15:12:52
ежели по грамоте от нуля

Alexey
12.09.2017
15:12:56
Это дистанция 255.
O(1).

Andrei
12.09.2017
15:13:56
ну да, полных 255, и 256th отмечаемый
к тому же первый день - первый, а не нулевой

Roman
12.09.2017
16:09:42
@zartsoft отчего setup.py sdist строит архив, в котором сабпакеджы внезапно превращаются в один плоский пакедж?

Zart
12.09.2017
16:11:00
ват

Roman
12.09.2017
16:11:10
но, есть один момент: в пакедже есть сабпакедж с именем pref, а внутри файл: pref/pref_name.py pref/pref_name2.py
может ли вот это pref_ влиять?

Zart
12.09.2017
16:11:30
чот нихуа не пони
MANIFEST.in проверял?

Roman
12.09.2017
16:13:21
Zart а нет манифеста

Zart
12.09.2017
16:13:58
ну

Dmitry
12.09.2017
16:14:18
нуу. такое

Google

Zart
12.09.2017
16:14:50
я хз как ты умудрился.. а плагины не стоят случаем?

Roman
12.09.2017
16:15:21
просто есть setup(... package=find_packages() ...)
нет, плагинов нет. ну и не я сделал, я просто удивился, когда полез в site-packages/name/. а там всё плоское
да еще и __init__ из сабмодуля перетёр __init__ из корня

Zart
12.09.2017
16:16:42
эээ
херня какая-то

Roman
12.09.2017
16:16:56
угу

Zart
12.09.2017
16:16:59
скинуть можешь, на посмотреть?
или нда и всё такое

Roman
12.09.2017
16:17:10
ну да, nda
попробую сам поковырять

Zart
12.09.2017
16:17:30
в общем сдист генерится строго по MANIFEST

Roman
12.09.2017
16:17:31
важно, что это не я дурак, а так быть не должно

Zart
12.09.2017
16:18:24
MANIFEST генерится либо из MANIFEST.in, если есть
если нет - оправшивается плагин контроля версий, если установлен
если ничо нет - дефолтная авто логика - взять все *.py, README/CHANGELOG/LICENSE в корне
сетап.кфг и там еще чота по мелочи

Roman
12.09.2017
16:18:43
Zart http://setuptools.readthedocs.io/en/latest/setuptools.html
Automatically include all relevant files in your source distributions, without needing to create a MANIFEST.in file, and without having to force regeneration of the MANIFEST file when your source tree changes.

Zart
12.09.2017
16:18:58
в любом случае я не помню чтобы хоть где-то было вот такое изменение структуры

Dmitry
12.09.2017
16:19:26
да чо нда, выкинь все лишнее, кроме инитов и этих преф_нэйм, а сами файлы оставь пустыми