
Dorian
23.02.2017
15:49:34
пруф есть?

Serge
23.02.2017
15:49:36

Ivan
23.02.2017
15:49:48
да и достаточно сервисов которые палят историю А записей, по ней выичисляется твой дц и дальше простым сканированием большинство сайтов можно найти

Google

Dorian
23.02.2017
15:50:49
какой bps?

Serge
23.02.2017
15:51:35

Vladimir
23.02.2017
15:52:01
на уровне того же nginx'а как динамику

Ivan
23.02.2017
15:52:56
можно локации закрывать limit rate-ом

Serge
23.02.2017
15:53:08
Нет это же всякие каталоги там вариантов параметров будет очень много

Vladimir
23.02.2017
15:54:04
и вероятно с ними общайся на эту тему предметно

Dorian
23.02.2017
15:54:49
если всё так плохо с кодом, може балансер поставить ?

Vladimir
23.02.2017
15:55:17
да кстати, тоже вариант - взять десятка 3-4 говновпсок по 5 баксов и замутить из них сложную распределенную схему
но в код придется лезть вероятно

Ivan
23.02.2017
15:55:31

Google

Ivan
23.02.2017
15:55:33
мы же девопсы

Vladimir
23.02.2017
15:56:15

Serge
23.02.2017
15:56:20
Спс за советы попробую cloudflare, а там видно будет.

Vladimir
23.02.2017
15:56:43

Ivan
23.02.2017
15:56:48

Serge
23.02.2017
15:57:02

Viktor
23.02.2017
15:57:21
https://security.googleblog.com/2017/02/announcing-first-sha1-collision.html

Dorian
23.02.2017
15:57:44
приходилось пользоваться

Serge
23.02.2017
15:58:06
Я там выбрал Security Level: I'm Under Attack!
Но еще DNS меняются пока не вижу

Ivan
23.02.2017
16:01:10
в ру зоне днс вообще медленно меняются

Serge
23.02.2017
16:01:24
Может кто еще опыт имел с таким. Допустим я знаю что с конкретной ВПС идет спам пакетами на сайт. Впска Digitalocean, если им написать будет ли какая-то реакция. Или "это обычный краулинг", ничего поделать не можем

Vladimir
23.02.2017
16:01:45

Ivan
23.02.2017
16:02:00
посмори их tos
можно ли, и если да, то можно смело в abuse писать, приложив дамп пакетиков

Serge
23.02.2017
16:02:36

Ivan
23.02.2017
16:02:45
terms of service
или как там эта штука у них называется
ну в общем где написано что можно а что нельзя

Google

Viktor
23.02.2017
16:03:18

Serge
23.02.2017
16:04:23
user-agent какой?
Когда только началось это был Python-urllib/2.7 ну это само собой понятно. Он был успешно отправлен в бан. Но у питона есть баблиотечки вроде python-grab который позволяют полностью иммитировать юзер агента пользователя

Dorian
23.02.2017
16:04:32
я бы сурикату всё-таки поставил
чтобы стата полная была

Alex
23.02.2017
16:45:04
Если с конкретного адреса идёт спам, то неужели нельзя заблочить его? Капчу сделать и т.п? Если это обычный спам, то для хостера это равнозначно краулингу. И естественно это уже проблема ваша
Может кто еще опыт имел с таким. Допустим я знаю что с конкретной ВПС идет спам пакетами на сайт. Впска Digitalocean, если им написать будет ли какая-то реакция. Или "это обычный краулинг", ничего поделать не можем
Юзер агента проверять смысла нет, прошлый век

Serge
23.02.2017
16:49:15

Alex
23.02.2017
16:52:22
Значит подсеть надо банить временно что бы имидж ресурса не страдал. Меньшее из зол если реальный спам. Или выводить валидатор типа капчи для клиентов из подсети. Я так понял у вас никакой фильтрации трафика нет. Все ручками

Serge
23.02.2017
16:53:24
Там не подсеть там большой проксилист, руками все это банить накладно

Дмитрий
23.02.2017
16:54:15
Проверьте все поля в http заголовке, не только юзер агент

Serge
23.02.2017
16:54:47
Вижу что в логах nginx или там не весь?

Дмитрий
23.02.2017
16:56:25

Alex
23.02.2017
16:56:30
Если прокси лист то дохлый номер. Заголовки и Вовочки научились проставлять

Дмитрий
23.02.2017
16:57:18
Я говорю, мало проставить, нужно ещё не забыть про верный порядок

Alex
23.02.2017
16:57:28

Александр
23.02.2017
16:58:15

Alex
23.02.2017
16:58:17
Тогда уж лучше на разрешение смотреть и соответствие юзер агенту
Я говорю, мало проставить, нужно ещё не забыть про верный порядок
Все вкупе и все равно не панацея

Google

Дмитрий
23.02.2017
16:59:07
Панацея есть

Serge
23.02.2017
16:59:09
Кейчас идет так как только меняетя юзер агент у меня сервер падает
потому чтто сейчас баню по юезр агенту

Alex
23.02.2017
16:59:40
Я бы тебя спарсил)
Панацея есть

Дмитрий
23.02.2017
16:59:44

Alex
23.02.2017
17:00:54
Нет панацеи никакой если это паблик

Дмитрий
23.02.2017
17:02:39
Можно собирать такое внушительное количество параметров, что парсер, реально обходящий такую защиту будет просто не по карману

Alex
23.02.2017
17:06:48
Суть в том, что если у человека огромный прокси лист и мозги на месте, то он может что угодно собрать. Единственный гемор для спама и парсера- это закрытые страницы. Да и это обходится в раскрутке аккаунтов соц.сетей через привязку бота к ип. Эмулировать поведение юзера научились люди. И заголовки проставлять
Причём так умело что боты живут в соц сетях месяцами
Чего говорить про обычный сайт

Дмитрий
23.02.2017
17:10:20
Ну значит защищать такие сайты просто не выгодно
Когда люди хотят - они делают)

Alex
23.02.2017
17:11:08
Я бы от спама капчу поставил интересную какую нибудь
Конверсия вниз, но зато и фейла не будет. За спам ещё и сайт закрыть могут
Удар по имиджу


Дмитрий
23.02.2017
17:23:55
Суть в том, что если у человека огромный прокси лист и мозги на месте, то он может что угодно собрать. Единственный гемор для спама и парсера- это закрытые страницы. Да и это обходится в раскрутке аккаунтов соц.сетей через привязку бота к ип. Эмулировать поведение юзера научились люди. И заголовки проставлять
Загибай пальцы
Координаты окна, координаты смещения окна, доступная площадь экрана, массив координат кликов мыши, массив времени кликов мыши, дисперсия обоих параметров, таймзона и ряд других региональных настроек, фича-детектинг браузера и его соответствие с декларируемым, проверки, на которых валися фантом, проверки на которых валится электрон, наличие do not traсk (какая ирония) список шрифтов в системе, список плагинов в системе и их точные версии, число глобальных переменных в window, поведение при кратковременной высокой нагрузке - уникальный "маркер" системы, про порядок http заголовков и их соответствие реальным браузерам я уже писал - это далеко не полный список того, что тебе придётся достоверно эмулировать, чтобы автоматически спарсить хотя бы десять страниц сайта, серьезно относящегося к защите от краулеров


Alex
23.02.2017
17:26:50
Что мне загибать пальцы. Что бы это детектировать надо что бы загрузился js. До этого момента можно легко обработать страницу. Так же если у меня динамический лист прокси все не забанишь. Но даже без запаса ты сможешь как клики эмулировать в области меню, скролл, события перехода. Реферер.
Это все делается легко

Google

Alex
23.02.2017
17:27:36
Составить список пунктов меню, вычислить позицию и сжмулирывать клик

Дмитрий
23.02.2017
17:27:47
Тебе просто не отдадут никакой инфы пока не пройдёшь вышеописанную валидацию


Viktor
23.02.2017
17:28:39
Загибай пальцы
Координаты окна, координаты смещения окна, доступная площадь экрана, массив координат кликов мыши, массив времени кликов мыши, дисперсия обоих параметров, таймзона и ряд других региональных настроек, фича-детектинг браузера и его соответствие с декларируемым, проверки, на которых валися фантом, проверки на которых валится электрон, наличие do not traсk (какая ирония) список шрифтов в системе, список плагинов в системе и их точные версии, число глобальных переменных в window, поведение при кратковременной высокой нагрузке - уникальный "маркер" системы, про порядок http заголовков и их соответствие реальным браузерам я уже писал - это далеко не полный список того, что тебе придётся достоверно эмулировать, чтобы автоматически спарсить хотя бы десять страниц сайта, серьезно относящегося к защите от краулеров
Чем это спасёт от селениума?

Annet
23.02.2017
17:29:18
php

Alex
23.02.2017
17:29:23
В общем не убедил, это все легко эмулировать

Дмитрий
23.02.2017
17:29:42
Чем это спасёт от селениума?
Тем что сервис будет знать, что это твой селениум, и когда ты последовательно залогинишься с него из гватемалы и бразилии - тебя забанят

Viktor
23.02.2017
17:31:11

Дмитрий
23.02.2017
17:31:16
Как ты сэмулируешь то, что твой фантом выполнит ряд функций по своему из-за кривой реализации, чем выдаст себя с головой

Alex
23.02.2017
17:31:22
Я тебе сказал- клиент всегда получит полноценную страницу. Ни кто не валидирует не авторищованого клиента по кликам. Потому что html он получит До этого момента. А дальше бань хоть весь интернет когда за бортом тысяча динамик прокси
Фантом нормально и чётко работает
У вас он даже тек вроде по памяти потому что не научились с ним работать
И фантом здесь не причём. Тот же селениум

Дмитрий
23.02.2017
17:34:12

Alex
23.02.2017
17:35:07
Я сказал с самого начала- это не панацея все что ты говоришь
Вообще

Дмитрий
23.02.2017
17:35:15
Для нормального юзера это будет едва заметный белый экран перед окном логина, для тебя - непроходимая головная боль

Alex
23.02.2017
17:36:11
Это усложняет задачу, но никогда не поможет защититься на 100 процентов