Dorian
23.02.2017
15:49:34
пруф есть?
Serge
23.02.2017
15:49:36
Ivan
23.02.2017
15:49:48
да и достаточно сервисов которые палят историю А записей, по ней выичисляется твой дц и дальше простым сканированием большинство сайтов можно найти
Google
Dorian
23.02.2017
15:50:49
какой bps?
Serge
23.02.2017
15:51:35
Vladimir
23.02.2017
15:52:01
на уровне того же nginx'а как динамику
Ivan
23.02.2017
15:52:56
можно локации закрывать limit rate-ом
Serge
23.02.2017
15:53:08
Нет это же всякие каталоги там вариантов параметров будет очень много
Vladimir
23.02.2017
15:54:04
и вероятно с ними общайся на эту тему предметно
Dorian
23.02.2017
15:54:49
если всё так плохо с кодом, може балансер поставить ?
Vladimir
23.02.2017
15:55:17
да кстати, тоже вариант - взять десятка 3-4 говновпсок по 5 баксов и замутить из них сложную распределенную схему
но в код придется лезть вероятно
Ivan
23.02.2017
15:55:31
Google
Ivan
23.02.2017
15:55:33
мы же девопсы
Vladimir
23.02.2017
15:56:15
Serge
23.02.2017
15:56:20
Спс за советы попробую cloudflare, а там видно будет.
Vladimir
23.02.2017
15:56:43
Ivan
23.02.2017
15:56:48
Serge
23.02.2017
15:57:02
Viktor
23.02.2017
15:57:21
https://security.googleblog.com/2017/02/announcing-first-sha1-collision.html
Dorian
23.02.2017
15:57:44
приходилось пользоваться
Serge
23.02.2017
15:58:06
Я там выбрал Security Level: I'm Under Attack!
Но еще DNS меняются пока не вижу
Ivan
23.02.2017
16:01:10
в ру зоне днс вообще медленно меняются
Serge
23.02.2017
16:01:24
Может кто еще опыт имел с таким. Допустим я знаю что с конкретной ВПС идет спам пакетами на сайт. Впска Digitalocean, если им написать будет ли какая-то реакция. Или "это обычный краулинг", ничего поделать не можем
Vladimir
23.02.2017
16:01:45
Ivan
23.02.2017
16:02:00
посмори их tos
можно ли, и если да, то можно смело в abuse писать, приложив дамп пакетиков
Serge
23.02.2017
16:02:36
Ivan
23.02.2017
16:02:45
terms of service
или как там эта штука у них называется
ну в общем где написано что можно а что нельзя
Google
Viktor
23.02.2017
16:03:18
Serge
23.02.2017
16:04:23
user-agent какой?
Когда только началось это был Python-urllib/2.7 ну это само собой понятно. Он был успешно отправлен в бан. Но у питона есть баблиотечки вроде python-grab который позволяют полностью иммитировать юзер агента пользователя
Dorian
23.02.2017
16:04:32
я бы сурикату всё-таки поставил
чтобы стата полная была
Alex
23.02.2017
16:45:04
Если с конкретного адреса идёт спам, то неужели нельзя заблочить его? Капчу сделать и т.п? Если это обычный спам, то для хостера это равнозначно краулингу. И естественно это уже проблема ваша
Может кто еще опыт имел с таким. Допустим я знаю что с конкретной ВПС идет спам пакетами на сайт. Впска Digitalocean, если им написать будет ли какая-то реакция. Или "это обычный краулинг", ничего поделать не можем
Юзер агента проверять смысла нет, прошлый век
Serge
23.02.2017
16:49:15
Alex
23.02.2017
16:52:22
Значит подсеть надо банить временно что бы имидж ресурса не страдал. Меньшее из зол если реальный спам. Или выводить валидатор типа капчи для клиентов из подсети. Я так понял у вас никакой фильтрации трафика нет. Все ручками
Serge
23.02.2017
16:53:24
Там не подсеть там большой проксилист, руками все это банить накладно
Дмитрий
23.02.2017
16:54:15
Проверьте все поля в http заголовке, не только юзер агент
Serge
23.02.2017
16:54:47
Вижу что в логах nginx или там не весь?
Дмитрий
23.02.2017
16:56:25
Alex
23.02.2017
16:56:30
Если прокси лист то дохлый номер. Заголовки и Вовочки научились проставлять
Дмитрий
23.02.2017
16:57:18
Я говорю, мало проставить, нужно ещё не забыть про верный порядок
Alex
23.02.2017
16:57:28
Александр
23.02.2017
16:58:15
Alex
23.02.2017
16:58:17
Тогда уж лучше на разрешение смотреть и соответствие юзер агенту
Я говорю, мало проставить, нужно ещё не забыть про верный порядок
Все вкупе и все равно не панацея
Google
Дмитрий
23.02.2017
16:59:07
Панацея есть
Serge
23.02.2017
16:59:09
Кейчас идет так как только меняетя юзер агент у меня сервер падает
потому чтто сейчас баню по юезр агенту
Alex
23.02.2017
16:59:40
Я бы тебя спарсил)
Панацея есть
Дмитрий
23.02.2017
16:59:44
Alex
23.02.2017
17:00:54
Нет панацеи никакой если это паблик
Дмитрий
23.02.2017
17:02:39
Можно собирать такое внушительное количество параметров, что парсер, реально обходящий такую защиту будет просто не по карману
Alex
23.02.2017
17:06:48
Суть в том, что если у человека огромный прокси лист и мозги на месте, то он может что угодно собрать. Единственный гемор для спама и парсера- это закрытые страницы. Да и это обходится в раскрутке аккаунтов соц.сетей через привязку бота к ип. Эмулировать поведение юзера научились люди. И заголовки проставлять
Причём так умело что боты живут в соц сетях месяцами
Чего говорить про обычный сайт
Дмитрий
23.02.2017
17:10:20
Ну значит защищать такие сайты просто не выгодно
Когда люди хотят - они делают)
Alex
23.02.2017
17:11:08
Я бы от спама капчу поставил интересную какую нибудь
Конверсия вниз, но зато и фейла не будет. За спам ещё и сайт закрыть могут
Удар по имиджу
Дмитрий
23.02.2017
17:23:55
Суть в том, что если у человека огромный прокси лист и мозги на месте, то он может что угодно собрать. Единственный гемор для спама и парсера- это закрытые страницы. Да и это обходится в раскрутке аккаунтов соц.сетей через привязку бота к ип. Эмулировать поведение юзера научились люди. И заголовки проставлять
Загибай пальцы
Координаты окна, координаты смещения окна, доступная площадь экрана, массив координат кликов мыши, массив времени кликов мыши, дисперсия обоих параметров, таймзона и ряд других региональных настроек, фича-детектинг браузера и его соответствие с декларируемым, проверки, на которых валися фантом, проверки на которых валится электрон, наличие do not traсk (какая ирония) список шрифтов в системе, список плагинов в системе и их точные версии, число глобальных переменных в window, поведение при кратковременной высокой нагрузке - уникальный "маркер" системы, про порядок http заголовков и их соответствие реальным браузерам я уже писал - это далеко не полный список того, что тебе придётся достоверно эмулировать, чтобы автоматически спарсить хотя бы десять страниц сайта, серьезно относящегося к защите от краулеров
Alex
23.02.2017
17:26:50
Что мне загибать пальцы. Что бы это детектировать надо что бы загрузился js. До этого момента можно легко обработать страницу. Так же если у меня динамический лист прокси все не забанишь. Но даже без запаса ты сможешь как клики эмулировать в области меню, скролл, события перехода. Реферер.
Это все делается легко
Google
Alex
23.02.2017
17:27:36
Составить список пунктов меню, вычислить позицию и сжмулирывать клик
Дмитрий
23.02.2017
17:27:47
Тебе просто не отдадут никакой инфы пока не пройдёшь вышеописанную валидацию
Viktor
23.02.2017
17:28:39
Загибай пальцы
Координаты окна, координаты смещения окна, доступная площадь экрана, массив координат кликов мыши, массив времени кликов мыши, дисперсия обоих параметров, таймзона и ряд других региональных настроек, фича-детектинг браузера и его соответствие с декларируемым, проверки, на которых валися фантом, проверки на которых валится электрон, наличие do not traсk (какая ирония) список шрифтов в системе, список плагинов в системе и их точные версии, число глобальных переменных в window, поведение при кратковременной высокой нагрузке - уникальный "маркер" системы, про порядок http заголовков и их соответствие реальным браузерам я уже писал - это далеко не полный список того, что тебе придётся достоверно эмулировать, чтобы автоматически спарсить хотя бы десять страниц сайта, серьезно относящегося к защите от краулеров
Чем это спасёт от селениума?
Annet
23.02.2017
17:29:18
php
Alex
23.02.2017
17:29:23
В общем не убедил, это все легко эмулировать
Дмитрий
23.02.2017
17:29:42
Чем это спасёт от селениума?
Тем что сервис будет знать, что это твой селениум, и когда ты последовательно залогинишься с него из гватемалы и бразилии - тебя забанят
Viktor
23.02.2017
17:31:11
Дмитрий
23.02.2017
17:31:16
Как ты сэмулируешь то, что твой фантом выполнит ряд функций по своему из-за кривой реализации, чем выдаст себя с головой
Alex
23.02.2017
17:31:22
Я тебе сказал- клиент всегда получит полноценную страницу. Ни кто не валидирует не авторищованого клиента по кликам. Потому что html он получит До этого момента. А дальше бань хоть весь интернет когда за бортом тысяча динамик прокси
Фантом нормально и чётко работает
У вас он даже тек вроде по памяти потому что не научились с ним работать
И фантом здесь не причём. Тот же селениум
Дмитрий
23.02.2017
17:34:12
Alex
23.02.2017
17:35:07
Я сказал с самого начала- это не панацея все что ты говоришь
Вообще
Дмитрий
23.02.2017
17:35:15
Для нормального юзера это будет едва заметный белый экран перед окном логина, для тебя - непроходимая головная боль
Alex
23.02.2017
17:36:11
Это усложняет задачу, но никогда не поможет защититься на 100 процентов