
?? L.A
28.04.2017
19:19:24
иногда бывают сложности типа бана по ИП или надо заголовки отправлять или агента менять и тд и тп, но не часто

Кирилл
28.04.2017
19:19:27
Так что если эмулировать навигацию пользователя, нужно имплементировать свою

?? L.A
28.04.2017
19:20:38

Кирилл
28.04.2017
19:20:53
Хотя я ничего другого не пробовал, че я сижу спорю ?

Google

?? L.A
28.04.2017
19:21:40
когда парсишь много, сразу всякие хаки отмечаешь, как парсить легче можно
например, щас парсю этот сайт http://www.laundrypartsdirect.com/American-Dryer-Parts-Replacements-Washer-Dryers-s/2002.htm
тут типа товары по страницам, по 30 штук. можно сделать по 300, но есть где даже если по 300 штук ставишь страницу, то все равно несколько страниц, то есть надо писать еще и сборщик страниц
но когда переключаешь кол-во айтемов на странице урл становится
http://www.laundrypartsdirect.com/Dexter-Parts-Dexter-Laundry-Parts-Dexter-Washer-Dryer-Parts-s/2004.htm?searching=Y&sort=5&cat=2004&show=300&page=1
где можно 300 поменять на 15000 например, и тогда не придется собирать страницы, все товары из одной категории будут на одной странице
кароче, чем больше парсишь, тем это легче и быстрее. седня писал с нуля парсер по hourly контракту, сделал за 2 часа

Eugene
28.04.2017
19:24:30
Скоро уже будет у тебя готовый шаблон, где надо будет ток менять ссылку и данные

?? L.A
28.04.2017
19:24:32
ну скрапи это и есть готовый шаблон по сути))
обычно надо ток исходные ссылки указать и селекторы сделать
где-то регулярками допилить еще
на пхп примерно так

Google

Eugene
28.04.2017
19:26:11
В регулярки сложно(

?? L.A
28.04.2017
19:26:23
хз)

Кирилл
28.04.2017
19:26:35

?? L.A
28.04.2017
19:26:39
обычно регулярку написать занимает максимум 5 минут

Кирилл
28.04.2017
19:27:00
Но на парсер у меня часов пять ушло. Правда я с UI на tcl/tk делал

?? L.A
28.04.2017
19:27:12

Кирилл
28.04.2017
19:28:05

?? L.A
28.04.2017
19:28:18
кстати, когда речь большом объеме данных идет, там уже другая история начинается. там появляется гемор типа где-то может память течь, надо больше проверок всяких писать, потому что если после нескольких часов работы упадет скрипт, очень несладко все с начала начинал, всякие бекапы, разбивка по архивам, проблемы с передачей заказчику и тд и тп
если цена не слишком интересная, я стараюсь не брать когда речь о 10к+ записях идет
такие выгрузки даже тупо проверять потом сложно, их заколебешься качать, открывать, место на компе надо и тд

Кирилл
28.04.2017
19:29:45
Можно парсер выделять в отдельны поток, который будет отказоустойчивым, а в основном вся логика. Если поток упадет, ты можешь сообщить об этом пользователю и запустить следующий

?? L.A
28.04.2017
19:31:24

Кирилл
28.04.2017
19:33:28
Да. Это у меня просто изначально враппер фантом на tcl/tk, поэтому фантом он уже сразу выделен в отдельный поток

?? L.A
28.04.2017
19:35:00
падает то не только из за памяти, а из за логики иногда
типа, например, у тебя есть код "взять цену" > "распарсить ее регуляркой", где-то цена неуказана, в регулярку передался null, скрипт упал :)

A16
28.04.2017
20:07:08
что вы не спите?

Eugene
28.04.2017
20:07:33

?? L.A
28.04.2017
20:07:56

Google

A16
28.04.2017
20:11:27
Может обьясните как реализовать такое, изменяя option изменялся бы слайд

?? L.A
28.04.2017
20:12:20

Eugene
28.04.2017
20:13:41
найми программиста
кстати около недели назад поимел такой опыт. Нанял челика для парсинга своего же html : D

?? L.A
28.04.2017
20:13:57
индуса?)

Eugene
28.04.2017
20:14:26
не, челика с чатика, заодно ему помог на апворк вкатиться)
20 баксов вышло, за вечер мне сделал.
Я до этого пару дней не мог норм решить:D

?? L.A
28.04.2017
20:14:40
))

Eugene
28.04.2017
20:15:24
Ну этот опыт мне ооочень понравился)

Владислав
28.04.2017
20:17:18
Что то все про апворк говорят. Биржа для дизайнеров?

?? L.A
28.04.2017
20:17:31

A16
28.04.2017
20:17:34

Eugene
28.04.2017
20:17:46
дизайнерам там тоже место:)

A16
28.04.2017
20:18:06

?? L.A
28.04.2017
20:18:20

Владислав
28.04.2017
20:18:22
Вай скоро тогда регаться побегу
Чет мне кажется, что с моим мини портфолио дня за 2-3 по любому можно заказ найти

Eugene
28.04.2017
20:19:24
ток не депенгуй

?? L.A
28.04.2017
20:19:41
тебе кажется)
когда статус появится нормальный, будет ок

Google

Eugene
28.04.2017
20:20:56
ты топ ?

?? L.A
28.04.2017
20:21:29

Eugene
28.04.2017
20:21:36
у меня райзинг отжали из-за индуса сук
о найс
в pro проходил тестовые?

?? L.A
28.04.2017
20:21:59
да

Admin
ERROR: S client not available

?? L.A
28.04.2017
20:22:12
ну они мне прислали письмо
типа хотите стать про?
я говорю ну ок
сначала было интервью
потом задание
потом еще интервью
ток толку от этого про 0 ваще

Eugene
28.04.2017
20:23:14

?? L.A
28.04.2017
20:23:16
такая еще штука есть

Eugene
28.04.2017
20:23:32
а энтерпрайзов у тебя не было?

Google

?? L.A
28.04.2017
20:23:39
это че?
блин
не к тому посту
энтерпрайз что это

Eugene
28.04.2017
20:23:53
это че?
это я так себе запорол стату
сейчас же есть энтерпайз клиенты с огромными бабками

?? L.A
28.04.2017
20:24:46
у меня был заказчик, учитель, он мне тоже там навыставлял че-то типа 4.25, я говорю это че? он начал мне затирать из каких критериев он поставил оценку. но в конце написал типа, если тебе так важно, я исправлю на 5

Eugene
28.04.2017
20:25:30

A16
28.04.2017
20:25:31

?? L.A
28.04.2017
20:25:35

A16
28.04.2017
20:25:49

Eugene
28.04.2017
20:25:55

?? L.A
28.04.2017
20:26:28

A16
28.04.2017
20:26:53
да
Не подкинешь хотя бы идею йай реализовать такое? я думаю switch case -ами делат

?? L.A
28.04.2017
20:26:53
у меня были заказчики, бельгийский стартап для медицины

Eugene
28.04.2017
20:27:12

?? L.A
28.04.2017
20:27:20
делали проект для англии
работали мимо авпорвка
за 3 месяца они мне заплатили че-то типа 14к+