@web_structure

Страница 1822 из 5834
?? L.A
28.04.2017
19:19:24
иногда бывают сложности типа бана по ИП или надо заголовки отправлять или агента менять и тд и тп, но не часто

Кирилл
28.04.2017
19:19:27
Так что если эмулировать навигацию пользователя, нужно имплементировать свою

Кирилл
28.04.2017
19:20:53
Хотя я ничего другого не пробовал, че я сижу спорю ?

Google
?? L.A
28.04.2017
19:21:40
когда парсишь много, сразу всякие хаки отмечаешь, как парсить легче можно

например, щас парсю этот сайт http://www.laundrypartsdirect.com/American-Dryer-Parts-Replacements-Washer-Dryers-s/2002.htm

тут типа товары по страницам, по 30 штук. можно сделать по 300, но есть где даже если по 300 штук ставишь страницу, то все равно несколько страниц, то есть надо писать еще и сборщик страниц

но когда переключаешь кол-во айтемов на странице урл становится http://www.laundrypartsdirect.com/Dexter-Parts-Dexter-Laundry-Parts-Dexter-Washer-Dryer-Parts-s/2004.htm?searching=Y&sort=5&cat=2004&show=300&page=1

где можно 300 поменять на 15000 например, и тогда не придется собирать страницы, все товары из одной категории будут на одной странице

кароче, чем больше парсишь, тем это легче и быстрее. седня писал с нуля парсер по hourly контракту, сделал за 2 часа

Eugene
28.04.2017
19:24:30
Скоро уже будет у тебя готовый шаблон, где надо будет ток менять ссылку и данные

?? L.A
28.04.2017
19:24:32


ну скрапи это и есть готовый шаблон по сути))

обычно надо ток исходные ссылки указать и селекторы сделать

где-то регулярками допилить еще

на пхп примерно так



Google
Eugene
28.04.2017
19:26:11
В регулярки сложно(

?? L.A
28.04.2017
19:26:23
хз)



Кирилл
28.04.2017
19:26:35
но когда переключаешь кол-во айтемов на странице урл становится http://www.laundrypartsdirect.com/Dexter-Parts-Dexter-Laundry-Parts-Dexter-Washer-Dryer-Parts-s/2004.htm?searching=Y&sort=5&cat=2004&show=300&page=1
А. Ну я так парсил магазин, чтобы товары импортировать в свой магазин. Писал сборщик урлов, да. А в вывод писать название, таксономию, цену, описание, массив характеристик, изображения. Тысяч 10 напарсил товаров

?? L.A
28.04.2017
19:26:39
обычно регулярку написать занимает максимум 5 минут

Кирилл
28.04.2017
19:27:00
Но на парсер у меня часов пять ушло. Правда я с UI на tcl/tk делал

Кирилл
28.04.2017
19:28:05
я как-то парсил желтые страницы Австралии 800к айтемов )
Ы) Я хз сколько у меня парсил по времени, я просто оставил на ночь)

?? L.A
28.04.2017
19:28:18
кстати, когда речь большом объеме данных идет, там уже другая история начинается. там появляется гемор типа где-то может память течь, надо больше проверок всяких писать, потому что если после нескольких часов работы упадет скрипт, очень несладко все с начала начинал, всякие бекапы, разбивка по архивам, проблемы с передачей заказчику и тд и тп

если цена не слишком интересная, я стараюсь не брать когда речь о 10к+ записях идет

такие выгрузки даже тупо проверять потом сложно, их заколебешься качать, открывать, место на компе надо и тд

Кирилл
28.04.2017
19:29:45
Можно парсер выделять в отдельны поток, который будет отказоустойчивым, а в основном вся логика. Если поток упадет, ты можешь сообщить об этом пользователю и запустить следующий

Кирилл
28.04.2017
19:33:28
Да. Это у меня просто изначально враппер фантом на tcl/tk, поэтому фантом он уже сразу выделен в отдельный поток

?? L.A
28.04.2017
19:35:00
падает то не только из за памяти, а из за логики иногда

типа, например, у тебя есть код "взять цену" > "распарсить ее регуляркой", где-то цена неуказана, в регулярку передался null, скрипт упал :)

A16
28.04.2017
20:07:08
что вы не спите?

Eugene
28.04.2017
20:07:33
я как-то парсил желтые страницы Австралии 800к айтемов )
вот из-за таких количеств парсинг не мое

?? L.A
28.04.2017
20:07:56
вот из-за таких количеств парсинг не мое
таких тасков мало. ну и никто не заставляет их брать)

что вы не спите?
хотим ничего не пропустить

Google
A16
28.04.2017
20:11:27
Может обьясните как реализовать такое, изменяя option изменялся бы слайд

Eugene
28.04.2017
20:13:41
найми программиста
кстати около недели назад поимел такой опыт. Нанял челика для парсинга своего же html : D

?? L.A
28.04.2017
20:13:57
индуса?)

Eugene
28.04.2017
20:14:26
не, челика с чатика, заодно ему помог на апворк вкатиться) 20 баксов вышло, за вечер мне сделал. Я до этого пару дней не мог норм решить:D

?? L.A
28.04.2017
20:14:40
))

Eugene
28.04.2017
20:15:24
Ну этот опыт мне ооочень понравился)

Владислав
28.04.2017
20:17:18
Что то все про апворк говорят. Биржа для дизайнеров?

A16
28.04.2017
20:17:34
Что то все про апворк говорят. Биржа для дизайнеров?
ахахахахахахахахахахахахахахах ору ????????????

Eugene
28.04.2017
20:17:46
дизайнерам там тоже место:)

A16
28.04.2017
20:18:06
?? L.A
28.04.2017
20:18:20


Владислав
28.04.2017
20:18:22
Вай скоро тогда регаться побегу

Чет мне кажется, что с моим мини портфолио дня за 2-3 по любому можно заказ найти

Eugene
28.04.2017
20:19:24
ток не депенгуй

?? L.A
28.04.2017
20:19:41


тебе кажется)

когда статус появится нормальный, будет ок



Google
Eugene
28.04.2017
20:20:56
ты топ ?

?? L.A
28.04.2017
20:21:29




Eugene
28.04.2017
20:21:36
у меня райзинг отжали из-за индуса сук

о найс

в pro проходил тестовые?

?? L.A
28.04.2017
20:21:59


да

Admin
ERROR: S client not available

?? L.A
28.04.2017
20:22:12
ну они мне прислали письмо

типа хотите стать про?

я говорю ну ок

сначала было интервью

потом задание

потом еще интервью

ток толку от этого про 0 ваще

Eugene
28.04.2017
20:23:14


?? L.A
28.04.2017
20:23:16
такая еще штука есть



Eugene
28.04.2017
20:23:32
а энтерпрайзов у тебя не было?

Google
?? L.A
28.04.2017
20:23:39
это че?

блин

не к тому посту

энтерпрайз что это

Eugene
28.04.2017
20:23:53
это че?
это я так себе запорол стату

сейчас же есть энтерпайз клиенты с огромными бабками

?? L.A
28.04.2017
20:24:46
у меня был заказчик, учитель, он мне тоже там навыставлял че-то типа 4.25, я говорю это че? он начал мне затирать из каких критериев он поставил оценку. но в конце написал типа, если тебе так важно, я исправлю на 5

сейчас же есть энтерпайз клиенты с огромными бабками
ну в смысле это не какой-то клауд или еще что-то, а тупо заказчики-энтерпрайзы?

?? L.A
28.04.2017
20:25:35
A16
28.04.2017
20:25:49
да
:) Круто

Eugene
28.04.2017
20:25:55
ну в смысле это не какой-то клауд или еще что-то, а тупо заказчики-энтерпрайзы?
тупо да, но там тоже надо для них подтверждения проходить

?? L.A
28.04.2017
20:26:28
у меня с индусом в конце сложились разлогласия . и хз как быть, мб написать в сапорт
им пофиг ) у меня есть пара контрактов типа "без оценки" где заказчики пропали, а я закрыл сам эти контакты, это на JSS влияет. я суппорту объяснял, им пофиг, они ниче не делают типа - ну работайте, исправляйте

A16
28.04.2017
20:26:53
да
Не подкинешь хотя бы идею йай реализовать такое? я думаю switch case -ами делат

?? L.A
28.04.2017
20:26:53
тупо да, но там тоже надо для них подтверждения проходить
ну была пара вариантов, но я редко отвечаю на такие проекты. не люблю лонг-терм жестки, где требования какие-то когда работаешь и тд

у меня были заказчики, бельгийский стартап для медицины

?? L.A
28.04.2017
20:27:20
делали проект для англии

работали мимо авпорвка

за 3 месяца они мне заплатили че-то типа 14к+

Страница 1822 из 5834