@prophp7

Страница 275 из 1387
Eugene
09.03.2017
15:21:08
Кто чем сейчас пользуется для парсинга интернет магазинов?

Maxim
09.03.2017
15:21:47
эм. что то в голову даже не приходило

$iD
09.03.2017
15:23:55
dom crawler

если нет api

Google
Eugene
09.03.2017
15:51:55
api нет, пробую domxpath, есть что эффективнее?

$iD
09.03.2017
15:53:21
dom crawler

Eugene
09.03.2017
16:02:03
за symfony не брался еще даже близко

$iD
09.03.2017
16:05:50
Там только компонент от симфони

Только его ставишь и радуешься

Pavel
09.03.2017
16:08:12
https://jobs.tut.by/article/20049 c++ 8к зеленых

$iD
09.03.2017
16:12:05
Css-selector ещё не забудь, и будешь рад полностью

В доке все описано

Eugene
09.03.2017
16:13:59
а что у него со скоростью и памятью? по сравнению с DOM?

$iD
09.03.2017
16:19:05
Замеры не проводил, скорость устраивала. Быстро, удобно, просто. Покроет 95% твоих нужд, остальные 5% покроет - xpath

Sergey
09.03.2017
16:21:01
❤️ Xpath

Eugene
09.03.2017
16:43:55
т.е. xpath из коробки покроет 100% ? он просто посложнее?

Vadim
09.03.2017
16:54:43
А какой у нас андроидоклиент гитхаба самый классный?) Чтобы тасочки двигать, майлстоуны там всякие

Google
Vadim
09.03.2017
16:55:31
А xpath да, ❤️

Eugene
09.03.2017
17:05:26
ок, xpath я поковырял, он меня пока устраивает )

Sergey
09.03.2017
17:07:55
xpath немного сложный, но крутой

Nurik
09.03.2017
17:10:54
Кто чем сейчас пользуется для парсинга интернет магазинов?
scrapy (фреймворк. удобно пауков писать.), nokogiri + mecanism, beautiful soup + urllib2 . На PHP такое не ищи. Бесполезное занятие.

Eugene
09.03.2017
17:31:17
подскажите, пожалуйста на страничке 28 товаров у каждого товара по 6 характеристик, допустим я могу спарсить любую характеристику, но как их спарсить 6 разом?

6 запросов дадут 6 объектов по 28 записей в каждом

а надо 1 запрос, 1 объект, по 28 записей из которых можно вытащить 6 характеристик

вопрос снимается, прогоню цикл по всем чайлдам

dypa
09.03.2017
17:40:19
Кто чем сейчас пользуется для парсинга интернет магазинов?
https://github.com/dypa/phpmulticurl + phpquery не урони только хостинг магазину случайно

Ivan
09.03.2017
17:40:42
смотри что бы тебя не забанили

Eugene
09.03.2017
17:41:02
тор спасет )

Ivan
09.03.2017
17:41:17
так то ноды тора в открытом доступе

я парсил сайтик однажды. капча на каждый второй айпи

Eugene
09.03.2017
17:42:39
есть сайты, которые не любят тор, знаю )

dypa
09.03.2017
17:42:40
мне однажды аж базу отдали, лишь бы сервер не грузил ;)

Ivan
09.03.2017
17:43:01
хахах ))

Eugene
09.03.2017
17:43:07
надеюсь, этот не такой ) сами виноваты, что апи нет

вроде, так и говорят парсить, по словам коиента

dypa
09.03.2017
17:43:52
хахах ))
бумажные договора - великая вещь )

Eugene
09.03.2017
17:44:29
дык блин, не спасет база

Google
Eugene
09.03.2017
17:44:41
обновы ежедневно множественные

Salavat
09.03.2017
17:57:58
Но guzzle хватает

$iD
09.03.2017
18:10:34
6 запросов дадут 6 объектов по 28 записей в каждом
Что мешает скормить весь хтмл в краулер и циклом пройтись

Газлом/курлом запрос и респонз в краулер

Есть goutte если что )) ну или сам скромишь респонз в краулер

На пхп7 вообще все летать будет

dypa
09.03.2017
18:13:36
Что мешает скормить весь хтмл в краулер и циклом пройтись
так и нужно делать, делить получение данных от обработки это очень разумно

$iD
09.03.2017
18:13:40
Есть у меня один могильничек на пфальконе + краулер - проблем нет

И на конторе есть один проект, который грабит продукты

Eugene
09.03.2017
18:15:15
curl отдает html нормально, получу количество товаров и пробугусь циклом по чайлдам от первого до последнего, т.е. в каждом проходе цикла будет 6 xpath

я не делаю в каждом прогоне запрос к серверу

$iD
09.03.2017
18:16:06
И это правильно

Eugene
09.03.2017
18:16:12
1 раз целиком забираю и разбираю спокойно

$iD
09.03.2017
18:16:30
Мужыыыыг

dypa
09.03.2017
18:16:49
1 раз целиком забираю и разбираю спокойно
еще бы ты разбирал бы это в разных процессах и было бы совсем хорошо

Eugene
09.03.2017
18:17:03
поясните?

$iD
09.03.2017
18:17:36
Не думаю что ему на столько надо заморачиваться

dypa
09.03.2017
18:17:44
поясните?
сбор html 1 процесс, получение данных из html другой процесс

Не думаю что ему на столько надо заморачиваться
тестировать парсеринг в разы будет легяе

Google
$iD
09.03.2017
18:18:27
Надо бд какую-то или другое хранилище

Есть шанс что оверхед

dypa
09.03.2017
18:19:10
Надо бд какую-то или другое хранилище
времена когда я советовал писать бд на файлах давно прошли

Eugene
09.03.2017
18:19:17
можно, конечно, так организовать, а как обмен данными делать?

$iD
09.03.2017
18:19:39
Супервизор + хранилище?

Eugene
09.03.2017
18:20:04
где про это почитать?

dypa
09.03.2017
18:20:05
$iD
09.03.2017
18:20:05
Хтмл получил, сложил куданить

Демон подобрал

Admin
ERROR: S client not available

$iD
09.03.2017
18:20:18
И распарсил

и всё в докер ;)
Угу. Я в докере нуб, га работе не юзают, дома как-то не до него. Но в целом интерес есть

Nurik
09.03.2017
18:21:40
$iD
09.03.2017
18:22:07
в redis можно.
Попадает под определение - хранилища

Хоть в файлы пиши

Eugene
09.03.2017
18:22:32
завтра продолжим?

$iD
09.03.2017
18:22:38
Ай

^^

Google
Eugene
09.03.2017
18:22:55
я спать )

dypa
09.03.2017
18:22:56
в redis можно.
мне монга больше нравится :p

я спать )
на горшок и в люльку?! этож какой часовой пояс?

Nurik
09.03.2017
18:23:33
мне монга больше нравится :p
Ну так о вкусах не спорят.

$iD
09.03.2017
18:24:08
Пишите в мускул в блоб :)))

Каб було

dypa
09.03.2017
18:25:09
Пишите в мускул в блоб :)))
ах вот кто автор того говнокода который я видел в этом месяце )))

$iD
09.03.2017
18:25:37
Показывай всем ))

Fayozjon [CybernatiC]
09.03.2017
18:26:33
dypa
09.03.2017
18:27:02
Показывай всем ))
не буду, тут многие еще не окрепли умом и не понимают что так не стоит

Fayozjon [CybernatiC]
09.03.2017
18:27:04
Я ради лола как то фильм загнал в блоб

Sheridan
09.03.2017
18:27:38
Я ради лола как то фильм загнал в блоб
Я это еще с файрбёрдом делал лет десять назад )

Fayozjon [CybernatiC]
09.03.2017
18:29:44
Этот гавенный файрберд

Свет в клинике моргнул

$iD
09.03.2017
18:30:01
Не хочу "хвастаться", но на текущем, англ. проекте до сих пор считают, что это норм

Fayozjon [CybernatiC]
09.03.2017
18:30:06
Вся база клиентов к ебням

Там были анализв

Короче восстановить как я понял не вариант

Sergey
09.03.2017
20:46:02
https://firebase.google.com/docs/functions/

php нинужон)

Nurik
09.03.2017
20:47:07

Страница 275 из 1387