
Eugene
09.03.2017
15:21:08
Кто чем сейчас пользуется для парсинга интернет магазинов?

Maxim
09.03.2017
15:21:47
эм. что то в голову даже не приходило

$iD
09.03.2017
15:23:55
dom crawler
если нет api

Google

Eugene
09.03.2017
15:51:55
api нет, пробую domxpath, есть что эффективнее?

$iD
09.03.2017
15:53:21
dom crawler

Eugene
09.03.2017
16:02:03
за symfony не брался еще даже близко

$iD
09.03.2017
16:05:50
Там только компонент от симфони
Только его ставишь и радуешься

Pavel
09.03.2017
16:08:12
https://jobs.tut.by/article/20049
c++ 8к зеленых

$iD
09.03.2017
16:12:05
Css-selector ещё не забудь, и будешь рад полностью
В доке все описано

Eugene
09.03.2017
16:13:59
а что у него со скоростью и памятью? по сравнению с DOM?

$iD
09.03.2017
16:19:05
Замеры не проводил, скорость устраивала. Быстро, удобно, просто. Покроет 95% твоих нужд, остальные 5% покроет - xpath

Sergey
09.03.2017
16:21:01
❤️ Xpath

Eugene
09.03.2017
16:43:55
т.е. xpath из коробки покроет 100% ? он просто посложнее?

Vadim
09.03.2017
16:54:43
А какой у нас андроидоклиент гитхаба самый классный?) Чтобы тасочки двигать, майлстоуны там всякие

Google

Vadim
09.03.2017
16:55:31
А xpath да, ❤️

Eugene
09.03.2017
17:05:26
ок, xpath я поковырял, он меня пока устраивает )

Sergey
09.03.2017
17:07:55
xpath немного сложный, но крутой

Nurik
09.03.2017
17:10:54

Eugene
09.03.2017
17:31:17
подскажите, пожалуйста
на страничке 28 товаров
у каждого товара по 6 характеристик, допустим
я могу спарсить любую характеристику, но как их спарсить 6 разом?
6 запросов дадут 6 объектов по 28 записей в каждом
а надо 1 запрос, 1 объект, по 28 записей из которых можно вытащить 6 характеристик
вопрос снимается, прогоню цикл по всем чайлдам

dypa
09.03.2017
17:40:19

Ivan
09.03.2017
17:40:42
смотри что бы тебя не забанили

Eugene
09.03.2017
17:41:02
тор спасет )

Ivan
09.03.2017
17:41:17
так то ноды тора в открытом доступе
я парсил сайтик однажды. капча на каждый второй айпи

Eugene
09.03.2017
17:42:39
есть сайты, которые не любят тор, знаю )

dypa
09.03.2017
17:42:40
мне однажды аж базу отдали, лишь бы сервер не грузил ;)

Ivan
09.03.2017
17:43:01
хахах ))

Eugene
09.03.2017
17:43:07
надеюсь, этот не такой ) сами виноваты, что апи нет
вроде, так и говорят парсить, по словам коиента

dypa
09.03.2017
17:43:52
хахах ))
бумажные договора - великая вещь )

Eugene
09.03.2017
17:44:29
дык блин, не спасет база

Google

Eugene
09.03.2017
17:44:41
обновы ежедневно множественные

Salavat
09.03.2017
17:57:58
Но guzzle хватает

$iD
09.03.2017
18:10:34
Газлом/курлом запрос и респонз в краулер
Есть goutte если что )) ну или сам скромишь респонз в краулер
На пхп7 вообще все летать будет

dypa
09.03.2017
18:13:36

$iD
09.03.2017
18:13:40
Есть у меня один могильничек на пфальконе + краулер - проблем нет
И на конторе есть один проект, который грабит продукты

Eugene
09.03.2017
18:15:15
curl отдает html нормально, получу количество товаров и пробугусь циклом по чайлдам от первого до последнего, т.е. в каждом проходе цикла будет 6 xpath
я не делаю в каждом прогоне запрос к серверу

$iD
09.03.2017
18:16:06
И это правильно

Eugene
09.03.2017
18:16:12
1 раз целиком забираю и разбираю спокойно

$iD
09.03.2017
18:16:30
Мужыыыыг

dypa
09.03.2017
18:16:49

Eugene
09.03.2017
18:17:03
поясните?

$iD
09.03.2017
18:17:36
Не думаю что ему на столько надо заморачиваться

dypa
09.03.2017
18:17:44
поясните?
сбор html 1 процесс, получение данных из html другой процесс

Google

$iD
09.03.2017
18:18:27
Надо бд какую-то или другое хранилище
Есть шанс что оверхед

dypa
09.03.2017
18:19:10

Eugene
09.03.2017
18:19:17
можно, конечно, так организовать, а как обмен данными делать?

$iD
09.03.2017
18:19:39
Супервизор + хранилище?

Eugene
09.03.2017
18:20:04
где про это почитать?

dypa
09.03.2017
18:20:05

$iD
09.03.2017
18:20:05
Хтмл получил, сложил куданить
Демон подобрал

Admin
ERROR: S client not available

$iD
09.03.2017
18:20:18
И распарсил
и всё в докер ;)
Угу. Я в докере нуб, га работе не юзают, дома как-то не до него. Но в целом интерес есть

dypa
09.03.2017
18:21:38

Nurik
09.03.2017
18:21:40

$iD
09.03.2017
18:22:07
Хоть в файлы пиши

Eugene
09.03.2017
18:22:32
завтра продолжим?

$iD
09.03.2017
18:22:38
Ай
^^

Google

Eugene
09.03.2017
18:22:55
я спать )

dypa
09.03.2017
18:22:56
я спать )
на горшок и в люльку?!
этож какой часовой пояс?

Nurik
09.03.2017
18:23:33

$iD
09.03.2017
18:24:08
Пишите в мускул в блоб :)))
Каб було

dypa
09.03.2017
18:25:09

$iD
09.03.2017
18:25:37
Показывай всем ))

Fayozjon [CybernatiC]
09.03.2017
18:26:33

dypa
09.03.2017
18:27:02
Показывай всем ))
не буду, тут многие еще не окрепли умом и не понимают что так не стоит

Fayozjon [CybernatiC]
09.03.2017
18:27:04
Я ради лола как то фильм загнал в блоб

Sheridan
09.03.2017
18:27:38

Fayozjon [CybernatiC]
09.03.2017
18:29:44
Этот гавенный файрберд
Свет в клинике моргнул

$iD
09.03.2017
18:30:01
Не хочу "хвастаться", но на текущем, англ. проекте до сих пор считают, что это норм

Fayozjon [CybernatiC]
09.03.2017
18:30:06
Вся база клиентов к ебням
Там были анализв
Короче восстановить как я понял не вариант

Sergey
09.03.2017
20:46:02
https://firebase.google.com/docs/functions/
php нинужон)

Nurik
09.03.2017
20:47:07