
Hot
14.12.2017
08:27:09
Просто мне в задачах на парсинг xml/html важна была скорость разработки.
А на скорость выполнения было накласть.

Robot
14.12.2017
08:27:30
Ага но иногда и скорость нужна

Jentry
14.12.2017
08:27:32
BeautifulSoup устарел эдак в 2012, не рекомендуется, так как в нем утечки памяти

Google

Jentry
14.12.2017
08:28:11

Robot
14.12.2017
08:28:35
Я как-то делал десктопное gui к одному форуму, и парсил его BeautifulSoup изначально. Это ощутимо тормозило. Именно парсер просто. Пришлось переделать.

Alexander
14.12.2017
08:29:04

Robot
14.12.2017
08:29:07
Ну и просто если надо много данных парсить, то скорость начинает ощущаться.

Alexander
14.12.2017
08:30:23
Угу... У меня не такие большие XML'ки - 100, 200 Кб. Я провел немного замеров - результаты идентичны. Но я может быть не использую каких-то фишек lxml для ускорения обработки...

Maxim robox
14.12.2017
08:30:58

Robot
14.12.2017
08:32:55

Jentry
14.12.2017
08:41:33

Robot
14.12.2017
08:45:32
у elementtree вроде была версия на си, но что-то её убрали

Alexander
14.12.2017
08:45:46

Robot
14.12.2017
08:46:23
3 секунды это довольно много

Alexander
14.12.2017
08:46:23

Jentry
14.12.2017
08:46:43
попробуй запрофайлить, я не думаю, что ты упрешься в парсинг, если конечно не парсишь мегабайты данных за раз
имхо zabbix это не столь критично по времени выполнения

Google

Jentry
14.12.2017
08:46:49
всяко не хайлоад

Alexander
14.12.2017
08:47:57
Среднее время выполнения - 700 мс.

Jentry
14.12.2017
08:49:14
возьми cProfile и посмотри стату по выполнению

Izy
14.12.2017
08:49:29
ребят есть вопро: есть такой код
filePath = '/mnt/Images/test.png'
searchUrl = 'http://www.google.hr/searchbyimage/upload'
multipart = {'encoded_image': (filePath, open(filePath, 'rb')), 'image_content': ''}
response = requests.post(searchUrl, files=multipart, allow_redirects=False)
fetchUrl = response.headers['Location']
почему я не могу сделать запрос такого типа
requests.get(fetchUrl)
почему он потом перекидывает на стандартную страницу поиска а не на результат поиска по картинке

Alexander
14.12.2017
08:50:46

Izy
14.12.2017
08:52:27
я тут пытаюсь поиск по картинке в гугл запилить)) и что то не догоняю) )

Jentry
14.12.2017
08:52:45

Maxim robox
14.12.2017
08:53:13

Nikolay
14.12.2017
08:54:10
Ты шлёшь запрос, но ты это делаешь без должного уважения

Robot
14.12.2017
08:54:23
посоветуйте библиотеку для soap

Nikolay
14.12.2017
08:54:45

Maxim robox
14.12.2017
08:55:09

Robot
14.12.2017
08:55:14

Izy
14.12.2017
08:55:19

Nikolay
14.12.2017
08:55:27

Bohdan
14.12.2017
08:55:40

Robot
14.12.2017
08:56:04
Он умеет возвращать данные в json хотя бы. Но сам запрос надо слать в xml

Maxim robox
14.12.2017
08:56:15

Izy
14.12.2017
08:56:24
не ну я же типо сначала сначала сделал пост запрос он мне типо ответил и отдал url с запросом а я поэтому потом делаю get запрос)) надо было post запрос делать да?

Google

Robot
14.12.2017
08:56:34

Bohdan
14.12.2017
08:56:48
zeep юзал, терпимо
по крайней мере лучше, чем besimple клиент для php

Jentry
14.12.2017
08:58:02

Maxim robox
14.12.2017
08:58:06
Тогда не знаю. Советую отдебажить в postman, а потом переносить в питон.
И в .net XDD
Ну ещё suds можешь попробовать. Но она мёртвая. Можно поискать форк поживее.

Jentry
14.12.2017
08:59:25

Izy
14.12.2017
08:59:35
А, там нет. Там GET.
просто соль в том что через селиниум результат открывается а через requests неоткрывается) вот я и думаю )) где я опять туплю)

Robot
14.12.2017
08:59:53

Maxim robox
14.12.2017
08:59:55

Robot
14.12.2017
09:00:06

Maxim robox
14.12.2017
09:00:23
Хотя нет. В порнорежиме та же ссылка тоже открывается.

Robot
14.12.2017
09:00:25

Maxim robox
14.12.2017
09:00:27
Тогда не знаю.
А по получившемуся дикту бегали другой библиотекой. dPath (типа аналог xPath в XML).

Izy
14.12.2017
09:04:32
Ну там, возможно, какой-нибудь идентификатор сессии в куках ещё.
я тоже думал про это , но я запрос делаю реквестом а открываю селениумом ну как то так:
import requests
filePath = '/mnt/Images/test.png'
searchUrl = 'http://www.google.hr/searchbyimage/upload'
multipart = {'encoded_image': (filePath, open(filePath, 'rb')), 'image_content': ''}
response = requests.post(searchUrl, files=multipart, allow_redirects=False)
fetchUrl = response.headers['Location']
browser = Browser()
browser = browser.start()
browser.get(fetchUrl)
я просто хотел сделать только на requests но он почему то не работает как я хочу

Maxim robox
14.12.2017
09:05:04

Маришка
14.12.2017
09:05:21

Robot
14.12.2017
09:06:34

Google

Izy
14.12.2017
09:06:41

Maxim robox
14.12.2017
09:06:47

Izy
14.12.2017
09:07:12

Maxim robox
14.12.2017
09:07:46
Экспорт запросов из браузера в postman это вообще космос фича.

Admin
ERROR: S client not available

Izy
14.12.2017
09:08:13

Jentry
14.12.2017
09:09:02

Maxim robox
14.12.2017
09:09:31

Jentry
14.12.2017
09:09:48
А ну все равно в хроме есть кнопочка перехвата в этом случае
хотя хз как ты ставил

Maxim robox
14.12.2017
09:10:12

Jentry
14.12.2017
09:10:36
https://chrome.google.com/webstore/detail/postman-interceptor/aicmkgpgakddgnaphhhpliifpcfhicfo?hl=en

Robot
14.12.2017
09:10:50
хм какая-то монстроидальная тулза. но спасибо за наводку, может пригодиться

Maxim robox
14.12.2017
09:11:11

Robot
14.12.2017
09:11:55
Оно не особо standalone там тоже браузер и нода какая-то

Maxim robox
14.12.2017
09:12:14
В любом случае, не экстеншн к браузеру.

Jentry
14.12.2017
09:14:38
хз перехват крутая штука, просто нажал кнопку и ловишь все в постмане, что тычешь в браузере

Robot
14.12.2017
09:19:15
Мне как-то хватало вкладки network в devtools

Kirill
14.12.2017
09:19:44
Друзья, посоветуйте библиотеку для манипуляций с pdf: кропить, мерджить, сплитить, вращать страницы.

Google

Maxim robox
14.12.2017
09:21:00

Евгений
14.12.2017
09:53:20
Привет всем. SQLAlchemy умеет во временные таблицы без их предварительного описания? Типа так:
SELECT *
INTO #tmptbl
FROM tbl
?
Жесть. Уже хз какой вопрос по алхимии задаю, и практически никогда не отвечают. Скалдывается такое впечатление, что алхимию никто не использует вообще.

Maxim robox
14.12.2017
09:56:48

Sergey
14.12.2017
09:57:33
:)

Евгений
14.12.2017
09:57:33
о_О а причём тут андроид?

Роман
14.12.2017
09:57:44

Maxim robox
14.12.2017
09:57:56

Евгений
14.12.2017
09:58:20

Maxim robox
14.12.2017
09:58:22
А, тьфу
Я гоню
Почему-то про sqlite подумал

Евгений
14.12.2017
09:58:38
если модуль плохо документирован, то его мало кто использует