@ru_python

« Назад

Страница 9102 из 9768

Далее »

Andrew

21.05.2019
13:24:16

Делаю паузы между запросами по 5-10сек

Есть смысл запускать без селери в async/await шедулере

Ребята, кто-нибудь встречался с такой фигней: celery реагирует на таск входящий ровно на второй раз.

а в логах что

GTR Network

21.05.2019
13:25:20

@Tishka17 эм... я чота ржу... не могу не поделиться. Этот крендень рассказывал что ему приходят байты в неизвестной кодировке говоря о DNS пакете

гарри поменьше умничей в чате... while True: print('wait data...') conn, addr = udp_socket.recvfrom(1024) d = DNSRecord.parse(conn) print('client addr: ', addr[0]) sub = str(d.q.qname) print('client sub_domain:', sub)

вот и весь затык

Google

Philipp

21.05.2019
13:25:35

а в логах что

ну я в режиме дебага, просто сам селеои не реагирует

Andrew

21.05.2019
13:25:55

так а в режиме дебага что

Philipp

21.05.2019
13:26:04

но второй раз реагирует гарантировано

Ваня

21.05.2019
13:26:08

Тогда лучше такую таску разбить на кучу мелких, а то получается задачка одного юзера впустую мелет воздух и занимает ресурсы, которые могли бы использоваться для выполнения задач других юзеров.

Понятно. Спасибо всем за ответы.

Philipp

21.05.2019
13:26:11

так а в режиме дебага что

просто ничего, тишина

как будто таск не прилетает

Andrew

21.05.2019
13:26:47

значит не прилетает)

Sergey

21.05.2019
13:29:23

Привет! У меня есть жирная цсв размером пару гигабайт, есть колонка user_id. Я использую пандас, чтобы работать с этой csv. Подозреваю, что есть какие то способы произвести в dataframe индексацию по user_id, чтобы при дальшейшем использовании данного поля при поиске по csv , поиск происходил не час или два , а мгновенно. Я погуглил, попробовал, но чет ничего не ускоряется. Подскажите как ускорить поиск. df = pd.read_csv('kek.csv') a = df['user_id'][df.user_id == 1]

Максим

21.05.2019
13:39:06

Привет! У меня есть жирная цсв размером пару гигабайт, есть колонка user_id. Я использую пандас, чтобы работать с этой csv. Подозреваю, что есть какие то способы произвести в dataframe индексацию по user_id, чтобы при дальшейшем использовании данного поля при поиске по csv , поиск происходил не час или два , а мгновенно. Я погуглил, попробовал, но чет ничего не ускоряется. Подскажите как ускорить поиск. df = pd.read_csv('kek.csv') a = df['user_id'][df.user_id == 1]

Запихнуть все в dict и хранить его pickle-ом?

Да, идея плохая

Я пропустил строчку где говорится, что файл двухгигабайтный

Amaro

21.05.2019
13:40:00

Или переложить CSV в базу данных. С индексом.

Максим

21.05.2019
13:40:11

Или переложить CSV в базу данных. С индексом.

Вот да, к примеру

Google

Максим

21.05.2019
13:40:23

Postgresql как раз для этих целей была создана

Sergey

21.05.2019
13:41:54

Но ведь люди пользуются пандасом специально для обработки подобных данных. Там есть нечто для ускорения и перфоманса. Дата инженеры хранять инфу в цсвшках и дальше обрабатывают. Ведь всегда есть способ достать информацию из памяти быстрее, чем из памяти какой-то бд. Нужно лишь как-то сделать индексацию, хеш таблицу по столбцу в датафрейме, но я читаю доку и не понимаю как(

Tishka17

21.05.2019
13:42:38

Я пропустил строчку где говорится, что файл двухгигабайтный

а почему нет?

2 гигибайта, не дв терабайта

Александр

21.05.2019
13:43:25

Всем привет! Кто-то решал рекапчи?

vladislav

21.05.2019
13:43:38

Всем привет! Кто-то решал рекапчи?

решал

oche somali yoba

21.05.2019
13:43:54

Доброго дня. Есть вопрос по структуре кода: сейчас у меня есть на руках система для распознавания и выгрузки в жсон текста определенных полей отсканированных бухгалтерских документов. Проблема в том, что качество документов очень разное, а система сейчас написана как вермишель из функций, которые идут по следующей цепочке: рспознавание типа документа -> выделение таблиц -> нарезка таблиц на ячейки -> обработка каждой ячейки как отдельного изображения с помощью системы OCR и выгрузка результатов в текстовый документ -> сборка всех текстовых доков в один итоговый файл жсона. Можете ли дать мне какие-нибудь рекомендации по переводу этого кода в человеческий вид? На PyImageSearch и в учебниках OpenCV, например, такая вермишель из функций считается совершенно нормальным делом, а теперь ее надо в веб-сервис переклепать. Тут падения сервера из-за порченного документа совсем не нужны.

Александр

21.05.2019
13:44:15

решал

С помощью сервиса recapture

vladislav

21.05.2019
13:44:44

С помощью сервиса recapture

Опиши вопрос целиком, как парень выше сделал)0 может кто-то и поможет

Максим

21.05.2019
13:45:31

Всем привет! Кто-то решал рекапчи?

Есть смысл кинуть вам ссылку на номета?

Доброго дня. Есть вопрос по структуре кода: сейчас у меня есть на руках система для распознавания и выгрузки в жсон текста определенных полей отсканированных бухгалтерских документов. Проблема в том, что качество документов очень разное, а система сейчас написана как вермишель из функций, которые идут по следующей цепочке: рспознавание типа документа -> выделение таблиц -> нарезка таблиц на ячейки -> обработка каждой ячейки как отдельного изображения с помощью системы OCR и выгрузка результатов в текстовый документ -> сборка всех текстовых доков в один итоговый файл жсона. Можете ли дать мне какие-нибудь рекомендации по переводу этого кода в человеческий вид? На PyImageSearch и в учебниках OpenCV, например, такая вермишель из функций считается совершенно нормальным делом, а теперь ее надо в веб-сервис переклепать. Тут падения сервера из-за порченного документа совсем не нужны.

Погугли celery chain

Александр

21.05.2019
13:47:39

Возникли трудности в решении рекапчи от google. Капчи решаю с помощью стороннего сервиса. При заполнении скрытого поля в рекапчи через браузер, все получается четко. А вот если делать это в фоне, то Гугл не принимает решение. Возможно кто-то сталкивался с этим и поможет в решении.

oche somali yoba

21.05.2019
13:52:38

Погугли celery chain

Спасибо. У меня самая большая проблема - выделение таблицы и разделение ее на ячейки для тессеракта, потому что трансформация для создания четких контуров приводит к появлению пустых ячеек внутри ячеек, контура которых образовываются из случайных дефектов изображения вроде чернильных точек или остаточного шума. А без этой трансформации несколько ячеек могут слиться воедино из-за обратного дефекта - нечеткого контура.

Islam

21.05.2019
13:52:50

Здорова хлопцi

Alex

21.05.2019
13:52:53

Но ведь люди пользуются пандасом специально для обработки подобных данных. Там есть нечто для ускорения и перфоманса. Дата инженеры хранять инфу в цсвшках и дальше обрабатывают. Ведь всегда есть способ достать информацию из памяти быстрее, чем из памяти какой-то бд. Нужно лишь как-то сделать индексацию, хеш таблицу по столбцу в датафрейме, но я читаю доку и не понимаю как(

но это ж не значит что люди во всех случаях берут огромный CSV пихают в память и с ним работают. хотя 2 ГБ это не так много. и еще это зависит от характера операций над данными. пандас тебе позволяет читать свой огромный файл блоками, но если тебе нужен доступ к случайным данным или индекс, очевидно CSV не самый подходящий для этого формат.

Sergey

21.05.2019
13:54:43

но это ж не значит что люди во всех случаях берут огромный CSV пихают в память и с ним работают. хотя 2 ГБ это не так много. и еще это зависит от характера операций над данными. пандас тебе позволяет читать свой огромный файл блоками, но если тебе нужен доступ к случайным данным или индекс, очевидно CSV не самый подходящий для этого формат.

Так какая разница csv это или я из json вытащил инфу и создала dataframe или генерирую его случайно. Теперь то у меня dataframe и я занимаюсь поисками значений в нем по фильтру одного столбца все время.

Tishka17

21.05.2019
13:54:55

удоли

Svetlana

21.05.2019
14:26:54

Требуется Python-lead Успешная западная веб-компания в области специализированного интернет-поиска запускает новый продукт, рассчитанный на конечных пользователей. Ищем талантливых и опытных разработчиков на Python 3. Обязанности: Проектирование и разработка архитектуры продукта и модулей, разработка бэкенда на python > 3.6 Распределение задач в рамках команды разработки Масштабирование архитектуры проекта по мере роста нагрузки и функционала Ревью кода Требования: Опыт коммерческой веб-разработки от 3 лет Отличное владение Python 3 и современными фреймворками (Django Rest Framework, Flask, Tornado и т.д. - хотя бы одним, но отлично) Знание SQL (Postgres), опыт проектирования БД, умение писать и оптимизировать сложные запросы (в продукте ОРМа не будет) Заработная плата: 200-350т.р. на руки Контакты для связи: hr@sci-guide.com #вакансии #работа #москва #IT #python #jobs

Maxim

21.05.2019
14:28:04

хай народ! а кто-нибудь решал такую траблу? ERROR: Exception: Traceback (most recent call last): File "/opt/venv/lib/python3.7/site-packages/pip/_internal/req/req_tracker.py", line 60, in add with open(entry_path) as fp: FileNotFoundError: [Errno 2] No such file or directory: '/tmp/pip-req-tracker-gbn92j9q/d0cc965cc7' делаю python setup.py install а внутри пару строк вида pipmain(['download', 'git+ssh://git@repo.git@v1', f'-d{extrasFolder}']) перед тем как упасть, есть строка Re-using requirements tracker '/tmp/pip-req-tracker-gbn92j9q. выглядит как будто этот трекер создается на первом download, а потом удаляется сразу ну и второй download пытается юзать несуществующую директорию. как бы этот requirements tracker не переиспользовать?

Pavel

21.05.2019
14:29:49

Требуется Python-lead Успешная западная веб-компания в области специализированного интернет-поиска запускает новый продукт, рассчитанный на конечных пользователей. Ищем талантливых и опытных разработчиков на Python 3. Обязанности: Проектирование и разработка архитектуры продукта и модулей, разработка бэкенда на python > 3.6 Распределение задач в рамках команды разработки Масштабирование архитектуры проекта по мере роста нагрузки и функционала Ревью кода Требования: Опыт коммерческой веб-разработки от 3 лет Отличное владение Python 3 и современными фреймворками (Django Rest Framework, Flask, Tornado и т.д. - хотя бы одним, но отлично) Знание SQL (Postgres), опыт проектирования БД, умение писать и оптимизировать сложные запросы (в продукте ОРМа не будет) Заработная плата: 200-350т.р. на руки Контакты для связи: hr@sci-guide.com #вакансии #работа #москва #IT #python #jobs

DRF + ORM'а не будет. не, оно конечно можно, но очень странно.

Google

Admin

ERROR: S client not available

Сергей

21.05.2019
15:19:39

Вопрос по Django2.1: использую как сервер и, посылая пост запрос, возвращает ошибку мол csrf токен failed. В функции index, которая вызывается при запросе добавил декоратор csrf_protect - не помогло. Нагуглить не могу. Как поправить?

Николай

21.05.2019
15:20:42

Вопрос по Django2.1: использую как сервер и, посылая пост запрос, возвращает ошибку мол csrf токен failed. В функции index, которая вызывается при запросе добавил декоратор csrf_protect - не помогло. Нагуглить не могу. Как поправить?

Добавить csrf токен в запрос?

Alex

21.05.2019
15:21:44

Вопрос по Django2.1: использую как сервер и, посылая пост запрос, возвращает ошибку мол csrf токен failed. В функции index, которая вызывается при запросе добавил декоратор csrf_protect - не помогло. Нагуглить не могу. Как поправить?

запрос откуда?

Сергей

21.05.2019
15:22:10

Мне нужно принимать post’ы от вк, там токен не получится добавить. Пока тестирую с ноута

Alex

21.05.2019
15:22:49

Мне нужно принимать post’ы от вк, там токен не получится добавить. Пока тестирую с ноута

https://docs.djangoproject.com/en/2.2/ref/csrf/#csrf-protection-should-be-disabled-for-just-a-few-views

Максим

21.05.2019
15:22:50

https://stackoverflow.com/a/31136060/6482982

Сергей

21.05.2019
15:25:08

Exempt, я так понимаю, его отключает. Так работает, да

https://docs.djangoproject.com/en/2.2/ref/csrf/#csrf-protection-should-be-disabled-for-just-a-few-views

AI

21.05.2019
16:10:19

В send_data.py я импортирую класс Allocate from allocate import Allocate в allocate.py я импортирую send_data из send_data.py, вылезает ошибка c cannot import name 'Allocate' from 'allocate' как ее исправить, импорты нельзя удалять?

Скрудж

21.05.2019
16:10:34

Привет! Хочу сделать бэкап своей БД на постгресе, написать скриптик на питоне, чтобы автоматически все это происходило. Работаю с VDS, на хостингире взял диск для бэкапов. Как можно это реализовать? Спасибо за помощь

Максим

21.05.2019
16:12:40

В send_data.py я импортирую класс Allocate from allocate import Allocate в allocate.py я импортирую send_data из send_data.py, вылезает ошибка c cannot import name 'Allocate' from 'allocate' как ее исправить, импорты нельзя удалять?

перенеси send_data в allocate

Максим

21.05.2019
16:13:02

Привет! Хочу сделать бэкап своей БД на постгресе, написать скриптик на питоне, чтобы автоматически все это происходило. Работаю с VDS, на хостингире взял диск для бэкапов. Как можно это реализовать? Спасибо за помощь

Диск монтируется?

Alex

21.05.2019
16:13:18

Привет! Хочу сделать бэкап своей БД на постгресе, написать скриптик на питоне, чтобы автоматически все это происходило. Работаю с VDS, на хостингире взял диск для бэкапов. Как можно это реализовать? Спасибо за помощь

и нафига тут скриптик на питоне? в самом простом случае pg_dump + скриптик на баше + крон чуть сложнее pg_dump + ansible