
Andrew
21.05.2019
13:24:16

GTR Network
21.05.2019
13:25:20
вот и весь затык

Google

Philipp
21.05.2019
13:25:35
а в логах что
ну я в режиме дебага, просто сам селеои не реагирует

Andrew
21.05.2019
13:25:55
так а в режиме дебага что

Philipp
21.05.2019
13:26:04
но второй раз реагирует гарантировано

Ваня
21.05.2019
13:26:08

Philipp
21.05.2019
13:26:11
как будто таск не прилетает

Andrew
21.05.2019
13:26:47
значит не прилетает)

Sergey
21.05.2019
13:29:23
Привет! У меня есть жирная цсв размером пару гигабайт, есть колонка user_id.
Я использую пандас, чтобы работать с этой csv. Подозреваю, что есть какие то способы произвести в dataframe индексацию по user_id, чтобы при дальшейшем использовании данного поля при поиске по csv , поиск происходил не час или два , а мгновенно.
Я погуглил, попробовал, но чет ничего не ускоряется. Подскажите как ускорить поиск.
df = pd.read_csv('kek.csv')
a = df['user_id'][df.user_id == 1]

Максим
21.05.2019
13:39:06
Да, идея плохая
Я пропустил строчку где говорится, что файл двухгигабайтный

Amaro
21.05.2019
13:40:00
Или переложить CSV в базу данных. С индексом.

Максим
21.05.2019
13:40:11

Google

Максим
21.05.2019
13:40:23
Postgresql как раз для этих целей была создана

Sergey
21.05.2019
13:41:54
Но ведь люди пользуются пандасом специально для обработки подобных данных. Там есть нечто для ускорения и перфоманса. Дата инженеры хранять инфу в цсвшках и дальше обрабатывают.
Ведь всегда есть способ достать информацию из памяти быстрее, чем из памяти какой-то бд. Нужно лишь как-то сделать индексацию, хеш таблицу по столбцу в датафрейме, но я читаю доку и не понимаю как(

Tishka17
21.05.2019
13:42:38
2 гигибайта, не дв терабайта

Александр
21.05.2019
13:43:25
Всем привет! Кто-то решал рекапчи?

vladislav
21.05.2019
13:43:38

oche somali yoba
21.05.2019
13:43:54
Доброго дня. Есть вопрос по структуре кода: сейчас у меня есть на руках система для распознавания и выгрузки в жсон текста определенных полей отсканированных бухгалтерских документов. Проблема в том, что качество документов очень разное, а система сейчас написана как вермишель из функций, которые идут по следующей цепочке: рспознавание типа документа -> выделение таблиц -> нарезка таблиц на ячейки -> обработка каждой ячейки как отдельного изображения с помощью системы OCR и выгрузка результатов в текстовый документ -> сборка всех текстовых доков в один итоговый файл жсона. Можете ли дать мне какие-нибудь рекомендации по переводу этого кода в человеческий вид? На PyImageSearch и в учебниках OpenCV, например, такая вермишель из функций считается совершенно нормальным делом, а теперь ее надо в веб-сервис переклепать. Тут падения сервера из-за порченного документа совсем не нужны.

Александр
21.05.2019
13:44:15
решал
С помощью сервиса recapture

vladislav
21.05.2019
13:44:44

Максим
21.05.2019
13:45:31


Александр
21.05.2019
13:47:39
Возникли трудности в решении рекапчи от google. Капчи решаю с помощью стороннего сервиса. При заполнении скрытого поля в рекапчи через браузер, все получается четко. А вот если делать это в фоне, то Гугл не принимает решение. Возможно кто-то сталкивался с этим и поможет в решении.

oche somali yoba
21.05.2019
13:52:38
Погугли celery chain
Спасибо. У меня самая большая проблема - выделение таблицы и разделение ее на ячейки для тессеракта, потому что трансформация для создания четких контуров приводит к появлению пустых ячеек внутри ячеек, контура которых образовываются из случайных дефектов изображения вроде чернильных точек или остаточного шума. А без этой трансформации несколько ячеек могут слиться воедино из-за обратного дефекта - нечеткого контура.

Islam
21.05.2019
13:52:50
Здорова хлопцi

Alex
21.05.2019
13:52:53

Sergey
21.05.2019
13:54:43

Tishka17
21.05.2019
13:54:55
удоли

Svetlana
21.05.2019
14:26:54
Требуется Python-lead
Успешная западная веб-компания в области специализированного интернет-поиска запускает новый продукт, рассчитанный на конечных пользователей. Ищем талантливых и опытных разработчиков на Python 3.
Обязанности:
Проектирование и разработка архитектуры продукта и модулей, разработка бэкенда на python > 3.6
Распределение задач в рамках команды разработки
Масштабирование архитектуры проекта по мере роста нагрузки и функционала
Ревью кода
Требования:
Опыт коммерческой веб-разработки от 3 лет
Отличное владение Python 3 и современными фреймворками (Django Rest Framework, Flask, Tornado и т.д. - хотя бы одним, но отлично)
Знание SQL (Postgres), опыт проектирования БД, умение писать и оптимизировать сложные запросы (в продукте ОРМа не будет)
Заработная плата: 200-350т.р. на руки
Контакты для связи:
hr@sci-guide.com
#вакансии #работа #москва #IT #python #jobs


Maxim
21.05.2019
14:28:04
хай народ! а кто-нибудь решал такую траблу? ERROR: Exception:
Traceback (most recent call last):
File "/opt/venv/lib/python3.7/site-packages/pip/_internal/req/req_tracker.py", line 60, in add
with open(entry_path) as fp:
FileNotFoundError: [Errno 2] No such file or directory: '/tmp/pip-req-tracker-gbn92j9q/d0cc965cc7'
делаю python setup.py install а внутри пару строк вида pipmain(['download', 'git+ssh://git@repo.git@v1', f'-d{extrasFolder}'])
перед тем как упасть, есть строка Re-using requirements tracker '/tmp/pip-req-tracker-gbn92j9q. выглядит как будто этот трекер создается на первом download, а потом удаляется сразу ну и второй download пытается юзать несуществующую директорию.
как бы этот requirements tracker не переиспользовать?

Pavel
21.05.2019
14:29:49

Google

Admin
ERROR: S client not available

Сергей
21.05.2019
15:19:39
Вопрос по Django2.1: использую как сервер и, посылая пост запрос, возвращает ошибку мол csrf токен failed. В функции index, которая вызывается при запросе добавил декоратор csrf_protect - не помогло. Нагуглить не могу. Как поправить?

Николай
21.05.2019
15:20:42

Alex
21.05.2019
15:21:44

Сергей
21.05.2019
15:22:10
Мне нужно принимать post’ы от вк, там токен не получится добавить. Пока тестирую с ноута

Alex
21.05.2019
15:22:49

Максим
21.05.2019
15:22:50
https://stackoverflow.com/a/31136060/6482982

Сергей
21.05.2019
15:25:08
Exempt, я так понимаю, его отключает. Так работает, да
https://docs.djangoproject.com/en/2.2/ref/csrf/#csrf-protection-should-be-disabled-for-just-a-few-views

AI
21.05.2019
16:10:19
В send_data.py я импортирую класс Allocate
from allocate import Allocate
в allocate.py я импортирую send_data из send_data.py, вылезает ошибка c
cannot import name 'Allocate' from 'allocate'
как ее исправить, импорты нельзя удалять?

Скрудж
21.05.2019
16:10:34
Привет! Хочу сделать бэкап своей БД на постгресе, написать скриптик на питоне, чтобы автоматически все это происходило. Работаю с VDS, на хостингире взял диск для бэкапов. Как можно это реализовать? Спасибо за помощь

Максим
21.05.2019
16:12:40

Максим
21.05.2019
16:13:02

Alex
21.05.2019
16:13:18

Скрудж
21.05.2019
16:13:45

Максим
21.05.2019
16:13:59

Скрудж
21.05.2019
16:14:09