
Artem
06.08.2018
12:46:07
а не как уебки, весь путь

Nikolay
06.08.2018
12:46:30
да, имхо, ":=" - говно

Artem
06.08.2018
12:46:46

Nikolay
06.08.2018
12:46:59

Google

Tigran
06.08.2018
12:47:12
cyka noooo

Artem
06.08.2018
12:47:22
да вмержат

Мой любимый
06.08.2018
12:51:43
его же можно не юзать, в чем проблема

Tishka17
06.08.2018
12:52:21

Мой любимый
06.08.2018
12:52:49
значит свыкнется

Nikolay
06.08.2018
12:53:54
Гвидо ж как раз из-за этой херни ушел

Minor
06.08.2018
12:54:06
чем?
Не люблю танцы с бубном.

Nikolay
06.08.2018
12:54:18
в питоне их больше гораздо же
там тупо путь от GOPATH, все

Artem
06.08.2018
12:55:34

Ramil
06.08.2018
13:04:42
Ramil Myasoutov:
Ребят, есть вопрос по поводу пакета pandas. Есть файл, которому передали регулярку для парсинга файла. Представим, что часть строк не парсятся пандой, в этом случае панда либо выкинет эксепшн, либо, если ее попросить, вернёт номер проблемной строки в stderr. Третьего способа получения больной строки вроде бы нет. Поэтому, возникает вопрос, как ловить такие битые строки. Решение вижу в перехватывании stderr, получение битых строк, а потом, при повторном чтении файла сохранении их в отдельный файл. Вопрос в том, знает ли кто иные решения? И что думаете по поводу моего. Спасибо


Nikolay
06.08.2018
13:05:19
Ramil Myasoutov:
Ребят, есть вопрос по поводу пакета pandas. Есть файл, которому передали регулярку для парсинга файла. Представим, что часть строк не парсятся пандой, в этом случае панда либо выкинет эксепшн, либо, если ее попросить, вернёт номер проблемной строки в stderr. Третьего способа получения больной строки вроде бы нет. Поэтому, возникает вопрос, как ловить такие битые строки. Решение вижу в перехватывании stderr, получение битых строк, а потом, при повторном чтении файла сохранении их в отдельный файл. Вопрос в том, знает ли кто иные решения? И что думаете по поводу моего. Спасибо
пандас умеет в регулярки?

Google

Nikolay
06.08.2018
13:05:42
я когда это искал - не нашел, как простым способом регулярку к столбцу в нем применить

Ramil
06.08.2018
13:06:05
Да, можешь в sep передать регулярку, а engine указать python

Nikolay
06.08.2018
13:06:37

Ramil
06.08.2018
13:06:48
Ага, про него

Nikolay
06.08.2018
13:07:19
ну, в случае engine=python у тебя строчки обрабатываться будут линейно все равно, насколько я помню
поэтому это аналогично тому, как если ты просто сделаешь генератор, в котором сам отфильтруешь, что надо, а потом передашь пандасу просто в Dataframe.from_records

Eldar
06.08.2018
13:08:11
Ramil Myasoutov:
Ребят, есть вопрос по поводу пакета pandas. Есть файл, которому передали регулярку для парсинга файла. Представим, что часть строк не парсятся пандой, в этом случае панда либо выкинет эксепшн, либо, если ее попросить, вернёт номер проблемной строки в stderr. Третьего способа получения больной строки вроде бы нет. Поэтому, возникает вопрос, как ловить такие битые строки. Решение вижу в перехватывании stderr, получение битых строк, а потом, при повторном чтении файла сохранении их в отдельный файл. Вопрос в том, знает ли кто иные решения? И что думаете по поводу моего. Спасибо
по идее в исключении должна содержаться строка

Ramil
06.08.2018
13:09:06

Nikolay
06.08.2018
13:10:25

Проксимов
06.08.2018
13:10:51

Nikolay
06.08.2018
13:11:04
ну и всегда есть вариант тупо грепом фильтровать файл еще до питона :)
Он её сам пропихнул
ну, эта хрень противоречит дзену питона, поэтому неудивительно, что у пацанвы пригорело

Ramil
06.08.2018
13:12:29

Nikolay
06.08.2018
13:12:51
на всякий случай рассмотри возможность за пределами питона фильтровать

Ramil
06.08.2018
13:13:11
Файлы да, большие, по 7гб и выше

Nikolay
06.08.2018
13:13:37

Ramil
06.08.2018
13:13:45
Но я все хотел это решать на уровне общения с пандой, а не лезть наружу, скажем так

Google

Minor
06.08.2018
13:14:07

Nikolay
06.08.2018
13:14:24
по-пандасовски было бы прочитать все, как получится, а потом разбить столбец по регулярке уже отдельно в самом пандасе
но это может потребовать больше рамы

El Mariachi
06.08.2018
13:18:39

Nikolay
06.08.2018
13:19:16

Minor
06.08.2018
13:19:17

Nikolay
06.08.2018
13:19:32
в асинхронных сервисах простых он уже потеснил
в датасаенсе - нет, и вряд ли когда-нибудь сможет

ivan
06.08.2018
13:20:38

El Mariachi
06.08.2018
13:21:14
Потомучто гугл продвигает?

Nikolay
06.08.2018
13:21:20

Tigran
06.08.2018
13:21:26
Потому что горутины

Nikolay
06.08.2018
13:21:44
у питона единственный шанс его на этом поприще догнать - это научиться в JIT со скейлом по ядрам
то есть этого шанса практически нет
по сути, надо всех разработчиков ноды заставить выкинуть это говно и придти чинить питон

Romka
06.08.2018
13:24:10
У кого-то была такая трабла с Pipenv? Что с ним делать?
NameError: name 'InvalidMarker' is not defined
https://pastebin.com/D4762fAq

No Name
06.08.2018
13:25:29

Google

Makc
06.08.2018
13:28:53
Незнаю правда чем это питону поможет)

Nikolay
06.08.2018
13:29:09
раст, кстати, в многопоточности быстрее, чем го
но более многословный

Проксимов
06.08.2018
13:29:50

Nikolay
06.08.2018
13:30:02

Tigran
06.08.2018
13:32:08

Admin
ERROR: S client not available

Tigran
06.08.2018
13:32:14
как я заметил

Nikolay
06.08.2018
13:32:28
например, рефлекты юзать в реальном коде - ну такое

Tigran
06.08.2018
13:32:56
да что там рефлекты

Dmitri
06.08.2018
13:33:05

Tigran
06.08.2018
13:33:08
рефакторнул с коллбеками - всё, в два раза медленнее

Nikolay
06.08.2018
13:33:19

Dmitri
06.08.2018
13:33:29

Nikolay
06.08.2018
13:33:30
(никогда не устаревает)

Tigran
06.08.2018
13:33:48

Dmitri
06.08.2018
13:34:03

Google

Tigran
06.08.2018
13:34:28
подскажешь?
я mysql использовал в далёкой юности, так что не знаю

Romka
06.08.2018
13:34:33

Nikolay
06.08.2018
13:34:36

Dmitri
06.08.2018
13:34:47
алхимия
мне не орм, мне либу для мускула))

Nikolay
06.08.2018
13:34:51
когда в цикле структуры создаешь - используй sync.Pool

Tigran
06.08.2018
13:34:51
но если либа не может нормально в python dbapi - это плохая либа

Denis
06.08.2018
13:34:58

Romka
06.08.2018
13:34:59

Dmitri
06.08.2018
13:35:10
pymysql
он вообще ничего не выкупает, сорян

Denis
06.08.2018
13:35:29
Может ты его готовишь неправильно?

Dmitri
06.08.2018
13:35:43

Проксимов
06.08.2018
13:35:50

Romka
06.08.2018
13:35:51

Dmitri
06.08.2018
13:35:57
А что он должен выкупать? Тебя из рабства?
cur.execute("SELECT cur_id FROM currencies WHERE cur_name = %s" % (currency))
currency заходит в фанк как 'Coin'
В итоге получаю -
pymysql.err.InternalError: (1054, "Unknown column 'Coin' in 'where clause'")

Romka
06.08.2018
13:37:29
ty
https://pypi.org/project/mysqlclient/#description
2 - 3.6

Tigran
06.08.2018
13:37:59

Dmitri
06.08.2018
13:38:06

Tigran
06.08.2018
13:38:07
или плейсхолдеры используй