@ru_python

Страница 6142 из 9768
Artem
06.08.2018
12:46:07
а не как уебки, весь путь

Nikolay
06.08.2018
12:46:30
да, имхо, ":=" - говно

Artem
06.08.2018
12:46:46
да, имхо, ":=" - говно
да, теперь это в петухоне >^_^<

Nikolay
06.08.2018
12:46:59
да, теперь это в петухоне >^_^<
еще вроде нет, в 3.8 будет, если реально вмержат

Google
Tigran
06.08.2018
12:47:12
cyka noooo

Artem
06.08.2018
12:47:22
да вмержат

Мой любимый
06.08.2018
12:51:43
его же можно не юзать, в чем проблема

Tishka17
06.08.2018
12:52:21
Мой любимый
06.08.2018
12:52:49
значит свыкнется

Nikolay
06.08.2018
12:53:54
Гвидо ж как раз из-за этой херни ушел

Minor
06.08.2018
12:54:06
чем?
Не люблю танцы с бубном.

Nikolay
06.08.2018
12:54:18
Не люблю танцы с бубном.
где там танцы с бубном? о_О

в питоне их больше гораздо же

там тупо путь от GOPATH, все

Artem
06.08.2018
12:55:34
там тупо путь от GOPATH, все
есть, но не все умеют нормально готовить гошечку

Ramil
06.08.2018
13:04:42
Ramil Myasoutov: Ребят, есть вопрос по поводу пакета pandas. Есть файл, которому передали регулярку для парсинга файла. Представим, что часть строк не парсятся пандой, в этом случае панда либо выкинет эксепшн, либо, если ее попросить, вернёт номер проблемной строки в stderr. Третьего способа получения больной строки вроде бы нет. Поэтому, возникает вопрос, как ловить такие битые строки. Решение вижу в перехватывании stderr, получение битых строк, а потом, при повторном чтении файла сохранении их в отдельный файл. Вопрос в том, знает ли кто иные решения? И что думаете по поводу моего. Спасибо

Google
Nikolay
06.08.2018
13:05:42
я когда это искал - не нашел, как простым способом регулярку к столбцу в нем применить

Ramil
06.08.2018
13:06:05
Да, можешь в sep передать регулярку, а engine указать python

Ramil
06.08.2018
13:06:48
Ага, про него

Nikolay
06.08.2018
13:07:19
ну, в случае engine=python у тебя строчки обрабатываться будут линейно все равно, насколько я помню

поэтому это аналогично тому, как если ты просто сделаешь генератор, в котором сам отфильтруешь, что надо, а потом передашь пандасу просто в Dataframe.from_records

Ramil
06.08.2018
13:09:06
по идее в исключении должна содержаться строка
Да, вот я ее и хочу забрать из stderr, но решение такое мне кажется громоздким, поэтому решил спросить о других, более лаконичных решениях

Nikolay
06.08.2018
13:10:25
Кхм, насчёт построчно не уверен, хотя в реализации питон парсера вроде он построчно и считывает
да, там же используется просто встроенный модуль csv вместо модного сишного в пандасе

Проксимов
06.08.2018
13:10:51
Nikolay
06.08.2018
13:11:04
ну и всегда есть вариант тупо грепом фильтровать файл еще до питона :)

Он её сам пропихнул
ну, эта хрень противоречит дзену питона, поэтому неудивительно, что у пацанвы пригорело

Ramil
06.08.2018
13:12:29
да, там же используется просто встроенный модуль csv вместо модного сишного в пандасе
Кхм, тогда попробую сделать эдакий препроцессинг больных строк. Спасибо

Nikolay
06.08.2018
13:12:51
Кхм, тогда попробую сделать эдакий препроцессинг больных строк. Спасибо
если файл очень большой - то это сильно замедлит его чтение

на всякий случай рассмотри возможность за пределами питона фильтровать

Ramil
06.08.2018
13:13:11
Файлы да, большие, по 7гб и выше

Nikolay
06.08.2018
13:13:37
Файлы да, большие, по 7гб и выше
ну вот я бы при таком раскладе использовал grep + GNU parallel на препроцессинге

Ramil
06.08.2018
13:13:45
Но я все хотел это решать на уровне общения с пандой, а не лезть наружу, скажем так

Google
Minor
06.08.2018
13:14:07
там тупо путь от GOPATH, все
Для каких задач юзаеш Го?

Nikolay
06.08.2018
13:14:24
Но я все хотел это решать на уровне общения с пандой, а не лезть наружу, скажем так
если ты уже фоллбэчнулся на уровень питоновской читалки - то ты уже за пределами пандаса и подкладываешь свинью себе

по-пандасовски было бы прочитать все, как получится, а потом разбить столбец по регулярке уже отдельно в самом пандасе

но это может потребовать больше рамы

Для каких задач юзаеш Го?
для разных - микросервисы, ETL

El Mariachi
06.08.2018
13:18:39
если ты пишешь именно код на питоне - то тебе в абсолютном большинстве случаев потоки не нужны
кстати, вспомнил, абсолютно реальную проблему с потоками... попытка остановить приложние по ctrl+c :))))

Nikolay
06.08.2018
13:19:16
кстати, вспомнил, абсолютно реальную проблему с потоками... попытка остановить приложние по ctrl+c :))))
это не то чтобы проблема, но это кейс, который разруливать руками не одной строкой кода надо

Minor
06.08.2018
13:19:17
для разных - микросервисы, ETL
Как вы думаете, может ли Го потеснить пайтон? Спасибо.

Nikolay
06.08.2018
13:19:32
в асинхронных сервисах простых он уже потеснил

в датасаенсе - нет, и вряд ли когда-нибудь сможет

ivan
06.08.2018
13:20:38
El Mariachi
06.08.2018
13:21:14
Потомучто гугл продвигает?

Nikolay
06.08.2018
13:21:20
А почему Go там так хорош?
потому что компиляется со статической типизацией + бесшовно горизонтально масштабируется на ядра

Tigran
06.08.2018
13:21:26
Потому что горутины

Nikolay
06.08.2018
13:21:44
у питона единственный шанс его на этом поприще догнать - это научиться в JIT со скейлом по ядрам

то есть этого шанса практически нет

по сути, надо всех разработчиков ноды заставить выкинуть это говно и придти чинить питон

Romka
06.08.2018
13:24:10
У кого-то была такая трабла с Pipenv? Что с ним делать? NameError: name 'InvalidMarker' is not defined https://pastebin.com/D4762fAq

No Name
06.08.2018
13:25:29
Google
Makc
06.08.2018
13:28:53
Незнаю правда чем это питону поможет)

Nikolay
06.08.2018
13:29:09
раст, кстати, в многопоточности быстрее, чем го

но более многословный

Проксимов
06.08.2018
13:29:50
Nikolay
06.08.2018
13:30:02
Ну С++ ещё быстрее
вовсе необязательно

Tigran
06.08.2018
13:32:08
Admin
ERROR: S client not available

Tigran
06.08.2018
13:32:14
как я заметил

Nikolay
06.08.2018
13:32:28
го вообще неспешный
смотря как на нем писать, на самом деле

например, рефлекты юзать в реальном коде - ну такое

Tigran
06.08.2018
13:32:56
да что там рефлекты

Dmitri
06.08.2018
13:33:05
ну у тебя плохая либа просто
Для работы в mysql из пайтона какая хорошая либа?

Tigran
06.08.2018
13:33:08
рефакторнул с коллбеками - всё, в два раза медленнее

Dmitri
06.08.2018
13:33:29
Nikolay
06.08.2018
13:33:30
(никогда не устаревает)

Tigran
06.08.2018
13:33:48
postgresql
два коллейшна этому оратору

Dmitri
06.08.2018
13:34:03
Google
Tigran
06.08.2018
13:34:28
подскажешь?
я mysql использовал в далёкой юности, так что не знаю

Nikolay
06.08.2018
13:34:36
Dmitri
06.08.2018
13:34:47
алхимия
мне не орм, мне либу для мускула))

Nikolay
06.08.2018
13:34:51
когда в цикле структуры создаешь - используй sync.Pool

Tigran
06.08.2018
13:34:51
но если либа не может нормально в python dbapi - это плохая либа

Romka
06.08.2018
13:34:59
Dmitri
06.08.2018
13:35:10
pymysql
не, не катит

pymysql
он вообще ничего не выкупает, сорян

Denis
06.08.2018
13:35:29
Может ты его готовишь неправильно?

Dmitri
06.08.2018
13:35:43
мусклклиент?
пайтон 3.6 есть под него MySQLdb?

Проксимов
06.08.2018
13:35:50
он вообще ничего не выкупает, сорян
А что он должен выкупать? Тебя из рабства?

Romka
06.08.2018
13:35:51
пайтон 3.6 есть под него MySQLdb?
https://github.com/PyMySQL/mysqlclient-python

Dmitri
06.08.2018
13:35:57
А что он должен выкупать? Тебя из рабства?
cur.execute("SELECT cur_id FROM currencies WHERE cur_name = %s" % (currency)) currency заходит в фанк как 'Coin' В итоге получаю - pymysql.err.InternalError: (1054, "Unknown column 'Coin' in 'where clause'")

Romka
06.08.2018
13:37:29
ty
https://pypi.org/project/mysqlclient/#description 2 - 3.6

Tigran
06.08.2018
13:38:07
или плейсхолдеры используй

Страница 6142 из 9768