@ru_python

Страница 8355 из 9768
Nobody
13.03.2019
08:52:14
всё равно не понятно почему замедляется парсинг и почему 6-8 гиг жрёт

Tishka17
13.03.2019
08:52:41
ну вообще расширять список чем больше тем сложнее

а вот насчет 6-8 гигов - вопрос

Google
Nobody
13.03.2019
08:52:59
а не пробовал вырубить работу с пандой и посмотреть сколько ест?
вот думаю ещё попробовать словарь отключить, посмотреть сколько чистый парсинг ест

Shieldy
13.03.2019
08:53:09
Добро пожаловать, Максим Смирнов! Не забудь ознакомиться с правилами чата. Ссылка в описании группы.

Nobody
13.03.2019
08:53:35
ну вообще расширять список чем больше тем сложнее
он расширяется не много, там гдет 50 ключей, потом его в панду и новый словарь инициализирую

ага, проверил просто парсинг пролетает со свистом, парсинг в словарь так же попинаем панду

Worlak
13.03.2019
09:13:20
Народ порекомендуйте годную статью или книгу по корутинам, потокам, асинхронности и вот этому вот всему, ощущаю пробелы у себя в этой теме

На питоне есесно

Nobody
13.03.2019
09:17:25
попробуй так: сделай генератор сконвертируй в список сконвертируй в датафрейм https://stackoverflow.com/questions/42999332/fastest-way-to-convert-python-iterator-output-to-pandas-dataframe
да, примерно так и сделал сделал лист, потом аппенд словарей в него, потом единственный dataframe.append(list) летает

но всё равно жрёт как падла, он не долго)

Марк
13.03.2019
09:24:30
@Saluev, помнишь, я там парсер писал? Так вот, потестил парсер, заменил им старый. И тут понеслись какие-то странные непонятные глюки. Яоткатился, проверил еще десять раз, что работа парсера валидна. Вкатился - опять глюки. Начинаю разбирать проблему. 1. Профайлинг обоих парсеров показывает стабильно, что новый работает в два раза быстрее старого при одинаковых датасетах в районе 1-2М строк. 2. При включенном новом парсерее вся система работает МЕДЛЕННЕЕ примерно на 20 микросекунд. 3. При старом парсере апи + ангуляры работают корректно. 4. При новом они начинают как-то люто подтормаживать с задержками более секунды и потом пачками события уходить в статус pending 5. Парсер никакого отношения к апи и ангулярам не имеет. Он вообще другим занимается, куда не лезет. 6. netstat показывает, что от количества открытых соединений глюки не зависят. 7. Отладочная информация со стороны бэка(пехепе) показывает весьма непонятные результаты, в которых в принципе ничего военного. Те же разбросы по микросекундам.
Кстати, пока возился со своим парсером и тюнил его, курил всякие хай перфоманс для петона. И наткнулся на фразу чет в стиле ну всем математикам очевидно, почему dict.has_key говно . Блин, я не математик, мне чет неочевидно(((((((((((

Artur Rakhmatulin
13.03.2019
09:25:30
оно там разве не хешмапой лежит ? разве там не o(1) ?

Tishka17
13.03.2019
09:25:48
вот да

Google
BrainIsDead
13.03.2019
09:25:59
Добрый день коллеги. Не исключаю что сейчас выслушаю кучу инфы что я говно-программист. Но... т.к. изучал Python самостоятельно не в ВУЗе, благополучно забил на Алгоритмы и структуры данных. на данный момент нуждаюсь в преподе для быстрого курса вышеописанной темы в кротчайшие сроки именно с реальными примерами из Python. Если ли у кого знакоміе преподаватели или возможно кто-то сам пожелает?

Tishka17
13.03.2019
09:26:00
мне тоже не очевидно

Марк
13.03.2019
09:26:56
оно там разве не хешмапой лежит ? разве там не o(1) ?
Профайлер показывает, что has_key еще медленее, чем get.

Valery
13.03.2019
09:27:09
что там помнить что сделать хочешь?
заменить в выводе например символы пробела на символы переноса строки

Марк
13.03.2019
09:28:22
а in ?
А in как раз рекомендуется

Andrew
13.03.2019
09:28:24
вот да
там был fallback который сильно ухудшал время

Tishka17
13.03.2019
09:28:40
просто in my_dict

Valery
13.03.2019
09:28:45
заменить в выводе например символы пробела на символы переноса строки
такое точно лучше седом питон оверхед а позже написали python -c "код" в argv входная строка

Марк
13.03.2019
09:29:16
Valery
13.03.2019
09:29:20
ну и по честноку, я не люблю всякие седы и прочие башевские неочевидности, мне проще питончиком

Pavel
13.03.2019
09:29:31
Valery
13.03.2019
09:29:40
(не знаю баш, ага)

Alexey
13.03.2019
09:29:53
#работа #Python #Cpp #Java #Москва #Яндекс #офис Разработчик в Отдел технологий разработки. Уровень дохода успешного кандидата составляет 100 000 – 300 000 RUR + бонусы и большой социальный пакет. Всем привет, давайте знакомиться. Меня зовут Алексей. Я team lead одной из команд Отдела технологий разработки Яндекса, также я отвечаю за найм в отделе. Мне можно задавать вопросы про то, чем мы занимаемся, про задачи, про что угодно. С удовольствием отвечу. Наши решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру: системы распределенной сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, систему ревью кода, распределенную систему выполнения задач, систему хранения данных (ресурсов) и много других систем и инструментов. Мы также разрабатываем свою систему контроля версий, используя лучшее из Git, SVN и Hg, в которой комфортно работать и можно быстро создавать новые изменения в большом репозитории. Мы предлагаем вам принять участие в создании и развитии инструментов, позволяющих поддерживать высокий темп и качество разработки. Есть задачи на любой вкус. Из языков – C++, Python, Java. Есть низкоуровневые решения и есть прикладные системы, взаимодействующие с различными видами баз данных. Небольшое видео про нас: https://youtu.be/8NHDcwOEBDs?t=13127

Valery
13.03.2019
09:30:14
Google
Tishka17
13.03.2019
09:30:59
Профайлер показывает, что has_key еще медленее, чем get.
>>> s={1:2} >>> s.has_key(3) Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'dict' object has no attribute 'has_key'

Valery
13.03.2019
09:31:04
#работа #Python #Cpp #Java #Москва #Яндекс #офис Разработчик в Отдел технологий разработки. Уровень дохода успешного кандидата составляет 100 000 – 300 000 RUR + бонусы и большой социальный пакет. Всем привет, давайте знакомиться. Меня зовут Алексей. Я team lead одной из команд Отдела технологий разработки Яндекса, также я отвечаю за найм в отделе. Мне можно задавать вопросы про то, чем мы занимаемся, про задачи, про что угодно. С удовольствием отвечу. Наши решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру: системы распределенной сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, систему ревью кода, распределенную систему выполнения задач, систему хранения данных (ресурсов) и много других систем и инструментов. Мы также разрабатываем свою систему контроля версий, используя лучшее из Git, SVN и Hg, в которой комфортно работать и можно быстро создавать новые изменения в большом репозитории. Мы предлагаем вам принять участие в создании и развитии инструментов, позволяющих поддерживать высокий темп и качество разработки. Есть задачи на любой вкус. Из языков – C++, Python, Java. Есть низкоуровневые решения и есть прикладные системы, взаимодействующие с различными видами баз данных. Небольшое видео про нас: https://youtu.be/8NHDcwOEBDs?t=13127
требования?

Tishka17
13.03.2019
09:31:04
хз что вы там измеряете

Tigran
13.03.2019
09:31:23
Марк
13.03.2019
09:31:36
>>> s={1:2} >>> s.has_key(3) Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'dict' object has no attribute 'has_key'
Потому шо ты модный хипстер и пишешь на тройке, где его ужо нет

Pavel
13.03.2019
09:31:42
хз что вы там измеряете
длину второго питона

Tishka17
13.03.2019
09:31:55
длину древнего легаси, которое доживает последний год?

окей

Tishka17
13.03.2019
09:32:12
давайте ещё профайлером потыкаем 2.4

Tishka17
13.03.2019
09:32:40
имеется в виду in, наверное
увы нет, именно has_key - он судя по всему просто кривой и что-то лишнее делал. Его выпилили чтобы никого не смущать

Pavel
13.03.2019
09:33:03
автор кнут
у него примеры на миксе а не на питоне

Worlak
13.03.2019
09:33:21
Продублирую

Народ порекомендуйте годную статью или книгу по корутинам, потокам, асинхронности и вот этому вот всему, ощущаю пробелы у себя в этой теме

На питоне есесно

Worlak
13.03.2019
09:34:19
Так я и сам могу

Pavel
13.03.2019
09:34:25
есть пруфцы?
что такое в мейллистах было. но сами в них ищите

Google
Worlak
13.03.2019
09:34:32
Я же рекомендации хочу, а не все подряд

Tishka17
13.03.2019
09:34:58
есть пруфцы?
$ python -mtimeit -s'd=dict.fromkeys(range(99))' '12 in d' 10000000 loops, best of 3: 0.0285 usec per loop $ python -mtimeit -s'd=dict.fromkeys(range(99))' 'd.has_key(12)' 10000000 loops, best of 3: 0.067 usec per loop

Artur Rakhmatulin
13.03.2019
09:35:02
Я же рекомендации хочу, а не все подряд
ты выбираешь сидеть и ждать подарка с небес, или взяться хоть за что-нибудь?

Tishka17
13.03.2019
09:35:08
ну разница в 3 раза - не смертельно

Worlak
13.03.2019
09:35:10
Я уже с потоками сам нашёл материал на хабре, а мне сказали что это плохой стиль

Tishka17
13.03.2019
09:35:11
хз короче

BrainIsDead
13.03.2019
09:35:22
автор кнут
Спасибо

Tigran
13.03.2019
09:35:29
ну разница в 3 раза - не смертельно
ну да. это, скорее всего, затраты на getattribute и call

Tishka17
13.03.2019
09:35:52
пишут, что has_key нужен если вы пишете до питона 2.3

Worlak
13.03.2019
09:36:01
ты выбираешь сидеть и ждать подарка с небес, или взяться хоть за что-нибудь?
Я выбираю дождаться годного материала, перед этим почитывая сам по методу который ты скинул

Pavel
13.03.2019
09:36:52
пишут, что has_key нужен если вы пишете до питона 2.3
в любом случае актуальности этого осталось меньше года

Alexey
13.03.2019
09:37:08
требования?
Из обязательного: – Знания одного из языков: C++, Python, Java, C#, Go – Хорошая алгоритмическая подготовка. Все остальное (знания БД, кругозор и т.д.) скорее как дополнительные плюсы.

Alexey
13.03.2019
09:38:06
звучит как требование на джуна, нет?
У нас много вакансий на разные уровни подготовки.

Valery
13.03.2019
09:38:14
да, я в курсе)

Artur Rakhmatulin
13.03.2019
09:38:50
У нас много вакансий на разные уровни подготовки.
тестовое задание? код на бумажке? задачи про хрустальные шары?

Tishka17
13.03.2019
09:39:33
ну да. это, скорее всего, затраты на getattribute и call
https://www.python.org/dev/peps/pep-0290/#testing-dictionary-membership в общем да

Worlak
13.03.2019
09:39:38
Tishka17
13.03.2019
09:39:51
всего ли getattribute и вызов функции

Google
Tishka17
13.03.2019
09:40:02
хз что имел ввиду автор того высказывания

#работа #Python #Cpp #Java #Москва #Яндекс #офис Разработчик в Отдел технологий разработки. Уровень дохода успешного кандидата составляет 100 000 – 300 000 RUR + бонусы и большой социальный пакет. Всем привет, давайте знакомиться. Меня зовут Алексей. Я team lead одной из команд Отдела технологий разработки Яндекса, также я отвечаю за найм в отделе. Мне можно задавать вопросы про то, чем мы занимаемся, про задачи, про что угодно. С удовольствием отвечу. Наши решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру: системы распределенной сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, систему ревью кода, распределенную систему выполнения задач, систему хранения данных (ресурсов) и много других систем и инструментов. Мы также разрабатываем свою систему контроля версий, используя лучшее из Git, SVN и Hg, в которой комфортно работать и можно быстро создавать новые изменения в большом репозитории. Мы предлагаем вам принять участие в создании и развитии инструментов, позволяющих поддерживать высокий темп и качество разработки. Есть задачи на любой вкус. Из языков – C++, Python, Java. Есть низкоуровневые решения и есть прикладные системы, взаимодействующие с различными видами баз данных. Небольшое видео про нас: https://youtu.be/8NHDcwOEBDs?t=13127
как много вакансий от яндекса. и каждый день новый рекрутер. Но верхний предел начал радовать, рпньше жмотились

Artur Rakhmatulin
13.03.2019
09:41:18
разбег космос

Alexey
13.03.2019
09:41:27
тестовое задание? код на бумажке? задачи про хрустальные шары?
Тестовое задания для стажеров – да. Для кандидатов с опытом – подобное уже не практикуется. Код на бумажке/на доске во время собеседования – да. Задачи про хрустальные шары – не знаю о чем ты, но думаю что это в прошлом ?

Tishka17
13.03.2019
09:41:55
хз, мне не показалось, что они что-то сложное задают

Алексей
13.03.2019
09:42:04
Tishka17
13.03.2019
09:43:27
Не жмотились, инфа 100%. Я. работаю в Яндексе не один год.
ну окей, по моим данным яндекс всегда ниже рынка платил

Aragaer
13.03.2019
09:43:50
мне задачку про шары задавал мой начальник на моей самой первой работе

но тогда все-таки было всего 2 шара, на n шаров мы не обобщали

Alexey
13.03.2019
09:44:40
ну окей, по моим данным яндекс всегда ниже рынка платил
Данные ошибочные. Я здесь давно и точно знаю что хорошие разработчики у нас зарабатывают заметно выше рынка.

Tishka17
13.03.2019
09:44:49
ну окей

Alexey
13.03.2019
09:45:38

Страница 8355 из 9768