
Tishka17
13.03.2019
08:52:08

Nobody
13.03.2019
08:52:14
всё равно не понятно почему замедляется парсинг
и почему 6-8 гиг жрёт

Tishka17
13.03.2019
08:52:41
ну вообще расширять список чем больше тем сложнее
а вот насчет 6-8 гигов - вопрос

Google

Nobody
13.03.2019
08:52:59

Shieldy
13.03.2019
08:53:09
Добро пожаловать, Максим Смирнов!
Не забудь ознакомиться с правилами чата. Ссылка в описании группы.

Nobody
13.03.2019
08:53:35
ага, проверил
просто парсинг пролетает со свистом, парсинг в словарь так же
попинаем панду

Worlak
13.03.2019
09:13:20
Народ порекомендуйте годную статью или книгу по корутинам, потокам, асинхронности и вот этому вот всему, ощущаю пробелы у себя в этой теме
На питоне есесно

Tishka17
13.03.2019
09:16:14
или просто append в список


Nobody
13.03.2019
09:17:25
но всё равно жрёт как падла, он не долго)


Марк
13.03.2019
09:24:30
@Saluev, помнишь, я там парсер писал? Так вот, потестил парсер, заменил им старый. И тут понеслись какие-то странные непонятные глюки. Яоткатился, проверил еще десять раз, что работа парсера валидна. Вкатился - опять глюки.
Начинаю разбирать проблему.
1. Профайлинг обоих парсеров показывает стабильно, что новый работает в два раза быстрее старого при одинаковых датасетах в районе 1-2М строк.
2. При включенном новом парсерее вся система работает МЕДЛЕННЕЕ примерно на 20 микросекунд.
3. При старом парсере апи + ангуляры работают корректно.
4. При новом они начинают как-то люто подтормаживать с задержками более секунды и потом пачками события уходить в статус pending
5. Парсер никакого отношения к апи и ангулярам не имеет. Он вообще другим занимается, куда не лезет.
6. netstat показывает, что от количества открытых соединений глюки не зависят.
7. Отладочная информация со стороны бэка(пехепе) показывает весьма непонятные результаты, в которых в принципе ничего военного. Те же разбросы по микросекундам.
Кстати, пока возился со своим парсером и тюнил его, курил всякие хай перфоманс для петона. И наткнулся на фразу чет в стиле ну всем математикам очевидно, почему dict.has_key говно . Блин, я не математик, мне чет неочевидно(((((((((((


Artur Rakhmatulin
13.03.2019
09:25:30
оно там разве не хешмапой лежит ? разве там не o(1) ?

Tishka17
13.03.2019
09:25:48
вот да

Google

BrainIsDead
13.03.2019
09:25:59
Добрый день коллеги. Не исключаю что сейчас выслушаю кучу инфы что я говно-программист. Но... т.к. изучал Python самостоятельно не в ВУЗе, благополучно забил на Алгоритмы и структуры данных. на данный момент нуждаюсь в преподе для быстрого курса вышеописанной темы в кротчайшие сроки именно с реальными примерами из Python. Если ли у кого знакоміе преподаватели или возможно кто-то сам пожелает?

Tishka17
13.03.2019
09:26:00
мне тоже не очевидно

Valery
13.03.2019
09:26:43

Марк
13.03.2019
09:26:56

Valery
13.03.2019
09:27:09

Artur Rakhmatulin
13.03.2019
09:28:03

Марк
13.03.2019
09:28:22
а in ?
А in как раз рекомендуется

Andrew
13.03.2019
09:28:24
вот да
там был fallback который сильно ухудшал время

Tishka17
13.03.2019
09:28:40
просто in my_dict

Valery
13.03.2019
09:28:45

Valery
13.03.2019
09:29:01

Pavel
13.03.2019
09:29:03

Марк
13.03.2019
09:29:16

Valery
13.03.2019
09:29:20
ну и по честноку, я не люблю всякие седы и прочие башевские неочевидности, мне проще питончиком

Pavel
13.03.2019
09:29:31

Valery
13.03.2019
09:29:40
(не знаю баш, ага)


Alexey
13.03.2019
09:29:53
#работа #Python #Cpp #Java #Москва #Яндекс #офис
Разработчик в Отдел технологий разработки.
Уровень дохода успешного кандидата составляет 100 000 – 300 000 RUR + бонусы и большой социальный пакет.
Всем привет, давайте знакомиться. Меня зовут Алексей. Я team lead одной из команд Отдела технологий разработки Яндекса, также я отвечаю за найм в отделе. Мне можно задавать вопросы про то, чем мы занимаемся, про задачи, про что угодно. С удовольствием отвечу.
Наши решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру: системы распределенной сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, систему ревью кода, распределенную систему выполнения задач, систему хранения данных (ресурсов) и много других систем и инструментов. Мы также разрабатываем свою систему контроля версий, используя лучшее из Git, SVN и Hg, в которой комфортно работать и можно быстро создавать новые изменения в большом репозитории.
Мы предлагаем вам принять участие в создании и развитии инструментов, позволяющих поддерживать высокий темп и качество разработки.
Есть задачи на любой вкус. Из языков – C++, Python, Java. Есть низкоуровневые решения и есть прикладные системы, взаимодействующие с различными видами баз данных.
Небольшое видео про нас: https://youtu.be/8NHDcwOEBDs?t=13127


Valery
13.03.2019
09:30:14

Марк
13.03.2019
09:30:18

Valery
13.03.2019
09:30:22

Google

Tishka17
13.03.2019
09:30:59


Valery
13.03.2019
09:31:04
#работа #Python #Cpp #Java #Москва #Яндекс #офис
Разработчик в Отдел технологий разработки.
Уровень дохода успешного кандидата составляет 100 000 – 300 000 RUR + бонусы и большой социальный пакет.
Всем привет, давайте знакомиться. Меня зовут Алексей. Я team lead одной из команд Отдела технологий разработки Яндекса, также я отвечаю за найм в отделе. Мне можно задавать вопросы про то, чем мы занимаемся, про задачи, про что угодно. С удовольствием отвечу.
Наши решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру: системы распределенной сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, систему ревью кода, распределенную систему выполнения задач, систему хранения данных (ресурсов) и много других систем и инструментов. Мы также разрабатываем свою систему контроля версий, используя лучшее из Git, SVN и Hg, в которой комфортно работать и можно быстро создавать новые изменения в большом репозитории.
Мы предлагаем вам принять участие в создании и развитии инструментов, позволяющих поддерживать высокий темп и качество разработки.
Есть задачи на любой вкус. Из языков – C++, Python, Java. Есть низкоуровневые решения и есть прикладные системы, взаимодействующие с различными видами баз данных.
Небольшое видео про нас: https://youtu.be/8NHDcwOEBDs?t=13127
требования?


Tishka17
13.03.2019
09:31:04
хз что вы там измеряете

Tigran
13.03.2019
09:31:23

Марк
13.03.2019
09:31:36

Pavel
13.03.2019
09:31:42

Tishka17
13.03.2019
09:31:55
длину древнего легаси, которое доживает последний год?
окей

Tigran
13.03.2019
09:32:04

Tishka17
13.03.2019
09:32:12
давайте ещё профайлером потыкаем 2.4

Valery
13.03.2019
09:32:23

Tishka17
13.03.2019
09:32:40
имеется в виду in, наверное
увы нет, именно has_key - он судя по всему просто кривой и что-то лишнее делал. Его выпилили чтобы никого не смущать

Pavel
13.03.2019
09:33:03

Tigran
13.03.2019
09:33:14

Worlak
13.03.2019
09:33:21
Продублирую
Народ порекомендуйте годную статью или книгу по корутинам, потокам, асинхронности и вот этому вот всему, ощущаю пробелы у себя в этой теме
На питоне есесно

Artur Rakhmatulin
13.03.2019
09:34:10

Worlak
13.03.2019
09:34:19
Так я и сам могу

Pavel
13.03.2019
09:34:25
есть пруфцы?
что такое в мейллистах было. но сами в них ищите

Google

Worlak
13.03.2019
09:34:32
Я же рекомендации хочу, а не все подряд

Tishka17
13.03.2019
09:34:58
есть пруфцы?
$ python -mtimeit -s'd=dict.fromkeys(range(99))' '12 in d'
10000000 loops, best of 3: 0.0285 usec per loop
$ python -mtimeit -s'd=dict.fromkeys(range(99))' 'd.has_key(12)'
10000000 loops, best of 3: 0.067 usec per loop

Artur Rakhmatulin
13.03.2019
09:35:02

Tishka17
13.03.2019
09:35:08
ну разница в 3 раза - не смертельно

Worlak
13.03.2019
09:35:10
Я уже с потоками сам нашёл материал на хабре, а мне сказали что это плохой стиль

Tishka17
13.03.2019
09:35:11
хз короче

Admin
ERROR: S client not available

BrainIsDead
13.03.2019
09:35:22

Tigran
13.03.2019
09:35:29

Tishka17
13.03.2019
09:35:52
пишут, что has_key нужен если вы пишете до питона 2.3

Worlak
13.03.2019
09:36:01

Pavel
13.03.2019
09:36:52

Alexey
13.03.2019
09:37:08
требования?
Из обязательного:
– Знания одного из языков: C++, Python, Java, C#, Go
– Хорошая алгоритмическая подготовка.
Все остальное (знания БД, кругозор и т.д.) скорее как дополнительные плюсы.

Valery
13.03.2019
09:37:29

Worlak
13.03.2019
09:37:42

Alexey
13.03.2019
09:38:06

Valery
13.03.2019
09:38:14
да, я в курсе)

Artur Rakhmatulin
13.03.2019
09:38:50

Tishka17
13.03.2019
09:39:33

Worlak
13.03.2019
09:39:38

Google


Tishka17
13.03.2019
09:39:51
всего ли getattribute и вызов функции
хз что имел ввиду автор того высказывания
#работа #Python #Cpp #Java #Москва #Яндекс #офис
Разработчик в Отдел технологий разработки.
Уровень дохода успешного кандидата составляет 100 000 – 300 000 RUR + бонусы и большой социальный пакет.
Всем привет, давайте знакомиться. Меня зовут Алексей. Я team lead одной из команд Отдела технологий разработки Яндекса, также я отвечаю за найм в отделе. Мне можно задавать вопросы про то, чем мы занимаемся, про задачи, про что угодно. С удовольствием отвечу.
Наши решения направлены на то, чтобы любой проект Яндекса получал готовую инфраструктуру: системы распределенной сборки и непрерывной интеграции для C++, Java, Python и Go, способные обрабатывать сотни сборок в минуту, систему ревью кода, распределенную систему выполнения задач, систему хранения данных (ресурсов) и много других систем и инструментов. Мы также разрабатываем свою систему контроля версий, используя лучшее из Git, SVN и Hg, в которой комфортно работать и можно быстро создавать новые изменения в большом репозитории.
Мы предлагаем вам принять участие в создании и развитии инструментов, позволяющих поддерживать высокий темп и качество разработки.
Есть задачи на любой вкус. Из языков – C++, Python, Java. Есть низкоуровневые решения и есть прикладные системы, взаимодействующие с различными видами баз данных.
Небольшое видео про нас: https://youtu.be/8NHDcwOEBDs?t=13127
как много вакансий от яндекса. и каждый день новый рекрутер. Но верхний предел начал радовать, рпньше жмотились


Artur Rakhmatulin
13.03.2019
09:41:18
разбег космос

Alexey
13.03.2019
09:41:27

Worlak
13.03.2019
09:41:35

Tishka17
13.03.2019
09:41:55
хз, мне не показалось, что они что-то сложное задают

Алексей
13.03.2019
09:42:04

Alexey
13.03.2019
09:42:39

Artur Rakhmatulin
13.03.2019
09:43:13

Tishka17
13.03.2019
09:43:27

Aragaer
13.03.2019
09:43:50
мне задачку про шары задавал мой начальник на моей самой первой работе
но тогда все-таки было всего 2 шара, на n шаров мы не обобщали

Tigran
13.03.2019
09:44:27

Alexey
13.03.2019
09:44:40

Tishka17
13.03.2019
09:44:49
ну окей

Tigran
13.03.2019
09:45:02

Alexey
13.03.2019
09:45:38