@ru_python

Страница 8545 из 9768
Riortre
28.03.2019
16:23:18
Но мне прям нравится скорость работы

Pavel
28.03.2019
16:23:45
Кх это весело)
arrayJoin, хочу памяти. хочу еще arrayJoin, но больше памяти в мастер ноду не лезет :(

шутка

Farrukh
28.03.2019
16:24:05
Ребят, кто пользовался BeautifulSoup4?

Google
Eldar
28.03.2019
16:24:07
Кх это весело)
особенно радует их фича в одном из релизов, где падающая нода тянула весь кластер за собой)

Riortre
28.03.2019
16:25:32
Я так однажды психанул и взял сервак на 512 гигов оперативы

Eldar
28.03.2019
16:25:33
это когда она в зукипере то мусорила?
не, там вроде была неправильная работа с памятью

Pavel
28.03.2019
16:27:19
но всё ж самое крутое что у них было, это хранение препроцессд-конфигов в /etc

цари просто

только пару релизов назад они это выпилили в /var/

Vladimir
28.03.2019
16:29:12
@Tishka17 спасибо, помогло, файл сделал )

Sergey
28.03.2019
16:29:34
Всем привет. Вопрос не столько про питон, сколько про работу с файлами в целом, но питон может всё, может и с моим кейсом кто-то сталкивался? Суть такая - нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном (проверить полный ли файл т.е.). На первый взгляд всё казалось достаточно просто - считываем размер файла через os, считываем битрейт через mutagen, делим, получаем искомое. По факту всё чуть сложнее - реальный размер всегда чуть больше чем должен был бы быть, причём разница не постоянная - я предполагаю что дело именно в мета-информации (тэгах). Но количество этих тегов разное, поэтому постоянную величину тоже не посчитать (одна запись может быть склеена из 1, 5 или n-кусков.). Кто-нибудь знает как посчитать именно размер тела-записи, т.е. длительность аудио-записи? P.S. На всякий случай - считать длительность записи из тегов не вариант, т.к. там неккоректная информация.

꧁꧂OGURCHIK꧁꧂
28.03.2019
16:30:15
Всем привет. Вопрос не столько про питон, сколько про работу с файлами в целом, но питон может всё, может и с моим кейсом кто-то сталкивался? Суть такая - нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном (проверить полный ли файл т.е.). На первый взгляд всё казалось достаточно просто - считываем размер файла через os, считываем битрейт через mutagen, делим, получаем искомое. По факту всё чуть сложнее - реальный размер всегда чуть больше чем должен был бы быть, причём разница не постоянная - я предполагаю что дело именно в мета-информации (тэгах). Но количество этих тегов разное, поэтому постоянную величину тоже не посчитать (одна запись может быть склеена из 1, 5 или n-кусков.). Кто-нибудь знает как посчитать именно размер тела-записи, т.е. длительность аудио-записи? P.S. На всякий случай - считать длительность записи из тегов не вариант, т.к. там неккоректная информация.
нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном ?

Google
Pavel
28.03.2019
16:30:36
Всем привет. Вопрос не столько про питон, сколько про работу с файлами в целом, но питон может всё, может и с моим кейсом кто-то сталкивался? Суть такая - нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном (проверить полный ли файл т.е.). На первый взгляд всё казалось достаточно просто - считываем размер файла через os, считываем битрейт через mutagen, делим, получаем искомое. По факту всё чуть сложнее - реальный размер всегда чуть больше чем должен был бы быть, причём разница не постоянная - я предполагаю что дело именно в мета-информации (тэгах). Но количество этих тегов разное, поэтому постоянную величину тоже не посчитать (одна запись может быть склеена из 1, 5 или n-кусков.). Кто-нибудь знает как посчитать именно размер тела-записи, т.е. длительность аудио-записи? P.S. На всякий случай - считать длительность записи из тегов не вариант, т.к. там неккоректная информация.
info.length UPD: а, мимо тегов...

мутаген у тебя уже есть

Tishka17
28.03.2019
16:31:23
Vladimir
28.03.2019
16:31:32
пдф )))) и текст )

Tishka17
28.03.2019
16:31:48
Всем привет. Вопрос не столько про питон, сколько про работу с файлами в целом, но питон может всё, может и с моим кейсом кто-то сталкивался? Суть такая - нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном (проверить полный ли файл т.е.). На первый взгляд всё казалось достаточно просто - считываем размер файла через os, считываем битрейт через mutagen, делим, получаем искомое. По факту всё чуть сложнее - реальный размер всегда чуть больше чем должен был бы быть, причём разница не постоянная - я предполагаю что дело именно в мета-информации (тэгах). Но количество этих тегов разное, поэтому постоянную величину тоже не посчитать (одна запись может быть склеена из 1, 5 или n-кусков.). Кто-нибудь знает как посчитать именно размер тела-записи, т.е. длительность аудио-записи? P.S. На всякий случай - считать длительность записи из тегов не вариант, т.к. там неккоректная информация.
vbr слышал?

Vladimir
28.03.2019
16:32:39
только не могу теперь понять, некоторые файлы pdfminer не считывает, точнее, читает их пустыми, а pdftotext нормально извлекает текст

Tishka17
28.03.2019
16:32:49
Всем привет. Вопрос не столько про питон, сколько про работу с файлами в целом, но питон может всё, может и с моим кейсом кто-то сталкивался? Суть такая - нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном (проверить полный ли файл т.е.). На первый взгляд всё казалось достаточно просто - считываем размер файла через os, считываем битрейт через mutagen, делим, получаем искомое. По факту всё чуть сложнее - реальный размер всегда чуть больше чем должен был бы быть, причём разница не постоянная - я предполагаю что дело именно в мета-информации (тэгах). Но количество этих тегов разное, поэтому постоянную величину тоже не посчитать (одна запись может быть склеена из 1, 5 или n-кусков.). Кто-нибудь знает как посчитать именно размер тела-записи, т.е. длительность аудио-записи? P.S. На всякий случай - считать длительность записи из тегов не вариант, т.к. там неккоректная информация.
Если в тегах неправильная, только декодировать весь файл и смотреть что получилось. Ну либо как ты сказал в случае cbr

Sergey
28.03.2019
16:32:55
info.length UPD: а, мимо тегов...
Да, это было бы слишком просто:)

vbr слышал?
Нет. Погуглю. Спасибо!!

Марк
28.03.2019
16:33:23
Кстати, о редиске. Это страшно медленная херня, если не юзать пайплайны

Tishka17
28.03.2019
16:33:36
Нет. Погуглю. Спасибо!!
Variable bit rate. Когда битрейт меняется в течение файла

Sergey
28.03.2019
16:33:54
Variable bit rate. Когда битрейт меняется в течение файла
Да, он там скачет в разных фреймах

ST
28.03.2019
16:33:55
Скиньте пожалуйста чаты по вордпресс

Марк
28.03.2019
16:34:08
Sergey
28.03.2019
16:34:16
Я не знал что это спец. термин)

Pavel
28.03.2019
16:35:33
Всем привет. Вопрос не столько про питон, сколько про работу с файлами в целом, но питон может всё, может и с моим кейсом кто-то сталкивался? Суть такая - нужно по размеру mp3-файла посчитать его длительность и сравнить с эталоном (проверить полный ли файл т.е.). На первый взгляд всё казалось достаточно просто - считываем размер файла через os, считываем битрейт через mutagen, делим, получаем искомое. По факту всё чуть сложнее - реальный размер всегда чуть больше чем должен был бы быть, причём разница не постоянная - я предполагаю что дело именно в мета-информации (тэгах). Но количество этих тегов разное, поэтому постоянную величину тоже не посчитать (одна запись может быть склеена из 1, 5 или n-кусков.). Кто-нибудь знает как посчитать именно размер тела-записи, т.е. длительность аудио-записи? P.S. На всякий случай - считать длительность записи из тегов не вариант, т.к. там неккоректная информация.
там есть padding

и формулы для константного битрейта тоже есть.

Google
Pavel
28.03.2019
16:36:33
но в случае переменного битрейта лучше воспользоваться советом @Tishka17 .

Марк
28.03.2019
16:37:36
Я редиску юзал как брокер пока в профайлере не увидел, насколько же медленные сеты и геты. Посмотрю на альтернативы

Alfred
28.03.2019
16:38:16
чуваки, кто юзает Pycharm? У вас тоже пропал 32 битный лаунчер после обновы до 19.1?

Pavel
28.03.2019
16:42:58
Декодировать в последовательность битов?
тебе только ответ нужен? или сама реализация должна быть твоя?

тебе только ответ нужен? или сама реализация должна быть твоя?
потому как можно заставить работать на себя какой-нить ffmpeg или sox

Марк
28.03.2019
16:43:36
Медленные? Это ты что туда пихал?
В рамках микросекунд медленные

Tishka17
28.03.2019
16:43:57
Декодировать в последовательность битов?
https://stackoverflow.com/questions/10437750/how-to-get-the-real-actual-duration-of-an-mp3-file-vbr-or-cbr-server-side для начала

Sergey
28.03.2019
16:44:25
Andrew
28.03.2019
16:44:56
В рамках микросекунд медленные
Насколько медленные в сравнении с мемкешед

Pavel
28.03.2019
16:45:20
Я ещё не оч хорошо понимаю что мне нужно
посмотри в сторону чего то типа sox -n stat <file> | grep length

LighteR
28.03.2019
16:45:45
В рамках микросекунд медленные
Подожди, но ведь pipeline же решает только проблемы большого concurency

Google
LighteR
28.03.2019
16:46:19
Ага
Скорость самих get/set от этого не должна меняться

в твоем случае проблема была скорее всего в ожидании получения коннекта из пула

Марк
28.03.2019
16:47:14
Ну я пока думаю затюнить редиску, а то он у меня часто сбрасывает на диск данные.

Выжмем из ентого, потом посмотрим

Tishka17
28.03.2019
16:49:12
Чёт я не втыкаю что за пайплайн

LighteR
28.03.2019
16:49:27
когда в один коннект можно отправить сразу несколько запросов

параллельных

Tishka17
28.03.2019
16:49:32
Эм

Окей

LighteR
28.03.2019
16:49:51
про http pipelining слышал?

вот это тоже самое по-сути

Tishka17
28.03.2019
16:50:08
Типа мультиплексирование соединения?

Хм. А в чем Профит кроме экономии сокетов?

LighteR
28.03.2019
16:51:34
Хм. А в чем Профит кроме экономии сокетов?
Ну у тебя же обычно пул ограничен

VoRend
28.03.2019
16:51:43
Привет, всем

Pavel
28.03.2019
16:52:06
Tishka17
28.03.2019
16:52:30
Ну у меня и клиентов число ограничено

LighteR
28.03.2019
16:52:37
Хм. А в чем Профит кроме экономии сокетов?
был еще пару лет назад хайп вокруг https://github.com/squeaky-pl/japronto когда на питоне выжимали миллион рпс из http-сервера

но этот миллион получался только в случае использования http pipelining'а

Pavel
28.03.2019
16:53:45
но этот миллион получался только в случае использования http pipelining'а
но чистые rps без нагрузки так себе характеристика. узкое место обычно в ковырянии бд и бизнеслогике

Google
LighteR
28.03.2019
16:54:07
Tishka17
28.03.2019
16:54:38
Каких клиентов?
Клиентов редиса

LighteR
28.03.2019
16:55:22
но чистые rps без нагрузки так себе характеристика. узкое место обычно в ковырянии бд и бизнеслогике
Обычно да, но не всегда. Опять же это лишня нагрузка на cpu и лишний latency

Клиентов редиса
у тебя синхронные приложения?

Tishka17
28.03.2019
16:56:13
Я понял, ок. Но боюсь у меня они все равно будут драться за обновление одних данных

LighteR
28.03.2019
17:09:51
Я понял, ок. Но боюсь у меня они все равно будут драться за обновление одних данных
в общем, если кол-во одновременных запросов в редис <= кол-ва коннектов, то профита от пайплайна не должно быть, ну не считая экономии на спичках (сокетах)

Tishka17
28.03.2019
17:10:38
А как делают шардинг в редисе обычно?

Гев
28.03.2019
17:11:11
Можете пожалуйста подсказать где тут ошибка?



LighteR
28.03.2019
17:11:16
@MarkEgorov а ты, кстати, профайлил проблемы со своими медленными запросами в редис без pipeline'а?

Гев
28.03.2019
17:11:19
Это для бота телеги

LighteR
28.03.2019
17:11:27
А как делают шардинг в редисе обычно?
шардинг по разным инстансам редиса?

Tishka17
28.03.2019
17:11:44
шардинг по разным инстансам редиса?
Угу. У меня независимые счётчики, могу их раскидать как угодно

Гев
28.03.2019
17:11:45
Связано с 9 строчкой

Tishka17
28.03.2019
17:12:16
Кажется, с отступом

LighteR
28.03.2019
17:12:23
Ага. Я за них с говорю
ну я имел в виду, профайлил ли ты в каком именно месте затык происходит?

Гев
28.03.2019
17:13:13
Кажется, с отступом
От душы спасибо

Страница 8545 из 9768