
Pavel
28.05.2019
11:54:27

{.__.__.}
28.05.2019
11:54:37

Yevhen Nakonechnyi
28.05.2019
11:55:01

Tishka17
28.05.2019
11:55:03
у меня есть 5Гб файл в котором каждая строка - json. Как мне его побыстрее отфильтровать по одному из полей (1000 значений конкретных)? Задача одноразовая

Google

Pavel
28.05.2019
11:55:22

Michael
28.05.2019
11:55:23
это продакшн
Тогда посмотри конфиг nginx, или на чем он его поднял. (если сайт поднял конечно)

Tishka17
28.05.2019
11:55:30

Pavel
28.05.2019
11:55:43

Tishka17
28.05.2019
11:55:47
=)

Алексей
28.05.2019
11:55:54

Tishka17
28.05.2019
11:55:55
не, можно тыщу раз групнуть наверно

Pavel
28.05.2019
11:56:31
ну можно в лоб. ридлайнз -> лоадс -> ...

Yevhen Nakonechnyi
28.05.2019
11:56:44

Таисия
28.05.2019
11:56:44

Максим
28.05.2019
11:57:24

Tishka17
28.05.2019
11:57:51

{.__.__.}
28.05.2019
11:57:57

Google

Iva
28.05.2019
11:57:58
docker

Pavel
28.05.2019
11:58:01
Запихнуть в монго?
для однократной задачи он будет с этим слишком долго возиться. тут проще в лоб

Tishka17
28.05.2019
11:58:07
пофиг, запустил греп
пойду пообедаю

Iva
28.05.2019
11:58:13

Tishka17
28.05.2019
11:58:27
уже где-то процентов 10 сделало

Алексей
28.05.2019
11:58:34
в монгу будет дольше запихиваться, чем тупо поиск построчно

Таисия
28.05.2019
11:58:59

Tishka17
28.05.2019
11:59:00
ну вотбще, это уже выгрузка из другой БД

{.__.__.}
28.05.2019
11:59:02
И обязательно ли иметь опыт от 4х лет разработки?

Tishka17
28.05.2019
11:59:09
мне просто лень разбираться как к ней напрямую коннектиться

Таисия
28.05.2019
11:59:24

Pavel
28.05.2019
12:00:07
может, только конфиги для своих сервисов писать нужно

{.__.__.}
28.05.2019
12:00:23
У меня около года, так, что...
Ну не в этот раз значит

Таисия
28.05.2019
12:01:54
Ребята! Спасибо Вам большущие! За вашу помощь мне, я честное слово очень признательна Вам, сейчас все уточню у руководителя:)

Alan
28.05.2019
12:28:23

Tishka17
28.05.2019
12:32:22
Про рам диск мысль

Denys
28.05.2019
12:37:14
есть словарь, в нем дата ключ, и int значение, я его отрисовал
series = Series(stats)
series.plot()
plt.savefig('stats')
Еще хотелось бы на графике возрастание суммы посмотреть, т.е сумму значений к определенному моменту

Google

Denys
28.05.2019
12:37:28
как это лучше и проще сделать?
как pandas.Series запихнуть в matpotlib.pyplot subplot, т.к судя из кода выше он его магией атачит

oche somali yoba
28.05.2019
13:48:36
Снова здравствуйте. Скажите, как с помощью селениума выбрать тэги нескольких типов? Допустим, мне нужны <p>, <h1> <h2> <li>, чтобы вырвать из них текст и собрать единую статью. Я могу сделать
paragraphs = txt_block.find_elements(By.TAG_NAME, "p") или аналогично для каждого тэга, но мне хочется набрать элементы с несколькими типами тэгов в таком порядке, в каком они представлены на странице.

Aidar
28.05.2019
13:59:57


oche somali yoba
28.05.2019
14:25:55
Можно сделать через xpath, по поводу написания конкретного запроса обращайтесь в гугл
Спасибо, уже получилось. Тогда другой вопрос: есть индексы от 1 до 9000 и четыре категории ["a", "b", "c", "d"]. Каждый индекс соответствует одной статье, которая может располагаться в той или одной категории, напр. "/a/1", "/a/2","/b/3","/c/4", "/a/5" — т.е. свозная нумерация. Нужно применить функцию на каждой верной комбинации индекса и катероии, т.е. проитерироваться по двум спискам. Как можно это сделать с экономией затрат времени?


Aidar
28.05.2019
14:31:10
Спасибо, уже получилось. Тогда другой вопрос: есть индексы от 1 до 9000 и четыре категории ["a", "b", "c", "d"]. Каждый индекс соответствует одной статье, которая может располагаться в той или одной категории, напр. "/a/1", "/a/2","/b/3","/c/4", "/a/5" — т.е. свозная нумерация. Нужно применить функцию на каждой верной комбинации индекса и катероии, т.е. проитерироваться по двум спискам. Как можно это сделать с экономией затрат времени?
Так вы же выбрали все нужные элементы, и можете просто проитерироваться по ним, не вижу проблем проверять это в питоне если известны правила, а дальше уже вызывайте обработчик, я бы написал функцию, которая классифицирует пару значений и по номеру класа скажем из словаря доставать обработчик


oche somali yoba
28.05.2019
14:41:03
Так вы же выбрали все нужные элементы, и можете просто проитерироваться по ним, не вижу проблем проверять это в питоне если известны правила, а дальше уже вызывайте обработчик, я бы написал функцию, которая классифицирует пару значений и по номеру класа скажем из словаря доставать обработчик
Проблема в том, что мне неизвестно, в какой категории будет статья с некоторым индексом, а обращение к некорректной паре - это 10-20 секунд поиска. 9000 я написал для примера, на самом-то деле индексов там за 50000, а категорий 15. Если каждая неверная комбинация будет съедать 15-20 секунд, то по времени работа выходит затратная.

Maksim
28.05.2019
14:42:00
как реализовать автоматический ввод дефолтного значения в input через 30сек(без нажатия enter)(прога запускается, ждет 30 сек настройку, если нет- работает с дефолтной)

Aidar
28.05.2019
14:44:19


oche somali yoba
28.05.2019
14:49:12
Нет, каждая комбинация - элемент адреса страницы. Если комбинация верная, то страница с адресом, включающим данную комбинацию, загружается и у меня запускается функция обработки ее содержимого. Если комбинация неверная, то загружается страница с 404, обработчик ничего не возвращает, программа переходит ко следующей комбинации. 10-20 секунд тратятся на доступ к любой странице, независимо от того, 404 там или требуемая информация. Если требуемая информация, то обработчик еще 10 секунд делает свое дело.

Dmitri
28.05.2019
14:55:50
Может кто-то сказать, как называется тема, когда при делении должно получиться целое число, а получается 3.000000000000001, или что-то вроде того (как-то натыклся на статью, но забыл что оно такое)
В общем хоть что-то, что можно на эту тему почитать, пожалуйста

Алексей
28.05.2019
14:57:17

Андрей
28.05.2019
14:58:00
https://docs.oracle.com/cd/E19957-01/806-3568/ncg_goldberg.html

Jentry
28.05.2019
14:58:02

Admin
ERROR: S client not available

Глеб
28.05.2019
14:58:36

Dmitri
28.05.2019
15:00:27
Спасибо!!

Artemij
28.05.2019
15:07:18
Это шо получаецо, плихтон на подсосе??

Denis
28.05.2019
15:11:20
А теперь сравни скорость написания

Google

Андрей
28.05.2019
15:11:20
ссылку можно
питон по определению не быстрый
но не в 20 раз медленее

Tishka17
28.05.2019
15:11:50

Artemij
28.05.2019
15:11:53
https://liberatum.ru/b/programming-languages-rating-by-speed

Андрей
28.05.2019
15:11:58
я скорее поверю что у кого-то руки из жопы

Евгений
28.05.2019
15:12:07
Достаточно комментарии почитать

Artemij
28.05.2019
15:12:15

Евгений
28.05.2019
15:12:34

Artemij
28.05.2019
15:12:57

Евгений
28.05.2019
15:13:05

Maksim
28.05.2019
15:13:07

Евгений
28.05.2019
15:13:12
Хочешь я тебе такую же сделаю? ?

Artemij
28.05.2019
15:13:38
Вау
Главное таблица, поверить можно и на слово?

Евгений
28.05.2019
15:14:17

Tishka17
28.05.2019
15:15:00
Может readline умеет

Mikk
28.05.2019
15:15:24

Artemij
28.05.2019
15:15:38