@ru_python

Страница 6476 из 9768
Aragaer
10.09.2018
14:13:47
но вообще, index и find тоже покатят

с твоим примером есть одна беда

"11111" in "AAAAAA=111111111112;" вернет истину

это то, почему мы -w использовали в грепе

Google
Iliya
10.09.2018
14:15:43
"11111" in "AAAAAA=111111111112;" вернет истину
да, только у меня не может быть пять едениц только 12значное число

Aragaer
10.09.2018
14:16:04
если так, тогда конечно проще

Iliya
10.09.2018
14:16:07
все равно не понимаю, уже не варит голова, что я делаю не так for i in file_1.readlines(): for j in file_2.readlines(): if j in i: continue else: file_3.write(i)

Aragaer
10.09.2018
14:16:29
убери readlines

Iliya
10.09.2018
14:16:33
если так, тогда конечно проще
да задача примитивная, 9 класс школы

Aragaer
10.09.2018
14:16:35
for i in file_1

и добавь j.strip() in i

потому что там символ ньюлайна остается

Iliya
10.09.2018
14:18:44
да нифига, пишет три раза из file2 и все - аж бесит .... По ходу понял, перепутал местами.....ну почти

Василий
10.09.2018
14:25:14
Iliya
10.09.2018
14:25:18
Успокойся. Ты не виноват. Проблема в Python ?
да именно, просто бомбит знатно когда детская задачка не получается, я i и j местами перепутал ))

вот так вроде отработало for i in file_2: for j in file_1: if i.strip() in j.strip(): continue else: file_3.write(j)

Google
Iliya
10.09.2018
14:29:53
Ты же в курсе что у тебя так из файл1 прочитается одна строка?
уже да, удалило только первое совпадение и все, блин, и что тут не так

Василий
10.09.2018
14:30:02
да все просто

Oksana
10.09.2018
14:30:05
#работа Киев, фулл-тайм Python Engineer в RnD Department Стек: опыт с Python, опыт с библиотеками для NLP / Machine learning Задачи в направлении Nature Language Processing зп от 800 долларов и выше (обсуждается) Детали в лс. Готова обсудить рекомендации :)

Василий
10.09.2018
14:31:19
with open(путь) as file1: set_1 = set(file1.readlines()) with open(путь) as file2: set_2 = set(file2.readlines()) set_2 - set_1

это будет разница уникальных строк в двух разных файлах

и не беспокойся о памяти. у тебя файлы такие маленькие что это займет от силы пол гига памяти

Alex
10.09.2018
14:32:23
А чего бы не обычный diff для разницы уникальных строк?

Василий
10.09.2018
14:34:07
а куда она запишется
ну я же примерно накидал. запиши в цикле в третий файл

и еще их лучше отсортировать перед вычитанием

Василий
10.09.2018
14:34:45
быстрее будет

Iliya
10.09.2018
14:36:04
быстрее будет
да уже без разницы, а ты в сеты хочешь положить весь файл?

Василий
10.09.2018
14:36:12
А чего бы не обычный diff для разницы уникальных строк?
Кстати вот правильно подсказывает. есть же стандартный диф

https://docs.python.org/3.7/library/difflib.html#difflib.context_diff

Alex
10.09.2018
14:36:33
У-и-и-и! ? Меня услышали!!!

Да как бы можно и утилиту, и сразу вывод в файл делать.

Даже можно патч сделать дифом

Iliya
10.09.2018
14:38:16
У-и-и-и! ? Меня услышали!!!
круто спосибо за подсказку, почитаю завтра, надо бежать

Vasiliy
10.09.2018
14:51:34
Всем привет, возможно глупый вопрос, но каким образом лучше убрать из памяти значение переменной? del a или a = None? Происходит обработка фотографии (фотография хранится в переменной a), затем после обработки программа продолжает работу, но изображение держать в памяти уже не надо

Google
Tigran
10.09.2018
14:52:11
пиши код так, чтобы в этом не было необходимости вообще

Василий
10.09.2018
14:52:58
del a помечает переменную к удалению для сборщика мусора. a = None создает новую переменную а значение старой помечает к удаленю для сборщика мусора

Tigran
10.09.2018
14:53:25
Подробный ответ. Ни del a, ни a = None не удаляют объект, а лишь снижают счётчик ссылок. Если на объект больше не останется ссылок - он удалится (скоро, но не сразу). Но если переменная а объявлена внутри фукнции, например, то всё то же самое произойдёт автоматически при выходе из неё.

Vasiliy
10.09.2018
14:53:34
а сразу удалить никак без ожидания пока сборщик мусора это сделает?

Tigran
10.09.2018
14:53:53
а сразу удалить никак без ожидания пока сборщик мусора это сделает?
Ну можно явно вызвать сборщик мусора, гугли python gc collect

Vasiliy
10.09.2018
14:54:01
ок, спасибо

alex
10.09.2018
15:38:48
всем времени.

вопрос имею, при парсинге файла entities = md.parse('C:\\temp\\jira\\entities.xml') получаю ошибку Traceback (most recent call last): File "C:/Python/Projects/test.py", line 9, in <module> entities = md.parse('C:\\temp\\jira\\entities.xml') File "C:\Python\Python37-32\lib\xml\dom\minidom.py", line 1958, in parse return expatbuilder.parse(file) File "C:\Python\Python37-32\lib\xml\dom\expatbuilder.py", line 911, in parse result = builder.parseFile(fp) File "C:\Python\Python37-32\lib\xml\dom\expatbuilder.py", line 207, in parseFile parser.Parse(buffer, 0) xml.parsers.expat.ExpatError: not well-formed (invalid token): line 499343, column 10 кто сталкивался и как решал ?? использую minidom

размер файла больше 4 гиг

xml правильный utf-8

Tigran
10.09.2018
15:42:23
оперативки хватает?

Tigran
10.09.2018
15:42:33
и как ты проверяешь, что XML корректный?

alex
10.09.2018
15:43:15
оперативки хватает?
вот тут может быть и проблема. всего 8 гиг, но свободно только 2 гига

может использоватььтогда другой парсер или по блочно ?

Tigran
10.09.2018
15:44:08
итеративный можно

alex
10.09.2018
15:44:21
это как ?

Tigran
10.09.2018
15:44:22
гугли python xml streaming parser

alex
10.09.2018
15:44:30
ок. спс

Google
Tigran
10.09.2018
15:44:41
он выдаёт тебе элементы по мере чтения файла, ты вычисляешь, что тебе нужно

alex
10.09.2018
15:45:38
а он может заменить значения на лету ?

Admin
ERROR: S client not available

alex
10.09.2018
15:46:18
так как у меня есть еще один файл и его так же налдо распарсить , но там файл порядка 6 гиг

Eldar
10.09.2018
15:47:00
Читай правила и иди в питон бегинерс

Костя
10.09.2018
16:16:54
X_Selent
10.09.2018
16:24:29
Приветствую... Помогите разобраться, не верно отрабатывает условие, при любом раскладе выводит (Не верный логин или пароль) уже несколько дней бьюсь над этим участком кода... r1 = s.post(url, data=payload, allow_redirects=True) soup = bs4.BeautifulSoup(r.text, 'html.parser') soup1 = soup.findAll('p')[1].string print(soup1) if soup1 in 'Исправьте следующие ошибки:': print('Не верный логин или пароль') else: print('Пароль правильный') r2 = s.get('https://jugl.net/api-user/status') texte = r2.text[6:] deco = json.loads(texte) my_name = deco['first_name'] print('Добро пожаловать', my_name) input('Нажмите Enter')

Romka
10.09.2018
16:28:14
Всем привет Как сгенерировать вложенный словарь с массива. Есть массив ['relation', 'model', 'name', 'nl'] И есть значение 'Lorem title' Как создать словарь вида { 'relation': { 'model': { 'nl': 'Lorem title' } } } ???

Vasiliy
10.09.2018
16:31:58
Юзай цикл, и вкладывай

Romka
10.09.2018
16:33:05
стоп

как?

Dmitry
10.09.2018
16:34:04
Reduce тебе в помощь

Vladislav
10.09.2018
16:47:15
Друзья, а никто не знает, есть ли уже какие-то готовые боты для Instagram, чтобы можно было вытащить список своих подписчиков ?

Василий
10.09.2018
16:47:18
Тогда ошибка может быть в том что in не правильно проверяет вхождение в подстроку?

попробуй явный метод вхождения в подстроку

X_Selent
10.09.2018
16:47:59
Тогда ошибка может быть в том что in не правильно проверяет вхождение в подстроку?
Вот скорей всего в этом ошибка, но как тогда исправить?

wicker
10.09.2018
16:48:41
А почему soup in string, а не наоборот?

Василий
10.09.2018
16:49:47
А почему soup in string, а не наоборот?
Вот кстати да. сам только заметил.

Google
Dmitry
10.09.2018
16:50:10
А почему soup in string, а не наоборот?
Аватарка идеально подходит к комменту

X_Selent
10.09.2018
16:51:00
Василий
10.09.2018
16:51:17
Можно поподробней?
if 'Исправьте следующие ошибки:' in soup1:

X_Selent
10.09.2018
16:51:38
Василий
10.09.2018
16:52:01
Так я тоже пробовал
https://docs.python.org/3.7/library/stdtypes.html#str.find

и тогда с тебя вывод того что в soup1

wicker
10.09.2018
16:52:31
И попробуй findall.text

А не findall.string

X_Selent
10.09.2018
16:53:57
И попробуй findall.text
попробовал результат такой-же

https://docs.python.org/3.7/library/stdtypes.html#str.find
Спасибо, позже изучу, щас надо бежать

Nikolay
10.09.2018
16:57:57
☹️

Страница 6476 из 9768