
Aragaer
10.09.2018
14:13:47
но вообще, index и find тоже покатят
с твоим примером есть одна беда
"11111" in "AAAAAA=111111111112;" вернет истину
это то, почему мы -w использовали в грепе

Google

Iliya
10.09.2018
14:15:43

Aragaer
10.09.2018
14:16:04
если так, тогда конечно проще

Iliya
10.09.2018
14:16:07
все равно не понимаю, уже не варит голова, что я делаю не так
for i in file_1.readlines():
for j in file_2.readlines():
if j in i:
continue
else:
file_3.write(i)

Aragaer
10.09.2018
14:16:29
убери readlines

Iliya
10.09.2018
14:16:33

Aragaer
10.09.2018
14:16:35
for i in file_1
и добавь j.strip() in i
потому что там символ ньюлайна остается

Iliya
10.09.2018
14:18:44
да нифига, пишет три раза из file2 и все - аж бесит ....
По ходу понял, перепутал местами.....ну почти

Alex
10.09.2018
14:21:09

Василий
10.09.2018
14:25:14

Iliya
10.09.2018
14:25:18
вот так вроде отработало
for i in file_2:
for j in file_1:
if i.strip() in j.strip():
continue
else:
file_3.write(j)

Google

Iliya
10.09.2018
14:29:53

Василий
10.09.2018
14:30:02
да все просто

Oksana
10.09.2018
14:30:05
#работа
Киев, фулл-тайм
Python Engineer в RnD Department
Стек: опыт с Python, опыт с библиотеками для NLP / Machine learning
Задачи в направлении Nature Language Processing
зп от 800 долларов и выше (обсуждается)
Детали в лс. Готова обсудить рекомендации :)

Василий
10.09.2018
14:31:19
with open(путь) as file1:
set_1 = set(file1.readlines())
with open(путь) as file2:
set_2 = set(file2.readlines())
set_2 - set_1
это будет разница уникальных строк в двух разных файлах
и не беспокойся о памяти. у тебя файлы такие маленькие что это займет от силы пол гига памяти

Alex
10.09.2018
14:32:23
А чего бы не обычный diff для разницы уникальных строк?

Iliya
10.09.2018
14:33:09

Василий
10.09.2018
14:34:07
и еще их лучше отсортировать перед вычитанием

Iliya
10.09.2018
14:34:38

Василий
10.09.2018
14:34:45
быстрее будет

Iliya
10.09.2018
14:36:04
быстрее будет
да уже без разницы, а ты в сеты хочешь положить весь файл?

Василий
10.09.2018
14:36:12
https://docs.python.org/3.7/library/difflib.html#difflib.context_diff

Alex
10.09.2018
14:36:33
У-и-и-и! ? Меня услышали!!!
Да как бы можно и утилиту, и сразу вывод в файл делать.
Даже можно патч сделать дифом

Iliya
10.09.2018
14:38:16

Vasiliy
10.09.2018
14:51:34
Всем привет, возможно глупый вопрос, но каким образом лучше убрать из памяти значение переменной? del a или a = None? Происходит обработка фотографии (фотография хранится в переменной a), затем после обработки программа продолжает работу, но изображение держать в памяти уже не надо

Google

Tigran
10.09.2018
14:52:11
пиши код так, чтобы в этом не было необходимости вообще

Василий
10.09.2018
14:52:58
del a помечает переменную к удалению для сборщика мусора. a = None создает новую переменную а значение старой помечает к удаленю для сборщика мусора

Tigran
10.09.2018
14:53:25
Подробный ответ. Ни del a, ни a = None не удаляют объект, а лишь снижают счётчик ссылок. Если на объект больше не останется ссылок - он удалится (скоро, но не сразу). Но если переменная а объявлена внутри фукнции, например, то всё то же самое произойдёт автоматически при выходе из неё.

Vasiliy
10.09.2018
14:53:34
а сразу удалить никак без ожидания пока сборщик мусора это сделает?

[̲̅i̲̅t̲̅j̲̅u̲̅n̲̅k̲̅y̲̅] ࢧ кибер-даос
10.09.2018
14:53:38

Tigran
10.09.2018
14:53:53

Vasiliy
10.09.2018
14:54:01
ок, спасибо

alex
10.09.2018
15:38:48
всем времени.
вопрос имею,
при парсинге файла
entities = md.parse('C:\\temp\\jira\\entities.xml')
получаю ошибку
Traceback (most recent call last):
File "C:/Python/Projects/test.py", line 9, in <module>
entities = md.parse('C:\\temp\\jira\\entities.xml')
File "C:\Python\Python37-32\lib\xml\dom\minidom.py", line 1958, in parse
return expatbuilder.parse(file)
File "C:\Python\Python37-32\lib\xml\dom\expatbuilder.py", line 911, in parse
result = builder.parseFile(fp)
File "C:\Python\Python37-32\lib\xml\dom\expatbuilder.py", line 207, in parseFile
parser.Parse(buffer, 0)
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 499343, column 10
кто сталкивался и как решал ??
использую minidom
размер файла больше 4 гиг
xml правильный utf-8

Tigran
10.09.2018
15:42:23
оперативки хватает?

Tigran
10.09.2018
15:42:33
и как ты проверяешь, что XML корректный?

alex
10.09.2018
15:43:15
может использоватььтогда другой парсер или по блочно ?

Tigran
10.09.2018
15:44:08
итеративный можно

alex
10.09.2018
15:44:21
это как ?

Tigran
10.09.2018
15:44:22
гугли python xml streaming parser

alex
10.09.2018
15:44:30
ок. спс

Google

Tigran
10.09.2018
15:44:41
он выдаёт тебе элементы по мере чтения файла, ты вычисляешь, что тебе нужно

alex
10.09.2018
15:45:38
а он может заменить значения на лету ?

Admin
ERROR: S client not available

alex
10.09.2018
15:46:18
так как у меня есть еще один файл и его так же налдо распарсить , но там файл порядка 6 гиг

Eldar
10.09.2018
15:47:00
Читай правила и иди в питон бегинерс

Костя
10.09.2018
16:16:54

X_Selent
10.09.2018
16:24:29
Приветствую... Помогите разобраться, не верно отрабатывает условие, при любом раскладе выводит (Не верный логин или пароль) уже несколько дней бьюсь над этим участком кода...
r1 = s.post(url, data=payload, allow_redirects=True)
soup = bs4.BeautifulSoup(r.text, 'html.parser')
soup1 = soup.findAll('p')[1].string
print(soup1)
if soup1 in 'Исправьте следующие ошибки:':
print('Не верный логин или пароль')
else:
print('Пароль правильный')
r2 = s.get('https://jugl.net/api-user/status')
texte = r2.text[6:]
deco = json.loads(texte)
my_name = deco['first_name']
print('Добро пожаловать', my_name)
input('Нажмите Enter')

Romka
10.09.2018
16:28:14
Всем привет
Как сгенерировать вложенный словарь с массива.
Есть массив ['relation', 'model', 'name', 'nl']
И есть значение 'Lorem title'
Как создать словарь вида
{
'relation': {
'model': {
'nl': 'Lorem title'
}
}
}
???

Vasiliy
10.09.2018
16:31:58
Юзай цикл, и вкладывай

Romka
10.09.2018
16:33:05
стоп
как?

Dmitry
10.09.2018
16:34:04
Reduce тебе в помощь

Василий
10.09.2018
16:42:43

X_Selent
10.09.2018
16:45:35

Vladislav
10.09.2018
16:47:15
Друзья, а никто не знает, есть ли уже какие-то готовые боты для Instagram, чтобы можно было вытащить список своих подписчиков ?

Василий
10.09.2018
16:47:18
Тогда ошибка может быть в том что in не правильно проверяет вхождение в подстроку?
попробуй явный метод вхождения в подстроку

X_Selent
10.09.2018
16:47:59

wicker
10.09.2018
16:48:41
А почему soup in string, а не наоборот?

Василий
10.09.2018
16:49:47

Google

Dmitry
10.09.2018
16:50:10

X_Selent
10.09.2018
16:51:00

Василий
10.09.2018
16:51:17

X_Selent
10.09.2018
16:51:38

Василий
10.09.2018
16:52:01
и тогда с тебя вывод того что в soup1

wicker
10.09.2018
16:52:31
И попробуй findall.text
А не findall.string

X_Selent
10.09.2018
16:53:57

Nikolay
10.09.2018
16:57:57
☹️