@habrachat

Страница 3986 из 6731
Mr
17.07.2017
18:28:49
Вопрос

А есть смысл уехать учится в Беларусь?

fgfgj
17.07.2017
18:30:09
А есть смысл уехать учится в Беларусь?
Врядли, шило на мыло, если ты не из нигерии только

Mr
17.07.2017
18:30:39
Да, я не из нигерии

Google
fgfgj
17.07.2017
18:31:16
Нахуй тебе это надо, рвани в европку

На учобку

По бесплатным программкам для приезжих

Или всех

Luka Megurine
17.07.2017
18:45:05
Правительство России включило в ПДД понятия «электромобиль» и «гибридный автомобиль» (vc.ru)

Зануда
17.07.2017
19:12:26
Админушки, почистьте флуд и оффтоп

Luka Megurine
17.07.2017
19:22:25
Разбор медиаскандала с Natura Siberica, связанного с использованием экстракта оленьих рогов (vc.ru)

Славик
17.07.2017
19:35:23
почитай про типы данных - основа основ

для разных нужд свой тип данных

fgfgj
17.07.2017
19:36:24
Luka Megurine
17.07.2017
19:57:26
Сайт First Users рассказывает, как известные сервисы привлекли первых пользователей (vc.ru)

Google
Luka Megurine
17.07.2017
20:35:16
«АвтоВАЗ» сократит более восьми тысяч сотрудников к 2019 году (vc.ru)

Интервью с Ричардом Докинзом. О нелюбимом меме, мучениках атеизма, правильной теологии и разговоре с богом (geektimes.ru) Обзор Moto Z2 Play: долгожданное обновление (geektimes.ru)

Причины раскола внутри Bitcoin и падения курса цифровой валюты — мнение специалиста DataArt (vc.ru) Тестирование динамической монетизации Adfox Sites — опыт ТАСС, «МаксимаТелеком» и Drive2 (vc.ru)

«Яндекс.Маркет» адаптирует бизнес-модель Amazon с собственными складами и доставкой (vc.ru)

ФАС потребовала от операторов «большой четвёрки» отменить плату за роуминг в России (vc.ru)

IsaacPearse
17.07.2017
23:31:33
всем доброго времени суток! В общем есть файл с тысячями строк значений, а так-же файл с еще большим количеством значений вклюючая одинаковые значания, которые присутствуют в первом файле. собственно как сделать так, чтобы удалить одинаковые значения из первого файла во втором?

Sergey
17.07.2017
23:40:03
хотя бы на примере списков длиной 5 vs 10

собственно, не понятна фраза "вклюючая одинаковые значания, которые присутствуют в первом файле." где присутствуют сами дублирующиеся значения? во втором или в первом?

и не понятно, что из чего нужно удалять

"удалить одинаковые значения из первого файла во втором"

т.е. во втором нет дублирующихся значений?

пока я понял это так: "нужно удалить из второго списка те значения, которые в первом списке встречаются более одного раза"

IsaacPearse
17.07.2017
23:46:20
1000158610 1000173235 10001760 1000182857 1000184575 1000185318 1000195746 1000220932 10002315 1000236196 1000241552 1000254085 10002542 1000264146 1000273002 1000276235 10002943 10003003 1000302226 1000304054 1000307472 1000310885 1000318271 1000324322

вот так выглядит все

Sergey
17.07.2017
23:48:00
тебе нужна эффективная по сложности/ресурсам реализация? или пофигу?

IsaacPearse
17.07.2017
23:48:01
это айдишки пользователей одной соц сети

какая например?

Google
Sergey
17.07.2017
23:49:33
ну, самое банальное: 1. считаешь количество вхождений каждого id для первого списка 2. те, которые встречаются больше одного раза, удаляешь из второго

IsaacPearse
17.07.2017
23:50:19
их миллионы...

Sergey
17.07.2017
23:51:29
списки сортированы?

(хоть и так по-дурацки, как в примере... как будто по string)

IsaacPearse
17.07.2017
23:52:49
Sergey
17.07.2017
23:57:05
вообще странная с практической точки зрения задача

Admin
ERROR: S client not available

IsaacPearse
18.07.2017
00:02:03
Именно! Хотя выглядит тривиально просто. Удалить одинаковую строку из одного файла, в другом файле.

Sergey
18.07.2017
00:02:14
нет, нифига не выглядит просто

IsaacPearse
18.07.2017
00:04:29
Не давно мне посоветовали софт WinMerge, который сравнивает похожие значения в нескольких файлах. Но чёт я так и не сообразил, как он вообще работает.

Sergey
18.07.2017
00:05:31
на файловой системе будет работать очень долго, как мне кажется

я бы загрузил в память

Sergey
18.07.2017
00:06:02
и сортанул первый список чем-нибудь вроде параллельного merge sort

потом будет просто найти повторяющиеся

IsaacPearse
18.07.2017
00:07:08
Спасибо конечно, но это слишком сложно для меня)

Sergey
18.07.2017
00:07:25
в итоге можно будет получить список тех чисел, которые нужно будет удалить из второго списка

затем второй список частями читать из файла в память, удалять всё, что встречается в чёрном списке

и эти отфильтрованные части записывать в другой файл

Luka Megurine
18.07.2017
00:09:07
Paradigm — Дизайн-система Mail.Ru Group, часть 1: Визуальный язык (habrahabr.ru)

Sergey
18.07.2017
00:13:09
Спасибо конечно, но это слишком сложно для меня)
будет выглядеть как let list1 = load_everything_from_file(first_file); list1.parallel_merge_sort(); let blacklist = find_dups_in(list1); дальше чуть по-интереснее цикл до конца файла с телом let list2_part = load_from_n_to_m(file2, 0, 10000); // loads first 10000 records list2_part.remove_if(|x| x.contains_in(blacklist)); write_to_file(output_file, list2_part)

Google
Sergey
18.07.2017
00:13:33
вроде читаемо

find_dups будет просто искать одинаковые последовательно идущие числа

list.remove_if это любое удобное удаление элемента из коллекции, если он есть в blacklist да, сложность O(n^2), но тут уж..

можно даже обычным циклом

Luka Megurine
18.07.2017
00:21:26
История озвучки «Антивируса Касперского», MC Хованский и Apple в Шанхае (vc.ru) Какие профессии исчезнут из-за автоматизации — исследование Bloomberg (vc.ru)

Ученые напечатали мягкое сердце, которое работает как настоящее (geektimes.ru)

SoundCloud под угрозой закрытия, добровольцы собираются создать архивную копию всех файлов сервиса (geektimes.ru)

Supa — сервис по созданию роликов для социальных сетей (vc.ru)

Страница 3986 из 6731