
Mr
17.07.2017
18:28:49
Вопрос
А есть смысл уехать учится в Беларусь?

fgfgj
17.07.2017
18:30:09

Mr
17.07.2017
18:30:39
Да, я не из нигерии

Google

fgfgj
17.07.2017
18:31:16
Нахуй тебе это надо, рвани в европку
На учобку
По бесплатным программкам для приезжих
Или всех

Иисус
17.07.2017
18:38:20

Luka Megurine
17.07.2017
18:45:05
Правительство России включило в ПДД понятия «электромобиль» и «гибридный автомобиль» (vc.ru)

Зануда
17.07.2017
19:12:26
Админушки, почистьте флуд и оффтоп

Luka Megurine
17.07.2017
19:22:25
Разбор медиаскандала с Natura Siberica, связанного с использованием экстракта оленьих рогов (vc.ru)

Славик
17.07.2017
19:35:23
почитай про типы данных - основа основ
для разных нужд свой тип данных

fgfgj
17.07.2017
19:36:24

Luka Megurine
17.07.2017
19:57:26
Сайт First Users рассказывает, как известные сервисы привлекли первых пользователей (vc.ru)

Google

Luka Megurine
17.07.2017
20:35:16
«АвтоВАЗ» сократит более восьми тысяч сотрудников к 2019 году (vc.ru)
Интервью с Ричардом Докинзом. О нелюбимом меме, мучениках атеизма, правильной теологии и разговоре с богом (geektimes.ru)
Обзор Moto Z2 Play: долгожданное обновление (geektimes.ru)
Причины раскола внутри Bitcoin и падения курса цифровой валюты — мнение специалиста DataArt (vc.ru)
Тестирование динамической монетизации Adfox Sites — опыт ТАСС, «МаксимаТелеком» и Drive2 (vc.ru)
«Яндекс.Маркет» адаптирует бизнес-модель Amazon с собственными складами и доставкой (vc.ru)
ФАС потребовала от операторов «большой четвёрки» отменить плату за роуминг в России (vc.ru)

IsaacPearse
17.07.2017
23:31:33
всем доброго времени суток!
В общем есть файл с тысячями строк значений, а так-же файл с еще большим количеством значений вклюючая одинаковые значания, которые присутствуют в первом файле. собственно как сделать так, чтобы удалить одинаковые значения из первого файла во втором?

Sergey
17.07.2017
23:40:03
хотя бы на примере списков длиной 5 vs 10
собственно, не понятна фраза
"вклюючая одинаковые значания, которые присутствуют в первом файле."
где присутствуют сами дублирующиеся значения? во втором или в первом?
и не понятно, что из чего нужно удалять
"удалить одинаковые значения из первого файла во втором"
т.е. во втором нет дублирующихся значений?
пока я понял это так:
"нужно удалить из второго списка те значения, которые в первом списке встречаются более одного раза"


IsaacPearse
17.07.2017
23:46:20
1000158610
1000173235
10001760
1000182857
1000184575
1000185318
1000195746
1000220932
10002315
1000236196
1000241552
1000254085
10002542
1000264146
1000273002
1000276235
10002943
10003003
1000302226
1000304054
1000307472
1000310885
1000318271
1000324322
вот так выглядит все

Sergey
17.07.2017
23:48:00
тебе нужна эффективная по сложности/ресурсам реализация? или пофигу?

IsaacPearse
17.07.2017
23:48:01
это айдишки пользователей одной соц сети
какая например?

Google

Sergey
17.07.2017
23:49:33
ну, самое банальное:
1. считаешь количество вхождений каждого id для первого списка
2. те, которые встречаются больше одного раза, удаляешь из второго

IsaacPearse
17.07.2017
23:50:19
их миллионы...

Sergey
17.07.2017
23:51:29
списки сортированы?
(хоть и так по-дурацки, как в примере... как будто по string)

IsaacPearse
17.07.2017
23:52:49

Sergey
17.07.2017
23:57:05
вообще странная с практической точки зрения задача

Admin
ERROR: S client not available

IsaacPearse
18.07.2017
00:02:03
Именно! Хотя выглядит тривиально просто.
Удалить одинаковую строку из одного файла, в другом файле.

Sergey
18.07.2017
00:02:14
нет, нифига не выглядит просто

IsaacPearse
18.07.2017
00:04:29
Не давно мне посоветовали софт WinMerge, который сравнивает похожие значения в нескольких файлах. Но чёт я так и не сообразил, как он вообще работает.

Sergey
18.07.2017
00:05:31
на файловой системе будет работать очень долго, как мне кажется
я бы загрузил в память

Sergey
18.07.2017
00:06:02
и сортанул первый список чем-нибудь вроде параллельного merge sort
потом будет просто найти повторяющиеся

IsaacPearse
18.07.2017
00:07:08
Спасибо конечно, но это слишком сложно для меня)

Sergey
18.07.2017
00:07:25
в итоге можно будет получить список тех чисел, которые нужно будет удалить из второго списка
затем второй список частями читать из файла в память, удалять всё, что встречается в чёрном списке
и эти отфильтрованные части записывать в другой файл

Luka Megurine
18.07.2017
00:09:07
Paradigm — Дизайн-система Mail.Ru Group, часть 1: Визуальный язык (habrahabr.ru)

Sergey
18.07.2017
00:13:09
Спасибо конечно, но это слишком сложно для меня)
будет выглядеть как
let list1 = load_everything_from_file(first_file);
list1.parallel_merge_sort();
let blacklist = find_dups_in(list1);
дальше чуть по-интереснее
цикл до конца файла с телом
let list2_part = load_from_n_to_m(file2, 0, 10000); // loads first 10000 records
list2_part.remove_if(|x| x.contains_in(blacklist));
write_to_file(output_file, list2_part)

Google

Sergey
18.07.2017
00:13:33
вроде читаемо
find_dups будет просто искать одинаковые последовательно идущие числа
list.remove_if это любое удобное удаление элемента из коллекции, если он есть в blacklist
да, сложность O(n^2), но тут уж..
можно даже обычным циклом

Luka Megurine
18.07.2017
00:21:26
История озвучки «Антивируса Касперского», MC Хованский и Apple в Шанхае (vc.ru)
Какие профессии исчезнут из-за автоматизации — исследование Bloomberg (vc.ru)
Ученые напечатали мягкое сердце, которое работает как настоящее (geektimes.ru)
SoundCloud под угрозой закрытия, добровольцы собираются создать архивную копию всех файлов сервиса (geektimes.ru)
Supa — сервис по созданию роликов для социальных сетей (vc.ru)