@habrachat

« Назад

Страница 3986 из 6731

Далее »

Mr

17.07.2017
18:28:49

Вопрос

А есть смысл уехать учится в Беларусь?

fgfgj

17.07.2017
18:30:09

А есть смысл уехать учится в Беларусь?

Врядли, шило на мыло, если ты не из нигерии только

Mr

17.07.2017
18:30:39

Да, я не из нигерии

Google

fgfgj

17.07.2017
18:31:16

Нахуй тебе это надо, рвани в европку

На учобку

По бесплатным программкам для приезжих

Или всех

Иисус

17.07.2017
18:38:20

А есть смысл уехать учится в Беларусь?

нет

Luka Megurine

17.07.2017
18:45:05

Правительство России включило в ПДД понятия «электромобиль» и «гибридный автомобиль» (vc.ru)

Зануда

17.07.2017
19:12:26

Админушки, почистьте флуд и оффтоп

Luka Megurine

17.07.2017
19:22:25

Разбор медиаскандала с Natura Siberica, связанного с использованием экстракта оленьих рогов (vc.ru)

Славик

17.07.2017
19:35:23

Что лучше иметь целое число или вещественное?

лучше иметь бабу

почитай про типы данных - основа основ

для разных нужд свой тип данных

fgfgj

17.07.2017
19:36:24

лучше иметь бабу

Ты мудр

Luka Megurine

17.07.2017
19:57:26

Сайт First Users рассказывает, как известные сервисы привлекли первых пользователей (vc.ru)

Google

Luka Megurine

17.07.2017
20:35:16

«АвтоВАЗ» сократит более восьми тысяч сотрудников к 2019 году (vc.ru)

Интервью с Ричардом Докинзом. О нелюбимом меме, мучениках атеизма, правильной теологии и разговоре с богом (geektimes.ru) Обзор Moto Z2 Play: долгожданное обновление (geektimes.ru)

Причины раскола внутри Bitcoin и падения курса цифровой валюты — мнение специалиста DataArt (vc.ru) Тестирование динамической монетизации Adfox Sites — опыт ТАСС, «МаксимаТелеком» и Drive2 (vc.ru)

«Яндекс.Маркет» адаптирует бизнес-модель Amazon с собственными складами и доставкой (vc.ru)

ФАС потребовала от операторов «большой четвёрки» отменить плату за роуминг в России (vc.ru)

IsaacPearse

17.07.2017
23:31:33

всем доброго времени суток! В общем есть файл с тысячями строк значений, а так-же файл с еще большим количеством значений вклюючая одинаковые значания, которые присутствуют в первом файле. собственно как сделать так, чтобы удалить одинаковые значения из первого файла во втором?

Sergey

17.07.2017
23:40:03

всем доброго времени суток! В общем есть файл с тысячями строк значений, а так-же файл с еще большим количеством значений вклюючая одинаковые значания, которые присутствуют в первом файле. собственно как сделать так, чтобы удалить одинаковые значения из первого файла во втором?

а можешь дать пример двух списков? иначе сложно понять, что именно в чём может дублироваться

хотя бы на примере списков длиной 5 vs 10

собственно, не понятна фраза "вклюючая одинаковые значания, которые присутствуют в первом файле." где присутствуют сами дублирующиеся значения? во втором или в первом?

и не понятно, что из чего нужно удалять

"удалить одинаковые значения из первого файла во втором"

собственно, не понятна фраза "вклюючая одинаковые значания, которые присутствуют в первом файле." где присутствуют сами дублирующиеся значения? во втором или в первом?

если в первом, то не понятно, для чего это уточнение

т.е. во втором нет дублирующихся значений?

пока я понял это так: "нужно удалить из второго списка те значения, которые в первом списке встречаются более одного раза"

IsaacPearse

17.07.2017
23:46:20

пока я понял это так: "нужно удалить из второго списка те значения, которые в первом списке встречаются более одного раза"

именно

1000158610 1000173235 10001760 1000182857 1000184575 1000185318 1000195746 1000220932 10002315 1000236196 1000241552 1000254085 10002542 1000264146 1000273002 1000276235 10002943 10003003 1000302226 1000304054 1000307472 1000310885 1000318271 1000324322

вот так выглядит все

Sergey

17.07.2017
23:48:00

тебе нужна эффективная по сложности/ресурсам реализация? или пофигу?

IsaacPearse

17.07.2017
23:48:01

это айдишки пользователей одной соц сети

какая например?

Google

Sergey

17.07.2017
23:49:33

ну, самое банальное: 1. считаешь количество вхождений каждого id для первого списка 2. те, которые встречаются больше одного раза, удаляешь из второго

IsaacPearse

17.07.2017
23:50:19

их миллионы...

Sergey

17.07.2017
23:51:29

списки сортированы?

(хоть и так по-дурацки, как в примере... как будто по string)

IsaacPearse

17.07.2017
23:52:49

списки сортированы?

нет

Sergey

17.07.2017
23:57:05

вообще странная с практической точки зрения задача

Admin

ERROR: S client not available

IsaacPearse

18.07.2017
00:02:03

Именно! Хотя выглядит тривиально просто. Удалить одинаковую строку из одного файла, в другом файле.

Sergey

18.07.2017
00:02:14

нет, нифига не выглядит просто

IsaacPearse

18.07.2017
00:04:29

Не давно мне посоветовали софт WinMerge, который сравнивает похожие значения в нескольких файлах. Но чёт я так и не сообразил, как он вообще работает.

Sergey

18.07.2017
00:05:31

на файловой системе будет работать очень долго, как мне кажется

я бы загрузил в память

Sergey

18.07.2017
00:06:02

и сортанул первый список чем-нибудь вроде параллельного merge sort

потом будет просто найти повторяющиеся

IsaacPearse

18.07.2017
00:07:08

Спасибо конечно, но это слишком сложно для меня)

Sergey

18.07.2017
00:07:25

в итоге можно будет получить список тех чисел, которые нужно будет удалить из второго списка

затем второй список частями читать из файла в память, удалять всё, что встречается в чёрном списке

и эти отфильтрованные части записывать в другой файл

Luka Megurine

18.07.2017
00:09:07

Paradigm — Дизайн-система Mail.Ru Group, часть 1: Визуальный язык (habrahabr.ru)

Sergey

18.07.2017
00:13:09

Спасибо конечно, но это слишком сложно для меня)

будет выглядеть как let list1 = load_everything_from_file(first_file); list1.parallel_merge_sort(); let blacklist = find_dups_in(list1); дальше чуть по-интереснее цикл до конца файла с телом let list2_part = load_from_n_to_m(file2, 0, 10000); // loads first 10000 records list2_part.remove_if(|x| x.contains_in(blacklist)); write_to_file(output_file, list2_part)

Google

Sergey

18.07.2017
00:13:33

вроде читаемо

find_dups будет просто искать одинаковые последовательно идущие числа

list.remove_if это любое удобное удаление элемента из коллекции, если он есть в blacklist да, сложность O(n^2), но тут уж..

можно даже обычным циклом

Luka Megurine

18.07.2017
00:21:26

История озвучки «Антивируса Касперского», MC Хованский и Apple в Шанхае (vc.ru) Какие профессии исчезнут из-за автоматизации — исследование Bloomberg (vc.ru)

Ученые напечатали мягкое сердце, которое работает как настоящее (geektimes.ru)

SoundCloud под угрозой закрытия, добровольцы собираются создать архивную копию всех файлов сервиса (geektimes.ru)

Supa — сервис по созданию роликов для социальных сетей (vc.ru)

« Назад

Страница 3986 из 6731

Далее »

Открыть в Telegram