Nik
11.04.2016
22:22:15
bloom filter ?
читатю вики
Roman
11.04.2016
22:23:28
ты точно сразу будешь знать что данных нет.
Nik
11.04.2016
22:23:43
короче суть - номер телефона - код города
Google
Nik
11.04.2016
22:23:50
есть 130 милионов телефонов
и есть ограничченное количество кодов городов(не телефонных, а просто обозначения, типа MSK)
их около 200
и либо я отдаю из какого города номер
либо говорю что его нет
Roman
11.04.2016
22:25:06
пфф
Nik
11.04.2016
22:25:09
и мне надо раз в сутки проверить вс номера
Phil
11.04.2016
22:25:12
так напомни - какая разница в размерах?
Nik
11.04.2016
22:25:16
если я проверяю кждый в базе
база умирает
разница вышла в 4гб
Phil
11.04.2016
22:25:34
на 130млн записей?
Nik
11.04.2016
22:25:35
после перехода от описания номера из string в int64
Google
Nik
11.04.2016
22:25:49
общий объем - 20 до 16 после
это если хеш тралицей
Phil
11.04.2016
22:26:00
а по сравнению с mysql?
вместе с индексами
Nik
11.04.2016
22:26:17
а мускулу не важнен обхзем
Roman
11.04.2016
22:26:34
а в мапе значениями ты хранишь MSK и вот это всё?
Nik
11.04.2016
22:26:39
могу ща залезть в базу и посмотреть сколько вести табилув
пример map[74991112233]»MSK»
блин, телеграм ломает кавычки
Roman
11.04.2016
22:27:21
охбля
Nik
11.04.2016
22:27:25
бывает там EKB
МДЯ
МДЯ
VLZ
и прочие варианты
Roman
11.04.2016
22:28:12
ну заведи ты мапу между int32 и string
Nik
11.04.2016
22:28:21
в int32 не влезает
уже думал
минимум - int64
Roman
11.04.2016
22:28:28
что не влезает?
Google
Roman
11.04.2016
22:28:34
дослушай до конца.
Nik
11.04.2016
22:28:38
uunit64 обхемом не меньше
оке, слушаю
letoto
11.04.2016
22:28:43
Roman
11.04.2016
22:28:48
заведи мапу вида int32 => string
Nik
11.04.2016
22:28:58
там и мобильные
например 910
Roman
11.04.2016
22:29:02
в ней храни 0 => MSK
1 => SPB
etc
Phil
11.04.2016
22:29:17
а мля. точно :)))
Roman
11.04.2016
22:29:27
а ту мапу переделай на int64 => int32
Nik
11.04.2016
22:29:30
я думла тже вынести - но адекватно не выходит
Phil
11.04.2016
22:29:59
Roman
11.04.2016
22:30:09
а код города у тебя сколько символов?
Nik
11.04.2016
22:30:18
от 3-х до 5
5 макс
Daniel
11.04.2016
22:30:49
ма-ма
Roman
11.04.2016
22:30:50
ну, короче если ты сделаешь int32, то тебе будет за глаза
letoto
11.04.2016
22:30:58
города в int16 умещаються
Google
Roman
11.04.2016
22:31:00
Nik
11.04.2016
22:31:06
это да - но адекватно не вырезать код города
Roman
11.04.2016
22:31:09
Nik
11.04.2016
22:31:20
города я в инт никак - эни же символьные
Daniel
11.04.2016
22:31:20
что во что ты мапишь, человек?
ма-ма
Alex
11.04.2016
22:31:29
Хэшируй всё
Roman
11.04.2016
22:31:40
Alex
11.04.2016
22:31:43
Да
Слушайте, я чот пропустил
Roman
11.04.2016
22:31:54
вот после такого и правда хочется назвать go новым php.
Daniel
11.04.2016
22:32:01
CRC32 от строки с городом - и будет тебе счастие
Alex
11.04.2016
22:32:01
Что во что мыпить-то надо?
Roman
11.04.2016
22:32:17
Daniel
11.04.2016
22:32:20
если уже просто справочник сделать не судьба
Alex
11.04.2016
22:32:29
Ну - какой-то хэщ
Daniel
11.04.2016
22:32:35
letoto
11.04.2016
22:32:36
Alex
11.04.2016
22:32:39
Или просто таблицу соответствия
Nik
11.04.2016
22:32:46
если уже просто справочник сделать не судьба
Google
Roman
11.04.2016
22:32:46
Nik
11.04.2016
22:32:49
кстати это мысль
не подумал
Daniel
11.04.2016
22:32:59
ну слава богу...
Roman
11.04.2016
22:32:59
более того, я и на коллизию md5 натыкался не раз.
и даже на sha1 было )
Alex
11.04.2016
22:33:04
Постойте
А че бы их не пронумеровать
Nik
11.04.2016
22:33:07
а сколько потреяю на проходе до справочника
Daniel
11.04.2016
22:33:14
нисколько
Alex
11.04.2016
22:33:18
Нисколько
Roman
11.04.2016
22:33:24
Alex
11.04.2016
22:33:25
Короч не думай пока про перформанс
Nik
11.04.2016
22:33:39
вот перфоманс блин и нужен
Daniel
11.04.2016
22:33:41
и вообще не думай про него, не надо
Roman
11.04.2016
22:33:43
пронумеровать все коды и хранить это в мапе.
Phil
11.04.2016
22:33:46
Nik
11.04.2016
22:33:50
без него - я бы тупо в 10 рутин сидел и селектил из базы
Alex
11.04.2016
22:33:54
Если нужен перформанс - покажи нам флеймграф уже
Посмотрим
Где втыкает
Roman
11.04.2016
22:34:02