@ru_python

Страница 1427 из 9768
Google
Мерлин
19.08.2016
09:55:05
А существуют ли хэши обладающие следующим свойством: чем меньше различаютсяя две хэшу-суммы, тем меньше различаются оригинальные сообщения?

tosh
19.08.2016
09:55:46
Чтобы было изи подобрать? :3

Aragaer
19.08.2016
09:57:03
обычно это не называется словом хэш 8)

tosh
19.08.2016
09:57:31
Да, самописный алгоритм "хеширования" какой-нибудь по идее

Иначе нахуй такой хеш нужен

Мерлин
19.08.2016
09:58:13
обычно это не называется словом хэш 8)
Ну, хэш - это функция приведения сообщения произвольной длины к фиксированному размеру Вот то что этот хэш не будет криптографическим - это да

Aragaer
19.08.2016
09:58:40
а, ок

просто взять ксор - уже лучше

Мерлин
19.08.2016
09:59:16
Суть в том, что нужно сравнить два сообщения на близость, не храня сами сообщения

Pavel
19.08.2016
09:59:20
sum(map(ord, message))

Aragaer
19.08.2016
09:59:37
хэш функция это отображение из пространства сообщений в пространство хэшей. Обычно его пытаются сделать сильно разрывным, но в данном случае лучше непрерывное. И такое сделать проще

Artem
19.08.2016
10:00:01
Что такое близость? Общие слова, расстояние левенштейна? Размер сообщение разный?

Мерлин
19.08.2016
10:00:07
sum(map(ord, message))
Кстати вот это один из вариантов

Google
Aragaer
19.08.2016
10:00:12
скорее левенштейна

тут беда в том, что хэш это всегда потеря информации об оригинальном сообщении

dmks
19.08.2016
10:00:40
Суть в том, что нужно сравнить два сообщения на близость, не храня сами сообщения
обычно для этого используют быстрые и медленные хеши,как в рсинке. црц 32 какой-нибудь

Aragaer
19.08.2016
10:01:17
можно взять в качестве хэша просто начало сообщения - тогда у сообщений с одинаковым началом хэш будет одинаковый, а у сообщений с мало отличающимся началом хэши будут близкие. Но это неинтересно

Мерлин
19.08.2016
10:01:27
Что такое близость? Общие слова, расстояние левенштейна? Размер сообщение разный?
Представь у тебя есть наборы чисел И ты хочешь сравнить два набора, не сравнивая их напрямую При этом это должна быть евклидова метрика

То есть блин

Евклидово-подобная Забыл как называется

Aragaer
19.08.2016
10:02:32
ну вот расстояние левенштейна

Мерлин
19.08.2016
10:03:40
ну вот расстояние левенштейна
Проблема в том, что для вычисления этого расстояния надо хранить сами сообщения

Artem
19.08.2016
10:05:24
Если сообщения небольшие или разнятся не сильно, можно придумать велосипед и накидать реперных точек по пространству сообщений. И хеш - это склеенные два числа - айди точки и расстояние от нее.

звучит достаточно безумно?

Aragaer
19.08.2016
10:06:59
чот вдруг подумал, а насколько сильно различаются коды хэмминга у двух разных сообщений?

ну да, там отличие в 1 бит в сообщении дает очень сильное изменение кода - вплоть до произвольного

там наоборот подобрано так, что все сообщения с расстоянием 1 имеют все допустимые значения хэша

Aragaer
19.08.2016
10:10:04
ну во-первых можно сначала сравнить длину

Мерлин
19.08.2016
10:11:06
ну во-первых можно сначала сравнить длину
Да Но сообщения одной длины могут очень сильно различатся

Artem
19.08.2016
10:14:32
А минхешинг никак сюда не воткнуть?

Мерлин
19.08.2016
10:22:22
А это кстати то, что нужно

Однако спасибо

Google
Мерлин
19.08.2016
10:22:57
С небольшой модификацией должно работать

Artem
19.08.2016
10:25:07
Ура!

Dan
19.08.2016
10:49:50
народ может кто подскажет ? Ситуация такая, есть скрипт, скрипт на python, который работает на нескольких серваках. на одних установлен MySql на других MariaDB. нужно из скрипта определить к какой базе подключен скрипт. как это можно сделать? взможно запросом. в идеале с использованием sqlalchemy.

Dan
19.08.2016
10:53:35
а что это даст ?

Владимир
19.08.2016
10:54:40
SHOW VARIABLES LIKE "%version%";

Dan
19.08.2016
10:54:41
по теории для mysql выдаст 5.*.* для мариа 10.*.*

Pavel
19.08.2016
10:55:06
а что это даст ?
https://mariadb.com/kb/en/mariadb/version/ SELECT VERSION(); +------------------------------+ | VERSION() | +------------------------------+ | 10.0.3-MariaDB-1~precise-log | +------------------------------+

Dan
19.08.2016
10:56:54
хорошо спасибо, попробую

Владимир
19.08.2016
10:58:31
по теории для mysql выдаст 5.*.* для мариа 10.*.*
тогда select version(); прокатит, попробовал на одной из mysql, пишет "5.5.49-0+deb8u1"

Andrii
19.08.2016
11:02:14
Коллеги , кто работал с logstash + elastic ???

ELK stack так называемый

Vladimir
19.08.2016
11:04:35
я работаю

и страдаю

эластик виснет и ведёт себя как хочет

Artem
19.08.2016
11:08:39
немного работал, то тоже не научился готовить эластик

Andrii
19.08.2016
11:09:16
я написал скрипт который шлет сктроки лога через TCP сокет

по 50 штук в секугду всего

запускаю их штук 5 - итого 250 месаг в секунду

через буквально 2-3 минуты он отпадают по сокет таймауту

Google
Andrii
19.08.2016
11:11:13
пока не останется только 2 скрипта - это около 100 сообщений/сек

ну такого ж не может быть что б он не успеевал обрабатывать больше 100 EPS ?

увеличил ES и LS heap size в init скриптах до 8 и 4 соот-но на серваке SSD и 16 гБ RAM и i7 3.5 ГГц

for i in xrange(1, self.number_of_lines + 1): line_to_send = self.generate_line() if self.debug: print line_to_send sock.send(line_to_send) time.sleep(0.02) sock.close() Есть какие-то трезвые мысли по этому поводу ?

Artem
19.08.2016
11:23:30
А что с загрузкой в пике? top что говорит

250 eps это конечно немного

Pavel
19.08.2016
11:24:13
for i in xrange(1, self.number_of_lines + 1): line_to_send = self.generate_line() if self.debug: print line_to_send sock.send(line_to_send) time.sleep(0.02) sock.close() Есть какие-то трезвые мысли по этому поводу ?
не трезвая мысль: написать скрипт, который будет висеть на порту вместо эластика, и тупо отправлять в /dev/null весь получнный трафик. Чтобы понять, это ось гадит или на уровне приложения проблемы.

Artem
19.08.2016
11:25:03
А еще что эластик о себе говорит

Admin
ERROR: S client not available

Artem
19.08.2016
11:25:22
Я забыл уже, как все называется, но у него есть какая-то диагностика

про состояние кластера и вот это все

Andrii
19.08.2016
11:26:34
8 ядер

Artem
19.08.2016
11:26:55
https://www.elastic.co/guide/en/elasticsearch/reference/2.3/cluster-health.html

H
19.08.2016
11:27:11
у меня шлет поболее через сислог, все работает более менее со схемой

Andrii
19.08.2016
11:28:23
про схему не понял

конфиг лог стеша ?

output ?

Petr
19.08.2016
11:29:29
Привет LOCK = threading.RLock() with LOCK: # заменяет acquire и release ? ...

H
19.08.2016
11:29:34
https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-templates.html

Google
j7sx
19.08.2016
11:29:37
8 ядер
Многопоточность

Petr
19.08.2016
11:30:35
спасибо

H
19.08.2016
11:31:03
зайди в коде посмотри что делают __aenter__ и __aexit__

Andrii
19.08.2016
11:31:08
оо логстеш ваще здох

даже kill не убивает его

Costel Salanders
19.08.2016
11:32:00
Привет LOCK = threading.RLock() with LOCK: # заменяет acquire и release ? ...
А разве не так нада? with threading.RLock() as LOCK: pass

H
19.08.2016
11:33:17
если подряд, то так

может у него там общий лок для чего-то

Petr
19.08.2016
11:33:54
threading.RLock() для нескольких потоков 1 объект будет?

arisu
19.08.2016
11:37:43
Andrii
19.08.2016
11:38:00
какой еще грейлог

Costel Salanders
19.08.2016
12:04:29
[x for x in numbers if x < 5]

Кончил и закурил

Vladimir
19.08.2016
12:07:12
[x for x in numbers if x < 5]
это где такое?)

Costel Salanders
19.08.2016
12:07:21
Эт в питончике

Andrii
19.08.2016
12:11:38
https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-templates.html
curl -XGET 'http://localhost:9200/_cluster/health?pretty=true' { "cluster_name" : "elasticsearch", "status" : "yellow", "timed_out" : false, "number_of_nodes" : 1, "number_of_data_nodes" : 1, "active_primary_shards" : 150, "active_shards" : 150, "relocating_shards" : 0, "initializing_shards" : 0, "unassigned_shards" : 150, "delayed_unassigned_shards" : 0, "number_of_pending_tasks" : 0, "number_of_in_flight_fetch" : 0, "task_max_waiting_in_queue_millis" : 0, "active_shards_percent_as_number" : 50.0 }

кто-то знает чего статус yellow а не green ?

j7sx
19.08.2016
12:14:20
Кто знает в если в телеграмм создать канал, а не группу, там смогут все писать?

Страница 1427 из 9768