
H
19.08.2016
09:46:15

Lyubov
19.08.2016
09:46:39

tosh
19.08.2016
09:47:41
Ну я уже скинул

Google

Мерлин
19.08.2016
09:55:05
А существуют ли хэши обладающие следующим свойством: чем меньше различаютсяя две хэшу-суммы, тем меньше различаются оригинальные сообщения?

tosh
19.08.2016
09:55:46
Чтобы было изи подобрать? :3

Aragaer
19.08.2016
09:57:03
обычно это не называется словом хэш 8)

tosh
19.08.2016
09:57:31
Да, самописный алгоритм "хеширования" какой-нибудь по идее
Иначе нахуй такой хеш нужен

Мерлин
19.08.2016
09:58:13

Aragaer
19.08.2016
09:58:40
а, ок
просто взять ксор - уже лучше

Мерлин
19.08.2016
09:59:16
Суть в том, что нужно сравнить два сообщения на близость, не храня сами сообщения

Pavel
19.08.2016
09:59:20
sum(map(ord, message))

Aragaer
19.08.2016
09:59:37
хэш функция это отображение из пространства сообщений в пространство хэшей. Обычно его пытаются сделать сильно разрывным, но в данном случае лучше непрерывное. И такое сделать проще

Artem
19.08.2016
10:00:01
Что такое близость? Общие слова, расстояние левенштейна? Размер сообщение разный?

Мерлин
19.08.2016
10:00:07

Google

Aragaer
19.08.2016
10:00:12
скорее левенштейна
тут беда в том, что хэш это всегда потеря информации об оригинальном сообщении

dmks
19.08.2016
10:00:40

Aragaer
19.08.2016
10:01:17
можно взять в качестве хэша просто начало сообщения - тогда у сообщений с одинаковым началом хэш будет одинаковый, а у сообщений с мало отличающимся началом хэши будут близкие. Но это неинтересно

Мерлин
19.08.2016
10:01:27
То есть блин
Евклидово-подобная
Забыл как называется

Aragaer
19.08.2016
10:02:32
ну вот расстояние левенштейна

Мерлин
19.08.2016
10:03:40

Artem
19.08.2016
10:05:24
Если сообщения небольшие или разнятся не сильно, можно придумать велосипед и накидать реперных точек по пространству сообщений. И хеш - это склеенные два числа - айди точки и расстояние от нее.
звучит достаточно безумно?

Aragaer
19.08.2016
10:06:59
чот вдруг подумал, а насколько сильно различаются коды хэмминга у двух разных сообщений?
ну да, там отличие в 1 бит в сообщении дает очень сильное изменение кода - вплоть до произвольного
там наоборот подобрано так, что все сообщения с расстоянием 1 имеют все допустимые значения хэша

Мерлин
19.08.2016
10:09:45

Aragaer
19.08.2016
10:10:04
ну во-первых можно сначала сравнить длину

Мерлин
19.08.2016
10:11:06

Artem
19.08.2016
10:14:32
А минхешинг никак сюда не воткнуть?

Мерлин
19.08.2016
10:22:22
А это кстати то, что нужно
Однако спасибо

Google

Мерлин
19.08.2016
10:22:57
С небольшой модификацией должно работать

Artem
19.08.2016
10:25:07
Ура!

Dan
19.08.2016
10:49:50
народ может кто подскажет ?
Ситуация такая, есть скрипт, скрипт на python, который работает на нескольких серваках. на одних установлен MySql на других MariaDB.
нужно из скрипта определить к какой базе подключен скрипт.
как это можно сделать? взможно запросом.
в идеале с использованием sqlalchemy.

Pavel
19.08.2016
10:53:10

Dan
19.08.2016
10:53:35
а что это даст ?

Владимир
19.08.2016
10:54:40
SHOW VARIABLES LIKE "%version%";

Dan
19.08.2016
10:54:41
по теории для mysql выдаст 5.*.* для мариа 10.*.*

Pavel
19.08.2016
10:55:06
а что это даст ?
https://mariadb.com/kb/en/mariadb/version/
SELECT VERSION();
+------------------------------+
| VERSION() |
+------------------------------+
| 10.0.3-MariaDB-1~precise-log |
+------------------------------+

Dan
19.08.2016
10:56:54
хорошо спасибо, попробую

Владимир
19.08.2016
10:58:31

Andrii
19.08.2016
11:02:14
Коллеги , кто работал с logstash + elastic ???
ELK stack так называемый

Vladimir
19.08.2016
11:04:35
я работаю
и страдаю
эластик виснет и ведёт себя как хочет

Artem
19.08.2016
11:08:39
немного работал, то тоже не научился готовить эластик

Andrii
19.08.2016
11:09:16
я написал скрипт который шлет сктроки лога через TCP сокет
по 50 штук в секугду всего
запускаю их штук 5 - итого 250 месаг в секунду
через буквально 2-3 минуты он отпадают по сокет таймауту

Google

Andrii
19.08.2016
11:11:13
пока не останется только 2 скрипта - это около 100 сообщений/сек
ну такого ж не может быть что б он не успеевал обрабатывать больше 100 EPS ?
увеличил ES и LS heap size в init скриптах до 8 и 4 соот-но
на серваке SSD и 16 гБ RAM и i7 3.5 ГГц
for i in xrange(1, self.number_of_lines + 1):
line_to_send = self.generate_line()
if self.debug:
print line_to_send
sock.send(line_to_send)
time.sleep(0.02)
sock.close()
Есть какие-то трезвые мысли по этому поводу ?

Artem
19.08.2016
11:23:30
А что с загрузкой в пике? top что говорит
250 eps это конечно немного

Pavel
19.08.2016
11:24:13

Artem
19.08.2016
11:25:03
А еще что эластик о себе говорит

Admin
ERROR: S client not available

Artem
19.08.2016
11:25:22
Я забыл уже, как все называется, но у него есть какая-то диагностика
про состояние кластера и вот это все

H
19.08.2016
11:26:00

Andrii
19.08.2016
11:26:34
8 ядер

Artem
19.08.2016
11:26:55
https://www.elastic.co/guide/en/elasticsearch/reference/2.3/cluster-health.html

H
19.08.2016
11:27:11
у меня шлет поболее через сислог, все работает более менее со схемой

Andrii
19.08.2016
11:28:23
про схему не понял
конфиг лог стеша ?
output ?

Petr
19.08.2016
11:29:29
Привет
LOCK = threading.RLock()
with LOCK: # заменяет acquire и release ?
...

H
19.08.2016
11:29:34
https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-templates.html

Google

j7sx
19.08.2016
11:29:37

H
19.08.2016
11:30:21

Petr
19.08.2016
11:30:35
спасибо

H
19.08.2016
11:31:03
зайди в коде посмотри что делают __aenter__ и __aexit__

Andrii
19.08.2016
11:31:08
оо логстеш ваще здох
даже kill не убивает его

Costel Salanders
19.08.2016
11:32:00

H
19.08.2016
11:33:17
если подряд, то так
может у него там общий лок для чего-то

Petr
19.08.2016
11:33:54
threading.RLock() для нескольких потоков 1 объект будет?

arisu
19.08.2016
11:37:43

Andrii
19.08.2016
11:38:00
какой еще грейлог

Costel Salanders
19.08.2016
12:04:29
[x for x in numbers if x < 5]
Кончил и закурил

Vladimir
19.08.2016
12:07:12

Costel Salanders
19.08.2016
12:07:21
Эт в питончике

Andrii
19.08.2016
12:11:38
https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-templates.html
curl -XGET 'http://localhost:9200/_cluster/health?pretty=true'
{
"cluster_name" : "elasticsearch",
"status" : "yellow",
"timed_out" : false,
"number_of_nodes" : 1,
"number_of_data_nodes" : 1,
"active_primary_shards" : 150,
"active_shards" : 150,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 150,
"delayed_unassigned_shards" : 0,
"number_of_pending_tasks" : 0,
"number_of_in_flight_fetch" : 0,
"task_max_waiting_in_queue_millis" : 0,
"active_shards_percent_as_number" : 50.0
}
кто-то знает чего статус yellow а не green ?

j7sx
19.08.2016
12:14:20
Кто знает в если в телеграмм создать канал, а не группу, там смогут все писать?

Yuriy
19.08.2016
12:14:36