@dba_ru

Страница 687 из 718
Natali
09.10.2018
19:36:40
Хм

Al
09.10.2018
19:54:11
Вообще про подписчиков на данные мне вспомнились оракловые очереди
Ну тут нет никаких очередей. Есть отправители и получатели. И что угодно может быть и тем и этим и одновременно обоими.

Natali
09.10.2018
20:19:05
Хм

VV
10.10.2018
05:03:58
Google
Al
10.10.2018
05:10:01
Отлично)
Отлично от чего?

Terminator
10.10.2018
05:17:46
@dedipur будет жить. Поприветствуем!

VV
10.10.2018
05:55:54
Отлично от чего?
Отлично от СПб и Мск

Михаил Власов
10.10.2018
05:57:06
В мск жепа в электричке и метро. Как сардины в банке.

Sergey
10.10.2018
07:05:30
Если сдвинуться от часов пик очень даже неплохо. А в МЦК так всегда хорошо

Ilia
10.10.2018
07:11:18
Отлично)
Ну ... как бы не супер.

Natali
10.10.2018
07:11:41
Отлично)
А там же на какой-тр одной половине только быть можно

Как можно жить, когда тебя не везде пускают? Интересно же

Frank
10.10.2018
07:12:25
В мск жепа в электричке и метро. Как сардины в банке.
Это да. Я правда наоборот начал к часам пик сдвигаться, хотя работка теперь ближе

Natali
10.10.2018
07:12:45
В мск жепа в электричке и метро. Как сардины в банке.
++ , поэтому хорошо работать не по стандартному графику: попозже приходить, часам к 11

VV
10.10.2018
07:13:20
Можно быть на любой стороне, но с турецкой стороной некоторые нюансы)

Terminator
10.10.2018
07:13:43
@crestoff будет жить. Поприветствуем!

Михаил Власов
10.10.2018
07:13:49
Google
VV
10.10.2018
07:14:21
из дома в тёплых странах - особенно актуально осенью, зимой и весной)

Frank
10.10.2018
07:14:22
++ , поэтому хорошо работать не по стандартному графику: попозже приходить, часам к 11
Так это, даже к 11 уже и пробки и толпень кругом. В 7-8 в метро вообще заходить страшно

Natali
10.10.2018
07:16:40
Саша
10.10.2018
07:16:53
Дома работать уныло и скучно

Natali
10.10.2018
07:17:15
Так это, даже к 11 уже и пробки и толпень кругом. В 7-8 в метро вообще заходить страшно
Ездила к 11, всегда сидя ехала) и это по ужасной перегруженной фиолетовой ветви)

Я интррверт мне ваще норм

Frank
10.10.2018
07:17:58
Ездила к 11, всегда сидя ехала) и это по ужасной перегруженной фиолетовой ветви)
Я вот как раз в метро спускаюсь, сейчас посмотрим что там))

Саша
10.10.2018
07:19:53
Без возможности обсудить что-нибудь интересное с более опытным товарищем? Ну нет

Ilia
10.10.2018
07:21:40
А там же на какой-тр одной половине только быть можно
Можно быть в обоих. Но на тебя просто будут не так смотреть в другой половине. (на юго-западе греки, на северо-востоке турки, соотношение 2:1, Левкосия/Никосия -- пополам.)

Crestoff
10.10.2018
07:36:40
Добрый день, уважаемые специалисты! Есть такая таблица статистики посещений (InnoDB в MySQL 7):



с такими индексами



за сутки в ней набирается до 1м записей, вот таких



Google
Crestoff
10.10.2018
07:36:40
Для вывода статистики делаем подобные запросы, только с разной группировкой (по часам, дате, IP, referer и тд) SELECT SUM(visit_amount) AS raws, COUNT(visit_amount) AS uniques, SUM(click_amount) AS clicks, ROUND(SUM(click_amount)/SUM(visit_amount)*100) AS prod, SUM(is_bot) AS bots, SUM(is_proxy) AS proxies, SUM(is_no_cookie) AS nocookies, FROM_UNIXTIME(TIME, "%H") AS hour FROM `log_visit` WHERE `time` BETWEEN 1539129600 AND 1539215999 GROUP BY `time` ORDER BY `hour` DESC, `raws` DESCполучаем подобные результаты:



в общем то всё прекрасно если бы не время выполнения запросов к примеру за прошлые сутки около 2х секунд, или если брать группировку по датам за неделю - это около 30 секунд.

результат профилирования



Больше программист чем специалист по DB, поэтому вопрос тривиальный - "Как можно оптимизировать таблицу/запрос/итд" чтобы запросы выполнялись бысрее:) ?

интерфейс, чтобы было понятно что требуется в статсе



Crestoff
10.10.2018
07:45:33
конечно же я делал такую группировку время выполнения запроса увеличивает в 2.5-3 раза

Виктор
10.10.2018
07:49:31
Почему агрегаты не собирать хоть в ту же вертику, зачем насиловать mysql?

Anton
10.10.2018
07:50:10
Я об этом написал в другой группе. Он везде одно и то же понакидал)

Crestoff
10.10.2018
07:51:33
Почему агрегаты не собирать хоть в ту же вертику, зачем насиловать mysql?
Пока интересно решение/совет на mysql, если же совсем ничего не поделать, будем думать о переносе

Anton
10.10.2018
07:52:35
1) сожми колонки 2) разбей на партиции А вообще задача конечно для колоночной бд

3) закажи железо помощнее ))))

NVME, буфер пул на весь размер бд, и номр даже так будет?

Виктор
10.10.2018
07:54:02
партиции не спасут, срез данных большой, все равно seq scan какой-то будет

Crestoff
10.10.2018
07:54:16
делал партиции по датам

не помогло

Anton
10.10.2018
07:54:35
есть предположение, что плохо делал

Google
Anton
10.10.2018
07:54:52
сколько дней в таблице хранится?

Crestoff
10.10.2018
07:55:02
30 дней

Ilia
10.10.2018
07:55:32
конечно же я делал такую группировку время выполнения запроса увеличивает в 2.5-3 раза
Ну, СНАЧАЛА запрос должен быть ПРАВИЛЬНЫМ. Потом -- быстрым.

Crestoff
10.10.2018
07:55:55
это точно)

Crestoff
10.10.2018
07:56:29
мильён он быстро делает

а за недельку, за месяц уже плохо ему

как-то я уже лояльно настроен на перенос данных в вертику, адаптер для yii2 даже есть (проект на yii2). конечно придётся поебаться, чувствую...

Виктор
10.10.2018
07:58:33
агрегаты и в мускуле можно хранить

Ilia
10.10.2018
07:58:53
конечно же я делал такую группировку время выполнения запроса увеличивает в 2.5-3 раза
Скажи что вот это всё значит Почему время -- int ? WHERE time BETWEEN 1539129600 AND 1539215999 это какой интервал (в часах) и сколько в него попадает записей? GROUP BY time Это видимо unixtime в чистом виде. Ну, точно, у тебя запрос неверный. Ты просто гонишь лажу какую-то а не данные.

Anton
10.10.2018
07:59:14
агрегаты и в мускуле можно хранить
да, но там у него декартово произведение получается чуть ли не во всю таблицу) 250 стран умножить на n браузеров умножить на m устройств...

Ilia
10.10.2018
07:59:47
агрегаты и в мускуле можно хранить
Не баламуть. Если это логи, то нахер их предагрегировать? Записал, снял статистику за день, и удалил нахрен. И всё.

Crestoff
10.10.2018
08:00:58
не решена проблема с временем

выполнения

Ilia
10.10.2018
08:01:49
а за недельку, за месяц уже плохо ему
А сколько записей за неделю, месяц?

Google
Crestoff
10.10.2018
08:02:03
ща

Crestoff
10.10.2018
08:02:26
примерно 1м в сутки

Ilia
10.10.2018
08:02:35
примерно 1м в сутки
Ye 30 млн это не шибко много, но уже да, многовато чтобы просто так вот на шару агрегировать...

Ilia
10.10.2018
08:04:27
900к записей например в промежутке который ты указал
Ну, это нормальный промежуток для этого запроса или ты каждый раз как хочешь указываешь?

Crestoff
10.10.2018
08:04:50
как раз этот промежуток не так долго выполняется, т.к. это 1 день.

но когда берём неделю и тд, это уже долго

Ilia
10.10.2018
08:05:33
но когда берём неделю и тд, это уже долго
Ну это совсем разные случаи, неделя и месяц и день

Короче.

Crestoff
10.10.2018
08:06:14
случаи разные - количество обрабатываемых данных увеличивается.

короче чо оптимальнее click хаус или вертика?

я понял уже что проще перенести таблицу

Страница 687 из 718