@pro_openstack

Страница 58 из 117
Марк ☢
12.12.2016
11:05:57
всмысле один осд может нахерачить много параллельных запросов на один диск

может это и капитанство, но напрямую это нигде не сказано

Михаил
12.12.2016
11:06:33
А

Google
Марк ☢
12.12.2016
11:09:02
поэтому, сцуко, NCQ пиздец как важно. и мои эксперименты показывают, что на само мделе нихера оно не работает

всмысле, что задержка при тарабане диска напрямую без цефа линейно растёт с количеством параллельных очередей

что на дешмани, что на velociraptor с наклейкой "Enterprise Storage"

Михаил
12.12.2016
11:12:10
Я надеюсь ты как хороший мальчик потом напишешь пост хотя бы сюда о своих изысканиях

Марк ☢
12.12.2016
11:12:43
ниасилю. да и не уверен пока насчёт правильности моих измерений

пока мне кажется, что руки у меня из жопы, но как это проверить?

вот например недавно зависал fio - я думаю что за дерьмо

а оказалось я забыл приписать direct=1

ну и понятно, оно в пэйджкеше накешировалось дохулиарда запросов

Марк ☢
12.12.2016
11:14:31
sas надо, там работает, у sata оно сильно кастрировано
эумперимент показывает. что даже пару-тройку секоторов за раз не прописывает, какой смысл?

в сасе вроде смысл в том что интерфейс позволяет более 32 очередей проталкивать

Viktor
12.12.2016
11:14:52
LSI в доках к контроллерам подробно расписывало где и насколько, но сейчас под рукой нет

Google
Марк ☢
12.12.2016
11:14:53
но блять, даже 2-3 это предел

либо у меня диски какие-то не те, либо методика измерения

или контроллер

Roman
12.12.2016
11:15:19
Viktor
12.12.2016
11:15:21
Марк ☢
12.12.2016
11:15:21
или фаза луны

он очень много чего позволяет сверх возможностей sata
например, из того что пригодится именно в цефе

Roman
12.12.2016
11:16:01
Марк ☢
12.12.2016
11:16:16
scsi много чего позволяет
а из того что пригодится в цефе ?

Roman
12.12.2016
11:16:47
ну NCQ же
ncq - это одна очередь

В scsi тоже одна очередь

Несколько очередей есть только в nvme

Марк ☢
12.12.2016
11:17:17
ладно, окей, очередь одна

но линукс зная это — в неё вталкивает по 32 сектора по одному из каждой линуксной очереди

Viktor
12.12.2016
11:17:35
sas как железо реализующее возможности протокола SCSI

Марк ☢
12.12.2016
11:17:45
(условно)

Марк ☢
12.12.2016
11:17:57
Нет
а как тогда?

Roman
12.12.2016
11:19:07
Что как?

Google
Марк ☢
12.12.2016
11:19:12
БЛДЖАД

в чём смысл NCQ тогда ?

Alexandr
12.12.2016
11:21:31
Это очередь. Одна очередь. Но контроллер диска с ncq может задания из этой очереди перемешать так, чтобы они выпонились эффективнее

Марк ☢
12.12.2016
11:21:42
ну как... четал. понятно что не так оно втупую работает, и не подному сектору. и не всегда 32 и т.д. но для представления этогодостаточно

Roman
12.12.2016
11:22:00
у нас есть как минимум 2 очереди: 1) это та самая nr_requests 2) очередь в самом блочном устройстве (ncq/tcq)

Roman
12.12.2016
11:22:46
более того, запросы из очереди 1 не всегда попадают в 1 в 1 в очередь 2

Roman
12.12.2016
11:23:01
Марк ☢
12.12.2016
11:23:14
везде.
а редхат в пдф говорит что нет

Roman
12.12.2016
11:23:56
есть такая крутилка, как max_sectors_kb, которая ограничивает максимальный размер блока который попадёт в очередь устройства

а редхат в пдф говорит что нет
что именно оно говорит? линк? вот у меня deadline и тоже есть nr_requests

Марк ☢
12.12.2016
11:24:24
https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Performance_Tuning_Guide/ch06s04s03.html

Roman
12.12.2016
11:24:27
в cfq тоже оно есть, как и bfq

Марк ☢
12.12.2016
11:24:41
https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Performance_Tuning_Guide/ch06s04s02.html

Roman
12.12.2016
11:25:32
Марк ☢
12.12.2016
11:25:32
мож оно есть, но не влияет при деадлайне ?

Google
Roman
12.12.2016
11:25:50
>Following are the tunables available for the block layer.

Марк ☢
12.12.2016
11:25:56
это на block level, а не на уровне элеватора
вот тут поподробнее, пожалуйста, потому что я не понял

Roman
12.12.2016
11:26:05
ну йопт

Марк ☢
12.12.2016
11:26:29
щас понял.

Roman
12.12.2016
11:26:36
tunables для элеватора живут в /sys/block/sda/queue/iosched/

Марк ☢
12.12.2016
11:26:37
пдф оформляли пидоры

Roman
12.12.2016
11:26:55
для noop ясен хер что никаких tunables нет потому что и элеватора нет

Марк ☢
12.12.2016
11:27:01
так. окей. продолжаем

Roman
12.12.2016
11:27:10
но block level никуда не делся

Марк ☢
12.12.2016
11:27:40
ок. жутко интересно про NCQ

жги.

Roman
12.12.2016
11:28:00
так вот, если у тебя i/o будет больше чем max_sectors_kb, то запрос побьётся и попадёт в очередь устройства уже в виде нескольких

Марк ☢
12.12.2016
11:28:03
(не всмысле, мол, ну давай, давай, спори хуйню, а реально интересно)

Roman
12.12.2016
11:28:40
ок. жутко интересно про NCQ
а что про неё говорить? ncq - это просто очередь и возможность для контроллера диска иметь пространство для оптимизации.

эта очередь - она в устройстве. чем больше размер очереди - тем больше шансов построить оптимальную траекторию движения головы по блинам и тем хуже всё с latency

Марк ☢
12.12.2016
11:29:59
так вот, если у тебя i/o будет больше чем max_sectors_kb, то запрос побьётся и попадёт в очередь устройства уже в виде нескольких
ну. тоесть линукс потенциально копит запросы чтобы потом протолкнуть их в диск всеё пачкой. верно ?

и копилки эти по-процессно. верно ?

Viktor
12.12.2016
11:30:42
а из того что пригодится в цефе ?
От нагрузки зависит, к примеру sas передаёт в дуплексе данные, в случае больших массивов может быть полезно, не блокирует порт 1 устройством в случае использования експандеров

Google
Viktor
12.12.2016
11:31:13
А вообще начните с вики, там для затравки немного расписано

Roman
12.12.2016
11:31:23
и копилки эти по-процессно. верно ?
не уверен, что per process. скорее, per device.

экспандеров нет (у меня) нагрузка в основном на запись.
я предлагаю подумать над относительно простым сценарием: у тебя аппаратный рейд и пачка дисков с ncq. у рейда будет tcq с глубиной очерди в 255 команд + очереди ncq в дисках. + очередь в linux к блочному устройству рейда.

Viktor
12.12.2016
11:33:57
какого именно wiki?
https://en.wikipedia.org/wiki/Serial_Attached_SCSI#Comparison_with_SATA

Марк ☢
12.12.2016
11:33:58
под цеф

Viktor
12.12.2016
11:34:33
будут по 4 диска в ноде
тогда забей на sas

Марк ☢
12.12.2016
11:34:57
а я и забил. вопрос был про NCQ и полезен ли он в цефе.

Viktor
12.12.2016
11:34:59
пока не станет много или/и диски не станут БЫСТРЫМИ тебе sas не нужен

Марк ☢
12.12.2016
11:35:20
и самое важное — как проверить по факту диск занимается тем самым прописыванием нескольких секторов за проворот или нет

пока не станет много или/и диски не станут БЫСТРЫМИ тебе sas не нужен
мне нужно собрать из говна и палок. но всё же, в говне поискать орешки

кароче.

как проверить NCQ в деле ? (измерить тоесть)

а стоп.

Roman
12.12.2016
11:36:40
Марк ☢
12.12.2016
11:36:40
погодите.

тупо queue depth менять
так и делаю . в фио

погодите.

Страница 58 из 117