Gleb
берешь услугу типа "виртуальный датацентр"
Gleb
всё за пределами вм - чёрный ящик
Anton
Миграция между кластерами бессмысленное занятие, если кластеры правильно созданы и спроектированы.
Anton
берешь услугу типа "виртуальный датацентр"
А если я провайдер и хочу встать на оптимальное количество жлеза? А не заказчик
Anton
vRops - чистый мониторинг и никаких команд не дает. Веритас вообще не при чем.
vRA тогда езще до кучи. На счет Веритас не соглашусь я
Konstantin
https://blogs.vmware.com/management/2016/11/david-davis-vrealize-operations-post-34-new-predictive-drs-vrealize-operations-6-4.html
Anton
vRA вообще для другого
Да, для другого, читаю пока ссылку по предсказаниям и размещениям VM, спасибо,интересно.Как раз поучусь, может Жбанков не будет обзываться тогда
Anton
Ну то есть Predictive DRS даст пинка на переезд если что-то пошло не так, а он скажет почему что-то пошло не так?
Anton
и если надо сдеать начальное размещене, куда размещать скажет? или ему сначала надо попылесосить информацию о профиле использования ресурсов, а уже потом на основе исторических данных говорить куму куда?
Konstantin
Each hour, predictive DRS will take the knowledge that it has of the environment combined with the historical resources utilization of each virtual machine then take action ensure that the virtual machines receive the resources they need BEFORE THEY NEED THEM. The end result is that your critical applications never get the chance to suffer any kind of performance impact.
Konstantin
начальным размещенем сам DRS занимается
Anton
А на основании исторических данных переместит машины, чтобы удовлетворить их потребности в ресурсах.
Anton
Антон, "если что-то пошло не так" - это не про DRS вообще. И тем более про Predictive.
Anton
Есть исторические данные по потреблению ресурсов.
Anton
Обычный DRS реагирует на изменение потребления ресурсов и перемещает ВМ внутри кластера, чтобы обеспечить им ресурсы с менее загруженных хостов.
Anton
Predictive делает то же самое, но только еще до того, как ВМ начали потреблять ресурсы
Konstantin
можно, например, vROps через API трогать и самостоятельно обрабатывать ситуации "если что-то пошло не так"
Alexandr
можно даже и vRO не использовать, а все равно обрабатывать
Alexandr
но зачем?
Anton
Хороший вопрос - что именно относится к категории "что-то пошло не так"
Konstantin
ну, например, у вас %RDY зашкалил. производительность просела. штатному DRS на это наплевать.
Konstantin
алерт с vROps прилетит
Anton
ну, например, у вас %RDY зашкалил. производительность просела. штатному DRS на это наплевать.
если зашкаливает %RDY - это или кривая конфигурация ВМ или жесткая нехватка производительности СХД.
Konstantin
и размигрируете скриптом как надо
Anton
Что в этой ситуации нужно делать?
Konstantin
как пример
Alexandr
офигеть... А как в этом примере миграция поможет?
Alexandr
Ну свалите вы на другой хост и ДС
Alexandr
или*
Konstantin
у вас могут быть менее нагруженные хосты
Alexandr
Стопе
Konstantin
но надо самому опять же смотреть на нагрузку по кол-ву ВМ и текущим %RDY на хостах
Alexandr
причина высокого рду в чем? Хост загружен?
Konstantin
прочих
Alexandr
погоди, это не твой кейс )
Alexandr
Я прочитал твой мессадж, теперь коррелирую его с высокой загрузкой хоста
Konstantin
как правило причина high %RDY одна - неправильный провижионинг по vCPU
Alexandr
Хотя стоп... Загрузка хоста... Высокая... дрс отработал уже давно, нет?
Konstantin
я имел в виду не нагрузку в процентах на CPU
Alexandr
Много точек, прошу прощения
Konstantin
бывают кейсы где на одних и тех же хостах загрузка проца примерно 30-40 процентов
Anton
выский %RDY - это или ожидание таймслотов на нескольких ядрах из-за синхронизации co-scheduling
Konstantin
но при этом на одном %RDY по 20, а на втором 5
Anton
или ожидание ввода-вывода, когда жестко нагнулась СХД и не справляется
Konstantin
для примера
Anton
Konstantin
это должен сказать потребитель ресурсов ))
Konstantin
бывает что и нет
Alexandr
Является ли это проблемой?
Добавлю - и это есть единственный признак? Больше ни одной метрики не находится в не нормальном состоянии?
Anton
Сам по себе %RDY - это показатель количества времени, которое CPU проводит в готовности исполнять команды, но не исполняет их
Konstantin
причина не одна, естественно...
Alexandr
Просто у меня складывается впечатление, что высокий реди - это не причина. А следствие.
Alexandr
И триггерить миграцию по нему - ну такоооое
Konstantin
как правило эта проблема многопроцессорных ВМ
Alexandr
Бинго.
Вот ты вечно вот
Anton
как правило эта проблема многопроцессорных ВМ
Как правило это проблема в мозгах того, кто эту ВМ создал
Konstantin
когда шедулер ждет освобождения всех ядер для исполнения
Anton
8 vCPU на контроллер домена
Konstantin
не всех на хосте естественно...а то счас начнется ))
Alexandr
Константин, просто я к чему. Пример не очень удачный (ИМХО)
Konstantin
пример удачный в плане того что эта ситуация не отслеживается штатным DRS
Konstantin
и у вас может просесть производительность при вполне приемлемых видимых стандартных показателях
Alexandr
Я еще раз повторю - вы хотите юзать дрс не при болезнях, а при симптоме
Alexandr
а симптома по хорошему не должно проявиться - миграция должна сработать раньше. не допустив такой ситуевины в принципе