Yuriy
Притом у тебя серваки разом могут отказать, например 4-5 штук, память засбоила.
Nikolay
За клиента не надо решать что у него в ha
Yuriy
Оба сразу перемкнуло?)
Да, было такое. Supermicro.
icewolf
Притом у тебя серваки разом могут отказать, например 4-5 штук, память засбоила.
КЗ в блоке питания может тебе сразу 6 серверов выбить
J
Да, было такое. Supermicro.
Ну или пожар случился и весь датацентр сгорел. Такое тоже у некоторых случалось.
Alexey
Nikolay
но это не значит в отказе клиенту постановки вм на HA
Yuriy
Вот именно)
То есть - "Извините, у нас сервак упал тут, а то что вы не делали HA на уровне приложений сами Д..ы?" Так клиенту скажешь? 8) Ты явно в облачном провайдере крупном не работал похоже.
icewolf
Почему именно 6?)
в стандарте у APC pdu до 5.5 обычно 2 банки, верхняя и нижняя так вот если КЗ обоих блоков, обычно так фьюжены и деллы падают то банки по каждой линии выбивает
J
Ну а еще жду когда скинут видос где из пистолета высокого давления моют стойку Novecом. Прям регулярно эти видосы обсасывают и как Задорнов "Ну туууупыыыыя"
J
То есть - "Извините, у нас сервак упал тут, а то что вы не делали HA на уровне приложений сами Д..ы?" Так клиенту скажешь? 8) Ты явно в облачном провайдере крупном не работал похоже.
Я скажу "Сервак упал, извините. Вот компенсация за даунтайм. Сейчас ваша ВМ работает, примите наши извинения за доставленные неудобства."
icewolf
Манагерьем пахнет
icewolf
и бедностью
icewolf
почему бедностью, потому что вы не озаботились в найме нормальных SRE
J
А если б были нормальные SRE,то что?
icewolf
где-нибудь в Латвии регулятор бы пришел бы и закрыл бы такой ЦОД
J
где-нибудь в Латвии регулятор бы пришел бы и закрыл бы такой ЦОД
Какой? Где у тебя при КЗ в блоке питания одного сервера срабатывают защитные автоматы на всю стойку по всем линиям?)
icewolf
притом без извещения, по жалобе клиента что ему бабахнули сервер и клиент понес потери в миллионы евров
Павел
Спасибо за подсказки по поводу fence и masacari, только я одного не пойму, где физически должны лежать инстансы. Они же лежат на нодах, и если эта нода умирает, то инстанс умирает вместе с ней. Должно же быть какое-то распределенное хранилище. Или я не так всё понял.
J
А как иначе то?
icewolf
А как иначе то?
А иначе vmware
icewolf
правда там тоже распределенное
Павел
Да, нужно распределенное хранилище)
Может в openstack есть служба для этого, или сторонними инструментами решается
J
Может в openstack есть служба для этого, или сторонними инструментами решается
Ну а как ты себе представляешь? Если у тебя диски виртуалок на локальном диске сервера и у него, kernel panic случился. Он висит включенный, но нерабочий. Получается, данные оттуда надо как-то смигрировать. Тут, разве что, магия какая помочь может)
J
Может в openstack есть служба для этого, или сторонними инструментами решается
Служба Masakari) Но она же не волшебная, хоть и нормально работает.
Павел
Я думал, это можно через Swift организовать, но когда его настроил, понял, что не получается как-то)))
Nikolay
причем тут object storage
Igor
Служба Masakari) Но она же не волшебная, хоть и нормально работает.
Так общий стор так или иначе нужен. С локальными дисками так не заработает.
icewolf
или ocfs
Igor
ну это все так или иначе sds, а не локал диски
Mr
а как же vmfs?
vmfs все же не распределенная. и в vsan внутри если я правильно помню - обьектное. Хотя наружу отдается по iscsi
icewolf
vmfs тащемто как раз кластерная как и ocfs
J
И в обоих случаях если абсолютно вся запись внутри вм не синхронная чо-то может поломаться)
Mr
vmfs тащемто как раз кластерная как и ocfs
окей )) я еще не поставил попкорн, чтобы слушать про аварии у больших облачных провайдеров на пример https://telecombloger.ru/49133
icewolf
И в обоих случаях если абсолютно вся запись внутри вм не синхронная чо-то может поломаться)
лирика, методология планируемой аварии и восстановления должна быть, как и бэкапы с снапшоты на случай не возможности восстановления.
Mr
и будет фхтагн
J
лирика, методология планируемой аварии и восстановления должна быть, как и бэкапы с снапшоты на случай не возможности восстановления.
Ну вот видишь, снова оказаось что HA не серебряная пуля и что куча оговорок и для полной уверенности нужна армия SRE, методология, бекапы и иконки с Богородицей, Иисусом и Николаем Чудотворцем на стойке)
J
Ох уж эти секты. Император защищает.
К слову, если нагнать достаточно много SRE готовых пожертвовать своей жизнью, они неустанно молясь четырем золотым сигналам смогут поддерживать жизнь в Боге Императоре стойке ценой своих жизненных сил даже если все ветки питания отвалятся. Это научный факт)
icewolf
Ох уж эти секты. Император защищает.
это потому что прототипирование и модель взята из того самого места.
icewolf
Черные HR бороздят просторы чатиков..
Не ну нам объясняют что оказывается обычный новичок, который только что сдал экзамен в автошколе. Может сесть за болид, и при этом еще менять на питстопе колеса и заправляться за доли секунд. И при этом не разбиться на трассе. Вы же понимаете что это лирика?
icewolf
так что и фенсинг нужен и голова не из жопы тоже нужна..
Stanley
Фенсинг и заранее обдуманный режим HA. А то и правда может случится неприятное т
icewolf
Всё засрали своей вахой, благослави вас Бог Имератор!
Вань, это вот все весь вот этот сраче-спичь это от ошибок на стадии проектирования, когда людям нужен условный ovirt они начинают укуриваться.. ух опенстек, ух щас как запануем!!! И в итоге мазафака, которая тоже решает ну далеко не весь спектр отказоустойчиловсти.. и получается облачко с услугой ZaaS
icewolf
Кстати у dynamix ZaaS из коробки
gwaewion
icewolf
дикая дичь в том что там три типа бэков хранения, и один из них shared.. ну то есть он типа shared.. но упирается все в ограничения этого shared(даже если это iscsi) и тут мы получаем уже не облако а шахид-мобиль
icewolf
а native драйвер это FC:)) и там тоже ZaaS случается.
icewolf
итого возврат к openvstorage
Павел
Я тут посмотрел, как вы считаете, собрать распределенное пространство из дисков нод на GlusterFS и монтировать его на ноды в папку /var/lib/nova/instances где инстансы хранятся. Тогда все инстансы будут работать в одной примонтированной папке с возможностью репликации.
Павел
Физически они будут находится на этих же нодах, ноэто уже будет надежно
ArcticFox
Кстати о глаштере, проект полноценно сейчас жив?
J
Кстати о глаштере, проект полноценно сейчас жив?
Да ну жив вроде. Почти ровно год назад 11 версия вышла.
gwaewion
лучше линстрор....
Это drbd который?
Павел
лучше линстрор....
Что такое линстрор?
J
Это drbd который?
Который да.
Павел
Понял спасибо
J
Понял спасибо
Понял ли? https://linbit.com/linstor/
gwaewion
Понял ли? https://linbit.com/linstor/
Полностью осознал, что нужно забыть про гопенстек и идти в сторону ovirt/cloudstack =)
Artemy
Понял ли? https://linbit.com/linstor/
А теперь со всей это херней на борту мы попытаемся взлететь (c)