
Yura
02.09.2016
08:34:36
мин
Сразу напишу что я тут работаю на правах стажёра и не имел доступа до всех систем, потому могу не располагать всей информацией. по железу: 4 сервера ProLiant DL380p Gen8 и несколько дисковых полок HP MSA2040 (что ещё надо - говорите, и желательно где и как посмотреть:)). Проблема началась где-то месяц тому, когда закончилось место на главной файлопомойке, после чего начались попытки увеличить место. Точно что было сделано не скажу, но в результате в понедельник производительность упала настолько, что фактически ничего не работает. Сначала была версия про один из двух контроллеров дисковой системы, но после замены ситуация не улучшилась. Сейчас главная проблема, что когда подключают FILES_BIGSACK к виртуальным машинам - быстродействие падает. Какую инфу ещё надо?
Ещё с того что слышал, это то, что FILES_BIGSACK был расширен не очень правильно, что возможно и привело к аварии.


Square
02.09.2016
09:06:01
У меня на машине с МКПП после трогания с места - обороты под красную зону но скорость движения еле до 20кмч доходит (это из того что известно наверняка). Дальше никто ничего уверено не говорит + я плохо вожу авто

Google

Sergiy
02.09.2016
09:06:38
рут. иди нафиг ?

Yura
02.09.2016
09:07:26
ясно, с моими знаниями даже проблему описать не могу :(

Filipp
02.09.2016
09:11:09
ну я бы ради интереса обратился в саппорт хп для проформа
железо на гарантии?

Sergiy
02.09.2016
09:11:59
та уже вроде ковыряются какие то сапортники. но там, я так понял, железячный сапорт кивает на вмвару. а вмвара кивает на железячников.
думал может кто то с похожим сталкивался и подскажет в какую сторону смотреть. часто ведь бывает что крутые спецы и проблемы ищут крутые, а виноваты мелкие нюансы.

Yura
02.09.2016
09:13:04
написали и в сапорт НР и вмварки

Square
02.09.2016
09:14:30
Батарейки вы ведь проверили?
Режим записи какой? С кэшированием?

John
02.09.2016
09:15:40
О чем говорят счетчики на самих котроллерах ? Очереди копяться ? У MSA есть логи в web-морде, они хоть и не очень информативные, но выцепить что-то там можно...
Страдает только запись или чтение в том числе ?

Yura
02.09.2016
09:18:34
по логах в какую морду смотреть? тут есть две

Google

John
02.09.2016
09:18:47
Первую
Райт бэк работает, оф кос )))
Контроллеры FC ?
Все пути работают ?

Square
02.09.2016
09:20:13
Да эти оптика

John
02.09.2016
09:21:04
Снимите скрин информ мессаджей пожалуйста.

Square
02.09.2016
09:22:17
А esx корзину для HA юзает? Drs работает?

John
02.09.2016
09:23:57
На самом деле один волюм на 23TB это сильно....

Yura
02.09.2016
09:26:31
John Carbon, [02.09.16 11:23]
Снимите скрин информ мессаджей пожалуйста.
Скрин логов? Ети? тут много, а експорта в файл не вижу
мож подскажеш как логи в файл вытянуть, а то я много вопросов не понимаю?(

John
02.09.2016
09:27:50
Экспорт в файл есть в другой морде, в составе выгрузки сервисной ифны
Тут видно, только манипуляции по мапингу..
Волюм новый совсем ? Как его подкючаешь ? Как новый Datastor под новые VM-ки или как RDM в саму VM ?
Хотя есть предчувствие, что с СХД, все хорошо )

Sergiy
02.09.2016
09:34:46
думаешь сама вмвара что то учудила?

John
02.09.2016
09:35:05
Возможно, но без вывода esxtop сложно...

Yura
02.09.2016
09:35:41
ща логи скину

John
02.09.2016
09:35:41
Также, я пока не знаю, что за SAN-фабрика через которую проходит FC от MAS-йки..

Yura
02.09.2016
09:37:34
Волюм новый совсем?
про FILES_BIGSACK? старый с данными без бекапа.

[DestRoYeR]
02.09.2016
09:37:36
Не проще ли развернуть тестовую vmware и проверить схд на ней?

Google

Yura
02.09.2016
09:37:57
притащили новий сервер с вмваркой - не помогло
те логи что надо?

Ant
02.09.2016
09:42:30
Хм, вы просто подключаете новый свежий сервер к фабрике и поехали проверять?

Yura
02.09.2016
09:43:06
как я понимаю да
это не я делаю, я просто стою сбоку и наблюдаю + пытаюсь понять

Ant
02.09.2016
09:44:25
Я канеш не настоящий сварщик, но зонирование на фабрике выполнено?
Мы когда-то автино пользовали msa1500, она на аптайме 290 дней без зонирования начинала фокусы выкидывать.
*активно

Yura
02.09.2016
09:47:13
"зонирования" что это? по английски как будет?
и аптайм был несколько лет

Ant
02.09.2016
09:49:58
Ну там выше про оптику говорили, у вас fiber channel ж так между серверами и хранилищем? Там принято делать zoning по идее. Но это только тычок пальцем в небо, тут есть думаю настоящие сварщики (с).

Yura
02.09.2016
09:50:21
проблемы начались после увеличения доступного места. а что точно было сделано не знаю
люди которые это делали, сами не до конца понимали, что делают

John
02.09.2016
10:00:08
Есть зонирование или нет, не столь важно если существует лишь один SAN-свитч между одной СХД и 5-и серверами )
Откуда инфа, что загрузка CPU контроллера на СХД 99% ?

Sergiy
02.09.2016
10:01:48
ну я сказал Юрке что на месте админов я бы сказал шефу "я буду только кнопочки жать, а для серьезных дел вызываем спецов из техподдержки". На что получил ответ "за ту зарплату что они получают они после такого сразу бы вылетели" ?. Ех. лучше бы реально не лезли лишний раз ?

John
02.09.2016
10:02:14
iSNS видит хосты, СХД тожде поэтому фактора блокирующего полностью все пути - нет )

Sergiy
02.09.2016
10:02:37
ну я так понял вся инфа доступна, но скорость доступа критически низкая

Google

John
02.09.2016
10:02:39
Ну по скринам я )

Sergiy
02.09.2016
10:03:07
меня чего то на скринах утилизация смутила - в потолок прямо

John
02.09.2016
10:04:41
Срри, а на каком это скрине ? Я вижу только трешхолды под алерты..
Или туплю.

Admin
ERROR: S client not available

Sergiy
02.09.2016
10:05:32
правый нижний блок
может я не на то посмотрел, я в этом вообще не импотентен
просто показалось что оно все 100% сожрало

Yura
02.09.2016
10:06:13
про проц сказали пацаны, которых прислали помогать. что как только начинают чтото делать с FILES_BIGSACK проц на 99 и все висит

Sergiy
02.09.2016
10:06:41
а что вообще за файлс_бигсак?

John
02.09.2016
10:06:54
Новый фейс не привычен мне )

Yura
02.09.2016
10:07:20
как понимаю ето VOLUME

John
02.09.2016
10:07:22
FILES_BIGSACK это они там волюм свой называют в который писать

Sergiy
02.09.2016
10:07:32
это отдельный сторедж/рейд или что оно такое? или это имя одного из датастораджей вмварки?

John
02.09.2016
10:08:06
Это волюм группа на СХД, под ней RAID6, если я все верно понял из скринов

Yura
02.09.2016
10:08:29

John
02.09.2016
10:08:33
Станно они ее назвали )

Sergiy
02.09.2016
10:08:39
вот интересно - параметр алокейтед он показывает ЗАНЯТОЕ информацией пространство?

John
02.09.2016
10:08:56
тут все есть!

Yura
02.09.2016
10:10:29
Его должны были увеличивать, ток я не могу понять видно ли это на скринах

Google

Yura
02.09.2016
10:19:54
я выше кидал логи, чем их смотреть?
наверное ничего с этого не выйдет, слишком плохо знаю тему. Подскажите хоть как с логами работать, которые я кинул. Буду потихоньку разбираться.

John
02.09.2016
11:19:13
Там куча txt. файлов, парсер этих логов есть только у HPE, мы может их рабирать только руками и глазами.

Sunlight
02.09.2016
12:09:06
В системные логи вмвари смотрели?
dmesg там и тд

Yura
02.09.2016
12:12:16
логи вмваре сейчас проблема супорта вмваре

Sunlight
02.09.2016
12:12:54
там если проблема какая - она моментально начинает срать в dmesg
я вот тут вою с CIM и адаптеком
походу дела придется без CIM его запускать
иначе нестабильно

Yura
02.09.2016
12:15:24
у нас уже пришли с внешней фирмы, берут процес под управление. от меня и тех двух кадров, что все поламали уже почти ничего не зависит

Karter
02.09.2016
12:16:04

Sergiy
02.09.2016
12:16:31
каким таким?

Karter
02.09.2016
12:16:49
Которые ломают всё, а потом обращаются во внешние фирмы.
И такие "от нас уже ничего не зависит".

Sergiy
02.09.2016
12:17:08
как по мне так умное решение пока не начудил еще больше. как говорят - ремонтники очень любят людей которые всё чинят сами, сумы цены работ сильно возрастают ?. Если видишь что вопрос начинает выходить за рамки твоей компетенции то лучше сразу убрать руки и предоставить работать более опытным
Эта группа больше не существует