
Valentin
04.07.2018
18:05:51

Alexander
04.07.2018
18:06:10

Ilya
04.07.2018
18:06:15

Alexander
04.07.2018
18:06:44
Вам достаточно проштудировать ITIL и или MOF

Google

Alexander
04.07.2018
18:06:59
Моф от MS вообще шикарен

Дамир
04.07.2018
18:07:02

Valentin
04.07.2018
18:07:58

Alexander
04.07.2018
18:08:25
Найдите MOF раздел по мониторингу

Valentin
04.07.2018
18:09:21

Ilya
04.07.2018
18:10:02

Valentin
04.07.2018
18:10:24
Это больше SLA/OLA
Сла это больше доя руководства и мониторинг сервисный лучше подходит под задачу. А для уровня инжинеров.

Alexander
04.07.2018
18:10:36

Valentin
04.07.2018
18:10:38

Alexander
04.07.2018
18:11:29
Для начала ознакомьтесь с материалами. Если с англ проблема то есть перевод и на русский

Google

Alexander
04.07.2018
18:11:37
Там будут и сервисы
И карта зависимостей
И роли
https://www.microsoft.com/ru-ru/download/details.aspx?id=23221

Valentin
04.07.2018
18:14:30
У вас каша
Наполовину согласен. В любом случае сначала отталкиваются от сла по сервису, но как определять неявно влияющие проблемы на уровень сеовиса.

Alexander
04.07.2018
18:14:45
Не
Не так

Valentin
04.07.2018
18:14:49

Alexander
04.07.2018
18:14:49
)
Сервис зависит и от него могут зависеть
Итд
SLA - это с бизнесом соглашение
OLA - внутри по сути
Оперейшен левел

Valentin
04.07.2018
18:17:42
Но, у меня проблема нестолько определения критичности, сколько действия из заббикса на длинные проблемы - вылетел диск - кейс уже открыт, но гасить проблему не прпвильно, но ее надо переводить из мониторинга в нечто другое, но и не упустить из виду.

Nikolay
04.07.2018
18:18:24
Я пару раз и разрабатывал стратегию, концепцию мониторинга. И строил процесс управления инцидентами (как реакция на срабатывание мониторинга)
Занимательное дело

Alexander
04.07.2018
18:18:34
По управлению инцидентами мне больше всего понравилось в Гугле - про SRE

Google

Valentin
04.07.2018
18:19:29

Nikolay
04.07.2018
18:19:47

Alexander
04.07.2018
18:19:49

Valentin
04.07.2018
18:19:50

Alexander
04.07.2018
18:20:03
Там есть примеры разбора полетов даже

Valentin
04.07.2018
18:20:15

evgeny
04.07.2018
18:20:25
Это нормально, что на SSD mysqldump при дампе дает 350 iops чтения ? 20-30 МБ в сек. Даже если без зипа. source и dest на одном волюме. Фигня какая-то. Что там еще можно подстроить ему

Valentin
04.07.2018
18:20:44

Alexander
04.07.2018
18:21:01
Я б рекомендовал с каталога сервисов начать

Nikolay
04.07.2018
18:21:13

Valentin
04.07.2018
18:21:30
Ок, спасибо

Alexander
04.07.2018
18:21:32
И параллельно все вести в терминологии ITIL/ITSM

Nikolay
04.07.2018
18:21:54
Не знаю где взять в электронном виде. В бумажном продаётся Cleverics

Alexander
04.07.2018
18:22:02
А после у каждого сервиса будет SLA

Nikolay
04.07.2018
18:22:37
Книга крайне по делу. Фактически оттуда можно применять все с минимальными доработками.

Alexander
04.07.2018
18:23:16
ФС?

evgeny
04.07.2018
18:23:56
ext4 350 гиг

Alexander
04.07.2018
18:24:45
dd тест что покажет?
К примеру чтение из урандома и создание файла размером 50ГБ

Google

Alexander
04.07.2018
18:25:42
Сам ссд не загибается?
Какой ссд?

evgeny
04.07.2018
18:41:14
dd if=/dev/urandom of=/mnt/ssd/dd_test_out bs=8k count=1M
8589934592 bytes (8.6 GB, 8.0 GiB) copied, 57.2294 s, 150 MB/s
dd if=/dev/zero of=/mnt/ssd/dd_test_out bs=8k count=1M
8589934592 bytes (8.6 GB, 8.0 GiB) copied, 13.3251 s, 645 MB/s
такое норм ?
может в винде гипервизоре дело ...

Евгений
04.07.2018
18:49:53
Концепция простая, все на первую линию :) там специально обученные люди на вторую и закрывают часть того, что уже не актуально, техподдержка на вторую, серверная часть на третью.
Загружали алярмы в 1с itil, оттуда распределение заявок первой линией по сотрудникам 2,3 ....

Alexander
04.07.2018
19:03:09

Admin
ERROR: S client not available

Alexander
04.07.2018
19:03:13
покажи как бекап делаешь
команду

evgeny
04.07.2018
19:04:19
с зипом mysqldump -q --single-transaction -u -p db | gzip > dump.sql.gz
без зипа несильно лучше чтение
в конфиге еще такое есть, но видимо не то что интересно max_allowed_packet = 1G
самое смешное в хранилке кэш еще должен дейстовать

Nikolay
04.07.2018
19:24:53

Евгений
04.07.2018
19:28:51

Nikolay
04.07.2018
19:30:31
И тут я с вами соглашусь .:) Именно это и систематизируется (а затем и автоматизируется и измеряется) в процессах управления инцидентами и проблемами

Google

Krangs
04.07.2018
19:39:28
Извините, а можно эти схемы в не пожатом виде?

Nikolay
04.07.2018
19:39:48
рад бы поделиться, но блин внутренний документ.. и все такое..

Krangs
04.07.2018
19:40:11
Ок, вопросов нет

Nikolay
04.07.2018
19:40:39
вот тут в целом почти тоже самое, в усредненном виде. Вообще считаю эту книженцию лучшей и самодостаточной для организации таких процессов.

Krangs
04.07.2018
19:41:18
Благодарю!

Michael
04.07.2018
19:54:41
А кто какие тикет-системы использует?)

Alexander
04.07.2018
19:55:29
Jira/Redmine/Bitrix24

Ilya
04.07.2018
19:55:33
Не начинайте срач только

Michael
04.07.2018
19:55:49
А то мы уже плююемся от нашей, перепиливали, допиливали, все равно что-то не то
Мне чисто советом помочь)))

Alexander
04.07.2018
19:56:33

Michael
04.07.2018
19:56:38
osTicket

Alexander
04.07.2018
19:56:45
не слышал даже

Michael
04.07.2018
19:56:56
в который сами ещё и полезли допиливать функционал

Alexander
04.07.2018
19:56:57
я б рекомендовал если есть $$$ брать Jira
если не хочется тратить $$$ - брать Redmine
ну и приструнить хотелки. сам при внедрении с такими хотелками сталкивался - в 80% удавалось уговорить не допиливать функционал а пользоваться стандартным

Krangs
04.07.2018
19:58:22
Посмотрите GLPI, опенсорс и не плох

Michael
04.07.2018
19:58:38
Стандартный функционал не сможет выгрузить отчёты в том формате, в котором нам надо)