@ZabbixPro

« Назад

Страница 942 из 1183

Далее »

Valentin

04.07.2018
18:05:51

Нет

Спасибо

Alexander

04.07.2018
18:06:10

Я думаю никто не поделится, это же хлеб админов

Это внутренний документ

Ilya

04.07.2018
18:06:15

А можете поделиться драфтом или концепцией?

А что ты собрался оттуда утаскивать? У тебя нет требований, каким должен быть у тебя мониторинг?

Alexander

04.07.2018
18:06:44

Вам достаточно проштудировать ITIL и или MOF

Google

Alexander

04.07.2018
18:06:59

Моф от MS вообще шикарен

Дамир

04.07.2018
18:07:02

Это внутренний документ

Само собой, даже если не внутренный, то уникальные знания делают контору/сотрудника ценным

Valentin

04.07.2018
18:07:58

не совсем понятно что такое концепция мониторинга. Типа как мониторится, что-за сборка, триггеры и вооще что может мой заббикс?

Концепция должна начинатся с постановки сегмента (сервера, сервиса) на мониторинг, и дальнейшее его развитие, уровни тригеров, реакция 1 линии, аски, заведения заявок по длинным проблемам или меинтенс правила.

Alexander

04.07.2018
18:08:25

Концепция должна начинатся с постановки сегмента (сервера, сервиса) на мониторинг, и дальнейшее его развитие, уровни тригеров, реакция 1 линии, аски, заведения заявок по длинным проблемам или меинтенс правила.

Вообще не так

Концепция должна начинатся с постановки сегмента (сервера, сервиса) на мониторинг, и дальнейшее его развитие, уровни тригеров, реакция 1 линии, аски, заведения заявок по длинным проблемам или меинтенс правила.

Это больше SLA/OLA

Найдите MOF раздел по мониторингу

Valentin

04.07.2018
18:09:21

А что ты собрался оттуда утаскивать? У тебя нет требований, каким должен быть у тебя мониторинг?

Нет. Илья, на конфе ты сам говорил, что мониторинг это не только лампоски, но и реакция на них. 3 уровнч тригеров и дальнейшая ескалация.

Ilya

04.07.2018
18:10:02

Нет. Илья, на конфе ты сам говорил, что мониторинг это не только лампоски, но и реакция на них. 3 уровнч тригеров и дальнейшая ескалация.

И? У нас есть требования, которые при этом меняются. У тебя нет требований?

Valentin

04.07.2018
18:10:24

Это больше SLA/OLA

Сла это больше доя руководства и мониторинг сервисный лучше подходит под задачу. А для уровня инжинеров.

Alexander

04.07.2018
18:10:36

Сла это больше доя руководства и мониторинг сервисный лучше подходит под задачу. А для уровня инжинеров.

У вас каша

Valentin

04.07.2018
18:10:38

Найдите MOF раздел по мониторингу

Ок, попробую. Спасиьо

И? У нас есть требования, которые при этом меняются. У тебя нет требований?

Нет

Alexander

04.07.2018
18:11:29

Для начала ознакомьтесь с материалами. Если с англ проблема то есть перевод и на русский

Google

Alexander

04.07.2018
18:11:37

Там будут и сервисы

И карта зависимостей

И роли

https://www.microsoft.com/ru-ru/download/details.aspx?id=23221

Valentin

04.07.2018
18:14:30

У вас каша

Наполовину согласен. В любом случае сначала отталкиваются от сла по сервису, но как определять неявно влияющие проблемы на уровень сеовиса.

Alexander

04.07.2018
18:14:45

Не

Не так

Valentin

04.07.2018
18:14:49

https://www.microsoft.com/ru-ru/download/details.aspx?id=23221

Спасибо.

Alexander

04.07.2018
18:14:49

)

Наполовину согласен. В любом случае сначала отталкиваются от сла по сервису, но как определять неявно влияющие проблемы на уровень сеовиса.

Неявные - это зависимости

Сервис зависит и от него могут зависеть

Итд

SLA - это с бизнесом соглашение

OLA - внутри по сути

Оперейшен левел

Valentin

04.07.2018
18:17:42

Но, у меня проблема нестолько определения критичности, сколько действия из заббикса на длинные проблемы - вылетел диск - кейс уже открыт, но гасить проблему не прпвильно, но ее надо переводить из мониторинга в нечто другое, но и не упустить из виду.

Nikolay

04.07.2018
18:18:24

Я пару раз и разрабатывал стратегию, концепцию мониторинга. И строил процесс управления инцидентами (как реакция на срабатывание мониторинга)

Занимательное дело

Alexander

04.07.2018
18:18:34

Но, у меня проблема нестолько определения критичности, сколько действия из заббикса на длинные проблемы - вылетел диск - кейс уже открыт, но гасить проблему не прпвильно, но ее надо переводить из мониторинга в нечто другое, но и не упустить из виду.

Хелпдеск/Сервисдеск

По управлению инцидентами мне больше всего понравилось в Гугле - про SRE

Google

Valentin

04.07.2018
18:19:29

OLA - внутри по сути

Согласен, есть даже примерное понимание, но не с ядром на конкретном заббиксе

Nikolay

04.07.2018
18:19:47

Но, у меня проблема нестолько определения критичности, сколько действия из заббикса на длинные проблемы - вылетел диск - кейс уже открыт, но гасить проблему не прпвильно, но ее надо переводить из мониторинга в нечто другое, но и не упустить из виду.

Могу поделится великолепным источником знаний. Освоив который вы сможете «сделать» такую реакцию, которая нужна именно вам

Alexander

04.07.2018
18:19:49

По управлению инцидентами мне больше всего понравилось в Гугле - про SRE

https://landing.google.com/sre/

Valentin

04.07.2018
18:19:50

Занимательное дело

Согласен, но примеров мало можно найти.

Alexander

04.07.2018
18:20:03

Там есть примеры разбора полетов даже

Valentin

04.07.2018
18:20:15

Могу поделится великолепным источником знаний. Освоив который вы сможете «сделать» такую реакцию, которая нужна именно вам

Если можнл.

evgeny

04.07.2018
18:20:25

Это нормально, что на SSD mysqldump при дампе дает 350 iops чтения ? 20-30 МБ в сек. Даже если без зипа. source и dest на одном волюме. Фигня какая-то. Что там еще можно подстроить ему

Valentin

04.07.2018
18:20:44

Там есть примеры разбора полетов даже

Спасибо. Посмотрю, изучу.

Alexander

04.07.2018
18:21:01

Я б рекомендовал с каталога сервисов начать

Nikolay

04.07.2018
18:21:13

Если можнл.

Valentin

04.07.2018
18:21:30

Ок, спасибо

Alexander

04.07.2018
18:21:32

И параллельно все вести в терминологии ITIL/ITSM

Nikolay

04.07.2018
18:21:54

Не знаю где взять в электронном виде. В бумажном продаётся Cleverics

Alexander

04.07.2018
18:22:02

А после у каждого сервиса будет SLA

Nikolay

04.07.2018
18:22:37

Книга крайне по делу. Фактически оттуда можно применять все с минимальными доработками.

Alexander

04.07.2018
18:23:16

Это нормально, что на SSD mysqldump при дампе дает 350 iops чтения ? 20-30 МБ в сек. Даже если без зипа. source и dest на одном волюме. Фигня какая-то. Что там еще можно подстроить ему

Размер базы?

ФС?

evgeny

04.07.2018
18:23:56

ext4 350 гиг

Alexander

04.07.2018
18:24:45

dd тест что покажет?

К примеру чтение из урандома и создание файла размером 50ГБ

Google

Alexander

04.07.2018
18:25:42

Сам ссд не загибается?

Какой ссд?

evgeny

04.07.2018
18:41:14

dd if=/dev/urandom of=/mnt/ssd/dd_test_out bs=8k count=1M 8589934592 bytes (8.6 GB, 8.0 GiB) copied, 57.2294 s, 150 MB/s dd if=/dev/zero of=/mnt/ssd/dd_test_out bs=8k count=1M 8589934592 bytes (8.6 GB, 8.0 GiB) copied, 13.3251 s, 645 MB/s

такое норм ?

может в винде гипервизоре дело ...

Евгений

04.07.2018
18:49:53

Концепция простая, все на первую линию :) там специально обученные люди на вторую и закрывают часть того, что уже не актуально, техподдержка на вторую, серверная часть на третью.

Загружали алярмы в 1с itil, оттуда распределение заявок первой линией по сотрудникам 2,3 ....

Alexander

04.07.2018
19:03:09

такое норм ?

пойдет

Admin

ERROR: S client not available

Alexander

04.07.2018
19:03:13

покажи как бекап делаешь

команду

evgeny

04.07.2018
19:04:19

с зипом mysqldump -q --single-transaction -u -p db | gzip > dump.sql.gz

без зипа несильно лучше чтение

в конфиге еще такое есть, но видимо не то что интересно max_allowed_packet = 1G

самое смешное в хранилке кэш еще должен дейстовать

Nikolay

04.07.2018
19:24:53

Концепция простая, все на первую линию :) там специально обученные люди на вторую и закрывают часть того, что уже не актуально, техподдержка на вторую, серверная часть на третью.

все верно, но от уровней можно отказаться. потому что слишком долго. и как обычно дьявол в мелочах

Евгений

04.07.2018
19:28:51

все верно, но от уровней можно отказаться. потому что слишком долго. и как обычно дьявол в мелочах

Для дьявола в мелочах есть нач отдела тп.... который должен смотреть в 100500 самых частых триггеров и анализировать, как так у него каждые 40 минут падает канал основной в филиале в новом уренгое.... и что с этим можно сделать.

Nikolay

04.07.2018
19:30:31

И тут я с вами соглашусь .:) Именно это и систематизируется (а затем и автоматизируется и измеряется) в процессах управления инцидентами и проблемами

Google

Krangs

04.07.2018
19:39:28

Извините, а можно эти схемы в не пожатом виде?

Nikolay

04.07.2018
19:39:48

рад бы поделиться, но блин внутренний документ.. и все такое..

Krangs

04.07.2018
19:40:11

Ок, вопросов нет

Nikolay

04.07.2018
19:40:39

вот тут в целом почти тоже самое, в усредненном виде. Вообще считаю эту книженцию лучшей и самодостаточной для организации таких процессов.

Krangs

04.07.2018
19:41:18

Благодарю!

Michael

04.07.2018
19:54:41

А кто какие тикет-системы использует?)

Alexander

04.07.2018
19:55:29

Jira/Redmine/Bitrix24

Ilya

04.07.2018
19:55:33

Не начинайте срач только

Michael

04.07.2018
19:55:49

А то мы уже плююемся от нашей, перепиливали, допиливали, все равно что-то не то

Не начинайте срач только

Не)

Мне чисто советом помочь)))

Alexander

04.07.2018
19:56:33

А то мы уже плююемся от нашей, перепиливали, допиливали, все равно что-то не то

а что у вас?

Michael

04.07.2018
19:56:38

osTicket

Alexander

04.07.2018
19:56:45

не слышал даже

Michael

04.07.2018
19:56:56

в который сами ещё и полезли допиливать функционал

Alexander

04.07.2018
19:56:57

я б рекомендовал если есть $$$ брать Jira

если не хочется тратить $$$ - брать Redmine

ну и приструнить хотелки. сам при внедрении с такими хотелками сталкивался - в 80% удавалось уговорить не допиливать функционал а пользоваться стандартным

Krangs

04.07.2018
19:58:22

Посмотрите GLPI, опенсорс и не плох

Michael

04.07.2018
19:58:38

Стандартный функционал не сможет выгрузить отчёты в том формате, в котором нам надо)

« Назад

Страница 942 из 1183

Далее »

Открыть в Telegram