
Alexander
02.10.2017
10:12:06

Kamil
02.10.2017
10:13:18

Nick
02.10.2017
10:14:06
на гипервизорах нам хватило system.cpu.load[percpu,avg1]
все так ? просто когда у тебя на гипервизоре 80 ядер без гипертреда и несколько продакшн-систем - иногда очень хочется жестко привязать эти системы к конкретным ядрам процессора, чтобы никто друг другу не мешался ни при каких обстоятельствах

Alexander
02.10.2017
10:15:43
у нас больше 20 гипервизоров и по полсотни виртуалок на каждом. ничего не привязываем. HT везде отключен. на гипервизорах по 24 CPU

Google

Alexander
02.10.2017
10:16:28
проблем не ощущаем

Kamil
02.10.2017
10:16:29

Nick
02.10.2017
10:16:30
ну не привязываете и не привязываете ) никто же не заставляет...

Alexander
02.10.2017
10:17:06
если не вмваре то это все превращается в дикий секс, особенно с миграцией ВМ

Kamil
02.10.2017
10:17:57

Nick
02.10.2017
10:18:36
я лишь привел кейс, когда имеет смысл мониторить загрузку ядер процессора
нужно это или нет в ваших конкретных условиях - решать только вам... довод "а у нас и так норм" херовый энивей

Kamil
02.10.2017
10:19:34

Alexander
02.10.2017
10:19:49
это работает если конфигурация ВМ очень статична и почти нет миграций

Kamil
02.10.2017
10:20:27

Alexander
02.10.2017
10:20:50
ну вы же тестируете выпадание и перераспределение гипервизоров?
(N-1) там или (N-2)

Kamil
02.10.2017
10:21:37

Google

Alexander
02.10.2017
10:22:29
эээ, вы БИОСы на гипервизорах обновляете?
ОС, ядра, либы
не?

Valentin
02.10.2017
10:23:24

Kamil
02.10.2017
10:23:47

Alexander
02.10.2017
10:25:46

Kamil
02.10.2017
10:28:44

Alexander
02.10.2017
10:31:30
на последних процессорах такой проблемы с ХТ нет, но на относительно старых наблюдались проблемы с производительностью на специфичных задачах

Некто
02.10.2017
10:34:00
Закидывание USB-ключа через TCP/IP считается странным?

Kamil
02.10.2017
10:35:22

Некто
02.10.2017
10:36:28
Я так и подумал.
Впрочем, в HV, насколько я помню, для запроса нужно еще пару сотен фьючеров активировать ))
для проброса, извините

Valentin
02.10.2017
10:53:17

Alexander
02.10.2017
10:58:15
я уже не помню. наткнулись - выключили. поехало. забыли
почитайте hyperthreading linux kvm
там всякие кейсы описаны - не будем тут оффтопить

Google

Yaroslav
02.10.2017
14:01:05
Привет!
Есть группа поддержки, которая бдит за мониторингом.
При срабатывании алертов, сотрудник должен как-то реагировать.
Сейчас инструкция описана в конфлюенсе: что значит триггер, какое влияние на сервис, что проверить, кому звонить или писать.
Это не очень удобно, потому что при добавлении новых сервисов или новых триггеров, нужно идти руками туда добавлять или править. И есть вероятность того, что что-то будет пропущено и не описано.
Думал, что это все можно добавить в описание самого триггера, но удобнее, когда всё в табличном виде.
Делал кто-то что-то подобное? И какими способами решали?

Danil
02.10.2017
14:02:55
ASCII art?... :)
ведь формата хтмл-письма от Заббикса ещё нет?..

Yaroslav
02.10.2017
14:03:45

Паша
02.10.2017
14:11:01

Danil
02.10.2017
14:11:29

Yaroslav
02.10.2017
14:11:48

Паша
02.10.2017
14:12:31
А там уже хоть таблицы, хоть картинки, хоть видео-инструкции :)

Danil
02.10.2017
14:13:04
видео будет в самый раз, думаю =))

Victor
02.10.2017
14:19:54
Доброго дня! Подскажите, а можно ли изменить выражение в тригере, созданном правилом обнаружения?

Ilya
02.10.2017
14:24:02
Привет!
Есть группа поддержки, которая бдит за мониторингом.
При срабатывании алертов, сотрудник должен как-то реагировать.
Сейчас инструкция описана в конфлюенсе: что значит триггер, какое влияние на сервис, что проверить, кому звонить или писать.
Это не очень удобно, потому что при добавлении новых сервисов или новых триггеров, нужно идти руками туда добавлять или править. И есть вероятность того, что что-то будет пропущено и не описано.
Думал, что это все можно добавить в описание самого триггера, но удобнее, когда всё в табличном виде.
Делал кто-то что-то подобное? И какими способами решали?
У нас есть краткое описание в самом триггере, если не вмещается – то ссылка на вики.
В описании айтемов хранится инфа о том, из какого тикета было инициировано добавление айтема.

oleg
02.10.2017
14:35:26

Ilya
02.10.2017
14:37:28
У Олега сломало русский язык

Yaroslav
02.10.2017
14:39:04

Паша
02.10.2017
14:39:18

oleg
02.10.2017
14:40:01
На Английском легче. :)


Alexander
02.10.2017
14:59:18
Привет!
Есть группа поддержки, которая бдит за мониторингом.
При срабатывании алертов, сотрудник должен как-то реагировать.
Сейчас инструкция описана в конфлюенсе: что значит триггер, какое влияние на сервис, что проверить, кому звонить или писать.
Это не очень удобно, потому что при добавлении новых сервисов или новых триггеров, нужно идти руками туда добавлять или править. И есть вероятность того, что что-то будет пропущено и не описано.
Думал, что это все можно добавить в описание самого триггера, но удобнее, когда всё в табличном виде.
Делал кто-то что-то подобное? И какими способами решали?
когда-то подобное реализовывал через Макросы. Задача была первой линии поддержки в алерт указать контакты и площадку, где объект мониторинга. Нашлепали шаблонов. накидали по объектам мониторинга
Дата: YYYY.MM.DD HH:MM:SS
Объект: ZZZZZZ
Инфраструктура: YYYYYYY
Единица ИИ: XXX-Server
IP: XX.XX.XX.XX
Техподдержка1: Контакты1
Техподдержка2: Контакты2
Техподдержка3: Контакты3
саппорт втыкал в дашборд и почту
ну и там Average еще был

Google

Alexander
02.10.2017
15:01:34
со слов ИТ саппорт - обычные офисные работники, которые дежурили. при алерте просто звонили на мобильный и диктовали чего там написано. Эскалаций и всего такого не делали - этого как показала практика было достаточно

Максим
02.10.2017
15:04:51

Danil
02.10.2017
15:09:30

Максим
02.10.2017
15:09:42

Danil
02.10.2017
15:11:50

Admin
ERROR: S client not available

Valentin
02.10.2017
15:22:08
Это круто, требуется срочно внедрить)

Yaroslav
02.10.2017
15:29:26

Valentin
02.10.2017
15:32:37
Запилить сегодня что ли
Тут уже близко к prtg письма по оформлению

Дмитрий
02.10.2017
15:34:09
думаю на его основе и делали

Владимир
02.10.2017
16:09:01
приветствую товарищи! кто работает с nginx, подскажите, у меня нет доменного имени, а есть ip адрес, как мне прикрепить к server_name 192.168.1.22/zabbix . Чет туплю

Ilya
02.10.2017
16:11:15
Без слеша
zabbix идёт в location
server_name 192.168.1.22;
location /zabbix {
}

Danil
02.10.2017
16:12:32
ещё как вариант, я в root-папке сделал симлинк на /usr/share/zabbix

Владимир
02.10.2017
16:12:44
О_О

Danil
02.10.2017
16:12:51
ну а в
location /zabbix/ {
конечно специфичные настройки

Владимир
02.10.2017
16:12:53
точно, спасибо большое. затупил

Google

@
02.10.2017
17:04:19

Victor
02.10.2017
17:05:25

Nik
02.10.2017
17:05:41

Victor
02.10.2017
17:06:43
ansible/pssh
или на чём хосты? не windows хоть? )

Nik
02.10.2017
17:07:34
на линуксе

Victor
02.10.2017
17:08:41
ну тогда gssh bla-bla-bla "echo бла-бла-бла | sudo tee -a /etc/zabbix/zabbix.d/user_parameters.conf && sudo service zabbix-agentd restart" чтобы не лазить
а модель узнать sudo dmidecode | grep Name
только понять бы ещё, какое Name )

Nik
02.10.2017
17:10:21
ага, я тоже думал про ансибл, а вот за gssh спасибо, почитаю

Victor
02.10.2017
17:10:34
$ sudo dmidecode | grep Name
Product Name: X9DRFR
Product Name: X9DRFR
Name: PWS-1K62P-1R

@
02.10.2017
17:10:39
это средствами заббикс агента без юзерпарамтров? ?
Ну почти, AIDA это прога для сбора информации о железе, по и прочего. Создаёте шаблон, запускаете в сайленте aida.exe с параметрами с указанием шаблона. А дальше уже учите zabbix читать текстовый файл либо другой формат, в котором aida будет сохранять

Victor
02.10.2017
17:10:58

@
02.10.2017
17:11:20

Nik
02.10.2017
17:11:27
интересно почему разрабы не сделают возможность узнавать мать средствами заббикс агента, неужели там разброс

@
02.10.2017
17:12:06

Victor
02.10.2017
17:12:25