Aleksandr
мертвые и есть мертвые, в заббиксе остались, по факту нет уже давно. например от них не поступало данных n дней. неужели нет решения из коробки?
Aleksandr
ну вот у меня авторегистрация, на нее я так понимаю не распространяется
Aleksandr
удаление итемов, те что через дискавери точно происходит, настраивается. про хосты не помню
Aleksandr
Keep lost resources period
Aleksandr
в 0
Grem1in
Уххххх
Grem1in
Боты какие-то
Andrey
Maxim
class, class, retard alert
Михаил
всем привет! такой вопрос. пытаюсь отслеживать наличие строки в определенном файле через vfs.file.regmatch. создал соответствующий элемент. вроде работает. но! если файла, в котором ищу строку, нет, то элемент меняет статус на Not supported с ошибкой "Cannot open file: [2] No such file or directory" триггер, соответственно, не взводится. неужели надо заводить второй элемент vfs.file.exist?
Михаил
не элемент, а триггер который будет проверять уже эти два элемента.
Ну да, триггер - это уже как следствие... И я не уверен, что он не станет инвалидным из-за того, что один из участвующих в нем элементов станет неподдерживаемым
Михаил
nodata
Спасибо, попробую
Айтуар
Кто подскажет причину таких скачков в zabbix perf? Период этих зубцов пилы примерно 2 минуты.
Айтуар
При этом неделю назад было всё ровно.
Обсессивно беспечное начало основополагающих раздумий
Мониторю логи в журнале шиндус. В элементах данных забиты значение которые должны встречаться в сообщении. Забыл как называется это поле, чтоб в триггерах явно указать на что срабатывать.
Обсессивно беспечное начало основополагающих раздумий
Ага, регексп, спасибо.
Михаил
Кто подскажет причину таких скачков в zabbix perf? Период этих зубцов пилы примерно 2 минуты.
Такое ощущение, что либо какое-то переполнение значений происходит, либо дискретность накопления значений совпадает с дискретностью запросов с определенной периодичностью. К примеру, внутренние счетчики обновляются раз в 40 с,каждый раз увеличиваясь на 100.а значения счетчика снимается раз в минуту. Тогда в 0с значение в 1м - 100 В 2 м - 300 В 3 м - 400 В 4 м - 600 В 5 м 700 В 9 м - 900 И т. д. Получается пила
Михаил
nodata
Кстати, помогло. Спасибо!
Н
Коллеги приветствую, подскажи. Какой тип данных выбрать для значение 0.004
Grem1in
float
Н
Ставлю с плавающие точкой, всё равно пишет not situable
Айтуар
может вместо точки нужна запятая?
Aleksandr
нет
Айтуар
Скажите есть у кого опыт конфигурирования заббикса на 2500 хостов и 200000 метрик?
Адаптивный Рекомбинатор
?
Айтуар
То что не работает нормально. Графики я приводил выше.
Адаптивный Рекомбинатор
я бы копал в сторону IO
Адаптивный Рекомбинатор
кеш например
Адаптивный Рекомбинатор
Адаптивный Рекомбинатор
дев инстанс
Адаптивный Рекомбинатор
300 хостов
Адаптивный Рекомбинатор
30000 айтемов
Адаптивный Рекомбинатор
Диск?
или БД
Адаптивный Рекомбинатор
набрал буфер - сбросил
Адаптивный Рекомбинатор
например
Адаптивный Рекомбинатор
а чем пила не нравится-то,
Адаптивный Рекомбинатор
?
Айтуар
Да вот как раз не видно нагрузки на БД или на серваке заббикса.
Айтуар
А пила началась когда триггеры начали валится с недоступностью хостов
Айтуар
И это не сеть.
Адаптивный Рекомбинатор
Адаптивный Рекомбинатор
разнести сбор на прокси
Айтуар
разнести сбор на прокси
Может быть. Такой вариант ещё не пробовал. Кстати хосты что на текущем прокси сидят нормально мониторит.
Айтуар
Это очень мало
тогда можете посоветовать что делать если он постоянно теряет агентов и графики с данными рваные даже у самого заббикс сервера? Агенты пассивные.
Айтуар
Партиции в базе, и тюнинг
Партиции есть. БД тюнил, там вообще нет нагрузки.
Victor
Victor
Подскажите. Если больше единицы, то загрузка больше 100 процентов?
Victor
или высчитывать исходя из количества ядер на процессоре?
Grem1in
Подскажите. Если больше единицы, то загрузка больше 100 процентов?
можно еще в процентах мерять - там другой ключ
Роман
Подскажите. Если больше единицы, то загрузка больше 100 процентов?
Нет. Просто LA выше единицы. Подробнее тут почитать: https://www.tecmint.com/understand-linux-load-averages-and-monitor-performance/
Роман
Про это?
а тут как раз утилизация процессора расписывается. idle_time 0% говорит, что процессор утилизирован полностью
Grem1in
IDLE - бездействие же
Айтуар
Victor
Т.е.
Victor
процессор полностью загружен (((
Victor
это плохо
Айтуар
процессор полностью загружен (((
Нет. Не обязательно. Это может быть диск.
Айтуар
iowait смотри
Victor
LA на 1 ядро. Не коррелирует с процентами
Т.е. даже если два процессора. То всё равно значение 1 и более это уже где-то проблема. Я правильно Вас понял?
Айтуар
Т.е. даже если два процессора. То всё равно значение 1 и более это уже где-то проблема. Я правильно Вас понял?
Нагрузка нормируется. Т.е. если у вас 2 ядра, LA на заббиксе 1, реальный LA будет 2.
Victor
Нагрузка нормируется. Т.е. если у вас 2 ядра, LA на заббиксе 1, реальный LA будет 2.
А так все системы мониторинга я так понял работают. Потому что тоже самое виду на Proxmox сервере.
Роман
Т.е. даже если два процессора. То всё равно значение 1 и более это уже где-то проблема. Я правильно Вас понял?
Это может быть и не проблемой совсем. Я встречал как серверы, нормально справляющиеся с необходимыми задачами при LA 400, но и безбожно рушащие сервис при LA 1. Зависит от функционала сервера. Поэтому проблемным значение LA может быть применимо только к конкретному серверу/сервису. И проблемой его можно считать только когда оно отличается от обычных для данного сервера показателей
Роман
400 по top, что равно 400/cores по мониторингу
Victor
400 по top, что равно 400/cores по мониторингу
А какая архитектура сервера? Я так понимаю там был 20 или более ядерный процессор и не один
Роман
12 ядер, 24 потока, вроде. Один сокет. Хотя не уверен - года два назад было (могло быть и меньше). Веб-сервер.
Роман
скорее, из кэша отдавал. Но да. Сам сайт работал с адекватной скоростью. Но это был и не вордпресс, а что-то весьма лёгкое на генерацию контента.