Метрики ZDS

Общие сведения

Метрики доступны на каждом экземпляре ZDS по пути GET /metrics/. Порт совпадает с портом для внешних запросов.

Все метрики имеют префикс zds_.

Метрики дисков

МетрикаОписаниеЛейблы
drive_free_space_percentageПроцент свободного места на дискеlocalNode, path, index, group
drive_space_bytesКоличество свободных байт на дискеlocalNode, path, index, group
drive_free_inodes_percentageПроцент свободных INode на дискеlocalNode, path, index, group
drive_read_ops_totalКоличество операций чтения с дискаlocalNode, path, index, group
drive_write_ops_totalКоличество операций записи на дискlocalNode, path, index, group
drive_read_bytes_totalКоличество прочитанных байт с дискаlocalNode, path, index, group
drive_write_bytes_totalКоличество записанных байт на дискlocalNode, path, index, group
drive_opened_filesЧисло открытых файлов на дискеlocalNode, path, index, group, mode

Лейблы:

  • localNode — имя узла, на котором установлен диск
  • path — путь диска
  • index — индекс диска
  • group — группа хранения диска (для файловой БД — db)
  • mode — режим доступа к файлу (read / write)

Метрики HTTP запросов

МетрикаОписаниеЛейблы
http_requests_totalОбщее число запросовlocalNode, name, endpoint, status
http_request_duration_secondsДлительность выполнения запросовlocalNode, name, endpoint
http_request_size_bytesРазмер запроса в байтахlocalNode, name, endpoint
http_response_size_bytesРазмер ответа в байтахlocalNode, name, endpoint

Лейблы:

  • localNode — имя узла, обрабатывающего запрос
  • name — системное имя метода
  • endpoint — тип обработчика (internal / external / admin)
  • status — статус код ответа

Метрики вольюмов

МетрикаОписаниеЛейблы
volume_countЧисло вольюмов на узлеlocalNode
volumes_files_countЧисло файлов в вольюме на узлеlocalNode
volumes_sizeРазмер файлов (логический) в вольюме на узлеvolume

Метрики ченджлогов

МетрикаОписаниеЛейблы
local_changelog_offsetsОффсеты локальных ченджлогов с разбивкой по группам хранения и типам оффсетовlocalNode, group, type
external_changelog_offsetsВнешние оффсеты ченджлоговlocalNode, remoteNode, group
max_changelog_capacityВместимость ченджлогаlocalNode

Лейблы:

  • group — индекс группы хранения ченджлога
  • type — тип оффсета (head / tail)
  • remoteNode — имя внешнего узла, внешний оффсет которого сохранён

Метрики очередей задач

МетрикаОписаниеЛейблы
queue_latency_millisecondsВремя обработки одной задачи очереди в мсlocalNode, queue
queue_sizeКоличество задач в очередиlocalNode, queue
queue_throughput_totalКоличество обработанных задачlocalNode, queue
queue_errors_totalКоличество ошибок при обработке задачlocalNode, queue

Метрики файловой БД

МетрикаОписаниеЛейблы
db_ops_committedКоличество закоммиченных операций в БДlocalNode
db_batch_intervalИнтервал между коммитами батчаlocalNode
db_batch_commit_durationДлительность операции коммитаlocalNode

Метрики восстановления

МетрикаОписаниеЛейблы
repair_files_repaired_totalЧисло восстановленных файловlocalNode
repair_files_failed_totalЧисло неуспешных восстановленийlocalNode

Метрики сканирования

МетрикаОписаниеЛейблы
scan_runningПризнак запущенного сканирования (1=true / 0=false)localNode
scan_window_interruptedПризнак приостановленного сканирования (1=true / 0=false)localNode
scan_last_run_timestamp_secondsВремя запуска последнего сканированияlocalNode
scan_last_duration_secondsДлительность последнего сканированияlocalNode
scan_last_files_scannedКоличество отсканированных файлов за последнее сканированиеlocalNode
scan_last_files_brokenКоличество повреждённых файлов по результатам последнего сканированияlocalNode

Метрики вакуума

МетрикаОписаниеЛейблы
vacuum_runningПризнак запущенного вакуума (1=true / 0=false)localNode
vacuum_window_interruptedПризнак приостановленного вакуума (1=true / 0=false)localNode
vacuum_last_run_timestamp_secondsВремя последнего запуска вакуумаlocalNode
vacuum_last_duration_secondsДлительность последнего вакуумаlocalNode
vacuum_last_dirs_deletedКоличество директорий, удалённых последним вакуумомlocalNode
vacuum_last_files_deletedКоличество файлов, удалённых последним вакуумомlocalNode
vacuum_last_bytes_freedМесто, освобождённое последним вакуумомlocalNode

Метрики шины событий

МетрикаОписание
eventbus_events_published_totalКоличество опубликованных событий
eventbus_events_processed_totalКоличество обработанных событий
eventbus_events_dropped_totalКоличество отброшенных событий
eventbus_events_failed_totalКоличество неуспешно обработанных событий
eventbus_subscriptions_activeЧисло активных подписчиков событий
eventbus_subscriptions_totalОбщее число подписчиков на события
eventbus_unsubscriptions_totalЧисло отменённых подписок на события
eventbus_processing_latency_secondsВремя обработки событий
eventbus_errors_no_subscribers_totalЧисло ошибок, связанных с отсутствием подписчиков события
eventbus_errors_bus_stopped_totalЧисло ошибок, связанных с остановкой шины событий
eventbus_errors_processor_not_found_totalЧисло ошибок, связанных с отсутствием обработчика события
eventbus_errors_channel_full_totalЧисло ошибок переполнения шины событий