Общие сведения
Метрики доступны на каждом экземпляре ZDS по пути GET /metrics/. Порт совпадает с портом для внешних запросов.
Все метрики имеют префикс zds_.
Метрики дисков
| Метрика | Описание | Лейблы |
|---|
drive_free_space_percentage | Процент свободного места на диске | localNode, path, index, group |
drive_space_bytes | Количество свободных байт на диске | localNode, path, index, group |
drive_free_inodes_percentage | Процент свободных INode на диске | localNode, path, index, group |
drive_read_ops_total | Количество операций чтения с диска | localNode, path, index, group |
drive_write_ops_total | Количество операций записи на диск | localNode, path, index, group |
drive_read_bytes_total | Количество прочитанных байт с диска | localNode, path, index, group |
drive_write_bytes_total | Количество записанных байт на диск | localNode, path, index, group |
drive_opened_files | Число открытых файлов на диске | localNode, path, index, group, mode |
Лейблы:
localNode — имя узла, на котором установлен диск
path — путь диска
index — индекс диска
group — группа хранения диска (для файловой БД — db)
mode — режим доступа к файлу (read / write)
Метрики HTTP запросов
| Метрика | Описание | Лейблы |
|---|
http_requests_total | Общее число запросов | localNode, name, endpoint, status |
http_request_duration_seconds | Длительность выполнения запросов | localNode, name, endpoint |
http_request_size_bytes | Размер запроса в байтах | localNode, name, endpoint |
http_response_size_bytes | Размер ответа в байтах | localNode, name, endpoint |
Лейблы:
localNode — имя узла, обрабатывающего запрос
name — системное имя метода
endpoint — тип обработчика (internal / external / admin)
status — статус код ответа
Метрики вольюмов
| Метрика | Описание | Лейблы |
|---|
volume_count | Число вольюмов на узле | localNode |
volumes_files_count | Число файлов в вольюме на узле | localNode |
volumes_size | Размер файлов (логический) в вольюме на узле | volume |
Метрики ченджлогов
| Метрика | Описание | Лейблы |
|---|
local_changelog_offsets | Оффсеты локальных ченджлогов с разбивкой по группам хранения и типам оффсетов | localNode, group, type |
external_changelog_offsets | Внешние оффсеты ченджлогов | localNode, remoteNode, group |
max_changelog_capacity | Вместимость ченджлога | localNode |
Лейблы:
group — индекс группы хранения ченджлога
type — тип оффсета (head / tail)
remoteNode — имя внешнего узла, внешний оффсет которого сохранён
Метрики очередей задач
| Метрика | Описание | Лейблы |
|---|
queue_latency_milliseconds | Время обработки одной задачи очереди в мс | localNode, queue |
queue_size | Количество задач в очереди | localNode, queue |
queue_throughput_total | Количество обработанных задач | localNode, queue |
queue_errors_total | Количество ошибок при обработке задач | localNode, queue |
Метрики файловой БД
| Метрика | Описание | Лейблы |
|---|
db_ops_committed | Количество закоммиченных операций в БД | localNode |
db_batch_interval | Интервал между коммитами батча | localNode |
db_batch_commit_duration | Длительность операции коммита | localNode |
Метрики восстановления
| Метрика | Описание | Лейблы |
|---|
repair_files_repaired_total | Число восстановленных файлов | localNode |
repair_files_failed_total | Число неуспешных восстановлений | localNode |
Метрики сканирования
| Метрика | Описание | Лейблы |
|---|
scan_running | Признак запущенного сканирования (1=true / 0=false) | localNode |
scan_window_interrupted | Признак приостановленного сканирования (1=true / 0=false) | localNode |
scan_last_run_timestamp_seconds | Время запуска последнего сканирования | localNode |
scan_last_duration_seconds | Длительность последнего сканирования | localNode |
scan_last_files_scanned | Количество отсканированных файлов за последнее сканирование | localNode |
scan_last_files_broken | Количество повреждённых файлов по результатам последнего сканирования | localNode |
Метрики вакуума
| Метрика | Описание | Лейблы |
|---|
vacuum_running | Признак запущенного вакуума (1=true / 0=false) | localNode |
vacuum_window_interrupted | Признак приостановленного вакуума (1=true / 0=false) | localNode |
vacuum_last_run_timestamp_seconds | Время последнего запуска вакуума | localNode |
vacuum_last_duration_seconds | Длительность последнего вакуума | localNode |
vacuum_last_dirs_deleted | Количество директорий, удалённых последним вакуумом | localNode |
vacuum_last_files_deleted | Количество файлов, удалённых последним вакуумом | localNode |
vacuum_last_bytes_freed | Место, освобождённое последним вакуумом | localNode |
Метрики шины событий
| Метрика | Описание |
|---|
eventbus_events_published_total | Количество опубликованных событий |
eventbus_events_processed_total | Количество обработанных событий |
eventbus_events_dropped_total | Количество отброшенных событий |
eventbus_events_failed_total | Количество неуспешно обработанных событий |
eventbus_subscriptions_active | Число активных подписчиков событий |
eventbus_subscriptions_total | Общее число подписчиков на события |
eventbus_unsubscriptions_total | Число отменённых подписок на события |
eventbus_processing_latency_seconds | Время обработки событий |
eventbus_errors_no_subscribers_total | Число ошибок, связанных с отсутствием подписчиков события |
eventbus_errors_bus_stopped_total | Число ошибок, связанных с остановкой шины событий |
eventbus_errors_processor_not_found_total | Число ошибок, связанных с отсутствием обработчика события |
eventbus_errors_channel_full_total | Число ошибок переполнения шины событий |