支援的監控指標

本頁列出 Memorystore for Valkey 適用的 Cloud Monitoring 指標,並說明各項指標的用途。

Cloud Monitoring 指標

執行個體層級指標

這些指標可提供執行個體整體健康狀態和效能的概略資訊。有助於瞭解執行個體的整體容量和使用率,並找出潛在瓶頸或可改善之處。

指標名稱 說明
memorystore.googleapis.com/instance/clients/average_connected_clients 執行個體中所有節點的平均用戶端連線數。
memorystore.googleapis.com/instance/clients/maximum_connected_clients 執行個體中單一節點的用戶端連線數上限。
memorystore.googleapis.com/instance/clients/maximum_connection_duration 執行個體中單一節點的用戶端連線時間長度上限。
memorystore.googleapis.com/instance/clients/total_connected_clients 目前連線至執行個體的用戶端連線數量。
memorystore.googleapis.com/instance/stats/total_connections_received_count 過去一分鐘內建立的執行個體層級用戶端連線總數。
memorystore.googleapis.com/instance/stats/total_rejected_connections_count 因 maxclients 限制而遭拒的連線數量。
memorystore.googleapis.com/instance/commandstats/total_usec_count 每個指令耗用的總時間。
memorystore.googleapis.com/instance/commandstats/total_calls_count 一分鐘內此指令的呼叫總數。
memorystore.googleapis.com/instance/cpu/average_utilization 執行個體中所有節點的平均 CPU 使用率,範圍為 0.0 到 1.0。
memorystore.googleapis.com/instance/cpu/maximum_utilization 執行個體中單一節點的最大 CPU 使用率,範圍為 0.0 到 1.0。
memorystore.googleapis.com/instance/stats/average_expired_keys 執行個體中所有節點主要節點的平均金鑰到期事件數。
memorystore.googleapis.com/instance/stats/maximum_expired_keys 執行個體中單一節點的主要金鑰到期事件數量上限。
memorystore.googleapis.com/instance/stats/total_expired_keys_count 執行個體中所有節點主要節點的密鑰到期事件總數。
memorystore.googleapis.com/instance/stats/average_evicted_keys 執行個體中所有節點的主要節點,因記憶體容量不足而遭逐出的鍵平均數量。
memorystore.googleapis.com/instance/stats/maximum_evicted_keys 執行個體中單一節點因主要記憶體容量而遭逐出的金鑰數量上限。
memorystore.googleapis.com/instance/stats/total_evicted_keys_count 執行個體中所有節點的主要節點因記憶體容量不足而遭逐出的鍵數。
memorystore.googleapis.com/instance/keyspace/total_keys 執行個體中儲存的索引鍵數量。
memorystore.googleapis.com/instance/stats/average_keyspace_hits 執行個體中所有節點成功查閱鍵的平均次數。
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits 執行個體中單一節點成功查閱金鑰的次數上限。
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count 執行個體成功查閱金鑰的次數。
memorystore.googleapis.com/instance/stats/average_keyspace_misses 執行個體中所有節點的平均鍵查閱失敗次數。
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses 執行個體中單一節點的金鑰查閱失敗次數上限。
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count 執行個體金鑰查閱失敗的總次數。
memorystore.googleapis.com/instance/memory/average_utilization 執行個體內所有節點的平均記憶體使用率。值介於 0.0 到 1.0 之間。
memorystore.googleapis.com/instance/memory/maximum_utilization 執行個體中單一節點的記憶體使用率上限,範圍為 0.0 到 1.0。
memorystore.googleapis.com/instance/memory/total_used_memory 執行個體的記憶體總用量。
memorystore.googleapis.com/instance/memory/size 執行個體的記憶體大小。
memorystore.googleapis.com/instance/replication/average_ack_lag 執行個體中所有節點的平均複製延遲時間 (以秒為單位)。

複製延遲時間 (以秒為單位) 表示副本落後主要節點的時間。
memorystore.googleapis.com/instance/replication/maximum_ack_lag 執行個體中單一副本的複製確認延遲時間上限 (以秒為單位)。

複製確認延遲時間 (以秒為單位) 表示複製確認落後主要執行個體的時間。
memorystore.googleapis.com/instance/replication/average_offset_diff 執行個體中所有節點的平均複製確認偏移差異 (以位元組為單位)。

複製確認偏移差異是指副本及其主要節點之間尚未複製的位元組數。
memorystore.googleapis.com/instance/replication/maximum_offset_diff 執行個體中單一節點的複製偏移差異上限 (以位元組為單位)。

複製偏移差異是指備用資源與主要資源之間尚未複製的位元組數。
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count 執行個體端點接收的連入網路位元組數。
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count 從執行個體端點傳送的連出網路位元組數。

節點層級指標

這些指標可深入瞭解執行個體中個別節點的健康狀態和效能。可協助您排解節點問題,並提升節點效能。

指標名稱 說明
memorystore.googleapis.com/instance/node/clients/connected_clients 連線至執行個體節點的用戶端數量。
memorystore.googleapis.com/instance/node/clients/blocked_clients 執行個體節點封鎖的用戶端連線數量。
memorystore.googleapis.com/instance/node/server/uptime 執行個體節點的運作時間。
memorystore.googleapis.com/instance/node/stats/connections_received_count Memorystore for Valkey 在執行個體節點上於過去一分鐘內建立的用戶端連線數。
memorystore.googleapis.com/instance/node/stats/rejected_connections_count Memorystore for Valkey 拒絕的連線數量,因為執行個體節點已達 `maxclients` 上限。
memorystore.googleapis.com/instance/node/commandstats/usec_count 執行個體節點中每個指令所耗用的時間。
memorystore.googleapis.com/instance/node/commandstats/calls_count 執行個體節點上,這個指令在一分鐘內的呼叫次數。
memorystore.googleapis.com/instance/node/cpu/utilization 執行個體節點的 CPU 使用率 (從 0.0 到 1.0)。
memorystore.googleapis.com/instance/node/stats/expired_keys_count 執行個體節點中的到期事件數。
memorystore.googleapis.com/instance/node/stats/evicted_keys_count 執行個體節點逐出的鍵數量。
memorystore.googleapis.com/instance/node/keyspace/total_keys Memorystore for Valkey 儲存在執行個體節點中的鍵數量。
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count 執行個體節點中索引鍵的成功查詢次數。
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count 執行個體節點中索引鍵的查閱失敗次數。
memorystore.googleapis.com/instance/node/memory/utilization 執行個體節點的記憶體使用率 (從 0.0 到 1.0)。
memorystore.googleapis.com/instance/node/memory/usage 執行個體節點的記憶體用量。
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count 執行個體節點接收的連入網路位元組數。
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count 執行個體節點傳送的連出網路位元組數。
memorystore.googleapis.com/instance/node/replication/offset 執行個體節點的複製偏移位元組。
memorystore.googleapis.com/instance/node/server/healthy 判斷執行個體節點是否可用且運作正常。 這項指標目前為預先發布版

跨區域複製指標

本節列出用於跨區域複製的指標。

指標名稱 說明
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links 這項指標會顯示主要和次要執行個體之間的分片連結數。在跨區域複製群組中,主要執行個體會回報與群組中次要執行個體之間的跨區域複製連結數量。對於每個次要執行個體,這個數字應等於分片數。如果數量低於分片數量,這項指標會指出複寫器與追隨者之間停止複寫時的分片數量。在理想狀態下,這個指標的數字與主要執行個體的分片數相同。
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff 這項指標會顯示主要和次要分片之間的最大複寫偏移差異。
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff 這項指標顯示主要和次要分片之間的平均複寫偏移差異。

備份指標

本節列出備份匯入指標。

執行個體層級指標

指標名稱 說明
memorystore.googleapis.com/instance/backup/last_backup_start_time 上次備份作業的開始時間。
memorystore.googleapis.com/instance/backup/last_backup_status 上次備份作業的狀態。狀態為 1 (成功) 和 0 (失敗)。
memorystore.googleapis.com/instance/backup/last_backup_duration 上次備份作業的時間長度 (以毫秒為單位)。
memorystore.googleapis.com/instance/backup/last_backup_size 上次備份的大小 (以位元組為單位)。
memorystore.googleapis.com/instance/import/last_import_start_time 上次匯入作業的開始時間。
memorystore.googleapis.com/instance/import/last_import_duration 上次匯入作業的時間長度(以毫秒為單位)。

持續性指標

本節列出留存率指標,並提供留存率指標的用途範例。

RDB 持久性指標

執行個體層級指標

指標名稱 說明
memorystore.googleapis.com/instance/persistence/load_count 執行個體中 AOF 或 RDB 持久性負載的累計次數。
memorystore.googleapis.com/instance/persistence/rdb_saves_count 執行個體擷取 RDB 快照的累計次數 (也稱為「儲存」)。這項指標有 status_code 欄位。如要檢查快照是否失敗,可以依下列錯誤篩選 status_code 欄位:3 - INTERNAL ERROR
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages 執行個體中所有節點的發布快照年齡。您希望看到延遲時間小於 (或等於) 快照頻率的值分布。
memorystore.googleapis.com/instance/persistence/rejected_writes_count 因無法保存而遭拒的寫入指令累計次數。

節點層級指標

指標名稱 說明
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress 執行個體節點正在進行 RDB BGSAVETRUE 表示正在儲存。
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status 執行個體節點上最後一次 BGSAVE 的成功狀態。TRUE 表示 BGSAVE 成功。如果沒有 bgrewrite,值可能會預設為 TRUE
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count 這項指標會顯示在執行個體節點上執行的 RDB 儲存作業累計次數。
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age 自上次成功建立快照以來經過的時間 (以秒為單位)。
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until 距離下一個快照的剩餘時間 (以秒為單位)。
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total 在執行個體節點上執行的 RDB 儲存作業中的鍵數。

AOF 持久性指標

執行個體層級指標

指標名稱 說明
memorystore.googleapis.com/instance/persistence/aof_fsync_lags 這項指標會顯示執行個體中所有節點的延遲時間分布情形 (從資料寫入到同步處理至耐久儲存空間)。只有在 appendfsync=everysec 的情況下,系統才會發出這項指標。理想情況下,您會希望看到延遲時間小於 (或等於) AOF 同步頻率的值。
memorystore.googleapis.com/instance/persistence/aof_rewrite_count 這項指標會顯示節點觸發 AOF 重寫的累計次數。這項指標有 status_code 欄位。如要檢查 AOF 重寫是否失敗,可以篩選 status_code 欄位,找出下列錯誤:3 - INTERNAL_ERROR

節點層級指標

指標名稱 說明
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status 這項指標會顯示執行個體節點上最近一次 AOF 寫入作業的成功率。TRUE 表示成功,如果未發生寫入作業,值可能會預設為 TRUE。
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status 這項指標會顯示執行個體節點上最後一次 AOF bgrewrite 作業是否成功。TRUE 代表成功,如果沒有發生 bgrewrite,值可能會預設為 TRUE。
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag 這項指標會顯示執行個體節點中,記憶體與永久儲存空間之間的 AOF 延遲。僅適用於啟用 AOF 的執行個體,且 appendfsync=EVERYSEC
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count 這項指標會顯示執行個體節點中的 AOF 重寫次數。如要檢查 AOF 重寫是否失敗,可以篩選 status_code 欄位,找出下列錯誤:3 - INTERNAL_ERROR
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count 這項指標會顯示 AOF fsync() 呼叫錯誤的計數,僅適用於啟用 AOF 的執行個體,且 appendfsync=EVERYSEC|ALWAYS。

常見的持續性指標

適用於 AOF 和 RDB 持續性機制的指標。

節點層級指標

指標名稱 說明
memorystore.googleapis.com/instance/node/persistence/auto_restore_count 這項指標會顯示從傾印檔案 (AOF 或 RDB) 還原的次數。如要檢查還原作業是否失敗,可以依下列錯誤篩選 status_code 欄位:2 - INTERNAL_ERROR

持續性指標的應用實例

檢查 AOF 寫入作業是否會導致延遲和記憶體壓力

假設您發現執行個體或執行個體內的節點延遲時間增加或記憶體用量增加,在這種情況下,您可能需要檢查額外用量是否與 AOF 持久性有關。

由於您知道 AOF 重寫作業可能會觸發暫時性負載尖峰,因此可以檢查 aof_rewrites_count 指標,瞭解執行個體或執行個體內節點的累計 AOF 重寫次數。假設這項指標顯示,重寫次數增加會導致延遲時間變長,在這種情況下,您可以降低寫入速率或增加分片數,以減少重寫頻率,解決這個問題。

檢查 RDB 儲存作業是否導致延遲和記憶體壓力

假設您發現執行個體或執行個體內的節點延遲時間增加或記憶體用量增加,在這種情況下,您可能需要檢查額外用量是否與 RDB 持久性有關。

由於您知道 RDB 儲存作業可能會觸發暫時性負載尖峰,因此可以檢查 rdb_saves_count 指標,該指標會提供執行個體或執行個體內節點在生命週期內的 RDB 儲存累計次數。假設這項指標顯示 RDB 儲存次數增加,延遲時間也會隨之增加,在這種情況下,您可以縮短 RDB 快照間隔,降低重寫頻率。您也可以擴充執行個體,降低基準負載量。

解讀 Memorystore for Valkey 的指標

如上表所示,許多指標共用三個類別:平均值、最大值和總計。

對於 Memorystore for Valkey,我們提供相同指標的平均值最大值變數,因此您可以同時使用這兩者,找出該指標系列的熱點。

指標的值是獨立的,可提供與平均值和最大值無關的洞察資料,因此與熱點分析目的無關。

瞭解平均和最高指標

假設您要比較執行個體的 average_keyspace_hitsmaximum_keyspace_hits 值。這兩項指標的差異越大,表示您執行個體中的熱點命中次數越多。理想情況下,您會將值設為介於 average_keyspace_hitsmaximum_keyspace_hits 之間,因為這表示命中次數在執行個體中分布得更平均。

這項原則適用於所有指標,包括相同指標的平均最高變體。

互動區範例

如果您比較執行個體中所有分片的 average_keyspace_hitsmaximum_keyspace_hits,比較這些值可指出發生熱點的位置。舉例來說,假設 6 個分片的執行個體有以下點擊次數:

  • 資料分割 1 - 2 命中
  • 分片 2 - 2 次命中
  • Shard 3 - 2 hits
  • 分片 4 - 2 次命中
  • Shard 5 - 2 hits
  • 第 6 到 8 個分片

在本例中,average_keyspace_hits 會傳回值 3,而 maximum_keyspace_hits 會傳回 8,表示分片 6 很熱。

我們提供節點層級的指標,有助於找出執行個體內的熱點。