Dokumen ini menjelaskan cara mengonfigurasi deployment Google Kubernetes Engine Anda sehingga Anda dapat menggunakan Google Cloud Managed Service for Prometheus untuk mengumpulkan metrik dari TorchServe. Dokumen ini menunjukkan cara melakukan hal berikut:
- Siapkan TorchServe untuk melaporkan metrik.
- Konfigurasi resource PodMonitoring untuk Managed Service for Prometheus guna mengumpulkan metrik yang diekspor.
- Akses dasbor di Cloud Monitoring untuk melihat metrik.
Petunjuk ini hanya berlaku jika Anda menggunakan koleksi terkelola dengan Managed Service for Prometheus. Jika Anda menggunakan pengumpulan yang di-deploy sendiri, lihat dokumentasi TorchServe untuk mengetahui informasi penginstalan.
Petunjuk ini diberikan sebagai contoh dan diharapkan berfungsi di sebagian besar lingkungan Kubernetes. Jika Anda mengalami masalah saat menginstal aplikasi atau eksportir karena kebijakan keamanan atau organisasi yang ketat, sebaiknya lihat dokumentasi open source untuk mendapatkan dukungan.
Untuk mengetahui informasi tentang TorchServe, lihat TorchServe. Untuk mengetahui informasi tentang cara menyiapkan TorchServe di Google Kubernetes Engine, lihat panduan GKE untuk TorchServe.
Prasyarat
Untuk mengumpulkan metrik dari TorchServe dengan menggunakan Managed Service for Prometheus dan pengumpulan terkelola, deployment Anda harus memenuhi persyaratan berikut:
- Cluster Anda harus menjalankan Google Kubernetes Engine versi 1.21.4-gke.300 atau yang lebih baru.
- Anda harus menjalankan Managed Service for Prometheus dengan koleksi terkelola yang diaktifkan. Untuk mengetahui informasi selengkapnya, lihat Mulai menggunakan koleksi terkelola.
metrics_mode
ditentukan dalam file config.properties
atau sebagai
variabel lingkungan.
Jika Anda menyiapkan TorchServe sendiri, sebaiknya lakukan penambahan berikut ke file config.properties
Anda.
Jika Anda mengikuti dokumen Google Kubernetes Engine Menayangkan LLM yang skalabel di GKE dengan TorchServe, penambahan ini adalah bagian dari penyiapan default.
Selain itu, saat men-deploy image ini ke GKE, ubah deployment dan layanan YAML untuk mengekspos port metrik yang ditambahkan:
Untuk memverifikasi bahwa TorchServe memancarkan metrik pada endpoint yang diharapkan, lakukan hal berikut:
- Siapkan penerusan port menggunakan perintah berikut:
kubectl -n NAMESPACE_NAME port-forward SERVICE_NAME 8082
- Akses endpoint
localhost:8082/metrics
menggunakan browser atau utilitascurl
di sesi terminal lain.
Tentukan resource PodMonitoring
Untuk penemuan target, Managed Service for Prometheus Operator memerlukan resource PodMonitoring yang sesuai dengan TorchServe di namespace yang sama.
Anda dapat menggunakan konfigurasi PodMonitoring berikut:
Pastikan nilai kolomport
dan matchLabels
cocok dengan pod TorchServe yang ingin Anda pantau.
Untuk menerapkan perubahan konfigurasi dari file lokal, jalankan perintah berikut:
kubectl apply -n NAMESPACE_NAME -f FILE_NAME
Anda juga dapat menggunakan Terraform untuk mengelola konfigurasi.
Memverifikasi konfigurasi
Anda dapat menggunakan Penjelajah Metrik untuk memverifikasi bahwa Anda telah mengonfigurasi TorchServe dengan benar. Mungkin perlu waktu satu atau dua menit agar Cloud Monitoring dapat menyerap metrik Anda.
Untuk memverifikasi bahwa metrik telah di-ingest, lakukan hal berikut:
-
Di konsol Google Cloud , buka halaman leaderboard Metrics explorer:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Di toolbar panel pembuat kueri, pilih tombol yang namanya code MQL atau code PromQL.
- Pastikan PromQL dipilih di tombol Language. Tombol bahasa ada di toolbar yang sama yang memungkinkan Anda memformat kueri.
- Masukkan dan jalankan kueri berikut:
up{job="torchserve", cluster="CLUSTER_NAME", namespace="NAMESPACE_NAME"}
Melihat dasbor
Integrasi Cloud Monitoring mencakup dasbor TorchServe Prometheus Overview. Dasbor akan otomatis diinstal saat Anda mengonfigurasi integrasi. Anda juga dapat melihat pratinjau statis dasbor tanpa menginstal integrasi.
Untuk melihat dasbor yang terinstal, lakukan tindakan berikut:
-
Di konsol Google Cloud , buka halaman
Dasbor:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Pilih tab Daftar Dasbor.
- Pilih kategori Integrasi.
- Klik nama dasbor, misalnya, TorchServe Prometheus Overview.
Untuk melihat pratinjau statis dasbor, lakukan tindakan berikut:
-
Di konsol Google Cloud , buka halaman
Integrations:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Klik filter platform deployment Kubernetes Engine.
- Temukan integrasi TorchServe, lalu klik Lihat Detail.
- Pilih tab Dasbor.
Pemecahan masalah
Untuk mengetahui informasi tentang cara memecahkan masalah penyerapan metrik, lihat Masalah pengumpulan dari eksportir di Memecahkan masalah sisi penyerapan.