Hier erfahren Sie, wie CrUX-Daten in BigQuery strukturiert sind.
Einführung
Die Rohdaten des Chrome UX Report (CrUX) sind in BigQuery verfügbar, einer in Google Cloud gehosteten Datenbank.
Mit CrUX auf BigQuery können Nutzer den gesamten Datensatz seit 2017 direkt abfragen, um beispielsweise Trends zu analysieren, Webtechnologien zu vergleichen und Domains zu vergleichen.
Die Daten sind nach monatlicher Veröffentlichung strukturiert. Außerdem gibt es eine Reihe von Zusammenfassungstabellen, die einen schnelleren Zugriff auf die Daten ermöglichen.
Die BigQuery-Daten sind die Grundlage des CrUX-Dashboards, mit dem Sie diese Daten visualisieren können, ohne SQL-Abfragen schreiben zu müssen.
Auf Dataset zugreifen
Für die Verwendung von BigQuery sind ein Google Cloud-Konto und grundlegende SQL-Kenntnisse erforderlich. Auf das CrUX-Dataset in BigQuery kann kostenlos zugegriffen und es kann bis zu den Limits der kostenlosen Stufe genutzt werden. Diese wird monatlich von BigQuery erneuert. Außerdem erhalten neue Google Cloud-Nutzer möglicherweise ein Anmeldeguthaben, um Ausgaben zu decken, die über das kostenlose Kontingent hinausgehen. Für das Google Cloud-Projekt muss eine Kreditkarte angegeben werden. Weitere Informationen finden Sie unter Warum muss ich eine Kreditkarte angeben?.
Wenn Sie BigQuery zum ersten Mal verwenden, gehen Sie so vor, um ein Projekt einzurichten:
- Rufen Sie in der Google Cloud Console die Seite Projekt erstellen auf.
- Geben Sie Ihrem neuen Projekt einen Namen wie „Mein Chrome UX-Bericht“ und klicken Sie auf „Erstellen“.
- Geben Sie Ihre Zahlungsinformationen an, wenn Sie dazu aufgefordert werden.
- CrUX-Dataset in BigQuery aufrufen
Jetzt können Sie mit dem Abfragen des Datasets beginnen.
Projekte organisieren
CrUX-Daten in BigQuery werden am zweiten Dienstag des Folgemonats veröffentlicht. Jeder Monat wird als neue Tabelle unter chrome-ux-report.all
veröffentlicht. Außerdem gibt es eine Reihe von materialisierten Tabellen mit zusammenfassenden Statistiken für jeden Monat.
- `chrome-ux-report
Detailliertes Tabellenschema
Die Rohdatentabellen für jedes Land und das Dataset all
werden nach Jahr und Monat bereitgestellt.
Rohdatentabellen
Die Rohdatentabellen haben das folgende Schema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schema der materialisierten Tabelle
Materialisierte Tabellen ermöglichen einen einfacheren Zugriff auf zusammengefasste Daten nach einer Reihe von wichtigen Dimensionen. Es werden keine Histogramme bereitgestellt. Stattdessen werden Leistungsdaten nach Leistungsbewertung und 75. Perzentilwert in Fraktionen aggregiert. In diesem Beispiel sehen Sie einige Beispielzeilen aus der Tabelle metrics_summary
:
jjjjmm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0.0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Das bedeutet, dass im Dataset 202204 90,56% der Nutzererfahrungen auf https://example.com
die Kriterien für einen guten LCP erfüllt haben und der grobe LCP-Wert des 75. Perzentils 1.600 ms betrug. Das ist etwas langsamer als in den Vormonaten.
Es sind vier materialisierte Tabellen verfügbar:
metrics_summary
- wichtige Messwerte nach Monat und Herkunft
device_summary
- wichtige Messwerte nach Monat, Herkunft und Gerätetyp
country_summary
- wichtige Messwerte nach Monat, Herkunft, Gerätetyp und Land
origin_summary
- eine Liste aller im Dataset enthaltenen Ursprünge
metrics_summary
Die Tabelle metrics_summary
enthält zusammenfassende Statistiken für jeden Ursprung und jedes monatliche Dataset:
yyyymm
- Monat des Datenerfassungszeitraums
origin
- URL des Website-Ursprungs
rank
- Grobe Beliebtheitsrangfolge (Stand: März 2021)
[small|medium|large]_cls
- Anteil des Traffics nach CLS-Grenzwerten
[fast|avg|slow]_<metric>
- Anteil des Traffics nach Leistungsschwellen
[low|medium|high]_rtt
- Anteil des Traffics nach RTT-Grenzwerten
p75_<metric>
- Wert des 75. Perzentils der Leistungsmesswerte (Millisekunden)
notification_permission_[accept|deny|ignore|dismiss]
- Anteil der Verhaltensweisen bei der Berechtigung zum Senden von Benachrichtigungen
[desktop|phone|tablet]Density
- Anteil des Traffics nach Formfaktor
[_4G|_3G|_2G|slow2G|offline]Density
- Anteil des Traffics nach effektivem Verbindungstyp (berechnet aus
rtt
-Histogrammen ab Februar 2025, ohne Offline) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- Anteil der Navigationstypen
device_summary
Die Tabelle device_summary
enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary
-Spalten gibt es:
device
- Formfaktor des Geräts
country_summary
Die Tabelle country_summary
enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary
-Spalten gibt es:
country_code
- Ländercode mit zwei Buchstaben
device
- Formfaktor des Geräts
origin_summary
Die Tabelle origin_summary
enthält eine Liste aller Ursprünge im CrUX-Dataset. Sie wird monatlich mit der neuesten Liste der Ursprünge im Dataset aktualisiert und hat eine einzelne Spalte: origin
.
Experimentelles Dataset
Die Tabellen im experimentellen Dataset sind exakte Kopien der Standardtabellen YYYYMM
. Sie nutzen jedoch neuere und fortschrittlichere BigQuery-Funktionen wie Partitionierung und Clustering, mit denen Sie schnellere, einfachere und kostengünstigere Abfragen schreiben können.
country
Das Dataset experimental.country
enthält zusammengefasste Daten aus den Datasets country_CC
mit einer zusätzlichen Spalte yyyymm
für das Dataset-Datum. Das Schema ist identisch mit dem von Rohdatentabellen. Es enthält zusätzlich die Spalten „date“ und country_code
. So können Vergleiche auf Länderebene über Zeitabfragen hinweg ausgeführt werden, ohne dass die monatlichen Tabellen verknüpft werden müssen.
global
Das Dataset experimental.global
enthält aggregierte Daten aus dem Dataset all
mit einer zusätzlichen Spalte yyyymm
für das Dataset-Datum. Das Schema ist identisch mit dem von Rohdatentabellen. Es wird jedoch das Datum hinzugefügt, sodass Zeitvergleichsabfragen ausgeführt werden können, ohne die monatlichen Tabellen zu verknüpfen.