CrUX in BigQuery

Hier erfahren Sie, wie CrUX-Daten in BigQuery strukturiert sind.

Einführung

Die Rohdaten des Chrome UX Report (CrUX) sind in BigQuery verfügbar, einer in Google Cloud gehosteten Datenbank.

Mit CrUX auf BigQuery können Nutzer den gesamten Datensatz seit 2017 direkt abfragen, um beispielsweise Trends zu analysieren, Webtechnologien zu vergleichen und Domains zu vergleichen.

Die Daten sind nach monatlicher Veröffentlichung strukturiert. Außerdem gibt es eine Reihe von Zusammenfassungstabellen, die einen schnelleren Zugriff auf die Daten ermöglichen.

Die BigQuery-Daten sind die Grundlage des CrUX-Dashboards, mit dem Sie diese Daten visualisieren können, ohne SQL-Abfragen schreiben zu müssen.

Auf Dataset zugreifen

Für die Verwendung von BigQuery sind ein Google Cloud-Konto und grundlegende SQL-Kenntnisse erforderlich. Auf das CrUX-Dataset in BigQuery kann kostenlos zugegriffen und es kann bis zu den Limits der kostenlosen Stufe genutzt werden. Diese wird monatlich von BigQuery erneuert. Außerdem erhalten neue Google Cloud-Nutzer möglicherweise ein Anmeldeguthaben, um Ausgaben zu decken, die über das kostenlose Kontingent hinausgehen. Für das Google Cloud-Projekt muss eine Kreditkarte angegeben werden. Weitere Informationen finden Sie unter Warum muss ich eine Kreditkarte angeben?.

Wenn Sie BigQuery zum ersten Mal verwenden, gehen Sie so vor, um ein Projekt einzurichten:

  1. Rufen Sie in der Google Cloud Console die Seite Projekt erstellen auf.
  2. Geben Sie Ihrem neuen Projekt einen Namen wie „Mein Chrome UX-Bericht“ und klicken Sie auf „Erstellen“.
  3. Geben Sie Ihre Zahlungsinformationen an, wenn Sie dazu aufgefordert werden.
  4. CrUX-Dataset in BigQuery aufrufen

Jetzt können Sie mit dem Abfragen des Datasets beginnen.

Projekte organisieren

CrUX-Daten in BigQuery werden am zweiten Dienstag des Folgemonats veröffentlicht. Jeder Monat wird als neue Tabelle unter chrome-ux-report.all veröffentlicht. Außerdem gibt es eine Reihe von materialisierten Tabellen mit zusammenfassenden Statistiken für jeden Monat.

Detailliertes Tabellenschema

Die Rohdatentabellen für jedes Land und das Dataset all werden nach Jahr und Monat bereitgestellt.

Rohdatentabellen

Die Rohdatentabellen haben das folgende Schema:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schema der materialisierten Tabelle

Materialisierte Tabellen ermöglichen einen einfacheren Zugriff auf zusammengefasste Daten nach einer Reihe von wichtigen Dimensionen. Es werden keine Histogramme bereitgestellt. Stattdessen werden Leistungsdaten nach Leistungsbewertung und 75. Perzentilwert in Fraktionen aggregiert. In diesem Beispiel sehen Sie einige Beispielzeilen aus der Tabelle metrics_summary:

jjjjmm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0.0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Das bedeutet, dass im Dataset 202204 90,56% der Nutzererfahrungen auf https://example.com die Kriterien für einen guten LCP erfüllt haben und der grobe LCP-Wert des 75. Perzentils 1.600 ms betrug. Das ist etwas langsamer als in den Vormonaten.

Es sind vier materialisierte Tabellen verfügbar:

metrics_summary
wichtige Messwerte nach Monat und Herkunft
device_summary
wichtige Messwerte nach Monat, Herkunft und Gerätetyp
country_summary
wichtige Messwerte nach Monat, Herkunft, Gerätetyp und Land
origin_summary
eine Liste aller im Dataset enthaltenen Ursprünge

metrics_summary

Die Tabelle metrics_summary enthält zusammenfassende Statistiken für jeden Ursprung und jedes monatliche Dataset:

yyyymm
Monat des Datenerfassungszeitraums
origin
URL des Website-Ursprungs
rank
Grobe Beliebtheitsrangfolge (Stand: März 2021)
[small|medium|large]_cls
Anteil des Traffics nach CLS-Grenzwerten
[fast|avg|slow]_<metric>
Anteil des Traffics nach Leistungsschwellen
[low|medium|high]_rtt
Anteil des Traffics nach RTT-Grenzwerten
p75_<metric>
Wert des 75. Perzentils der Leistungsmesswerte (Millisekunden)
notification_permission_[accept|deny|ignore|dismiss]
Anteil der Verhaltensweisen bei der Berechtigung zum Senden von Benachrichtigungen
[desktop|phone|tablet]Density
Anteil des Traffics nach Formfaktor
[_4G|_3G|_2G|slow2G|offline]Density
Anteil des Traffics nach effektivem Verbindungstyp (berechnet aus rtt-Histogrammen ab Februar 2025, ohne Offline)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
Anteil der Navigationstypen

device_summary

Die Tabelle device_summary enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary-Spalten gibt es:

device
Formfaktor des Geräts

country_summary

Die Tabelle country_summary enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary-Spalten gibt es:

country_code
Ländercode mit zwei Buchstaben
device
Formfaktor des Geräts

origin_summary

Die Tabelle origin_summary enthält eine Liste aller Ursprünge im CrUX-Dataset. Sie wird monatlich mit der neuesten Liste der Ursprünge im Dataset aktualisiert und hat eine einzelne Spalte: origin.

Experimentelles Dataset

Die Tabellen im experimentellen Dataset sind exakte Kopien der Standardtabellen YYYYMM. Sie nutzen jedoch neuere und fortschrittlichere BigQuery-Funktionen wie Partitionierung und Clustering, mit denen Sie schnellere, einfachere und kostengünstigere Abfragen schreiben können.

country

Das Dataset experimental.country enthält zusammengefasste Daten aus den Datasets country_CC mit einer zusätzlichen Spalte yyyymm für das Dataset-Datum. Das Schema ist identisch mit dem von Rohdatentabellen. Es enthält zusätzlich die Spalten „date“ und country_code. So können Vergleiche auf Länderebene über Zeitabfragen hinweg ausgeführt werden, ohne dass die monatlichen Tabellen verknüpft werden müssen.

global

Das Dataset experimental.global enthält aggregierte Daten aus dem Dataset all mit einer zusätzlichen Spalte yyyymm für das Dataset-Datum. Das Schema ist identisch mit dem von Rohdatentabellen. Es wird jedoch das Datum hinzugefügt, sodass Zeitvergleichsabfragen ausgeführt werden können, ohne die monatlichen Tabellen zu verknüpfen.