CrUX w BigQuery

Dowiedz się, jak dane CrUX są uporządkowane w BigQuery.

Wprowadzenie

Surowe dane z Raportu UX Chrome (CrUX) są dostępne w BigQuery, bazie danych hostowanej w Google Cloud.

CrUX w BigQuery umożliwia użytkownikom bezpośrednie wysyłanie zapytań do pełnego zbioru danych z okresu od 2017 r., np. w celu analizowania trendów, porównywania technologii internetowych i wyznaczania wartości referencyjnych dla domen.

Dane są uporządkowane według comiesięcznych wydań, a także w postaci kilku tabel podsumowujących, które umożliwiają szybsze wysyłanie zapytań.

Dane BigQuery są podstawą panelu CrUX, który umożliwia wizualizację tych danych bez pisania zapytań SQL.

Dostęp do zbioru danych

Korzystanie z BigQuery wymaga konta Google Cloud i podstawowej znajomości SQL. Zbiór danych CrUX w BigQuery jest dostępny bezpłatnie w ramach limitów bezpłatnego poziomu, który jest odnawiany co miesiąc i udostępniany przez BigQuery. Dodatkowo nowi użytkownicy Google Cloud mogą otrzymać środki na rejestrację, które pokryją wydatki wykraczające poza bezpłatny poziom. Pamiętaj, że w przypadku projektu Google Cloud musisz podać kartę kredytową. Więcej informacji znajdziesz w sekcji Dlaczego muszę podać kartę kredytową?.

Jeśli korzystasz z BigQuery po raz pierwszy, wykonaj te czynności, aby skonfigurować projekt:

  1. Otwórz Utwórz projekt w konsoli Google Cloud.
  2. Nadaj nowemu projektowi nazwę, np. „Mój raport UX Chrome”, i kliknij Utwórz.
  3. W razie potrzeby podaj informacje rozliczeniowe.
  4. Otwórz zbiór danych CrUX w BigQuery.

Możesz teraz zacząć wysyłać zapytania do zbioru danych.

Organizacja projektu

Dane CrUX w BigQuery są udostępniane w drugi wtorek następnego miesiąca. Każdy miesiąc jest publikowany jako nowa tabela w sekcji chrome-ux-report.all. Istnieje też kilka zmaterializowanych tabel, które zawierają statystyki podsumowujące za każdy miesiąc.

Szczegółowy schemat tabeli

Surowe tabele dla poszczególnych krajów i zbiór danych all są udostępniane według roku i miesiąca.

Tabele nieprzetworzone

Tabele surowe mają ten schemat:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schemat tabeli zmaterializowanej

Tabele zmaterializowane zapewniają łatwiejszy dostęp do danych podsumowujących według kilku kluczowych wymiarów. Nie są podawane histogramy, tylko dane o wydajności są agregowane w postaci ułamków według oceny wydajności i wartości 75 percentyla. W tym przykładzie pokazano zestaw przykładowych wierszy z tabeli metrics_summary:

rrrrmm pochodzenie fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Wynika z tego, że w zbiorze danych z kwietnia 2022 r. 90, 56% wrażeń użytkowników na stronie https://example.com spełniało kryteria dobrego LCP,a przybliżona wartość 75. percentyla LCP wynosiła 1600 ms. Jest to nieco wolniejsze niż w poprzednich miesiącach.

Dostępne są 4 zmaterializowane tabele:

metrics_summary
kluczowe dane według miesiąca i źródła
,
device_summary
kluczowe dane według miesiąca, źródła i typu urządzenia
country_summary
kluczowe dane według miesiąca, źródła, typu urządzenia i kraju
;
origin_summary
lista wszystkich źródeł uwzględnionych w zbiorze danych

metrics_summary

Tabela metrics_summary zawiera statystyki podsumowujące dla każdego pochodzenia i każdego miesięcznego zbioru danych:

yyyymm
Miesiąc okresu gromadzenia danych
origin
Adres URL źródła witryny
rank
Ogólna lista popularności (stan na marzec 2021 r.)
[small|medium|large]_cls
odsetek ruchu według progów CLS
[fast|avg|slow]_<metric>
odsetek ruchu według progów skuteczności
[low|medium|high]_rtt
odsetek ruchu według progów RTT
p75_<metric>
Wartość 75 percentyla danych dotyczących skuteczności (w milisekundach)
notification_permission_[accept|deny|ignore|dismiss]
odsetek zachowań związanych z uprawnieniami do powiadomień
[desktop|phone|tablet]Density
udział ruchu według formatu
[_4G|_3G|_2G|slow2G|offline]Density
odsetek ruchu według efektywnego typu połączenia (obliczonego na podstawie rtt histogramów z lutego 2025 r. bez trybu offline)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
odsetek typów nawigacji

device_summary

Tabela device_summary zawiera zbiorcze statystyki według miesiąca, źródła, kraju i urządzenia. Oprócz kolumn metrics_summary są też:

device
Format urządzenia

country_summary

Tabela country_summary zawiera zbiorcze statystyki według miesiąca, źródła, kraju i urządzenia. Oprócz kolumn metrics_summary są też:

country_code
Dwuliterowy kod kraju
device
Format urządzenia

origin_summary

Tabela origin_summary zawiera listę wszystkich punktów początkowych w zbiorze danych CrUX. Jest ona aktualizowana co miesiąc o najnowszą listę punktów początkowych w zbiorze danych i ma jedną kolumnę: origin.

Eksperymentalny zbiór danych

Tabele w eksperymentalnym zbiorze danych są dokładnymi kopiami domyślnych tabel YYYYMM, ale korzystają z nowszych i bardziej zaawansowanych funkcji BigQuery, takich jak partycjonowanie i klastrowanie, które umożliwiają pisanie szybszych, prostszych i tańszych zapytań.

country

Zbiór danych experimental.country zawiera zagregowane dane ze zbiorów danych country_CC z dodatkową kolumną yyyymm z datą zbioru danych. Schemat jest identyczny jak w przypadku tabel surowych, ale zawiera dodatkowo kolumny daty i country_code, co umożliwia wykonywanie zapytań dotyczących porównań na poziomie kraju w czasie bez łączenia tabel miesięcznych.

global

Zbiór danych experimental.global zawiera zagregowane dane ze zbioru danych all z dodatkową kolumną yyyymm z datą zbioru danych. Schemat jest identyczny jak w przypadku tabel surowych, ale zawiera dodatkowo datę, co umożliwia wykonywanie zapytań porównujących dane w czasie bez łączenia tabel miesięcznych.