Dowiedz się, jak dane CrUX są uporządkowane w BigQuery.
Wprowadzenie
Surowe dane z Raportu UX Chrome (CrUX) są dostępne w BigQuery, bazie danych hostowanej w Google Cloud.
CrUX w BigQuery umożliwia użytkownikom bezpośrednie wysyłanie zapytań do pełnego zbioru danych z okresu od 2017 r., np. w celu analizowania trendów, porównywania technologii internetowych i wyznaczania wartości referencyjnych dla domen.
Dane są uporządkowane według comiesięcznych wydań, a także w postaci kilku tabel podsumowujących, które umożliwiają szybsze wysyłanie zapytań.
Dane BigQuery są podstawą panelu CrUX, który umożliwia wizualizację tych danych bez pisania zapytań SQL.
Dostęp do zbioru danych
Korzystanie z BigQuery wymaga konta Google Cloud i podstawowej znajomości SQL. Zbiór danych CrUX w BigQuery jest dostępny bezpłatnie w ramach limitów bezpłatnego poziomu, który jest odnawiany co miesiąc i udostępniany przez BigQuery. Dodatkowo nowi użytkownicy Google Cloud mogą otrzymać środki na rejestrację, które pokryją wydatki wykraczające poza bezpłatny poziom. Pamiętaj, że w przypadku projektu Google Cloud musisz podać kartę kredytową. Więcej informacji znajdziesz w sekcji Dlaczego muszę podać kartę kredytową?.
Jeśli korzystasz z BigQuery po raz pierwszy, wykonaj te czynności, aby skonfigurować projekt:
- Otwórz Utwórz projekt w konsoli Google Cloud.
- Nadaj nowemu projektowi nazwę, np. „Mój raport UX Chrome”, i kliknij Utwórz.
- W razie potrzeby podaj informacje rozliczeniowe.
- Otwórz zbiór danych CrUX w BigQuery.
Możesz teraz zacząć wysyłać zapytania do zbioru danych.
Organizacja projektu
Dane CrUX w BigQuery są udostępniane w drugi wtorek następnego miesiąca. Każdy miesiąc jest publikowany jako nowa tabela w sekcji chrome-ux-report.all
. Istnieje też kilka zmaterializowanych tabel, które zawierają statystyki podsumowujące za każdy miesiąc.
- `chrome-ux-report
Szczegółowy schemat tabeli
Surowe tabele dla poszczególnych krajów i zbiór danych all
są udostępniane według roku i miesiąca.
Tabele nieprzetworzone
Tabele surowe mają ten schemat:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schemat tabeli zmaterializowanej
Tabele zmaterializowane zapewniają łatwiejszy dostęp do danych podsumowujących według kilku kluczowych wymiarów. Nie są podawane histogramy, tylko dane o wydajności są agregowane w postaci ułamków według oceny wydajności i wartości 75 percentyla. W tym przykładzie pokazano zestaw przykładowych wierszy z tabeli metrics_summary
:
rrrrmm | pochodzenie | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Wynika z tego, że w zbiorze danych z kwietnia 2022 r. 90, 56% wrażeń użytkowników na stronie https://example.com
spełniało kryteria dobrego LCP,a przybliżona wartość 75. percentyla LCP wynosiła 1600 ms. Jest to nieco wolniejsze niż w poprzednich miesiącach.
Dostępne są 4 zmaterializowane tabele:
metrics_summary
- kluczowe dane według miesiąca i źródła ,
device_summary
- kluczowe dane według miesiąca, źródła i typu urządzenia
country_summary
- kluczowe dane według miesiąca, źródła, typu urządzenia i kraju ;
origin_summary
- lista wszystkich źródeł uwzględnionych w zbiorze danych
metrics_summary
Tabela metrics_summary
zawiera statystyki podsumowujące dla każdego pochodzenia i każdego miesięcznego zbioru danych:
yyyymm
- Miesiąc okresu gromadzenia danych
origin
- Adres URL źródła witryny
rank
- Ogólna lista popularności (stan na marzec 2021 r.)
[small|medium|large]_cls
- odsetek ruchu według progów CLS
[fast|avg|slow]_<metric>
- odsetek ruchu według progów skuteczności
[low|medium|high]_rtt
- odsetek ruchu według progów RTT
p75_<metric>
- Wartość 75 percentyla danych dotyczących skuteczności (w milisekundach)
notification_permission_[accept|deny|ignore|dismiss]
- odsetek zachowań związanych z uprawnieniami do powiadomień
[desktop|phone|tablet]Density
- udział ruchu według formatu
[_4G|_3G|_2G|slow2G|offline]Density
- odsetek ruchu według efektywnego typu połączenia (obliczonego na podstawie
rtt
histogramów z lutego 2025 r. bez trybu offline) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- odsetek typów nawigacji
device_summary
Tabela device_summary
zawiera zbiorcze statystyki według miesiąca, źródła, kraju i urządzenia. Oprócz kolumn metrics_summary
są też:
device
- Format urządzenia
country_summary
Tabela country_summary
zawiera zbiorcze statystyki według miesiąca, źródła, kraju i urządzenia. Oprócz kolumn metrics_summary
są też:
country_code
- Dwuliterowy kod kraju
device
- Format urządzenia
origin_summary
Tabela origin_summary
zawiera listę wszystkich punktów początkowych w zbiorze danych CrUX. Jest ona aktualizowana co miesiąc o najnowszą listę punktów początkowych w zbiorze danych i ma jedną kolumnę: origin
.
Eksperymentalny zbiór danych
Tabele w eksperymentalnym zbiorze danych są dokładnymi kopiami domyślnych tabel YYYYMM
, ale korzystają z nowszych i bardziej zaawansowanych funkcji BigQuery, takich jak partycjonowanie i klastrowanie, które umożliwiają pisanie szybszych, prostszych i tańszych zapytań.
country
Zbiór danych experimental.country
zawiera zagregowane dane ze zbiorów danych country_CC
z dodatkową kolumną yyyymm
z datą zbioru danych. Schemat jest identyczny jak w przypadku tabel surowych, ale zawiera dodatkowo kolumny daty i country_code
, co umożliwia wykonywanie zapytań dotyczących porównań na poziomie kraju w czasie bez łączenia tabel miesięcznych.
global
Zbiór danych experimental.global
zawiera zagregowane dane ze zbioru danych all
z dodatkową kolumną yyyymm
z datą zbioru danych. Schemat jest identyczny jak w przypadku tabel surowych, ale zawiera dodatkowo datę, co umożliwia wykonywanie zapytań porównujących dane w czasie bez łączenia tabel miesięcznych.