Aprende cómo se estructuran los datos de CrUX en BigQuery.
Introducción
Los datos sin procesar detrás de Chrome UX Report (CrUX) están disponibles en BigQuery, una base de datos alojada en Google Cloud.
CrUX en BigQuery permite a los usuarios consultar directamente el conjunto de datos completo desde 2017, por ejemplo, para analizar tendencias, comparar tecnologías web y comparar dominios.
Los datos se estructuran por versión mensual, además de una serie de tablas de resumen para proporcionar un acceso más rápido a la hora de consultar los datos.
Los datos de BigQuery son la base del panel de CrUX, que te permite visualizar estos datos sin escribir consultas en SQL.
Cómo acceder al conjunto de datos
Para usar BigQuery, se requiere una cuenta de Google Cloud y conocimientos básicos de SQL. Se puede acceder al conjunto de datos de CrUX en BigQuery y explorarlo de forma gratuita hasta los límites del nivel gratuito, que BigQuery renueva mensualmente. Además, es posible que los usuarios nuevos de Google Cloud cumplan con los requisitos para obtener un crédito de registro que cubra los gastos más allá del nivel gratuito. Ten en cuenta que se debe proporcionar una tarjeta de crédito para el proyecto de Google Cloud. Consulta ¿Por qué debo proporcionar una tarjeta de crédito?.
Si es la primera vez que usas BigQuery, sigue estos pasos para configurar un proyecto:
- Navega a Crear un proyecto en la consola de Google Cloud.
- Asigna un nombre a tu proyecto nuevo, como "Mi informe de UX de Chrome", y haz clic en Crear.
- Proporciona tus datos de facturación si se te solicitan.
- Navega al conjunto de datos de CrUX en BigQuery
Ahora puedes comenzar a consultar el conjunto de datos.
Organización del proyecto
Los datos de CrUX en BigQuery se publican el segundo martes del mes siguiente. Cada mes se lanza como una tabla nueva en chrome-ux-report.all
. También hay varias tablas materializadas que proporcionan estadísticas resumidas para cada mes.
- `chrome-ux-report
Esquema detallado de la tabla
Las tablas sin procesar de cada país y el conjunto de datos de all
se proporcionan por año y mes.
Tablas sin procesar
Las tablas sin procesar tienen el siguiente esquema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Esquema de tabla materializada
Se proporcionan tablas materializadas para facilitar el acceso a los datos resumidos por una serie de dimensiones clave. No se proporcionan histogramas, sino que los datos de rendimiento se agregan en fracciones según la evaluación del rendimiento y el valor del percentil 75. En este ejemplo, se muestra un conjunto de filas de ejemplo de la tabla metrics_summary
:
aaaamm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
Esto muestra que, en el conjunto de datos de 202204, el 90.56% de las experiencias de usuarios reales en https://example.com
cumplieron con los criterios para un LCP bueno y que el valor aproximado del percentil 75 del LCP fue de 1,600 ms. Esto es un poco más lento que en los meses anteriores.
Se proporcionan cuatro tablas materializadas:
metrics_summary
- Métricas clave por mes y origen
device_summary
- Métricas clave por mes, origen y tipo de dispositivo
country_summary
- Métricas clave por mes, origen, tipo de dispositivo y país
origin_summary
- una lista de todos los orígenes incluidos en el conjunto de datos
metrics_summary
La tabla metrics_summary
contiene estadísticas de resumen para cada origen y cada conjunto de datos mensual:
yyyymm
- Mes del período de recopilación de datos
origin
- URL del origen del sitio
rank
- Clasificación aproximada de popularidad (a partir de marzo de 2021)
[small|medium|large]_cls
- Fracción del tráfico por umbrales de CLS
[fast|avg|slow]_<metric>
- Fracción del tráfico según los umbrales de rendimiento
[low|medium|high]_rtt
- Fracción del tráfico por umbrales de RTT
p75_<metric>
- Valor del percentil 75 de las métricas de rendimiento (milisegundos)
notification_permission_[accept|deny|ignore|dismiss]
- fracción de comportamientos de permisos de notificaciones
[desktop|phone|tablet]Density
- fracción del tráfico por factor de forma
[_4G|_3G|_2G|slow2G|offline]Density
- Fracción del tráfico por tipo de conexión efectiva (calculada a partir de los histogramas de
rtt
desde febrero de 2025, sin conexión) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- fracción de tipos de navegación
device_summary
La tabla device_summary
contiene estadísticas agregadas por mes, origen, país y dispositivo. Además de las columnas metrics_summary
, se incluyen las siguientes:
device
- Factor de forma del dispositivo
country_summary
La tabla country_summary
contiene estadísticas agregadas por mes, origen, país y dispositivo. Además de las columnas metrics_summary
, se incluyen las siguientes:
country_code
- Código de país de dos letras
device
- Factor de forma del dispositivo
origin_summary
La tabla origin_summary
contiene una lista de todos los orígenes del conjunto de datos de CrUX. Se actualiza mensualmente con la lista más reciente de orígenes del conjunto de datos y tiene una sola columna: origin
.
Conjunto de datos experimental
Las tablas del conjunto de datos experimental son copias exactas de las tablas predeterminadas de YYYYMM
, pero utilizan funciones más nuevas y avanzadas de BigQuery, como la partición y el agrupamiento en clústeres, que te permiten escribir consultas más rápidas, sencillas y económicas.
country
El conjunto de datos experimental.country
contiene datos agregados de los conjuntos de datos country_CC
con una columna yyyymm
adicional para la fecha del conjunto de datos. El esquema es idéntico al de las tablas sin procesar, con la adición de las columnas de fecha y country_code
, lo que permite ejecutar consultas de comparación a lo largo del tiempo a nivel del país sin unir las tablas mensuales.
global
El conjunto de datos experimental.global
contiene datos agregados del conjunto de datos all
con una columna yyyymm
adicional para la fecha del conjunto de datos. El esquema es idéntico al de las tablas sin procesar, con la adición de la fecha, lo que permite ejecutar consultas de comparación a lo largo del tiempo sin unir las tablas mensuales.