Prácticas recomendadas para la estructura de las URLs en la Búsqueda de Google
Para que la Búsqueda de Google pueda rastrear tu sitio de forma eficaz, debes usar una estructura de URL rastreable que cumpla los siguientes requisitos. Si tus URLs no cumplen los criterios que se indican a continuación, es probable que la Búsqueda de Google rastree tu sitio de forma ineficiente, lo que puede incluir, entre otros, tasas de rastreo extremadamente altas o que no se produzca ningún rastreo.
Requisitos de una estructura de URL rastreable | |||||||
---|---|---|---|---|---|---|---|
Seguir la IETF STD 66 |
La Búsqueda de Google admite las URLs definidas en IETF STD 66. Los caracteres definidos por el estándar como reservados deben estar codificados con porcentajes. |
||||||
No uses fragmentos de URL para cambiar el contenido |
No uses fragmentos para cambiar el contenido de una página, ya que la Búsqueda de Google no suele admitir fragmentos de URL. A continuación, se muestra un ejemplo de fragmento de URL: https://example.com/#/potatoes Si usas JavaScript para cambiar el contenido, usa la API History. |
||||||
Usar una codificación común para los parámetros de URL |
Cuando especifiques parámetros de URL, usa la siguiente codificación común: un signo igual (
|
Facilitar la comprensión de la estructura de las URLs
Para ayudar a la Búsqueda de Google (y a tus usuarios) a entender mejor tu sitio, te recomendamos que crees una estructura de URL sencilla y apliques las prácticas recomendadas que se indican a continuación siempre que sea posible.
Prácticas recomendadas | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Utiliza URLs descriptivas |
Siempre que sea posible, utiliza palabras en vez de números de ID largos.
|
||||||||||
Usar el idioma de tu audiencia |
Usa palabras en el idioma de tu audiencia en la URL (y, si procede, transliteradas). Por ejemplo, si tu audiencia hace búsquedas en alemán, utiliza palabras en alemán en la URL: https://example.com/lebensmittel/pfefferminz Si tu audiencia hace búsquedas en japonés, utiliza palabras en japonés en la URL: https://example.com/ペパーミント |
||||||||||
Utilizar codificación UTF-8 si es necesario |
Cuando enlaces a páginas de tu sitio, usa la codificación UTF-8 en los atributos
|
||||||||||
Separar las palabras con guiones |
Te recomendamos que separes las palabras de tus URLs siempre que sea posible. En concreto, te recomendamos que uses guiones (
|
||||||||||
Usar el menor número posible de parámetros |
Si es posible, quita parámetros innecesarios de las URLs para acortarlas (es decir, parámetros que no cambian el contenido). | ||||||||||
Tener en cuenta que las URLs distinguen entre mayúsculas y minúsculas |
Al igual que cualquier otro cliente HTTP que siga la IETF STD 66, la gestión de URLs de la Búsqueda de Google distingue entre mayúsculas y minúsculas (por ejemplo, Google trata tanto /APPLE como /apple como URLs distintas con su propio contenido). Si el servidor web trata de la misma forma el texto en mayúsculas y minúsculas de una URL, pon todo el texto en mayúsculas o en minúsculas para que Google pueda determinar más fácilmente si las URLs hacen referencia a la misma página.
|
||||||||||
Para sitios multirregionales |
Si tu sitio es multirregional, te recomendamos que uses una estructura de URLs con la que resulte sencillo dirigir tu sitio a usuarios de diferentes zonas geográficas. Para ver más ejemplos de formas de estructurar tus URLs, consulta cómo usar URLs específicas de configuración regional. Recomendado (usando un dominio específico del país): https://example.de Recomendado (usando un subdirectorio específico del país con gTLD): https://example.com/de/ |
Evitar problemas habituales relacionados con las URLs
Las URLs demasiado complejas, sobre todo las que contienen varios parámetros, pueden suponer un problema porque los rastreadores pueden encontrarse con demasiadas URLs que dirigen a contenido similar o idéntico de tu sitio. En estas situaciones, el robot de Google puede consumir una cantidad de ancho de banda muy superior a la necesaria, o la Búsqueda de Google puede dejarse parte del contenido del sitio sin indexar.
Hay varios motivos por los que puede haber un exceso de URLs. Aquí tienes algunos:
Problemas habituales | |
---|---|
Combinaciones de filtros en un conjunto de elementos |
Muchos sitios ofrecen distintas vistas del mismo conjunto de elementos o resultados de búsqueda y permiten que los usuarios filtren ese conjunto según criterios definidos. Por ejemplo, un usuario podría buscar hoteles en la playa. Cuando se pueden combinar filtros (por ejemplo, si se pueden buscar hoteles en la playa que tengan gimnasio), la cantidad de URLs (vistas de datos) del sitio se dispara. Siguiendo con el ejemplo, es redundante crear muchas listas de hoteles ligeramente distintas porque al robot de Google le basta con ver solo unas cuantas que le permitan acceder a las páginas de todos los hoteles. Por ejemplo:
|
Parámetros irrelevantes |
Los parámetros irrelevantes en la URL pueden provocar un gran número de URLs, como las siguientes:
Puedes usar un archivo robots.txt para bloquear el acceso del robot de Google a estas URLs problemáticas. |
Problemas de calendario |
Los calendarios generados dinámicamente pueden crear enlaces a fechas pasadas y futuras sin ninguna restricción sobre las fechas de inicio ni de finalización. Por ejemplo: https://example.com/calendar.php?d=13&m=8&y=2011
Si tu sitio tiene un calendario infinito, añade un atributo |
Enlaces relativos rotos |
Si colocas un enlace relativo a la página principal en la página equivocada, es posible que se creen espacios infinitos si el servidor no responde con el código de estado HTTP correcto para las páginas que no existen. Por ejemplo, un enlace relativo a la página principal como <a href="../../category/stuff">...</a> en https://example.com/category/community/070413/html/FAQ.htm puede llevar a URLs falsas como https://example.com/category/community/category/stuff .
Para solucionarlo, utiliza URLs relativas a la raíz en los enlaces (en lugar de relativas a la página principal).
|
Solucionar problemas de la estructura de URL relacionados con el rastreo
Si observas que la Búsqueda de Google está rastreando estas URLs problemáticas, te recomendamos que hagas lo siguiente:
- Puedes utilizar un archivo robots.txt para bloquear el acceso del robot de Google a direcciones URL problemáticas. Normalmente, deberías bloquear URLs dinámicas, como las que generan resultados de búsqueda, o de URLs que pueden crear espacios infinitos, como calendarios, y funciones de ordenación y filtrado.
- Si tu sitio tiene navegación por facetas, consulta cómo gestionar el rastreo de esas URLs de navegación por facetas.