Prácticas recomendadas para la estructura de las URLs en la Búsqueda de Google

Para que la Búsqueda de Google pueda rastrear tu sitio de forma eficaz, debes usar una estructura de URL rastreable que cumpla los siguientes requisitos. Si tus URLs no cumplen los criterios que se indican a continuación, es probable que la Búsqueda de Google rastree tu sitio de forma ineficiente, lo que puede incluir, entre otros, tasas de rastreo extremadamente altas o que no se produzca ningún rastreo.

Requisitos de una estructura de URL rastreable

Seguir la IETF STD 66

La Búsqueda de Google admite las URLs definidas en IETF STD 66. Los caracteres definidos por el estándar como reservados deben estar codificados con porcentajes.

No uses fragmentos de URL para cambiar el contenido

No uses fragmentos para cambiar el contenido de una página, ya que la Búsqueda de Google no suele admitir fragmentos de URL. A continuación, se muestra un ejemplo de fragmento de URL:

https://example.com/#/potatoes

Si usas JavaScript para cambiar el contenido, usa la API History.

Usar una codificación común para los parámetros de URL

Cuando especifiques parámetros de URL, usa la siguiente codificación común: un signo igual (=) para separar pares clave-valor y un et (&) para añadir parámetros adicionales. Para indicar varios valores de la misma clave en un par clave-valor, puedes usar cualquier carácter que no entre en conflicto con la IETF STD 66, como una coma (,).

Recomendado No recomendado
Usar un signo igual (=) para separar los pares clave-valor y un signo et (&) para añadir parámetros adicionales:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Usar dos puntos (:) para separar los pares clave-valor y corchetes ([ ]) para añadir parámetros adicionales:
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
Usar una coma (,) para indicar varios valores de la misma clave, un signo igual (=) para separar pares clave-valor y un signo et (&) para añadir parámetros adicionales:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
Usar una coma (,) para separar los pares clave-valor y comas dobles (,,) para añadir parámetros adicionales:
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789

Facilitar la comprensión de la estructura de las URLs

Para ayudar a la Búsqueda de Google (y a tus usuarios) a entender mejor tu sitio, te recomendamos que crees una estructura de URL sencilla y apliques las prácticas recomendadas que se indican a continuación siempre que sea posible.

Prácticas recomendadas

Utiliza URLs descriptivas

Siempre que sea posible, utiliza palabras en vez de números de ID largos.

Recomendado (palabras sencillas y descriptivas) No recomendado (números de ID largos e ilegibles)
https://example.com/wiki/Aviation
https://example.com/index.php?topic=42&area=3a5ebc944f41daa6f849f730f1

Usar el idioma de tu audiencia

Usa palabras en el idioma de tu audiencia en la URL (y, si procede, transliteradas). Por ejemplo, si tu audiencia hace búsquedas en alemán, utiliza palabras en alemán en la URL:

https://example.com/lebensmittel/pfefferminz

Si tu audiencia hace búsquedas en japonés, utiliza palabras en japonés en la URL:

https://example.com/ペパーミント

Utilizar codificación UTF-8 si es necesario

Cuando enlaces a páginas de tu sitio, usa la codificación UTF-8 en los atributos href de los enlaces según sea necesario. Los caracteres ASCII no reservados pueden dejarse sin codificar. Además, los caracteres fuera del intervalo ASCII deben codificarse con UTF-8. Por ejemplo:

Recomendado (codificación UTF-8) No recomendado (caracteres que no son ASCII)
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
https://example.com/نعناع
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
https://example.com/杂货/薄荷
https://example.com/gem%C3%BCse
https://example.com/gemüse
https://example.com/%F0%9F%A6%99%E2%9C%A8
https://example.com/🦙✨

Separar las palabras con guiones

Te recomendamos que separes las palabras de tus URLs siempre que sea posible. En concreto, te recomendamos que uses guiones (-) en lugar de guiones bajos (_) para separar las palabras en las URLs, ya que ayudan a los usuarios y a los buscadores a identificar mejor los conceptos de la URL. Por motivos del pasado, no recomendamos utilizar guiones bajos, ya que este estilo ya se utiliza habitualmente para indicar conceptos que deben mantenerse juntos, por ejemplo, en varios lenguajes de programación para nombrar funciones (como format_date).

Recomendado No recomendado

Usar guiones (-) para separar palabras:

https://example.com/summer-clothing/filter?color-profile=dark-grey

Usar guiones bajos (_) para separar palabras:

https://example.com/summer_clothing/filter?color_profile=dark_grey

Unir palabras en la URL:

https://example.com/greendress

Usar el menor número posible de parámetros

Si es posible, quita parámetros innecesarios de las URLs para acortarlas (es decir, parámetros que no cambian el contenido).

Tener en cuenta que las URLs distinguen entre mayúsculas y minúsculas

Al igual que cualquier otro cliente HTTP que siga la IETF STD 66, la gestión de URLs de la Búsqueda de Google distingue entre mayúsculas y minúsculas (por ejemplo, Google trata tanto /APPLE como /apple como URLs distintas con su propio contenido). Si el servidor web trata de la misma forma el texto en mayúsculas y minúsculas de una URL, pon todo el texto en mayúsculas o en minúsculas para que Google pueda determinar más fácilmente si las URLs hacen referencia a la misma página.

Para sitios multirregionales

Si tu sitio es multirregional, te recomendamos que uses una estructura de URLs con la que resulte sencillo dirigir tu sitio a usuarios de diferentes zonas geográficas. Para ver más ejemplos de formas de estructurar tus URLs, consulta cómo usar URLs específicas de configuración regional.

Recomendado (usando un dominio específico del país):

https://example.de

Recomendado (usando un subdirectorio específico del país con gTLD):

https://example.com/de/

Evitar problemas habituales relacionados con las URLs

Las URLs demasiado complejas, sobre todo las que contienen varios parámetros, pueden suponer un problema porque los rastreadores pueden encontrarse con demasiadas URLs que dirigen a contenido similar o idéntico de tu sitio. En estas situaciones, el robot de Google puede consumir una cantidad de ancho de banda muy superior a la necesaria, o la Búsqueda de Google puede dejarse parte del contenido del sitio sin indexar.

Hay varios motivos por los que puede haber un exceso de URLs. Aquí tienes algunos:

Problemas habituales

Combinaciones de filtros en un conjunto de elementos

Muchos sitios ofrecen distintas vistas del mismo conjunto de elementos o resultados de búsqueda y permiten que los usuarios filtren ese conjunto según criterios definidos. Por ejemplo, un usuario podría buscar hoteles en la playa. Cuando se pueden combinar filtros (por ejemplo, si se pueden buscar hoteles en la playa que tengan gimnasio), la cantidad de URLs (vistas de datos) del sitio se dispara. Siguiendo con el ejemplo, es redundante crear muchas listas de hoteles ligeramente distintas porque al robot de Google le basta con ver solo unas cuantas que le permitan acceder a las páginas de todos los hoteles. Por ejemplo:

  • Hoteles a "precios interesantes":
    https://example.com/hotel-search-results.jsp?Ne=292&N=461
  • Hoteles a "precios interesantes" en la playa:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
  • Hoteles a "precios interesantes" en la playa y con gimnasio:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270

Parámetros irrelevantes

Los parámetros irrelevantes en la URL pueden provocar un gran número de URLs, como las siguientes:

  • Parámetros de referencia:
    https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories
  • Parámetros de ordenación de Shopping:
    https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Identificadores de sesión:
    https://example.com/search/noheaders?sessionid=6EE2BF1AF6A3D705D5561B7C3564D9C2

Puedes usar un archivo robots.txt para bloquear el acceso del robot de Google a estas URLs problemáticas.

Problemas de calendario

Los calendarios generados dinámicamente pueden crear enlaces a fechas pasadas y futuras sin ninguna restricción sobre las fechas de inicio ni de finalización. Por ejemplo:

https://example.com/calendar.php?d=13&m=8&y=2011

Si tu sitio tiene un calendario infinito, añade un atributo nofollow a los enlaces que lleven a páginas de calendario futuras creadas dinámicamente.

Si colocas un enlace relativo a la página principal en la página equivocada, es posible que se creen espacios infinitos si el servidor no responde con el código de estado HTTP correcto para las páginas que no existen. Por ejemplo, un enlace relativo a la página principal como <a href="../../category/stuff">...</a> en https://example.com/category/community/070413/html/FAQ.htm puede llevar a URLs falsas como https://example.com/category/community/category/stuff. Para solucionarlo, utiliza URLs relativas a la raíz en los enlaces (en lugar de relativas a la página principal).

Solucionar problemas de la estructura de URL relacionados con el rastreo

Si observas que la Búsqueda de Google está rastreando estas URLs problemáticas, te recomendamos que hagas lo siguiente: