manuel lopez consultor seo sem analytics

Qué es la Cobertura del índice?

La Cobertura del índice es un nuevo informe de estado de Google Search Console en el que puedes consultar qué páginas de tu web se han indexado y cómo corregir los problemas de las que no se han incluido en el índice.

Este informe se encuentra en la nueva versión de Google Search Console, que está en fase Beta y a la que puedes acceder desde un enlace en la parte superior del menú de la izquierda en la versión anterior, en el que pone "Probar la nueva Search Console"

Cada URL de tu web aparecerá en el informe de cobertura del índice con uno de los siguientes estados:

  1. Válida: se ha indexado la página
  2. Advertencia: la página está indexada, o lo estaba hasta hace poco, y tiene problemas. Ejemplo: un archivo robots.txt la ha bloqueado
  3. Error: no se ha indexado la página. Ejemplo: Error de servidor (5xx) o página con la etiqueta "no index"
  4. Excluida: no se ha incluido la página en el índice por motivos que están fuera de tu alcance. Ejemplo: páginas redirigidas y duplicadas

Se ha detectado un nuevo problema de cobertura del índice

problema de cobertura del indice

Si recibes un mensaje de Search Console del tipo: Se ha detectado un nuevo problema de cobertura del índice en tu dominio https://www.masterseosem.com, deberías acceder al informe y comprobar los mensajes.

En función del problema que se presente en cada informe de estado, puedes encontrar páginas:

Válidas

Las páginas cuyo estado sea Válidas están indexadas en alguno de los siguientes casos:

  • Enviada e indexada: has enviado la URL para indexarla y se ha incluido en el índice.
  • Indexada, no enviada en sitemap: Google ha descubierto la URL y la ha indexado
  • Indexada; recomendamos marcarla como canónica: se ha indexado la URL, pero como tiene duplicados, te recomienda que la marques como canónica explícitamente.

Advertencia

La advertencia habitual que encontrarás es: Se ha indexado aunque un archivo robots.txt la ha bloqueado.

En este caso, la página se ha incluido en el índice aun estando bloqueada por un archivo robots.txt.

Google sigue las indicaciones de los archivos robots.txt, pero si hay enlaces a la página en otros sitios web, la indexará.

Error

No se han indexado páginas con alguno de los siguientes errores:

  • Error del servidor (5xx): tu servidor ha devuelto un error 5xx cuando se ha solicitado la página.
  • Error de redirección: la URL ha dado un error de redirección porque la cadena de redirección es demasiado larga, tiene un bucle de redirección, la URL de redirección supera la longitud de URL máxima, o había una URL incorrecta o vacía en la cadena de redirección.
  • Robots.txt ha bloqueado la URL enviada: has enviado la página para indexarla, pero está bloqueada por un archivo robots.txt. Prueba la página con el Probador de robots.txt.
  • La URL enviada contiene la etiqueta "noindex": has enviado la página para indexarla, pero tiene una directiva "noindex" en una metaetiqueta o en una respuesta HTTP. Si quieres incluirla en el índice, quita la etiqueta o la respuesta HTTP.
  • La URL enviada devuelve un soft 404: has enviado la página para indexarla, pero el servidor ha devuelto lo que parece ser un error soft 404.
  • La URL enviada devuelve una solicitud no autorizada (401): has enviado la página para indexarla, pero Google ha obtenido una respuesta 401 (no autorizada). Retira los requisitos de autorización de la página o permite que el robot de Google acceda a tus páginas verificando su identidad.
  • No se ha podido encontrar la URL enviada (404): has enviado una URL que no existe para indexarla.
  • La URL enviada tiene un problema de rastreo: has enviado la página para indexarla, pero Google ha encontrado un error de rastreo que no puede clasificarse en ninguna de las categorías anteriores. Prueba a depurar tu página con Explorar como Google.

Excluidas

Estas páginas no suelen estar indexadas, en algunos casos por alguna acción intencionada por tu parte:

  • Bloqueada por una etiqueta "noindex"
  • Bloqueada por la herramienta para eliminar URLs de Search Console
  • Bloqueada por robots.txt. Puedes comprobarlo con el Probador de robots.txt
  • Bloqueada por una solicitud no autorizada (401): el robot de Google no ha podido acceder a la página debido a una solicitud de autorización
  • Anomalía en el rastreo: se ha producido una anomalía sin determinar al obtener la URL, lo que podría implicar un código de respuesta 4xx o 5xx
  • Rastreada, actualmente sin indexar: Google ha rastreado la página, pero no la ha incluido en el índice. Es posible que se indexe más adelante, no tienes que volver a solicitar que se rastree esta URL.
  • Descubierta: actualmente sin indexar: Google ha encontrado la página, pero todavía no la ha rastreado
  • Página alternativa con etiqueta canónica adecuada: la página es un duplicado de una página que Google considera canónica y, además, apunta correctamente a dicha página canónica. No tienes que hacer nada.
  • Página duplicada sin etiqueta canónica: la página tiene duplicados, y ninguno se ha marcado como canónico. Deberías indicar cuál es la versión canónica de esta página de forma explícita
  • Página duplicada que no es HTML: una página que no es HTML (por ejemplo, un archivo PDF) es un duplicado de otra página que Google ha marcado como canónica
  • Google eligió una página canónica diferente
  • No se ha encontrado (404): la página ha devuelto un error 404 al solicitarse
  • Se ha retirado la página por una reclamación legal: la página se ha quitado del índice a causa de una reclamación legal.
  • Página con redirección: la URL es una redirección, por lo que no se ha añadido al índice.
  • Se ha puesto en cola para realizar su rastreo: la página está pendiente de rastrearse. Vuelve a consultarla en unos días para ver si ya se ha rastreado.
  • Respuesta Soft 404: se indica a los usuarios que la página no se ha encontrado sin mostrar el código de respuesta 404 correspondiente
  • La URL enviada se ha retirado
  • La URL enviada no se ha seleccionado como canónica

Herramienta de inspección de URLs

Puedes usar la herramienta de inspección de URLs de la nueva versión de Search Console para consultar la información que tiene Google sobre el estado de indexación de una página concreta de tu web.

Se encuentra en la parte superior de Search Console como un cuadro de búsqueda con el texto: Inspeccionar las URL de tu dominio.

La herramienta te mostrará si tiene errores de AMP, errores de datos estructurados o problemas de indexación.

Respecto a la presencia en Google, la respuesta puede tener los siguientes valores:

  • La URL está en Google
  • La URL está en Google, pero tiene problemas
  • La URL no está en Google por errores de indexación
  • La URL no está en Google (por elección propia)
  • La URL es una versión alternativa

inspeccion de urls

 

Volver al Diccionario SEO - Glosario de términos de marketing digital

 

Pin it

Ratio: 5 / 5

Inicio activadoInicio activadoInicio activadoInicio activadoInicio activado
 
­

Usamos cookies propias y de terceros para facilitar su navegación. Si continúa navegando consideramos que acepta su uso. Ver Política de Cookies