Existen una variedad de razones por las que las páginas no se indexan, entre ellas podemos encontrar que tenemos un contenido de baja calidad o duplicado.

El primer paso para comprender por qué una página no se indexa es explorar el informe de Google Search Console. Las advertencias de la consola de búsqueda pueden ayudar a comprender por qué determinadas páginas no aparecen en los resultados de búsqueda de Google.

Una vez sepamos qué páginas no están indexadas y qué significan las advertencias de la consola de búsqueda, luego podremos explorar los pasos para seguir y garantizar que las páginas se indexen correctamente. Muchas veces hay advertencias que pueden no requerir realizar ninguna acción.

¿Qué rastreador indexa mis páginas?

El encargado en Google para indexar la páginas se llama Googlebot en el abanico más amplio. Este robot lee el contenido de la página y sigue los enlaces que encuentra. Luego decide cómo indexar una página en base a la relevancia y contenidos que ha encontrado dentro de la url.

¿Por qué algunas páginas no deberían indexarse?

Es importante recordar que algunas páginas no deben indexarse. Por ejemplo, no se deben indexar las páginas duplicadas o etiquetas de un blog.

Un ejemplo dentro de un ecommerce podría ser dar el atributo «noindex» a la página de inicio de sesión. Digamos que no es algo que queremos priorizar dentro de nuestro sitio web y más si nuestro dominio tiene más de 500.000 urls donde si puede afectar el presupuesto de rastreo que dedica Google a cada dominio.

Causas comunes de problemas de indexación

Algunas de las causas más comunes de problemas de indexación son contenido duplicado sin una etiqueta canónica adecuada, acceso a páginas bloqueado, archivo robots.txt incorrecto, redireccionamientos mal implementados y problemas de representación relacionados con Javascript.

La realidad detrás de los Redireccionamientos

Podría parecer preocupante que Google no esté indexando todas estas páginas. Sin embargo, al investigar más a fondo, nos damos cuenta de que la situación no es tan alarmante como parece. Por ejemplo, al hablar de páginas con redirecciones, es importante mencionar que un sitio puede incluir un foro, lo que explicaría la gran cantidad de páginas que pueden verse afectadas. Aunque haya más de xxx páginas con redirecciones, esto no significa necesariamente que sean un problema para el sitio.

Google entiende que una página que antes estaba disponible ahora redirige a otro lugar, y esto es completamente normal. Por ejemplo, al verificar una URL que se redirige, podemos observar que Google la ha indexado correctamente a pesar de la redirección.

Comprender el informe de indexación de páginas en Google Search Console

Utilizar el Informe de indexación de páginas es la forma más rápida de obtener una descripción general de qué páginas de su sitio web han sido indexadas y no han sido indexadas por Google. Para encontrarlo, primero ubica en el menú desplegable «Indexación» en la barra lateral y luego haz clic en la pestaña «Páginas«.

Veamos ejemplos de avisos que pueden aparecer

Páginas con Etiquetas Canónicas

El uso de etiquetas canónicas suele indicar que el contenido puede estar duplicado en más de un lugar. Google maneja esto adecuadamente, seleccionando una versión preferida del contenido para indexar. Esto demuestra que no todas las páginas no indexadas son motivo de preocupación.

Páginas Excluidas por No Index

En cuanto a las páginas marcadas para no ser indexadas, es una práctica común en la gestión de sitios. Por ejemplo, en un sitio de WordPress, ciertas páginas como archivos de autor o etiquetas no necesitan ser indexadas, ya que no aportan valor SEO. Estas exclusiones son normales y no deben causar alarma.

Página no encontrada (404)

Google descubrió una URL sin ninguna solicitud de rastreo, pero la página ya no existe y no se ha implementado ninguna redirección. Si es posible, deberías implementar una redirección 301 a una página adecuada. Si no existe una página adecuada, puede dejar el 404 como está, pero es mejor evitar los 404 siempre que sea posible.

Acceso Restringido

Algunas páginas pueden estar bloqueadas para usuarios no registrados o pueden haber sido eliminadas. Estos casos son manejables y no representan problemas graves para la indexación del sitio en general.

La importancia de los errores de Crawling

Los errores de crawling, como el contenido móvil que cambia de posición durante la carga de la página, pueden afectar la experiencia del usuario. Sin embargo, no siempre requieren una acción inmediata. Es crucial monitorear estos errores y evaluar su impacto real en el sitio.

«Arreglar el problema»

Una vez que consideras que el problema ha sido resuelto y que la página está lista para volver a indexarla deberás:

  1. Hacer clic en páginas y haga clic en la URL que está listo para volver a enviar.
  2. Revisa la lista de detalles de la página para asegurarse de haber abordado todos los problemas enumerados. Luego, haz clic en «Validar corrección».
  3. Google te enviará un correo electrónico para indicarte que el proceso de validación ha comenzado. Este proceso puede tardar varias semanas. Una vez que Google resuelva los problemas, es muy probable que su página finalmente sea indexada y comience a clasificarse en las SERP para consultas de búsqueda relevantes.

Muddle-opinión

Los avisos de páginas no indexadas y otros errores comunes, muchas veces son en realidad aspectos normales del funcionamiento de un sitio web. Al comprender estos problemas y cómo Google los interpreta, podemos manejarlos adecuadamente sin caer en la alarma innecesaria. Recuerda, en la gestión de sitios web, el conocimiento detallado y la calma son tus mejores herramientas.