Desindexar una URL: Cómo eliminar una pagina web de Google

Es más habitual de lo que imaginas… de pronto, un día descubres que necesitas desindexar una página web del navegador, eliminarla, exterminarla, lanzarla hacia un supermassive black hole… suprimirla del índice, retirarle la luz que la anima.

Tal vez lo escribiste engorilao, puede que no fuera tu mejor día, igual es la única escapatoria que tienes para salir de una penalización… tienes que sacar a esa url del índice.

Se me ocurren varias ciscunstancias por las que podrías encontrarte en esta encrucijada, si no te sientes representado en mi listado, por favor, no dudes en contactar conmigo.

Por qué podrías necesitar eliminar una página de google?

 

  • Simplemente has idexado url’s que no tenías previstas

 

  • Algunas páginas te están generando contenido duplicado (páginas de autor, por ejemplo)

 

  • Tienes páginas de baja calidad… no serás el único

 

  • Alguna de tus páginas te estan causando problemas legales… :/ y tienes que retirarlas de circulación lo más rápido posible

 

  • etc..

La Substantia nigra son todas aquellas páginas que Google indexa y que no deberían estarlo.

Si la parte de sustancia negra es mayoritaria en tu web, es hora de hacer limpieza.

¿Qué diferencia hay entre páginas indexadas y páginas indexables?

Una página indexable es una página que respeta todas las condiciones que Google indica para que sea indexada… obvio.

Una página indexada es una página que Google ha rastreado, crawleado, y decidido que la va a añadir a su índice.

Recordarte que para que una página sea indexable tiene que ser también crawlable.

Una página crawlable es una página autorizada para su rastreo, en román paladino, no bloqueada en el robots.txt.

Al contrario, una página no indexable es una página a la que hemos indicado a Google que no la indexe… lo has adivinado…

Para desindexar una página de Google tienes que hacer 2 cosas:

1. Volverla no indexable para Google

2. Desindexarla

Fácil!

¿Cómo volver una página «no-indexable»?

La primera pregunta que debes hacerte es la siguiente: La página que quiero desinxar ¿debe seguir siendo visible y consultable para mis visitas?

Cómo desindexo una página que quiero que siga accesible a mis visitas

En esta circunstancia tienes que elegir entre diferentes soluciones:

Meter una etiqueta meta robots noindex

Que le indique a los motores de búsqueda que no deseas que esa página sea indexada. Seguirá indexada hasta que Google detecte esta etiqueta en el HTML de la página. Si nunca estuvo indexada, no lo será en un futuro.

Encabezado HTTP X-Robots-Tag

Persigue el mismo propósito que la meta robots noindex. Se utiliza cuando el documento que queremos desindexar no es una página Html si no documentos PDF, Excel, Word, etc…)

Definir una URL canónica diferente a la URL de la página que quieres desindexar

Por ejemplo, con motivo de una promoción, una ficha de producto puede ser accesible tanto a una url A como a una url temporal B, los atributos de los productos (color, talla, etc) tambien pueden generar url’s con contenido duplicado. Define la url canónica pero has de saber que esto Google se lo toma como una sugerencia, no es una directiva, si no le da la gana, no lo respetará al 100%… es lo que hay.

Ahora puedes hacer 2 cosas:

1. Esperas a que Google desindexe la página

2. Intentas acelerar el proceso (te lo cuento más abajo)

Pequeño saltamontes, sé que me has seguido hasta aquí sin perder ripio y que no ha caido en saco roto eso de que la página que deseas desindexar debe ser crawlable (rastreable) ya que si le prohibes a Google rastrearla, la arañita no podra constatar que le estás pidiendo que no la indexe puesto que le estás prohibiendo que entre en el Html de la página.

Como bien sabes, disallow es una directiva que metes en el robots.txt para que no rastree determinadas páginas o directorios, es un archivo de texto que cuelga, normalmente, de la raíz.

En cambio, las meta robots, son intrucciones que metes a nivel de url en su html.

Meter una meta robots noindex y bloquearla en el robots.tx = es una #seoandez

Cómo elimino una url de Google que no es accesible a mis visitas

En este segundo caso, tienes estas soluciones:

Enviar un código de respuesta 404 0 410

Esto le va a indicar a Google que la página no existe ya. Parece que Google trata igual el 404 que el 410 pero hay la impresión generalizada que el 410 es más rápido.

La «ventaja» de un 410 sobre un 404 cuando pretendes suprimir una página es no mezclar conceptos: los 404 son como errores involuntario y los 410, voluntarios.

Se trata de un código de estado HTTP conocido como HTTP 410 Gone o Ya no existe/Ya no disponible. Cuando se marca una URL con esta cabecera se manda un mensaje a los robots de los buscadores donde se les informa que ya no existe y no va a volver a existir con lo cual no hace falta que vuelva a pasar por ella.

Pueden pasar meses hasta que Google se decida a desindexar la página.

Pese a tener un uso no muy extendido, la directiva Redirect Gone tiene varias utilidades interesantes:

1. Una de las clásicas: eliminar productos que ya no van a volver a existir en una tienda online.

2. Suprimir URLs que has creado de forma puntual y que no tienen relación con otras existentes.

En general, conviene utilizarlos con cualquier URL que no vaya a tener ningún otro uso futuro y que no haya sido útil para el posicionamiento en el pasado.

Redirect gone /loren-ipsum

Redirección 301 hacia otra página

Se suele utilizar este método cuando pensamos que la URL a desindexar habia obtenido buenos backlins y autoridad, PR o como quieras llamarlo y no queremos perder el beneficio obtenido.

Las redirecciones 301 son permanentes y traspasan autoridad (aprox un 90% o quién lo sabe realmente…) en contraposición a las 302, que son redirecciones temporales y no traspasan autoridad.

Ten en cuenca que si haces esto como un endemoniado sobre una cantidad imposible de URLs, Google puede considerarlo como un error soft 404 y que al final las páginas no sean desindexadas.

Antes de tomar una decisión entre una 301 y un 410 verifica si tienes enlaces entrates y cuales son, igual te ineresa más una 301 a una url similar o personalizar una página con una aviso de falta de stock, por ejemplo, en caso de una tienda online

¿Cuánto tiempo tarda Google en desindexar una página?

A esperar toca… La página no será desindexada hata que a Google le de la soberana gana, con un poco de suerte en el momento en el que Google la vuelva a rastrear.

¿Cuánto tiempo tarda Google en desindexar una página?

A esperar toca… La página no será desindexada hata que a Google le de la soberana gana, con un poco de suerte en el momento en el que Google la vuelva a rastrear.

¿Cómo suprimir rápidamente una página de Google?

Forzar la desindexación con la Google Search Console

Los más eficaz es pedírselo directamente a San Google a través de la Search Console. Será temporal, creo que 90 días, no recuerdo bien. Es decir, este es un método complementario a lo hablado anteriormente. Herramienta para eliminar url’s Google Search Console

Si tienes un montón de URLs va a ser un poco tedioso hacer todas las demandas individuales.

Delirio… o no?:

Haz una lista de todas las URL’s que quieres desindexar en un fichero sitemap… un simple fichero de texto con una URL por linea (codificación UTF‑8), con el nombre que más te guste y envíalo a la Google Search console… espera pacientemente.

La idea es que un sitemap pueda servir no solo para indexar las páginas… igual también para incitar a Google a rastrear esas URL’s…

Gracias a este sitemap: la arañita vendrá rápidamente a crawlear todas esas URLs y constatará que deben ser desindexadas.

Cada vez que vayas a tu Google Console podras ver cuantas de esas URLs de ese sitemap están todavía presentes en el índice de Google.

Una vez que tengas todas las páginas desindexadas, te ventilas ese sitemap.

¿Se puede desindexar una página con el archivo robots.txt?

Rápidamente: NO

Por la sencilla razón que el archivo robots.txt no gestiona la indexación sino el rastréo.

Google no vendra a rastraerla, simplemente.

Es un error clásico del que ya hemos hablado más arriba… estoy iterando o aprovechando para meter otro h2, ya no se cuales son mis intenciones… no me conozco.

Una pequeña precisión antes de partir: es posible suprimir una página via Search Console y para evitar que vuelva en un futuro al índice de Google, la puedes bloquear en el fichero Robots.txt… la combinación puede funcionar.

La directiva Noindex no funciona en el robots.txt. Google anunció que a partir del 1 de septiembre del 2019 los archivos robots no la soportarían. Recuerda que la directiva soportada sería Disallow.

¡Andad por lo segao!

Resumen
¿Cómo eliminar una url de Google? Desindexar una página:
Título
¿Cómo eliminar una url de Google? Desindexar una página:
Descripción
¿Cómo desindexar una página que quieres siga accesible a tus visitas?¿Cuánto tiempo tarda Google?¿Cómo suprimir rápido una url de Google? ¿Se puede desindexar una página con el archivo robots.txt? Meter una etiqueta meta robots noindex, Encabezado HTTP X-Robots-Tag, Definir una URL canónica, Enviar un código de respuesta 404 0 410.
Autor
Editor
RitaDoit
Logo

Pin It on Pinterest

Share This
×