URLs espejo: qué son, cómo perjudican el SEO de tu web y cómo solucionarlas

Es un término con el que nosotros a nivel interno (en B30) hemos denominado a este tipo de URLs, de las cuales  te lo vamos a hablar a fondo, pero al fin y al cabo es un término inventado por nosotros (o por lo menos eso creo).

Ponerle nombre y encarar el problema de frente con un contenido me parece algo útil y necesario porque nos permite hacer más «tangible» un concepto, en este caso de SEO on page, que tenemos que cuidar dentro de nuestras páginas y al que la mayor parte de veces no se le hace demasiado caso.

Hoy hablaremos de SEO… estás en Blogger3cero ¿de qué otra cosa íbamos a hablar si no?

Pero antes haré una intro más personal.

Empezamos.

Antes de comenzar con el tema del post propiamente en cuestión quiero decir que, por lo menos en el momento de escribir estas líneas, estoy feliz.

No siempre es algo fácil para mí, dada lo hiperactiva que es mi cabeza (lo cual te hace estar siempre insatisfecho con lo que estás haciendo y buscar algo más), lo inconformista que tiendo a ser (disfrutas menos de los logros obtenidos y los das por sentado) o lo nostálgico y apegado que me muestro a veces con las personas que quiero o he querido (esto puede hacer que sea más complicado dejar etapas personales atrás, por ejemplo).

Pero ahora cada vez tengo más claro el camino y creo que poco a poco me estoy acercando a la mejor versión de mí mismo.



Creo que de forma lenta pero constante voy viendo sentido a todas las cosas, acciones o decisiones que he ido tomando en el pasado y de una manera u otra van conformando lo que siempre quise que fuera mi vida, mi realidad actual, que cada vez se acerca más a ese ideal que tenía en mente cuando empecé Blogger3.0

Quería hacer «grandes cosas» dentro del SEO, pero aún no sabía qué.

Es bonito ser pequeño y tener sueños u objetivos grandilocuentes.

¿Cuántos niños no han querido ser «astronautas» alguna vez?

Pero es todavía más bonito cumplirlos.

Soy una persona afortunada por el mero hecho de que cada vez me voy acercando más a cumplir mis objetivos o mejor dicho «nuestros» objetivos… en plural, haciendo alusión a la familia que se consolida más y más dentro del equipo de Blogger3cero, un equipo con el que os prometo que revolucionaré el sector.

Stay tuned

¿Qué son las URLs espejo?

El «contenido» es algo que está en un determinado sitio y la URL es «la carretera» por la que se llega a ese contenido.

Definimos como URLs espejo a las URLs que aparecen en tu sitio (y por tanto, son rastreables por un crawler) tanto con el slash («/») al final como sin él y que a su vez llevan a un mismo contenido.

Por ejemplo, esto sería una URL espejo:

blogger3cero.com/es-un-blog-molon/

blogger3cero.com/es-un-blog-molon

Empecé a prestar más atención a esta problemática cuando profundicé en una auditoría en la web de uno de mis clientes de mentorías: un blog de viajes bastante popular en su sector que cuenta con cientos de URLs y contenidos publicados.

Cuando mapeábamos todas las URLs del dominio con un poco más de detalle era frecuente comenzar a ver URLs que las herramientas SEO nos detectaban 2 veces, pero que en realidad apuntaban al mismo contenido. No obstante, la URL era la misma con la salvedad de que solo variaba el / al final.

¿Qué problema pueden ocasionar?

Tienes que tener cuidado, porque si el crawler de una herramienta SEO puede acceder, lógicamente Googlebot también.

Para Google son URLs diferentes, lo cual implica que tienes un solo contenido que es accesible por más de una vía (y esto no está bien). Por tanto, podríamos decir que ambas URLs «existen» a ojos de Google.

De alguna manera estás generando contenido duplicado en tu propio site, algo que tampoco será grave a menos que lo generes en cantidades ingentes, pero que conviene corregir.

Por otro lado, también está el factor añadido de que muy posiblemente estás dividiendo el pagerank interno.

¿Por qué?

Bueno, para entender el problema del pagerank generado por las URLs espejo primero tenemos que entender «cómo se generan esas URLs espejo», algo que te cuento justo en el siguiente apartado.

¿Cómo se generan estas URLs espejo?

Lo más habitual es que se generen cuando «se enlaza mal«.

Ya sea porque nosotros internamente hemos «enlazado mal» o porque nos han «enlazado mal» externamente con backlinks.

¿Y qué entendemos por enlazar mal? Pues básicamente enlazar a una versión de la URL diferente a la «buena», donde generalmente la URL «buena» será CON el / y la URL «mala» será SIN el /

Esto explica el problema de la división del pagerank que comentaba un poco más arriba, por ejemplo:

En este caso, la URL que no contiene el slash al final es la URL espejo.

Se ha generado porque sin querer uno de mis redactores ha puesto enlaces internos hacia el post de «esqueletos de dinosaurios», pero se le ha olvidado poner el / al final.

De este modo estamos dividiendo el pagerank tontamente, ya que ese enlace interno debería apuntar a la versión de URL con / y de ese modo esa pagerank se podría aprovechar para llevar más fuerza a la URL buena, en lugar de desperdiciarlo.

Esto es un único ejemplo a pequeña escala y no va a suceder nada, pero si esto tuviese lugar de forma masiva en tu dominio tendrías un serio problema a la hora de rankear, dado el desperdicio de pagerank que eso supondría e incluso podría llegar a derivar en un problema de crawl budget, repito, si se diera a gran escala, ya que estarías haciendo a Google rastrear más URLs para llegar a un mismo contenido.

¿Cómo se solucionan?

Lo primero que tendrás que hacer es utilizar una herramienta que disponga de un crawler con el que analizar TODAS y cada una de las URLs de tu web y que luego te pinte esta información.

Esto puedes hacerlo con varias herramientas, Screaming Frog por ejemplo, aunque nosotros lógicamente lo hacemos con DinoRANK.

El módulo de URLs espejo fue algo que añadimos precisamente a petición mía después de trabajar con el blog de viajes que te comentaba arriba, ya que en la sección de «pagerank interno» de DinoRANK detectábamos muchas URLs con y sin slash, y teníamos que ir buscándolas 1 a 1 visualmente por el dibujo para solucionarlas, lo cual no era algo viable.

Ahora con un click las tienes listadas.

Fíjate en la foto, me sale que para dinosaurioss.com tengo dos post con URLs espejo, therizinosaurus y esqueletos de dinosaurios.

Vamos a ver cómo se solucionaría el problema de las URLs espejo sobre este mismo ejemplo práctico.

Hacemos click sobre la URL pintada de color azul que es la «espejo» de la buena, en este caso esta: https://dinosaurioss.com/cretacico/omnivoros-c/therizinosaurus

DinoRANK nos llevará al apartado de «inlinks» que es algo muy similar a lo que tiene Screaming Frog, solo que nosotros en lugar de mostrártelo en una tabla de datos lo hacemos mediante gráfica: llegados a este punto la herramienta te dice cuáles son los enlaces internos que están apuntando a esa URL espejo y que por tanto la están generando.

Y debajo podremos ver estos enlaces internos listados («enlaces entrantes» hacia esa URL).

Nos dice que tiene 5 enlaces internos entrantes, desde 2 URLs diferentes.

Vamos a ver cuáles son esos enlaces internos que apuntan MAL a la URL en cuestión, para corregirlos y apuntar a la versión «buena» del contenido, que será la versión contenida en la URL con / al final.

Para ello abrimos las URLs del listado y buscamos el enlace interno mal generado

Corregimos todos los inlinks y de esta forma estaremos solucionando el problema a nivel interno… Pero, ¿y qué pasa si esa URL espejo ha recibido enlaces externos de otras páginas ajenas a la nuestra? 😱

En este caso lo más apropiado sería realizar una redirección 301 desde la URL espejo hacia la URL buena.

Aunque personalmente antes de hacer esto, yo miraría con una herramienta de análisis de backlinks como Ahrefs para asegurarme de que hay enlaces externos apuntando a esas URLs espejo y que son enlaces que no me interesa perder.

En última instancia siempre nos quedará el manual de la vieja escuela bloggera de mandar un email al webmaster que nos ha emitido ese enlace para que ponga nuestra URL bien…

###

¡Y esto es todo lector/a! Corto y al punto

Pronto mucho más.

Dean.

LucusHost, el mejor hosting

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

A %d blogueros les gusta esto: