Cómo encontrar contenido duplicado en una página web

Ser capaz de identificar el contenido duplicado es una de las habilidades que todo experto en SEO debe poseer. Por desgracia, no siempre es fácil identificar cuando un contenido está duplicado, ya que muchas veces lo que se aprecia como contenido duplicado, en realidad no lo es. De hecho el propio Google utiliza diferentes criterios para clasificar lo que considera contenido duplicado.
Al realizar una auditoría SEO a una página web se debe buscar contenido duplicado no solo en las páginas, sino también en los encabezados y las URL
El contenido duplicado puede aparecer por muchos motivos, por ejemplo, por un plugin que funciona mal y que está duplicando los contenidos de las categorías o de las páginas de un blog. También puede haber contenido duplicado en páginas muy grandes, con mucho contenido acumulado o si se trabaja con redactores externos. Venga de dónde venga el problema, así es como se puede identificar el contenido duplicado de forma rápida y efectiva:
–Encontrar contenido duplicado en la propia página: Una de las mejores formas de encontrar este contenido es utilizando herramientas como Siteliner para escanear una página web. La aplicación analiza una a una todas las páginas del sitio web y muestra los resultados ordenados en una lista, donde se muestra el porcentaje de duplicidad en el contenido, así como las páginas que parecen duplicadas.
-Encontrar contenido duplicado en Internet: También es posible utilizar herramientas como Copyscape para identificar plagios en Internet. En este caso, se utiliza más como forma de encontrar quién ha copiado contenido de una página o, si se trabaja con redactores externos, para analizar si el contenido que han creado es original o plagiado.
Una forma más sencilla aún de encontrar estos plagios, es utilizar Google. Los usuarios que quieran saber si alguien ha copiado sus textos, pueden copiar un fragmento de un artículo y pegarlo en el buscador de Google. Si entre los resultados aparecen páginas que no son la original, es que ese texto ha sido copiado y pegado.
–Encontrar URL duplicadas: Es muy importante que no existan dos URL iguales en una misma página web, ya que de haberlas, Google puede tener problemas a la hora de indexar el contenido de forma correcta. Este problema suele ser habitual en páginas grandes y con mucho contenido y se puede solucionar con etiquetas «canonical» para señalar el contenido más importante.
Para encontrar URL duplicadas es posible utilizar herramientas como Screaming Frog o Wild Shark SEO que analizan todo el contenido de una página. Estas herramientas también sirven para escanear las páginas de la competencia y buscar errores o posibles huecos en sus contenidos.
–Encabezados y subencabezados: También se debe buscar este contenido en los H1, estos deberían ser únicos para cada página. Para encontrar duplicados entre los encabezados se pueden utilizar las mismas herramientas descritas en el punto anterior. En este caso, hay que visitar la pestaña H1, donde aparece la información de todos las etiquetas «h» de las diferentes páginas.