Jose Alexis Correa Valencia
@jalexiscv, hace 5 meses..
Cover 2 5DBD7A287AAD3

Contenido duplicado en línea en el 2020 y sus implicaciones


ADVERTENCIA: ¡El contenido duplicado no hace que su sitio sea penalizado!

  • Los Googlers saben que los usuarios desean diversidad en los resultados de búsqueda y no el mismo artículo una y otra vez, por lo que eligen consolidar y mostrar solo una versión.
  • En realidad, Google diseñó algoritmos para evitar que el contenido duplicado afecte a los webmasters. Estos algoritmos agrupan las diversas versiones en un clúster, se muestra la "mejor" URL en el clúster y en realidad consolidan varias señales (como enlaces) de las páginas dentro de ese clúster a la que se muestra. Incluso llegaron a decir: "Si no quiere preocuparse por ordenar la duplicación en su sitio, puede dejar que nos preocupemos por eso".
  • El contenido duplicado no es motivo de acción a menos que su intención sea manipular los resultados de búsqueda. Lo peor que puede suceder con este filtrado es que se muestre una versión menos deseable de la página en los resultados de búsqueda.
  • Google intenta determinar la fuente original del contenido y mostrar ese.
  • Si alguien está duplicando su contenido sin permiso, puede solicitar que se elimine presentando una solicitud en virtud de la Ley de Derechos de Autor Digital Millennium.
  • No bloquee el acceso a contenido duplicado. Si no pueden rastrear todas las versiones, no pueden consolidar las señales.

¿Qué cuenta como contenido duplicado?

Si el contenido aparece en cualquier ubicación en Internet más de una vez, se clasifica como contenido duplicado. Si el contenido se replica en un solo sitio web o en más de una URL, se clasifica como contenido duplicado. Incluso dentro de un solo sitio web puede haber contenido duplicado que conduzca a una posición SERP reducida para contenido importante. No queremos usar la palabra penalización, pero en realidad, si está duplicando su propio contenido en varias páginas, al final obligará a Google a colocar ciertas páginas en los SERPs y dejar de lado otras. ¿Multa? No exactamente, pero seguro que se siente como una. La solución fácil es modificar el contenido en las páginas siguientes, por lo que es específico de la página y está etiquetado como original. Existen muchos mitos sobre el contenido duplicado, asegúrese de saber lo que AHREFS dijo al respecto y lo que dice Moz sobre el contenido duplicado.

Recuerde, el contenido duplicado no es solo cuando se copia el contenido de otro sitio web, sino que también cuando se duplica o copia reiterativamente contenido alojado en su propio sitio web en varias URL. Ambos tipos de contenido duplicado pueden afectar negativamente el SEO de un sitio web, y aunque es relativamente fácil de solucionar, la mayoria de las personas no son conscientes del impacto del contenido duplicado.

La definición de Google de contenido duplicado es bastante clara, y para muchos que buscan formas de mejorar el SEO de su sitio web, es el lugar ideal para usar como punto de referencia. Muchas veces, arreglar títulos duplicados, parrafos y meta tiquetas puede conducir a mejorar rapidamente el posicionamiento.

Definición de contenido duplicado: Son áreas sustantivas de contenido que son apreciablemente similares o que coinciden directamente con otro contenido contenido en un solo dominio o publicado en múltiples dominios. No es un gran problema si eres el autor y, en segundo lugar, pero lo más importante, ¡tienes el sitio web más fuerte! La situación se vuelve más oscura si alguien te está superando por TU contenido, o viceversa. Hay formas de reportar esto a Google. ¿Necesita buscar los términos de marketing en línea que usare en este artículo?.

Ejemplos de contenido duplicado no malicioso

Todos estos son ejemplos de contenido duplicado que no se consideran maliciosos en su intención.

  • Versiones solo impresas de páginas web.
  • Páginas que no están indexadas por motores de búsqueda.
  • Foros de debate que generan páginas optimizadas para web y dispositivos móviles.
  • Elementos dentro de una tienda que se presentan con una multitud de URL distintivas (suponiendo que los canónicos rel estén configurados correctamente).
  • Páginas que son canónicas al contenido original.
  • Menús, secciones de pie de página, algunas barras laterales y otras áreas de contenido que no se encuentran en el área principal de "contenido único" del sitio web.
  • Contenido que tiene suficientes Geo-modificadores, H1, H2 y copia modificados, incluso cuando se extrae de un solo conjunto de archivos.
  • HTTP y HTTPS.
  • www y no www.
  • Parámetros y navegación facetada.
  • ID de sesión.
  • Barras finales.
  • Versiones de página alternativas como m. o páginas AMP o imprimir.
  • Paginación.
  • Versiones de país / idioma.

Si su aplicación web(sitio web) tiene diferentes páginas donde el contenido es casi el mismo, hay muchas maneras de informar a Google de su URL preferida. Esto también se conoce típicamente como Canonicalización.

El contenido que se copia de su autor y se pega en un sitio web o blog también puede denominarse contenido plagiado. En esta situación, la persona que copia el contenido lo hace aparecer como su contenido original. Un blog raspado(scraped) o bloque de contenido rara vez cae en esta categoría. Por lo general, Google puede descubrir quién es el autor, un raspador(scraped) generalmente no está tratando de ser un impostor, generalmente solo intentan ofrecer información a sus usuarios. Una vez más, el problema surge cuando el material raspado(scraped) supera al material original. Para estar seguro, simplemente agregue un enlace al original o, si es un fragmento completo de otro material, simplemente vuelva a publicar la publicación en la fuente original. Por lo general, los privilegios son muy fáciles de obtener, a menos que sea un contenido que le da a un sitio web una ventaja competitiva sobre otro. Aún así, esta información es usualmente utilizada con crédito, en especial el contenido relacionado con noticias(news).

Cuando un publicante raspa contenido y lo coloca en otro dominio, para robar el trabajo de otros autores (bloggers, Noticieros, Influencers, Expertos etc), esto puede en casos extremos, generar penalizaciones y la eliminación completa de los motores de búsqueda. Prácticas como esta pueden destruir la experiencia del usuario y son maliciosas, es por esta razón que Google aplica sanciones para proteger la experiencia del usuario y penalizar a cualquiera que intente usar prácticas sucias para ganar tráfico o aumentar posicionamiento de la aplicación o sitio web. Se debe usar la atribución adecuada cuando la información se toma prestada de otras fuentes en línea. Por lo general, en una situación en la que alguien está plagiando su sitio web y haciéndose pasar por usted, esto no es algo que se le atribuya, porque el autor está cometiendo una infracción que, cuando se detecta, dará lugar a una sanción.

Operador de búsqueda avanzada de Google para encontrar contenido duplicado

Si desea verificar si la información fue raspada(scraped) de su sitio sin atribución, simplemente use el operador de Google intext: e incluya una porción de contenido que le interese o sea significativa. Los operadores de búsqueda de Google adicionales que pueden ayudarlo a encontrar contenido duplicado raspado de su sitio incluyen: intitle:, allintitle:, inurl:, allinurl:, allintext:. Pero, sinceramente, la mayoría de las personas no se preocupan por esto: la mayoría de los grandes blogs son raspados(scraped) continuamente. El truco para obtener algo de esta táctica es incluir una estructura de enlaces entrantes sólida, de esa manera podría ganar algo de posicionamiento, tráfico o incluso autoridad con respecto al contenido publicado. La estructura de enlaces de una web juega un papel importante con respecto a los enlaces entrantes externos (backlinks) y los enlaces internos. Ambos casos son ponderados de manera diferente por los motores de búsqueda. Mientras que la estructura de enlace externa es un factor de posicionamiento además de la confianza, la estructura de enlace interna es útil para la navegación del usuario y, al mismo tiempo, importante para transmitir el link juice.

¿El contenido duplicado es malo?

¿Si? ¿No? Tal vez. Realmente depende de la situación. Google es bastante abierto acerca de que no hay una penalización real por el contenido duplicado, ya que Internet está duplicado en un 30%. ¿Qué harían, simplemente eliminar el 30% del contenido en sus servidores? ¿Cómo elegirían ellos?

Casi el 30% del contenido en línea es contenido duplicado. En casos maliciosos, puede causar confusión con los motores de búsqueda, ya que no saben qué versión del contenido debe clasificarse (según la autoridad). Si somos honestos, el contenido duplicado en varios sitios generalmente implica el robo de datos, donde alguien, incluso si se hizo inocentemente, ha robado o copiado contenido de otro sitio web o fuente.

Existen muchas leyes y herramientas de derechos de autor que se pueden utilizar para detectar contenido plagiado. Recuerde, el plagio es mucho peor que un simple raspado o incluso contenido reutilizado en otro sitio web. La infracción no solo incluye la palabra escrita, sino que también se aplica a otras formas de medios, como imagen y contenido de video. Hay muchos lugares para obtener contenido gratuito para usar, pero la mayoría de los lugares cuestan y/o requieren atribución.

Si ha copiado contenido o contenido duplicado en su sitio web, esto puede ocasionar una serie de problemas clave. ¡No solo se considera vago en las redes web actuales, sino que, en algunos casos, puede representar una imagen poco profesional o poco ética de su empresa o la de su cliente! Peor aún.

¿Compraría productos de un negocio que a sabiendas roba y copia el trabajo de otros?

Sé que la respuesta es sí, ¿verdad? Las compañías telefónicas parecen estafarse mutuamente a diario. Pero por un segundo, piénselo con respecto al contenido en línea. Si espera ser la próxima autoridad de contenido, el contenido duplicado no es el camino a seguir. No estamos diciendo que huyas de la distribución de contenido original de otros en tu sitio web, estamos diciendo, usa la atribución adecuada cuando lo hagas. Mantente por encima del tablero cuando se trata de alojar material de otros en tu URL. ¿Dónde está la línea con Google? En caso de raspado / plagio extremo, Google y otros motores de búsqueda podrían imponer una penalización manual contra su URL, perjudicando la rentabilidad de su empresa por el tráfico de búsqueda orgánica.

El propósito de cualquier sitio web es atraer e informar. Cuando tiene contenido duplicado en su sitio web, pierde una gran oportunidad de atraer tráfico a su sitio web, especialmente cuando el motor de búsqueda no muestra su / url con el contenido. Es realmente un riesgo con poco beneficio.

En resumen, el contenido duplicado puede ser malo para su sitio web y malo para sus esfuerzos en línea. Si desea mejorar su SEO, puede comenzar actualizando el contenido de su sitio web y asegurándose de que cualquier contenido duplicado se elimine y se reemplace con una copia original y atractiva que sea relevante para su audiencia y única para su negocio.

¿Qué es el contenido THIN delgado?

Si bien el objetivo de este artículo es hablar sobre formas de detectar contenido duplicado, parece apropiado cubrir rápidamente otra categoría de contenido que se considera malo para el posicionamiento en buscadores (SEO). El contenido delgado puede ser causado por contener contenido duplicado. Pero ¿qué es el contenido delgado? El contenido delgado es contenido que tiene poco o ningún valor para el usuario. Google considera las páginas de entrada, las páginas de afiliados de baja calidad, o simplemente las páginas con muy poco o ningún contenido como páginas de contenido delgado. Pero no caiga en la trampa de solo producir cargas de contenido muy similar: las páginas no originales, páginas con contenido raspado y duplicado, también se consideran páginas de contenido delgado. Además de eso, a Google tampoco le gustan las páginas que están llenas de palabras clave. Google se ha vuelto más inteligente y ha aprendido a distinguir entre contenido valioso y el de baja calidad, especialmente desde la implementación del algoritmo Google Panda.

Desde la introducción original de Google Panda y las actualizaciones posteriores sobre cómo Google clasifica un sitio web; ha habido un tema concurrente de penalizar sitios web que tienen contenido de baja calidad. El contenido delgado (Thin Content) es contenido que ofrece nada o poco valor para un visitante. Se puede definir aún más como páginas de baja calidad en un sitio web o dentro de una tienda de comercio electrónico. Los ejemplos de contenido delgado (Thin Content) incluyen contenido generado automáticamente, páginas duplicadas y páginas de entrada. Si tiene una página en su sitio web en la que los usuarios no permanecen por mucho tiempo o una que claramente rechaza a las personas fuera de su sitio, a veces es un indicador para las arañas de que una página contiene contenido delgado.

En pocas palabras, si una página no ofrece valor a un visitante y está haciendo que la gente se aleje de su sitio, hay problemas con su contenido que querrá abordar rápidamente.

¿Cómo mide Google contenido fino?

Gran parte de lo que Google mide está automatizado. Cuando se trata de medir contenido delgado, hay una métrica particular que utiliza Google. 'Tiempo para hacer clic largo' es efectivo cuando una persona hace clic en un resultado en una página de búsqueda de Google y luego permanece en el sitio de destino durante un tiempo. Digamos, por ejemplo; Si encuentra un artículo que le guste, es posible que desee echar un vistazo al sitio para obtener más información útil. Luego, supongamos que hace clic en un enlace que no es útil, lo que significa que regresa a Google mucho más rápido para buscar otro sitio que proporcione datos más completos o más útiles. Este último se conoce como clic corto.

Para asegurarse de no ser penalizado por tener contenido delgado intente evitar usar contenido duplicado en tu sitio, trate de asegurarse de proporcionar información relevante para sus clientes o clientes potenciales, asegúrese de que los títulos y las descripciones de su página coincidan con lo que realmente está presente en una página web, intente asegurarse de tener un mínimo de al menos 350 palabras por página, asegúrese de que su contenido responda a cualquier pregunta que pueda tener un visitante.

Fuentes
    Comentario
    Image
    Comentarios