Duplicate Content (DC)


Ein duplizierter oder kopierter Inhalt, in dem wortgetreue Vorlagen ganz oder in Teilen auf anderen Webseiten veröffentlicht wurde, gilt nicht nur für Doktorarbeiten als regelwidriges Verhalten, das Strafen nach sich ziehen kann.

Mit der immer weiter voranschreitenden Entwicklung der Suchmaschinen werden solche Inhalte auch vom Crawler bei Google entdeckt. Google erkennt dabei nicht nur wortgetreue Kopien, sondern auch größtenteils identische Inhalte, bei denen nur manche Begriffe geändert worden sind. Solch ein Verhalten kann nicht nur rechtliche Konsequenzen haben, wenn z.B. das Copyright eines Inhalts verletzt wird. Auch bei den Verhaltensrichtlinien von Google wird Duplicate Content aus verschiedenen Gründen nicht akzeptiert.

Warum wird Duplicate Content abgestraft?

Erstens hat sich Google auf die Fahnen geschrieben, dass die Inhalte des von ihm durchsuchten und in den Suchergebnissen präsentierten Bereich des Internets echten informationellen Mehrwert für den Nutzer darstellen soll. Dies hat nicht nur “ethische”, sondern auch ganz pragmatisch wirtschaftliche Gründe. Vielfach vorhandene Inhalte gleicher Art frustrieren die Nutzer, die daraufhin ihr Suchverhalten bei der Suchmaschine reduzieren könnten.

Dies könnte wirtschaftliche Einbußen für Google bedeuten, da die bezahlten Anzeigen nicht mehr die gleiche Reichweite unter den Nutzern erzielen würden. Außerdem lässt sich für die Suchmaschine bei gleichen Inhalten nicht mehr ganz ohne weiteres feststellen, von welcher URL der eigentliche Urheber stammt. Der Vergleich und die Analyse in Bezug auf die Urheberschaft ist zwar möglich, erfordert jedoch Extra-Aufwand.

Gründe für Duplicate Content

Festgestellter Duplicate Content wird daher mit Strafen belegt, die von der Herabstufung im Ranking bis in extremen Fällen zum Ausschluss vom Suchindex reichen können. Eine Webseite, die hauptsächlich DC bietet, würde somit kaum noch oder gar nicht mehr in den Suchergebnissen gefunden werden. Dieser extern genannte Duplicate Content muss noch nicht mal in böser Absicht z.B. des Gewinn Abschöpfens entstanden sein.

Manche Pressebeiträge, Chatbeiträge oder zitierte wissenschaftliche Beiträge werden munter geteilt, aber ohne entsprechende Signale an Google wie den “Nofollow” publiziert. Das gleiche passiert z.B. mit einem längeren Werbetext, der von verschiedenen Anbietern der gleichen Produkte 1:1 übernommen wird, weil sie der Hersteller dazu ausdrücklich berechtigt hat. Daher wird z.B. der Versuch unternommen, solche Beiträge nicht als Text, sondern als Bilder einzustellen, die dann entsprechend viel Text enthalten.

Interner Duplicate Content

Ein anderes Thema ist im Unterschied zum o.a. Externen Duplicate Content der Interne Duplicate Content. Auch hier wird ein und derselbe Inhalt unter zwei URL gefunden, womit sich die originale URL nicht ausloten lässt. Interner Duplicate Content entsteht häufig unbewusst bzw. aus Nachlässigkeit. Wenn ein Webmaster z.B. eine Neugestaltung oder einen Umzug von Seiten vornimmt, aber die alten Seiten nicht vom Server nimmt oder einen entsprechenden Weiterleitungslink setzt, sind gleiche Inhalte in dieser Domain doppelt vorhanden. Ähnliches passiert, wenn in einer komplexen Navigation ein Inhalt aus zwei verschiedenen Taxonomien angesteuert werden kann, z.B. als Produkt und als Forschungsergebnis. Häufig wird auch die Neugestaltung einer Webseite auf dem gleichen Server betrieben, aber diese sogenannte Entwicklungsumgebung ist für Google nicht als solche gekennzeichnet und damit vom Crawling ausgenommen. In diesem Fall braucht Google keine Strafen heranziehen. Man bestraft sich vielmehr selbst. Das oder die zentralen Keywords der beiden Seiten sind identisch und leisten sich damit Konkurrenz. Sie fressen sich als sogenannte Cannibalizing Keywords praktisch gegenseitig und sinken gemeinsam auf einen niedrigeren Platz bei den Suchergebnissen.

Wie geht man gegen Duplicate Content vor?

Wenn man den Verdacht hat, dass ein vorgelegter Text oder die Seite einer Website so einen Duplicate Content enthält, lässt sich das relativ leicht mit einer Google Suche herausfinden. Man setzt den zu suchenden Inhalt in Anführungszeichen. Wörtliche Kopien werden dann entdeckt. Sollte Google daraus bisher keine Konsequenzen gezogen haben, kann man eine entsprechende Meldung im Spam-Report schicken. Zudem kann der Betreiber der Webseite zum Löschen aufgefordert bzw. können rechtliche Schritte eingeleitet werden. Für solche Prüfungen stehen auch Tools im Internet zur Verfügung, die man bei entsprechend wertvollen Inhalten auch automatisiert nutzen sollte.

Und gegen den internen DC?

Ähnliches gilt für den internen Duplicate Content auf der eigenen Seite. Je umfangreicher und komplexer eine Website oder eine ganze Domain angelegt ist, desto mehr erhöht sich die Wahrscheinlichkeit des unbeabsichtigten Duplicate Content. Ganz gleich, ob man selbst der Webmaster ist oder die Seite für einen Kunden betreut, ist ein regelmäßiger Check sinnvoll, um die eigenen Bemühungen für ein erfolgreiches Content Marketing nicht zu untergraben. Man checke insbesondere das Archiv, den möglicherweise parallelen Zugang über https://… oder https://www. und die Entwicklungsumgebung. Wiederkehrende Textbausteine sollten immer kurz sein. Je einfacher und klarer eine Navigation strukturiert ist, desto geringer ist die Möglichkeit, dass sich Duplicate Content findet – und desto leichter kommen die Nutzer einer Webseite zurecht.

Über den Beitrag


Sie lesen gerade


Unsere Leistungen


Sie haben Fragen?

Stichwörter zum Thema
Duplicate Content (DC)