Das ganze Duplicate-Content-Geschwafel geht mir langsam auf die Nerven. Ständig sieht man irgendwelche Plugins oder Anleitungen, die einem weismachen wollen, daß man den google-bot von möglichst vielen internen Seiten aussperren soll, damit auch ja kein Text doppelt vorkommt. Ich denke, diese Panik ist völlig fehl am Platz.
Alle was man zum Thema Duplicate Content wissen muß, hat Vanessa Fox von google schon einmal hier zusammengefasst:
… ist also das „Schlimmste“, was Webmastern passieren kann, das Auftauchen der „weniger erwünschten“ Version einer Seite in unserem Index.
Regt euch nicht zu sehr über Websites auf, die euren Content „scrapen“, d. h. ihn sich widerrechtlich aneignen und neu veröffentlichen. Dies ist zwar ärgerlich, jedoch ist es sehr unwahrscheinlich, dass solche Websites einen negativen Einfluss auf die Präsenz eurer Website in Google haben. Wenn ihr einen besonders frustrierenden Fall entdeckt, reicht bitte einen DMCA Antrag ein, um Besitzanspruch auf den Inhalt geltend zu machen; wir befassen uns dann mit der Scraper-Site.
Ein wenig brenzlig kann es werden, wenn man fremden Seiten erlaubt den eigenen Content zu verwenden und diese wesentlich besser ranken als die eigene Seite, Wie man sich dabei verhält, hat seo-scene.de aber schon einmal schön zusammengefasst.
Hier noch meine ernstgemeinten Tips, um Duplicate Content zu vermeiden:
- Stelle nicht Deinen ganzen Artikel auf yigg ein.
- Klaue Deinen Inhalt nicht von wikipedia.
- Gebe Deine bevorzugte Domain in den google webmaster tools (mit oder ohnen www) an.
Über jedes soziale Bookmark würde ich mich freuen.









Duplicate Content hat nicht unbedingt etwas mit geklautem Content zu tun. Darauf kann und sollte man das Thema gerade nicht reduzieren.
Google selbst empfiehlt, sich des Themas anzunehmen:
http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=35769
Selbst Deinem Link folgend sollte man an einer Stelle stutzig werden:
“CMS verstehen: Sorgt dafür, dass ihr damit vertraut seid, wie Content auf eurer Website dargestellt wird, vor allem wenn diese einen Blog, ein Forum oder ähnliche Systeme beinhaltet, die oftmals den gleichen Content in unterschiedlichen Formaten zeigen.”
und
“Kurz gesagt, durch ein generelles Bewusstsein für den Umgang mit Duplicate Content und ein paar Minuten für durchdachte, präventive Pflege eurer Website helft ihr uns dabei, unseren Usern einzigartigen und relevanten Content zu bieten.”
Schau einfach mal nach bei Google.de mittels “site:existenz24.biz” und Du wirst sehen, daß Wordpress Dir gewissermaßen den Content selbst klaut.
Viele Grüße,
René
Wieso klaut mir wordpress den content selbst? Die Suche mittels “site:existenz24.biz” zeigt doch gerade, daß google alle meine Artikel findet, oder etwa nicht?
Du hast massig Dubletten im Index. Schau mal im im Wordpress-Tellerrand bzw. Dash board auf Deine Blog Stats. Theoretisch müßte die Anzahl der Artikel genau der Menge der indexierten Seiten bei Google entsprechen. Tut sie aber nicht.
Deine Artikel finden sich unter verschiedenen Links doppelt und dreifach bei Google. Das nennt sich Duplicate Content und genau das sollte man vermeiden.
Auf die leichte Schulter würde ich es nicht nehmen. Gerade mit Wordpress kommt man schnell in die Situation, dass Google nur noch Mehrfach-Content findet. Wenn man dann wie ich, auch noch die Meta “decription” weglässt, dann landet das gesamte Blog im Supplemental index. Geht ganz schnell…
Schon wieder diese Panik:
Warum denn? Wo ist der Nachteil für mich.
Außerdem sollte google mehr Seiten als Artikel finden. Ich habe auch Kategorien und Tag-Seiten.
Naja, z.B. deine Archivseite für den aktuellen Monat ist eine 1:1 Kopie deiner Startseite (bis auf die Überschrift).
aber das Archiv kann Gift sein, habs auch nicht geglaubt, bis es mir erst vor Kurzem selbst passiert ist, dass ein ganzes Blog nur noch supplemental war. Das hat mehr als die Hälfte der Besucher gekostet.
Die Kategorien würde ich auch nicht aussperren, die bringen immer so schöne Treffer
Wenn du dann noch die Beiträge nicht abkürzt (more…), dann ist ein und derselbe Beitrag auf der Startseite, in der Kategorie und im Archiv zu finden, und das gibt dann nunmal Probleme.
Viele sperren auch noch die “umgeblätterten Seiten” der Startseite per robots.txt aus, weil ja dann Beiträge auf die zweite Seite rutschen, die vorher auf der ersten Seite waren, und der Googlebot ja nicht sofort feststellen kann, dass der Beitrag auf der ersten Seite nicht mehr zu finden ist, das halt ich auch für etwas übertrieben.
Ich verstehe es nicht. Es kann man mir doch egal sein, ob google nun die Startseite, die Kategorie- oder die Archivseite veriinkt. Eine wird immer im Index bleiben.
Genau das ist der Fehler. Google könnte genauso gut sagen, Du seist ein Spamer. Zigfach denselben Content = massiver Verstoß wider Google-Rules = Und tschüß!
Außerdem kommt es auch darauf an, welcher Link im Index steckt. Links auf den Feed bringen nichts.
Das DC-Problem sollte man nicht auf die leichte Schulter nehmen. Man sollte versuchen, ein wenig was dagegen zu tun.
PS: Mit “Und tschüß!” ist die Google Sandbox gemeint. Da taucht man dann an letzter Stelle im Index auf, so ab 500 ungefähr. Nicht witzig!
jetzt kann ich mir ne antwort aber auch nicht länger verkneifen. die anzahl von webseiten, die probleme mit DC in irgendeiner form haben, ist m.e. deutlich gestiegen. gerade ganz grosse portale können da ein lied von singen. zudem blendet google manchmal seiten aus, deren content m.e. nie als doppel zu bezeichnen wäre, nur weil der filter irgendso ein schnipsel findet, das auf der anderen seite auch vorkommt. das hebt nicht gerade mein vertrauen in die qualität der filterung.
Was man mit einer kleinen Brandrede an Kommentaren provozieren kann, ist schon beachtlich. Ich wollte niemanden auf den Schlips treten.
Ich finde es trotzdem falsch, die Indexierung von Kategorie- und Archivseiten zu unterbinden. Eine individuelle Gestaltung mit z. B. the_excerpt Reloaded empfinde ich als sinnvoller.
Sobald man seinen Feed bei Feedburner anmeldet, taucht er übrigens nicht mehr in der Suche auf. Ist zumindest meine Beobachtung.
Hatte auch mal das Problem, dass jemand von meiner Seite für LogoSocken http://www.logo-socken.de den Text von der Startseite geklaut hatte und 1:1 auf seine Seite für den Verkauf von Logosocken gesetzt hatte. Zum Glück hatte ich den Begrüßungstext just in der Woche überarbeitet und gleich reingesetzt. Jetzt können die meinen “schlechteren” Text gern behalten. P.S. der steht immer noch auf deren Seite…