Das ganze Duplicate Content-Geschwafel

Das ganze Duplicate-Content-Geschwafel geht mir langsam auf die Nerven. Ständig sieht man irgendwelche Plugins oder Anleitungen, die einem weismachen wollen, daß man den google-bot von möglichst vielen internen Seiten aussperren soll, damit auch ja kein Text doppelt vorkommt. Ich denke, diese Panik ist völlig fehl am Platz.

Alle was man zum Thema Duplicate Content wissen muß, hat Vanessa Fox von google schon einmal hier zusammengefasst:

… ist also das „Schlimmste“, was Webmastern passieren kann, das Auftauchen der „weniger erwünschten“ Version einer Seite in unserem Index.

Regt euch nicht zu sehr über Websites auf, die euren Content „scrapen“, d. h. ihn sich widerrechtlich aneignen und neu veröffentlichen. Dies ist zwar ärgerlich, jedoch ist es sehr unwahrscheinlich, dass solche Websites einen negativen Einfluss auf die Präsenz eurer Website in Google haben. Wenn ihr einen besonders frustrierenden Fall entdeckt, reicht bitte einen DMCA Antrag ein, um Besitzanspruch auf den Inhalt geltend zu machen; wir befassen uns dann mit der Scraper-Site.

Ein wenig brenzlig kann es werden, wenn man fremden Seiten erlaubt den eigenen Content zu verwenden und diese wesentlich besser ranken als die eigene Seite, Wie man sich dabei verhält, hat seo-scene.de aber schon einmal schön zusammengefasst.

Hier noch meine ernstgemeinten Tips, um Duplicate Content zu vermeiden:

  1. Stelle nicht Deinen ganzen Artikel auf yigg ein.
  2. Klaue Deinen Inhalt nicht von wikipedia.
  3. Gebe Deine bevorzugte Domain in den google webmaster tools (mit oder ohnen www) an.

Über jedes soziale Bookmark würde ich mich freuen.

ADDThis del.icio.us MrWong yigg Digg

Popularity: 5% [?]

This entry was posted in Allgemein and tagged , , , . Bookmark the permalink. Post a comment or leave a trackback: Trackback URL.

13 Comments

  1. Posted 17. July 2007 at 22:09 | Permalink

    Duplicate Content hat nicht unbedingt etwas mit geklautem Content zu tun. Darauf kann und sollte man das Thema gerade nicht reduzieren.

    Google selbst empfiehlt, sich des Themas anzunehmen:
    http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=35769

    Selbst Deinem Link folgend sollte man an einer Stelle stutzig werden:
    “CMS verstehen: Sorgt dafür, dass ihr damit vertraut seid, wie Content auf eurer Website dargestellt wird, vor allem wenn diese einen Blog, ein Forum oder ähnliche Systeme beinhaltet, die oftmals den gleichen Content in unterschiedlichen Formaten zeigen.”

    und

    “Kurz gesagt, durch ein generelles Bewusstsein für den Umgang mit Duplicate Content und ein paar Minuten für durchdachte, präventive Pflege eurer Website helft ihr uns dabei, unseren Usern einzigartigen und relevanten Content zu bieten.”

    Schau einfach mal nach bei Google.de mittels “site:existenz24.biz” und Du wirst sehen, daß Wordpress Dir gewissermaßen den Content selbst klaut.

    Viele Grüße,

    René

  2. Posted 17. July 2007 at 23:08 | Permalink

    Wieso klaut mir wordpress den content selbst? Die Suche mittels “site:existenz24.biz” zeigt doch gerade, daß google alle meine Artikel findet, oder etwa nicht?

  3. Posted 18. July 2007 at 08:11 | Permalink

    Du hast massig Dubletten im Index. Schau mal im im Wordpress-Tellerrand bzw. Dash board auf Deine Blog Stats. Theoretisch müßte die Anzahl der Artikel genau der Menge der indexierten Seiten bei Google entsprechen. Tut sie aber nicht.

    Deine Artikel finden sich unter verschiedenen Links doppelt und dreifach bei Google. Das nennt sich Duplicate Content und genau das sollte man vermeiden.

  4. Posted 18. July 2007 at 09:18 | Permalink

    Auf die leichte Schulter würde ich es nicht nehmen. Gerade mit Wordpress kommt man schnell in die Situation, dass Google nur noch Mehrfach-Content findet. Wenn man dann wie ich, auch noch die Meta “decription” weglässt, dann landet das gesamte Blog im Supplemental index. Geht ganz schnell…

  5. Posted 18. July 2007 at 10:25 | Permalink

    Schon wieder diese Panik:

    “Das nennt sich Duplicate Content und genau das sollte man vermeiden.”

    Warum denn? Wo ist der Nachteil für mich.

    Außerdem sollte google mehr Seiten als Artikel finden. Ich habe auch Kategorien und Tag-Seiten.

  6. Posted 18. July 2007 at 10:58 | Permalink

    Naja, z.B. deine Archivseite für den aktuellen Monat ist eine 1:1 Kopie deiner Startseite (bis auf die Überschrift).
    Die Kategorien würde ich auch nicht aussperren, die bringen immer so schöne Treffer ;-) aber das Archiv kann Gift sein, habs auch nicht geglaubt, bis es mir erst vor Kurzem selbst passiert ist, dass ein ganzes Blog nur noch supplemental war. Das hat mehr als die Hälfte der Besucher gekostet.

    Wenn du dann noch die Beiträge nicht abkürzt (more…), dann ist ein und derselbe Beitrag auf der Startseite, in der Kategorie und im Archiv zu finden, und das gibt dann nunmal Probleme.
    Viele sperren auch noch die “umgeblätterten Seiten” der Startseite per robots.txt aus, weil ja dann Beiträge auf die zweite Seite rutschen, die vorher auf der ersten Seite waren, und der Googlebot ja nicht sofort feststellen kann, dass der Beitrag auf der ersten Seite nicht mehr zu finden ist, das halt ich auch für etwas übertrieben.

  7. Posted 18. July 2007 at 15:59 | Permalink

    Ich verstehe es nicht. Es kann man mir doch egal sein, ob google nun die Startseite, die Kategorie- oder die Archivseite veriinkt. Eine wird immer im Index bleiben.

  8. Posted 18. July 2007 at 16:02 | Permalink

    Genau das ist der Fehler. Google könnte genauso gut sagen, Du seist ein Spamer. Zigfach denselben Content = massiver Verstoß wider Google-Rules = Und tschüß!

    Außerdem kommt es auch darauf an, welcher Link im Index steckt. Links auf den Feed bringen nichts.

    Das DC-Problem sollte man nicht auf die leichte Schulter nehmen. Man sollte versuchen, ein wenig was dagegen zu tun.

  9. Posted 18. July 2007 at 16:03 | Permalink

    PS: Mit “Und tschüß!” ist die Google Sandbox gemeint. Da taucht man dann an letzter Stelle im Index auf, so ab 500 ungefähr. Nicht witzig! ;)

  10. Posted 18. July 2007 at 17:32 | Permalink

    jetzt kann ich mir ne antwort aber auch nicht länger verkneifen. die anzahl von webseiten, die probleme mit DC in irgendeiner form haben, ist m.e. deutlich gestiegen. gerade ganz grosse portale können da ein lied von singen. zudem blendet google manchmal seiten aus, deren content m.e. nie als doppel zu bezeichnen wäre, nur weil der filter irgendso ein schnipsel findet, das auf der anderen seite auch vorkommt. das hebt nicht gerade mein vertrauen in die qualität der filterung.

  11. Posted 19. July 2007 at 11:28 | Permalink

    Was man mit einer kleinen Brandrede an Kommentaren provozieren kann, ist schon beachtlich. Ich wollte niemanden auf den Schlips treten. ;-)

    Ich finde es trotzdem falsch, die Indexierung von Kategorie- und Archivseiten zu unterbinden. Eine individuelle Gestaltung mit z. B. the_excerpt Reloaded empfinde ich als sinnvoller.

    Sobald man seinen Feed bei Feedburner anmeldet, taucht er übrigens nicht mehr in der Suche auf. Ist zumindest meine Beobachtung.

  12. Posted 19. January 2008 at 15:12 | Permalink

    Hatte auch mal das Problem, dass jemand von meiner Seite für LogoSocken http://www.logo-socken.de den Text von der Startseite geklaut hatte und 1:1 auf seine Seite für den Verkauf von Logosocken gesetzt hatte. Zum Glück hatte ich den Begrüßungstext just in der Woche überarbeitet und gleich reingesetzt. Jetzt können die meinen “schlechteren” Text gern behalten. P.S. der steht immer noch auf deren Seite…

  13. internet Benzer
    Posted 13. September 2008 at 06:39 | Permalink

    Ja richtig finde ich das auch. Ich habe auch seit jahren nicht beobachten können das ein Duplicate dem eigentlichen Verfasser geschadet hätte. Die Suchmaschinen Google merkt zum beispiel welcher Content schon länger besteht und bewertet den neuen Content kaum im Index

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

  • Tags