WordPress: Duplicate Content erzeugen

Ich habe ja schon viel darüber geschrieben, wie man in WordPress Duplicate Content vermeiden kann, es geht aber auch anders.

Duplicate Content lässt sich bei einer WordPress-Installation sehr leicht erzeugen, besonders dann, wenn die Seite Permalinks verwendet. Neben der Permalink-URL sind alle Beiträge weiterhin über die Default-URLs, z.B. www.example.com/?p=10 und www.example.com/index.php?p=10, erreichbar. Der Parameter bei p steht dafür für die interne WordPress-ID, die mit jedem Artikel oder Blogrolleintrag hochgezählt wird.

Wenn man diese Artikel, mit den Standard-URLs von extern anlinkt, ensteht eine Menge Duplicate Content.

Wie kann man das vermeiden? Schön wäre eine Umleitung aus der .htaccess heraus, soweit ich weiß, kann man dort aber nicht per Wildcard umleiten. Auch ein rewrite dürfte nichts bringen, die Permalink URLs sind in der .htaccess unbekannt.

Optimal wäre ein Plugin, dass für jeden Artikel eine 301 Umleitung der Default-URL auf die Permalink-URL in die .htaccess einträgt, mir ist aber keines bekannt, dass diese Funktionalität bietet.

Alternativ kann man diese unerwünschten URLs auch in der robots.txt sperren. Zumindest der Googlebot kann mit Wildcards umgehen und deshalb genügt es, eine Zeile hinzuzufügen:

Disallow: /*?p=*

Damit verbietet man den Bots jede URLs zu crawlen die „?p=“ enthalten.

ACHTUNG: Das sollte man nur tun, wenn man wirklich Permalinks aktiviert hat! Sonst schießt man seine eigene Seite aus dem Index. 😉

Share this content: