googles canonical problem - falsch berechnete Eingangsseiten und doppelter Inhalt

Seit ca. 2005 kämpft google nun schon mit dem canonical-Problem. Diese beschreibt den Fehler, dass google die Einstiegsseite
einer Domain nicht richtig bestimmt bzw. bestimmen kann. Die normale Einstiegsseite einer Domain wäre zum Beispiel: www.domain.de/index.html oder
www.domain.de/index.php. Doch googles Algorithmus scheint Probleme damit zu haben, die Seite eindeutig zu bestimmen.


Eigentlich nicht schlimm, könnte man nun behaupten. Ist es aber doch. Da google die Seite nun unter www.domain.de in den Index auf nimmtaber gleichzeitig
auch unter www.domain.de/index.html führt, glaubt der Algorithmus nun zwei Seiten mit dem komplett identischen Inhalt vor sich zu haben, aufrufbar mit 2 verschiedenen URLs.
So entsteht ungewollt Duplicate Content, nur im Sinne der Suchmaschine natürlich. Bestefalls wird nur die eine Seite nicht mehr indiziert, schlimmstenfalls wird die komplette Domain
von der SUMA ( Suchmaschine ) für ca. 6 Monate gesperrt.


Der schlimmere Fall ist allerdings der, dass durch die Umstellung des WWW als Subdomain, nun auch alle Domains unter doamin.de als auch unter www.domain.de zu erreichen sind.
Hiermit werden nun alle auf der Domain befindlichen Seiten doppelt gefunden alsbald der Bot auf einen Link auf einer externen Seite mit und ohne das www stösst.


Yahoo und MSN haben diese Probleme nicht.


Seitenbesitzter sollten also per link: Abfrage die Seiten im google Index auf das conanical Problem hin prüfen. Dazu reicht es
die link: Abfrage mit und ohne www zu stellen. ( link:www.domain.de und link:domain.de ).


Finden sich unter den gefundenen Seiten jeweils Seiten mit und ohne www vor dem Domainnamen, so hat man es höchstwahrscheinlich mit dem canonical Problem zu tun.


Abhilfe


Abhilfe schafft hier eigentlich nur ein permanenter Redirect ( 301 ) der Seiten ohne www auf die Seiten mit www.
Dies bewerkstelligt man mittels der htaccess Datei, die im Root der Homepage liegt und den Server anweist bestimmte ankommende Befehle
besonders zu behandeln. So auch den get-Befehl des Browers nach einer bestimmten Seite.
Leider lassen sich nicht alle Server gleich behandeln. Vielmehr kommt es auf das System an mit dem der Server läuft.
Ein Apache Server läßt sich zum Beispiel mittels dieser Befehle zum Redirect bewegen:


RewriteEngine on


RewriteCond %{HTTP_HOST} !^www\.domain\.de$


RewriteRule ^(.*)$ http://www.domain.de/$1 [L,R=301]


301 Redirect - aber bitte richtig


Als erstes sollte man einmal testen ob die Seite überhaupt unter beiden URLs zu erreichen ist.
Dazu gibt man im Adressfeld des Browers einmal die Domain mit und ohne www ein. Wird die Seite geladen und
ändert sich gleichzeitig nicht die URL von www.domain.de in domain.de oder umgekehrt, so sollte man
einen permanenten Redirect (301) setzten.


Hierzu erstellt man, wenn nicht schon vorhanden, im Root der Domain eine Datei namens .htaccess (der Punkt vor dem Dateinamen ist beabsichtigt),
und schreibt die obigen Anweisungen in die Datei und lädt sie anschliessend auf den Server des Providers.


Testen kann man den Redirect wieder mittels der Eingabe der beiden URLs mit und ohne www. Dieses Mal muss sich allerdings
bei der Eingabe der Adresse ohne www ( domain.de ) das Adressfeld im Browser ändern zu www.domain.de. Geschieht dies, so funktioniert der Redirect ab jetzt.
Wird die Seite gar nicht mehr geladen, so muss man die RewriteCondition anders ausführen.


DVI und HDMI Kabel

Monitorkabel

High End Audio- und Videokabel