URL-Hijacking

16.01.2005 Mit dem Status Code 302 Found und einer Weiterleitungs-Adresse teilt der Webserver dem Browser oder Bot mit, dass die angefragte Datei vorübergehend an der angegebenen Adresse (URI) zu finden ist, siehe hierzu auch die Status Code Definitions des Hypertext Transfer Protocols:

302 Found
The requested resource resides temporarily under a different URI. Since the redirection might be altered on occasion, the client SHOULD continue to use the Request-URI for future requests.

Unter der Weiterleitungsadresse ist die angefragte Seite bei einem 302 Redirect also nicht dauerhaft zu finden - im Gegensatz zu eine 301 Moved Permanently. Soweit jedenfalls der Standard, in der Praxis wird eine 302 Weiterleitung oft auch genutzt, um gewöhnliche Links zu maskieren, oder zu "tracken" (zu verfolgen), so z.B. von einigen Webkatalogen. Dies ist allerdings irreführend, weil die betreffende Webkatalogseite ja nicht vorübergehend umzieht auf die verlinkte Seite.

Suchmaschinen müssen echte von falschen 302 Weiterleitungen unterscheiden, da sie vorübergehende Adressen nicht indizieren. Seit einiger Zeit schon treten hierbei vermehrt Probleme auf: so werden in den Suchergebnisseiten von Google in einigen Fällen anstelle der Originalseiten die Weiterleitungsseiten von Webkatalogen angezeigt. Dies wurde mittlerweise als URL-Hijacking, aber auch als Google Bug bezeichnet, obwohl Google sich eigentlich korrekt verhält: die Weiterleitungsseite behauptet ja, dass der Inhalt auf der verlinkten Seite nur vorübergehend dorthin umgezogen ist, also wird dieser auch weiter unter der vermeintlich alten Adresse aufgeführt, in dem Fall eben der Weiterleitungsseite des Webkataloges.

Google hat das Problem der vielfach falsch eingesetzten 302 Weiterleitungen wohl einige Zeit handhaben können, indem es diese von den richtigen unterschied und dementsprechend anders behandelte. Das funktioniert nun allerdings seit einiger Zeit nicht mehr hundertprozentig. Die vermehrt auftretenden Fälle von Hijacking sollte nun Anlass genug sein, dass Webmaster die Status Codes der Webserver gemäß den HTTP Standards korrekt einsetzen. Auf der anderen Seite kann eine Suchmaschine einem Status Code, der eine Weiterleitung von einer Domain zu einer anderen anzeigt, nicht grundsätzlich trauen, so dass Google daran arbeiten sollte, die Erkennung von falschen 302ern wieder zu verbessern.

In meinem Forum habe ich einer kleinen Liste Seiten aufgeführt, auf denen diese Problematik eingehender diskutiert wurde oder auf denen Tipps gegeben wurde, wie man eine gehijackte Seite wieder in den Suchmaschinen-Index bekommt: Google Bug bei Weiterleitungen.

2 Kommentare / Trackbacks