Referer-Spam

20.10.2004 Seit über einem halben Jahr verzeichnen die Logfiles der Webserver einen stetigen Anstieg von gefälschten Referern, auf den angegebenen Webseiten sucht man oft vergeblich nach einem Link auf die eigene Seite.

In einigen Fällen sollen anscheinend die Webmaster als Besucher angelockt werden, so z.B. wenn die verweisende Seite den Dateinamen awards.html innehat, in den meisten Fällen geht es wie beim Gästebuchspam oder Kommentarspam aber um das Steigern der Linkpopularität der Referer-Seiten, um ein besseres Ranking derselben in den Suchergebnis-Seiten der Suchmaschinen zu erreichen. Da auf manchen Websites die häufigsten Referer als Links aufgeführt sind, lohnt es sich anscheinend auf Verdacht massig Referer-Einträge zu erzeugen. Dieses Vorgehen wird Referer-Spam oder auch Logfile-Spam genannt. Man kann die betreffenden Referer über die .htaccess sperren, aber da diese ständig wechseln, erscheint mir eine solche Abwehrmaßnahme wie ein Kampf gegen Windmühlen.

Das ganze wäre auch nur halb so schlimm, wenn dieser Spam nicht die Statistiken verfälschen würden. Ärgerlich ist es in dem Zusammenhang, wenn sogar Suchmaschinen-Bots einen Referer angeben - die meisten Spider lassen dieses Feld gegenüber dem Webserver sinnvollerweise frei, nicht so aber der HeinrichderMiragoRobot sowie der ABACHOBot, die folgende Referer übermitteln:

http://www.miragorobot.com/scripts/mrinfo.asp
http://www.abacho.de/

Die URLs für weitere Informationen werden normalerweise im Feld User Agent übergeben, der Miragorobot übermittelt diese zusätzlich, der Abachobot nur über das Referer-Feld. Zweck dieses Vorgehens ist es möglicherweise, in Suchmaschinen-Statistiken weiter oben aufgeführt zu werden.

Referer oder Referrer?

Noch ein kleiner Nachtrag zu der Schreibweise des Wortes Referer gegenüber allgemeinsprachlich englisch Referrer. Diese geht zurück auf einen Tippfehler, der Eingang gefunden hat in das offizielle Hypertext Transfer Protocol des W3C.

The Referer[sic] request-header field allows the client to specify, for the server's benefit, the address (URI) of the resource from which the Request-URI was obtained (the "referrer", although the header field is misspelled.)

Es handelt sich gewissermaßen um einen Tippfehler, der sich durchgesetzt hat, und deswegen keiner mehr ist. In Bezug auf HTTP, Webserver und Webseiten sollte man Referer also nur mit drei r schreiben statt wie ansonsten mit vier r

Fortsetzung: Referer-Spam (II)

2 Kommentare / Trackbacks