News 09.10.2001, 16:30 Uhr

Trau keiner Statistik, es sei denn, du hast sie selbst verfälscht

Webstatistiken sind ein unverzichtbares Werkzeug für Werber und Webdesigner. Schliesslich will man ja wissen, was sich auf der teueren Webseite tut, und wo Verbesserungen notwendig sind. Doch wie aussagekräftig sind Webstatistiken wirklich?
Nicht ganz zu unrecht kursieren viele Witze über Statistiken: Schiesst etwa ein Jäger zuerst einen Meter rechts an einer Ente vorbei, und beim zweiten Versuch einen Meter zu weit links, so ist das arme Tier statistisch gesehen tot. Oder wussten Sie, dass im Vatikan pro Quadratkilometer zwei Päpste leben?
Subjektive Annahmen oder Erwartungen verändern das Ergebnis einer Statistik, davon sind natürlich auch Webstatistiken betroffen. Wenn ein Browser eine komplette Webseite von einem Server lädt, produziert dieser Vorgang meist gleich mehrere Einträge im Logfile des Servers. Darin werden sämtliche eintreffende Anfragen mit Datum und Uhrzeit gespeichert. Die Aufgabe eines Webstatistik-Programms ist es, diese Zeilen auszuwerten und daraus bunte Grafiken und Tabellen zu erstellen, so dass des Managers Herz vor Freude hüpft.
So etwa sieht ein Eintrag im Logfile eines Webservers aus:
192.168.100.1 [01/Oct/2001:10:45:35 +0000] "GET /index.html HTTP/1.0"
200 1243 "http://www.site.com/" "Mozilla/2.0 (X11; I; HP-UX A.09.05)"
Hier stellt man unter anderem fest, dass der Benutzer mit der Internetadresse 192.168.100.1 am 1. Oktober 2001 um 10:45 die Datei index.html vom Webserver angefordert hat. Sein Betriebssystem war HP-Unix, als Browser wurde Mozilla 2.0 verwendet.
Enthält die angeforderte HTML-Datei, wie in den meisten Fällen üblich, weitere Bestandteile (zum Beispiel Grafiken), so wird für jedes Element ein weiterer Eintrag vorgenommen.
Jede Zeile eines Logfiles beschreibt also eine erfolgreiche Kontaktaufnahme mit dem Webserver. Dies nennt man einen "Hit". Gibt jemand seinen Verkehr auf der Website in Hits an, könnte er gerade so gut auch in Kartoffeln rechnen: Denn mit dieser Information kann man nicht viel anfangen. Kommt eine Webseite beispielsweise ohne ein einziges Bild aus, so wird pro Aufruf auch ein Hit generiert. Sind jedoch zehn Bilder integriert, so zählt man bereits elf Hits für eine Seitenimpression (engl: page impression / view).
Richtig interessant wird die Statistik erst dann, wenn sich ein Benutzer identifizieren lässt, so dass sich Einstiegs- und Ausstiegsseite, Klickpfade (Reihenfolge) und Dauer des Aufenthalts feststellen lassen. Auch gut zu wissen: War der Benutzer schon mal da? Von welcher Website kam er hierher? Welches Betriebssystem und welchen Browser benutzt er?
Der Betreiber einer Website hat verschiedene Möglichkeiten, die Benutzer zu identifizieren. Die sichere Methode ist nach einem passwortgeschützten Benutzernamen zu fragen. Doch in den meisten Fällen scheidet diese Methode von vornherein aus. Denn wer will sich schon registrieren, ohne vorher einen Blick auf die Seite geworfen zu haben?
Die nächste und weit verbreitete Möglichkeit ist die Platzierung eines Cookies [1]. Was aber, wenn der Benutzer den Software-Keks nicht annimmt? Oder ihn zwischen zwei Besuchen löscht? Schwups, der eine Besucher wurde statistisch verdoppelt.
Eine weitere Methode zur Benutzeridentifikation ist die IP-Adresse. Aber auch hier steckt der Wurm drin: Wählt sich der Benutzer beim Provider ein, so wird ihm normalerweise jedes Mal eine neue IP-Adresse zugewiesen und erscheint somit als neuer Benutzer. Hat er einen Proxy [2] aktiviert, so wird der Zugriff gar nicht erst gezählt. Dient eine Firewall [3] zur Sicherung des Firmennetzwerkes, verschmelzen im Logfile meist alle Mitarbeiter zu einem einzigen Besucher, sprich zu einer IP-Adresse.
Programme für Webstatistiken haben also noch mit vielen technischen und sozialen Hürden zu kämpfen, und müssen zwangsweise mit Annahmen (zum Beispiel "eine Benutzersitzung dauert 30 Minuten") arbeiten. Aus diesem Grund gibt jedes Statistikprodukt andere Zahlen aus, so dass eine Besucherzahl von 4 Millionen durchaus auf eine Million schrumpfen kann.
Trotzdem bereiten Statistikprogramme interessante Informationen auf, welche sicherlich eine Orientierung und das Herauslesen von Tendenzen ermöglichen. Denn aus Marketing-Sicht ist eine Homepage ohne Statistik so effektiv wie der Jäger, der stets einen Meter daneben schiesst. Die Ente zumindest freut sich.



Kommentare
Es sind keine Kommentare vorhanden.