Dies ist eine alte Version des Dokuments!
LU08c - LogAudit
Lernziele
- …
LogFiles analysieren
Das Zugriffsprotokoll (access_log) eines Webservers enthält viele interessante Informationen über die Nutzung einer Website. Oder, auf den Punkt gebracht, sie enthält: Wann welche Inhalte wie oft von wie vielen Nutzern abgerufen werden.
Die Nutzung einer Website kann durch Kennzahlen beschrieben werden, die ohne grossen Aufwand und mit Hilfe von Auswertungsprogrammen aus den LogFiles generiert werden können. Dies sind:
- die Anzahl aller übertragenen Dateien (Hits)
- die Anzahl der abgerufenen Seiten (Page Impressions)
- die Anzahl der Anwendersitzungen (Visits)
Hits | Hits sind die Anzahl aller Objekte, die vom WebServer abgerufen werden. Dabei ist es gleichgültig, ob es sich dabei um statische HTML-Dokumente oder dynamisch durch CGI-Skripte erzeugte Dokumente handelt, um Grafiken, Audio- oder Videodateien oder andere Dateitypen. Der Begriff Hits wurde in den Anfangsjahren des WWW eingeführt, ist aber eine wenig aussagekräftige Messgrösse: Wenn eine HTML-Seite viele grafische Elemente enthält, werden auch mehr Hits erzeugt, ohne dass dies etwas über das Benutzerverhalten aussagen würde. |
---|
Page Impressions | Page Impressions (oft auch Page Views genannt) sind die Anzahl der HTML-Dokumente, die vom WebServer abgerufen wurden. Grafiken und andere Dateiformate bleiben unberücksichtigt. In einer LogFile-Analyse sollten somit immer mehr Hits als Page Impressions vorhanden sein. Der Zugriff auf eine HTML-Seite, in der 10 Grafiken enthalten sind, verursacht 11 Hits und eine Page Impression. |
---|---|
Visits | Visits sind die Anzahl der Anwendersitzungen einer Website. Eine Anwendersitzung ist dabei ein zusammenhängender Nutzungszeitraum einer Website durch einen Clientrechner, beginnend mit dem erstmaligen Abruf einer Ressource auf dieser Website. Ein Visit wird als beendet betrachtet, wenn der Clientrechner einen festgelegten Zeitabschnitt lang keine Anforderung gestellt hat. Visits sind nicht gleichbedeutend mit der Anzahl der Benutzer einer Website. Die Berechnung der Anzahl der eindeutigen Benutzer ist nur eingeschränkt und unter einigen Annahmen möglich. Welche Probleme hier bestehen, wird nachfolgend erläutert. |