Wie Sie feststellen können, ob ein Benutzer auf einen Link geklickt hat

378
usr371

Ich habe große Verkehrsdateien, die ich statistisch analysieren möchte, um zu überprüfen, ob ein Benutzer auf Links in bestimmten Websites klickt.

Es ist wichtig zu sagen, dass meine Pakete nach Flüssen (IP1 <=> IP2) sortiert sind.

Meine erste Idee war, in den Paketen nach Inhalt zu suchen und nach Hrefs und Links zu suchen, sie alle in einer Art Datenstruktur mit ihren Zeitstempeln zu speichern und dann erneut über die Pakete zu iterieren, um zum Zeitpunkt des Links nach Abfragen zu suchen .

So ähnlich wie im folgenden Pseudocode:

for each packet in each flow: search for "href" or "http://" or "https://" save the links with their timestamp for each packet in each flow: if it's an http request and its url matches some url in the list and the  time is close enough, record it 

Das Problem bei diesem Code ist, dass einige (wichtige) Verknüpfungen dynamisch generiert werden, während die Seite geladen wird, und mit der oben genannten Methode nicht gefunden werden können.

Eine andere Idee war, das Referrer-Feld im http-Header zu überprüfen und nach Paketen zu suchen, die von den relevanten Sites referenziert wurden. Diese Methode generiert aufgrund von Frames und eingebetteten Objekten viele Fehlalarme.

Es ist wichtig zu erwähnen, dass dies nicht mein Server ist, und ich beabsichtige, ein Werkzeug für die statistische Analyse des Nutzerverhaltens zu erstellen (daher kann ich meiner Site keinen Click-Tracker hinzufügen).

Hat jemand eine Idee, was kann ich tun, um zu überprüfen, ob die Benutzer entsprechend ihrem Netzwerkverkehr auf Links geklickt haben?
Jede Hilfe wird geschätzt!
Vielen Dank

0
Sie verwenden das falsche Werkzeug für den Job. Warum nicht (zumindest) die Serverprotokolle verwenden? Wenn die Verknüpfungen dynamisch generiert werden, können Sie diese Informationen auch nicht abrufen, ohne entweder dieselbe Generierung durchzuführen (es muss sich um ein Muster handeln?) Oder um ein gutes Erraten. Es ist wahrscheinlich, dass es nur eine Reihe von Möglichkeiten gibt, auf eine bestimmte Site zuzugreifen. Seth vor 6 Jahren 0
Vielen Dank für Ihre Antwort! Ich denke, Sie haben recht und meine Sichtweise ist hier falsch. Meine Absicht ist es, das Verhalten der Benutzer nur anhand ihres Datenverkehrs zu bestimmen, und nach meinen Annahmen werde ich keinen Zugriff auf den Server selbst haben (auf lange Sicht würde ich das Linkklickverhalten für einige (bestimmte) Websites prüfen wollen, also Ich kann keine serverseitigen Programme verwenden. Ich habe tatsächlich gesehen, dass es Klicks gibt, die nicht als vollständige Form (aber als Verkettung von Variablen) im Paket erscheinen. \ N Haben Sie eine andere Vorstellung davon, was ich tun kann, um das zu überprüfen? usr371 vor 6 Jahren 0

0 Antworten auf die Frage