Welche Methoden verwenden GeoIP-Services neben WHOIS-Info?

1045
Learner

Ich habe mich nur gefragt, wie GeoIP-Dienste neben der Überprüfung der IP-Adresse WHOIS-Daten auch Daten über den geografischen Standort von IPs sammeln. Zum Beispiel bin ich auf diese Website gestoßen, die besagt, dass sich IP 74.207.244.221 in Fremont, Kalifornien befindet: https://ipinfo.io/74.207.244.221

Aber ich kann diese Info auf dieser IP-Whois-Information nicht finden. ipinfo.io erklärt folgendes:

Ursprünglich wurden in unserer API MaxMind-Daten verwendet, aber wir waren sehr damit beschäftigt, eigene Geolocation-Daten zu erstellen. Wir haben große Fortschritte gemacht und verwenden jetzt unsere eigenen Daten, um rund die Hälfte aller Anfragen zu bearbeiten. Wir greifen jedoch immer noch auf MaxMind-Daten zurück

Und das hat mich interessiert. Auf welche Weise sammeln Dienste wie ipinfo.io und MaxMind GeoIP-Daten?

11

2 Antworten auf die Frage

11
Fanatique

Diese Dienste verwenden normalerweise drei Möglichkeiten, um eine IP-Adresse zu lokalisieren:

  1. Wenn man durch Whois - Datenbanken für eine Adresse suchen;
  2. Verfolgung von umgekehrten DNS-Abfragen zum Auffinden von Hinweisen auf der Grundlage von Datensätzen mit Domänennamen oder Verfolgung des Pfads des an das Ziel gesendeten Pakets, was auch Hinweise geben kann (z. B. mithilfe von Traceroute).
  3. Und schließlich verwenden sie die RTT-Triangulation.

Die Round-Trip-Time (RTT) -Triangulation ist eine Methode, mit der die ungefähre Geolocation einer IP-Adresse durch Messen der Ping-Latenz von drei verschiedenen Standorten ermittelt wird.

Wenn Sie beispielsweise drei Server haben, die in Form eines Dreiecks auf der ganzen Welt verteilt sind, und wenn Sie von allen drei eine IP-Adresse anpingen und für die Latenz die gleichen Ergebnisse erhalten, bedeutet dies, dass sich die IP-Adresse genau dort befindet die Mitte dieses Dreiecks. Es ist die Art und Weise, wie die Triangulation funktioniert. In diesem Fall wird sie jedoch mit ICMP-Pings verwendet.

Ressourcen, die Sie lesen können:
Was ist Ping? @ Wikipedia
SIGCOMM Paper über RTT-Triangulation

Wow, ich würde nie denken, dass es eine auf RTT basierende Triangulation gibt. Interessant. Wenn also ein Server nicht geografisch lokalisiert werden möchte, kann dies zu einer zufälligen Verzögerung der ICMP-Antworten führen. Learner vor 5 Jahren 5
Ich möchte hinzufügen, dass es hilfreich sein könnte, sich tracert / traceroute anzuschauen, wie auf iplocation.net geschrieben: "Sie können den Befehl 'traceroute' verwenden, um Hinweise auf den Ort der IP-Adresse zu finden. Die Namen der Router, über die Pakete, die von Ihrem Host zum Zielhost fließen, weisen möglicherweise auf den geografischen Pfad des endgültigen Standorts hin. " Learner vor 5 Jahren 0
@Learner das ist eine nette Ergänzung, die sich aber bereits in meiner Antwort in Form von "Tracking Reverse DNS Queries" befindet. Obwohl Traceroute dies nicht wirklich tut, zeigt es Ihnen alle Domains / Adressen an, über die eine Abfrage läuft. Ich werde eine Notiz hinzufügen, um es dennoch klarer zu machen :) Fanatique vor 5 Jahren 1
5
Ben Dowling

Ich bin der Gründer von IPinfo, daher kann ich definitiv einige Details dazu anbieten! Es gibt keine einzige Methode oder eine einzige Datenquelle, um eine eigene Geolocation-Datenbank (oder einen unserer anderen Datensätze, wie z. B. IP to company oder IP to carrier) zu erstellen. Es ist eine Mischung aus verschiedenen Datensätzen, Datenverarbeitungstechniken und Lektionen, die dies seit einigen Jahren gelernt hat!

Einige Datenquellen und Techniken, die nicht oft erwähnt werden, sind:

  • Direkte Feeds von ISPs. Unser Service bearbeitet täglich rund 500 Millionen API-Anforderungen und wurde auf vielen beliebten Websites mit hohem Bekanntheitsgrad eingesetzt. Daher sind ISPs dazu angehalten, uns genaue, aktuelle Geolocation-Daten zur Verfügung zu stellen, damit ihre Kunden eine großartige Erfahrung im Web erhalten. Wir arbeiten ständig mit immer mehr ISPs zusammen.

  • GPS-Standortdaten. Es ist möglich, genaue Positionsinformationen mit GPS auf mobilen Geräten zu erfassen. Sie können dies mit der IP-Adresse und einigen Inferenzen der Netzwerktopologie koppeln, um den Standort für IP-Bereiche zu ermitteln, wenn nur ein paar Messungen vorgenommen werden.

  • Vom Benutzer eingereichte Korrekturen Wenn der Standort falsch ist (oder nach einer Änderung nicht aktualisiert wurde), erhalten wir oft schnell Feedback von den Benutzern und können den Standort manuell korrigieren oder unseren Algorithmus anpassen, um sicherzustellen, dass er beim nächsten Durchlauf richtig lokalisiert wird unsere Datenverarbeitungs-Pipeline.

Für unseren IP-zu-Unternehmens-Datensatz kratzen wir jeden Monat jeden einzelnen Domain-Namen und verweisen auf die Daten, die wir dort extrahieren, mit IP-Besitzinformationen, R-Records und mehr. Anschließend verwenden wir die Daten zum Domain-Scraping, um zu zeigen, welche Domains auf welchen IP-Adressen gehostet werden, und in unserem IP-Typ-Klassifizierer zusammen mit vielen anderen Datenquellen, um die Wahrscheinlichkeit zu bestimmen, dass eine IP-Adresse hauptsächlich als ISP für Privatkunden verwendet wird. Geschäft oder Hosting-Anbieter. Wir analysieren auch die Link - Struktur der Seiten, und einige dieser Daten zeigen host.io .

Vielen Dank! Ich habe nicht erwartet, dass der Gründer dieser Website auf meine Frage antworten wird :) Es war sehr interessant. Learner vor 5 Jahren 0