Die Tatsache, dass der Webserver des Unternehmens den berüchtigten HTTP-Fehler 404 an eine URL zurückgegeben hat, bedeutet nicht, dass die Ressource nicht vorhanden ist. Das bedeutet nur, dass der Webserver entschieden hat, dass diese Ressource für Sie nicht vorhanden ist .
Der Webserver kann Sie anhand zahlreicher Methoden als zahlenden Kunden identifizieren. Zu den wichtigsten gehören ein HTTP-Cookie, das in Ihrem Browser gespeichert ist. Wenn der Cookie nicht gefunden wird, fordert Sie der Webserver normalerweise dazu auf, sich anzumelden. Wenn der Cookie erfolgreich ist, wird er zurückgegeben.
Die Frage ist dann, warum Googlebot Zugriff gewährt wird, aber Sie nicht?
Googlebot kann schließlich fast jede Website erkennen, der Webmaster kann jedoch einen frühen Besuch mit den in Get your content bei Google enthaltenen Tools anfordern . Er kann den Bot auch mithilfe einer Robots.txt-Datei in bestimmte Ordner leiten .
Ein Beispiel für eine solche Datei ist:
User-agent: googlebot User-agent: google User-agent: bingbot User-agent: bing Disallow: /bedven/bedrijf/ Crawl-delay: 10 User-agent: * Disallow: /
Der Bot identifiziert sich selbst, indem er beispielsweise im Header der HTTP-Anfrage ein User-Agent- Tag verwendet googlebot
.
Es ist jedoch keine leichte Angelegenheit, die Identität von Googlebot anzunehmen. Die Website kann die Identität des Bots leicht überprüfen, indem eine umgekehrte DNS-Suche nach der zugreifenden IP-Adresse durchgeführt wird. Der zurückgegebene Domainname muss in diesem Fall entweder googlebot.com
oder sein google.com
, was Sie selbst nicht vortäuschen können.
Wenn Sie Ihren Webserver vollständig steuern, zum Beispiel über PHP, können Sie diesen Mechanismus duplizieren und eine so genannte "Mitgliedschaftswebsite" erstellen. Diese Software wird als Mitgliedschaftssoftware bezeichnet .
Wenn Sie kein PHP-Programmierer sind oder eine solche Investition Ihrer Zeit nicht wünschen, gibt es viele Open-Source-Softwarealternativen, aber auch viele kommerzielle Produkte, die für Ihr Unternehmen im Wettbewerb stehen. Seien Sie sehr kritisch, wenn Sie sich für eine entscheiden, und überprüfen Sie diese im Internet gründlich auf Rezensionen.
Weitere Informationen finden Sie in diesen Ressourcen, die ich über eine Suche gefunden habe (nicht unbedingt die besten, und einige sind recht kommerzieller Natur, aber sie werden Ihnen den Einstieg erleichtern):