Sie können den Crawler blockieren, indem Sie die folgenden IP-Bereiche blockieren:
78.46.174.128/27 & 108.61.0.0/16 & 5.101.96.0/21
Sobald Sie diese blockieren, sollte der Versuch, eine Seite mit archive.today zu indizieren, zu einer Endlosschleife auf ihrer Site führen.
Sie können es in iptables tun wie:
sudo iptables -A INPUT -s 78.46.174.128/27 -j DROP sudo iptables -A INPUT -s 108.61.0.0/16 -j DROP sudo iptables -A INPUT -s 5.101.96.0/21 -j DROP
Und ich stelle mir vor, dass Apache und Ngix etwas Ähnliches tun können.
Archiv besiegt:
Wenn Sie dies nicht sehen, haben sie wahrscheinlich einige neue IPs.