Zur Navigation

robots.txt Besucher

1 Jan

Hallo,

was ich nicht gedacht hätte ... Bots sind wirklich lernfähig. Hatte ich noch anfangs Probleme mit Bots die sich nicht an die Regeln halten (wurden dann per .htaccess gesperrt) halten diese sich inzwischen (wurden nach einer Pause wieder aus der .htaccess entfernt) an die Regeln der robots.txt.

Das hat mich doch überrascht.

Was mich aber auch überrascht ... immer mehr einfache User-Agenten (also ohne Bot-Kennung) besuchen die robots.txt. Das ist ja wohl für normale Besucher einer Webseite eher unüblich ...

Mit freundlichen Grüßen - Jan

24.02.2023 14:58

2 Jörg Kruse

immer mehr einfache User-Agenten (also ohne Bot-Kennung) besuchen die robots.txt.

Dahinter können auch Bots stecken, v.a. wenn eine IP-Adresse mit gewöhnlichem User Agent häufiger auftaucht. Indizien hierzu können eine Whois-Abfrage auf die IP-Adresse und Abfragen von Datenbanken wie AbuseIPDB liefern

24.02.2023 15:56 | geändert: 24.02.2023 15:57

3 Jan

Hallo Jörg,

warum sollte sich auch ein normaler Besucher für die robots.txt interessieren ... auf die Idee da da auch Bots hinter stecken könnten bin ich noch gar nicht gekommen :-/

Da die letzte IP-Stelle vom Hoster auf 0 gesetzt ist hilft da eine Abfrage ja leider nichts :-(

Aber AbuseIPDB ist interessant, kannte ich bisher nicht wirklich. Hab mich heute aufgrund deines Hinweises dort mal genauer umgesehen. Leider ist auf dem betreuten Server kein Fail2Ban vorhanden (Shared Hosting). Aber melden kann man ja entsprechende IPs wenigstens.

Mit freundlichen Grüßen - Jan

27.02.2023 16:00

Beitrag schreiben (als Gast)

Die Antwort wird nach der Überprüfung durch einen Moderator freigeschaltet.





[BBCode-Hilfe]