http://www.joergkrusesweb.de/browser/kennung
Diese UserAgent-Liste hat mir schon öfer weitergeholfen, besonders bei Safari u. ä.
Ich würde es begrüßen, wenn man die Liste noch um die Eigenschaften des JavaScript-Objekts navigator erweitern könnte, da es oftmals leicher ist, dieses zu verwenden, statt den userAgent zu parsen.
Hallo Matthias,
danke für die Anregung. Eine solche Erweiterung der Liste macht wohl auch Sinn. Sobald ich dazu komme, werde ich die betreffenden Informationen zusammenstellen und die Seite aktualisieren
Jörg
folgende UA kommen immer mal wieder vorbei:
67.15.119.25 User-Agent: User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)
IP zeigt: Everyones Internet
ist das ein Sammler? wer kennt den?
65.214.44.74 Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://sp.ask.com/docs/about/tech_crawling.html)
IP zeigt: UUNET Technologies, Inc.
- ist der echt oder fake?
Das ist die normale Kennung eines Internet Explorer 6 auf Windows 2000:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)
Die zweite Frage habe ich mal in einem Extra-Thread beantwortet:
Bot von Ask.com oder Fake
wäre da nicht "User-Agent: User-Agent:" vor der Browserkennung. Der vollständige UA lautet:
"User-Agent: User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
bei mir sind alle UA gesperrt die mit U beginnen:
RewriteCond %{HTTP_USER_AGENT} ^U.+ [OR]
nicht aber
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) da es sich hier eben um den waschechten IE-Browser handelt.
Siehst Du eine Notwendigkeit diesen speziellen UA freizuschalten?
Achso, das gehört noch zum UA-String. Dann ist es wohl eine schlechte Fälschung und kann getrost gesperrt werden
8-ung
da kommt ein getarnter Spider und holt MB-weise Daten. Ist der eventuell bekannt, sollte man den aussperren?
193.159.174.201 DE GERMANY NORDRHEIN-WESTFALEN DUISBURG TSI FUER GAVI GES. FUER ANGEW. VERSICHERUNGS-INFORMATIK MBH
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)
Die IP ist eine Yahoo
unsere Seiten haben nichts mit Versicherungen zu tun.
Wenn er das Verhalten eines Bots hat (hohe Zahl und niedrige Frequenz an Aufrufen), sich aber über eine Browser-Kennung als menschlicher Besucher ausgibt, würde ich ihn nicht als vertrauenswürdig einstufen.
Ein vertrauenswürdiger Bot...
- weist eine Kennung auf, die sich von einem Browser unterscheiden lässt
- gibt in seiner Kennung eine URL zu einer Webseite an, auf der man sich über ihn informieren kann
- ruft als allererstes die robots.txt auf
- hält sich an die in der robots.txt enthaltenen Verbote
Die Frage zu Yahoo-MMCrawler habe ich in einen eigenen Thread verschoben:
Yahoo-MMCrawler