Zur Navigation

ia_archiver

1 Mario

der Eine sammelt auch Daten für den Anderen, oder ist es nicht vielmehr der gleiche Klub? www.alexa.com = www.archive.org ?


UA: ia_archiver
ip: 209.237.238.224

goelocation:
209.237.238.224 US UNITED STATES CALIFORNIA SAN FRANCISCO ALEXA INTERNET

http://www.archive.org
The Internet Archive is a 501(c)(3) non-profit that was founded to build an ‘Internet library,’ with the purpose of offering permanent access for researchers, historians, and scholars to historical collections that exist in digital format. Founded in 1996 and located in the Presidio of San Francisco, the Archive has been receiving data donations from Alexa Internet and others.


Mario

07.05.2006 20:18

2 Jörg

Ja, der ia_archiver ist für Alexa wie auch für das Internet-Archiv unterwegs

07.05.2006 21:04 | geändert: 07.05.2006 21:09

3 Jörg

Der ia_archiver verursacht bei mir in letzter Zeit viele 404 Fehler, indem er Seiten mit Anker aufruft (die '#' als '%23' codiert):

209.237.238.228 - - [25/May/2006:14:32:52 +0200] "GET /bb-codes-t-1060-1.html%23p9 HTTP/1.0" 404 2730 forum.joergkrusesweb.de "-" "ia_archiver" "-"

Normalerweise sollten Clients für ihre Anfragen den Anker einfach abschneiden :/?

26.05.2006 10:56 | geändert: 26.05.2006 10:57

4 Jörg

Da der ia_archiver nicht damit aufhört, diese Anfragen mit Anker zu stellen, ich ihn andererseits nicht völlig blocken möchte, gebe ich ihm jetzt Nachhilfe:

RewriteRule ^(.+)\#(.+)$ $1 [R=301]

Mal schauen, ob er's so packt...

31.05.2006 21:53

Beitrag schreiben (als Gast)





[BBCode-Hilfe]