Zur Navigation

Wordpress - URLs die man nicht kennt

1 Jan

Hallo Jörg,

immer wieder finde ich URL die mir einfach unbekannt waren, wie z.B

66.249.64.0 - - [20/Feb/2023:18:48:14 +0100] "GET /noindex/css/bootstrap.min.css HTTP/1.1" 200 19341 "eigene-domain" "Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/109.0.5414.101 Safari/537.36"

Natürlich war ich neugierig was das denn für eine CSS sein soll, also selber aufgerufen ... und tatsächlich die gibt es! Nur ... woher kommt diese denn?

Eine lokale Suche in einem Backup der Seite fand die Datei

/plugins/wp-optimize/vendor/tubalmartin/cssmin/gui/third-party/bootstrap/css

Wie kommt Google darauf diese Seite anzufragen? Mit dem jeweiligen Seiteninhalt hat doch dieses Plugin nichts zu tun?

Mit freundlichen Grüßen - Jan

21.02.2023 22:29

2 Jörg Kruse

Google möchte wissen, wo die einzelnen Inhalte auf der Seite dargestellt werden, z.B. ob weiter oben im sichtbaren Bereich oder erst nach dem Scrollen oder nach Klick auf einem Tab sichtbar. Dazu muss der Bot auch alle CSS- und Java-Script-Dateien holen, die in den HTML-Dokumenten eingebunden sind.

22.02.2023 11:25 | geändert: 22.02.2023 11:27

3 Jan

Hallo Jörg,

Danke für deine Erläuterung. Das ist mir natürlich auch bekannt und auch klar. Deshalb sind doch entsprechende CSS oder JS auch in der Webseite verlinkt ... diese aber nicht. Und deshalb wunderte ich mich auch bei Durchsicht des Logs über die erscheinende URL ...

Wie auch immer ... das Plugin ist wieder entfernt. Und damit das Problemchen erledigt.

Mit freundlichen Grüßen - Jan

24.02.2023 14:31

4 Jörg Kruse

Bei dem Vendor-Paket tubalmartin/cssmin handelt es sich um einen CSS-Compressor:

https://packagist.org/packages/tubalmartin/cssmin

Beim Einschalten der betreffenden Option von wp-optimize könnte das Bootstrap-CSS, welches möglicherweise zu einem Theme oder einem anderen Plugin gehört, komprimiert eingebunden worden sein? und der Googlebot hat zu dem Zeitpunkt die entsprechenden Seiten gecrawlt...

24.02.2023 15:25 | geändert: 24.02.2023 15:27

5 Jan

Hallo Jörg,

deine Vermutung wird passen, denn das Plugin war ein paar Tage aktiv!

Mit freundlichen Grüßen - Jan

27.02.2023 15:46

... 1 Monat später ...

6 Jan

Hallo Jörg,

40.77.167.0 - - [29/Mar/2023:04:34:59 +0200] "GET /accommodation/suite-room/ HTTP/1.1" 301 - "-" "Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm) Chrome/103.0.5060.134 Safari/537.36"

Kein Eintrag davor, keiner danach. Und vermutlich gab es die Seite tatsächlich mal. Vorgänger auf dem Server hatten da einiges installiert, probiert etc. aber leider kein sauberes System hinterlassen.

Die URL Könnte durch ein Hotel Booking Plugin entstanden sein und Bing hatte diese in Erinnerung ...

Allerdings gibt es die URL definitiv nicht, weshalb auch ein 404er kommen sollte ...

93.236.0.0 - - [30/Mar/2023:16:09:51 +0200] "GET /accommodation/suite-room/ HTTP/1.1" 404 77871 "-" "Mozilla/5.0 (X11; Linux x86_64; rv:102.0) Gecko/20100101 Firefox/102.0"

Und der 404er kommt auch ... wenn ich die Seite aufrufe. Nur warum bekommt Bing einen 301er und ich den 404er?

Bestimmt wieder so ein WP-Feature ;-)

Mit freundlichen Grüßen - Jan

PS: Und eben finde ich doch noch einen späteren Eintrag

40.77.167.0 - - [28/Mar/2023:20:48:14 +0200] "GET /accommodation/suite-room/ HTTP/1.1" 404 77871 "-" "Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm) Chrome/103.0.5060.134 Safari/537.36"

Und da bekommt Bing Stunden später doch einen 404er ... Nur warum vorher den 301er ... Tstst

30.03.2023 16:29 | geändert: 30.03.2023 17:01

7 Jörg Kruse

In dem Logfile sind Angaben für Host und Port nicht enthalten.

example.com:80 würde beispielsweise nach example.com:443 weitergeleitet, wenn du eine Standard-Weiterleitung nach https:// eingerichtet hast. Oder www.example.com:443 nach example.com:443. Der im Logfile enthaltene Request URI dagegen bleibt gleich.

30.03.2023 22:05 | geändert: 30.03.2023 22:07

1 Forenmitglied fand diesen Beitrag gut

Beitrag schreiben (als Gast)

Die Antwort wird nach der Überprüfung durch einen Moderator freigeschaltet.





[BBCode-Hilfe]