Zur Navigation

Sprunghafter Anstieg von Crawling Fehlern

1 Dolphin (Gast)

Hallo Jörg,

seit einige Wochen erhalte ich Hinweise von Google (über die Webmaster Tools), dass die Anzahl der Crawling Fehler massiv ansteigt. Bislang sind rund 50.000 URLs aufgelaufen.

Der Hintergrund ist offenbar eine Komponente auf meiner Joomla-Seite, welche eine Meta-Job-Suchmaschine einbindet. Offenbar schickt Google jetzt regelmäßig Anfragen im Format

www.meinedomain.de/projekte?l=verschiedene_suchbegriffe und www.meinedomain.de/projekte?q=verschiedene_suchbegriffe

an diese Seite. Ich habe keine Ahnung, wie die Suchbegriffe in die URLs kommen oder wer die abschickt.

Diese Anfragen laufen jedenfalls allesamt auf einen 404-error, da die Suchbegriffe auf der Seite nicht gefunden werden. Zudem gibt es eine Firewall (RSFirewall von RSJoomla), welche diese l und q Parameter als Local file inclusion bewertet.

Da ich - wie gesagt - inzwischen regelmäßig Hinweise von Google erhalte, befürchte ich mittelfristig eine Abwertung unserer Site. Ich würde daher gerne diese Fehler abstellen.

Dazu habe ich zwei Fragen:
1. Wie bewertest Du diese Hinweise von Google? Sollte ich da was tun oder kann ich die vielleicht sogar ignorieren?
2. Falls ich was tun muss: Wie kann ich z. B. über eine Regular Expression verhindern, dass die URLs als Fehler ausgelesen werden bzw.
3. Macht es evtl. Sinn, solche Anfragen auf eine fehlerfreie Contentseite außerhalb der Meta-Suchmaschine umzuleiten (z. B. mit dem Hinweis: Die von Ihnen eingegebenen Suchbegriffe wurden leider nicht gefunden.)

Falls ich gedanklich komplett auf dem Holzweg bin, bin ich für jeden anderen Tipp dankbar.

Gruß,
Uwe

16.02.2014 11:17

2 Jörg

Der Hintergrund ist offenbar eine Komponente auf meiner Joomla-Seite, welche eine Meta-Job-Suchmaschine einbindet.

... und diese Meta-Job-Suchmaschine bindet auch deine Seite in ihre Suche ein?

Offenbar schickt Google jetzt regelmäßig Anfragen im Format

www.meinedomain.de/projekte?l=verschiedene_suchbegriffe und www.meinedomain.de/projekte?q=verschiedene_suchbegriffe

an diese Seite.

Verwendet diese Meta-Suchmaschine u.a. Google, d.h. Google wird durch Suchen in dieser Meta-Suchmaschine veranlasst, diese URLs aufzurufen?

Diese Anfragen laufen jedenfalls allesamt auf einen 404-error, da die Suchbegriffe auf der Seite nicht gefunden werden.

Falls es sich um eine Suchergebnisseite deiner Website handelt, ist ein 404er vielleicht nicht ganz passend. Google sendet auch keinen 404er, wenn es keine Suchergebnisse gibt. Angemessener wäre denke ich eine Meta-Angabe robots "noindex" oder ein Ausschluss in der robots.txt. Wenn sich das nicht realisieren lässt (weil man z.B. /projekte nicht komplett sperren möchte), erfüllt der 404er aber zumindest seinen Zweck, dass die (inhaltslosen) Seiten nicht indiziert werden.

16.02.2014 13:09 | geändert: 16.02.2014 13:10

3 Dolphin (Gast)

Hallo Jörg,

danke für Deine Antworten.

Meine Seite wird nicht in die Suche eingebunden. Es handelt sich dabei letztendlich nur um die Einbindung der Meta-Suchmaschine www.SimplyHired.com. Ich kann leider nicht sehen, ob diese Suchmaschine wiederum Google für die Suche verwendet. Auf der Website steht darüber zumindest nichts.

Offenbar bindet die Joomla-Komponente diese Suchmaschine über eine XML-API in unsere Website ein. Das ist auch soweit ok.

Ich bin nur verunsichert, woher diese merkwürdigen Suchanfragen kommen. Derzeit gehen täglich 20 oder mehr dieser Anfragen ein. Das ist natürlich einerseits Traffic auf der Seite aber andererseits weiß ich nicht, ob das "guter" Traffic ist, der uns z. B. bei Google aufwertet. Oder führen diese ganzen Irrläufer möglicherweise sogar zu einer Abwertung?

Was denkst Du darüber?

Gruß,
Uwe

19.02.2014 08:51

4 Jörg

Meine Seite wird nicht in die Suche eingebunden.

Dann stellt sich die Frage, wie es dazu kommt:

Offenbar schickt Google jetzt regelmäßig Anfragen im Format

www.meinedomain.de/projekte?l=verschiedene_suchbegriffe und www.meinedomain.de/projekte?q=verschiedene_suchbegriffe

an diese Seite.

Unter den Crawling-Fehlern in den Google Webmaster Tools kannst du dir zu jeder aufgeführten URL im Reiter "Verlinkt über..." anzeigen lassen, welche Seiten die fehlerhaften Links enthalten, über die der Googlebot gekommen ist

20.02.2014 18:30

Beitrag schreiben (als Gast)





[BBCode-Hilfe]