Zur Navigation

"Preferred domain" in den Webmastertools

1 Martin

Hallo,
ich habe vor längerem von dieser Option Gebrauch gemacht und die www-Version in den Webmastertools angegeben.
Jetzt habe ich bei der Hilfe dort folgendes gefunden:


You can tell us your preferred domain by adding the site to your Google Sitemaps account and verifying site ownership. Then, simply click the site link on the Dashboard and click Preferred Domain from the Diagnostic tab. Choose from the following:

* Display URLs as http://www.yoursite.com
* Display URLs as http://yoursite.com
* Don't set an association

If you choose don't set an association, we may treat the www and non-www versions of the domain as separate references to separate pages. If you choose a version, we use that information when crawling links to your site that use either version of the URL. We also use the information to help us determine how to display URLs for your site in the index.

Was ist mit association gemeint?
Und hätte bei beiden Versionen (mit/ohne www), die oben genannt sind, nicht der slash am Schluss noch gesetzt sein müssen: yoursite.com/ ?

Grüße,

Martin


Grüße

18.06.2007 21:16

2 Rudy

Mit Association ist die explizite Zuweisung der Referenzen auf die Domain auf die www oder www-lose Variante gemeint. Wenn Du keine wählst, "könnte" Google annehmen, dass dieselbe URL mit www und ohne zwei verschiedene Seiten gleichen Inhalts sind

Und hätte bei beiden Versionen (mit/ohne www), die oben genannt sind, nicht der slash am Schluss noch gesetzt sein müssen: yoursite.com/ ?
Das ist ein bloß als Beispiel gedacht, um klar zu machen, was mit der Darstellung der URL gemeint ist. Ein Trailing-Slash ist dafür nicht relevant.

Btw. ist die www-Subdomain total überflüssig und hat nur historische Gründe. Persönlich würde ich der www-losen Variante den Vorzug geben. Die URLs ohne www sehen nebenbei auch noch schicker aus und bereiten weniger Schreibarbeit ^^

18.06.2007 21:43 | geändert: 18.06.2007 21:49

3 Jörg

Diese Zuweisung könnte auch durch eine permanente Weiterleitung (Status Code 301) von der einen zur anderen Domain erreicht werden. Und man kann die Zuweisung natürlich auch über Weiterleitung und über die Google Tools machen, wenn man doppelt sicher gehen möchte...

18.06.2007 22:11 | geändert: 18.06.2007 22:13

4 Martin

Danke für die schnellen Antworten.
Sorry, aber das mit der association habe ich evtl. noch nicht verstanden. Man soll sich für die mit oder ohne www-Version entscheiden. Und als dritte Option könnte man auch bewusst auf eine Klarstellung der Standard-Domain verzichten, indem man angibt "don't set an association"?
Wenn ich von der ganzen Sache überhaupt gar keinen Gebrauch mache, ist das doch das Gleiche, warum es explizit sagen?

Wegen dem Slash:
Ich weiß nicht mehr, ob ich den bei Festlegung auf die www-Version mitangegeben habe.

Wenn ich jetzt in diese Rubrik "preferred domain" bei den Webmastertools reingehe, dann sehe ich ganz oben
"www.domain.de/ > preferred domain" Also MIT slash.

Weiter unten steht aber der Satz "The preferred domain name www.domain.de was set on Mar 24, 2007." Also OHNE slash!?

Könnt ihr aufgrund eurer eigenen Erfahrung mit dieser Möglichkeit der Festlegung einer Standard-Domain sagen, ob in meinem Fall mit oder Slash für Google zählt bzw. von mir angegeben worden sein muss? Oder wie kriege ich das raus? Wie man an dem Hilfetext oben sieht, ist das (Nicht-)Vorhandensein des Slash nicht immer beabsichtigt bzw. ein Indiz.

Grüße,

Martin

Grüße

18.06.2007 23:35

5 Jörg

Und als dritte Option könnte man auch bewusst auf eine Klarstellung der Standard-Domain verzichten, indem man angibt "don't set an association"?
Wenn ich von der ganzen Sache überhaupt gar keinen Gebrauch mache, ist das doch das Gleiche, warum es explizit sagen?

Du sagst Google damit, dass es sich um zwei verschiedene Domains handelt. Wenn du Google nichts mitteilst, wird sie versuchen, anhand anderer Kriterien selbst zu entscheiden, ob es sich um ein oder zwei Domains handelt. Die Wahl könnte dabei so oder so ausfallen. Mit der Option nimmst du Google diese Entscheidung ab.

Wegen dem Slash:
Ich weiß nicht mehr, ob ich den bei Festlegung auf die www-Version mitangegeben habe.

Das ist völlig egal - wie Rudy schon sagte, handelt es sich hier nur um Beispiele. Der Slash gehört zur URL der Startseite der Domain. Hier geht es aber um die Zuordnung der Domains als solche und diese haben keinen Slash. In meiner Version der Google Webmaster Tools muss man auch nur eine Checkbox markieren, kann also nichts falsch machen. Falls man die Domain auch noch in irgendein Eingabefeld eingeben kann, wird Google einen Trailing Slash wohl entweder selbst entfernen oder eine Fehlermeldung ausgeben

19.06.2007 05:12 | geändert: 19.06.2007 05:17

6 Martin

Ah verstehe, es gibt also Fälle, in denen es mit und ohne www tatsächlich zwei verschiedene Domains sein sollen. Darauf wäre ich gar nicht gekommen. Kenne das Thema nur wegen der DC/Kanonisierung-Problematik.

Du meinst also, das preferred domain-Tool ist NUR dazu gedacht, mit/ohne www festzulegen und hat mit mit der Slash-Sache gar nichts am Hut bzw. der Slash wäre hier sogar verkehrt, weil eindeutige Domain und korrekte URL zwei verschiedene Sachen sind.
Ob ich Checkboxen hatte weiß ich nicht mehr, aber es hat mich verwirrt, weil wie gesagt in der Rubrik preferred domain oben der Slash dabei ist und in dem Satz unten nicht. Daher dachte ich, die Slash-Sache gehöre dazu.

Das würde nun bedeuten, das unvermeidliche Problem mit falschen Links (ohne Slash, z.B. Webkataloge, deren Skript den Slash z.T. automatisch wegnimmt) muss/soll/kann per 301 gelöst werden. Ich würde dazu gern den Code als Grundlage verwenden, der das mit/ohne www definiert und die Anweisung Nicht-Slash-Links auf "mit Slash" umzuleiten ergänzen.
Ich habe folgenden Code zur Sache mit/ohne www gefunden:

RewriteEngine on
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\.domain\.de$
RewriteRule ^(.*)$ http://www.domain.de/$1 [L,R=301]

Kannst du mir sagen, wie das mit der Slash-Anweisung ergänzt werden muss? Oder steckt das bereits drin, da ja vor "$1" ein Slash zu sehen ist? Oder besagt das evtl. die 2. Zeile bereits?

Martin

19.06.2007 10:59

7 Jörg

es hat mich verwirrt, weil wie gesagt in der Rubrik preferred domain oben der Slash dabei ist und in dem Satz unten nicht.

Ja, von daher könnte man vielleicht sagen, dass die dortigen Beispiele nicht ganz sauber gewählt sind. Für die Zuordnung der Domains hat der Slash jedenfalls keine Bedeutung

Um einen fehlenden Slash braucht der Server sich auch nicht zu kümmern, da dies die Angelegenheit des Browser ist. Eine URL wie http://example.org ist unvollständig, da ihr der Parameter REQUEST_URI fehlt - der Browser ergänzt dann automatisch den Slash. Ein Request ohne den Slash (d.h. ohne REQUEST_URI) würde der Server mit einem "400 Bad Request" quittieren.

Anders ist es vielleicht noch bei Verzeichnissen, bei denen der schließende Slash fehlt:

example.org/dir

Aber auch hier leiten Server meistens automatisch weiter, wenn sie eine Datei /dir nicht finden, dafür aber ein Verzeichnis /dir/.

19.06.2007 11:28 | geändert: 19.06.2007 11:30

8 Martin

Die Webserver sind darauf eingestellt, aber ich dachte beim Beispiel der (wegen des fehlenden Slash) "falschen" Links z.B. aus Webkatalogen eher an die Suchmaschinen, die Links mit und ohne Slash nicht unbedingt zuverlässig der EINEN Domain zuordnen.

Normalerweise sollte das eine Suchmaschine auf die Reihe bekommen, wäre auch traurig andernfalls, denn ich vermute, dass viele Links ohne den Slash gesetzt werden. Aber es scheint vorzukommen, dass sich Pagerank und Linkpower aufteilen auf www.domain.de und www.domain.de/ . Vielleicht über ein paar Ecken, G ist nicht perfekt, die Webmaster auch nicht...
Folgender Artikel ist ganz interessant (auch die Kommentare dazu):
http://www.ragepank.com/articles/68/that-trailing-slash-does-matter/

Deshalb dachte ich, auf Nummer Sicher gehen, wer weiß, wozu es nochmal gut sein kann und vielleicht wertet es die Links ohne slash doch etwas auf. Und wenn man es mit der www-Geschichte verbinden kann, in einem Aufwasch...

Martin

19.06.2007 17:47 | geändert: 19.06.2007 17:53

9 Jörg

Hallo Martin,

der von dir verlinkte Artikel behandelt ja einen anderen Fall, den ich oben aber ja auch bereits beschrieben hatte (unter "Anders ist es vielleicht noch bei Verzeichnissen"):

www.example.com/page/ is not the same as www.example.com/page - in Google's eyes they are 2 different pages.

In beiden Fällen ist hier der REQUEST_URI vorhanden: einmal als /page/ und einmal als /page - der Browser muss hier also nichts korrigieren und sendet zwei unterschiedliche Requests. Anders im Fall www.example.com versus www.example.com/ - im ersten Fall wäre der REQUEST_URI leer, so dass der Browser hier ein "/" ergänzen muss, damit der Request vom Server nicht als ungültig zurückgewiesen wird.

Wie ich in meinem letzten Beitrag weiter unten geschrieben habe, wird der Fall www.example.com/page vom Server oft auch selbstständig korrigiert durch eine permanente Weiterleitung. Ob dies der Fall ist, kannst du einfach testen, indem du www.example.com/page aufrufst. Ein Problem kann sich höchstens dann ergeben, wenn www.example.com/page/ nur virtuell erzeugt wurde, z.B. durch Modrewrite - dann leitet der Server nicht weiter, weil er kein reales Verzeichnis zum Weiterleiten findet. In solchen Fällen muss man noch durch eine Modrewrite Rule nachhelfen. Aber der Fall www.example.com ist in jedem Fall unproblematisch, weil Browser und Bots hier einen Slash ergänzen müssen, wenn sie nicht ins Leere (Fehler 400) laufen wollen. Du kannst ein www.example.com serverseitig deswegen auch nicht korrigieren, weil der Server solche Requests gar nicht erst annimmt

19.06.2007 18:09

10 Jörg

Nachtrag:

vielleicht macht diese Übersicht das Gesagte etwas deutlicher:

Browser: example.com/page -> "/page" = zeig mir die Datei page im Rootverzeichnis
Server liefert Datei page aus; falls Datei page nicht vorhanden, sucht er nach Verzeichnis page und leitet, falls vorhanden, weiter nach example.com/page/

Browser: example.com/page/ -> "/page/" = zeig mir das Verzeichnis page im Rootverzeichnis
Server liefert Index-Datei des Verzeichnis page aus

Browser: example.com/ -> "/" = zeig mir das Rootverzeichnis
Server liefert Index-Datei des Rootverzeichnis aus

Browser: example.com -> "" = zeig mir nichts
Server sagt: "hä?"

Damit dies nicht passiert, handeln Browser in aller Regel so:
Browser: example.com = example.com/ -> "/" = zeig mir das Rootverzeichnis
Server liefert Index-Datei des Rootverzeichnis aus

19.06.2007 18:27