doppelte Inhalte zu Hauf - score_rewrite_urls wird ignoriert?

Guten Morgen,

entweder habe ich eine Montagsversion der Software oder aber die folgenden Probleme müssten doch schon bei anderen aufgetaucht sein. Auf der Lösungssuche für einen Fehler, finden sich immer weitere…

Die WMT zeigen doppelte Inhalte an

1. Beispiel

http://www.domain.de/SEO-URL

http://www.domain.de/SEO-URL?sPartner=xxx

Wenn man reichlich Partner hat oder auch die Dateien für Produktlister mit Partnerid trackt, ist das bescheiden.

 

2. Beispiel

http://www.domain.de/detail/index/sArticle/562/sCategory/5
http://www.domain.de/SEO-URL

Beide URLs rufen den gleichen Artikel auf.

 

3. Beispiel

/detail/index/sArticle/471/sCategory/45
/detail/index/sArticle/471

Beide URLs rufen den gleichen Artikel auf.

 

4. Beispiel

http://www.domain.de/SEO-URL

http://www.domain.de/SEO-URL?c=6

Hierzu habe ich einen 4 Jahre alten Beitrag gefunden, wonach dies damals behoben wurde. Mein Shop ging im März 2016 online in der damals aktuellsten Version und es werden alle Updates gemacht.

noch eine Variante dazu:

/seourlartikel1?c=42
/seourlartikel1?c=62
/seourlartikel1?c=6

Alle 3 URLs rufen den gleichen Artikel auf.

 

Hier werden in Kürze auch doppelte Inhalte zu erwarten sein:

/detail/index/sArticle/780
/detail/index/sArticle/782
/detail/index/sArticle/788

Diese URLs erschienen auf unerklärliche Weise in den WMT, obwohl eine SEO-URL angelegt ist. Jedoch sind weder die o.g. noch die SEO urls bisher in der Sitemap enthalten gewesen.

Der Eintrag in der Datenbank ist korrekt, bei Mouseover oder Klick im Shop selbst wird die SEO-URL mit ?c=x angezeigt/aufgerufen.

Inzwischen habe ich stichprobenartig die URLs aus der score_rewrite_urls geprüft - ältere und ganz neue - alle Artikel sind über SEO-URL und o.g. aufbau zu erreichen, bei allen Artikeln wird im Shop die SEO-URL angezeigt. Und genau diese Anzeige im Shop habe ich vor Liveschaltung geprüft und mich drauf verlassen, dass alles richtig läuft.

 

Jetzt lasse ich noch außen vor, dass in den WMT URLs auftauchen, deren Aufbau es bei SW nicht gibt oder gab (das wird hoffentlich an anderer Stelle gelöst).

Ich habe zu SW gewechselt um SEO-technisch bessere Möglichkeiten zu haben, als zuvor. Im Moment sieht mir das nach einer Fehleinschätzung aus…

Tauchen diese Fehler nur bei mir auf oder hat sie vielleicht bisher noch keiner bemerkt? Ich hab sie auch mehr oder weniger zufällig entdeckt.

LG

 

Hallo,

grundsätzlich ist das völlig korrekt und in Ordnung, dass die genannten Seiten über verschiedene URLs erreichbar sind. Das ist ja auch bewusst so gebaut.
Du müsstest bei dir im Seitenquelltext einmal prüfen, ob es einen korrekten Canonical gibt. Der Canonical gibt immer die eindeutige SEO-URL an, welche von den Suchmaschinen auch für den Index genommen werden soll.

Dann ist natürlich auch ein Aufruf über die URL mit Parameter oder ohne SEO-Link möglich. Diese Angaben werden bei dem Canonical-Tag herausgefiltert und nur der reine SEO-Link angezeigt

Viele wichtige Infos bekommst du auch über den SEO Guide

Sebastian

Hallo Sebastian,

vielleicht hatte ich da auch eine falsche Vorstellung was beim Aufruf von /detail/index/sArticle/780 passieren soll. Bei meinen 301-Weiterleitungen in der htaccess springt bei Eingabe der alten URL wird die Seite aufgerufen und in der Browserzeile steht die neue/richtige URL. So habe ich das hier auch erwartet.

Wenn ich diese Artikel aufrufe, steht bei sowohl bei /detail/index/sArticle/780 und bei Aufruf über die SEO-URL im Header:

Wäre dann wohl richtig?

Warum erscheint bei den wmt dann die Variante mit der ID, vor allem, da sie bisher nie in einer Sitemap aufgetaucht war? Die dazugehörige SEO URL ist hingegen schon seit Jahren im Index, da sie aus dem alten Shop stammt. Bis zur Aktivierung dieser Artikel in der letzten Woche, hatte google auch immer wieder versucht, die SEO-URL zu crawlen.

Wenn dieser canonical-tag so richtig ist, sollte google nichts zu meckern haben.

LG

 

 

 

  

Hallo,

korrekt. Also wenn der Non-Seo-Link aufgerufen wird oder ein Link mit Parametern, dann leitet Shopware diesen nicht um. Nur bei alten SEO-URLs erfolgt aus der Shopware Tabelle heraus eine 301 Weiterleitung auf die neue, aktive URL. Daher gibt es ja speziell den Canonical Tag. 

Ich bin kein Google Experte. Ich glaube aber, dass in den WMT ja alles auftaucht, was der Crawler so findet und was auf den Seite verlinkt ist. Das bedeutet nicht, dass Google diese dann auch indiziert.

Über die Suche hier im Forum solltest du auch noch deutlich mehr finden zu dem Thema, da es immer mal wieder aufkommt. Ist eher eine Google Thema. Von Shopware-Seite wird der Duplicate Content, also auch das Mehrfach-Erfassen von ein und derselben Seite, durch den Canonical verhindert.

Auch bei Google findest du sehr hilfreiche Infos, z.B. https://support.google.com/webmasters/answer/139066?hl=de

Sebastian

Hallo,

ob der Non-Seo-Link indiziert wird, weiß ich nicht. Aber zumindest reklamieren die wmt die Beispiele 1-3 oben als doppelte Inhalte. Sonst wäre es mir nicht aufgefallen. Daraus hätte ich geschlossen, dass google den canonical-tag nicht erkennt. Bei onpage.org ist der Anhang ?c=x glaube ich auch schon aufgetaucht, muss ich nochmal schauen.

LG