Duplicate Content-Probleme durch falsche URLs

Hallo zusammen,

bei mehreren unserer Shopwareseiten und diversen anderen Shopwareseiten werden URLs mit dem Muster Detail/index/sArticle von Google indexiert. (Hinweis: Detail groß geschrieben).

Bei der normalen Struktur ( detail klein geschrieben) ist es kein Problem, weil der Canonical Tag auf die SEO URL gesetzt wird.

domain.com/detail/index/sArticle/5

canonical: https://www.domain.com/seo-url.html

Bei Detail/index/sArticle (Detail groß) wird der Canonical Tag allerdings auf sich selbst gesetzt, so dass dann natürlich Duplicate Content entsteht.

Also domain.com/Detail/index/sArticle/5

canonical: https://www.domain.com/Detail/index/sArticle/5

Gibt es eine Möglichkeit, dass die URLs mit Detail großgeschrieben nicht erzeugt werden können? 404 Fehler ausgeben oder umleiten auf detail klein?

Laut Screaming Frog sind die fehlerhaften Seiten auch nicht im Shop verlinkt, aber trotzdem muss der Google Bot die irgendwie crawlen.

Das scheint mir ein allgemeines Shopware SEO Problem zu sein. Betrifft also nicht nur unsere Shops.

Der Fehler tritt auch im Shopware Demo auf:

http://store1.shopwaredemo.de/detail/index/sArticle/277 canonical: http://store1.shopwaredemo.de/detail/index/sArticle/277

Duplicate Content:

http://store1.shopwaredemo.de/ Detail /index/sArticle/277 canonical: http://store1.shopwaredemo.de/ Detail /index/sArticle/277

http://store1.shopwaredemo.de ist völlig veraltet. Aktueller Demo Shop ist https://www.shopwaredemo.de/

@R4M schrieb:

http://store1.shopwaredemo.de ist völlig veraltet. Aktueller Demo Shop ist https://www.shopwaredemo.de/

Danke für Deinen Hinweis.

Da tritt der Fehler auch auf:

https://www.shopwaredemo.de/detail/index/sArticle/277
Canonical: https://www.shopwaredemo.de/lysandro-277

https://www.shopwaredemo.de/Detail/index/sArticle/277
Canonical: https://www.shopwaredemo.de/Detail/index/sArticle/277

 

Die Links mit „/detail/index/…“ gibt es doch gar nicht mehr und werden in aktuellen Shops so gar nicht mehr aufgerufen. Sollte eigentlich ein 301 folgen.

Die Frage ist ja eher, woher Google die URLs hat. 

Das eine ist ja, dass die Links funktionieren - aber wenn Google die nicht hat, dann ist es auch egal ob die funktionieren. Als Fehler würde ich das jetzt nicht sehen, dass diese Urls funktionieren. Maximal, dass der Canonical nicht gesetzt wird.

@Moritz Naczenski schrieb:

Die Frage ist ja eher, woher Google die URLs hat. 

Das eine ist ja, dass die Links funktionieren - aber wenn Google die nicht hat, dann ist es auch egal ob die funktionieren. Als Fehler würde ich das jetzt nicht sehen, dass diese Urls funktionieren. Maximal, dass der Canonical nicht gesetzt wird.

 

Die Frage, woher Google die URLs hat, kann ich leider bisher auch nicht beantworten. Laut Screaming Frog, sind die URLs intern nicht verlinkt. Möglicherweise durch falsch gesetzte externe Links von irgendwo. Laut Backlinkstools konnte ich da bisher aber auch nichts finden, aber irgendie crawlt Google die Duplicate Content URLs.

Fakt ist, dass bisher bei zwei unserer Shops jeweils ca. 90 URLs mit dem Muster /Detail/index/sArticle/ indexiert wurden. Also ist das schon ein Problem, wegen Duplicate Content. Wenn der Canonical fehlt bzw. nicht auf Noindex sind, dann können die auch indexiert werden z.B. durch externe Links.

Als Lösung käme meiner Ansicht nach in Frage:

    • Alle URLs mit dem Muster /Detail/index/sArticle/ leiten automatisch um auf /detail/index/sArticle/ - bei /detail/index/sArticle/ ist ja bereits der korrekte Canonical gesetzt. Hast Du dafür eine Lösung für Apache und nginx wie man das automatisch umleitet?

Alternativ müsste ich nämlich sonst alle bereits von Google gecrawlten URLs mit dem 301 redirect Plugin manuell umleiten und das bei neuen Artikeln immer wieder machen.

Oder:

  1. Canonical geht bei /Detail/index/sArticle/ auf die korrekte SEO URL wie bei /detail/index/sArticle/

Weist Du, wie man das umsetzen kann?