Seiten laut Google aufgrund von robots.txt nicht crawlbar, obwohl alles in Ordnung ist

MCube · 18. September 2019 um 06:48

Hallo zusammen,

für mehrere einzelne Seiten wird in den Google Suchergebnissen keine Meta Description angezeigt. (Fehlermeldung: Für diese Seite sind keine Informationen verfügbar.) In der Search Console wird mir dann folgender Fehler angezeigt: Indexiert, obwohl durch robots.txt-Datei blockiert.

Bei Überprüfung der robots.txt Datei ist allerdings alles in Ordnung. Ein manueller Test zeigt an, dass die Seite durch den Bot gecrawlt werden kann. Im Quelltext selbst steht die Seite auf index und follow.

Ich hatte diesen Fehler vor ein paar Wochen schon einmal. Es waren vereinzelte Seiten betroffen. Nach einem erneuten Crawl durch Google war alles wieder „normal“. In dieser Zeit hatte unsere Seite allerdings einiges an Rankings einbüßen müssen. Deswegen wäre ich froh, wenn mir jemand weiter helfen könnte.

Betroffene Seite: http://bit.ly/2lTeh6f

Robots.txt: http://bit.ly/2kM8X4s

Viele Grüße,

MCube

NextMike · 18. September 2019 um 08:52

Kann leider nicht viel helfen. 2 Punkte sind mir aufgefallen:

es ist keine Standard robots.txt. Aus welchen Grund werden andere Pfade gesperrt und widerum mehr zugelassen? Hier ist eine Standard: https://www.shopwaredemo.de/robots.txt
die Seite ist nicht auf Deutsch, sie wird wohl kaum im deutschen Index landen

MCube · 18. September 2019 um 09:11

Die robots.txt wird ja zum teil von Shopware selbst erstellt, wenn ich das richtig verstanden habe. Ich würde gerne das Crawl Delay rausnehmen, habe aber hier im Forum keine Antwort gefunden wie ich es kann. Die index Datei auf dem Server, auf welcher ich die ausgeschlossenen Seiten eintrage, beinhaltet die Infos gar nicht.

Die Seite war ja ne ganze Zeit lang indexiert und ist es momentan auch noch. Nur die robots.txt hindert Google alle zwei Wochen daran die Seite zu crawlen. Kann da weder ein Muster noch eine bestimmte Zeit festellen.

NextMike · 18. September 2019 um 09:39

Liegt eine robots.txt auf dem Server? Hast du ein Projekt übernommen oder alles selbst gemacht? Geh noch mal auf meine Punkte aus ersten Antwort ein.

MCube · 18. September 2019 um 10:01

Ich hab auf dem Server eine index Datei dort kann ich die gesperrten Pfade eintragen. Also nicht die komplette Datei bearbeiten. Die Pfade sind deshalb gesperrt, da /us/ /reseller/ einfach nur duplizierte Seiten mit anderer Währung sind, so sind diese Seiten teilweise doppelt in den Suchergebnissen erschienen bzw. haben sich abgewechselt. Mittelfristig will ich das mit hreflangs lösen, aber kurzfristig will ich erstmal dass unsere Rankings nicht all zwei Wochen einbrechen. Ne ich habe das übernommen und derjenige, der das gemacht hat, ist momentan nicht zu erreichen.

NextMike · 18. September 2019 um 10:33

Sorry, da fällt mir leider nichts ein. Vielleicht mal Google kontaktieren?

msslovi0 · 18. September 2019 um 10:41

Kann es sein, dass deine /frontend/robots_txt/index.tpl nicht vom Bare-Theme erbt bzw. {$smarty.block.parent}-Anweisungen fehlen und sie deshalb Elemente nicht enthält, die eigentlich enthalten sein sollten?

Für mich sieht das ja nach einem internen DC-Problem aus.

https://cube-biotech.com/products/nanodisc-products/synthetic-polymers/diisobutylene-maleic-acid-dibma/
https://cube-biotech.com/de/products/nanodisc-products/synthetic-polymers/diisobutylene-maleic-acid-dibma/

Sind beide indiziert, sind aber identisch.

Gruß

Matt

MCube · 18. September 2019 um 11:46

@NextMike‍ das habe ich getan bevor ich hier geschrieben habe, weil ich dachte, dass es eventuell ein Shopware Problem ist. Gerade eben habe ich die Antwort erhalten, dass alle Anfragen aus den USA automatisch auf /us weitergeleitet werden und das steht nun mal im robots.txt …

@msslovi0‍ Du scheinst recht zu haben. Die Datei im Bar-Theme enthält auch einige Einschränkungen, welche nicht in der robots.txt auftauchen. Ich weiß ehrlich gesagt nicht wie ich dann an die andere Datei rankommen soll.

Das DC-Problem versuche ich dann über hreflang in den Griff zu bekommen.

Danke jedenfalls für eure Antworten,

MCube

msslovi0 · 18. September 2019 um 15:15

Die Datei in deinem Theme muss vom Bare-Theme extenden und du musst dann den entsprechenden Block erweitern. Wie das geht ist hier beschrieben:

https://docs.shopware.com/de/shopware-5-de/tutorials-und-faq/aenderungen-am-template-vornehmen

Gruß

Matt

Thema		Antworten	Aufrufe
robots.txt-Datei Shopware 5	12	946	9. Dezember 2022
Seiten werden nicht gecrawlet, obwohl robots.txt die erlauben müsste Administration	14	842	24. September 2019
robots.txt Shopware 3.5 other	2	765	29. August 2011
Ups! Ein Fehler ist aufgetreten! "...widgets/Listing/ajaxListing" Administration	7	738	13. Dezember 2017
Warnung google Search Console hat erkannt, dass Ihre Website von 1 Neues Problem hat Allgemein	2	526	7. Mai 2019

Seiten laut Google aufgrund von robots.txt nicht crawlbar, obwohl alles in Ordnung ist

Verwandte Themen