Crawling Fehler bei Google und falsche Artikel-Ids

Hagen · 28. Oktober 2016 um 06:14

Hallo zusammen,

wie kann denn das angehen das bei Google plötzlich andere Artikel-Ids in der URL sind?
Google meldet Crawling-Fehler, jeden Tag werden es mehr, heute schon über 600.

Google: ersatzteile/882/sensor
Richtig: ersatzteile/1859/sensor

Google: ersatzteile/1003/wasserpumpe
Richtig: ersatzteile/1980/wasserpumpe

Google: ersatzteile/189/oelfilter
Richtig: ersatzteile/1166/oelfilter

Es können sich doch nicht von heute auf morgen die Artikel-Ids ändern.
Ich verstehe das gerade nicht.

Gruß,
Hagen

SebastianKloepper · 28. Oktober 2016 um 06:26

Hallo,

das kann natürlich schon vorkommen, wenn z.B. Artikel neu per Import in den Shop kommen.
Die ID ist ja fortlaufend und wenn der Artikel oder auch eine Kategorie entfernt und durch Import wieder in den Shop kommt, dann bekommen diese immer eine neue ID.
Man müsste also wissen, welche Prozess bei dir im Shop laufen.

Von alleine kann das nicht passieren. Das ist ausgeschlossen

Sebastian

Hagen · 28. Oktober 2016 um 06:44

Jetzt habe ich mal in die Datenbank geguckt.

Die Beispiele von oben haben diese changetime:

2016-08-30 21:15:29
2016-08-30 21:17:13
2016-08-30 21:04:35

Die Sitemap:
Zuletzt gecrawlt am: 24.10.16
Erstmals erkannt am: 24.10.16

Verlinkt über .com/sitemapMobile.xml

Auszug, der ist auch richtig:
https://www. xxx /ersatzteile/1166/oelfilter-fuer-audi-vw-seat-skoda-030115561an-030-115-561-an

Fehler 23:

23 autoteile/ersatzteile/189/oelfilter-fuer-audi-vw-seat-skoda-030115561an-030-115-561-an 404 24.10.16

Ich weiß mir grad keinen Rat???

Gruß,

Hagen

SebastianKloepper · 28. Oktober 2016 um 06:50

Hi,

aber wie kommen die Artikel in den Shop? Gibt es eine Schnittstelle, Wawi, Import/Export?
Die Änderungen darüber kann man ja nicht zwingend nachvollziehen in der Datenbank, außer das die Artikel eine neue ID bekommen

Die ID kann sich eigentlich nur durch Importe/Schnittstellen ändern. Das kann Shopware selbst nicht.

Sebastian

Hagen · 28. Oktober 2016 um 07:00

Hi Sebastian,

die Artikel kamen am 30.08.2016 in den Shop per API Import. Hatte mir ein Programm geschrieben welches die Artikel aus dem bestehenden Shop nach Shopware per API kopiert. Jetzt kommen nur noch ab und zu 3-8 Artikel alle zwei Tage ebenfalls per API in den Shop nämlich immer dann wenn neue im alten Shop angelegt werden.
Laut Datenbank ist die erste Artikel-Id die 1045 und die heutige letzte die 4976.
Das fängt warscheinlich deshalb nicht mit 1 an weil ich vorher ein paar Import-Tests gemacht habe und diese Artikel dann im Backend wieder gelöscht habe.

Hagen

SebastianKloepper · 28. Oktober 2016 um 07:04

Hi Hagen,

ja und scheinbar sind genau diese Import-Tests zu Google gekommen und Google hat daher alles alte URLs.
Sind die Sitemaps denn jetzt passend/aktuell? Oder liegt ggf. bei dir im Verzeichnis eine alte Sitemap physikalisch, so dass Shopware keine neue automatisch erzeugen kann?

Sebastian

Hagen · 28. Oktober 2016 um 07:33

Hi Sebastian,

aber wie sollen die zu Google gekommen sein? Ich hatte bis zum öffentlichen Start eine .htaccess Sperre davor!
Die Sitemaps sind aktuell, die werden doch dynamisch erzeugt oder?

Hagen

SebastianKloepper · 28. Oktober 2016 um 07:50

Hi,

aber wie sollen die zu Google gekommen sein? Ich hatte bis zum öffentlichen Start eine .htaccess Sperre davor!

Das kann ich leider nicht beantworten. Dazu hätte man das vorher prüfen müssen. Irgendwie hat Google die Infos bekommen. Entweder Sitemap oder durch das Crawlen der Seite (wie auch immer). Das kann man so nicht beantworten. Da wird man das jetzt so bei Google bereinigen und neu indexieren müssen.

Die Sitemaps sind aktuell, die werden doch dynamisch erzeugt oder?

Genau - die sind aktuell. Man kann aber auch immer eine eigene in das Verzeichnis legen, dann würde Google die manuelle Datei ziehen.

Viele Grüße

Sebastian

Hagen · 28. Oktober 2016 um 12:48

Hi Sebastian,

ok, ich danke dir für deine Überlegungen. Tatsächlich muss Google den Shop besucht haben als ich zum Test der API mal für etwa 3 Stunden das htaccess ausgeschalten hatte

Gruß,
Hagen

simplybecause · 28. Oktober 2016 um 17:50

Du kannst Dir die URLs, die Google nicht findet, aber in der Datenbank, Tabelle s_core_rewrite_urls, speichern und der aktuellen URL zuordnen, dann laufen sie nicht ins leere.

Thema		Antworten	Aufrufe
Umzug von Shopware - werden URL's mit importiert? Shopware 3.5 installation--gettin	4	702	28. Juli 2015
SEO Url's komplett durcheinander Shopware 3.5 general	6	630	4. April 2015
Produktexporte - Artikel-URL bei Varianten plötzlich falsch - HILFE Programmierung	1	516	5. März 2018
Datenbankdaten der URL passen nicht zu den IDs im Backend Administration	5	378	26. Februar 2018
Article ID ändern Administration	3	803	8. November 2021

Crawling Fehler bei Google und falsche Artikel-Ids

Verwandte Themen