wir haben Probleme mit der internen Suche und nun sehr viele Artikel abgearbeitet. Unser Problem ist, dass selbst einfach Tippfehler nicht korrigiert werden, als Beispiel: „Vitamix“ bringt 32 Ergebnisse, der Suchstring Vitamox = 0 Ergebnisse.
Haben auch ein aktuelles Abbild auf unserem Staging-System erstellt und hier diverse Empfehlungen durchgespielt. Hinsichtlich des folgenden Artikels gibt es den Hinweis:
Befinden Sich hier Einträge für die Spalte „Soundex“ mit dem Wet NULL die keine Zahl als Eintrag haben, so ist dies ein Indiz dafür, dass der Suchindex nicht korrekt aufgebaut wurde.
Bei uns haben alle Soundex-Felder den Wert Null. Kennt jemand das Problem? Welchen Wert haben eure Soundex-Felder? Kann man das debuggen?
Den Such- und SEOIndex können wir ohne Fehler generieren, sowohl über das Backend, als auch über die Console.
Seitens Hoster wurde die Funktionalität überprüft und ist manuell auch nutzbar.
Oder anders gefragt: Die Standardsuche erkennt doch Schreibfehler, richtig oder falsch?
Sollte die Suche erkennen, wenn jemand Lachs mit ä (Lächs) oder mit o (Lochs) schreibt?
Man kann jedoch gängige Schreibfehler z.B. in die Keywords eintragen und diese dann in der Suche als zu indizierendes Feld definieren. Wäre auch mit einem Freitextfeld möglich.
Von Soundex() würde ich mir eh nicht viel erwarten, da der Algorithmus für Englisch gedacht ist (phonetische Lautähnlichkeit) und für Deutsch viele Limitationen hat, z.B. keine Unterscheidung von längeren (zusammengesetzten) Wörtern, Umlaute uvm.
Da gibt es bessere, z.B. Double Metaphone, die auch mit Deutsch klarkommen. Allerdings sind „klingt so ähnlich“ und „vertippt“ unterschiedliche Herausforderungen, denn ein Tippfehler muss nicht unbedingt ähnlich klingen. Moderne Spellchecker basieren daher auf KI und wurden mit großen Textmengen trainiert, um das zugrundeliegende Modell zu erzeugen. Wen‘s interessiert: How to Write a Spelling Corrector