Semantische Suche

Sie benötigen eine individuelle semantische Suchlösung? Intelligente Suchfunktionen sollen Suchzeiten verringern? Mit personalisierten Empfehlungen möchten Sie Ihre Nutzer inspirieren und begeistern?

Wir entwickeln maßgeschneiderte semantische Suchlösungen: Semantische Anwendungen für Ihren einzigartigen Kontext, welche die Informationsbedürfnisse Ihrer Nutzer verstehen.

Profitieren Sie von unserer über zehnjährigen Erfahrung bei der Entwicklung individueller semantischer Suchlösungen für Unternehmen und Bibliotheken.

Mit einer semantischen Suchmaschine verringern Sie Suchzeiten und begeistern Ihre Nutzer. Mit smarten Lösungen für semantische Suche, Empfehlungsalgorithmen und künstlicher Intelligenz schaffen wir eine herausragende Nutzererfahrung für Ihre Suchanwendung.

Kundenprojekte: Suchlösungen

Semantische Suche: Unsere Leistungen

  • Schaffung einer Datenbasis für semantische Suche
  • Individuelle Datenfeeds für semantische Suchlösungen
  • Semantische Suchfunktionen wie 'Meinten Sie:..', 'Ähnliche Themen:...', 'Andere Nutzer suchten:...', 'Persönliche Empfehlung:...' oder 'Passende Artikel:...'
  • Analyse historischer Suchsessions, Klickpfade und Events im Suchprozess
  • Erstellen von semantischen Netzen mit künstlicher Intelligenz
  • Personalisierung der Sucherfahrung
  • Informationswissenschaftliches Know-how: Wissensrepräsentation, Information Retrieval und Informationsarchitektur
  • Integration kognitiver Aspekte für semantische Suche
  • Best Practices zur Gestaltung der Nutzerinteraktion im Suchprozess
  • Optimieren von Performance-Indikatoren für semantische Suchlösungen
  • Betrieb von Suchlösungen inhouse oder bei Google Cloud Platform bzw. Amazon Web Services


Langjährige Expertise

Über 10 Jahre Praxiserfahrung in Entwicklung und Betrieb semantischer Suchlösungen in zahlreichen Branchen.

Semantische Netze

Intelligentes Matching und Mapping von Metadaten, Artikelhierarchien, Kategorieinformationen und Nutzersignalen.

Individuelle Nutzererfahrung

Nahtlose Nutzererfahrung durch Auslieferung personalisierter Empfehlungen im Subsekundenbereich.

Cloudservices

Betrieb Ihrer Suchanwendung in Cloudplattformen garantieren herausragende Performance und Verfügbarkeit.

Technische Eigenschaften unserer semantischen Suchlösungen

Hohe Geschwindigkeit

Suchergebnisse und Filterfacetten werden im Sub-Sekundenbereich ausgeliefert. Vorschläge in der Autovervollständigung werden per Tastenanschlag aktualisiert.

Aktualität der Daten

Updates für neue oder geänderte Dokumente können inkrementell erfolgen. Damit können flüchtige Informationen nahezu in Echtzeit in der Suchanwendung aktualisiert werden.

Horizontale Skalierung

Die horizontale Skalierung des Suchindex ermöglicht die Indexierung großer Dokumentenkollektionen. Suchlösungen mit hunderten Millionen Dokumenten haben wir bereits erfolgreich in Kundenprojekten implementiert.

Hochverfügbarkeit und Backups

Die Hochverfügbarkeit eines Such-Clusters kann für einen produktiven 24/7-Betrieb gewährleistet werden. Eine Neuindizierung und Backups des Suchindex können im laufenden Betrieb erfolgen. Dadurch lässt sich ein Index jederzeit wiederherstellen.

Die 3 Suchstrategien: Klassisch vs. semantisch

Bei Suchanwendungen existieren zwei klassische Strategien: Suche über die Suchbox und schrittweise Einschränkung über Facetten und Filter. Die semantische Suche erweitert diese Möglichkeiten um einen Discovery-Ansatz. Mit Hilfe eines Wissensgraphen (semantisches Netz) wird einer Suchlösung Hintergrundwissen einer spezifischen Domäne bereitgestellt.

Suche über die Suchbox

Die Suchbox ist der zentrale Sucheinstieg für Nutzer. Durch positive Erfahrungen bei Innovationsführern im Bereich Suche wie Google und Amazon haben Nutzer heute eine hohe Erwartungshaltung bei der Interaktion mit der Suchbox.

Fehlertolerante Suche

Das grundlegende Konzept einer Volltextsuche basiert auf dem Abgleich der Sucheingabe mit den verfügbaren Metadaten und Volltexten zugrundeliegender Artikel im Suchindex.
Fehlertolerante Suchen unterstützen den Nutzer vielseitig, z.B. bei Falscheingaben oder der Wahl alternativer Schreibweisen. Folgende Lösungsansätze können individuell untereinander kombiniert werden und sind einfach erweiterbar.

Lösungsansätze

Umlaute

München = Muenchen; 
Dún Laoghaire = Dun Laoghaire

Tippfehler

Foo Gighters = Foo Fighters

Zusammengeschriebene Wörter

Gartenschlauch = Garten-Schlauch = Garten Schlauch

Phonetische Suche

Grafik = Graphik

Synonyme, Abkürzungen

DNA = DNS = Desoxyribonukleinsäure

Unterschiedliche Schreibweisen und Konventionen

978-3-423-21427-8 = 978-3423214278

Gleichbehandlung von Groß- und Kleinschreibung

HELMUT KOHL = helmut kohl

Verwandte Suchbegriffe

Stehen dem Nutzer bei der Formulierung einer thematischen Suche nicht die relevanten Begriffe zur Verfügung und können diese auch nicht über die Autovervollständigung angeboten werden, helfen verwandte Suchbegriffe.

Verwandte Suchbegriffe werden entweder durch eine semantische Analyse der Suchanfrage oder aus den bisherigen Suchanfragen der Nutzer zusätzlich zur Ergebnismenge bereitgestellt und ermöglichen neue Einstiegspunkte im Informationsraum.

Verwandte Suchbegriffe zum Thema Physik
Selbsterlernte Autovervollständigung

Die Autovervollständigung unterhalb der Suchbox bietet dem Suchenden Vorschläge auf Basis der bisherigen Sucheingabe.

  • Vorschläge werden bei Tastenanschlag aktualisiert, um eine sofortige Interaktion mit dem System zu signalisieren
  • Für die Vorschläge können individuelle Konfigurationen einer fehlertoleranten Suche vorgenommen werden
  • Vorschläge können nach frei konfigurierbaren Kategorien gruppiert werden.
 

Da die Vorschläge auf bespielsweise fünf pro Kategorie begrenzt sind, spielt die Sortierung eine große Rolle, denn Klicks auf einen Vorschlag lösen eine präzise Suche aus. Deshalb können verschiedenen Relevanzkritierien konfiguriert werden um die Suchqualität nach verschiedenen Kriterien zu optimieren.

Intelligente Autovervollständigung Unterteilung in Vorschläge für den Titel, den Autor und das Thema.
Relevanz-Ranking der Suchergebnisse

Die optimale Suche aus Sicht des Kunden sortiert die Suchergebnisse gemäß deren Relevanz für die gestellte Suchanfrage oder verweist direkt auf eine Artikeldetailseite, wenn mit einer ID (z.B. ISBN) gesucht wird. Die Sortierung der Ergebnisse ist der wichtigste Erfolgsfaktor einer Suchlösung, da sie direkten Einfluss auf die Nutzerzufriedenheit hat.

Der zugrundeliegenden Relevanz-Algorithmus ist von vielen Faktoren abhängig und kann sich kontinuierlich durch das beobachtbare Nutzerverhalten (z.B. Saisonalitäten) ändern. In einer Produktsuche in einem Online-Shop können folgende Faktoren für eine Verbesserung der Relevanz konfiguriert werden:

Geschäftsbasierte Konfigurationen – Artikel Promoting

Ist ein bestimmter Artikel innerhalb einer Suchanfrage Teil der Ergebnismenge, kann dieser automatisch an erster Stelle platziert werden. Hierfür können beliebiger Geschäftsmetriken eingebunden werden, die das Ranking beeinflussen. Beispiele hierfür können sein:

  • Abverkaufswunsch (z.B. zur Reduzierung des Lagerbestandes)
  • Marge des Artikels
  • Verfügbarkeit (z.B. nichtverfügbare Artikel werden nach unten sortiert)
  • Artikel-Bewertungen der Nutzer.

Technische Konfigurationen

  • Wahl von Matching-Algorithmen (inkl. Re-Ranking) zwischen Suchanfrage und Metadaten
  • Boosting der Relevanz verschiedener Metadaten-Felder gegeneinander, so sind Treffer im Titel meist wichtiger als in der Kurzbeschreibung
  • automatische Relevanzanpassung auf Basis des Nutzer-Klickverhaltens.
Erweiterte Suche

Die erweiterte Suche wird in Fachredaktionen und Bibliotheken häufig genutzt, wenn eine spezifische Suche innerhalb eines oder mehrerer Metadaten-Felder erwünscht ist.

Für die erweiterte Suche sind:

  • Alle Metadaten-Suchfelder frei konfigurierbar
  • Es können mehrere Metadaten-Suchfelder gleichzeitig ausgefüllt werden
  • Für jedes Metadaten-Suchfeld kann eine Autovervollständigung zur Verfügung gestellt werden
  • Wurde ein Metadaten-Suchfeld bereits ausgefüllt, können die anderen Suchfelder hiervon abhängig gemacht werden. Wurde beispielsweise die Autorin “J.K. Rowling” gewählt, werden im Suchfeld “Titel” nur noch Werke vorgeschlagen, welche von J.K. Rowling verfasst wurden
Beispiel für Erweiterte Suche
Expertensuche

In bestimmten Fällen möchte der Suchende explizite oder unscharfe Suchanfragen formulieren und dabei logische Operatoren benutzen:

  • Einzelne Terme der Suchanfrage werden standardmäßig durch eine UND-Beziehung miteinander verknüpft. Alternativ kann der OR-Operator eingesetzt werden
  • Exakte Phrasensuche: Durch die Verwendung des umschließenden Hochkommas muss die Reihenfolge der Terme der Suchanfrage exakt mit den Metadaten übereinstimmen
  • Wildcards können eingesetzt werden, um einzelne oder mehrere Buchstaben als Platzhalter frei wählbar zu machen (z.B. Alan T*)
Transparenz in den Suchergebnissen

Die Suchlösung kann zusätzliche Informationen für die Ergebnisse einer Suchanfrage zurückliefern, wodurch dem Nutzer transparent gemacht werden kann, weshalb ein bestimmtes Ergebnis angezeigt wird.

  • Highlighting in den Suchergebnissen: Übereinstimmung der Suchanfrage mit den Metadaten werden besonders gekennzeichnet.
  • Snippets: Einblendung von Textauszügen pro Suchergebnis – z.B. aus dem Klappentext, Volltext oder Abstract – die für gewöhnlich nicht in der Ergebnisliste erscheinen.
Selbstbeschreibungsfähigkeit der Suchergebnisse Highlighting der gestellten Suchanfrage

Facettiertes Browsing/Navigation

Filterfacetten dienen der schrittweisen Einschränkung von Suchergebnissen nach der Ausprägungen diverser Artikeleigenschaften. Zur schnellen Orientierung wird dem Nutzer pro Attribut die Anzahl der darin enthaltenen Artikel angezeigt.

Facettiertes Browsing als Sucheinstieg

Facetten können als zentrale Navigationsstruktur innerhalb zur Strukturierung von Informationsräumen genutzt werden. Hierdurch können die Nutzer entlang eines konfigurierbaren Kategoriesystems zu den richtigen Stellen in der Dokumenten-Kollektion oder im Online-Shop geführt werden.

Einschränkung der Suchergebnisse mit Filterfacetten

Das Verhalten jeder Filterfacette kann individuell konfiguriert werden:

Multiselektierungs-Facetten
Anstelle nur einer Ausprägung einer Filterfacette können mehrere Werte selektiert werden – z.B. der Medientyp Buch, EBook oder Hörbuch.

Deselektierungs-Facetten
Einzelne Ausprägungen einer Facette können abgewählt werden, wodurch Filterungen wie “alles außer <>” realisiert werden können.

Hierarchische Facetten
Diese werden häufig für Themen-Klassifikationen eingesetzt. Innerhalb einer Taxonomie wird durch die Wahl einer Oberkategorie die Ausprägungen der Unterkategorien präsentiert.

Wertebereiche
Auswahl bestimmter Mess- oder Zeitwerte:

  • mit absoluten Werten – Beispiel Preise: zwischen 0€ – 29€
  • mit relativen Werten –Beispiel Erscheinungsdatum: im letzten Jahr, im letzten Jahrzehnt,…
  • Umkreissuche basierend auf Geokoordinaten
oben: Beispiel für facettierte Auswahl von Wertebereichen
links: Beispiel für Hierarchische Facette

Semantic Discovery

Die semantische Suche basiert auf einem Wissengraphen, welcher strukturierte Informationen zu gesuchten Themen, sowie den vorhandenen Metadaten der einzelnen Dokumente während des Suchprozesses bereitstellt.

Informationen innerhalb des Wissensgraphen bieten wiederum neue Verlinkungen zu potentiell interessanten Themen, die ein neues Explorationskonzept im Suchprozess ermöglichen. Eine Auswahl von Informationen sind:

  • Über- und untergeordnete Begriffe zum gesuchten Thema
  • Kurzbeschreibung des Themas, der Biographie eines Autors etc.
  • Synonyme und Antonyme
  • Weitere Artikel zum Thema
  • Autoren, die zum gleichen Thema veröffentlicht haben.
Welche Rolle spielt der Wissensgraph in einer semantischen Suche?

Der Wissensgraph stattet die Suchmaschine mit Hintergrundwissen einer bestimmten Domäne aus:

  • Zusatzinformationen können das Sucherlebnis des Nutzers unterstützen, da sämtliche Informationen an einem Ort zu finden sind
  • Der Nutzer muss für inhaltliche Recherchen die Suchanwendung nicht verlassen, da er einen Überblick über das aktuell recherchierte Themengebiet erhält
  • Das Angebot zusätzlicher Links erhöht die Serendipität und lädt zum Stöbern ein
  • Der Wissensgraph ermöglicht eine freie thematische Suche.
 

Individuelle Wissensgraphen können durch die Analyse und Integration von Dokumenten-Kollektionen, Such-Logs sowie linguistischen und enzyklopädischen Ressourcen erzeugt werden.

Beispiel für einen Wissensgraph für das Thema Physik

Begleitende Suchfunktionen für Online-Shops

Um Up- und Cross-Selling-Potentiale zu realisieren, muss das individuelle Suchinteresse abhängig von der aktuellen Suchinteraktion mit dem Shop und – wenn vorhanden – des Nutzerprofils und der Verkaufshistorie maschinell verstanden werden, um kontextsensitive Vorschläge unterbreiten zu können.

Benachrichtigungen

Nutzer können für eine Suchanfrage eine Benachrichtigung aktivieren, wodurch sie informiert werden, wenn:

  • ein neuer Artikel in die Datenbank oder ein neues Produkt in den Shop aufgenommen wird, welcher zu gespeicherten Suchanfragen passen
  • sich bestimmte Informationen für einen Artikel ändern (z.B. Verfügbarkeit oder Preis).
Empfehlungsmaschine (Recommendation Engine)

Befindet sich der Nutzer auf einer Artikeldetailseite können ihm Vorschläge für alternative oder ergänzende Artikel angeboten werden. Die Vorschläge können auf folgenden Grundlagen basieren:

Der inhaltlichen Änlichkeit, welche aus den Metadaten aller verfügbaren Artikel, den in Beziehung stehenden Produkt-IDs oder der statistische Übereinstimmung der Volltexte
(“More-Like-This-Funktionalität”) berechnet werden können.

Einer Warenkorbanalyse, indem Artikel vorgeschlagen werden, die auch von Kunden gekauft wurden, die den gerade betrachten Artikel der Detailseite erworben haben.

Einer Logdaten-Analyse, indem Artikel vorgeschlagen werden, die in individuellen Such-Sessions vom Kunden nacheinander betrachtet wurden.

Beispiel für Buchempfehlungen nach Reihe und inhaltlicher Ähnlichkeit

Konfigurations-Console

Ein Konfigurations-Interface bietet ohne Programmieraufwand die Möglichkeit der Konfiguration der Suchlösung. Folgende Konfigurationen sind möglich und je nach Bedarf flexibel anpassbar.

Index-Verwaltung

Schema-Manager
Mit dem Schema-Manager lassen sich innerhalb der Web-GUI alle Index-Felder konfigurieren.

Typisierung

  • Typisierung ist notwendig, um das Verhalten von Filterfacetten und Sortiermöglichkeiten konfigurieren zu können
  • Beispiel: Filterfacette – kann auf Basis des Date-Typs die Ausprägungen “im letzten halben Jahr”, “im letzten Jahrzehnt” berechnen.

 

Individuelles Feld-Verhalten

Hierbei kann konfiguriert werden, wozu das jeweilige Feld innerhalb der Suchanwendung verwendet werden soll:

  • Anzeige für den Artikel innerhalb der Ergebnisliste
  • Hervorhebung in der Ergebnisliste bei Übereinstimmung mit den Suchbegriffen
  • Verwendung für die Snippet-Funktionalität
  • Verwendung für die Erzeugung von Filterfacetten
  • Durchsuchbarkeit für die globale Suche und ob bestimmte Transformationen für die fehlertolerante Suche nicht angewandt werden sollen
  • Verwendung für die erweiterte Suche
  • Verwendung für die Sortierung – abhängig der Typisierung werden relevante Vorschläge präsentiert.
 

Facetten-Manager
Mit dem Facetten-Manager lässt sich das Verhalten der jeweiligen Filterfacetten definieren, die im Schema-Editor bereits definiert wurden sind:

  • Definition des Einschränkungsverhaltens: Hierarchisch, Mehrfachauswahl, Deselektion
  • Berechnung von Wertebereichen aus den Feldinhalten
  • Festlegung der Wertesortierung: alphabetisch, numerisch, nach Trefferanzahl.
 

Query-Verwaltung
Mit der Query-Verwaltung kann aus einer Liste definiert werden, welche Möglichkeiten für eine Expertensuche aktiviert werden.

Relevanz-Ranking-Manager
Mit dem Relevanz-Ranking-Manager kann der Scoringalgorithmus konfiguriert werden. Mögliche Konfigurationen können dem Abschnitt Relevanz-Ranking der Suchergebnisse entnommen werden. Im einfachsten Fall steht eine Liste möglicher Parametrisierungen zur Verfügung, die jeweils aktiviert werden können und denen eine zusätzliche Gewichtung via Schieberegler zugewiesen werden kann.

Die Innovation in diesem Modul stellt die Live-Konfiguration des Scorings dar, d.h. es besteht die Möglichkeit, dass die Änderung an der Scoringfunktion zur Laufzeit vorgenommen werden kann und keine Neuindizierung notwendig ist.

Autocompletion-Manager
Im Autocompletion-Manager kann konfiguriert werden, welche Vorschläge präsentiert werden können:

  • Definition von Feldern, die als Kategorie verwendet werden sollen
  • Bilder, die pro Vorschlag eingeblendet werden sollen
  • Anzahl der maximalen Vorschläge pro Kategorie
  • Das Ranking der Ergebnisse wird über das zentrale Relevanz-Ranking konfiguriert.
Import-Manager

Mit dem Import-Manager kann definiert werden, wo bestimmte Dateien zum Index-Import abgelegt sind. Ein Scheduling des Importprozesses ist möglich.

Administrations-Konsole

In der Administrations-Konsole kann das Such-Cluster überwacht und individuell konfiguriert werden.

Überwachen des Suchclusters (hier: ElasticSearch Kopf)
Such-Analytics

Das Suchverhalten der Nutzer kann geloggt und mit Dashboarding-Lösungen wie Kibana zur weiteren Analyse aufbereitet werden.

Überwachen der Suchstatistiken (hier: Kibana)
Error-Konsole

In der Error-Konsole kann definiert werden, welche Fehler geloggt werden.

Was Sie von uns erwarten können

  • Über 10 Jahre Erfahrung in der Entwicklung individueller semantischer Suchlösungen
  • Intelligentes Matching, Mapping und Ranking von Artikelattributen für semantische Suchfunktionen
  • Beachtung kognitiver Aspekte im Information Retrieval
  • Einsatz künstlicher Intelligenz für Steigerung der Relevanz von Suchergebnisse und Empfehlungen
  • Orchestrierung maßgeschneiderter Empfehlungsregeln durch intelligente Algorithmen
  • Logging, Monitoring und Performance-Optimierung für Ihre Suchlösung

Was andere über uns sagen

>>Langjähriger Partner. Super zufrieden!<<
Tobias Baumgart - Director Ecommerce-Platform Conrad Electronic SE
>>Schneller geht die Extraktion nicht. Insofern sehe ich ihre Umsetzung als vollen Erfolg!<<
Burghard Gocht - BGH Edelstahlwerke GmbH

Unser Leistungsversprechen an Sie?

>>Performancesprünge für Ihre Suchlösungen!<<

Unsere Leistungen sind unabhängig von Interessen kommerzieller Softwarehersteller – der größtmögliche Nutzen unserer Lösungen für Ihr Unternehmen gilt bei uns als Maßstab. Jederzeit.

Ihr Kontakt zu uns

Berichten Sie uns von Ihren Herausforderungen – Konkrete Lösungsvorschläge erhalten Sie von unseren Experten für semantische Suchlösungen.

Oder schreiben Sie uns eine Nachricht:

Daten. Software. Analytics

Kontakt

  • Avantgarde Labs GmbH
  • Theresienstraße 9
  • 01097 Dresden
  • Germany