Die ständig wachsende Menge an verfügbaren Dokumenten macht die Analyse großer Datenmengen zunehmend anspruchsvoller. Ein typisches Szenario ist dabei die Suche nach relevanten Informationen. Mit der Verbreitung großer Sprachmodelle in jüngster Zeit ergeben sich jedoch spürbare Vorteile, um diese Datenflut effektiv zu bewältigen.
Ein Beispiel hierfür ist der AI Data Pilot (RAG) von digitalsalt, der eine Vektordatenbank verwendet, um Einbettungen und Suchmechanismen zu nutzen und eng verwandte Dokumente zu identifizieren.
AI-Suche: Ein Überblick
AI Search ist der Cloud-basierte Suchdienst von digitalsalt im Rahmen des AI Data Pilot, der Anwenderinnen und Anwendern eine leistungsstarke Suchfunktion für verschiedene Arten von Inhalten bietet. Er umfasst erweiterte Funktionen wie Volltextsuche, Fuzzy Matching, facettierte Navigation, Filterung und Sortierung. Der Dienst unterstützt auch erweiterte Funktionen wie Sprachanalysatoren, Stemming, Synonyme und georäumliche Suche.
Dieser Artikel konzentriert sich auf die Retrieval- und Ranking-Funktionen von AI Search, die für RAG-Systeme besonders relevant sind.
Abruf (L1): Die Grundlagen
Der erste Schritt im Suchprozess, oft L1 genannt, besteht darin, aus einem großen Index schnell alle Dokumente zu finden, die den Suchkriterien entsprechen. Normalerweise werden die 50 besten Ergebnisse für den Benutzer ausgewählt oder an die nächste Ebene weitergegeben. Azure AI Search unterstützt drei primäre Abfragemodi: