Was ist eine Volltextsuche?

Mit Volltextsuche (englisch full text search ) wird in der Informationstechnik die Suche nach Wörtern in einer Menge von Texten bezeichnet. Sie ist eine grundlegende Funktion von Datenbanksystemen und Textverarbeitungsprogrammen. Die zu durchsuchenden Texte werden oft als Dokumente bezeichnet, auch wenn es sich nicht um selbständige Dateien handelt.

von | Mai 7, 2025

Architects Team

Volltextsuche unterscheidet sich von anderen Suchen, wie etwa der Suche nach

  • Metadaten (zum Beispiel Autor, Titel, Datum),
  • Primärschlüsseln in Datenbanktabellen oder
  • einem festen Dateinamen im Dateisystem,

indem der gesamte Text eines Dokuments durchsucht wird.

Volltextindex

Eine Volltextsuche kann entweder in dem Moment, in dem sie ausgelöst wird, das sogenannte Suchwortdokument scannen (on the fly , germanisiert: „flüchtig“), oder aber sie kann auf einen bereits vorher für jeden zu durchsuchenden Text erstellten Index zurückgreifen. Ein solcher Index, der auch als Volltextindex bezeichnet wird, ist eine Datenstruktur, die es erlaubt, eine Volltextsuche effizient durchzuführen. Das bekannteste Beispiel ist der invertierte Index, der eine Verknüpfung von Wörtern zu den Dokumenten enthält, in denen sie vorkommen. Die Erstellung des Index geschieht durch das sogenannte Indexieren . Dabei wird der Text in Token zerlegt, die zum Index hinzugefügt werden. Je nach Art der Suchanfrage werden beim Indexieren zusätzliche Informationen wie die Position eines Wortes im Text oder dessen Häufigkeit gespeichert.

Dateiverwaltung mit searchit

Volltextsuche mit Index

Die Suche mit Index ist in der Regel erheblich schneller als die flüchtige Suche. Der Nachteil der Indexsuche ist der Aufwand für die Indexerstellung. Sie muss entweder vor der ersten Suche geschehen oder aber, falls die zu durchsuchenden Texte sehr häufig geändert werden, jeweils vor einer Suche neu durchgeführt werden. Der Such- beziehungsweise Indexierungsprozess kann durch weitere linguistische Analysen wie Stemming oder Lemmatisierung ergänzt werden. Diese Analysen helfen dabei, verschiedene Flexionsformen eines Wortes auf eine Grundform zurückzuführen, um die Suchergebnisse zu verbessern. Zum Beispiel werden die Wörter „gehe“, „ging“ und „gegangen“ auf das Lemma „gehen“ zurückgeführt. Auch kann eine Gewichtung der Suchergebnisse nach der Relevanz erfolgen, was als Ranking bezeichnet wird. Solche Systeme werden als Information-Retrieval-Systeme bezeichnet.

Volltextsuche in relationalen Datenbanken

In relationalen Datenbanken werden häufig Feldindizes verwendet, um bestimmte Tabellenspalten zu indizieren. Diese Indizes erlauben zwar schnelle Suchen nach exakten Feldinhalten oder nach Feldinhalten, die ein bestimmtes Wort enthalten, sie unterstützen jedoch keine komplexeren Suchanfragen, wie etwa die Suche nach mehreren Wörtern, die in einer bestimmten Distanz im selben Text vorkommen. Hierzu werden spezielle Volltextindizes benötigt, die die gesamte Spalte indizieren und entsprechende Operatoren für die Suchanfrage bereitstellen.

Geschichte

Anbieter von kommerziellen Volltextsystemen sind unter anderem IBM (STAIRS, seit 1973), OpenText (seit 1985) und Verity (seit 1988).

Bekannte Anwendungen

Bekannte Anwendungen einer Volltextsuche sind die Websuche mit Suchmaschinen wie Google, Bing oder Yahoo, die in den indizierten Webseiten sucht, sowie die Unix-Programme grep und locate, die in Dateien beziehungsweise Dateinamen suchen. Auch Desktop-Suchmaschinen wie die Windows-Suche oder Google Desktop Search nutzen Volltextsuche, um auf dem lokalen Computer gespeicherte Dokumente zu finden. Ein weiteres Beispiel ist die Wikipedia, die eine Volltextsuche in allen Artikeln ermöglicht.

Architects Team

Volltextsuche in Datenbanken

Die Volltextsuche in Datenbanken ist ein relativ neues Konzept, da traditionelle relationale Datenbanken wie Oracle, PostgreSQL oder Microsoft SQL Server ursprünglich nicht dafür ausgelegt waren, große Mengen von Textdaten effizient zu durchsuchen. In den 1990er Jahren wurden jedoch Erweiterungen eingeführt, um diese Funktionalität zu unterstützen. Heutzutage bieten viele Datenbanksysteme integrierte Volltextsuchfunktionen, die es ermöglichen, auch große Textmengen effizient zu durchsuchen.

Suchprogramme sind essentiell für Unternehmen im Jahr 2025 – die vielen Anwendungsfälle und Vorteile wie etwa Zeit- und Kostenersparnis in der Suche sowie die Automatisierung von Unternehmensprozessen stellen unschlagbare Vorteile dar.

Ing. Christoph Wendl

Experte für KI-basierte Enterprise Search Software, CEO der Iphos IT Solutions GmbH

 

Haben Sie Fragen zu searchit Enterprise Search?

Möchten Sie mehr darüber erfahren, wie searchit Ihr Unternehmen bei der effizienten Verwaltung Ihrer Daten unterstützen kann? Buchen Sie jetzt einen Demo-Termin und erleben Sie die Vorteile unserer intelligenten Enterprise Search Software aus erster Hand.

 

Kategorien

Kontakt

Wir setzen auf ganzheitlichen Service & auf eine High End Enterprise Search Engine. Kontaktieren Sie uns.

    [hidden _referer_page]
    Bessere Enterprise Search für Unternehmen mit searchit