Volltextsuche/Volltextindex
Was ist eine Volltextsuche?
Neben anderen Suchmethoden bieten Dokumentenmanagementsysteme wie bitfarm-Archiv Dokumentenmanagement die Volltextsuche an. Diese Suchmethode ist besonders intuitiv, da Dokumente nach beliebigen, im Text des Dokuments vorkommenden Begriffen gefunden werden können. Üblicherweise beinhaltet die Volltextsuche auch sämtliche sonstige erfasste Information eines Dokuments. Der Anwender braucht also gar nicht zu überlegen, wo bzw. in welches Feld er welche Suchinformation eingibt. Im Zweifel braucht er sogar noch nicht einmal den Ablageort des Dokuments zu kennen.
Die Volltextsuche ist eine erweiterte Datenbanksuchmethode. Diese kann schnell alle Vorkommen eines Begriffs (Wortes) in einer Tabelle finden, ohne nach Zeilen suchen oder wissen zu müssen, in welcher Spalte der Begriff gespeichert ist. Die Volltextsuche funktioniert mit Hilfe der Textindizierung. Der Textindex speichert die Ortsinformationen aller Begriffe, die in der Spalte gefunden wurden, für die Sie den Textindex erstellt haben. Die Verwendung eines Textindexes ist schneller als die Verwendung eines regulären Indexes, um Zeilen zu finden, die einen bestimmten Wert enthalten. Die Volltextsuche in SQL unterscheidet sich von der Suche mit Operatoren, da sie auf der Grundlage von Begriffen und nicht von Mustern gefunden wird. Damit bestehen hier Differenzen zu Operatoren wie beispielsweise:
- REGEX
- LIKE
- SIMILIAR TO
Der Stringvergleich in der Volltextsuche verwendet alle normalen Sortiereinstellungen der Datenbank. Sofern nicht anders angegeben, verwendet die Volltextsuche alle internationalen Funktionen, die unterstützt werden.
Der Anwender benutzt nur einen einzigen Eingabeschlitz, ähnlich wie bei einer Internetsuche (Google u. a.). Diese Herangehensweise ist für den Anwender natürlich sehr interessant, weil einfach. Liefert eine Suche einmal zu viele Treffer, so kann durch hinzufügen von weiteren Suchbegriffen die Trefferanzahl reduziert werden. Alternativ grenzt der Anwender zusätzlich den Zeitbereich ein oder gibt sonstige Metainformationen an. Volltextsuche und sonstige Metadaten lassen sich in modernen Dokumentenmanagementsystemen beliebig miteinander kombinieren.
Paradigmenwechsel durch neue Möglichkeiten
Die Volltextsuche als primäre Suche im Gegensatz zur Schlagwortsuche einzusetzen und zu propagieren ist eine relativ junge Entwicklung. Die meisten Anbieter von Dokumentenmanagementsystemen verfahren noch nach der klassischen Stategie der Verschlagwortung. Für jedes Dokument muss vom Anwender eine Vielzahl von Feldern ausgefüllt werden, damit es später wiedergefunden werden kann. Dies ist ein nicht zu unterschätzender Mehraufwand und belastet die Mitarbeiter, welche für die ordnungsgemäße Ablage der Dokumente im DMS zuständig sind, erheblich. Der Komfort einer schnell durchsuchbaren Dokumentenablage für alle Mitarbeiter geht zu Lasten einiger Weniger.
Dabei gibt es in den letzten Jahren einige interessante Entwicklungen, die eine effektive Verwendung der Volltextsuche gerade im Bereich Dokumentenmanagement möglich machen. Datenbanken sind heutzutage dank leistungsfähiger Server in der Lage mehrere Millionen Dokumente schnell zu durchsuchen. bitfarm-Archiv setzt auf MySQL, der bekannten Open-Source-Datenbank. Diese gilt als eine der schnellsten Datenbanken für Volltextsuchen – weit vor Microsoft SQL oder Oracle. Mit MySQL als Datenbank kann bitfarm-Archiv Volltextsuchen in einer Million Dokumenten in ca. 3 Sekunden bewältigen. Dazu reicht ein Standardserver für wenige hundert Euro.
Zudem ist die Texterkennungsqualität bei eingescannten Papierdokumenten durch die optische Texterkennung (OCR) so exakt geworden, dass ein händisches Nachpflegen der erkannten Suchbegiffe nicht mehr erforderlich ist. bitfarm-Archiv setzt in der Enterprise-Version die Omnipage-OCR ein, welche zusammen mit Finereader die weltweit führende Texterkennungssoftware ist. Sogar bei schwierigen Vorlagen (Nadeldrucker, Umweltpapier etc.) lässt sich dank der immer besser und gleichzeitig preisgünstiger werdenden Dokumentenscanner so noch gut arbeiten.
Weitere Möglichkeiten zu diesem Thema können Sie in unserem Video dazu finden.
Verschlagwortung dennoch in manchen Fällen notwendig
Es gibt Dokumente bzw. Suchanforderungen, in denen eine Volltextsuche keinen Sinn macht. Müssen zum Beispiel Dokumente nach kurzen spezifischen Nummern, sagen wir Hausnummern durchsucht werden, so würde dies mit einer Volltextsuche eine nicht brauchbare Anzahl an Treffern zu Tage bringen. Volltextsuchen funktionieren also nur mit Zeichenketten, welche eine genügende Länge aufweisen, um damit ein relevantes Suchergebnis zu generieren. Dies funktioniert je nach Dokumentenmenge und -beschaffenheit bereits ab ca. vier Zeichen als Sucheingabe. Für alle anderen Fälle halten professionelle Dokumentenmanagementsysteme zusätzlich frei konfigurierbare Indexfelder zur Verschlagwortung bereit.
bitfarm-Archiv DMS bietet in der Enterprise-Version mit seiner modernen Technologie sowohl definierbare Indexfelder, als auch eine sehr leistungsstarke Volltextsuche. Damit wird nicht nur das Recherchieren in Dokumenten zu Kinderspiel - auch das Erfassen von Dokumenten wird vereinfacht, indem die Notwendigkeit zur Verschlagwortung wegfällt oder zumindest reduziert werden kann.
Weiterführende Quellen
Weitere interessante Links zum Thema Volltexsuche: