Document Structure Analysis

Document Structure Analysis

Die logische Struktur eines Dokuments beschreibt die logischen Komponenten des Dokuments. Beispiele für logische Komponenten sind Überschriften, Tabellen, Fußnoten oder Aufzählungen. Mehrere Anwendungen im Bereich der Dokumentverarbeitung profitieren von Informationen über die logische Struktur, etwa Aufgaben der Informationsextraktion oder des Document Retrieval. Leider enthalten die üblichen Dokumentformate nicht alle Strukturinformationen, die für eine automatische Dokumentverarbeitung wünschenswert wären. Um die Dokumentstruktur nutzen zu können, muss das Dokument analysiert und die ursprüngliche Struktur des Dokuments rekonstruiert werden.

Ziel des Projekts ist die Entwicklung eines allgemeinen Frameworks zur automatischen Strukturanalyse, das auf verschiedene Dokumenttypen anwendbar ist, z. B. Karteikarten, Geschäftsbriefe oder Paper. Die Kombination aus visuellen und automatischen Methoden ermöglicht eine effiziente und effektive Erstellung der benötigten Dokumentmodelle entsprechend den Bedürfnissen des Nutzers.

Weitere Informationen zu dieser und verwandten Arbeiten finden sich in den folgenden Publikationen.

Publikationen

Zum Inhaltsanfang

© Universität Konstanz 2026