Age Suitability and Readability Analysis
Altersfreigabe-Analyse: Sind meine Kinder alt genug, um diese Bücher zu lesen?
Filme werden standardmäßig bewertet und als für ein bestimmtes Alter und Publikum geeignet eingestuft. Für Bücher hat sich ein solches Bewertungssystem bislang noch nicht etabliert. Bücher unterscheiden sich jedoch hinsichtlich Inhalt, Schreibstil, Thema, Genre und anderer altersbezogener Aspekte und sind daher möglicherweise ebenfalls nicht für jedes Publikum geeignet. Nach Auffassung von Experten der Domäne müssen nicht nur die Lesbarkeit des Textes, sondern auch die behandelten Themen, die Komplexität der Handlung und die beim Leser ausgelösten Emotionen berücksichtigt werden.
Ziel dieser Arbeit ist es, eine effektive Methode zu finden, um die Altersfreigabe textueller Dokumente zu messen und darzustellen, sodass Eltern und Experten die verschiedenen altersrelevanten Aspekte beurteilen können, ohne das gesamte Buch zu lesen.
Im Rahmen des Projekts haben wir Methoden entwickelt, um die relevanten Aspekte rechnerisch zu erfassen. Die Ergebnisse des automatischen Textanalyseprozesses werden dem Nutzer in einer dashboardartigen Visualisierung präsentiert (im Screenshot unten ist das Buch „Harry Potter and the Deathly Hallows” zu sehen). Jeder beitragende Aspekt wird separat visualisiert. Im oberen linken Bereich der Visualisierung ist das Ergebnis der Emotionserkennung dargestellt, in der Mitte werden Lesbarkeitsindikatoren angegeben, und rechts ist das Ergebnis des Themenerkennungsalgorithmus zu sehen. Der untere Teil der Visualisierungsoberfläche stellt die Komplexität der Handlung des Buches dar. Jede Zeile repräsentiert eine andere Figur, und jedes Rechteck in einer Zeile zeigt, ob und wie aktiv eine Figur während der Handlung des Buches agierte. Je gesättigter die Farbe einer Zelle ist, desto häufiger tritt die Figur im jeweiligen Abschnitt auf (nur in der Detaildarstellung sichtbar). Durch das Drill-down auf die nächste Ebene wird eine detailliertere Exploration der verschiedenen Aspekte möglich.
Visuelle Lesbarkeitsanalyse
Unser Werkzeug VisRA zur visuellen Lesbarkeitsanalyse unterstützt Autoren bei der Überarbeitung einer Entwurfsversion eines Dokuments. Im Gegensatz zu Standardwerkzeugen für die Lesbarkeitsanalyse zeigt VisRA nicht nur, welche Sätze überarbeitet werden müssen, sondern auch warum. Automatische Algorithmen, die im Hintergrund arbeiten, ermitteln die Gründe für schlechte Lesbarkeit, etwa komplexe Satzstruktur, schwierigen Wortschatz oder zu viele Nominalformen.
Aus informatischer Sicht besteht eines der Ziele des Projekts darin, semantisch verständliche Indikatoren für eine Texteigenschaft (in diesem Fall die Lesbarkeit) (halb-)automatisch zu finden. Darüber hinaus wurden verschiedene visuelle Darstellungen in das Werkzeug integriert, die unterschiedlichen Dokumentgrößen sowie der Verfügbarkeit von Informationen über das physische und logische Layout der Dokumente Rechnung tragen.
Weitere Informationen zu dieser und verwandten Arbeiten finden sich in den folgenden Publikationen.