Generalized Scatter Plots
Scatter Plots gehören zu den leistungsfähigsten und am weitesten verbreiteten Techniken zur visuellen Datenexploration. Ein bekanntes Problem besteht darin, dass Scatter Plots häufig einen hohen Grad an Überlappung aufweisen, wodurch ein erheblicher Teil der dargestellten Datenwerte verdeckt werden kann. In diesem Beitrag schlagen wir Generalized Scatter Plots vor, die es ermöglichen, große Datenmengen vollständig und ohne Überlappung in das Anzeigefenster einzupassen. Wir diskutieren zwei Varianten: binned Scatter Plots und distorted Scatter Plots.
Die Grundidee besteht darin, dem Analysten zu ermöglichen, den Grad der Überlappung, Verzerrung und Binning so zu optimieren, dass die bestmögliche Ansicht entsteht. Um eine effektive Nutzung zu ermöglichen, stellen wir die Möglichkeit bereit, stufenlos zwischen traditionellen Scatter Plots und unseren Generalized Scatter Plots zu zoomen. Wir identifizieren eine Optimierungsfunktion, die Überlappung und Verzerrung der Visualisierung berücksichtigt. Wir evaluieren die Generalized Scatter Plots anhand dieser Optimierungsfunktion und zeigen, dass in der Regel ein optimaler Kompromiss zwischen Überlappung und Verzerrung existiert. Unsere Generalized Scatter Plots wurden erfolgreich auf eine Reihe realer Anwendungen im Bereich IT-Services angewendet, etwa auf die Überwachung der Serverleistung, die Analyse der Nutzung von Telefondiensten und Finanzdaten, und demonstrieren dabei die Vorteile der Generalized Scatter Plots gegenüber traditionellen Scatter Plots.