Daten- und Informationsvisualisierung

Daten- und Informationsvisualisierung (Daten nämlich oder Info nämlich)[1] ist ein interdisziplinäres Feld, das sich mit dem befasst Grafik Darstellung von Daten und Information. Es ist eine besonders effiziente Art der Kommunikation, wenn die Daten oder Informationen zahlreich sind, wie beispielsweise a Zeitfolgen.[2]

Es ist auch das Studium von visuelle Darstellungen von abstrakten Daten zur Verstärkung der menschlichen Kognition. Die abstrakten Daten umfassen sowohl numerische als auch nicht numerische Daten wie Text und Geografische Informationen. Es hängt mit Infografiken und Wissenschaftliche Visualisierung. Eine Unterscheidung ist, dass die Informationsvisualisierung bei der räumlichen Darstellung (z. B. die, die Seitenlayout von a Grafikdesign) wird ausgewählt, während es ist Wissenschaftliche Visualisierung Wenn die räumliche Darstellung angegeben ist.[3]

Aus akademischer Sicht kann diese Darstellung als Zuordnung zwischen den Originaldaten (normalerweise numerisch) und grafischen Elementen angesehen werden[4] (Zum Beispiel Zeilen oder Punkte in einem Diagramm). Die Zuordnung bestimmt, wie die Attribute dieser Elemente je nach Daten variieren. In diesem Licht ist ein Balkendiagramm eine Zuordnung der Länge eines Balkens in eine Größe einer Variablen. Da das Grafikdesign der Zuordnung die Lesbarkeit eines Diagramms nachteilig beeinflussen kann, kann dies beeinträchtigen.[2] Die Zuordnung ist eine Kernkompetenz der Datenvisualisierung.[5]

Daten- und Informationsvisualisierung hat ihre Wurzeln im Bereich von Statistiken und wird daher allgemein als Zweig von angesehen beschreibende Statistik. Da sowohl Designfähigkeiten als auch statistische und Computerfähigkeiten erforderlich sind, um effektiv zu visualisieren, wird von Autoren wie Gershon und Page argumentiert, dass es sich sowohl um Kunst als auch eine Wissenschaft handelt.[5]

Die Erforschung der Erforschung der Lesen und Fehllesen verschiedener Visualisierungen und Missverständnissen bei der Ermittlung, welche Arten und Merkmale von Visualisierungen für die Vermittlung von Informationen am verständlichsten und effektivsten sind.[6][7]

Überblick

Die Datenvisualisierung ist einer der Schritte bei der Analyse von Daten und zur Präsentation von Benutzern.
Teilkarte des Internets Anfang 2005 als Diagramm dargestellt, repräsentiert jede Zeile zwei IP -Adressenund eine Verzögerung zwischen diesen beiden Knoten.

Das Gebiet der Daten- und Informationsvisualisierung ist "aus der Forschung in entstanden Menschliche interaktion mit dem Computer, Informatik, Grafik, visuelles Design, Psychologie, und Geschäftsmethoden. Es wird zunehmend als kritische Komponente in der wissenschaftlichen Forschung angewendet, Digitale Bibliotheken, Data Mining, Finanzdatenanalyse, Marktstudien, Fertigung Produktionskontrolle, und Drogenentdeckung".[8]

Daten- und Informationsvisualisierung geht davon aus Vermittlung abstrakter Informationen auf intuitive Weise. "[9]

Die Datenanalyse ist ein unverzichtbarer Bestandteil aller angewandten Forschungs- und Problemlösung in der Industrie. Die grundlegendsten Datenanalyseansätze sind Visualisierung (Histogramme, Streudiagramme, Oberflächenplots, Baumkarten, parallele Koordinatendiagramme usw.). Statistiken (Hypothesentest, Regression, PCA, etc.), Data Mining (Assoziationsabbauusw.) und maschinelles Lernen Methoden (Clustering, Einstufung, Entscheidungsbäume, etc.). Unter diesen Ansätzen ist die Informationsvisualisierung oder visuelle Datenanalyse der am meisten auf die kognitiven Fähigkeiten menschlicher Analysten angewiesen und ermöglicht die Entdeckung unstrukturierter umsetzbarer Erkenntnisse, die nur durch menschliche Vorstellungskraft und Kreativität begrenzt sind. Der Analyst muss keine ausgefeilten Methoden lernen, um die Visualisierungen der Daten zu interpretieren. Informationsvisualisierung ist auch ein Hypothesergenerierungsschema, das typischerweise eine analytischere oder formalere Analyse wie statistische Hypothesentests befolgt.

Um Informationen klar und effizient zu kommunizieren, verwendet die Datenvisualisierung Statistische Grafiken, Diagramme, Informationsgrafik und andere Werkzeuge. Numerische Daten können mit Punkten, Linien oder Balken codiert werden, um eine quantitative Nachricht visuell zu kommunizieren.[10] Eine effektive Visualisierung hilft den Benutzern, Daten und Beweise zu analysieren und zu begründen.[11] Es macht komplexe Daten zugänglicher, verständlicher und nutzbarer, kann aber auch reduktiv sein.[12] Benutzer können bestimmte analytische Aufgaben haben, z. B. Vergleiche oder Verständnis Kausalitätund das Entwurfsprinzip der Grafik (d. H. Vergleiche oder Kausalität) folgt der Aufgabe. Tabellen werden im Allgemeinen verwendet, wenn Benutzer eine bestimmte Messung nachschlagen, während Diagramme verschiedener Typen verwendet werden, um Muster oder Beziehungen in den Daten für eine oder mehrere Variablen anzuzeigen.

Die Datenvisualisierung bezieht sich auf die Techniken, die zur Kommunikation von Daten oder Informationen verwendet werden, indem sie sie als visuelle Objekte (z. B. Punkte, Linien oder Balken) in Grafiken codieren. Ziel ist es, den Benutzern die Informationen klar und effizient zu vermitteln. Es ist einer der Schritte in Datenanalyse oder Datenwissenschaft. Laut Vitaly Friedman (2008) ist das "Hauptziel der Datenvisualisierung", Informationen klar und effektiv auf grafische Weise zu kommunizieren. Dies bedeutet nicht, dass die Datenvisualisierung langweilig aussehen muss, um funktional oder äußerst raffiniert zu sein, um schön auszusehen. Ideen zu vermitteln Effektiv müssen sowohl die ästhetische Form als auch die Funktionalität Hand in Hand gehen und Einblicke in einen eher spärlichen und komplexen Datensatz geben, indem seine Schlüsselaspekte intuitiver kommuniziert werden. Doch Designer erreichen häufig kein Gleichgewicht zwischen Form und Funktion, was herrlich erzeugt Datenvisualisierungen, die ihrem Hauptzweck nicht erfüllen - Informationen zu kommunizieren ".[13]

In der Tat, Fernanda Viegas und Martin M. Wattenberg schlug vor, dass eine ideale Visualisierung nicht nur klar kommunizieren sollte, sondern auch das Engagement und die Aufmerksamkeit der Zuschauer anregen sollte.[14]

Die Datenvisualisierung ist eng mit dem zusammenhängen mit Informationsgrafik, Informationsvisualisierung, Wissenschaftliche Visualisierung, Explorationsdatenanalyse und Statistische Grafiken. Im neuen Jahrtausend ist die Datenvisualisierung zu einem aktiven Bereich der Forschung, Lehre und Entwicklung geworden. Nach Post et al. (2002) hat die wissenschaftliche und Informationsvisualisierung vereint.[15]

In der kommerziellen Umgebungsdatenvisualisierung wird häufig als als bezeichnet als Dashboards. Infografiken sind eine weitere sehr häufige Form der Datenvisualisierung.

Prinzipien

Eigenschaften effektiver grafischer Anzeigen

Charles Joseph Minard1869 Diagramm von Napoleonisches Frankreichs Invasion in Russland, ein frühes Beispiel für eine Informationsgrafik

Der größte Wert eines Bildes besteht darin, dass es uns zwingt, zu bemerken, was wir nie erwartet haben.

John Tukey[16]

Edward Tufte hat erklärt, dass Benutzer von Informationsanzeigen speziell ausführen Analyseaufgaben wie Vergleiche zu machen. Das Designprinzip der Informationsgrafik sollte die analytische Aufgabe unterstützen.[17] Wie William Cleveland und Robert McGill zeigen, erreichen verschiedene grafische Elemente dies mehr oder weniger effektiv. Zum Beispiel übertreffen DOT -Diagramme und Balkendiagramme Kreisdiagramme.[18]

In seinem Buch von 1983 Die visuelle Anzeige quantitativer Informationen, Edward Tufte Definiert "grafische Anzeigen" und Prinzipien für eine effektive grafische Anzeige in der folgenden Passage: "Exzellenz in statistischen Grafiken besteht aus komplexen Ideen, die mit Klarheit, Präzision und Effizienz kommuniziert haben. Grafische Anzeigen sollten:

  • Zeigen Sie die Daten
  • Verleihen Sie den Betrachter dazu, über die Substanz und nicht über Methodik, Grafikdesign, die Technologie der grafischen Produktion oder über etwas anderes nachzudenken
  • Vermeiden Sie es, zu verzerren, was die Daten zu sagen haben
  • Präsentieren Sie viele Zahlen in einem kleinen Raum
  • Machen Sie große Datensätze kohärent
  • Ermutigen Sie das Auge, verschiedene Datenstücke zu vergleichen
  • Geben Sie die Daten auf mehreren Detailebenen an, von einer breiten Übersicht bis zur Feinstruktur
  • Erfüllen Sie einen einigermaßen klaren Zweck: Beschreibung, Erforschung, Tabellierung oder Dekoration
  • Seien Sie eng in die statistischen und verbalen Beschreibungen eines Datensatzes integriert.

Grafik aufdecken Daten. In der Tat können Grafiken präziser und aufschlussreicher sein als herkömmliche statistische Berechnungen. "[19]

Zum Beispiel zeigt das Minard -Diagramm die Verluste von Napoleons Armee im Zeitraum von 1812–1813. Sechs Variablen sind aufgetragen: die Größe der Armee, ihre Position auf einer zweidimensionalen Oberfläche (x und y), Zeit, Bewegungsrichtung und Temperatur. Die Linienbreite zeigt einen Vergleich (Größe der Armee zu Zeitpunkten), während die Temperaturachse eine Ursache für die Änderung der Armeegröße vorsieht. Dieses multivariate Display auf einer zweidimensionalen Oberfläche erzählt eine Geschichte, die sofort erfasst werden kann, während die Quelldaten für die Verfeinerung von Glaubwürdigkeit identifiziert werden. Tufte schrieb 1983: "Es kann durchaus die beste statistische Grafik sein, die jemals gezeichnet wurde."[19]

Nicht anwenden können diese Prinzipien nicht anwenden können irreführende Grafiken, die Nachricht zu verzerren oder eine fehlerhafte Schlussfolgerung zu unterstützen. Laut Tufte, Chartjunk Bezieht sich auf die fremde innere Dekoration der Grafik, die nicht die Botschaft oder unbegründete dreidimensionale oder perspektivische Auswirkungen verbessert. Die Erklärungsschlüssel vom Bild selbst, die das Auge vom Bild zum Schlüssel hin und her zu wandern, ist eine Form von "administrativen Trümmern". Das Verhältnis von "Daten zu Tinte" sollte maximiert werden, wobei die nicht-Daten-Tinte gelöscht werden, wo machbar ist.[19]

Das Budgetbüro des Kongresses Zusammenfassend lässt sich mehrere Best Practices für grafische Displays in einer Präsentation im Juni 2014 zusammen. Dazu gehörten: a) Ihr Publikum zu kennen; b) Gestaltung von Grafiken, die allein außerhalb des Kontextes des Berichts stehen können; und c) Entwerfen von Grafiken, die die Schlüsselnachrichten im Bericht kommunizieren.[20]

Quantitative Nachrichten

Eine Zeitreihe, die mit einem Zeilendiagramm illustriert ist, das Trends in den US -Bundesausgaben und Einnahmen im Laufe der Zeit zeigt
Eine Streuung, die die negative Korrelation zwischen zwei Variablen (Inflation und Arbeitslosigkeit) veranschaulicht, gemessen zu Zeitpunkten

Autor Stephen wenige haben acht Arten quantitativer Nachrichten beschrieben, die Benutzer versuchen können, eine Reihe von Daten zu verstehen oder zu kommunizieren, und die zugehörigen Diagramme, mit denen die Nachricht kommuniziert wird:

  1. Zeitreihen: Eine einzige Variable wird über einen bestimmten Zeitraum erfasst, wie z. B. die Arbeitslosenquote oder die Temperaturmaßnahmen über einen Zeitraum von 10 Jahren. EIN Liniendiagramm kann verwendet werden, um den Trend im Laufe der Zeit zu demonstrieren.
  2. Ranking: Kategoriale Unterteilungen werden in aufsteigender oder absteigender Reihenfolge eingestuft, z. B. eine Ranking der Verkaufsleistung (die messen) von Verkäufern (die Kategorie, mit jedem Verkäufer a Kategorische Unterteilung) während eines einzigen Zeitraums. EIN Balkendiagramm Kann verwendet werden, um den Vergleich über die Vertriebsmitglieder zu zeigen.
  3. Teil-zu-Ganze: Kategoriale Unterteilungen werden als Verhältnis zum Ganzen gemessen (d. H. Ein Prozentsatz von 100%). EIN Kuchendiagramm oder Bar -Chart kann den Vergleich von Verhältnissen zeigen, wie z. B. den Marktanteil, der von Wettbewerbern in einem Markt vertreten wird.
  4. Abweichung: Kategoriale Unterteilungen werden mit einer Referenz verglichen, z. B. einen Vergleich der tatsächlichen und den Haushaltskosten für mehrere Abteilungen eines Unternehmens für einen bestimmten Zeitraum. Ein Balkendiagramm kann den tatsächlichen Vergleich der Referenzbetrag mit dem Vergleich des tatsächlichen Vergleichs anzeigen.
  5. Frequenzverteilung: Zeigt die Anzahl der Beobachtungen einer bestimmten Variablen für ein bestimmtes Intervall an, wie z. HistogrammFür diese Analyse kann eine Art von Balkendiagramm verwendet werden. EIN Box-Plot Hilft bei der Visualisierung von Schlüsselstatistiken über die Verteilung, wie Median, Quartile, Ausreißer usw.
  6. Korrelation: Vergleich zwischen Beobachtungen, die durch zwei Variablen (x, y) dargestellt werden, um festzustellen, ob sie dazu neigen, sich in dieselbe oder entgegengesetzte Richtungen zu bewegen. Zum Beispiel die Arbeitslosigkeit (x) und die Inflation (Y) für eine Stichprobe von Monaten. EIN Streudiagramm wird normalerweise für diese Nachricht verwendet.
  7. Nenner Vergleich: Vergleichen kategoriale Unterteilungen in keiner bestimmten Reihenfolge, z. B. das Verkaufsvolumen mit dem Produktcode. Für diesen Vergleich kann ein Balkendiagramm verwendet werden.
  8. Geografisch oder Geospatial: Vergleich einer Variablen über eine Karte oder ein Layout, z. B. die Arbeitslosenquote durch Staat oder die Anzahl der Personen auf den verschiedenen Böden eines Gebäudes. EIN Kartogramm ist eine typische Grafik verwendet.[10][21]

Analysten, die eine Reihe von Daten überprüfen, können prüfen, ob einige oder alle oben genannten Nachrichten und Grafiktypen für ihre Aufgabe und ihr Publikum anwendbar sind. Der Prozess von Versuch und Irrtum, aussagekräftige Beziehungen und Nachrichten in den Daten zu identifizieren, ist Teil von von Explorationsdatenanalyse.

Visuelle Wahrnehmung und Datenvisualisierung

Ein Mensch kann Unterschiede in Linienlänge, Form, Ausrichtung, Entfernungen und Farbe (Hue) leicht ohne signifikante Verarbeitungsaufwand unterscheiden; Diese werden als "bezeichnet"Vorantriebsattribute" Instanzen der Ziffern können durch die vorabstiegende Verarbeitung schnell festgestellt werden.[22]

Überzeugende Grafiken nutzen die voreinstimmende Verarbeitung und Attribute sowie die relative Stärke dieser Attribute. Da der Mensch beispielsweise leichter Unterschiede in der Länge der Linienlänge als in der Oberfläche verarbeiten kann, kann es effektiver sein, ein Balkendiagramm (das die Länge der Linien ausnutzt, um den Vergleich anzuzeigen) und kann eher ein Balkendiagramm verwenden, anstatt Kreisdiagramme (die Oberfläche verwenden, um den Vergleich anzuzeigen ).[22]

Menschliche Wahrnehmung/Wahrnehmung und Datenvisualisierung

Fast alle Datenvisualisierungen werden für den menschlichen Verbrauch erstellt. Kenntnis der menschlichen Wahrnehmung und Wahrnehmung ist bei der Gestaltung intuitiver Visualisierungen notwendig.[23] Kognition bezieht sich auf Prozesse bei Menschen wie Wahrnehmung, Aufmerksamkeit, Lernen, Gedächtnis, Gedanken, Konzeptbildung, Lesen und Problemlösung.[24] Die visuelle Verarbeitung des Menschen ist effizient bei der Erkennung von Veränderungen und zum Vergleich zwischen Größen, Größen, Formen und Variationen der Leichtigkeit. Wenn Eigenschaften symbolischer Daten auf visuelle Eigenschaften abgebildet werden, können Menschen effizient große Datenmengen durchsuchen. Es wird geschätzt, dass 2/3 der Neuronen des Gehirns an der visuellen Verarbeitung beteiligt sein können. Die richtige Visualisierung bietet einen anderen Ansatz, um potenzielle Verbindungen, Beziehungen usw. zu zeigen, die in nicht-visualisierten quantitativen Daten nicht so offensichtlich sind. Visualisierung kann ein Mittel von werden Datenforschung.

Studien haben gezeigt, dass Personen im Durchschnitt 19% weniger kognitive Ressourcen und 4,5% besser in der Lage sind, sich an Details zu erinnern, wenn sie die Datenvisualisierung mit Text vergleichen.[25]

Geschichte

Ausgewählte Meilensteine ​​und Erfindungen

Die moderne Untersuchung der Visualisierung begann mit Computergrafik, was "von Anfang an verwendet wurde, um wissenschaftliche Probleme zu untersuchen. In den frühen Tagen hat die mangelnde Grafikleistung jedoch häufig ihre Nützlichkeit eingeschränkt. Die jüngste Betonung der Visualisierung begann 1987 mit der Sonderausgabe von Computergrafiken zur Visualisierung in der Visualisierung in Wissenschaftliches rechnen. Seitdem gab es mehrere Konferenzen und Workshops, die von der gemeinsam gesponsert wurden IEEE Computer Society und ACM Siggraph".[26] Sie haben sich den allgemeinen Themen von gewidmet Datenvisualisierung, Informationsvisualisierung und Wissenschaftliche Visualisierung, und spezifischere Bereiche wie z. Volumenvisualisierung. 1786, William Playfair veröffentlichte die erste Präsentationsgrafik.

Produktraumlokalisierung, beabsichtigt, das zu zeigen Wirtschaftliche Komplexität einer bestimmten Wirtschaft
Baumkarte von Benin Exports (2009) nach Produktkategorie. Die Produktexporte Treemaps sind eine der neuesten Anwendungen dieser Art von Visualisierungen, die vom Harvard-mit entwickelt wurden Observatorium der wirtschaftlichen Komplexität

Es gibt keine umfassende "Geschichte" der Datenvisualisierung. Es gibt keine Berichte, die die gesamte Entwicklung des visuellen Denkens und die visuelle Darstellung von Daten umfassen und die Beiträge unterschiedlicher Disziplinen sammeln.[27] Michael Friendly und Daniel J Denis von York University sind in einem Projekt beteiligt, das versucht, eine umfassende Visualisierungsgeschichte zu erzielen. Entgegen der allgemeinen Überzeugung ist die Datenvisualisierung keine moderne Entwicklung. Seit Vorgeschichte wurden Sterndaten oder Informationen wie die Lage der Sterne an den Wänden von Höhlen (wie die in der gefundenen Sterne vorhanden Lascaux Cave in Südfrankreich) seit der Pleistozän- Epoche.[28] Physische Artefakte wie Mesopotamianer Ton -Token (5500 v. Chr.), Inca Quipus (2600 v. Chr.) Und Marshall Islands Stick -Diagramme (n.d.) kann auch als visualisierende quantitative Informationen angesehen werden.[29][30]

Die erste dokumentierte Datenvisualisierung kann auf 1160 v. mit Turin Papyrus Karte Dies zeigt genau die Verteilung geologischer Ressourcen und liefert Informationen über das Steinbruch dieser Ressourcen.[31] Solche Karten können als kategorisiert werden thematische KartographieDies ist eine Art von Datenvisualisierung, die bestimmte Daten und Informationen über eine geografische Abbildung vorstellt und kommuniziert, die ein bestimmtes Thema zeigt, das mit einem bestimmten geografischen Bereich verbunden ist. Frühere dokumentierte Formen der Datenvisualisierung waren verschiedene thematische Karten aus verschiedenen Kulturen und Ideogrammen und Hieroglyphen, die die Interpretation von Informationen zur Verfügung stellten. Zum Beispiel, Linear b Tablets von Mykene bildete eine Visualisierung von Informationen über das Handwerk der Spätbronzezeit im Mittelmeerraum. Die Idee der Koordinaten wurde von alten ägyptischen Vermesser verwendet, um Städte auszulegen, irdische und himmlische Positionen wurden durch etwas, das dem Breitengrad und Längengrad ähnelte Claudius Ptolemäus [C.85 - C. 165] in Alexandria würde bis zum 14. Jahrhundert als Referenzstandard dienen.[31]

Die Erfindung von Papier und Pergament ermöglichte die weitere Entwicklung von Visualisierungen im Laufe der Geschichte. Die Abbildung zeigt eine Grafik aus dem 10. oder möglicherweise 11. Jahrhundert, das eine Darstellung der Planetenbewegung darstellt, die in einem Anhang eines Lehrbuchs in Klosterschulen verwendet wird.[32] Die Grafik sollte offenbar ein Diagramm der Neigungen der Planetenbahnen als Funktion der Zeit darstellen. Zu diesem Zweck wurde die Zone des Tierkreises in einer Ebene mit einer horizontalen Linie dargestellt, die als Zeit- oder Längsachse in dreißig Teile unterteilt war. Die vertikale Achse bezeichnet die Breite des Tierkreises. Die horizontale Skala scheint für jeden Planeten einzeln ausgewählt worden zu sein, für die Perioden kann nicht abgeglichen werden. Der dazugehörige Text bezieht sich nur auf die Amplituden. Die Kurven sind anscheinend nicht rechtzeitig verwandt.

Planetenbewegungen

Bis zum 16. Jahrhundert waren Techniken und Instrumente zur präzisen Beobachtung und Messung der physikalischen Größen sowie die geografische und himmlische Position gut entwickelt (z. B. ein „Wandquadrant“, das durch konstruiert wurde, durch Tycho Brahe [1546–1601], bedeckt eine ganze Wand in seinem Observatorium). Besonders wichtig war die Entwicklung von Triangulation und anderen Methoden, um Kartierungsstellen genau zu bestimmen.[27] Sehr früh führte die Zeitmaßnahmen dazu, die Wissenschaftler innovative Möglichkeiten zur Visualisierung der Daten zu entwickeln (z. B. Lorenz Codomann im Jahr 1596, Johannes Temporarius im Jahr 1596[33]).

Französischer Philosoph und Mathematiker René Descartes und Pierre de Fermat entwickelte analytische Geometrie und zweidimensionales Koordinatensystem, das die praktischen Methoden zur Anzeige und Berechnung von Werten stark beeinflusste. Fermat und Blaise PascalDie Arbeit an Statistiken und Wahrscheinlichkeitstheorie legte den Grundstein für das, was wir jetzt als Daten konzipieren.[27] Laut der Interaction Design Foundation erlaubten und halfen diese Entwicklungen William und halfen William Fair spielen, der Potenzial für eine grafische Kommunikation quantitativer Daten sah, um grafische Methoden der Statistik zu generieren und zu entwickeln.[23]

Playfair Timeseries

In der zweiten Hälfte des 20. Jahrhunderts, Jacques Bertin verwendete quantitative Diagramme, um Informationen "intuitiv, klar, genau und effizient" darzustellen.[23]

John Tukey und Edward Tufte drückten die Grenzen der Datenvisualisierung; Tukey mit seinem neuen statistischen Ansatz der explorativen Datenanalyse und Tufte mit seinem Buch "Die visuelle Anzeige quantitativer Informationen" ebnete den Weg zur Verfeinerung von Datenvisualisierungstechniken für mehr als Statistiker. Mit dem Fortschreiten der Technologie kam das Fortschreiten der Datenvisualisierung; Beginnend mit handgezeichneten Visualisierungen und Entwicklung zu mehr technischen Anwendungen-einschließlich interaktiver Designs, die zur Softwarevisualisierung führen.[34]

Programme wie SAS, SOFA, R, Minitab, Eckpfeiler und mehr ermöglichen die Datenvisualisierung im Bereich der Statistik. Andere Datenvisualisierungsanwendungen, fokussierter und einzigartig für Einzelpersonen, Programmiersprachen wie z. D3, Python und JavaScript Helfen Sie, die Visualisierung quantitativer Daten zu einer Möglichkeit zu machen. Privatschulen haben auch Programme entwickelt, um die Nachfrage nach Lerndatenvisualisierung und zugehörigen Programmierbibliotheken zu erfüllen, einschließlich kostenloser Programme wie Der Datenkubator oder bezahlte Programme wie Generalversammlung.[35]

Ab dem Jahr 2013 haben das Artcenter College of Design, Caltech und JPL in Pasadena 2013 mit dem Symposium "Daten zur Entdeckung" ein jährliches Programm zur interaktiven Datenvisualisierung durchgeführt.[36] Das Programm fragt: Wie kann die interaktive Datenvisualisierung Wissenschaftlern und Ingenieuren helfen, ihre Daten effektiver zu untersuchen? Wie können Computer-, Design- und Design -Denken dazu beitragen, die Forschungsergebnisse zu maximieren? Welche Methoden sind am effektivsten, um Wissen aus diesen Bereichen zu nutzen? Durch die Codierung relationaler Informationen mit geeigneten visuellen und interaktiven Eigenschaften, um zu befragen und letztendlich neue Einblicke in Daten zu erhalten und 3D -Grafik.

Terminologie

Die Datenvisualisierung beinhaltet eine spezifische Terminologie, von denen einige aus Statistiken abgeleitet sind. Zum Beispiel definiert der Autor Stephen nur zwei Arten von Daten, die in Kombination verwendet werden, um eine aussagekräftige Analyse oder Visualisierung zu unterstützen:

  • Kategorisch: Stellen Sie Gruppen von Objekten mit einem bestimmten Merkmal dar. Kategoriale Variablen können entweder nominal oder ordinal sein. Nominale Variablen zum Beispiel haben keine Ordnung zwischen ihnen und sind somit nominal. Ordinale Variablen sind Kategorien mit einer Bestellung, um die Altersgruppe aufzuzeichnen, in die jemand fällt.[37]
  • Quantitativ: Messungen darstellen, wie die Höhe einer Person oder die Temperatur einer Umgebung. Quantitative Variablen können entweder sein kontinuierlich oder diskret. Kontinuierliche Variablen erfassen die Idee, dass Messungen immer genauer durchgeführt werden können. Diskrete Variablen haben zwar nur eine begrenzte Anzahl von Möglichkeiten, wie z. B. eine Anzahl einiger Ergebnisse oder ein Alter, das in den ganzen Jahren gemessen wird.[37]

Die Unterscheidung zwischen quantitativen und kategorialen Variablen ist wichtig, da die beiden Typen unterschiedliche Visualisierungsmethoden erfordern.

Zwei primäre Arten von Informationen Anzeigen sind Tabellen und Grafiken.

  • A Tisch Enthält quantitative Daten, die in Zeilen und Spalten mit kategorialen Etiketten organisiert sind. Es wird in erster Linie verwendet, um bestimmte Werte zu suchen. Im obigen Beispiel könnte die Tabelle möglicherweise kategoriale Spaltenbezeichnungen enthalten, die den Namen darstellen (a Qualitative Variable) und Alter (a Quantitative Variable) mit jeder Datenreihe, die eine Person darstellt (die Stichprobe Experimentelle Einheit oder Kategorie Unterteilung).
  • A Graph wird in erster Linie verwendet, um Beziehungen zwischen Daten zu zeigen und Werte darzustellen visuelle Objekte (z. B. Linien, Balken oder Punkte). Numerische Werte werden in einem Bereich angezeigt, der von einem oder mehreren abgegrenzt wurde Äxte. Diese Achsen liefern Waage (Quantitativ und kategorisch) verwendet, um den visuellen Objekten Werte zu kennzeichnen und zuweisen. Viele Grafiken werden auch als als bezeichnet Diagramme.[38]

Eppler und Lengler haben die "periodische Tabelle der Visualisierungsmethoden" entwickelt, ein interaktives Diagramm mit verschiedenen Datenvisualisierungsmethoden. Es enthält sechs Arten von Datenvisualisierungsmethoden: Daten, Informationen, Konzept, Strategie, Metapher und Verbund.[39]

Techniken

Name Visuelle Abmessungen Beschreibung / Beispiel Verwendungen
Balkendiagramm von Tipps bis zum Wochentag
Balkendiagramm
  • Länge/Anzahl
  • Kategorie
  • Farbe
  • Die Geschenke Kategoriale Daten mit rechteckig Bars mit Höhen oder Längen proportional zu den Werten, die sie darstellen. Die Balken können vertikal oder horizontal aufgetragen werden.
  • Ein Balkendiagramm zeigt Vergleiche unter diskret Kategorien. Eine Achse des Diagramms zeigt die spezifischen Kategorien, die verglichen werden, und die andere Achse stellt einen gemessenen Wert dar.
  • Einige Balkendiagramme enthalten Balken in Gruppen von mehr als einem und zeigen die Werte von mehr als einer gemessenen Variablen. Diese Clustergruppen können mit Farbe differenziert werden.
  • Zum Beispiel; Vergleich von Werten, wie z. B. Vertriebsleistung für mehrere Personen oder Unternehmen in einem Zeitraum.
Balkendiagramm variabler Breite in Bezug auf (1) Bevölkerung, (2) Pro-Kopf-Treibhausgasemissionen und (3) Gesamt-Treibhausgasemissionen der Treibhausgas

Variable-Breiten-Balkendiagramm ("Variwide")

  • Kategorie (Größe/Anzahl/Ausmaß in der ersten Dimension)
  • Größe/Anzahl/Ausmaß in der zweiten Dimension
  • Größe/Anzahl/Ausmaß als Barbereich
  • Farbe
  • Enthält oben die meisten Funktionen des Basic -Balkendiagramms oben
  • Bereich des ungleichmäßigen Breitenstabs vermittelt explizit Informationen einer dritten Menge, die implizit mit der ersten und zweiten Menge aus horizontalen und vertikalen Achsen zusammenhängt
Projizierte (1) Frequenz und (2) Intensität extremer "10-Jahres-Wärmewellen" sind in Paaren von horizontalen bzw. vertikalen Balken verbunden. Balken werden durch (3) farbcodierte Primärkategorie (Grad der globalen Erwärmung) unterschieden.

Orthogonales (orthogonales Composite) Balkendiagramm

  • Numerischer Wert der ersten Variablen (Ausmaß in der ersten Dimension; überlagerte horizontale Balken)
  • Numerischer Wert der zweiten Variablen (Ausmaß in der zweiten Dimension; wie herkömmliches vertikales Balkendiagramm)
  • Kategorie für erste und zweite Variablen (z. B. farbcodiert)
  • Enthält oben die meisten Funktionen des Basic -Balkendiagramms oben
  • Paare von numerischen Variablen, normalerweise farbcodiert, nach Kategorie gerendert
  • Variablen müssen nicht direkt in der Art und Weise verwandt sein, wie sie sich in "variweiten" Diagrammen befinden
Histogramm der Immobilienpreise
Histogramm
  • Behältergrenzen
  • zählen/Länge
  • Farbe
  • Eine ungefähre Darstellung der Verteilung von numerischen Daten. Teilen Sie den gesamten Wertebereich in eine Reihe von Intervallen und zählen Sie dann, wie viele Werte in jedes Intervall fallen, dies wird genannt Klasseneinteilung. Die Behälter werden normalerweise als aufeinanderfolgende, nicht überlappende angegeben Intervalle einer Variablen. Die Mülleimer (Intervalle) müssen benachbart sein und sind häufig (aber nicht erforderlich) von gleicher Größe.
  • Zum Beispiel die Bestimmung der Häufigkeit des jährlichen Aktienmarktprozentsatzes innerhalb bestimmter Bereiche (Bins) wie 0-10%, 11-20%usw. Die Höhe des Balkens repräsentiert die Anzahl der Beobachtungen (Jahre) mit einem Rendite%in der Reichweite durch den jeweiligen Behälter.
Grundlegende Streuung von zwei Variablen
Streudiagramm
  • x Position
  • y Position
  • Symbol/Glyphe
  • Farbe
  • Größe
  • Verwendet Kartesischen Koordinaten Werte für typischerweise zwei anzeigen Variablen für eine Reihe von Daten.
  • Punkte können über Farbe, Form und/oder Größe codiert werden, um zusätzliche Variablen anzuzeigen.
  • Jeder Punkt auf dem Diagramm hat einen zugehörigen X- und Y -Term, der seine Position in der kartesischen Ebene bestimmt.
  • Streudiagramme werden häufig verwendet, um die Korrelation zwischen Variablen (x und y) hervorzuheben.
Streudiagramm
Streudiagramm (3D)
  • Position x
  • Position y
  • Position z
  • Farbe
  • Symbol
  • Größe
  • Ähnlich wie das 2-dimensionale Streudiagramm oben visualisiert das 3-dimensionale Streudiagramm die Beziehung zwischen typischerweise 3 Variablen aus einem Datensatz.
  • Der Punkt kann erneut über Farbe, Form und/oder Größe codiert werden, um zusätzliche Variablen anzuzeigen
Netzwerkanalyse
Netzwerk
  • Knotengröße
  • Knoten Farbe
  • Krawattendicke
  • Bindungen Farbe
  • Räumlichkeit
  • Finden von Clustern im Netzwerk (z. B. Gruppieren von Facebook -Freunden in verschiedene Cluster).
  • Entdeckung von Brücken (Informationsmakler oder Grenzspanner) zwischen Clustern im Netzwerk
  • Bestimmung der einflussreichsten Knoten im Netzwerk (z. B. möchte ein Unternehmen eine kleine Gruppe von Personen auf Twitter für eine Marketingkampagne ansprechen).
  • Finden ausfälligerer Akteure, die nicht in einen Cluster passen oder sich in der Peripherie eines Netzwerks befinden.
Kuchendiagramm
Kuchendiagramm
  • Farbe
  • Repräsentiert eine kategoriale Variable, die in Scheiben unterteilt ist, um den numerischen Anteil zu veranschaulichen. In einem Kreisdiagramm die Bogenlänge von jedem Schicht (und folglich seine seines Zentralwinkel und Bereich), ist proportional zu der Menge, die es darstellt.
  • Zum Beispiel, wie in der Grafik rechts gezeigt, der Anteil von Englisch Muttersprachler weltweit
Liniendiagramm
Liniendiagramm
  • x Position
  • y Position
  • Symbol/Glyphe
  • Farbe
  • Größe
  • Repräsentiert Informationen als eine Reihe von Datenpunkten, die als "Marker" bezeichnet werden, die durch gerade Liniensegmente verbunden sind.
  • Ähnlich wie a Streudiagramm außer dass die Messpunkte geordnet werden (typischerweise nach ihrem X-Achse-Wert) und mit geraden Liniensegmenten verbunden sind.
  • Oft verwendet, um einen Trend der Daten über Zeitintervalle der Zeit zu visualisieren - a Zeitfolgen - Somit wird die Linie oft chronologisch gezogen.
Streamgraph
Streamgraph
  • Breite
  • Farbe
  • Zeit (Fluss)
  • Eine Art gestapelt Flächengrafik das ist um a umgedrückt Zentralachse, was zu einer fließenden Form führt.
  • Im Gegensatz zu einem herkömmlichen gestapelten Flächendiagramm, in dem die Schichten auf einer Achse gestapelt sind, sind in einem Streamgraph die Schichten positioniert, um ihr "Wackel" zu minimieren.
  • Streamgraphs zeigen Daten nur mit positiven Werten an und können nicht sowohl negative als auch positive Werte darstellen.
  • Zum Beispiel zeigt das richtige Visual die Musik, die ein Benutzer zu Beginn des Jahres 2012 angehört wird
Treemap
Treemap
  • Größe
  • Farbe
  • Ist eine Methode zum Anzeigen Hierarchisch Daten verwenden verschachtelt Figuren, normalerweise Rechtecke.
  • Zum Beispiel Speicherplatz nach Standort- / Dateityp
Gantt-Diagramm
Gantt-Diagramm
  • Farbe
  • Zeit (Fluss)
Wärmekarte
Wärmekarte
  • Farbe
  • Kategoriale Variable
  • Repräsentiert die Größe eines Phänomens als Farbe in zwei Dimensionen.
  • Es gibt zwei Kategorien von Wärmekarten:
    • Cluster -Wärmekarte: Wenn Größen in eine Matrix der festen Zellgröße ausgelegt werden, deren Zeilen und Spalten kategoriale Daten sind. Zum Beispiel die Grafik rechts.
    • Räumliche Wärmekarte: wobei keine Matrix der festen Zellgröße beispielsweise eine Wärmemap. Zum Beispiel eine Wärmekarte mit Bevölkerungsdichten, die auf einer geografischen Karte angezeigt werden
Streifengrafik
Streifengrafik
  • x Position
  • Farbe
  • Eine Folge von farbigen Streifen zeigt den Trend einer Datenreihe visuell.
  • Porträtiert eine einzelne Variable - prototypisch Temperatur im Laufe der Zeit porträtieren Erderwärmung
  • Absichtlich minimalistisch-ohne technische Indikia-intuitiv mit Nichtwissenschaftlern zu kommunizieren[40]
  • Kann "gestapelt" werden, um Plural -Serien darzustellen (Beispiel)
Animierte Spiralgrafik
Animierte Spiralgrafik
  • Radialentfernung (abhängige Variable)
  • Drehwinkel (Radfahren durch Monate)
  • Farbe (vergangene Jahre)
  • Porträtiert eine einzelne abhängige Variable - prototypisch Temperatur im Laufe der Zeit porträtieren Erderwärmung
  • Die abhängige Variable wird zunehmend entlang einer kontinuierlichen "Spirale" aufgetragen, die als Funktion von (a) ständig rotierenden Winkel (zwölf Monate pro Revolution) und (b) sich entwickelnde Farbe (Farbveränderungen über die Jahre) bestimmt wird[41]
Kasten- und Whisker -Grundstück
Kasten- und Whisker -Grundstück
  • x Achse
  • y Achse
  • Eine Methode zur grafischen Darstellung von Gruppen numerischer Daten durch ihre Quartile.
  • Boxplots können auch Linien haben, die sich von den Kästchen erstrecken (Schnurrhaare) Angeben von Variabilität außerhalb der oberen und unteren Quartile.
  • Ausreißer kann als individuelle Punkte aufgetragen werden.
  • Die beiden Boxen, die übereinander drapieren, repräsentieren die mittleren 50% der Daten, wobei die Linie die beiden Boxen trennte, die den mittleren Datenwert identifizieren, und die oberen und unteren Kanten der Felder repräsentieren die 75. bzw. 25. Perzentildatenpunkte.
  • Boxplots sind nicht parametrisch: Sie zeigen Variationen in Proben von a Statistische Bevölkerung ohne Annahmen der zugrunde liegenden Annahmen zu treffen Statistische Verteilungsind daher nützlich, um ein anfängliches Verständnis eines Datensatzes zu erhalten. Zum Beispiel beim Vergleich der Verteilung des Alters zwischen einer Gruppe von Menschen (z. B. männlich und Frauen).
Flussdiagramm
Flussdiagramm
  • Repräsentiert a Arbeitsablauf, Prozess oder ein Schritt-für-Schritt-Ansatz zur Lösung einer Aufgabe.
  • Das Flussdiagramm zeigt die Schritte als Kisten verschiedener Arten und ihre Bestellung an, indem die Kästchen mit Pfeilen verbinden.
  • Zum Beispiel die Maßnahmen zur Ausführung von Aktionen, um zu unternehmen, wenn eine Lampe nicht funktioniert, wie im Diagramm rechts gezeigt.
Radardiagramm
Radardiagramm
  • Attribute
  • Wert zugewiesene Attribute zugewiesen
  • Anzeigen multivariate Daten in Form eines zweidimensionalen Diagramm von drei oder mehr quantitativen Variablen, die auf Achsen aus demselben Punkt dargestellt werden.
  • Die relative Position und der relative Winkel der Achsen sind typischerweise uninformativ, aber verschiedene Heuristiken, z. und eine Vielzahl anderer vergleichender Maßnahmen.
  • Zum Beispiel den Vergleich von Attributen/Fähigkeiten (z. B. Kommunikation, Analyse, IT -Fähigkeiten), die in verschiedenen Universitätsabschlüssen (z. B. Mathematik, Wirtschaftlichkeit, Psychologie) gelernt wurden.
Venn-Diagramm
Venn-Diagramm
  • alle möglich logisch Beziehungen zwischen einer endlichen Sammlung verschiedener Sets.
  • Zeigt an alle möglich logisch Beziehungen zwischen einer endlichen Sammlung verschiedener Sets.
  • Diese Diagramme zeigen Elemente als Punkte im Flugzeug und Sets als Regionen in geschlossenen Kurven.
  • Ein Venn -Diagramm besteht aus mehreren überlappenden geschlossenen Kurven, normalerweise Kreisen, die jeweils einen Satz darstellen.
  • Die Punkte in einer gekennzeichneten Kurve S Elemente des Satzes darstellen S, während Punkte außerhalb der Grenze Elemente darstellen, nicht im Satz S. Dies eignet sich für intuitive Visualisierungen; Zum Beispiel die Menge aller Elemente, die Mitglieder beider Sätze sind S und T, bezeichnet ST und lesen "den Schnittpunkt von S und T", wird visuell durch den Bereich der Überlappung der Regionen dargestellt S und T. In Venn -Diagrammen werden die Kurven auf jede mögliche Weise überlappt und zeigen alle möglichen Beziehungen zwischen den Sätzen.
Ikonographie der Korrelationen
Ikonographie der Korrelationen
  • Keine Achse
  • Durchgezogene Linie
  • gepunktete Linie
  • Farbe
  • Explorationsdatenanalyse.
  • Ersetzen Sie eine Korrelationsmatrix durch ein Diagramm, in dem die „bemerkenswerten“ Korrelationen durch eine durchgezogene Linie (positive Korrelation) oder eine gepunktete Linie (negative Korrelation) dargestellt werden.
  • Punkte können über Farbe codiert werden.

Andere Techniken

Interaktivität

Interaktive Datenvisualisierung Ermöglicht direkte Aktionen auf einer grafischen Aktion Handlung Elemente und Verbindung zwischen mehreren Diagrammen ändern.[42]

Die interaktive Datenvisualisierung war ein Streben nach Statistiker Seit den späten 1960er Jahren. Beispiele für die Entwicklungen finden Sie auf der American Statistical Association Videokreditbibliothek.[43]

Gemeinsame Interaktionen umfassen:

  • Bürsten: funktioniert mit der Verwendung der Maus Um einen Pinsel zu steuern und die Farbe oder den Glyphen der Elemente eines Grundstücks direkt zu ändern. Der Pinsel ist manchmal ein Zeiger und arbeitet manchmal, indem er eine Art Überblick über Punkte zeichnet. Der Umriss ist manchmal unregelmäßig geformt, wie ein Lasso. Das Bürsten wird am häufigsten verwendet, wenn mehrere Diagramme sichtbar sind und zwischen den Diagrammen einiger Verknüpfungsmechanismus besteht. Es gibt verschiedene konzeptionelle Modelle für das Bürsten und eine Reihe gemeinsamer Verknüpfungsmechanismen. Bürsten Streudiagramme Kann ein vorübergehender Betrieb sein, bei dem Punkte im aktiven Diagramm nur ihre neuen Eigenschaften behalten. Gleichzeitig werden sie von der Bürste eingeschlossen oder geschnitten, oder es kann eine anhaltende Operation sein, so dass Punkte ihr neues Erscheinungsbild beibehalten, nachdem die Bürste weggezogen wurde. Transientes Bürsten wird normalerweise für verknüpfte Bürsten ausgewählt, wie wir gerade beschrieben haben.
  • Malerei: Persistentes Bürsten ist nützlich, wenn wir die Punkte in Cluster gruppieren und dann andere Operationen wie die Tour verwenden möchten, um die Gruppen zu vergleichen. Es wird zu einer gemeinsamen Terminologie, die persistente Operationsmalerei zu bezeichnen.
  • Identifikation: Dies könnte auch als Kennzeichnung oder Bezeichnung als Beutebürre bezeichnet werden, ist eine weitere Manipulation des Diagramms, die verknüpft werden kann. Den Cursor in einem Punkt oder einer Kante in einer Streuplot oder in einem Balken in a Balkendiagramm, verursacht ein Etikett, das das Plotelement identifiziert. Es ist in vielen interaktiven Grafiken weit verbreitet und wird manchmal als Mausover bezeichnet.
  • Skalierung: ordnet die Daten auf das Fenster und ändert sich im Bereich der. Die Zuordnungsfunktion hilft uns, verschiedene Dinge aus derselben Handlung zu lernen. Die Skalierung wird üblicherweise verwendet, um überfüllte Regionen eines Streudiagramms zu vergrößern, und es kann auch verwendet werden, um das Seitenverhältnis eines Diagramms zu ändern, um verschiedene Merkmale der Daten anzuzeigen.
  • Verknüpfung: verbindet Elemente, die in einem Diagramm mit Elementen in einem anderen Grundstück ausgewählt wurden. Die einfachste Art der Verknüpfung, eins zu eins, bei der beide Diagramme unterschiedliche Projektionen derselben Daten zeigen und ein Punkt in einem Diagramm genau einem Punkt in der anderen entspricht. Bei Verwendung von Flächendiagrammen hat das Bürsten eines Teils eines Bereichs den gleichen Effekt wie das Bürsten und ist gleichbedeutend mit der Auswahl aller Fälle in der entsprechenden Kategorie. Selbst wenn einige Handlungselemente mehr als einen Fall darstellen, verbindet die zugrunde liegende Verknüpfungsregel einen Fall in einem Diagramm in anderen Diagrammen. Die Verknüpfung kann auch durch kategoriale Variable erfolgen, z. B. durch eine Subjekt -ID, so dass alle Datenwerte, die diesem Thema entsprechen, in allen sichtbaren Diagrammen hervorgehoben werden.

Andere Perspektiven

Es gibt verschiedene Ansätze zum Umfang der Datenvisualisierung. Ein gemeinsamer Schwerpunkt liegt auf der Informationspräsentation wie Friedman (2008). Friendly (2008) setzt zwei Hauptteile der Datenvisualisierung voraus: Statistische Grafiken, und thematische Kartographie.[44] In dieser Zeile gibt der Artikel "Datenvisualisierung: Moderne Ansätze" (2007) einen Überblick über sieben Themen der Datenvisualisierung:[45]

Alle diese Themen sind eng miteinander verbunden mit Grafikdesign und Informationsdarstellung.

Andererseits von a Informatik Perspektive, Frits H. Post im Jahr 2002, kategorisierte das Feld in Unterfelder:[15][46]

In der Harvard Business Review entwickelte Scott Berinato einen Rahmen, um die Datenvisualisierung zu nähern.[47] Um visuell zu denken, müssen Benutzer zwei Fragen berücksichtigen. 1) Was Sie haben und 2) Was Sie tun. Der erste Schritt besteht darin, zu identifizieren, welche Daten sich visualisieren möchten. Es ist datengetrieben wie Gewinn in den letzten zehn Jahren oder eine konzeptionelle Idee, wie eine bestimmte Organisation strukturiert ist. Sobald diese Frage beantwortet wurde, kann man sich darauf konzentrieren, ob sie versuchen, Informationen (deklarative Visualisierung) zu kommunizieren oder etwas herauszufinden (explorative Visualisierung). Scott Berinato kombiniert diese Fragen, um vier Arten von visueller Kommunikation zu geben, die jeweils ihre eigenen Ziele haben.[47]

Diese vier Arten der visuellen Kommunikation sind wie folgt;

  • IDEA -Illustration (konzeptionell und deklarativ).[47]
    • Wird verwendet, um Konzepte zu unterrichten, zu erklären und/oder einfach einfach. Zum Beispiel Organisationsdiagramme und Entscheidungsbäume.
  • Ideengenerierung (konzeptionell und explorativ).[47]
    • Verwendet, um Probleme zu entdecken, zu innovieren und zu lösen. Zum Beispiel ein Whiteboard nach einer Brainstorming -Sitzung.
  • Visuelle Entdeckung (datengesteuert und explorativ).[47]
    • Wird verwendet, um Trends zu erkennen und Daten zu verstehen. Diese Art von Visuelle ist bei großen und komplexen Daten häufiger, bei denen der Datensatz etwas unbekannt ist und die Aufgabe offen ist.
  • Alltägliche Datenvisualisierung (datengesteuert und deklarativ).[47]
    • Die häufigste und einfachste Art der Visualisierung, die zur Bestätigung und Festlegung des Kontexts verwendet wird. Zum Beispiel ein Zeilendiagramm des BIP im Laufe der Zeit.

Anwendungen

Daten- und Informationsvisualisierungserkenntnisse werden in Bereichen wie:[8]

Organisation

Bemerkenswerte akademische und Industrielabors in diesem Bereich sind:

Konferenzen in diesem Bereich, der nach Bedeutung der Datenvisualisierungsforschung eingestuft wird,[49] sind:

  • IEEE Visualisierung: Eine jährliche internationale Konferenz über wissenschaftliche Visualisierung, Informationsvisualisierung und visuelle Analyse. Die Konferenz findet im Oktober statt.
  • ACM Siggraph: Eine jährliche internationale Konferenz über Computergrafiken, die von der ACM Siggraph -Organisation einberufen wird. Die Konferenzdaten variieren.
  • EUROVIS: Eine jährliche europäische Konferenz zur Datenvisualisierung, die von der Eurographics Working Group zur Datenvisualisierung organisiert und vom iEEE-Visualisierungs- und Grafikkomitee (IEEE VGTC) unterstützt wird. Die Konferenz findet normalerweise im Juni statt.
  • Konferenz über menschliche Faktoren in Computersystemen (CHI): Eine jährliche internationale Konferenz zur Interaktion zwischen Mensch und Compute, veranstaltet von ACM Sigchi. Die Konferenz findet normalerweise im April oder Mai statt.
  • Eurographie: Eine jährliche europäische Computergrafikkonferenz, die von der Europäischen Vereinigung für Computergrafiken abgehalten wird. Die Konferenz findet normalerweise im April oder Mai statt.
  • Pacificvis: Ein jährliches Visualisierungssymposium in der asiatisch-pazifischen Region, gesponsert vom IEEE Visualisierungs- und Grafikkomitee (IEEE VGTC). Die Konferenz findet normalerweise im März oder April statt.

Weitere Beispiele finden Sie unter: Kategorie: Computergrafikorganisationen

Datenpräsentationsarchitektur

Eine Datenvisualisierung von sozialen Medien

Datenpräsentationsarchitektur (DPA) ist ein Fähigkeitssatz, der versucht, Daten so zu identifizieren, zu lokalisieren, zu manipulieren, formatieren und zu präsentieren, um die Bedeutung und das richtige Wissen optimal zu kommunizieren.

Historisch gesehen der Begriff Datenpräsentationsarchitektur wird Kelly Lautt zugeschrieben:[a] "Datenpräsentation Architecture (DPA) ist eine selten angewandte Fähigkeit, die für den Erfolg und den Wert von entscheidend ist Business Intelligence. Die Datenpräsentation Architektur versteht die Wissenschaft von Zahlen, Daten und Statistiken in Erkennen wertvoller Informationen aus Daten und damit nutzbar, relevant und umsetzbar mit den Künsten der Datenvisualisierung, Kommunikation, Organisationspsychologie und Änderungsmanagement Um Business Intelligence -Lösungen mit Datenumfang, Bereitstellungszeit, Format und Visualisierungen zur Verfügung zu stellen, die operative, taktische und strategische Verhaltensweisen für verstandene Geschäftsziele (oder organisatorische) Ziele am effektivsten unterstützen und vorantreiben. DPA ist weder ein IT noch eine geschäftliche Fähigkeit, sondern existiert als separates Fachgebiet. Die Datenpräsentationsarchitektur ist oft mit der Datenvisualisierung verwechselt und ist ein viel breiteres Fähigkeitssatz, das die Bestimmung der Daten enthält, in welchem ​​Zeitplan und in welchem ​​genauen Format vorgestellt werden sollen, nicht nur der beste Weg, um Daten vorzustellen, die bereits ausgewählt wurden. Datenvisualisierungsfähigkeiten sind ein Element von DPA. "

Ziele

DPA hat zwei Hauptziele:

  • Verwenden Sie Daten, um Wissen auf die effizienteste Weise zu vermitteln (minimieren Sie Rauschen, Komplexität und unnötige Daten oder Details, wenn Sie die Bedürfnisse und Rollen der einzelnen Publikum angeben)
  • Um Daten zu verwenden, um das Wissen auf möglichst effektivste Weise zu vermitteln (relevante, zeitnahe und vollständige Daten für jedes Publikum in klarer und verständlicher Weise bereitzustellen, die eine wichtige Bedeutung vermitteln, ist umsetzbar und kann das Verständnis, Verhalten und Entscheidungen beeinflussen.

Zielfernrohr

Unter Berücksichtigung der oben genannten Ziele besteht die tatsächliche Arbeit der Datenpräsentationsarchitektur aus:

  • Erstellen effektiver Liefermechanismen für jedes Publikum, je nach seiner Rolle, Aufgaben, Standorten und Zugang zu Technologie
  • Definieren wichtiger Bedeutung (relevantes Wissen), die jedes Publikum in jedem Kontext benötigt
  • Bestimmung der erforderlichen Periodizität von Datenaktualisierungen (die Währung der Daten)
  • Bestimmen des richtigen Zeitpunkts für die Datenpräsentation (wann und wie oft der Benutzer die Daten sehen muss)
  • Finden der richtigen Daten (Themenbereich, historische Reichweite, Breite, Detailniveau usw.)
  • Verwendung geeigneter Analysen, Gruppierung, Visualisierung und anderer Präsentationsformate

Verwandte Felder

Die DPA -Arbeit teilt Gemeinsamkeiten mit mehreren anderen Bereichen, darunter:

  • Wirtschaftsanalyse Bei der Ermittlung von Geschäftszielen, zum Sammeln von Anforderungen und Kartierungsprozessen.
  • Verbesserung des Geschäftsprozesses darin, dass sein Ziel darin besteht, Maßnahmen und Entscheidungen bei der Förderung von Geschäftszielen zu verbessern und zu rationalisieren
  • Datenvisualisierung, indem sie gut etablierte Visualisierungstheorien verwendet, um Bedeutung oder Wichtigkeit in der Datenpräsentation hinzuzufügen oder hervorzuheben.
  • Digitale Geisteswissenschaften Erforscht nuanciertere Möglichkeiten zur Visualisierung komplexer Daten.
  • Informationsarchitekturaber der Fokus der Informationsarchitektur liegt auf unstrukturierte Daten und schließt daher sowohl eine Analyse (im statistischen/datener Sinne) als auch die direkte Umwandlung des tatsächlichen Inhalts (Daten für DPA) in neue Entitäten und Kombinationen aus.
  • HCI und InteraktionsdesignDa viele der Prinzipien beim Entwerfen interaktiver Datenvisualisierung mit HCI interdisziplinär entwickelt wurden.
  • Visueller Journalismus und datengesteuerter Journalismus oder Datenjournalismus: Der visuelle Journalismus befasst sich mit allen Arten der grafischen Erleichterung des Erzählens von Nachrichten, und datengesteuerter und Datenjournalismus werden nicht unbedingt mit der Datenvisualisierung erzählt. Dennoch steht das Gebiet des Journalismus im Vordergrund bei der Entwicklung neuer Datenvisualisierungen zur Kommunikation von Daten.
  • GrafikdesignInformationen durch Styling, Typografie, Position und andere ästhetische Bedenken.

Siehe auch

Anmerkungen

  1. ^ Die ersten formalen, aufgezeichneten öffentlichen Verwendungen der Begriffsdatenpräsentationsarchitektur waren im Dezember, Januar und Februar 2007–08 in Edmonton, Calgary und Vancouver (Kanada) in einer Präsentation von Kelly Laut, in einer Präsentation von Kelly Lauutt, die Kelly Lauutt beschreibt Ein Business Intelligence -System zur Verbesserung der Servicequalität in einem Zellstoff- und Papierunternehmen. Der Begriff wurde am 16. Dezember 2009 in einer Präsentation von Microsoft Canada in der öffentlichen Nutzung in der öffentlichen Nutzung über den Wert des Zusammenführens von Business Intelligence mit Corporate Collaboration -Prozessen verwendet.

Verweise

  1. ^ Shewan, Dan (5. Oktober 2016). "Daten sind wunderschön: 7 Datenvisualisierungstools für digitale Vermarkter". Business2Community.com. Archiviert Aus dem Original am 12. November 2016.
  2. ^ a b Nussbaumer Knaflic, Cole (2. November 2015). Geschichtenerzählen mit Daten: Ein Datenvisualisierungshandbuch für Geschäftsfachleute. ISBN 978-1-119-00225-3.
  3. ^ Tamara Munzner. "Prozess- und Fallstricke beim Schreiben von Informationsvisualisierungsforschungsarbeiten". www.cs.ubc.ca. Abgerufen 9. April 2018.
  4. ^ "Was ist Datenvisualisierung? - WhizLabs Blog". 22. Oktober 2021.
  5. ^ a b Gershon, Nahum; Page, Ward (1. August 2001). "Was das Geschichtenerzählen zur Informationsvisualisierung bewirken kann". Kommunikation der ACM. 44 (8): 31–37. doi:10.1145/381641.381653. S2CID 7666107.
  6. ^ Mason, Betsy (12. November 2019). "Warum Wissenschaftler bei der Datenvisualisierung besser sein müssen". Knowable Magazine. doi:10.1146/Knowable-110919-1.
  7. ^ O'Donoghue, Seán I.; Baldi, Benedetta Frida; Clark, Susan J.; Darling, Aaron E.; Hogan, James M.; Kaur, Sandeep; Maier-Hein, Lena; McCarthy, Davis J.; Moore, William J.; Stenau, Esther; Swedlow, Jason R.; Vuong, Jenny; Procter, James B. (2018-07-20). "Visualisierung biomedizinischer Daten". Jährliche Überprüfung der biomedizinischen Datenwissenschaft. 1 (1): 275–304. doi:10.1146/Annurev-biodatasci-080917-013424. HDL:10453/125943. S2CID 199591321. Abgerufen 25. Juni 2021.
  8. ^ a b Benjamin B. Bederson und Ben Shineiderman (2003). Das Handwerk der Informationsvisualisierung: Lesungen und Reflexionen, Morgan Kaufmann ISBN1-55860-915-6.
  9. ^ James J. Thomas und Kristin A. Cook (Hrsg.) (2005). Illumination des Weges: Die F & E -Agenda für visuelle Analysen Archiviert 2008-09-29 bei der Wayback -Maschine. Nationales Visualisierungs- und Analysezentrum. S.30
  10. ^ a b "Stephen Wenig-Perceptual Edge-Wählern des richtigen Diagramms für Ihre Nachricht-2004" (PDF). Archiviert (PDF) vom Original am 2014-10-05. Abgerufen 2014-09-08.
  11. ^ "10 Beispiele für interaktive Kartendatenvisualisierungen".
  12. ^ Engebretsen, Martin; Helen, Kennedy, Hrsg. (2020-04-16). Datenvisualisierung in der Gesellschaft. Nieuwe Prinsengracht 89 1018 VR Amsterdam Nederland: Amsterdam University Press. doi:10.5117/9789463722902_Ch02. ISBN 978-90-485-4313-7.{{}}: CS1 Wartung: Standort (Link)
  13. ^ Vitaly Friedman (2008) "Datenvisualisierung und Infografiken" Archiviert 2008-07-22 bei der Wayback -Maschine in: Grafik, Montag Inspiration, 14. Januar 2008.
  14. ^ Viegas, Fernanda; Witttenberg, Martin (19. April 2011). "Wie man Daten sexy aussehen lassen". Cnn.com. Archiviert von das Original am 6. Mai 2011. Abgerufen 7. Mai, 2017.
  15. ^ a b Frits H. Post, Gregory M. Nielson und Georges-Pierre Bonneau (2002). Datenvisualisierung: Der Stand der Technik. Forschungspapier Tu Delft, 2002. Archiviert 2009-10-07 bei der Wayback -Maschine.
  16. ^ Tukey, John (1977). Explorationsdatenanalyse. Addison-Wesley. ISBN 0-201-07616-0.
  17. ^ TechatState (7. August 2013). "[email protected]: Datenvisualisierung - Keynote von Dr. Edward Tufte". Archiviert vom Original am 29. März 2017. Abgerufen 29. November 2016 - über YouTube.
  18. ^ Cleveland, W. S.; McGill, R. (1985). "Grafische Wahrnehmung und grafische Methoden zur Analyse wissenschaftlicher Daten". Wissenschaft. 229 (4716): 828–33. Bibcode:1985Sci ... 229..828c. doi:10.1126/science.229.4716.828. PMID 17777913. S2CID 16342041.
  19. ^ a b c Tufte, Edward (1983). Die visuelle Anzeige quantitativer Informationen. Cheshire, Connecticut: Graphics Press. ISBN 0-9613921-4-2. Archiviert vom Original am 2013-01-14. Abgerufen 2019-08-10.
  20. ^ "Visuelle Geschichten über Daten erzählen - Kongressbudget Office". www.cbo.gov. Archiviert vom Original am 2014-12-04. Abgerufen 2014-11-27.
  21. ^ "Stephen Wenig-Perceptual Edge-Graph-Auswahlmatrix" (PDF). Archiviert (PDF) vom Original am 2014-10-05. Abgerufen 2014-09-08.
  22. ^ a b "Steven, nur wenige die Kraft der visuellen Wahrnehmung-September 2004", " (PDF). Archiviert (PDF) vom Original am 2014-10-05. Abgerufen 2014-10-08.
  23. ^ a b c Datenvisualisierung für die menschliche Wahrnehmung. Die Interaction Design Foundation. Archiviert vom Original am 2015-11-23. Abgerufen 2015-11-23.
  24. ^ "Visualisierung" (PDF). SFU. SFU -Vorlesung. Archiviert von das Original (PDF) Am 2016-01-22. Abgerufen 2015-11-22.
  25. ^ Graham, Fiona (2012-04-17). "Können Bilder die Datenüberladung stoppen?". BBC News. Abgerufen 2020-07-30.
  26. ^ G. Scott Owen (1999). Geschichte der Visualisierung Archiviert 2012-10-08 bei der Wayback -Maschine. Zugriff am 19. Januar 2010.
  27. ^ a b c Friendly, Michael (2006). "Eine kurze Geschichte der Datenvisualisierung". Handbuch zur Datenvisualisierung. Springer-Verlag. S. 15–56. doi:10.1007/978-3-540-33037-0_2. ISBN 9783540330370.
  28. ^ Whitehouse, D. (9. August 2000). "Ice Age Star Map entdeckt". BBC News. Archiviert Aus dem Original am 6. Januar 2018. Abgerufen 20. Januar 2018.
  29. ^ Dragicevic, Pierre; Jansen, Yvonne (2012). "Liste der physikalischen Visualisierungen und verwandten Artefakte". Archiviert vom Original am 2018-01-13. Abgerufen 2018-01-12.
  30. ^ Jansen, Yvonne; Dragicevic, Pierre; Isenberg, Petra; Alexander, Jason; Karnik, Abhijit; Kildal, Johan; Subramanisch, Sriram; Hornbæk, Kasper (2015). "Chancen und Herausforderungen für die Physikalisierung von Daten". Verfahren der 33. jährlichen ACM -Konferenz über menschliche Faktoren in Computersystemen: 3227–3236. Archiviert vom Original am 2018-01-13. Abgerufen 2018-01-12.
  31. ^ a b Friendly, Michael (2001). "Meilensteine ​​in der Geschichte der thematischen Kartographie, der statistischen Grafik und der Datenvisualisierung". Archiviert von das Original Am 2014-04-14.
  32. ^ Funkhouser, Howard Gray (Januar 1936). "Eine Notiz in einem zehnten Jahrhundert -Diagramm". Osiris. 1: 260–262. doi:10.1086/368425. JStor 301609. S2CID 144492131.
  33. ^ "Datenvisualisierung: Definition, Beispiele, Tools, Rat [Handbuch 2020]". Marktforschungsberatung. 2020-12-09. Abgerufen 2020-12-09.
  34. ^ Friendly, Michael (2006). "Eine kurze Geschichte der Datenvisualisierung" (PDF). York University. Springer-Verlag. Archiviert (PDF) vom Original am 2016-05-08. Abgerufen 2015-11-22.
  35. ^ "NY bekommt ein neues Bootcamp für Datenwissenschaftler: Es ist kostenlos, aber schwieriger, sich auf als Harvard einzugeben.". Venture Beat. Archiviert vom Original am 2016-02-15. Abgerufen 2016-02-21.
  36. ^ Interaktive Datenvisualisierung
  37. ^ a b Bulmer, Michael (2013). Eine tragbare Einführung in die Datenanalyse. Die Universität von Queensland: Veröffentlichung On Demand Center. S. 4–5. ISBN 978-1-921723-10-0.
  38. ^ "Steven wählte das richtige Diagramm für Ihre Nachricht-September 2004 aus" (PDF). Archiviert (PDF) vom Original am 2014-10-05. Abgerufen 2014-09-08.
  39. ^ Lengler, Ralph; Eppler, Martin. J. "Periodische Tabelle der Visualisierungsmethoden". www.visual-literacy.org. Archiviert Aus dem Original am 16. März 2013. Abgerufen 15. März 2013.
  40. ^ Kahn, Brian (17. Juni 2019). "Diese auffällige Visualisierung des Klimawandels ist jetzt für jeden Ort auf der Erde anpassbar". Gizmodo. Archiviert Aus dem Original am 26. Juni 2019. Entwickelt im Mai 2018 von Ed Hawkins, Universität von Reading.
  41. ^ Mooney, Chris (11. Mai 2016). "Dieser Wissenschaftler hat sich gerade verändert, wie wir über den Klimawandel mit einem GIF denken.". Die Washington Post. Archiviert Aus dem Original am 6. Februar 2019. Ed Hawkins nahm diese monatlichen Temperaturdaten und zeichnete sie in Form einer Spirale auf, so dass es für jedes Jahr zwölf Punkte für jeden Monat um die Mitte eines Kreises gibt - mit wärmeren Temperaturen weiter nach außen und kälteren Temperaturen näher nach innen.
  42. ^ Swayne, Deborah (1999). "Einführung in die Sonderausgabe zur interaktiven grafischen Datenanalyse: Was ist Interaktion?". Computerstatistik. 14 (1): 1–6. doi:10.1007/PL00022700. S2CID 86788346.
  43. ^ American Statistics Association, statistische Grafikabschnitt. "Videokreditbibliothek".
  44. ^ Michael freundlich (2008). "Meilensteine ​​in der Geschichte der thematischen Kartographie, der statistischen Grafik und der Datenvisualisierung" Archiviert 2008-09-11 bei der Wayback -Maschine.
  45. ^ "Datenvisualisierung: moderne Ansätze" Archiviert 2008-07-22 bei der Wayback -Maschine. in: Grafik, 2. August 2007
  46. ^ Frits H. Post, Gregory M. Nielson und Georges-Pierre Bonneau (2002). Datenvisualisierung: Der Stand der Technik Archiviert 2009-10-07 bei der Wayback -Maschine.
  47. ^ a b c d e f Berinato, Scott (Juni 2016). "Visualisierungen, die wirklich funktionieren". Harvard Business Review: 92–100.
  48. ^ Faisal, Sarah; Blandford, Ann; Potts, Henry WW (2013). "Sinn für persönliche Gesundheitsinformationen: Herausforderungen für die Informationsvisualisierung" (PDF). Health Informatics Journal. 19 (3): 198–217. doi:10.1177/1460458212465213. PMID 23981395. S2CID 3825148.
  49. ^ Kosara, Robert (11. November 2013). "Ein Leitfaden für die Qualität verschiedener Visualisierungsorte". EGEREYES. Abgerufen 7. April 2017.

Weitere Lektüre

  • Cleveland, William S. (1993). Daten visualisieren. Hobart Press. ISBN 0-9634884-0-6.
  • Evergreen, Stephanie (2016). Effektive Datenvisualisierung: Das richtige Diagramm für die richtigen Daten. Salbei. ISBN 978-1-5063-0305-5.
  • Healy, Kieran (2019). Datenvisualisierung: Eine praktische Einführung. Princeton: Princeton University Press. ISBN 978-0-691-18161-5.
  • Post, Frits H.; Nielson, Gregory M.; Bonneau, Georges-Pierre (2003). Datenvisualisierung: Der Stand der Technik. New York: Springer. ISBN 978-1-4613-5430-7.
  • Wilke, Claus O. (2018). Grundlagen der Datenvisualisierung. O'Reilly. ISBN 978-1-4920-3108-6.
  • Wilkinson, Leland (2012). Grammatik der Grafik. New York: Springer. ISBN 978-1-4419-2033-1.

Externe Links