Datenanalyse
Datenanalyse ist ein Prozess der Inspektion, Reinigung, Transformation, und Modellieren Daten mit dem Ziel, nützliche Informationen zu entdecken, Schlussfolgerungen zu informieren und Entscheidungen zu unterstützen.[1] Die Datenanalyse verfügt über mehrere Facetten und Ansätze, die verschiedene Techniken unter verschiedenen Namen umfassen und in verschiedenen Bereichen für Unternehmen, Wissenschaft und sozialwissenschaften verwendet werden.[2] In der heutigen Geschäftswelt spielt die Datenanalyse eine Rolle, um Entscheidungen wissenschaftlicher zu gestalten und Unternehmen zu helfen, effektiver zu arbeiten.[3]
Data Mining ist eine bestimmte Datenanalysetechnik, die sich auf statistische Modellierung und Wissensfindung für prädiktive als auf rein beschreibende Zwecke konzentriert, während Business Intelligence Deckt die Datenanalyse ab, die stark auf die Aggregation beruht und sich hauptsächlich auf Geschäftsinformationen konzentriert.[4] In statistischen Anwendungen kann die Datenanalyse unterteilt werden in beschreibende Statistik, Explorationsdatenanalyse (EDA) und Bestätigungsdatenanalyse (CDA).[5] EDA konzentriert sich darauf, neue Funktionen in den Daten zu entdecken, während die CDA auf die Bestätigung oder Fälschung von bestehendem Vorkommen konzentriert Hypothesen.[6][7] Prädiktive Analytics Konzentriert sich auf die Anwendung statistischer Modelle für die Vorhersage oder Klassifizierung vorhersagen Textanalyse wendet statistische, sprachliche und strukturelle Techniken an, um Informationen aus Textquellen zu extrahieren und zu klassifizieren, eine Art von Art von unstrukturierte Daten. Alle oben genannten sind Sorten der Datenanalyse.[8]
Datenintegration ist ein Vorläufer für die Datenanalyse, und die Datenanalyse ist eng miteinander verbunden mit Datenvisualisierung und Datenverbreitung.[9]
Der Prozess der Datenanalyse
Analysebezieht sich auf die Aufteilung eines Ganzen in seine getrennten Komponenten für die individuelle Prüfung.[10] Datenanalyse, ist ein Prozess zum Erhalten Rohdatenund anschließend in Informationen umwandeln, die für die Entscheidungsfindung durch Benutzer nützlich sind.[1] Daten, wird gesammelt und analysiert, um Fragen zu beantworten, Hypothesen zu testen oder Theorien zu widerlegen.[11]
Statistiker John Tukey, definierte Datenanalyse im Jahr 1961, als:
"Verfahren zur Analyse von Daten, Techniken zur Interpretation der Ergebnisse solcher Verfahren, Planungsmöglichkeit . "[12]
Es gibt mehrere Phasen, die unterschieden werden können (unten beschrieben). Die Phasen sind iterativIn diesem Feedback aus späteren Phasen können in früheren Phasen zusätzliche Arbeiten führen.[13] Das Knackiges Framework, benutzt in Data Mining, hat ähnliche Schritte.
Datenanforderungen
Die Daten sind als Eingaben für die Analyse erforderlich, die auf der Grundlage der Anforderungen der Analyse (oder Kunden, die das fertige Produkt der Analyse verwenden) angegeben sind.[14][15] Die allgemeine Art der Entität, auf der die Daten gesammelt werden Experimentelle Einheit (z. B. eine Person oder Bevölkerung von Menschen). Spezifische Variablen bezüglich einer Population (z. B. Alter und Einkommen) können angegeben und erhalten werden. Daten können numerisch oder kategorisch sein (d. H. Eine Textbezeichnung für Zahlen).[13]
Datensammlung
Daten werden aus einer Vielzahl von Quellen gesammelt.[16][17] Die Anforderungen können von Analysten mitgeteilt werden Depotbanken der Daten; wie zum Beispiel, Personal des Informationstechnologie Innerhalb einer Organisation.[18] Die Daten können auch von Sensoren in der Umgebung gesammelt werden, einschließlich Verkehrskameras, Satelliten, Aufzeichnungsgeräten usw. Sie können auch durch Interviews, Downloads aus Online -Quellen oder Lesen von Dokumentationen erhalten werden.[13]
Datenverarbeitung
Daten, die anfänglich erhalten wurden, müssen zur Analyse verarbeitet oder organisiert werden.[19][20] Beispielsweise können diese Daten in einem Tabellenformat in Zeilen und Spalten einfügen ((bekannt als Strukturierte Daten) zur weiteren Analyse, häufig durch die Verwendung von Tabellenkalkulationen oder statistischer Software.[13]
Datenreinigung
Sobald sie verarbeitet und organisiert sind, können die Daten unvollständig sein, Duplikate enthalten oder Fehler enthalten.[21][22] Das Bedürfnis nach Datenreinigung wird aus Problemen auftreten, wie das Datum eingegeben und gespeichert wird.[21] Die Datenreinigung ist der Prozess der Verhinderung und Korrektur dieser Fehler. Zu den häufigen Aufgaben gehören die Aufzeichnungsanpassung, die Identifizierung der Ungenauigkeit von Daten, die Gesamtqualität vorhandener Daten, die Deduplizierung und die Segmentierung von Spalten.[23] Solche Datenprobleme können auch durch eine Vielzahl von analytischen Techniken identifiziert werden. Zum Beispiel; Mit Finanzinformationen können die Summen für bestimmte Variablen mit separat veröffentlichten Zahlen verglichen werden, von denen angenommen wird, dass sie zuverlässig sind.[24][25] Ungewöhnliche Mengen über oder unter vorbestimmten Schwellenwerten können ebenfalls überprüft werden. Es gibt verschiedene Arten von Datenreinigung, die von der Art der Daten im Satz abhängen. Dies können Telefonnummern, E -Mail -Adressen, Arbeitgeber oder andere Werte sein.[26][27] Quantitative Datenmethoden zur Ausreißererkennung können verwendet werden, um Daten zu entfernen, die eine höhere Wahrscheinlichkeit haben, falsch eingegeben zu werden.[28] Textüberprüfungen für Textdaten können verwendet werden, um die Menge an mis-typen-Wörtern zu verringern. Es ist jedoch schwieriger zu erkennen, ob die Wörter selbst korrekt sind.[29]
Explorationsdatenanalyse
Sobald die Datensätze gereinigt sind, können sie analysiert werden. Analysten können eine Vielzahl von Techniken anwenden, die als als als bezeichnet bezeichnet werden Explorationsdatenanalyse, um die in den erhaltenen Daten enthaltenen Nachrichten zu verstehen.[30] Der Prozess der Datenexploration kann zu zusätzlichen Datenreinigung oder zusätzlichen Datenanforderungen führen. Somit die Initialisierung der iterative Phasen erwähnt im führenden Absatz dieses Abschnitts.[31] Beschreibende Statistikwie der Durchschnitt oder der Median können generiert werden, um die Daten zu verstehen.[32][33] Datenvisualisierung Ist auch eine Technik verwendet, bei der der Analyst die Daten in einem grafischen Format untersuchen kann, um zusätzliche Erkenntnisse in Bezug auf die Nachrichten innerhalb der Daten zu erhalten.[13]
Modellierung und Algorithmen
Mathematische Formeln oder Modelle (bekannt als Algorithmen), kann auf die Daten angewendet werden, um Beziehungen zwischen den Variablen zu identifizieren; Zum Beispiel verwenden Korrelation oder Ursache.[34][35] Im Allgemeinen können Modelle entwickelt werden, um eine bestimmte Variable basierend auf anderen im Datensatz enthaltenen Variablen zu bewerten, die mit einigen enthalten sind Restfehler Abhängig von der Genauigkeit des implementierten Modells (z.B., Data = Modell + Fehler).[36][11]
Inferenzstatistik, einschließlich der Verwendung von Techniken, die die Beziehungen zwischen bestimmten Variablen messen.[37] Zum Beispiel, Regressionsanalyse kann verwendet werden, um zu modellieren, ob eine Änderung der Werbung (unabhängige Variable x), liefert eine Erklärung für die Variation des Verkaufs (Abhängige Variable y).[38] In mathematischer Hinsicht,, Y (Verkäufe) ist eine Funktion von X (Werbung).[39] Es kann beschrieben werden als (Y = Axt + b + Fehler), wo das Modell so konzipiert ist, dass ((a) und (b) Minimieren Sie den Fehler, wenn das Modell vorhersagt Y Für einen bestimmten Wertebereich von X.[40] Analysten können auch versuchen, Modelle zu erstellen, die die Daten beschreiben, um die Analyse zu vereinfachen und Ergebnisse zu kommunizieren.[11]
Datenprodukt
A Datenprodukt ist eine Computeranwendung, die nimmt Dateneingaben und erzeugt Ausgängesie wieder in die Umgebung füttern.[41] Es kann auf einem Modell oder Algorithmus basieren. Zum Beispiel eine Anwendung, die Daten über den Kaufverlauf des Kunden analysiert und die Ergebnisse verwendet, um andere Einkäufe zu empfehlen, die der Kunde möglicherweise genießen.[42][13]
Kommunikation
Sobald die Daten analysiert sind, kann sie in vielen Formaten an die Benutzer der Analyse gemeldet werden, um deren Anforderungen zu unterstützen.[44] Die Benutzer haben möglicherweise Feedback, was zu einer zusätzlichen Analyse führt. Daher ist ein Großteil des analytischen Zyklus iterativ.[13]
Bei der Feststellung, wie die Ergebnisse kommuniziert werden, kann der Analytiker eine Vielzahl von Datenvisualisierungstechniken implementieren, um die Botschaft klarer und effizienter an das Publikum zu vermitteln.[45] Datenvisualisierung verwendet Informationen Anzeigen (Grafiken wie Tabellen und Diagramme), um die in den Daten enthaltenen Schlüsselnachrichten zu kommunizieren.[46] Tische sind ein wertvolles Tool, indem ein Benutzer die Fähigkeit ermöglicht, abfragen und sich auf bestimmte Zahlen konzentrieren; Während Diagramme (z. B. Balkendiagramme oder Zeilendiagramme) helfen können, die in den Daten enthaltenen quantitativen Nachrichten zu erklären.[47]
Quantitative Nachrichten
STEPHEN Nur wenige haben acht Arten quantitativer Nachrichten beschrieben, die Benutzer möglicherweise versuchen, eine Reihe von Daten zu verstehen oder zu kommunizieren, und die zugehörigen Diagramme, die zur Kommunikation der Nachricht verwendet werden.[48] Kunden, die Anforderungen und Analysten angeben, die die Datenanalyse ausführen, können diese Nachrichten im Verlauf des Prozesses berücksichtigen.[49]
- Zeitreihen: Eine einzige Variable wird über einen Zeitraum von der Arbeitslosenquote über einen Zeitraum von 10 Jahren erfasst. EIN Liniendiagramm kann verwendet werden, um den Trend zu demonstrieren.[50]
- Ranking: Kategoriale Unterteilungen werden in aufsteigender oder absteigender Reihenfolge eingestuft, z. B. eine Ranking der Verkaufsleistung (die messen) von Verkäufern (die Kategoriemit jedem Verkäufer a Kategorische Unterteilung) während eines einzigen Zeitraums.[51] EIN Balkendiagramm kann verwendet werden, um den Vergleich über die Verkäufer zu zeigen.[52]
- Teil-zu-Ganze: Kategoriale Unterteilungen werden als Verhältnis zum Ganzen gemessen (d. H. Ein Prozentsatz von 100%). EIN Kuchendiagramm oder Bar -Chart kann den Vergleich von Verhältnissen zeigen, wie z. B. den Marktanteil, der von Wettbewerbern in einem Markt vertreten wird.[53]
- Abweichung: Kategoriale Unterteilungen werden mit einer Referenz verglichen, z. B. einen Vergleich der tatsächlichen und den Haushaltskosten für mehrere Abteilungen eines Unternehmens für einen bestimmten Zeitraum. Ein Balkendiagramm kann den Vergleich der tatsächlichen Referenzmenge mit dem tatsächlichen Vergleich anzeigen.[54]
- Frequenzverteilung: Zeigt die Anzahl der Beobachtungen einer bestimmten Variablen für ein bestimmtes Intervall an, wie z. HistogrammFür diese Analyse kann eine Art von Balkendiagramm verwendet werden.[55]
- Korrelation: Vergleich zwischen Beobachtungen, die durch zwei Variablen (x, y) dargestellt werden, um festzustellen, ob sie dazu neigen, sich in dieselbe oder entgegengesetzte Richtungen zu bewegen. Zum Beispiel die Arbeitslosigkeit (x) und die Inflation (Y) für eine Stichprobe von Monaten. EIN Streudiagramm wird normalerweise für diese Nachricht verwendet.[56]
- Nenner Vergleich: Vergleichen kategoriale Unterteilungen in keiner bestimmten Reihenfolge, z. B. das Verkaufsvolumen mit dem Produktcode. Für diesen Vergleich kann ein Balkendiagramm verwendet werden.[57]
- Geografisch oder Geospatial: Vergleich einer Variablen über eine Karte oder Layout, wie z. B. die Arbeitslosenquote durch Staat oder die Anzahl der Personen auf den verschiedenen Böden eines Gebäudes. EIN Kartogramm ist eine typische Grafik verwendet.[58][59]
Techniken zur Analyse quantitativer Daten
Der Autor Jonathan Koomey hat eine Reihe von Best Practices zum Verständnis quantitativer Daten empfohlen.[60] Diese beinhalten:
- Überprüfen Sie die Rohdaten für Anomalien vor der Durchführung einer Analyse.
- Wichtige Berechnungen erneut ausführen, z. B. über die Überprüfung von Datenspalten, die formelgesteuert sind;
- Bestätigen Sie die Hauptsummen sind die Summe der Subtotalen;
- Überprüfen Sie die Beziehungen zwischen Zahlen, die auf vorhersehbare Weise zusammenhängen, wie z. B. Verhältnisse im Laufe der Zeit;
- Normalisieren Sie Zahlen, um Vergleiche zu erleichtern, z. B. die Analyse von Mengen pro Person oder im Verhältnis zum BIP oder als Indexwert im Verhältnis zu einem Basisjahr;
- Probleme in Komponententeile einteilen, indem Faktoren analysiert werden, die zu den Ergebnissen führten, wie z. DuPont -Analyse Eigenkapitalrendite.[25]
Für die untersuchten Variablen erhalten Analysten typischerweise beschreibende Statistik für sie, wie der Mittelwert (Durchschnitt), Median, und Standardabweichung.[61] Sie können auch die analysieren Verteilung der Schlüsselvariablen, um zu sehen, wie sich die einzelnen Werte um den Mittelwert befinden.[62]
Die Berater bei McKinsey und Gesellschaft benannte eine Technik zum Aufbrechen eines quantitativen Problems in seine Komponententeile, die als die genannt werden Mece -Prinzip.[63] Jede Schicht kann in ihre Komponenten unterteilt werden. Jeder der Unterkomponenten muss sein gegenseitig exklusiv voneinander und gemeinsam Fügen Sie der Ebene über ihnen hinzu.[64] Die Beziehung wird als "gegenseitig ausschließend und gemeinsam erschöpfend" oder Mece bezeichnet. Zum Beispiel kann der Gewinn per Definition in den Gesamtumsatz und die Gesamtkosten unterteilt werden.[65] Der Gesamtumsatz kann wiederum durch seine Komponenten analysiert werden, wie z.[66]
Analysten können robuste statistische Messungen verwenden, um bestimmte analytische Probleme zu lösen.[67] Hypothesentest wird verwendet, wenn eine bestimmte Hypothese über den wahren Zustand des Analysten erstellt wird, und Daten werden gesammelt, um festzustellen, ob dieser Zustand wahr oder falsch ist.[68][69] Zum Beispiel könnte die Hypothese sein, dass "Arbeitslosigkeit keinen Einfluss auf die Inflation hat", was sich auf ein Wirtschaftskonzept bezieht Phillips Kurve.[70] Hypothesentest beinhaltet die Berücksichtigung der Wahrscheinlichkeit von Fehler vom Typ I und Typ II, die sich darauf beziehen, ob die Daten die Akzeptanz oder Ablehnung der Hypothese unterstützen.[71][72]
Regressionsanalyse Kann verwendet werden, wenn der Analyst versucht, zu bestimmen, inwieweit die unabhängige Variable X die abhängige Variable y beeinflusst (z. B. "Inwieweit sich Änderungen in der Arbeitslosenquote (x) auf die Inflationsrate (y) auswirken?").[73] Dies ist ein Versuch, eine Gleichungslinie oder Kurve an die Daten zu modellieren oder zu passen, so dass y eine Funktion von X ist.[74][75]
Notwendige Bedingungsanalyse (NCA) kann verwendet werden, wenn der Analyst versucht, zu bestimmen, inwieweit die unabhängige Variable x variable y (z. B. "inwieweit eine bestimmte Arbeitslosenquote (x) für eine bestimmte Inflationsrate (y) erforderlich ist?") .[73] Während (mehrere) Regressionsanalyse additive Logik verwendet, wobei jedes X-Variable das Ergebnis erzeugen kann und die X's einander kompensieren können (sie sind ausreichend, aber nicht notwendig),[76] Die notwendige Bedingungsanalyse (NCA) verwendet die Notwendigkeitslogik, wobei ein oder mehrere X-Variablen das Ergebnis existieren lassen, es jedoch nicht produzieren (sie sind notwendig, aber nicht ausreichend). Jede einzelne notwendige Bedingung muss vorhanden sein und eine Kompensation ist nicht möglich.[77]
Analytische Aktivitäten von Datennutzern
Benutzer können in einem Datensatz bestimmte Datenpunkte haben, im Gegensatz zu den oben beschriebenen allgemeinen Nachrichten. Solche Benutzeranalyseaktivitäten auf niedriger Ebene werden in der folgenden Tabelle dargestellt. Die Taxonomie kann auch durch drei Aktivitäten der Aktivitäten organisiert werden: Werte abrufen, Datenpunkte finden und Datenpunkte anordnen.[78][79][80][81]
# | Aufgabe | Allgemein Beschreibung | Pro forma Abstrakt | Beispiele |
---|---|---|---|---|
1 | Wert abrufen | Finden Sie angesichts einer Reihe spezifischer Fälle Attribute dieser Fälle. | Was sind die Werte der Attribute {x, y, z, ...} in den Datenfällen {a, b, c, ...}? | - Was ist die Kilometerleistung pro Gallone des Ford Mondeo? - Wie lange dauert der Film mit dem Wind? |
2 | Filter | Finden Sie bei einigen konkreten Bedingungen für Attributwerte Datenfälle, die diese Bedingungen erfüllen. | Welche Datenfälle erfüllen die Bedingungen {a, b, c ...}? | - Welche Kellogg -Müsli haben hohe Faser? - Welche Komödien haben Preise gewonnen? - Welche Fonds haben den SP-500 unterdurchschnittlich geschafft? |
3 | Berechnen Sie abgeleiteter Wert | Berechnen Sie bei einer Reihe von Datenfällen eine aggregierte numerische Darstellung dieser Datenfälle. | Was ist der Wert der Aggregationsfunktion F über einen bestimmten Satz s von Datenfällen? | - Was ist der durchschnittliche Kalorieninhalt von Post -Getreide? - Was ist das Bruttoeinkommen aller Geschäfte zusammen? - Wie viele Hersteller von Autos gibt es? |
4 | Extreme finden | Finden Sie Datenfälle mit einem extremen Wert eines Attributs über seinen Bereich innerhalb des Datensatzes. | Was sind die oberen/unteren N -Datenfälle in Bezug auf Attribut A? | - Was ist das Auto mit dem höchsten MPG? - Welcher Regisseur/Film hat die meisten Auszeichnungen gewonnen? - Welcher Marvel Studios -Film hat das neueste Veröffentlichungsdatum? |
5 | Sortieren | Angesichts einer Reihe von Datenfällen bewerten Sie sie nach einigen ordinalen Metrik. | Wie lautet die sortierte Reihenfolge einer Reihe von Datenfällen gemäß ihrem Wert von Attribut A? | - Bestellen Sie die Autos nach Gewicht. - Rang das Müsli nach Kalorien. |
6 | Bereich bestimmen | Finden Sie bei einer Reihe von Datenfällen und einem Interessenattribut die Wertespanne innerhalb des Satzes. | Wie hoch ist der Wertebereich von Attribut A in einem Satz s von Datenfällen? | - Was ist der Bereich der Filmlängen? - Was ist die Reichweite der Autorten? - Welche Schauspielerinnen befinden sich im Datensatz? |
7 | Verteilung charakterisieren | Charakterisieren Sie die Verteilung der Werte dieses Attributs über den Satz. | Was ist die Verteilung der Werte von Attribut A in einem Satz von Datenfällen? | - Was ist die Verteilung von Kohlenhydraten in Getreide? - Was ist die Altersverteilung der Käufer? |
8 | Finden Sie Anomalien | Identifizieren Sie alle Anomalien innerhalb eines bestimmten Satzes von Datenfällen in Bezug auf eine bestimmte Beziehung oder Erwartung, z. Statistische Ausreißer. | Welche Datenfälle in einem Satz von Datenfällen haben unerwartete/außergewöhnliche Werte? | - Gibt es Ausnahmen von der Beziehung zwischen Pferdestärken und Beschleunigung? - Gibt es Ausreißer im Protein? |
9 | Cluster | Finden Sie bei einem Satz von Datenfällen Cluster ähnlicher Attributwerte. | Welche Datenfälle in einem Satz s von Datenfällen sind im Wert für die Attribute {x, y, z, ...} ähnlich? | - Gibt es Gruppen von Getreide mit ähnlichem Fett/Kalorien/Zucker? - Gibt es eine Gruppe typischer Filmlängen? |
10 | Zueinander in Beziehung stehen | Bestimmen Sie bei einer Reihe von Datenfällen und zwei Attributen nützliche Beziehungen zwischen den Werten dieser Attribute. | Was ist die Korrelation zwischen den Attributen x und y über einen bestimmten Satz von Datenfällen? | - Gibt es eine Korrelation zwischen Kohlenhydraten und Fett? - Gibt es eine Korrelation zwischen Herkunftsland und MPG? - Haben verschiedene Geschlechter eine bevorzugte Zahlungsmethode? - Gibt es einen Trend, die Filmlänge im Laufe der Jahre zu erhöhen? |
11 | Kontextualisierung[81] | Suchen Sie bei einer Reihe von Datenfällen die kontextbezogene Relevanz der Daten an die Benutzer. | Welche Datenfälle in einem Satz von Datenfällen sind für den Kontext der aktuellen Benutzer relevant? | - Gibt es Gruppen von Restaurants mit Lebensmitteln, die auf meiner aktuellen Kalorienaufnahme basieren? |
Hindernisse für eine wirksame Analyse
Barrieren für eine effektive Analyse können bei den Analysten bestehen, die die Datenanalyse oder unter dem Publikum ausführen. Die Unterscheidung von Tatsachen von Meinungen, kognitiven Verzerrungen und Unzählern sind Herausforderungen für die solide Datenanalyse.[82]
Verwirrende Tatsache und Meinung
Sie haben Anspruch auf Ihre eigene Meinung, aber Sie haben keinen Anspruch auf Ihre eigenen Fakten.
Eine effektive Analyse erfordert das Erhalten von Relevanten Fakten Um Fragen zu beantworten, eine Schlussfolgerung oder formal zu unterstützen Meinung, oder Test Hypothesen.[83][84] Fakten sind per Definition unwiderlegbar, was bedeutet, dass jede Person, die an der Analyse beteiligt ist, in der Lage sein sollte, sie zu vereinbaren.[85] Zum Beispiel im August 2010 die Budgetbüro des Kongresses (CBO) schätzte, dass die Erweiterung des Bush -Steuersenkungen von 2001 und 2003 für den Zeitraum 2011–2020 würde die Staatsverschuldung etwa 3,3 Billionen US -Dollar erhöhen.[86] Jeder sollte in der Lage sein zuzustimmen, dass CBO dies tatsächlich berichtete. Sie können alle den Bericht untersuchen. Das macht es zu einer Tatsache. Ob Personen mit dem CBO zustimmen oder nicht zustimmen, ist ihre eigene Meinung.[87]
Als ein weiteres Beispiel muss der Prüfer einer Aktiengesellschaft zu einer formellen Meinung darüber eingehen, ob Abschlüsse von börsennotierten Unternehmen "in jeder wesentlichen Hinsicht ziemlich angegeben" sind.[88] Dies erfordert eine umfassende Analyse von sachlichen Daten und Beweisen, um ihre Meinung zu stützen. Wenn Sie den Sprung von Fakten zu Meinungen machen, besteht immer die Möglichkeit, dass die Meinung ist fehlerhaft.[89]
Kognitive Voreingenommenheit
Es gibt eine Vielzahl von einer Vielzahl von kognitive Voreingenommenheit Dies kann die Analyse nachteilig beeinflussen. Zum Beispiel, Bestätigungsverzerrung ist die Tendenz, Informationen auf eine Weise zu suchen oder zu interpretieren, die die eigenen Vorurteile bestätigt.[90] Darüber hinaus können Einzelpersonen Informationen diskreditieren, die ihre Ansichten nicht unterstützen.[91]
Analysten können speziell ausgebildet werden, um sich dieser Vorurteile zu bewusst und wie sie überwunden werden können.[92] In seinem Buch Psychologie der Intelligenzanalyse, pensionierter CIA -Analyst Richards Heuer schrieb, dass Analysten ihre Annahmen und Inferenzketten eindeutig festlegen und den Grad und die Quelle der mit den Schlussfolgerungen verbundenen Unsicherheit festlegen sollten.[93] Er betonte die Verfahren, um die Oberfläche und Debatte über alternative Gesichtspunkte zu unterstützen.[94]
Unzähligkeit
Wirksame Analysten sind im Allgemeinen mit einer Vielzahl von numerischen Techniken geschickt. Das Publikum hat jedoch möglicherweise keine solche Alphabetisierung mit Zahlen oder Rechnen; Sie sollen unzählig sein.[95] Personen, die die Daten kommunizieren, können auch versuchen, irreführend oder falsch zu formulieren, wodurch schlechte numerische Techniken verwendet werden.[96]
Ob beispielsweise eine Zahl steigt oder fällt, ist möglicherweise nicht der Schlüsselfaktor. Wichtiger kann die Anzahl der relativ zu einer anderen Zahl sein, wie z.[97] Diese numerische Technik wird als Normalisierung bezeichnet[25] oder Common-Gize. Es gibt viele solcher Techniken, die von Analysten angewendet werden, unabhängig davon, ob die Inflation angepasst (d. H. Vergleich realer und nominaler Daten) oder die Bevölkerungssteigerungen, demografische Daten usw. zu berücksichtigen.[98] Analysten wenden eine Vielzahl von Techniken an, um die verschiedenen quantitativen Nachrichten zu beheben, die im obigen Abschnitt beschrieben sind.[99]
Analysten können auch Daten unter verschiedenen Annahmen oder Szenarien analysieren. Zum Beispiel, wenn Analysten durchführen BilanzanalyseSie werden häufig den Jahresabschluss unter verschiedenen Annahmen umgeben, um zu einer Schätzung des zukünftigen Cashflows zu gelangen, die sie dann auf den Barwert basierend auf einem Zinssatz ergeben, um die Bewertung des Unternehmens oder seiner Aktien zu bestimmen.[100][101] In ähnlicher Weise analysiert der CBO die Auswirkungen verschiedener politischer Optionen auf die Einnahmen, Ausgaben und Defizite der Regierung und schafft alternative zukünftige Szenarien für wichtige Maßnahmen.[102]
Andere Themen
Intelligente Gebäude
Ein Datenanalyseansatz kann verwendet werden, um den Energieverbrauch in Gebäuden vorherzusagen.[103] Die unterschiedlichen Schritte des Datenanalyseprozesses werden durchgeführt, um intelligente Gebäude zu realisieren, bei denen die Gebäudemanagement- und Steuerungsvorgänge wie Heizung, Belüftung, Klimaanlage, Beleuchtung und Sicherheit automatisch realisiert werden, indem die Anforderungen der Gebäudeberutzer nachgedacht und die Ressourcen optimiert werden Wie Energie und Zeit.[104]
Analytik und Business Intelligence
Analytics ist die "umfassende Verwendung von Daten, statistische und quantitative Analysen, erklärende und prädiktive Modelle und faktenbasiertes Management, um Entscheidungen und Maßnahmen zu fördern". Es ist eine Teilmenge von Business IntelligenceDies ist eine Reihe von Technologien und Prozessen, die Daten verwenden, um die Geschäftsleistung zu verstehen und zu analysieren, um die Entscheidungsfindung voranzutreiben.[105]
Ausbildung
Im AusbildungDie meisten Pädagogen haben Zugang zu einem Datensystem Zum Zweck der Analyse von Studentendaten.[106] Diese Datensysteme präsentieren Daten an Pädagogen in einem rezeptfreie Daten Format (Einbetten von Etiketten, ergänzende Dokumentation und ein Hilfesystem sowie wichtige Paket/Anzeige- und Inhaltsentscheidungen), um die Genauigkeit der Datenanalysen der Pädagogen zu verbessern.[107]
Praktizierende Notizen
Dieser Abschnitt enthält eher technische Erklärungen, die den Praktikern helfen können, aber über den typischen Umfang eines Wikipedia -Artikels hinausgehen.[108]
Erstdatenanalyse
Die wichtigste Unterscheidung zwischen der Phase der anfänglichen Datenanalyse und der Hauptanalysephase besteht darin, dass während der anfänglichen Datenanalyse ein Analyse während der Beantwortung der ursprünglichen Forschungsfrage auf eine Analyse abzeigt.[109] Die anfängliche Datenanalysephase wird von den folgenden vier Fragen geleitet:[110]
Datenqualität
Die Qualität der Daten sollte so früh wie möglich überprüft werden. Die Datenqualität kann auf verschiedene Weise unter Verwendung verschiedener Arten von Analysen bewertet werden: Häufigkeitszahlen, deskriptive Statistiken (Mittelwert, Standardabweichung, Median), Normalität (Schiefe, Kurtosis, Frequenzhistogramme), Normal Imputation wird gebraucht.[111]
- Analyse von Extreme Beobachtungen: Außenbeobachtungen in den Daten werden analysiert, um festzustellen, ob sie die Verteilung zu stören scheinen.[112]
- Vergleich und Korrektur von Unterschieden in den Codierungsschemata: Variablen werden mit Codierungsschemata von Variablen extern zum Datensatz verglichen und möglicherweise korrigiert, wenn die Codierungsschemata nicht vergleichbar sind.[113]
- Test für Common-Method-Varianz.
Die Auswahl der Analysen zur Bewertung der Datenqualität während der anfänglichen Datenanalysephase hängt von den Analysen ab, die in der Hauptanalysephase durchgeführt werden.[114]
Qualität der Messungen
Die Qualität der Messinstrumente sollte nur während der anfänglichen Datenanalysephase überprüft werden, wenn dies nicht die Fokus- oder Forschungsfrage der Studie ist.[115][116] Man sollte überprüfen, ob die Struktur von Messinstrumenten der in der Literatur angegebenen Struktur entspricht.
Es gibt zwei Möglichkeiten, die Messqualität zu bewerten:
- Bestätigungsfaktoranalyse
- Analyse der Homogenität (interne Konsistenz), was einen Hinweis auf die gibt Verlässlichkeit eines Messinstruments.[117] Während dieser Analyse untersucht man die Abweichungen der Elemente und der Skalen, die Cronbachs α der Skalen und der Änderung des Cronbachs Alpha, wenn ein Gegenstand aus einer Skala gelöscht wird[118]
Anfangsumwandlungen
Nach der Beurteilung der Qualität der Daten und der Messungen könnte man entscheiden, fehlende Daten zu unterstellen oder anfängliche Transformationen einer oder mehrerer Variablen durchzuführen, obwohl dies auch während der Hauptanalysephase erfolgen kann.[119]
Mögliche Transformationen von Variablen sind:[120]
- Quadratwurzeltransformation (wenn sich die Verteilung mäßig von der Normalität unterscheidet)
- Log-Transformation (wenn sich die Verteilung erheblich von der Normalen unterscheidet)
- Inverse Transformation (wenn sich die Verteilung stark von normal unterscheidet)
- Kategoriale (ordinale / dichotom) machen (wenn sich die Verteilung stark von normal unterscheidet und keine Transformationen helfen)
Hat die Umsetzung der Studie die Absichten des Forschungsdesigns erfüllt?
Man sollte den Erfolg des Randomisierung Verfahren, beispielsweise durch Überprüfung, ob Hintergrund und inhaltliche Variablen innerhalb und zwischen Gruppen gleichermaßen verteilt sind.[121]
Wenn die Studie kein Randomisierungsverfahren benötigte oder verwendet hat, sollte man den Erfolg der nicht zufälligen Stichprobe überprüfen, beispielsweise durch Überprüfung, ob alle Untergruppen der Interessenbevölkerung in der Stichprobe vertreten sind.[122]
Andere mögliche Datenverzerrungen, die überprüft werden sollten, sind:
- aussteigen (Dies sollte während der anfänglichen Datenanalysephase identifiziert werden)
- Artikel Nichtantwort (Ob dies zufällig ist oder nicht, sollte während der anfänglichen Datenanalysephase bewertet werden)
- Behandlungsqualität (Verwendung Manipulationskontrollen).[123]
Eigenschaften der Datenprobe
In jedem Bericht oder Artikel muss die Struktur der Stichprobe genau beschrieben werden.[124][125] Es ist besonders wichtig, die Struktur der Probe (und insbesondere die Größe der Untergruppen) genau zu bestimmen, wenn während der Hauptanalysephase Untergruppenanalysen durchgeführt werden.[126]
Die Eigenschaften der Datenprobe können untersucht werden:
- Grundlegende Statistiken wichtiger Variablen
- Handlungsdiagramme
- Korrelationen und Assoziationen
- Cross-Tabulationen[127]
Endstufe der ersten Datenanalyse
Während der letzten Phase werden die Ergebnisse der anfänglichen Datenanalyse dokumentiert und notwendig, vorzuziehen und mögliche Korrekturmaßnahmen ergriffen.[128]
Außerdem kann und sollte der ursprüngliche Plan für die Hauptdatenanalysen ausführlicher angegeben oder neu geschrieben werden.[129][130]
Dazu können und sollten mehrere Entscheidungen über die Hauptdatenanalysen getroffen werden:
- Im Fall von nichtNormalen: sollte eins verwandeln Variablen; Variablen kategorisch (ordinal/dichotom) machen; die Analysemethode anpassen?
- Im Falle des fehlende Daten: Sollte man die fehlenden Daten vernachlässigen oder unterstellen; Welche Imputationstechnik sollte angewendet werden?
- Im Falle des Ausreißer: Sollte man robuste Analysetechniken verwenden?
- Falls Elemente nicht zur Skala passen: Sollte man das Messinstrument anpassen, indem sie Elemente weglassen, oder vielmehr die Vergleichbarkeit mit anderen (Verwendung des) Messinstruments (en) sicherstellen?
- Bei (auch) kleinen Untergruppen: Sollte man die Hypothese über Unterschiede zwischen Gruppen fallen oder kleine Stichprobentechniken verwenden, wie genaue Tests oder Bootstrapping?
- Falls die Randomisierung Das Verfahren scheint defekt zu sein: Kann und sollte man berechnen Neigungswerte und sie als Kovariaten in die Hauptanalysen aufnehmen?[131]
Analyse
Während der anfänglichen Datenanalysephase können mehrere Analysen verwendet werden:[132]
- Univariate Statistiken (Einzelvariable)
- Bivariate Assoziationen (Korrelationen)
- Grafische Techniken (Streudiagramme)
Es ist wichtig, die Messniveaus der Variablen für die Analysen zu berücksichtigen, da für jede Ebene spezielle statistische Techniken verfügbar sind:[133]
- Nominale und ordinale Variablen
- Frequenzzählungen (Zahlen und Prozentsätze)
- Assoziationen
- Umgehungssteuerung (Crosstabulations)
- Hierarchische loglineare Analyse (beschränkt auf maximal 8 Variablen)
- Loglineare Analyse (um relevante/wichtige Variablen und mögliche Störfaktoren zu identifizieren)
- Genaue Tests oder Bootstrapping (Falls Untergruppen sind klein)
- Berechnung neuer Variablen
- Kontinuierliche Variablen
- Verteilung
- Statistik (M, SD, Varianz, Schiefe, Kurtosis)
- Stamm- und Blattdisplays
- Boxplots
- Verteilung
Nichtlineare Analyse
Eine nichtlineare Analyse ist häufig erforderlich, wenn die Daten von a aufgezeichnet werden Nichtlineares System. Nichtlineare Systeme können komplexe dynamische Effekte einschließlich zeigen, einschließlich Bifurkationen, Chaos, Harmonische und Subharmonik Dies kann nicht mit einfachen linearen Methoden analysiert werden. Die nichtlineare Datenanalyse steht eng mit dem zusammen mit mit Nichtlineare Systemidentifikation.[134]
Hauptdatenanalyse
In der Hauptanalysephase werden Analysen zur Beantwortung der Forschungsfrage sowie jede andere relevante Analyse durchgeführt, die zum Schreiben des ersten Entwurfs des Forschungsberichts erforderlich ist.[135]
Erkundungs- und Bestätigungsansätze
In der Hauptanalysephase kann entweder ein explorativer oder bestätigender Ansatz gewählt werden. Normalerweise wird der Ansatz entschieden, bevor die Daten gesammelt werden.[136] In einer explorativen Analyse wird vor der Analyse der Daten keine klare Hypothese angegeben, und die Daten werden nach Modellen gesucht, die die Daten gut beschreiben.[137] In einer bestätigenden Analyse werden klare Hypothesen über die Daten getestet.[138]
Explorationsdatenanalyse sollte sorgfältig interpretiert werden. Beim Testen mehrerer Modelle auf einmal besteht ein hohes Chancen, mindestens eines von ihnen als signifikant zu finden, aber dies kann auf a zurückzuführen sein Typ 1 Fehler.[139] Es ist wichtig, das Signifikanzniveau immer beim Testen mehrerer Modelle mit beispielsweise a anzupassen Bonferroni -Korrektur.[140] Außerdem sollte man eine explorative Analyse mit einer Bestätigungsanalyse im selben Datensatz nicht verfolgen.[141] Eine explorative Analyse wird verwendet, um Ideen für eine Theorie zu finden, aber auch nicht diese Theorie zu testen.[141] Wenn ein Modell in einem Datensatz explorativ empfunden wird, kann es einfach bedeuten Typ 1 Fehler Dies führte in erster Linie zu dem Erkundungsmodell.[141] Die Bestätigungsanalyse wird daher nicht informativer sein als die ursprüngliche explorative Analyse.[142]
Stabilität der Ergebnisse
Es ist wichtig, einen Hinweis darauf zu erhalten, wie verallgemeinerbar die Ergebnisse sind.[143] Dies ist zwar oft schwer zu überprüfen, aber man kann die Stabilität der Ergebnisse betrachten. Sind die Ergebnisse zuverlässig und reproduzierbar? Es gibt zwei Hauptmethoden, um dies zu tun.[144]
- Kreuzvalidierung. Durch die Aufteilung der Daten in mehrere Teile können wir überprüfen, ob eine Analyse (wie ein angepasstes Modell) basierend auf einem Teil der Daten auf einen anderen Teil der Daten verallgemeinert wird.[145] Kreuzvalidierung ist im Allgemeinen unangemessen, wenn es in den Daten Korrelationen gibt, z. mit Paneldaten.[146] Daher müssen manchmal andere Validierungsmethoden verwendet werden. Weitere Informationen zu diesem Thema finden Sie unter Statistische Modellvalidierung.[147]
- Sensitivitätsanalyse. Ein Verfahren zur Untersuchung des Verhaltens eines Systems oder eines Modells, wenn globale Parameter (systematisch) variiert. Eine Möglichkeit, dies zu tun, ist über Bootstrapping.[148]
Kostenlose Software für die Datenanalyse
Zu den bemerkenswerten kostenlosen Software für die Datenanalyse gehören:
- Devinfo - Ein Datenbanksystem, das von der unterstützt wird Entwicklungsgruppe der Vereinten Nationen zur Überwachung und Analyse der menschlichen Entwicklung.[149]
- ELKI - Data Mining -Framework in Java mit Data Mining -orientierten Visualisierungsfunktionen.
- Knime - Der Konstanz Information Miner, ein benutzerfreundlicher und umfassender Datenanalyse -Framework.
- Orange - Ein visuelles Programmierwerkzeug mit Interaktive Datenvisualisierung und Methoden zur statistischen Datenanalyse, Data Mining, und maschinelles Lernen.
- Pandas - Python -Bibliothek zur Datenanalyse.
- PFOTE - FORTRAN/C -Datenanalyse -Framework entwickelt bei Cern.
- R - Eine Programmiersprache und Software -Umgebung für statistisches Computer und Grafiken.[150]
- WURZEL - C ++ Datenanalyse Framework entwickelt bei Cern.
- Scipy - Python -Bibliothek zur Datenanalyse.
- Julia - Eine Programmiersprache, die für numerische Analysen und Computerwissenschaft gut geeignet ist.
Internationale Datenanalysewettbewerbe
Verschiedene Unternehmen oder Organisationen veranstalten Datenanalyse -Wettbewerbe, um die Forscher zu ermutigen, ihre Daten zu verwenden oder eine bestimmte Frage mithilfe der Datenanalyse zu lösen.[151][152] Einige Beispiele für bekannte internationale Datenanalysewettbewerbe sind wie folgt:[153]
- Kaggle -Wettbewerb, der von abgehalten wird von Kaggle.[154]
- LTPP -Datenanalysewettbewerb von Fhwa und ASCE.[155][156]
Siehe auch
- Versicherungsmathematik
- Analyse
- Große Daten
- Business Intelligence
- Zenserung (Statistik)
- Computerphysik
- Datenerfassung
- Datenmischung
- Datenamt
- Data Mining
- Datenpräsentationsarchitektur
- Datenwissenschaft
- Digitale Signalverarbeitung
- Dimensionsreduzierung
- Frühe Fallbewertung
- Explorationsdatenanalyse
- Fourier -Analyse
- Maschinelles Lernen
- Multilineare PCA
- Multilineares Subspace -Lernen
- Multiway -Datenanalyse
- Suche nach Nachbarn
- Nichtlineare Systemidentifikation
- Prädiktive Analytics
- Hauptkomponentenanalyse
- Qualitative Forschung
- Wissenschaftliches rechnen
- Structured data analysis (statistics)
- Systemidentifikation
- Testmethode
- Textanalyse
- Unstrukturierte Daten
- Wavelet
- Liste der Big -Data -Unternehmen
Verweise
Zitate
- ^ a b "Unstrukturierte Daten in nützliche Informationen umwandeln", Big Data, Bergbau und Analyse, Auerbach Publications, S. 227–246, 2014-03-12, doi:10.1201/b16666-14, ISBN 978-0-429-09529-0, abgerufen 2021-05-29
- ^ "Die mehrfachen Facetten der Korrelationsfunktionen", Datenanalysetechniken für Physikalische Wissenschaftler, Cambridge University Press, S. 526–576, 2017, doi:10.1017/9781108241922.013, ISBN 978-1-108-41678-8, abgerufen 2021-05-29
- ^ Xia, B. S. & Gong, P. (2015). Überprüfung der Business Intelligence durch Datenanalyse. Benchmarking, 21(2), 300-311. doi:10.1108/BIJ-08-2012-0050
- ^ Datenanalyse untersuchen
- ^ "Datencodierungs- und Explorationsanalyse (EDA) -Regeln für Datencodierungs -Explorationsdatenanalyse (EDA) statistische Annahmen", SPSS für Zwischenstatistiken, Routledge, S. 42–67, 2004-08-16, doi:10.4324/9781410611420-6, ISBN 978-1-4106-1142-0, abgerufen 2021-05-29
- ^ Spie (2014-10-01). "Der neue europäische IKT -Anruf konzentriert sich auf Bilder, Laser, Datenübertragung". Spie Professional. doi:10.1117/2.4201410.10. ISSN 1994-4403.
- ^ Samandar, Petersson; Svantesson, Sofia (2017). Skapandet av förtroende inom ewom: en studie av profilbildens effekt ur ett könsperspektiv. Högskolan I Gävle, Förretagsekonomi. OCLC 1233454128.
- ^ Gute Nacht, James (2011-01-13). "Die Prognose für Vorhersageanalysen: heiß und heißer werden". Statistische Analyse und Data Mining: Das ASA Data Science Journal. 4 (1): 9–10. doi:10.1002/sam.10106. ISSN 1932-1864. S2CID 38571193.
- ^ Sherman, Rick (4. November 2014). Business Intelligence -Leitfaden: Von der Datenintegration bis zur Analytik. Amsterdam. ISBN 978-0-12-411528-6. OCLC 894555128.
- ^ Field, John (2009), "Das Hören in seine Komponenten einteilen", Hören im Sprachklassenzimmer, Cambridge: Cambridge University Press, S. 96–109, doi:10.1017/CBO9780511575945.008, ISBN 978-0-511-57594-5, abgerufen 2021-05-29
- ^ a b c Judd, Charles; McCleland, Gary (1989). Datenanalyse. Harcourt Brace Jovanovich. ISBN 0-15-516765-0.
- ^ John Tukey-die Zukunft der Datenanalyse-Juli 1961
- ^ a b c d e f g Schutt, Rachel; O'Neil, Cathy (2013). Datenwissenschaft machen. O'Reilly Media. ISBN 978-1-449-35865-5.
- ^ "Verwendung der Daten", Handbuch zur Analyse von Erdölprodukten, Hoboken, NJ: John Wiley & Sons, Inc, S. 296–303, 2015-02-06, doi:10.1002/9781118986370.ch18, ISBN 978-1-118-98637-0, abgerufen 2021-05-29
- ^ Ainsworth, Penne (20. Mai 2019). Einführung in die Buchhaltung: Ein integrierter Ansatz. ISBN 978-1-119-60014-5. OCLC 1097366032.
- ^ Margo, Robert A. (2000). Löhne und Arbeitsmärkte in den USA, 1820-1860. Universität von Chicago Press. ISBN 0-226-50507-3. OCLC 41285104.
- ^ Olusola, Johnson Adedeji; Shot, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. (7. Mai 2021). "Tabelle 1: Datentyp und Datenquellen für diese Forschung gesammelt". Peerj. 9: e11387. doi:10.7717/peerj.11387/Tabelle-1. Abgerufen 2021-05-29.
- ^ MacPherson, Derek (2019-10-16), "Perspektiven der Informationstechnologieanalysten", Datenstrategie an Hochschulen und Universitäten, Routledge, S. 168–183, doi:10.4324/9780429437564-12, ISBN 978-0-429-43756-4, S2CID 211738958, abgerufen 2021-05-29
- ^ Nelson, Stephen L. (2014). Excel -Datenanalyse für Dummies. Wiley. ISBN 978-1-118-89810-9. OCLC 877772392.
- ^ "Abbildung 3 - SOURCE -Daten 1. Roh- und verarbeitete Werte, die über qPCR erhalten wurden". dx.doi.org. 30. August 2017. doi:10.7554/elife.28468.029. Abgerufen 2021-05-29.
- ^ a b Bohannon, John (2016-02-24). "Viele Umfragen, etwa jeder fünfte, können betrügerische Daten enthalten". Wissenschaft. doi:10.1126/Science.AAF4104. ISSN 0036-8075.
- ^ Jeannie Scruggs, Garber; Gross, Monty; Slonim, Anthony D. (2010). Vermeidung häufiger Pflegefehler. Wolters Kluwer Health/Lippincott Williams & Wilkins. ISBN 978-1-60547-087-0. OCLC 338288678.
- ^ "Datenreinigung". Microsoft Research. Abgerufen 26. Oktober 2013.
- ^ Hancock, R.G.V.; Carter, Tristan (Februar 2010). "Wie zuverlässig sind unsere veröffentlichten archäometrischen Analysen? Auswirkungen von analytischen Techniken durch die Zeit auf die Elementaranalyse von Obsidianen". Zeitschrift für archäologische Wissenschaft. 37 (2): 243–250. doi:10.1016/j.jas.2009.10.004. ISSN 0305-4403.
- ^ a b c Wahrnehmungsbekannte Praktiken zum Verständnis des quantitativen Datenfeins 14, 2006
- ^ Peleg, Roni; Avdalimov, Angelika; Freud, Tamar (2011-03-23). "Bereitstellung von Handynummern und E -Mail -Adressen an Patienten: die Perspektive des Arztes". BMC -Forschungsnotizen. 4 (1): 76. doi:10.1186/1756-0500-4-76. ISSN 1756-0500. PMC 3076270. PMID 21426591.
- ^ Goodman, Lenn Evan (1998). Judentum, Menschenrechte und menschliche Werte. Oxford University Press. ISBN 0-585-24568-1. OCLC 45733915.
- ^ Hanzo, Lajos. "Schätzung des Blind-Gelenk-Maximumswahrscheinlichkeitskanals und Datenerkennung für mehrere Input-Systeme mit mehreren Eingängen". dx.doi.org. doi:10.1049/iet-tv.44.786. Abgerufen 2021-05-29.
- ^ Hellerstein, Joseph (27. Februar 2008). "Quantitative Datenreinigung für große Datenbanken" (PDF). EECS Informatik Abteilung: 3. Abgerufen 26. Oktober 2013.
- ^ Davis, Steve; Petttengill, James B.; Luo, Yan; Payne, Justin; Shpuntoff, Al; Rand, Hugh; Stamm, Errol (26. August 2015). "CFSAN-SNP-Pipeline: Eine automatisierte Methode zum Erstellen von SNP-Matrizen aus Sequenzdaten der nächsten Generation". Peerj Informatik. 1: e20. doi:10.7717/peerj-cs.20/Supp-1. Abgerufen 2021-05-31.
- ^ "FTC fordert zusätzliche Daten an". Pumpenindustrieanalyst. 1999 (48): 12. Dezember 1999. doi:10.1016/s1359-6128 (99) 90509-8. ISSN 1359-6128.
- ^ "Untersuchen Ihrer Daten mit Datenvisualisierung und deskriptiven Statistiken: Häufige deskriptive Statistiken für quantitative Daten". 2017. doi:10.4135/9781529732795.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ Murray, Daniel G. (2013). Tableau deine Daten! : schnelle und einfache visuelle Analyse mit Tableau -Software. J. Wiley & Sons. ISBN 978-1-118-61204-0. OCLC 873810654.
- ^ Ben-Ari, Mordechai (2012), "Logik erster Ordnung: Formeln, Modelle, Tableaux", Mathematische Logik für Informatik, London: Springer London, S. 131–154, doi:10.1007/978-1-4471-4129-7_7, ISBN 978-1-4471-4128-0, abgerufen 2021-05-31
- ^ Sosa, Ernest (2011). Ursache. Oxford Univ. Drücken Sie. ISBN 978-0-19-875094-9. OCLC 767569031.
- ^ Evans, Michelle V.; Dallas, Tad A.; Han, Barbara A.; Murdock, Courtney C.; Drake, John M. (28. Februar 2017). Brady, Oliver (Hrsg.). "Abbildung 2. Variable Bedeutung durch Permutation, gemittelt über 25 Modelle". Elife. 6: E22053. doi:10.7554/elife.22053.004. Abgerufen 2021-05-31.
- ^ Watson, Kevin; Halperin, Israel; Aguilera-Castells, Joan; Iacono, Antonio Dello (12. November 2020). "Tabelle 3: Deskriptive (Mittelwert ± SD), Inferenz (95% CI) und qualitative Statistiken (ES) aller Variablen zwischen selbst ausgewählten und vorbestimmten Bedingungen". Peerj. 8: e10361. doi:10.7717/peerj.10361/table-3. Abgerufen 2021-05-31.
- ^ Cortés-Molino, Álvaro; Aululló-Maestro, Isabel; Fernandez-luque, Ismael; Flores-Moya, Antonio; Carreira, José A.; Salvo, A. Enrique (22. Oktober 2020). "Tabelle 3: Beste Regressionsmodelle zwischen LIDAR-Daten (unabhängige Variable) und feldbasierten Forestereo-Daten (abhängige Variable), die zur Abbildung der räumlichen Verteilung der Hauptwaldstrukturvariablen verwendet wird". Peerj. 8: e10158. doi:10.7717/peerj.10158/table-3. Abgerufen 2021-05-31.
- ^ Internationale Verkaufsbedingungen, Beck/Hart, 2014, doi:10.5040/9781472561671.Ch-003, ISBN 978-1-4725-6167-1, abgerufen 2021-05-31
- ^ Nwabueze, JC (2008-05-21). "Leistungen von Schätzern des linearen Modells mit automatisch korrelierten Fehlerbegriffen, wenn die unabhängige Variable normal ist". Zeitschrift der Nigerian Association of Mathematical Physics. 9 (1). doi:10.4314/jonamp.v9i1.40071. ISSN 1116-4336.
- ^ Conway, Steve (2012-07-04). "Ein warnender Hinweis zu Dateneingaben und visuellen Ausgaben in der Analyse des sozialen Netzwerks". British Journal of Management. 25 (1): 102–117. doi:10.1111/j.1467-8551.2012.00835.x. HDL:2381/36068. ISSN 1045-3172. S2CID 154347514.
- ^ "Kundenkäufe und andere wiederholte Ereignisse", Datenanalyse mit SQL und Excel®, Indianapolis, Indiana: John Wiley & Sons, Inc., S. 367–420, 2016-01-29, doi:10.1002/9781119183419.Ch8, ISBN 978-1-119-18341-9, abgerufen 2021-05-31
- ^ Grandjean, Martin (2014). "La Connaissance Est un réseau" (PDF). Les Cahiers du Numérique. 10 (3): 37–54. doi:10.3166/lcn.10.3.37-54.
- ^ Datenanforderungen für Halbleiter -Sterben. Austausch von Datenformaten und Datenwörterbuch, BSI Britische Standards, doi:10.3403/02271298, abgerufen 2021-05-31
- ^ Yee, D. (1985-04-01). "Wie Sie Ihre Botschaft effektiv an ein Publikum vermitteln". Der Gerontologe. 25 (2): 209. doi:10.1093/Geront/25.2.209. ISSN 0016-9013.
- ^ Bemowska-kałabun, Olga; Wąsowicz, Paweł; Napora-Rutkowski, łukasz; Nowak-życzyńska, Zuzanna; Wierzbicka, Małgorzata (11. Juni 2019). "Ergänzende Informationen 1: Rohdaten für Diagramme und Tabellen". doi:10.7287/peerj.preprints.27793v1/Supp-1. Abgerufen 2021-05-31.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ Visualisieren von Daten zu britischen Museen: Balkendiagramme, Liniendiagramme und Wärmekarten. 2021. doi:10.4135/9781529768749. ISBN 9781529768749. S2CID 240967380.
- ^ Tunqui Neira, José Manuel (2019-09-19). "Vielen Dank für Ihre Bewertung. Weitere Informationen finden Sie in der beigefügten PDF -Datei auf die Punkte, die Sie angesprochen haben.". dx.doi.org. doi:10.5194/hess-2019-325-AC2. S2CID 241041810. Abgerufen 2021-06-01.
- ^ Brackett, John W. (1989), "Voraussetzung für Projektkurse für externe Kunden", Probleme in der Software -Ingenieurausbildung, New York, NY: Springer New York, S. 276–285, doi:10.1007/978-1-4613-9614-7_20, ISBN 978-1-4613-9616-1, abgerufen 2021-06-03
- ^ Wyckhuys, Kris A. G.; Wongtiem, Prapit; Rauf, Aunu; Als Charoen, Anchana; Heimpel, George E.; Le, Nhung T. T.; Fanani, Muhammad Zainal; Gurr, Geoff M.; Lundgren, Jonathan G.; Burra, Dharani D.; Palao, Leo K.; Hyman, Glenn; Graziosi, Ignazio; Le, vi x.; Schwanz, Matthew J. W.; Tscharntke, Teja; Wratten, Steve D.; Nguyen, Liem V.; Sie, Minsheng; Lu, Yanhui; Ketelaar, Johannes W.; Gogen, Georg; Neuenschwander, Peter (19. Oktober 2018). "Abbildung 2: Bi-monatliche Mealybug-Bevölkerungsschwankungen in Südvietnam über einen Zeitraum von 2 Jahren". Peerj. 6: E5796. doi:10.7717/peerj.5796/Abb. 2. Abgerufen 2021-06-03.
- ^ Riehl, Emily (2014), "Eine Stichprobe von 2-kategorischen Aspekten der Quasi-Kategorie-Theorie", Kategorische Homotopie -Theorie, Cambridge: Cambridge University Press, S. 318–336, doi:10.1017/CBO9781107261457.019, ISBN 978-1-107-26145-7, abgerufen 2021-06-03
- ^ "X-Bar-Diagramm", SpringerReference, Berlin/Heidelberg: Springer-Verlag, 2011, doi:10.1007/SpringerReference_7402, abgerufen 2021-06-03
- ^ "Diagramm C5.3. Prozentsatz von 15-19-Jährigen, die nicht im Bildung, nach Arbeitsmarktstatus (2012)". dx.doi.org. doi:10.1787/8889331119055. Abgerufen 2021-06-03.
- ^ "Diagramm 7: Haushalte: Endverbrauchsausgaben im Vergleich zum tatsächlichen individuellen Verbrauch". dx.doi.org. doi:10.1787/665527077310. Abgerufen 2021-06-03.
- ^ Chao, Luke H.; Jang, Jaebong; Johnson, Adam; Nguyen, Anthony; Gray, Nathanael S.; Yang, Priscilla L.; Harrison, Stephen C. (12. Juli 2018). Jahn, Reinhard; Schekman, Randy (Hrsg.). "Abbildung 4. Häufigkeit der Hemifusion (gemessen wie Fluoreszenz-Dequenching) als Funktion der Anzahl der gebundenen Alexa-Fluor-555/3-110-22-Moleküle". Elife. 7: e36461. doi:10.7554/elife.36461.006. Abgerufen 2021-06-03.
- ^ Garnier, Elodie M.; Fouret, Nastasia; Descoins, Médéric (3. Februar 2020). "Tabelle 2: Grafikvergleich zwischen Streudiagramm, Geigen- + Streudiagramm, Heatmap und Visielse -Graph". Peerj. 8: e8341. doi:10.7717/peerj.8341/Tabelle-2. Abgerufen 2021-06-03.
- ^ "Produktvergleichstabelle: Wearables". Psycextra -Datensatz. 2009. doi:10.1037/e539162010-006. Abgerufen 2021-06-03.
- ^ Stephen Wenig-Perzeptuelleswählen Sie das richtige Diagramm für Ihre Nachricht-2004
- ^ Stephen Wenig-Perceptual Edge-Graph-Auswahlmatrix
- ^ "Empfohlene Best Practices". dx.doi.org. 2008-10-01. doi:10.14217/9781848590151-8-en. Abgerufen 2021-06-03.
- ^ Hobold, Edilson; Pires-Lopes, vitor; Gómez-Campos, Rossana; Arruda, Miguel de; Andruske, Cynthia Lee; Pacheco-Carrillo, Jaime; Cossio-Bolaños, Marco Antonio (30. November 2017). "Tabelle 1: Deskriptive Statistiken (Mittelwert ± Standardverlust) für somatische Variablen und physische Fitness für Männer und Frauen". Peerj. 5: E4032. doi:10.7717/peerj.4032/Tabelle-1. Abgerufen 2021-06-03.
- ^ Abblin, Jacob N.; Zohar, Ada H.; Zaraya-Blum, Reut; Buskila, Dan (13. September 2016). "Tabelle 2: Clusteranalyse mit Mittelwerten psychologischer Variablen pro Clustergruppe". Peerj. 4: e2421. doi:10.7717/peerj.2421/Tabelle-2. Abgerufen 2021-06-03.
- ^ "Berater bei McKinsey & Company", Organisationsverhalten 5, Routledge, S. 77–82, 2008-07-30, doi:10.4324/9781315701974-15, ISBN 978-1-315-70197-4, abgerufen 2021-06-03
- ^ Antiphanes (2007), Olson, S. Douglas (Hrsg.), "H6 Antiphanes Fr.172.1-4, von Frauen, die aussahen wie einander oder Männer, die wie einander aussahen", Zerbrochenes Lachen: Wählen Sie Fragmente der griechischen Komödie aus, Oxford University Press, doi:10.1093/Oseo/Instanz.00232915, ISBN 978-0-19-928785-7, abgerufen 2021-06-03
- ^ Carey, Malachy (November 1981). "Über gegenseitig ausschließliche und gemeinsam erschöpfende Eigenschaften von Nachfragefunktionen". Wirtschaftlichkeit. 48 (192): 407–415. doi:10.2307/2553697. ISSN 0013-0427. JStor 2553697.
- ^ "Gesamtsteuereinnahmen". dx.doi.org. doi:10.1787/352874835867. Abgerufen 2021-06-03.
- ^ "Dual-Use-Auto kann Transportprobleme lösen". Archiv Chemical & Engineering News. 46 (24): 44. 1968-06-03. doi:10.1021/cen-v046n024.p044. ISSN 0009-2347.
- ^ Heckman (1978). "Einfache statistische Modelle für diskrete Paneldaten, die entwickelt und angewendet wurden, um die Hypothese der echten Zustandsabhängigkeit gegen die Hypothese der falschen Zustandsabhängigkeit zu testen.". Annales de l'Sesinéé (30/31): 227–269. doi:10.2307/20075292. ISSN 0019-0209. JStor 20075292.
- ^ Koontz, Dean (2017). Falsches Gedächtnis. Headlinienbuchverlag. ISBN 978-1-4722-4830-5. OCLC 966253202.
- ^ Munday, Stephen C. R. (1996), "Arbeitslosigkeit, Inflation und die Phillips -Kurve", Aktuelle Entwicklungen in der Wirtschaftswissenschaften, London: Macmillan Education UK, S. 186–218, doi:10.1007/978-1-349-24986-2_11, ISBN 978-0-333-64444-7, abgerufen 2021-06-03
- ^ Louangrath, Paul I. (2013). "Alpha- und Beta -Tests für die Bestimmung des Typ -I- und Typ -II -Inferenzfehlers bei Hypothesentests". SSRN Electronic Journal. doi:10.2139/ssrn.2332756. ISSN 1556-5068.
- ^ Wallo, Ann M. (2006). Ablehnung der Hypothese der zweiten Generation: Aufrechterhaltung der estnischen Ethnizität in Lakewood, New Jersey. AMS Press. ISBN 0-404-19454-0. OCLC 467107876.
- ^ a b Yanamandra, Venkataramana (September 2015). "Wechselkursänderungen und Inflation in Indien: Wie hoch ist das Ausmaß des Wechselkursverwalters für Importe?". Wirtschaftsanalyse und Politik. 47: 57–68. doi:10.1016/j.eap.2015.07.004. ISSN 0313-5926.
- ^ Mudiyanselage, Nawarathna; Nawarathna, Pubudu Manoj. Charakterisierung epigenetischer Veränderungen und ihre Verbindung zu Genexpressionsanomalien beim klaren Zellzellkarzinom. OCLC 1190697848.
- ^ Moreno Delgado, David; Møller, Thor C.; Ster, Jeanne; Giraldo, Jesús; Maurel, Damien; Rovira, Xavier; Scholler, Pauline; Zwier, Jurriaan M.; Perroy, Julie; Durroux, Thierry; Trinquet, Eric; Prezeau, Laurent; Rondard, Philippe; Pin, Jean-Philippe (29. Juni 2017). Chao, Moses V (Hrsg.). "Anhang 1 - Abbildung 5. Kurvendaten, die in Anhang 1 enthalten sind, 4 (feste Punkte) und die theoretische Kurve unter Verwendung der Parameter der Hill -Gleichung von Anhang 1 - table 5 (Kurvenlinie)". Elife. 6: E25233. doi:10.7554/elife.25233.027. Abgerufen 2021-06-03.
- ^ Feinmann, Jane. "Wie können Ingenieure und Journalisten sich gegenseitig helfen?". dx.doi.org. doi:10.1049/iet-tv.48.859. Abgerufen 2021-06-03.
- ^ Dul, Jan (2015). "Notwendige Zustandsanalyse (NCA): Logik und Methodik der notwendigen, aber nicht ausreichenden 'Kausalität". SSRN Electronic Journal. doi:10.2139/ssrn.2588480. HDL:1765/77890. ISSN 1556-5068. S2CID 219380122.
- ^ Robert Amar, James Eagan und John Stasko (2005) "Niedrige Komponenten der analytischen Aktivität in der Informationsvisualisierung"
- ^ William Newman (1994) "Eine vorläufige Analyse der Produkte der HCI -Forschung unter Verwendung von Pro forma Abstracts"
- ^ Mary Shaw (2002) "Was macht eine gute Forschung im Software -Engineering?"
- ^ a b Yavari, Ali; Jayaraman, Prem Prakash; Georgakopoulos, Dimitrios; Nepal, Surya (2017). Contaas: Ein Ansatz zur Kontextualisierung im Internetmaßstab zur Entwicklung eines effizienten Internet der Dinge Anwendungen. Wissenschaftler. Proceedings der 50. Hawaii International Conference on System Sciences (2017). HICSS50. doi:10.24251/hics.2017.715. HDL:10125/41879. ISBN 9780998133102. Abgerufen 24. Mai, 2017.
- ^ "Konnektivitätstool überträgt Daten zwischen Datenbank und statistischen Produkten". Computerstatistik und Datenanalyse. 8 (2): 224. Juli 1989. doi:10.1016/0167-9473 (89) 90021-2. ISSN 0167-9473.
- ^ "Informationen, die für Ihren Job relevant sind", Informationen zum effektiven Management erhalten, Routledge, S. 48–54, 2007-07-11, doi:10.4324/9780080544304-16, ISBN 978-0-08-054430-4, abgerufen 2021-06-03
- ^ Lehmann, E. L. (2010). Testen statistischer Hypothesen. Springer. ISBN 978-1-4419-3178-8. OCLC 757477004.
- ^ Fielding, Henry (2008-08-14), "Besteht teilweise aus Tatsachen und teilweise aus Beobachtungen auf sie", Tom Jones, Oxford University Press, doi:10.1093/OWC/9780199536993.003.0193, ISBN 978-0-19-953699-3, abgerufen 2021-06-03
- ^ "Kongress-Haushaltsbüro-Budget und Wirtschaftsausblick-August 2010-Tabelle 1.7 auf Seite 24" (PDF). 18. August 2010. Abgerufen 2011-03-31.
- ^ "Zugehörigkeitsgefühl der Schüler durch Einwandererhintergrund". PISA 2015 -Ergebnisse (Band III). Pisa. 2017-04-19. doi:10.1787/9789264273856-table125-en. ISBN 9789264273818. ISSN 1996-3777.
- ^ Gordon, Roger (März 1990). "Handeln handelte Unternehmen im öffentlichen Interesse handeln?". Cambridge, MA. doi:10.3386/w3303.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ Minardi, Margot (2010-09-24), "Fakten und Meinung", Sklaverei Geschichte machen, Oxford University Press, S. 13–42, doi:10.1093/ACPROF: OSO/9780195379372.003.0003, ISBN 978-0-19-537937-2, abgerufen 2021-06-03
- ^ Rivard, Jillian R (2014). Bestätigungsverzerrung bei Zeugenbefragungen: Können Interviewer ihre Vorurteile ignorieren? (These). Florida International University. doi:10.25148/etd.fi14071109.
- ^ Papineau, David (1988), "Diskutiert die Soziologie der Wissenschaft die Wissenschaft?", Relativismus und Realismus in der Wissenschaft, Dordrecht: Springer Niederlande, S. 37–57, doi:10.1007/978-94-009-2877-0_2, ISBN 978-94-010-7795-8, abgerufen 2021-06-03
- ^ Bromme, Rainer; Hesse, Friedrich W.; Spada, Hans, Hrsg. (2005). Barrieren und Vorurteile in der computergestützten Wissenskommunikation. doi:10.1007/B105100. ISBN 978-0-387-24317-7.
- ^ Heuer, Richards (2019-06-10). Heuer, Richards J (Hrsg.). Quantitative Ansätze zur politischen Intelligenz. doi:10.4324/9780429303647. ISBN 9780429303647. S2CID 145675822.
- ^ "Einführung" (PDF). cia.gov.
- ^ "Abbildung 6.7. Unterschiede in den Alphabetisierungswerten in OECD -Ländern spiegeln im Allgemeinen diejenigen in der Zahlung wider.". dx.doi.org. doi:10.1787/888934081549. Abgerufen 2021-06-03.
- ^ Bloomberg-barry Ritholz-Bad-Mathematik, die für den Insight-Octentober 28, 2014 passt
- ^ Gusnaini, Nuriska; Andesto, Rony; Ermawati (2020-12-15). "Die Auswirkungen der regionalen Regierungsgröße, der gesetzgebenden Größe, der Anzahl der Bevölkerung und der Zwischenstaatlichkeitseinnahmen auf die Offenlegung des Jahresabschlusses". Europäisches Journal of Business and Management Research. 5 (6). doi:10.24018/ejbmr.2020.5.6.651. ISSN 2507-1076. S2CID 231675715.
- ^ Linsey, Julie S.; Becker, Blake (2011), "Wirksamkeit von Hirnwriting -Techniken: Vergleich nominaler Gruppen mit realen Teams", Design Kreativität 2010, London: Springer London, S. 165–171, doi:10.1007/978-0-85729-224-7_22, ISBN 978-0-85729-223-0, abgerufen 2021-06-03
- ^ Lyon, J. (April 2006). "Angebliche verantwortungsvolle Adresse in E-Mail-Nachrichten". doi:10.17487/rfc4407.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ Aktien, Eugene (10. Juni 2017). Die Geschichte der kirchlichen Missionsgesellschaft ihrer Umwelt, ihrer Männer und ihrer Arbeit. ISBN 978-3-337-18120-8. OCLC 1189626777.
- ^ Gross, William H. (Juli 1979). "Gutscheinbewertung und Zinszyklen". Finanzanalysten Journal. 35 (4): 68–71. doi:10.2469/faj.v35.n4.68. ISSN 0015-198x.
- ^ "25. Gesamtausgaben der allgemeinen Regierung". dx.doi.org. doi:10.1787/888932348795. Abgerufen 2021-06-03.
- ^ González-Vidal, Aurora; Moreno-Cano, Victoria (2016). "In Bezug auf Energieeffizienz intelligente Gebäudemodelle basierend auf intelligenten Datenanalysen". Verfahren Informatik. 83 (Elsevier): 994–999. doi:10.1016/j.Procs.2016.04.213.
- ^ "Niedrige Energieklima- und Beleuchtungssteuerung", Systeme zur Bewirtschaftung der Energiemanagementsysteme, Routledge, S. 406–439, 2013-07-04, doi:10.4324/9780203477342-18, ISBN 978-0-203-47734-2, abgerufen 2021-06-03
- ^ Davenport, Thomas; Harris, Jeanne (2007). Wettbewerb auf Analysen. O'Reilly. ISBN 978-1-4221-0332-6.
- ^ Aarons, D. (2009). Bericht stellt Staaten auf dem Kurs zum Bau von Schülern-Daten-Systemen fest. Bildungswoche, 29(13), 6.
- ^ Rankin, J. (2013, 28. März). Wie Datensysteme und Berichte entweder gegen die Datenanalyse -Fehlerpidemie kämpfen oder verbreiten können und wie Pädagogen -Führungskräfte helfen können. Archiviert 2019-03-26 bei der Wayback -Maschine Präsentation vom Technology Information Center for Administrative Leadership (TICAL) School Leadership Summit.
- ^ Brödermann, Eckart J. (2018), "Artikel 2.2.1 (Umfang des Abschnitts)", Handelsrecht, Nomos tragsgesellschaft mbh & Co. kg, p. 525, doi:10.5771/9783845276564-525, ISBN 978-3-8452-7656-4, abgerufen 2021-06-03
- ^ Jaech, J. L. (1960-04-21). "Analyse von dimensionalen Verzerrungsdaten aus den ersten 24 Qualitätszertifizierungsrohre". doi:10.2172/10170345. S2CID 110058009.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ Adèr 2008a, p. 337.
- ^ Kjell, Oscar N. E.; Thompson, Sam (19. Dezember 2013). "Deskriptive Statistiken, die den Mittelwert, die Standardabweichung und die Häufigkeit fehlender Werte für jede Bedingung (n = Anzahl der Teilnehmer) und für die abhängigen Variablen (DV) anzeigen". Peerj. 1: e231. doi:10.7717/peerj.231/Tabelle-1. Abgerufen 2021-06-03.
- ^ Übung für den Umgang mit abgelegenen Beobachtungen, ASTM International, doi:10.1520/e0178-16a, abgerufen 2021-06-03
- ^ "Alternative Codierungsschemata für Dummy -Variablen", Regression mit Dummy -Variablen, Newbury Park, CA: Sage Publications, Inc., S. 64–75, 1993, doi:10.4135/9781412985628.n5, ISBN 978-0-8039-5128-0, abgerufen 2021-06-03
- ^ Adèr 2008a, S. 338–341.
- ^ Danilyuk, P. M. (Juli 1960). "Berechnung der Verschiebung der anfänglichen Kontur von Zahnrädern, wenn sie mittels Bälle überprüft werden". Messtechniken. 3 (7): 585–587. doi:10.1007/bf00977716. ISSN 0543-1972. S2CID 121058145.
- ^ Newman, Isadore (1998). Qualitativ-quantitative Forschungsmethodik: Untersuchung des interaktiven Kontinuums. Southern Illinois University Press. ISBN 0-585-17889-5. OCLC 44962443.
- ^ Terwilliger, James S.; Lele, Kaustubh (Juni 1979). "Einige Beziehungen zwischen interner Konsistenz, Reproduzierbarkeit und Homogenität". Journal of Educational Measurement. 16 (2): 101–108. doi:10.1111/j.1745-3984.1979.tb00091.x. ISSN 0022-0655.
- ^ Adèr 2008a, S. 341–342.
- ^ Adèr 2008a, p. 344.
- ^ Tabachnick & Fidell, 2007, p. 87-88.
- ^ Tchakarova, Kalina (Oktober 2020). "2020/31 Der Vergleich von Stellenbeschreibungen reicht nicht aus, um zu überprüfen, ob die Arbeit gleichermaßen wertvoll ist (BG)". Europäische Arbeitsrecht Fälle. 5 (3): 168–170. doi:10.5553/Eelc/187791072020005003006. ISSN 1877-9107. S2CID 229008899.
- ^ Zufällige Stichproben- und Randomisierungsverfahren, BSI Britische Standards, doi:10.3403/30137438, abgerufen 2021-06-03
- ^ Adèr 2008a, S. 344–345.
- ^ Sandberg, Margareta (Juni 2006). "Akupunkturverfahren müssen genau beschrieben werden". Akupunktur in der Medizin. 24 (2): 92–94. doi:10.1136/AIM.24.2.92. ISSN 0964-5284. PMID 16783285. S2CID 30286074.
- ^ Jaarsma, C.F. Verkeer in Een Landelijk Gebied: Waaremingen und analysieren Sie Van Het Verkeer in Zuidwest Friesland en Ontwikkeling van Een Verkeersmodel. OCLC 1016575584.
- ^ Foth, christlich; Hedrick, Brandon P.; Ezcurra, Martin D. (18. Januar 2016). "Abbildung 4: Regressionsanalysen der Schwerpunktgröße für die Hauptprobe". Peerj. 4: e1589. doi:10.7717/peerj.1589/Abb-4. Abgerufen 2021-06-03.
- ^ Adèr 2008a, p. 345.
- ^ "Die letzten Jahre (1975-84)", Die Straße nicht genommen, Boydell & Brewer, S. 853–922, 2018-06-18, doi:10.2307/j.ctv6cfncp.26, ISBN 978-1-57647-332-0, S2CID 242072487, abgerufen 2021-06-03
- ^ Fitzmaurice, Kathryn (17. März 2015). Schicksal, neu geschrieben. ISBN 978-0-06-162503-9. OCLC 905090570.
- ^ "Ergänzende Datei 4. Rohdaten und R-basierte Analysen". dx.doi.org. 7. März 2017. doi:10.7554/elife.24102.023. Abgerufen 2021-06-03.
- ^ Adèr 2008a, S. 345–346.
- ^ Adèr 2008a, S. 346–347.
- ^ Adèr 2008a, S. 349–353.
- ^ Billings S.A. Wiley, 2013
- ^ Adèr 2008b, p. 363.
- ^ "Explorationsdatenanalyse", Python® für R -Benutzer, Hoboken, NJ, USA: John Wiley & Sons, Inc., S. 119–138, 2017-10-13, doi:10.1002/9781119126805.Ch4, HDL:11380/971504, ISBN 978-1-119-12680-5, abgerufen 2021-06-03
- ^ "Analyse, Visualisierungs- und Hypothesentests analysieren ...................................... .............................................. ..... Explorationsdatenanalyse, Geovisualisation und Daten ", Raumanalyse, CRC Press, S. 106–139, 2015-07-28, doi:10.1201/b18808-8, ISBN 978-0-429-06936-9, S2CID 133412598, abgerufen 2021-06-03
- ^ "Hypothesen über Kategorien", Startstatistiken: Ein kurzer, klarer Leitfaden, London: Sage Publications Ltd, S. 138–151, 2010, doi:10.4135/9781446287873.N14, ISBN 978-1-84920-098-1, abgerufen 2021-06-03
- ^ Sordo, Rachele Del; Sidoni, Angelo (Dezember 2008). "MIB-1-Zellmembranreaktivität: Ein Befund, der sorgfältig interpretiert werden sollte". Angewandte Immunhistochemie und molekulare Morphologie. 16 (6): 568. doi:10.1097/pai.0b013e31817af2cf. ISSN 1541-2016. PMID 18800001.
- ^ Alkohol, Benoit; Riou, Jérémie (2013-06-08). "Korrektur des Signifikanzniveaus beim Versuch mehrerer Transformationen einer erklärenden Variablen in verallgemeinerten linearen Modellen". BMC Medical Research Methodology. 13 (1): 75. doi:10.1186/1471-2288-13-75. ISSN 1471-2288. PMC 3699399. PMID 23758852.
- ^ a b c McARDLE, John J. (2008). "Einige ethische Fragen in der Bestätigung im Vergleich zu explorativen Analysen". Psycextra -Datensatz. doi:10.1037/e503312008-001. Abgerufen 2021-06-03.
- ^ Adèr 2008b, S. 361–362.
- ^ Adèr 2008b, S. 361–371.
- ^ Truswell IV, William H., ed. (2009), "3 Das Facelift: Ein Leitfaden für sichere, zuverlässige und reproduzierbare Ergebnisse", Chirurgische Gesichtsverjüngung, Stuttgart: Georg Thieme Verlag, doi:10.1055/B-0034-73436, ISBN 978-1-58890-491-1, abgerufen 2021-06-03
- ^ "Ergänzungsdatei 1. Quervalidierungsschema". dx.doi.org. 6. Dezember 2018. doi:10.7554/elife.40224.014. Abgerufen 2021-06-03.
- ^ Hsiao, Cheng (2014), "Querschnittsabhängig abhängige Paneldaten", Analyse der Paneldaten, Cambridge: Cambridge University Press, S. 327–368, doi:10.1017/CBO9781139839327.012, ISBN 978-1-139-83932-7, abgerufen 2021-06-03
- ^ Hjorth, J.S. Urban (2017-10-19), "Kreuzvalidierung", Computerintensive statistische Methoden, Chapman und Hall/CRC, S. 24–56, doi:10.1201/9781315140056-3, ISBN 978-1-315-14005-6, abgerufen 2021-06-03
- ^ Sheikholchlami, Razi; Razavi, Saman; Haghnegahdar, Amin (2019-10-10). "Was sollen wir tun, wenn ein Modell abstürzt? Empfehlungen für die globale Sensitivitätsanalyse von Modellen für Erd- und Umweltsysteme". Geowissenschaftliche Modellentwicklung. 12 (10): 4275–4296. Bibcode:2019gmd .... 12.4275s. doi:10.5194/GMD-12-4275-2019. ISSN 1991-9603. S2CID 204900339.
- ^ "Verbundindizes der menschlichen Entwicklung". dx.doi.org. 2018-09-19. doi:10.18356/ce6f8e92-en. S2CID 240207510. Abgerufen 2021-06-03.
- ^ Wiley, Matt; Wiley, Joshua F. (2019), "Multivariate Datenvisualisierung", Fortgeschrittene R -statistische Programmier- und Datenmodelle, Berkeley, CA: Apress, S. 33–59, doi:10.1007/978-1-4842-2872-2_2, ISBN 978-1-4842-2871-5, S2CID 86629516, abgerufen 2021-06-03
- ^ Orduna-malea, Enrique; Alonso-Arroyo, Adolfo (2018), "Ein cybermetrisches Analysemodell zur Messung privater Unternehmen", Cybermetrische Techniken zur Bewertung von Organisationen mit webbasierten DatenElsevier, S. 63–76, doi:10.1016/b978-0-08-101877-4.00003-x, ISBN 978-0-08-101877-4, abgerufen 2021-06-03
- ^ Leen, A.R. Der Verbraucher in der österreichischen Wirtschaft und in der österreichischen Perspektive auf die Verbraucherpolitik. ISBN 90-5808-102-8. OCLC 1016689036.
- ^ "Beispiele für die Analyse von Überlebensdaten", Statistische Methoden zur Überlebensdatenanalyse, Wiley-Serie in Wahrscheinlichkeit und Statistik, Hoboken, NJ, USA: John Wiley & Sons, Inc., 2003-06-30, S. 19–63, doi:10.1002/0471458546.ch3, ISBN 978-0-471-45854-8, abgerufen 2021-06-03
- ^ "Die Community für maschinelles Lernen übernimmt die Higgs". Symmetriemagazin. 15. Juli 2014. Abgerufen 14. Januar 2015.
- ^ Nehme, Jean (29. September 2016). "LTPP International Data Analysis Contest". Federal Highway Administration. Abgerufen 22. Oktober, 2017.
- ^ "Data.gov:Long-Term Pavement Performance (LTPP)". 26. Mai 2016. Abgerufen 10. November, 2017.
Literaturverzeichnis
- Adèr, Herman J. (2008a). "Kapitel 14: Phasen und erste Schritte in der Datenanalyse". In Adèr, Herman J.; Mellenbergh, Gideon J.; Hand, David J. (Hrsg.). Beratung zu Forschungsmethoden: Der Begleiter eines Beraters. Huizen, Niederlande: Johannes van Kessel Pub. S. 333–356. ISBN 9789079418015. OCLC 905799857.
- Adèr, Herman J. (2008b). "Kapitel 15: Die Hauptanalysephase". In Adèr, Herman J.; Mellenbergh, Gideon J.; Hand, David J. (Hrsg.). Beratung zu Forschungsmethoden: Der Begleiter eines Beraters. Huizen, Niederlande: Johannes van Kessel Pub. S. 357–386. ISBN 9789079418015. OCLC 905799857.
- Tabachnick, B.G. & Fidell, L.S. (2007). Kapitel 4: Reinigen Sie Ihre Handlung. Screeningdaten vor der Analyse. In B.G. Tabachnick & L.S. Fidell (Hrsg.), Unter Verwendung multivariater Statistiken, fünfte Ausgabe (S. 60–116). Boston: Pearson Education, Inc. / Allyn und Bacon.
Weitere Lektüre
- Adèr, H.J. & Mellenbergh, G.J. (Mit Beiträgen von D.J. Hand) (2008). Beratung zu Forschungsmethoden: Der Begleiter eines Beraters. Huizen, Niederlande: Johannes van Kessel Publishing. ISBN978-90-79418-01-5
- Chambers, John M.; Cleveland, William S.; Kleiner, Beat; Tukey, Paul A. (1983). Grafische Methoden für die Datenanalyse, Wadsworth/Duxbury Press. ISBN0-534-98052-x
- Fandango, Armando (2017). Python -Datenanalyse, 2. Auflage. Packt Publishers. ISBN978-1787127487
- Juran, Joseph M.; Godfrey, A. Blanton (1999). Jurans Qualitätshandbuch, 5. Ausgabe. New York: McGraw Hill. ISBN0-07-034003-x
- Lewis-Beck, Michael S. (1995). Datenanalyse: Eine Einführung, Sage Publications Inc., ISBN0-8039-5772-6
- NIST/SEMATech (2008) Handbuch der statistischen Methoden,
- Pyzdek, T, (2003). Qualitätstechnik Handbuch, ISBN0-8247-4614-7
- Richard sehr (1984). Pragmatische Datenanalyse. Oxford: Blackwell Scientific Publications. ISBN0-632-01311-7
- Tabachnick, B.G.; Fidell, L.S. (2007). Verwenden von multivariaten Statistiken, 5. Auflage. Boston: Pearson Education, Inc. / Allyn und Bacon, ISBN978-0-205-45938-4