Konfidenzintervall

Jede Punktzeile ist eine Probe aus derselben Normalverteilung. Die farbigen Linien sind 50% Konfidenzintervalle für den Mittelwert, μ. In der Mitte jedes Intervalls befindet sich der mit einem Diamant gekennzeichnete Probenmittelwert. Die blauen Intervalle enthalten den Mittelwert und die roten nicht.

Im Häufige Statistiken, a Konfidenzintervall (CI) ist eine Reihe von Schätzungen für ein Unbekanntes Parameter. Ein Konfidenzintervall wird mit einem festgelegten berechnet Vertrauensniveau; Das Konfidenzniveau von 95% ist am häufigsten, aber manchmal werden andere Werte wie 90% oder 99% verwendet.[1][2] Das Konfidenzniveau repräsentiert die langfristige Anteil von entsprechenden cis, die die enthalten wahrer Wert des Parameters. In allen Intervallen, die auf 95% Ebene berechnet wurden, sollten 95% von ihnen den wahren Wert des Parameters enthalten.[3]

Faktoren, die die Breite des CI beeinflussen, umfassen das Konfidenzniveau, die Stichprobengröße, und die Variabilität in der Probe.[4] Alles andere ist gleich, eine größere Probe würde ein engeres Konfidenzintervall erzeugen. Ebenso erzeugt eine größere Variabilität in der Stichprobe ein breiteres Konfidenzintervall, und ein höheres Konfidenzniveau würde ein breiteres Konfidenzintervall erfordern.[5]

Definition

Lassen X sei a zufällige Probe von einem Wahrscheinlichkeitsverteilung mit Statistischer Parameter θ, was eine Menge ist, die geschätzt werden muss, und φ, repräsentieren Mengen, die nicht von unmittelbarem Interesse sind. Ein Konfidenzintervall für den Parameter θmit Konfidenzniveau oder Koeffizient γ, ist ein Intervall (u(X),v(X)) bestimmt durch zufällige Variablen u(X) und v(X) mit der Eigenschaft:

Die Nummer γ, dessen typischer Wert nahezu aber nicht größer als 1 ist, ist manchmal in Form 1 - angegeben -α (oder als Prozentsatz 100%· (1 - -α)), wo α ist eine kleine nicht negative Zahl, am häufigsten .05.

Es ist wichtig für u(X) und v(X) so lange angegeben werden X wird zufällig gesammelt, jedes Mal, wenn wir ein Konfidenzintervall berechnen, gibt es Wahrscheinlichkeit γ dass es enthalten würde θDer wahre Wert des geschätzten Parameters. Dies sollte für jeden tatsächlichen zutreffen θ und φ. [2]

Ungefähre Konfidenzintervalle

In vielen Anwendungen sind Konfidenzintervalle, die genau das erforderliche Konfidenzniveau haben, schwer zu konstruieren, aber ungefähre Intervalle können berechnet werden. Die Regel für den Bau des Intervalls kann als Bereitstellung eines Konfidenzintervalls auf Ebene akzeptiert werden wenn

zu einem akzeptablen Annäherungsgrad. Alternativ einige Autoren[6] benötigen das einfach

Das ist nützlich, wenn die Wahrscheinlichkeiten nur sind teilweise identifiziert oder ungenau, und auch im Umgang mit Diskrete Verteilungen. Vertrauensgrenzen der Form

und

werden genannt konservativ;[7] Dementsprechend spricht man von konservativen Konfidenzintervallen und im Allgemeinen Regionen.

Wünschenswerte Eigenschaften

Bei der Anwendung statistischer Standardverfahren gibt es häufig Standardmethoden, um Konfidenzintervalle zu konstruieren. Diese werden so entwickelt, dass bestimmte wünschenswerte Eigenschaften erfüllt sind, die behaupten, dass die Annahmen, auf die das Verfahren angewiesen ist, wahr sind. Diese wünschenswerten Eigenschaften können als: Gültigkeit, Optimalität und Invarianz beschrieben werden. Von dieser "Gültigkeit" ist am wichtigsten, gefolgt von "Optimalität". "Invarianz" kann als Eigentum der Ableitung eines Konfidenzintervalls angesehen werden, anstatt der Regel für die Konstruktion des Intervalls. In nicht standardmäßigen Anwendungen würden die gleichen wünschenswerten Eigenschaften gesucht.

  • Gültigkeit. Dies bedeutet, dass der nominelle Abdeckungswahrscheinlichkeit (Konfidenzniveau) des Konfidenzintervalls sollte entweder genau oder zu einer guten Annäherung gelten.
  • Optimalität. Dies bedeutet, dass die Regel für die Erstellung des Konfidenzintervalls die Informationen im Datensatz wie möglich genutzt werden sollte. Denken Sie daran, dass man die Hälfte eines Datensatzes wegwerfen und dennoch ein gültiges Konfidenzintervall ableiten kann. Eine Möglichkeit zur Bewertung der Optimalität ist die Länge des Intervalls, so dass eine Regel für den Bau eines Konfidenzintervalls besser beurteilt wird als eine andere, wenn sie zu Intervallen führt, deren Längen normalerweise kürzer sind.
  • Invarianz. In vielen Anwendungen ist die geschätzte Menge möglicherweise nicht eng als solche definiert. Beispielsweise könnte eine Umfrage zu einer Schätzung des Durchschnittseinkommens in einer Bevölkerung führen, aber es könnte gleichermaßen als Schätzung des Logarithmus des mittleren Einkommens angesehen werden, da dies eine gemeinsame Skala für die Darstellung grafischer Ergebnisse ist. Es wäre wünschenswert, dass die Methode, die zum Erstellen eines Konfidenzintervalls für das mittlere Einkommen verwendet wird der Werte an den Enden des früheren Intervalls.

Ableitungsmethoden

Für nicht standardmäßige Anwendungen gibt es mehrere Routen, die zur Ableitung einer Regel für die Konstruktion von Konfidenzintervallen herangezogen werden könnten. Die festgelegten Regeln für Standardverfahren können über mehrere dieser Routen gerechtfertigt oder erklärt werden. Typischerweise ist eine Regel für die Konstruktion von Konfidenzintervallen eng mit einer bestimmten Art des Findens a verbunden Punktschätzung von der Menge berücksichtigt.

Zusammengefasste Statistiken
Dies ist eng mit dem verwandt Momente Methode zur Schätzung. Ein einfaches Beispiel entsteht, wenn die geschätzte Menge der Bevölkerungsmittelwert ist. In diesem Fall ist eine natürliche Schätzung der Stichprobenmittelwert. Ebenso die Probe Varianz Kann verwendet werden, um die Populationsvarianz abzuschätzen. Ein Konfidenzintervall für den wahren Mittelwert kann auf dem Probenmittelwert mit einer Breite konstruiert werden, die ein Vielfaches der Quadratwurzel der Probenvarianz ist.
Wahrscheinlichkeitstheorie
Schätzungen können mit dem konstruiert werden Maximale WahrscheinlichkeitsprinzipDie Wahrscheinlichkeitstheorie dafür bietet zwei Möglichkeiten, Konfidenzintervalle oder Konfidenzregionen für die Schätzungen zu konstruieren.
Schätzung von Gleichungen
Der Schätzansatz hier kann sowohl als Verallgemeinerung des Momente Methode und eine Verallgemeinerung des maximalen Ansatzes für die Wahrscheinlichkeit. Es gibt entsprechende Verallgemeinerungen der Ergebnisse der maximalen Wahrscheinlichkeitstheorie, die es ermöglichen, dass Konfidenzintervalle basierend auf den abgeleiteten Schätzungen konstruiert werden Schätzung von Gleichungen.
Hypothesentest
Wenn Hypothesentests für allgemeine Werte eines Parameters verfügbar sind, können Konfidenzintervalle/Regionen durch Einbeziehung in die 100 konstruiert werdenp% Konfidenzregion all jene Punkte, für die der Hypothesentest der Nullhypothese dass der wahre Wert der angegebene Wert ist, wird nicht bei einem Signifikanzniveau von (1 - - abgelehntp).[8]
Bootstrapping
In Situationen, in denen die Verteilungsannahmen für die oben genannten Methoden ungewiss oder verletzt sind, ermöglichen Resampling -Methoden die Konstruktion von Konfidenzintervallen oder Vorhersageintervallen. Die beobachtete Datenverteilung und die internen Korrelationen werden als Ersatz für die Korrelationen in der breiteren Bevölkerung verwendet. Siehe auch: Abfertigung von Konfidenzintervallen aus der Bootstrap -Verteilung.

Zentralgrenze Theorem

Der zentrale Grenzwertsatz ist eine Verfeinerung der Gesetz der großen Anzahl. Für eine große Anzahl unabhängiger identisch verteilter Zufallsvariablen mit endlicher Abweichung der Durchschnitt hat ungefähr eine Normalverteilung, unabhängig von der Verteilung der Verteilung der ist.[2]

Beispiel

Vermuten {X1,…,Xn} ist ein unabhängig Probe von a normal verteilt Bevölkerung mit unbekannten Parametern bedeuten μ und Varianz σ2. Lassen

Wo X ist der Probenmittelwert, und S2 ist der Stichprobenvarianz. Dann

hat ein Studenten t Verteilung mit n - 1 Freiheitsgrade.[9] Beachten Sie, dass die Verteilung von T hängt nicht von den Werten der nicht beobachtbaren Parameter ab μ und σ2; d.h. es ist a entscheidende Menge. Angenommen, wir wollten ein 95% -Konfidenzintervall für berechnenμ. Dann bezeichnet c als 97.5 Perzentil dieser Verteilung,

Beachten Sie, dass "97,5th" und "0,95" in den vorhergehenden Ausdrücken korrekt sind. Es besteht eine Chance von 2,5%, das wird weniger sein als und eine Chance von 2,5%, dass es größer sein wird als . Somit die Wahrscheinlichkeit, dass wird dazwischen sein und ist 95%.

Folglich,

und wir haben ein theoretisches (stochastisches) 95% -Konfidenzintervall fürμ.

Nach der Beobachtung der Probe finden wir Werte x zum X und s zum S, aus dem wir das Konfidenzintervall berechnen

In diesem BalkendiagrammDie oberen Enden der braunen Balken zeigen beobachtete Mittelwerte und die roten Liniensegmente an ("Fehlerbalken") die Konfidenzintervalle um sie herum darstellen. Obwohl die Fehlerbalken als symmetrisch um die Mittel angezeigt werden, ist dies nicht immer der Fall. In den meisten Grafiken repräsentieren die Fehlerbalken keine Konfidenzintervalle (z. B. stellen sie häufig Standardfehler oder Standard dar Abweichungen)

Deutung

Verschiedene Interpretationen eines Konfidenzintervalls können verabreicht werden (das 95% -Konfidenzintervall als Beispiel im Folgenden).

  • Das Konfidenzintervall kann in Bezug auf a ausgedrückt werden Langfristige Frequenz in Wiederholte Proben (oder in Resampling): "Wäre dieses Verfahren in zahlreichen Proben wiederholt, würde der Anteil der berechneten 95% -Konfidenzintervalle, die den tatsächlichen Wert des Populationsparameters umfassten, zu 95% tendieren. "[10]
  • Das Konfidenzintervall kann als Wahrscheinlichkeit in Bezug auf eine einzelne theoretische (noch zu verwirkliche) Probe ausgedrückt werden: "Es gibt 95% Wahrscheinlichkeit Dass das aus einer bestimmten zukünftige Stichprobe berechnete 95% -Konfidenzintervall den tatsächlichen Wert des Populationsparameters abdecken wird. " [11] Dies wird im Wesentlichen die Interpretation "wiederholte Stichproben" als Wahrscheinlichkeit als als Frequenz neu bearbeitet. Sehen Neyman -Konstruktion.
  • Das Konfidenzintervall kann in Bezug auf statistische Signifikanz ausgedrückt werden, z. B.: "Das 95% -Konfidenzintervall repräsentiert Werte, die nicht sind statistisch signifikant anders als die Punktschätzung auf der Ebene von 0,05".[12]


Gemeinsame Missverständnisse

Diagramm von 50 Konfidenzintervallen aus 50 Proben, die aus einer Normalverteilung erzeugt wurden.

Konfidenzintervalle und Ebenen werden häufig missverstanden, und veröffentlichte Studien haben gezeigt, dass selbst professionelle Wissenschaftler sie häufig falsch interpretieren.[13][14][15][16][17][18]

  • Ein Konfidenzniveau von 95% bedeutet nicht, dass für ein gegebenes realisiertes Intervall eine Wahrscheinlichkeit von 95% besteht, dass der Populationsparameter innerhalb des Intervalls liegt (d. H. Eine Wahrscheinlichkeit von 95%, dass das Intervall den Populationsparameter abdeckt).[19] Nach der strengen häufigen Interpretation deckt dieses Intervall nach dem Parameterwert oder nicht den Parameterwert ab oder dies nicht. Es ist keine Wahrscheinlichkeit mehr. Die Wahrscheinlichkeit von 95% bezieht sich auf die Zuverlässigkeit des Schätzverfahrens, nicht auf ein spezifisches berechnetes Intervall.[20] Neyman selbst (der ursprüngliche Befürworter von Konfidenzintervallen) machte diesen Punkt in seinem ursprünglichen Papier:[11]

    "Es wird festgestellt, dass in der obigen Beschreibung die Wahrscheinlichkeitsaussagen auf die Probleme der Schätzung beziehen α. Betrachten Sie nun den Fall, wenn bereits eine Stichprobe gezogen wird und die Berechnungen [bestimmte Grenzen] angegeben haben. Können wir sagen, dass in diesem speziellen Fall die Wahrscheinlichkeit des wahren Wertes [zwischen diesen Grenzen fallen] gleich α? Die Antwort ist offensichtlich negativ. Der Parameter ist eine unbekannte Konstante, und es kann keine Wahrscheinlichkeitserklärung zu seinem Wert gemacht werden ... "

Deborah Mayo erweitert dies weiter wie folgt:[21]

"Es muss jedoch betont werden, dass die Neyman -Pearson -Theorie, nachdem er den Wert [der Daten] gesehen hatα) 100% Wahrscheinlichkeit oder (1 - -α) 100% Vertrauen. Seidenfelds Bemerkung scheint in einem (nicht ungewöhnlichen) Wunsch nach Neyman -Pearson -Konfidenzintervallen verwurzelt zu sein, um etwas zu liefern, das sie nicht legitimisch bieten können. Ein Maß für den Grad der Wahrscheinlichkeit, des Glaubens oder der Unterstützung, dass ein unbekannter Parameterwert in einem bestimmten Intervall liegt. Nach Savage (1962) kann die Wahrscheinlichkeit, dass ein Parameter in einem bestimmten Intervall liegt, als Maß für die endgültige Genauigkeit bezeichnet werden. Während ein Maß für die endgültige Präzision wünschenswert erscheint und das Vertrauen häufig (fälschlicherweise) als eine solche Maßnahme interpretiert wird, ist keine solche Interpretation erforderlich. Zugegeben, eine solche Fehlinterpretation wird durch das Wort "Vertrauen" gefördert. "

  • Ein Konfidenzniveau von 95% bedeutet nicht, dass 95% der Stichprobendaten innerhalb des Konfidenzintervalls liegen.
  • Ein Konfidenzintervall ist kein definitiver Bereich plausibler Werte für den Probenparameter, obwohl es häufig heuristisch als Bereich plausibler Werte genommen wird.
  • Ein bestimmtes Konfidenzniveau von 95%, der aus einem Experiment berechnet wurde, bedeutet nicht, dass eine 95% ige Wahrscheinlichkeit eines Probenparameters aus einer Wiederholung des Versuchs, das innerhalb dieses Intervalls fällt, eine Probenparameter besteht.[17]

Gegenbeispiele

Da die Konfidenzintervall-Theorie vorgeschlagen wurde, wurde eine Reihe von Gegenbedenken der Theorie entwickelt, um zu zeigen, wie die Interpretation von Konfidenzintervallen problematisch sein kann, zumindest wenn man sie naiv interpretiert.

Vertrauensverfahren für den einheitlichen Standort

Welch[22] präsentierte ein Beispiel, das deutlich den Unterschied zwischen der Theorie der Konfidenzintervalle und anderer Theorien der Intervallschätzung zeigt (einschließlich Fisher's problemlos Intervalle und Ziel Bayesian Intervalle). Robinson[23] nannte dieses Beispiel "[P] das bekannteste Gegenbeispiel für Neymans Version der Konfidenzintervalltheorie." Zu Welch zeigte es die Überlegenheit der Konfidenzintervalltheorie; Für Kritiker der Theorie zeigt es einen Mangel. Hier präsentieren wir eine vereinfachte Version.

Nehme an, dass sind unabhängige Beobachtungen von a Uniform(θ - 1/2, θ + 1/2) Verteilung. Dann das optimale 50% -Konfidenzverfahren[24] ist

Ein herzliches oder objektives Bayes'sche Argument kann verwendet werden, um die Intervallschätzung abzuleiten

Dies ist auch ein 50% ige Vertrauensverfahren. Welch zeigte, dass das erste Vertrauensverfahren die zweite dominiert, so Desiderata aus der Konfidenzintervalltheorie; für jeden die Wahrscheinlichkeit, dass das erste Verfahren enthält ist weniger als oder gleich Die Wahrscheinlichkeit, dass das zweite Verfahren enthält . Die durchschnittliche Breite der Intervalle aus dem ersten Verfahren ist geringer als die des zweiten. Daher wird das erste Verfahren unter klassischer Konfidenzintervall -Theorie bevorzugt.

Allerdings wann Intervalle aus dem ersten Verfahren sind garantiert den wahren Wert einzudämmen : Daher ist der nominale 50% -Konfidenzkoeffizient nicht mit der Unsicherheit verbunden, dass ein bestimmtes Intervall den wahren Wert enthält. Das zweite Verfahren hat diese Eigenschaft nicht.

Wenn das erste Verfahren ein sehr kurzes Intervall erzeugt, zeigt dies außerdem darauf hin, dass dies angezeigt wird sind sehr nahe beieinander und bieten daher nur die Informationen in einem einzigen Datenpunkt an. Das erste Intervall schließt jedoch fast alle vernünftigen Werte des Parameters aufgrund seiner kurzen Breite aus. Das zweite Verfahren hat diese Eigenschaft nicht.

Die beiden kontraintuitiven Eigenschaften des ersten Verfahrens-100% Abdeckung bei sind weit voneinander entfernt und fast 0% Abdeckung, wenn sind nahe beieinander - balancieren Sie durchschnittlich 50% Deckung. Obwohl das erste Verfahren optimal ist, bieten seine Intervalle weder eine Bewertung der Genauigkeit der Schätzung noch eine Bewertung der Unsicherheit, dass das Intervall den wahren Wert enthält.

Dieses Gegenbeispiel wird verwendet, um gegen naive Interpretationen von Konfidenzintervallen zu argumentieren. Wenn ein Vertrauensverfahren als Eigenschaften über die der nominalen Abdeckung (z. B. Verhältnis zur Präzision oder eine Beziehung zur Bayes'schen Inferenz) aufweist, müssen diese Eigenschaften nachgewiesen werden. Sie folgen nicht aus der Tatsache, dass ein Verfahren ein Vertrauensverfahren ist.

Vertrauensverfahren für ω2

Steiger[25] schlug eine Reihe von Vertrauensverfahren für gemeinsame Effektgröße Maßnahmen in Anova. Morey et al.[19] weisen darauf hin, dass einige dieser Vertrauensverfahren, einschließlich der für die, für ω2, haben das Eigentum, das als die F Die Statistik wird immer kleiner - mit allen möglichen Werten von Fehlanpassungen zu veranlassen ω2- Das Konfidenzintervall schrumpft und kann sogar nur den einzelnen Wert enthalten ω2= 0; Das heißt, der CI ist unendlich eng (dies tritt auf, wenn Für ein CI).

Dieses Verhalten steht im Einklang mit der Beziehung zwischen dem Vertrauensverfahren und Signifikanztests: wie F wird so klein, dass die Gruppe bedeutet, dass es viel näher zusammen ist, als wir zufällig erwarten würden. Ein Signifikanztest könnte auf die meisten oder alle Werte von hinweisen ω2. Daher ist das Intervall sehr eng oder sogar leer (oder durch eine von Steiger vorgeschlagene Konvention nur 0). Dies tut jedoch nicht Geben Sie an, dass die Schätzung von ω2 ist sehr präzise. In gewissem Sinne zeigt es das Gegenteil: dass die Vertrauenswürdigkeit der Ergebnisse selbst im Zweifel sein kann. Dies steht im Widerspruch zur gemeinsamen Interpretation von Konfidenzintervallen, dass sie die Genauigkeit der Schätzung aufdecken.

Geschichte

Konfidenzintervalle wurden von eingeführt von Jerzy Neyman 1937.[26] Statistiker übernahmen schnell die Idee, aber die Adoption von Wissenschaftlern war allmählicher. Einige Autoren in medizinischen Zeitschriften förderten bereits in den 1970er Jahren Konfidenzintervalle. Trotzdem wurden Konfidenzintervalle bis zum folgenden Jahrzehnt selten verwendet, als sie schnell Standard wurden.[27] In den späten 1980er Jahren verlangten medizinische Zeitschriften die Berichterstattung über Konfidenzintervalle.[28]

Siehe auch

Konfidenzintervall für bestimmte Verteilungen

Verweise

  1. ^ Zar, Jerrold H. (199). Biostatistische Analyse (4. Aufl.). Upper Saddle River, N.J.: Prentice Hall. S. 43–45. ISBN 978-0130815422. OCLC 39498633.
  2. ^ a b c Dekking, Frederik Michel; Kraaikamp, ​​Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). "Eine moderne Einführung in Wahrscheinlichkeit und Statistik". Springer Texte in Statistiken. doi:10.1007/1-84628-168-7. ISBN 978-1-85233-896-1. ISSN 1431-875X.
  3. ^ Illowsky, Barbara. Einführungsstatistik. Dean, Susan L., 1945-, Illowsky, Barbara., OpenStax College. Houston, Texas. ISBN 978-1-947172-05-0. OCLC 899241574.
  4. ^ Hazra, Avijit (Oktober 2017). "Verwenden des Konfidenzintervalls zuversichtlich". Journal of Thoracic Disease. 9 (10): 4125–4130. doi:10.21037/jtd.2017.09.14. ISSN 2072-1439. PMC 5723800. PMID 29268424.
  5. ^ Khare, Vikas; Nema, Savita; Baredar, Prashant (2020). Modellierung und Simulation der Ozeanergie mit Big Data Computational Intelligence für die Systemoptimierung und Gitterintegration. ISBN 978-0-12-818905-4. OCLC 1153294021.
  6. ^ George G. Roussas (1997) Ein Kurs in mathematischer Statistik, 2. Auflage, Academic Press, p397
  7. ^ Cox D. R., Hinkley D.V. (1974) Theoretische Statistik, Chapman & Hall, p. 210
  8. ^ Cox D. R., Hinkley D.V. (1974) Theoretische Statistik, Chapman & Hall, Abschnitt 7.2 (III)
  9. ^ Rees. D.G. (2001) Wesentliche Statistiken, 4. Ausgabe, Chapman und Hall/CRC. ISBN1-58488-007-4 (Abschnitt 9.5)
  10. ^ Cox D. R., Hinkley D.V. (1974) Theoretische Statistik, Chapman & Hall, P49, P209
  11. ^ a b Neyman, J. (1937). "Umriss einer Theorie der statistischen Schätzung basierend auf der klassischen Wahrscheinlichkeitstheorie". Philosophische Transaktionen der königlichen Gesellschaft a. 236 (767): 333–380. Bibcode:1937RSPTA.236..333n. doi:10.1098/rsta.1937.0005. JStor 91337.
  12. ^ Cox D. R., Hinkley D.V. (1974) Theoretische Statistik, Chapman & Hall, S. 214, 225, 233
  13. ^ Kalinowski, Pawel (2010). "Identifizierung von Missverständnissen über Konfidenzintervalle" (PDF). Abgerufen 2021-12-22.
  14. ^ "Archivierte Kopie" (PDF). Archiviert von das Original (PDF) am 2016-03-04. Abgerufen 2014-09-16.{{}}: CS1 Wartung: Archiviertes Kopie als Titel (Link)
  15. ^ Hoekstra, R., R. D. Morey, J.N. Rouder und E-J. Wagenmaker, 2014. Robuste Fehlinterpretation von Konfidenzintervallen. Psychonomic Bulletin Review, in Press. [1]
  16. ^ Das Verständnis der Wissenschaftler für Konfidenzintervalle verursacht kein Vertrauen, Wissenschaftsnachrichten, 3. Juli 2014
  17. ^ a b Grönland, Sander; Senn, Stephen J.; Rothman, Kenneth J.; Carlin, John B.; Poole, Charles; Goodman, Steven N.; Altman, Douglas G. (April 2016). "Statistische Tests, p -Werte, Konfidenzintervalle und Macht: Ein Leitfaden zu Fehlinterpretationen". Europäisches Journal für Epidemiologie. 31 (4): 337–350. doi:10.1007/s10654-016-0149-3. ISSN 0393-2990. PMC 4877414. PMID 27209009.
  18. ^ Helske, Jouni; Helske, Satu; Cooper, Matthew; Ynnerman, Anders; Besancon, Lonni (2021-08-01). "Kann die Visualisierung dichotomes Denken lindern? Auswirkungen visueller Darstellungen auf den Cliff -Effekt". IEEE -Transaktionen zur Visualisierung und Computergrafik. Institut für Elektro- und Elektronikingenieure (IEEE). 27 (8): 3397–3409. Arxiv:2002.07671. doi:10.1109/tvcg.2021.3073466. ISSN 1077-2626. PMID 33856998. S2CID 233230810.
  19. ^ a b Morey, R. D.; Hoekstra, R.; Rouder, J. N.; Lee, M. D.; Wagenmacher, E.-J. (2016). "Der Irrtum, Vertrauen in Konfidenzintervalle zu setzen". Psychonomisches Bulletin & Review. 23 (1): 103–123. doi:10.3758/S13423-015-0947-8. PMC 4742505. PMID 26450628.
  20. ^ "1.3.5.2. Vertrauensgrenzen für den Mittelwert". Nist.gov. Archiviert von das Original am 2008-02-05. Abgerufen 2014-09-16.
  21. ^ Mayo, D. G. (1981) "Zur Verteidigung der Neyman -Pearson -Theorie der Konfidenzintervalle", Philosophie der Wissenschaft, 48 (2), 269–280. JStor 187185
  22. ^ Welch, B. L. (1939). "Über Vertrauensgrenzen und ausreichend unter Bezugnahme auf Parameter des Standorts". Die Annalen der mathematischen Statistik. 10 (1): 58–69. doi:10.1214/AOMS/1177732246. JStor 2235987.
  23. ^ Robinson, G. K. (1975). "Einige Gegenbeispiele zur Theorie der Konfidenzintervalle". Biometrika. 62 (1): 155–161. doi:10.2307/2334498. JStor 2334498.
  24. ^ Pratt, J. W. (1961). "Buchbesprechung: Testen statistischer Hypothesen von E. L. Lehmann". Zeitschrift der American Statistical Association. 56 (293): 163–167. doi:10.1080/01621459.1961.10482103. JStor 2282344.
  25. ^ Steiger, J. H. (2004). "Über den F -Test hinaus: Effektgrößenkonfidenzintervalle und Tests der engen Anpassung in die Varianz- und Kontrastanalyse". Psychologische Methoden. 9 (2): 164–182. doi:10.1037/1082-989x.9.2.164. PMID 15137887.
  26. ^ [Neyman, J., 1937. Gliederung einer Theorie der statistischen Schätzung basierend auf der klassischen Wahrscheinlichkeitstheorie. Philosophische Transaktionen der Royal Society of London. Serie A, Mathematical and Physical Sciences, 236 (767), S. 333-380]
  27. ^ Altman, Douglas G. (1991). "Statistiken in medizinischen Zeitschriften: Entwicklungen in den 1980er Jahren". Statistiken in der Medizin. 10 (12): 1897–1913. doi:10.1002/SIM.4780101206. ISSN 1097-0258.
  28. ^ Sandercock, Peter A.G. (2015). "Kurze Geschichte der Konfidenzintervalle". Streicheln. Ovid Technologies (Wolters Kluwer Health). 46 (8): E184-7. doi:10.1161/strokeaha.115.007750. ISSN 0039-2499. PMID 26106115.

Literaturverzeichnis

Externe Links