Machtgesetz

Ein Beispiel für Power-Law-Graphen, das die Rangliste der Popularität zeigt. Rechts ist die langen Schwanzund links sind die wenigen, die dominieren (auch als das bekannt 80–20 Regel).

Im Statistiken, a Machtgesetz ist ein Funktionsbeziehung zwischen zwei Mengen, wo a relative Veränderung In einer Menge führt zu einer proportionalen relativen Änderung der anderen Menge, unabhängig von der Anfangsgröße dieser Größen: Eine Menge variiert als a Energie eines anderen. In Anbetracht der Fläche eines Quadrats in Bezug auf die Länge seiner Seite wird beispielsweise die Fläche mit einem Faktor vier multipliziert.[1]

Empirische Beispiele

Die Verteilungen einer Vielzahl von physischen, biologischen und künstlichen Phänomenen folgen ungefähr einem Stromgesetz über eine Vielzahl von Größen Mond und von Sonneneruptionen,[2] Das Futtersfuttermuster verschiedener Arten,[3] Die Größen der Aktivitätsmuster neuronaler Populationen,[4] Die Frequenzen von Wörter In den meisten Sprachen Frequenzen von Familiennamen, das Artenreichtum in Kladen von Organismen,[5] die Größen von Stromausfälle, Vulkanausbrüche,[6] menschliche Urteile der Stimulusintensität[7][8] und viele andere Mengen.[9] Nur wenige empirische Verteilungen passen für alle ihre Werte ein Machtgesetz, sondern folgen einem Machtgesetz im Schwanz.Akustische Dämpfung Folgt Frequenzstrom-Schwiegereltern in breiten Frequenzbändern für viele komplexe Medien. Allometrische Skalierungsgesetze Für Beziehungen zwischen biologischen Variablen gehören zu den bekanntesten Machtgesetzfunktionen in der Natur.

Eigenschaften

Skalieren Invarianz

Ein Attribut von Machtgesetzen ist ihr skalieren Invarianz. Mit einer Beziehung das Argument skalieren durch einen konstanten Faktor verursacht nur eine proportionale Skalierung der Funktion selbst. Das ist,

wo bezeichnet direkte Verhältnismäßigkeit. Das heißt, Skalierung durch eine Konstante Multipliziert einfach die ursprüngliche Power-Law-Beziehung mit der Konstante . Daraus folgt, dass alle Machtgesetze mit einem bestimmten skalierenden Exponenten gleichwertig zu konstanten Faktoren entsprechen, da es sich nur um eine skalierte Version der anderen handelt. Dieses Verhalten erzeugt die lineare Beziehung, wenn Logarithmen von beiden genommen werden und und die geraden Linie auf der Log -Log -Diagramm wird oft das genannt Unterschrift eines Machtgesetzes. Bei realen Daten ist eine solche Geradheit eine notwendige, aber nicht ausreichende Bedingung für die Daten nach einer Potenzgesetz-Beziehung. In der Tat gibt es viele Möglichkeiten, endliche Datenmengen zu generieren, die dieses Signaturverhalten nachahmen, aber in ihrer asymptotischen Grenze sind keine echten Machtgesetze (z. B. wenn der Generierungsprozess einiger Daten a folgt a Log-normale Verteilung). So genau passend und Überprüfung der Stromversuche Modelle ist ein aktives Forschungsbereich in Statistiken. siehe unten.

Mangel an genau definierter Durchschnittswert

Ein Power-Law hat eine gut definierte bedeuten Über nur wenn und es hat eine endliche Varianz nur wenn ; Die am meisten identifizierten Machtgesetze in der Natur haben Exponenten, so dass der Mittelwert gut definiert ist, aber die Varianz nicht, was bedeutet, dass sie in der Lage sind, zu fähig zu werden schwarzer Schwan Verhalten.[2] Dies ist im folgenden Gedankenexperiment zu sehen:[10] Stellen Sie sich ein Zimmer mit Ihren Freunden vor und schätzen Sie das durchschnittliche monatliche Einkommen im Raum. Jetzt stellen Sie sich das vor reichste Person der Welt Eintritt in den Raum mit einem monatlichen Einkommen von ca. 1 Milliarde US$. Was passiert mit dem durchschnittlichen Einkommen im Raum? Das Einkommen wird gemäß einem Stromversetz verteilt, der als das bekannt ist Pareto -Verteilung (Zum Beispiel wird das Nettovermögen der Amerikaner nach einem Machtgesetz mit einem Exponenten von 2 verteilt).

Einerseits macht es es falsch, herkömmliche Statistiken anzuwenden, auf die basiert Varianz und Standardabweichung (wie zum Beispiel Regressionsanalyse).[11] Andererseits ermöglicht dies auch kosteneffiziente Interventionen.[10] Angesichts der Tatsache, dass der Autoabgase nach einem Stromversetz unter Autos verteilt ist (nur sehr wenige Autos tragen zur größten Kontamination bei), reichen es aus, diese sehr wenigen Autos von der Straße von der Straße zu beseitigen, um den Gesamtabgas erheblich zu reduzieren.[12]

Der Median existiert jedoch: für ein Machtgesetz xkmit Exponent , es braucht den Wert 21/((k - 1)xMindest, wo xMindest ist der Mindestwert, für den das Machtgesetz gilt.[2]

Universalität

Die Äquivalenz der Machtgesetze mit einem bestimmten Skalierungsponenten kann einen tieferen Ursprung in den dynamischen Prozessen haben, die die Potenzgesetz-Beziehung erzeugen. In der Physik zum Beispiel, Phasenübergänge In thermodynamischen Systemen sind mit der Entstehung von Stromverteilungen bestimmter Größen verbunden, deren Exponenten als die bezeichnet werden Kritische Exponenten vom System. Verschiedene Systeme mit denselben kritischen Exponenten - dh, die ein identisches Skalierungsverhalten zeigen, wie sie sich nähern kritisch- kann durch gezeigt werden über Renormalisierungsgruppe Theorie, um die gleiche grundlegende Dynamik zu teilen. Zum Beispiel das Verhalten von Wasser und CO2 An ihren Siedepunkten fallen in derselben Universalitätsklasse, weil sie identische kritische Exponenten haben.[Klarstellung erforderlich] Tatsächlich werden fast alle Materialphasenübergänge durch eine kleine Reihe von Universalitätsklassen beschrieben. Ähnliche Beobachtungen wurden für verschiedene, wenn auch nicht so umfassend, gemacht selbst organisiert kritisch Systeme, wo der kritische Punkt des Systems ein ist Attraktor. Formal wird diese Teile der Dynamik als bezeichnet als Universalitätund Systeme mit genau den gleichen kritischen Vertretern sollen demselben gehören Universalitätsklasse.

Power-Law-Funktionen

Das wissenschaftliche Interesse an Machtversorgungsbeziehungen ergibt sich teilweise auf die Leichtigkeit, mit der bestimmte allgemeine Klassen von Mechanismen sie erzeugen.[13] Die Demonstration einer Leistungsschulenbeziehung in einigen Daten kann auf bestimmte Arten von Mechanismen hinweisen, die dem fraglichen natürlichen Phänomen zugrunde liegen und auf eine tiefe Verbindung zu anderen, scheinbar nicht verwandten Systemen hinweisen können.[14] siehe auch Universalität Oben. Die Allgegenwart der Machtverschärfen in der Physik ist teilweise auf Dimensionsbeschränkungen, während in Komplexe SystemeEs wird oft angenommen stochastische Prozesse. Einige bemerkenswerte Beispiele für Machtgesetze sind Paretos Gesetz der Einkommensverteilung, strukturelle Selbstähnlichkeit von Fraktale, und Skalierungsgesetze in biologischen Systemen. Die Forschung zu den Ursprüngen der Machtverhältnisse und der Bemühungen, sie in der realen Welt zu beobachten und zu validieren, ist ein aktives Thema der Forschung in vielen Bereichen der Wissenschaft, einschließlich Physik, Informatik, Linguistik, Geophysik, Neurowissenschaften, Systematik, Soziologie, Wirtschaft und mehr.

Ein Großteil des jüngsten Interesses an Machtgesetzen ergibt sich jedoch aus der Studie von Wahrscheinlichkeitsverteilungen: Die Verteilungen einer Vielzahl von Mengen scheinen der Stromversorgungsform zumindest in ihrem oberen Schwanz zu folgen (große Ereignisse). Das Verhalten dieser großen Ereignisse verbindet diese Mengen mit der Untersuchung von Theorie der großen Abweichungen (auch genannt Extremwerttheorie), was die Häufigkeit von extrem seltenen Ereignissen wie berücksichtigt Aktienmarktunfälle und groß Naturkatastrophen. In erster Linie wird der Name "Machtgesetz" verwendet.

In empirischen Kontexten eine Annäherung an eine Machtschule Beinhaltet oft einen Abweichungsbegriff , die Unsicherheit in den beobachteten Werten (möglicherweise Mess- oder Stichprobenfehlern) darstellen oder eine einfache Möglichkeit für Beobachtungen zur Abweichung von der Leistungsgesetzfunktion darstellen können (möglicherweise für stochastisch Gründe dafür):

Mathematisch kann ein striktes Machtgesetz keine Wahrscheinlichkeitsverteilung sein, sondern eine Verteilung, die verkürzt wird Leistungsfunktion ist möglich: zum wo der Exponent (Griechischer Brief Alpha, nicht verwechselt mit Skalierungsfaktor oben verwendet) ist größer als 1 (ansonsten hat der Schwanz unendliche Fläche), der Mindestwert wird sonst benötigt, sonst hat die Verteilung unendlich wie x nähert sich 0 und die Konstante C ist ein Skalierungsfaktor, um sicherzustellen, dass die Gesamtfläche 1 beträgt, wie durch eine Wahrscheinlichkeitsverteilung erforderlich. Häufiger verwendet man ein asymptotisches Machtgesetz - eines, das nur in der Grenze wahr ist; sehen Power-Law-Wahrscheinlichkeitsverteilungen unten für Details. Typischerweise fällt der Exponent in den Bereich , wenn auch nicht immer.[9]

Beispiele

In der Physik (z. B. Sandpile-Lawinen), der Biologie (z. B. Aussterben und Körpermasse) und den Sozialwissenschaften (z. B. Stadtgrößen und Einkommen) wurden mehr als hundert Power-Law-Verteilungen identifiziert.[15] Unter ihnen sind:

Astronomie

Physik

Psychologie

Biologie

Meteorologie

  • Die Größe von Regenshowerzellen,[25] Energieabteilung in Zyklonen,[26] und die Durchmesser von Dust Devils auf Erden und Mars [27]

Allgemeine Wissenschaft

Mathematik

Wirtschaft

Finanzen

  • Die mittlere absolute Änderung der logarithmischen Mittelpreise[40]
  • Anzahl der Zecken zählt im Laufe der Zeit
  • Größe des maximalen Preiszugs
  • Durchschnittliche Wartezeit von a Richtungsänderung[41]
  • Durchschnittliche Wartezeit von einem Überschwingen

Varianten

Gesetzes Gesetz gebrochen

Einige Modelle der anfängliche Massenfunktion Verwenden Sie ein gebrochenes Machtgesetz; Hier Kroupa (2001) in Rot.

Ein gebrochenes Machtgesetz ist a stückweise Funktion, bestehend aus zwei oder mehr Machtgesetzen, kombiniert mit einer Schwelle. Zum Beispiel mit zwei Machtgesetzen:[42]

zum
.

Machtgesetz mit exponentiellem Grenzwert

Ein Machtgesetz mit einem exponentiellen Grenzwert ist einfach ein Machtgesetz, das mit einer exponentiellen Funktion multipliziert wird:[9]

Gebogenes Machtgesetz

[43]

Power-Law-Wahrscheinlichkeitsverteilungen

Im lockereren Sinne eine Machtschule Wahrscheinlichkeitsverteilung ist eine Verteilung, deren Dichtefunktion (oder Massenfunktion im diskreten Fall) die Form für große Werte von hat ,[44]

wo , und ist ein Langsam variierende Funktion, was jede Funktion ist, die erfüllt für jeden positiven Faktor . Diese Eigenschaft von folgt direkt aus der Anforderung, dass asymptotisch invariant skalieren; so die Form von steuert nur die Form und die begrenzte Ausdehnung des unteren Schwanzes. Zum Beispiel wenn, wenn ist die konstante Funktion, dann haben wir ein Machtgesetz, das für alle Werte von gilt . In vielen Fällen ist es zweckmäßig, eine untere Grenze anzunehmen von dem das Gesetz gilt. Kombinieren dieser beiden Fälle und wo ist eine kontinuierliche Variable, das Machtgesetz hat die Form der Pareto -Verteilung

wo der Präfaktor zu ist der Normalisierung der Konstante. Wir können jetzt mehrere Eigenschaften dieser Verteilung berücksichtigen. Zum Beispiel seine ITS Momente werden gegeben von

das ist nur gut definiert für . Das heißt, alle Momente Abweichung: Wann Die durchschnittlichen und alle Momente höherer Ordnung sind unendlich; Wenn , der Mittelwert existiert, aber die Varianz und die Momente höherer Ordnung sind unendlich usw. Für endliche Größe, die aus einer solchen Verteilung stammen, impliziert dieses Verhalten, dass die zentraler Moment Schätzer (wie der Mittelwert und die Varianz) für divergierende Momente werden niemals konvergieren - wenn mehr Daten akkumuliert werden, wachsen sie weiter. Diese Wahrscheinlichkeitsverteilungen der Power-Law-Wahrscheinlichkeit werden ebenfalls genannt Pareto-Typ-Verteilungen, Verteilungen mit Pareto -Schwänzen oder Verteilungen mit regelmäßig unterschiedlichen Schwänzen.

Eine Modifikation, die die obige allgemeine Form nicht erfüllt, mit einem exponentiellen Grenzwert,[9] ist

In dieser Verteilung der exponentielle Zerfallterm Begriff Überfordert schließlich das Verhalten des Leistungsschatzes bei sehr großen Werten von . Diese Verteilung skaliert nicht und ist daher nicht asymptotisch als Machtgesetz; Es skaliert jedoch ungefähr eine endliche Region vor dem Cutoff. Die obige reine Form ist eine Untergruppe dieser Familie mit . Diese Verteilung ist eine häufige Alternative zur asymptotischen Leistungsverteilung, da sie natürlich endliche Effekte erfasst.

Das Tweedie -Verteilungen sind eine Familie statistischer Modelle, die durch gekennzeichnet sind durch Schließung unter additiver und reproduktiver Faltung sowie unter Skalentransformation. Folglich drücken diese Modelle alle eine Potenzgesetzbeziehung zwischen der Varianz und dem Mittelwert aus. Diese Modelle spielen eine grundlegende Rolle als Mathematik -Schwerpunkte Konvergenz Ähnlich der Rolle, die die Normalverteilung hat als Fokus in der Zentralgrenze Theorem. Dieser Konvergenz-Effekt erklärt, warum sich das Varianz-zu-Mean-Machtgesetz in natürlichen Prozessen so stark manifestiert, wie bei Taylors Gesetz in der Ökologie und mit Schwankungsskalierung[45] in der Physik. Es kann auch gezeigt werden, dass dieses Varianz-zu-Mean-Machtgesetz, wenn er von der gezeigt wird Methode zur Erweiterung von Behälternimpliziert das Vorhandensein von 1//f Lärm und das 1//f Lärm kann als Folge davon auftreten Tweedie -Konvergenz -Effekt.[46]

Grafische Methoden zur Identifizierung

Obwohl ausgefeiltere und robustere Methoden vorgeschlagen wurden, sind die am häufigsten verwendeten grafischen Methoden zur Identifizierung von Leistungsgesetzwahrscheinlichkeitsverteilungen unter Verwendung von zufälligen Proben pareto quantilquantile Diagramme (oder Pareto Q - Q -Diagramme), mittlere Restlebensdiagramme[47][48] und Log -Log -Diagramme. Eine andere, robustere grafische Methode verwendet Bündel von Restquantilfunktionen.[49] (Bitte beachten Sie, dass Power-Law-Verteilungen auch als Pareto-Typ-Verteilungen bezeichnet werden.) Hier wird angenommen, dass eine Zufallsstichprobe aus einer Wahrscheinlichkeitsverteilung erhalten wird und dass wir wissen möchten, ob der Schwanz der Verteilung einem Leistungsgesetz folgt (Mit anderen Worten, wir möchten wissen, ob die Verteilung einen "Pareto -Schwanz" hat). Hier heißt die Zufallsprobe "die Daten".

Pareto Q -Q -Diagramme vergleichen die Quantile der logarithmisch transformierten Daten an die entsprechenden Quantile einer Exponentialverteilung mit dem Mittelwert 1 (oder an die Quantile einer Standard-Pareto-Verteilung), indem er erstere gegen letztere aufgetragen wird. Wenn der resultierende Streudiagramm darauf hindeutet, dass die auf den Aufzeichnungspunkte "asymptotisch konvergierten" zu einer geraden Linie eine Stromverteilung vermutet werden sollten. Eine Einschränkung der Pareto -Q -Q -Diagramme ist, dass sie sich schlecht verhalten, wenn der Schwanzindex (Auch der Pareto -Index genannt) liegt in der Nähe von 0, da Pareto -Q -Q -Diagramme nicht so ausgelegt sind, dass Verteilungen mit langsam variierenden Schwänzen identifiziert werden.[49]

Andererseits besteht in seiner Version zur Identifizierung von Wahrscheinlichkeitsverteilungen der Stromversorgungswahrscheinlichkeit das mittlere Restlebensdiagramm aus der ersten logarithmischen Übertragung der Daten und dann den Durchschnitt dieser logarithmischen Daten, die höher sind als die i-TH -Statistik gegen die i-TH -Statistik, für i= 1, ...,n, wobei n die Größe der Zufallsstichprobe hat. Wenn der resultierende Streudiagramm darauf hindeutet, dass die auf den Aufzeichnungspunkte tendierten Punkte dazu neigen, über eine horizontale gerade Linie zu "stabilisieren", sollte eine Stromverteilung vermutet werden. Da die mittlere Verschwörung des verbleibenden Lebens sehr empfindlich gegenüber Ausreißern ist (es ist nicht robust), erzeugt sie normalerweise Diagramme, die schwer zu interpretieren sind; Aus diesem Grund werden solche Diagramme normalerweise Hill Horror Plots genannt [50]

Eine geraden Linie auf einem Protokoll-Log-Diagramm ist erforderlich, aber unzureichende Beweise für Power-Laws, die Steigung der geraden Linie entspricht dem Exponent des Leistungsgesetzes.

Log -Log -Diagramme sind eine alternative Möglichkeit, den Schwanz einer Verteilung mit einer Zufallsstichprobe grafisch zu untersuchen. Es muss jedoch Vorsicht geboten werden, da ein Protokoll-Log-Diagramm erforderlich ist, aber unzureichende Beweise für eine Machtgesetzbeziehung, da viele Nicht-Power-Law-Verteilungen als geraden Linien auf einem Protokoll-Log-Diagramm erscheinen.[9][51] Diese Methode besteht darin, den Logarithmus eines Schätzers der Wahrscheinlichkeit zu zeichnen, dass eine bestimmte Anzahl der Verteilung im Vergleich zum Logarithmus dieser bestimmten Zahl auftritt. Normalerweise ist dieser Schätzer der Anteil der Male, in denen die Zahl im Datensatz auftritt. Wenn die Punkte im Diagramm dazu neigen, für große Zahlen in der X-Achse zu einer geraden Linie zu "konvergieren", kommt der Forscher zu dem Schluss, dass die Verteilung einen Stromverskretär-Schwanz hat. Beispiele für die Anwendung dieser Arten von Handlungen wurden veröffentlicht.[52] Ein Nachteil dieser Diagramme ist, dass sie, damit sie zuverlässige Ergebnisse liefern, enorme Datenmengen erfordern. Darüber hinaus sind sie nur für diskrete (oder gruppierte) Daten geeignet.

Eine weitere grafische Methode zur Identifizierung von Power-Law-Wahrscheinlichkeitsverteilungen unter Verwendung von zufälligen Stichproben wurde vorgeschlagen.[49] Diese Methodik besteht darin, a zu zeichnen Bündel für die logarithmische Probe. Die Bündelmethode basiert ursprünglich als Instrument zur Erforschung der Existenz von Momenten und der Momentgenerierungsfunktion unter Verwendung von zufälligen Stichproben Quantilfunktionen (RQFS), auch restliche Perzentilfunktionen genannt,[53][54][55][56][57][58][59] Dies sorgt für eine vollständige Charakterisierung des Schwanzverhaltens vieler bekannter Wahrscheinlichkeitsverteilungen, einschließlich Stromverteilungen, Verteilungen mit anderen Arten von schweren Schwänzen und sogar Verteilungen mit nicht schwerer Schwanz. Bündeldiagramme haben nicht die Nachteile von Pareto -Q -Q -Diagrammen, mittleren Restlebensdiagrammen und log -log -Diagramme (sie sind für Ausreißer robust und ermöglichen visuell identifizierende Leistungsgesetze mit kleinen Werten von und verlangen Sie nicht die Erfassung vieler Daten). Darüber hinaus können andere Arten von Schwanzverhalten unter Verwendung von Bündeldiagrammen identifiziert werden.

Plotting Power-Law-Verteilungen

Im Allgemeinen werden die Verteilungen des Stromversorgungsverteilungen auf doppelt logarithmischen Achsen aufgetragen, die den oberen Schwanzbereich hervorheben. Der bequemste Weg, dies zu tun, ist über die (Komplementär) kumulative Verteilung (CCDF) Das heißt, die Überlebensfunktion, Anwesend

Die CDF ist auch eine Leistungsstrafe, jedoch mit einem kleineren Skalierungsvertretung. Für Daten ist eine äquivalente Form des CDF der Rangfrequenzansatz, bei dem wir zuerst die sortieren beobachtete Werte in aufsteigender Reihenfolge und zeichnen Sie sie gegen den Vektor auf .

Obwohl es zweckmäßig sein kann, die Daten zu protokollieren oder die Wahrscheinlichkeitsdichte (Mass) -Funktion direkt zu glätten, führen diese Methoden eine implizite Verzerrung der Darstellung der Daten ein und sollten daher vermieden werden.[9][60] Die Überlebensfunktion hingegen ist robuster gegenüber (aber nicht ohne) solchen Verzerrungen in den Daten und bewahrt die lineare Signatur für doppelt logarithmische Achsen. Obwohl eine Überlebensfunktionsdarstellung gegenüber der des PDF bevorzugt wird und gleichzeitig ein Leistungsgesetz mit der linearen Methode am kleinsten Quadrat anpasst, ist sie nicht ohne mathematische Ungenauigkeit. Bei der Schätzung der Exponenten einer Leistungsrechtsverteilung wird daher ein maximaler Wahrscheinlichkeitsschätzer empfohlen.

Schätzung des Exponenten aus empirischen Daten

Es gibt viele Möglichkeiten zur Schätzung des Wertes des Skalierungsponenten für einen Power-Law-Schwanz, aber nicht alle ergeben unvoreingenommene und konsequente Antworten. Einige der zuverlässigsten Techniken basieren häufig auf der Methode von Maximale Wahrscheinlichkeit. Alternative Methoden basieren häufig auf einer linearen Regression entweder auf der Log-Log-Wahrscheinlichkeit, der kumulativen Verteilungsfunktion der logarithmischen Log-Log oder auf Protokollbinnendaten. Diese Ansätze sollten jedoch vermieden werden, da sie alle zu stark voreingenommenen Schätzungen der führen können Exponent skalieren.[9]

Maximale Wahrscheinlichkeit

Für reale Wertschöpfung, unabhängig und identisch verteilt Daten, wir passen eine Stromverteilung des Formulars an

zu den Daten , wo der Koeffizient ist enthalten, um sicherzustellen, dass die Verteilung ist normalisiert. Bei der Wahl für Die Log -Likelihood -Funktion wird:

Das Maximum dieser Wahrscheinlichkeit wird durch Differenzierung in Bezug auf Parameter gefunden das Ergebnis auf Null setzen. Bei der Neuordnung ergibt dies die Schätzungsgleichung:

wo sind die Datenpunkte .[2][61] Dieser Schätzer weist eine kleine endliche Stichprobengröße von Ordnung auf , was klein ist, wenn n> 100. Ferner ist der Standardfehler der Schätzung . Dieser Schätzer entspricht der Bevölkerung Hügelschätzer aus Quantitative Finanzen und Extremwerttheorie.

Für eine Reihe von n Integer-bewertete Datenpunkte wieder wo jeder Der Exponent der maximalen Wahrscheinlichkeit ist die Lösung für die transzendentale Gleichung

wo ist der unvollständige Zeta -Funktion. Die Unsicherheit in dieser Schätzung folgt der gleichen Formel wie für die kontinuierliche Gleichung. Die beiden Gleichungen für jedoch sind weder äquivalent, und die kontinuierliche Version sollte weder auf diskrete Daten oder umgekehrt angewendet werden.

Darüber hinaus erfordern diese beiden Schätzer die Wahl von . Für Funktionen mit einem nicht trivialen Funktion, wählen Zu klein erzeugt eine signifikante Verzerrung in Wenn Sie es zu groß wählen, erhöht sich die Unsicherheit in und reduziert die Statistische Macht unseres Modells. Im Allgemeinen die beste Wahl von hängt stark von der jeweiligen Form des unteren Schwanzes ab, dargestellt durch Oben.

Mehr über diese Methoden und die Bedingungen, unter denen sie verwendet werden können, finden sich in.[9] Darüber hinaus bietet dieser umfassende Übersichtsartikel Nutzbarer Code (Matlab, Python, R und C ++) Für die Schätz- und Testroutinen für Power-Law-Verteilungen.

Kolmogorov -Smirnov -Schätzung

Eine andere Methode zur Schätzung des Exponenten des Power-Law unabhängig und identisch verteilt (IID) Daten, verwendet die Minimierung der Kolmogorov -Smirnov -Statistik, , zwischen den kumulativen Verteilungsfunktionen der Daten und dem Machtgesetz:

mit

wo und Bezeichnen Sie die CDFs der Daten und das Machtgesetz mit Exponent , beziehungsweise. Da diese Methode keine IID-Daten annimmt, bietet sie einen alternativen Weg, um den Exponenten für die Leistungsschwere für Datensätze zu bestimmen, in denen die zeitliche Korrelation nicht ignoriert werden kann.[4]

Zwei-Punkte-Anpassungsmethode

Dieses Kriterium[Klarstellung erforderlich] kann für die Schätzung des Exponenten des Power-Law-Exponents im Fall von freien freien Verteilungen angewendet werden und liefert eine konvergentere Schätzung als die maximale Wahrscheinlichkeitsmethode. Es wurde angewendet, um Wahrscheinlichkeitsverteilungen von Frakturöffnungen zu untersuchen. In einigen Kontexten wird die Wahrscheinlichkeitsverteilung beschrieben, nicht durch die Verteilungsfunktion, bis zum kumulative Frequenz eines Eigentums X, definiert als Anzahl der Elemente pro Meter (oder Flächeneinheit, Sekunde usw.), für die X>x gilt, wo x ist eine variable reelle Zahl. Als Beispiel die kumulative Verteilung der Frakturöffnung,, Xfür eine Stichprobe von N Elemente sind definiert als „die Anzahl der Frakturen pro Meter mit einer Apertur größer als x . Die Verwendung der kumulativen Frequenz hat einige Vorteile, z. Es ermöglicht es, die gleichen Diagrammdaten aufzulegen, die aus Probenlinien unterschiedlicher Längen in verschiedenen Skalen (z. B. aus dem Aufschluss und aus dem Mikroskop) gesammelt wurden.

Machtgesetze validieren

Obwohl Power-Law-Beziehungen aus vielen theoretischen Gründen attraktiv sind, erfordert das Nachweisen, dass Daten tatsächlich einer Potenzgesetz-Beziehung folgen, als nur ein bestimmtes Modell an die Daten anzupassen.[29] Dies ist wichtig für das Verständnis des Mechanismus, der die Verteilung hervorruft: Obenmarkt ähnliche Verteilungen können aus signifikant unterschiedlichen Gründen auftreten, und verschiedene Modelle ergeben unterschiedliche Vorhersagen, wie z. B. Extrapolation.

Zum Beispiel, logarithmische Verteilungen werden oft mit Power-Law-Verteilungen verwechselt:[62] Ein aus einer lognormaler Verteilung entnommener Datensatz ist für große Werte ungefähr linear (entsprechend dem oberen Schwanz des logarithmischen Lognormales, der nahe an einem Leistungsgesetz liegt)[Klarstellung erforderlich]Aber für kleine Werte fällt der logarithmische Anormalen erheblich ab (nach unten), was dem unteren Schwanz des logaritischen Lognormalens klein ist (es gibt nur sehr wenige kleine Werte und nicht viele kleine Werte in einem Leistungsgesetz).

Zum Beispiel, Gibrats Gesetz Über proportionale Wachstumsprozesse erzeugen Verteilungen, die logarithmisch anormal sind, obwohl ihre Protokoll -Log -Diagramme über einen begrenzten Bereich linear aussehen. Eine Erklärung dafür ist, dass zwar der Logarithmus der lognormale Dichtefunktion ist quadratisch in Protokoll(x), die eine "Bogen" -Form in einem log -log -Diagramm ergeben, wenn der quadratische Term relativ zum linearen Term klein ist, kann das Ergebnis nahezu linear erscheinen, und das logarithmische Verhalten ist nur sichtbar, wenn der quadratische Term dominiert, was möglicherweise erheblich erforderlich ist, was erheblich erforderlich ist Weitere Daten. Daher kann ein log-log-Diagramm, das leicht nach unten "beugt" ist, eine logarithmische Normalverteilung widerspiegeln-kein Machtgesetz.

Im Allgemeinen können viele alternative funktionale Formen in gewissem Maße einer Stromversorgungsform folgen.[63] Stumpf & Porter (2012) schlug vor, die empirische kumulative Verteilungsfunktion in der Log-Log-Domäne zu zeichnen, und behauptete, dass ein Kandidaten-Potenzgesetz mindestens zwei Größenordnungen abdecken sollte.[64] Außerdem müssen Forscher normalerweise dem Problem vorgehen, zu entscheiden, ob eine Wahrscheinlichkeitsverteilung der realen Welt einem Machtgesetz folgt oder nicht. Als Lösung für dieses Problem, Diaz[49] schlug eine grafische Methodik vor, die auf zufälligen Stichproben basiert, die visuell erkennen zwischen verschiedenen Arten des Schwanzverhaltens. Diese Methodik verwendet Bündel von verbleibenden Quantilfunktionen, die auch als Perzentil-Restlebensfunktionen bezeichnet werden und die viele verschiedene Arten von Verteilungsschwänzen charakterisieren, einschließlich schwerer und nicht schwerer Schwänze. Jedoch, Stumpf & Porter (2012) behauptete die Notwendigkeit sowohl eines statistischen als auch eines theoretischen Hintergrunds, um einen Stromversetz im zugrunde liegenden Mechanismus zu unterstützen, der den Datenerzeugungsprozess vorantreibt.[64]

Eine Methode zur Validierung eines Power-Law-Beziehung testet viele orthogonale Vorhersagen eines bestimmten generativen Mechanismus gegen Daten. Ein einfaches Anpassung an eine Power-Law-Beziehung zu einer bestimmten Art von Daten wird nicht als rationaler Ansatz angesehen. Daher bleibt die Validierung von Power-Law-Behauptungen ein sehr aktives Forschungsbereich in vielen Bereichen der modernen Wissenschaft.[9]

Siehe auch

Verweise

Anmerkungen

  1. ^ Yaneer Bar-yam. "Konzepte: Machtgesetz". New England Complex Systems Institute. Abgerufen 18. August 2015.
  2. ^ a b c d Newman, M. E. J. (2005). "Machtgesetze, Pareto -Verteilungen und Zipf -Gesetz". Zeitgenössische Physik. 46 (5): 323–351. Arxiv:cond-mat/0412004. Bibcode:2005Conph..46..323n. doi:10.1080/00107510500052444. S2CID 202719165.
  3. ^ Humphries NE, Queiroz N, Dyer JR, Pade NG, Musyl MK, Schaefer KM, Fuller DW, Brunnschweiler JM, Doyle TK, Houghton JD, Hays GC, Jones CS, Noble LR, Wearmouth VJ, Southall EJ, Sims DW (2010) (2010) . "Umweltkontext erklärt Lévy- und Brownsche Bewegungsmuster von marinen Raubtieren" (PDF). Natur. 465 (7301): 1066–1069. Bibcode:2010Natur.465.1066H. doi:10.1038/nature09116. PMID 20531470. S2CID 4316766.
  4. ^ a b c Klaus A, Yu S, Plenz D (2011). Zochowski m (Hrsg.). "Statistische Analysen unterstützen die Verteilungen der Machtrechte in neuronalen Lawinen". PLUS EINS. 6 (5). E19779. Bibcode:2011ploso ... 619779k. doi:10.1371/journal.pone.0019779. PMC 3102672. PMID 21720544.
  5. ^ Albert & Reis 2011, p.[Seite benötigt].
  6. ^ Cannavò, Flavio; Nunnari, Giuseppe (2016-03-01). "Auf ein mögliches einheitliches Skalierungsgesetz für Vulkanausbruchdauern". Wissenschaftliche Berichte. 6: 22289. Bibcode:2016natsr ... 622289c. doi:10.1038/srep22289. ISSN 2045-2322. PMC 4772095. PMID 26926425.
  7. ^ Stevens, S. S. (1957). "Über das psychophysikalische Gesetz". Psychologische Überprüfung. 64 (3): 153–181. doi:10.1037/h0046162. PMID 13441853.
  8. ^ Staddon, J. E. R. (1978). "Theorie der Verhaltenskraftfunktionen". Psychologische Überprüfung. 85 (4): 305–320. doi:10.1037/0033-295x.85.4.305. HDL:10161/6003.
  9. ^ a b c d e f g h i Clauset, Shalizi & Newman 2009.
  10. ^ a b "9NA CEPAL CHARLAS SOBRE SISTEMAS COMPLEJOS Sociales (CCSSCs): Leyes de Potencias". Youtube.
  11. ^ Taleb, Nassim Nicholas; Bar-Yam, Yaneer; Cirillo, Pasquale (2020-10-20). "Bei Einzelpunktprognosen für Fettschwanzvariablen". Internationales Journal of Prognosen. doi:10.1016/j.ijForecast.2020.08.008. ISSN 0169-2070. Abgerufen 2022-01-06.
  12. ^ Malcolm Gladwell (13. Februar 2006). "Millionen Dollar Murray". Archiviert von das Original Am 2015-03-18. Abgerufen 2015-06-14.
  13. ^ Sornette 2006.
  14. ^ Simon 1955.
  15. ^ Andriani, P.; McKelvey, B. (2007). "Beyond Gaußsche Durchschnittswerte: Umleitung internationaler Geschäfts- und Managementforschung zu extremen Ereignissen und Machtgesetzen". Journal of International Business Studies. 38 (7): 1212–1230. doi:10.1057/palgrave.jibs.8400324. S2CID 512642.
  16. ^ Bolmatov, D.; Brasilien, V. V.; Trachenko, K. (2013). "Thermodynamisches Verhalten der überkritischen Materie". Naturkommunikation. 4: 2331. Arxiv:1303.3153. Bibcode:2013natco ... 4.2331b. doi:10.1038/ncomms3331. PMID 23949085. S2CID 205319155.
  17. ^ Moret, M.; Zebende, G. (2007). "Aminosäure Hydrophobie und zugängliche Oberfläche". Physische Bewertung e. 75 (1 Pt 1). 011920. Bibcode:2007Phrve..75a1920m. doi:10.1103/Physreve.75.011920. PMID 17358197.
  18. ^ Mackay, D. M. (1963). "Psychophysik der wahrgenommenen Intensität: eine theoretische Grundlage für Fechners und Stevens 'Gesetze". Wissenschaft. 139 (3560): 1213–1216. Bibcode:1963Sci ... 139.1213m. doi:10.1126/science.139.3560.1213-A. S2CID 122501807.
  19. ^ Staddon, J. E. R. (1978). "Theorie der Verhaltenskraftfunktionen" (PDF). Psychologische Überprüfung. 85 (4): 305–320. doi:10.1037/0033-295x.85.4.305. HDL:10161/6003.
  20. ^ John T. Wixted; Shana K. Carpenter. "Das Wickelgren -Machtgesetz und die Ebbinghaus -Sparfunktion" (PDF). Psychologische Wissenschaft. Archiviert von das Original (PDF) am 8. April 2016. Abgerufen 31. August, 2016.
  21. ^ Lacquaniti, Francesco; Terzuolo, Carlo; Viviani, Paolo (1983). "Das Gesetz, das die kinematischen und figuralen Aspekte der Zeichnen von Bewegungen bezieht". Acta Psychologica. 54 (1–3): 115–130. doi:10.1016/0001-6918 (83) 90027-6. PMID 6666647.
  22. ^ Albert, J. S.; Bart, H. J.; Reis, R. E. "Artenreichtum & Cladal -Vielfalt". Im Albert & Reis (2011), S. 89–104.
  23. ^ Yu, Frank H.; Willson, Timothy; Frye, Stephen; Edwards, aled; Bader, Gary D.; Isserlin, Ruth (2011-02-02). "Das menschliche Genom und die Drogenentdeckung nach einem Jahrzehnt. Straßen (noch) nicht genommen". Natur. 470 (7333): 163–165. Arxiv:1102.0448v2. Bibcode:2011natur.470..163e. doi:10.1038/470163a. PMID 21307913. S2CID 4429387.
  24. ^ Saravia, Leonardo A.; Doyle, Santiago R.; Bond-Lamberty, Ben (2018-12-10). "Machtgesetze und kritische Fragmentierung in globalen Wäldern". Wissenschaftliche Berichte. 8 (1): 17766. Bibcode:2018natsr ... 817766s. doi:10.1038/s41598-018-36120-w. ISSN 2045-2322. PMC 6288094. PMID 30532065.
  25. ^ Machado L, Rossow, WB (1993). "Strukturelle Eigenschaften und radiale Eigenschaften tropischer Wolkencluster". Monatliche Wetterbewertung. 121 (12): 3234–3260. doi:10.1175/1520-0493 (1993) 121 <3234: Scarpo> 2.0.co; 2; 2;.
  26. ^ Corral, A, Osso, A, Llebot, JE (2010). "Skalierung der tropischen Zyklonabteilung". Naturphysik. 6 (9): 693–696. Arxiv:0910.0054. Bibcode:2010natph ... 6..693c. doi:10.1038/nphys1725. S2CID 67754747.
  27. ^ Lorenz RD (2009). "Machtgesetz von Dust Devil Diamesser auf Erde und Mars". Icarus. 203 (2): 683–684. Bibcode:2009icar..203..683l. doi:10.1016/j.icarus.2009.06.029.
  28. ^ Reed, W. J.; Hughes, B. D. (2002). "Von Genfamilien und Gattungen bis hin zu Einkommen und Internetdateigrößen: Warum Machtgesetze in der Natur so häufig sind" (PDF). Phys rev e. 66 (6): 067103. Bibcode:2002phrve..66f7103r. doi:10.1103/Physreve.66.067103. PMID 12513446.
  29. ^ a b Hilbert, Martin (2013). "Skalenfreie Leistungsschaltungen als Wechselwirkung zwischen Fortschritt und Diffusion". Komplexität (Eingereichtes Manuskript). 19 (4): 56–65. Bibcode:2014cmplx..19d..56h. doi:10.1002/cplx.21485.
  30. ^ "Hortons Gesetze - Beispiel". www.engr.colostate.edu. Abgerufen 2018-09-30.
  31. ^ Sutton, J. (1997), "Gibrat's Legacy", Journal of Economic Literature Xxxv, 40–59.
  32. ^ Li, W. (November 1999). "Zufällige Texte zeigen die Frequenzverteilung von Zipf-Law-ähnlicher Wort". IEEE -Transaktionen zur Informationstheorie. 38 (6): 1842–1845. doi:10.1109/18.165464. ISSN 0018-9448.
  33. ^ Curtis, Vickie (2018-04-20). Online -Bürgerwissenschaft und die Erweiterung der Wissenschaft: Verteilte Engagement für Forschung und Wissensproduktion. Springer. ISBN 978-3-319-77664-4.
  34. ^ Croteau, David; Hoynes, William (2013-11-06). Medien/Gesellschaft: Branchen, Bilder und Publikum. Sage Publications. ISBN 978-1-4833-2355-8.
  35. ^ Lewis Fry Richardson (1950). Die Statistiken tödlicher Streitigkeiten.
  36. ^ Berreby, David (31. Juli 2014). "Bewölkt mit der Chance auf Krieg". Nautilus Magazine. Abgerufen 22. Oktober, 2020.
  37. ^ Martin, Charles H.; Mahoney, Michael W. (2018-10-02). "Implizite Selbstregulierung in tiefen neuronalen Netzwerken: Evidenz aus der Zufallsmatrix-Theorie und Auswirkungen auf das Lernen". Arxiv:1810.01075 [cs.lg].
  38. ^ Etro, F.; Stepanova, E. (2018). "Power-Laws in Art". Physica A: Statistische Mechanik und ihre Anwendungen. 506: 217–220. Bibcode:2018phya..506..217e. doi:10.1016/j.physa.2018.04.057. HDL:11382/522706. S2CID 126347599.
  39. ^ Fricke, Daniel; Lux, Thomas (2015-02-13). "Bei der Verteilung von Links im Interbank-Netzwerk: Beweise aus dem E-MID-Geldmarkt über Nacht" (PDF). Empirische Ökonomie. Springer Science and Business Media LLC. 49 (4): 1463–1495. doi:10.1007/s00181-015-0919-x. ISSN 0377-7332.
  40. ^ Müller, Ulrich A.; Dacorogna, Michel M.; Olsen, Richard B.; Pictet, Olivier V.; Schwarz, Matthias; Morgenegg, Claude (1990-12-01). "Statistische Untersuchung von Wechselkursen, empirische Nachweise eines Preisveränderungsgesetzes und Intraday -Analyse". Journal of Banking & Finance. 14 (6): 1189–1208. doi:10.1016/0378-4266 (90) 90009-Q. ISSN 0378-4266.
  41. ^ Glattfelder, J. B.; Dupuis, a.; Olsen, R. B. (2011-04-01). "Muster in Hochfrequenz-FX-Daten: Entdeckung von 12 empirischen Skalierungsgesetzen". Quantitative Finanzen. 11 (4): 599–614. Arxiv:0809.1040. doi:10.1080/14697688.2010.481632. ISSN 1469-7688. S2CID 154979612.
  42. ^ Jóhannesson, Gudlaugur; Björnsson, Gunnlaugur; Gudmundsson, Einar H. (2006). "Nachglühen Lichtkurven und gebrochene Machtgesetze: Eine statistische Studie". Das Astrophysical Journal. 640 (1): L5. Arxiv:Astro-Ph/0602219. Bibcode:2006APJ ... 640L ... 5J. doi:10.1086/503294. S2CID 16139116.
  43. ^ "Burved-Power-Gesetz". Archiviert von das Original Am 2016-02-08. Abgerufen 2013-07-07.
  44. ^ N. H. Bingham, C. M. Goldie und J. L. Tugugels, reguläre Variation. Cambridge University Press, 1989
  45. ^ Kendal, WS; Jørgensen, B (2011). "Taylors Machtgesetz und Schwankungsskalierung durch eine zentrallimitähnliche Konvergenz". Phys. Rev. e. 83 (6): 066115. Bibcode:2011phrve..83f6115k. doi:10.1103/Physreve.83.066115. PMID 21797449.
  46. ^ Kendal, WS; Jørgensen, Br (2011). "Tweedie -Konvergenz: Eine mathematische Grundlage für das Machtgesetz von Taylor, 1//f Rauschen und Multifraktalität " (PDF). Phys. Rev. e. 84 (6): 066120. Bibcode:2011phrve..84F6120K. doi:10.1103/Physreve.84.066120. PMID 22304168.
  47. ^ J. Beiglant, J. L. Tugels, P. Vynckier (1996) Praktische Analyse der Extremwerte, Leuven: Leuven University Press
  48. ^ Coles, S. (2001) Eine Einführung in die statistische Modellierung extremer Werte. Springer-Verlag, London.
  49. ^ a b c d Diaz, F. J. (1999). "Identifizieren des Schwanzverhaltens durch Restquantilfunktionen". Journal of Computational and Graphical Statistics. 8 (3): 493–509. doi:10.2307/1390871. JStor 1390871.
  50. ^ Resnick, S. I. (1997). "Schwerschwanzmodellierung und Teletaffic -Daten". Die Annalen der Statistik. 25 (5): 1805–1869. doi:10.1214/aoS/1069362376.
  51. ^ "Also denkst du, du hast ein Machtgesetz - nun, ist das nicht etwas Besonderes?". bactra.org. Abgerufen 27. März 2018.
  52. ^ Jeong, H.; Tombor, B. Albert; Oltvai, Z.N.; Barabasi, A.-L. (2000). "Die groß angelegte Organisation von Stoffwechselnetzwerken". Natur. 407 (6804): 651–654. Arxiv:cond-mat/0010278. Bibcode:2000natur.407..651J. doi:10.1038/35036627. PMID 11034217. S2CID 4426931.
  53. ^ Arnold, B. C.; Brockett, P. L. (1983). "Wann bestimmt die Funktion des βth Perzentil -Restlebens die Verteilung?". Unternehmensforschung. 31 (2): 391–396. doi:10.1287/Opre.31.2.391.
  54. ^ Joe, H.; Proschan, F. (1984). "Perzentil -Restlebensfunktionen". Unternehmensforschung. 32 (3): 668–678. doi:10.1287/Opre.32.3.668.
  55. ^ Joe, H. (1985), "Charakterisierungen der Lebensverteilungen aus Perzentil -Restlebensdauer", Ann. Inst. Statist. Mathematik. 37, Teil A, 165–172.
  56. ^ Csorgo, S.; Viharos, L. (1992). "Vertrauensbänder für prozentuale Restlebensdauer" (PDF). Zeitschrift für statistische Planung und Inferenz. 30 (3): 327–337. doi:10.1016/0378-3758 (92) 90159-P. HDL:2027.42/30190.
  57. ^ Schunglein, D. C.; Morrison, D. G. (1981). "Die mittlere Restlebensdauer: ein Charakterisierungssatz und eine Anwendung". Unternehmensforschung. 29 (2): 392–399. doi:10.1287/Opre.29.2.392.
  58. ^ Morrison, D. G.; Schunglein, D. C. (1980). "Jobs, Streiks und Kriege: Wahrscheinlichkeitsmodelle für die Dauer". Organisationsverhalten und menschliche Leistung. 25 (2): 224–251. doi:10.1016/0030-5073 (80) 90065-3.
  59. ^ Gerchak, Y (1984). "Verringerung der Ausfallraten und damit verbundenen Probleme in den Sozialwissenschaften". Unternehmensforschung. 32 (3): 537–546. doi:10.1287/Opre.32.3.537.
  60. ^ Bauke, H. (2007). "Parameterschätzung für Leistungsschwerpunktverteilungen durch maximale Wahrscheinlichkeitsmethoden". Europäisches physisches Journal B. 58 (2): 167–173. Arxiv:0704.1867. Bibcode:2007EPJB ... 58..167B. doi:10.1140/EPJB/E2007-00219-Y. S2CID 119602829.
  61. ^ Hall, P. (1982). "Bei einigen einfachen Schätzungen eines Exponenten der regulären Variation". Zeitschrift der Royal Statistical Society, Serie B. 44 (1): 37–42. JStor 2984706.
  62. ^ Mitzenmacher 2004.
  63. ^ LAHERRère & Sornette 1998.
  64. ^ a b Stumpf & Porter 2012.

Literaturverzeichnis

Externe Links