Glättung

Im Statistiken und Bildverarbeitung, zu glatt a Datensatz ist eine approximierende Erstellung Funktion Das Versuch, wichtig zu erfassen Muster in den Daten, während Lärm oder andere feine Strukturen/schnelle Phänomene. Bei der Glättung werden die Datenpunkte eines Signals so modifiziert, dass einzelne Punkte höher als die benachbarten Punkte (vermutlich aufgrund von Rauschen) reduziert sind und Punkte, die niedriger sind als die benachbarten Punkte, erhöht werden, was zu einem glatteren Signal führt. Glättung kann auf zwei wichtige Arten verwendet werden, die bei der Datenanalyse (1) helfen können, indem mehr Informationen aus den Daten extrahieren können, solange die Glättung angemessen ist, und (2) durch die Bereitstellung von Analysen, die beide flexibel sind und robust.[1] Viele verschiedene Algorithmen werden zur Glättung verwendet.

Die Glättung kann vom verwandten und teilweise überlappenden Konzept von unterschieden werden Kurvenanpassung Auf folgende Weise:

  • Die Kurvenanpassung beinhaltet häufig die Verwendung einer expliziten Funktionsform für das Ergebnis, während die unmittelbaren Ergebnisse der Glättung die "geglätteten" Werte sind, ohne dass eine spätere Verwendung einer Funktionsform verwendet wird, wenn es eines gibt.
  • Ziel der Glättung ist es, eine allgemeine Vorstellung von relativ langsamen Wertänderungen zu geben, wobei wenig Aufmerksamkeit auf die endgültige Übereinstimmung der Datenwerte geschenkt wird, während sich die Kurvenanpassung darauf konzentriert, so eng wie möglich zu erreichen.
  • Glättungsmethoden haben häufig einen zugeordneten Tuning -Parameter, mit dem das Ausmaß der Glättung gesteuert wird. Die Kurvenanpassung passt eine beliebige Anzahl von Parametern der Funktion an, um die beste Anpassung zu erhalten.

Lineare SMOOTHERS

In dem Fall, dass die geglätteten Werte als geschrieben werden können lineare Transformation der beobachteten Werte ist der Glättungsvorgang als a bekannt linear glatter; Die Matrix, die die Transformation darstellt glattere Matrix oder Hutmatrix.

Der Betrieb der Anwendung einer solchen Matrix -Transformation wird aufgerufen Faltung. Somit wird die Matrix auch als Faltungsmatrix oder a bezeichnet Faltungskern. Bei einfachen Reihe von Datenpunkten (anstelle eines mehrdimensionalen Bildes) ist der Faltungskern ein eindimensional Vektor.

Algorithmen

Einer der häufigsten Algorithmen ist der "gleitender Durchschnitt", oft verwendet, um zu versuchen, wichtige Trends in wiederholten Erfassen zu erfassen Statistische Umfragen. Im Bildverarbeitung und Computer Vision, Glättungsideen werden in verwendet Raum skalieren Darstellungen. Der einfachste Glättungsalgorithmus ist der "rechteckige" oder "ungewichtete Gleitdurchschnitts glatt". Diese Methode ersetzt jeden Punkt im Signal durch den Durchschnitt von "m" benachbarten Punkten, wobei "m" eine positive Ganzzahl ist, die als "glatte Breite" bezeichnet wird. Normalerweise ist M eine ungerade Zahl. Das dreieckig glatt ist wie das rechteckig glatt außer dass es eine gewichtete Glättungsfunktion implementiert.[2]

Einige spezifische Glättungs- und Filtertypen mit ihren jeweiligen Verwendungen, Vor- und Nachteile sind:

Algorithmus Übersicht und verwendet Profis Nachteile
Additive Glättung verwendet, um zu glätten Kategoriale Daten.
Butterworth -Filter Langsamer Abrollen als a Chebyshev Typ I/Typ II -Filter oder ein Elliptischer Filter
  • Lineare Phasenantwort in der Passband als Chebyshev Typ I/Typ II und elliptische Filter können erreichen.
  • Entwickelt, um eine zu haben Frequenzgang so flach wie möglich im Passband.
  • erfordert eine höhere Ordnung, um eine bestimmte implementieren zu können Stoppband Spezifikation
Chebyshev Filter Hat einen steiler Abrollen und mehr Passband Ripple (Typ I) oder Stoppband Ripple (Typ II) als Butterworth -Filter.
  • Minimiert den Fehler zwischen dem idealisierten und dem tatsächlichen Filtercharakteristik über den Bereich des Filters
Digitaler Filter Verwendet auf a probiert, diskrete Zeit Signal bestimmte Aspekte dieses Signals zu reduzieren oder zu verbessern
Elliptischer Filter
Exponentielle Glättung
  • Wird verwendet, um Unregelmäßigkeiten (zufällige Schwankungen) in Zeitreihendaten zu reduzieren und so eine klarere Sicht auf das tatsächliche zugrunde liegende Verhalten der Serie.
  • Bietet außerdem ein wirksames Mittel zur Vorhersage zukünftiger Werte der Zeitreihen (Prognose).[3]
Kalman -Filter Schätzungen von unbekannten Variablen, die er produziert
Kernel glatter
  • Wird verwendet, um einen realen Wert abzuschätzen Funktion als gewichteter Durchschnitt der benachbarten beobachteten Daten.
  • am besten geeignet, wenn die Dimension der Anzeichen ist niedrig (p < 3), for example for data visualization.
Die geschätzte Funktion ist reibungslos und der Niveau der Glättung wird durch einen einzelnen Parameter eingestellt.
Kolmogorov -Zrubenko -Filter
  • robust und fast optimal
  • Funktioniert gut in einer fehlenden Datenumgebung, insbesondere in mehrdimensionaler Zeit und in mehreren Raum, in denen fehlende Daten zu Problemen zu räumlichen Sparnissen führen können
  • Die beiden Parameter haben jeweils klare Interpretationen, damit sie von Spezialisten in verschiedenen Bereichen leicht übernommen werden können
  • Software -Implementierungen für Zeitreihen, Längs- und räumliche Daten wurden im beliebten statistischen Paket entwickelt R, die die Verwendung des KZ -Filters und seiner Erweiterungen in verschiedenen Bereichen erleichtern.
Laplace -Glättung Algorithmus zum Glätten a Polygonales Netz.[4][5]
Lokale Regression Auch als "Löss" oder "Lowess" bezeichnet Eine Verallgemeinerung von gleitender Durchschnitt und Polynomregression.
  • Anpassen einfacher Modelle an lokalisierte Untergruppen der Daten, um eine Funktion aufzubauen, die den deterministischen Teil der Variation in den Daten beschreibt, Punkt für Punkt
  • Eine der Hauptattraktionen dieser Methode ist, dass der Datenanalyst keine globale Funktion eines beliebigen Formulars angeben muss, um ein Modell an die Daten anzupassen, nur für die Anpassung der Daten der Daten.
  • Erhöhte Berechnung. Weil es so rechenintensiv ist, wäre es praktisch unmöglich gewesen, in der Ära zu verwenden, wenn die Regression der kleinsten Quadrate entwickelt wurde.
Tiefpassfilter
  • A Filter das vergeht Signale mit einer Frequenz niedriger als eine ausgewählte Grenzfrequenz und dämpft Signale mit höheren Frequenzen höher als die Grenzfrequenz.
  • Wird für die kontinuierliche Zeitrealisierung und diskrete Zeitrealisierung verwendet.
Gleitender Durchschnitt
  • Eine Berechnung zur Analyse von Datenpunkten durch Erstellen einer Reihe von Durchschnittswerte von verschiedenen Teilmengen des vollständigen Datensatzes.
  • Eine Glättungstechnik, mit der die langfristigen Trends einer Zeitreihe klarer werden.[3]
  • Das erste Element des gleitenden Durchschnitts wird erhalten, indem der Durchschnitt der anfänglichen festen Untergruppe der Zahlreihe eingenommen wird
  • häufig verwendet mit Zeitfolgen Daten, um kurzfristige Schwankungen zu glätten und längerfristige Trends oder Zyklen hervorzuheben.
  • wurde eingestellt, um saisonale oder zyklische Komponenten einer Zeitreihe zu ermöglichen
Ramer -Douglas -Peucker -Algorithmus dezimiert Eine Kurve, die aus Liniensegmenten zu einer ähnlichen Kurve mit weniger Punkten besteht.
Savitzky -Golay -Glättungsfilter
  • Basierend auf der Anpassung von Polynomen der kleinsten Quadrate an Segmente der Daten
SCHLAUT -KLINE
Gestreckte Gittermethode
  • a Numerische Technik Für die Suche nach ungefähren Lösungen verschiedener mathematischer und technischer Probleme, die mit einem Elastizitätsnetzverhalten zusammenhängen können
  • Meteorologen verwenden die gestreckte Gittermethode für die Wettervorhersage
  • Ingenieure verwenden die gestreckte Netzmethode, um Zelte und andere zu entwerfen Zugstrukturen.

Siehe auch

Verweise

  1. ^ Simonoff, Jeffrey S. (1998) Glättungsmethoden in Statistiken, 2. Auflage. Springer ISBN978-0387947167[Seite benötigt]
  2. ^ O'Haver, T. (Januar 2012). "Glättung". terpconnect.umd.edu.
  3. ^ a b Easton, V. J.; & McColl, J. H. (1997)"Zeitfolgen", Schritte Statistik Glossar
  4. ^ Herrmann, Leonard R. (1976), "Laplace-Isoparametrie-Gittererzeugungsprogramm", Abteilung für Journal of the Engineering Mechanics, 102 (5): 749–756.
  5. ^ Sorkine, O., Cohen-Or, D., Lipman, Y.,, Alexa, M., Rössl, C., Seidel, H.-P. (2004). "Laplace -Oberflächenbearbeitung". Verfahren des Eurographics/ACM -Siggraph -Symposiums 2004 zur Geometrieverarbeitung. SGP '04. Schön, Frankreich: ACM. S. 175–184. doi:10.1145/1057432.1057456. ISBN 3-905673-13-4.{{}}: Cs1 montiert: Mehrfachnamen: Autorenliste (Link)

Weitere Lektüre

  • Hastie, T.J. und Tibshirani, R.J. (1990), Verallgemeinerte additive Modelle, New York: Chapman und Hall.