Monday 30 January 2017

Linear Regression Kleinste Quadrate Gleitender Durchschnitt

Griffe Fälle, in denen Datenqualität variiert Eine der gemeinsamen Annahmen, die den meisten Methoden der Prozessmodellierung zugrunde liegen. Einschließlich linearer und nichtlinearer Kleinste-Quadrate-Regression, ist, dass jeder Datenpunkt genauso präzise Informationen über den deterministischen Teil der gesamten Prozessvariation bereitstellt. Mit anderen Worten, die Standardabweichung des Fehlerterms ist über alle Werte des Prädiktors oder der erläuternden Variablen konstant. Diese Annahme bleibt jedoch in jeder Modellierungsanwendung eindeutig nicht aus. Beispielsweise scheint es bei den nachstehend gezeigten Halbleiter-Photomasken-Zeilenabstandsdaten, daß die Genauigkeit der Zeilenabstand-Messungen mit zunehmendem Zeilenabstand abnimmt. In Situationen wie diesem, wenn es nicht vernünftig sein kann anzunehmen, dass jede Beobachtung gleich behandelt werden sollte, können oft gewichtete kleinste Quadrate verwendet werden, um die Effizienz der Parameterschätzung zu maximieren. Dies geschieht, indem versucht wird, jedem Datenpunkt seine richtige Grße des Einflusses auf die Parameterschätzwerte zu geben. Eine Prozedur, die alle Daten gleichermaßen behandelt, würde weniger präzise gemessene Punkte mehr Einfluss ergeben, als sie haben würden und würden hochpräzise Punkte zu wenig beeinflussen. Linespacing-Messfehler-Datenmodelltypen und gewichtete kleinste Quadrate Im Gegensatz zur linearen und nichtlinearen Regression der kleinsten Quadrate ist die gewichtete Kleinste-Quadrate-Regression nicht mit einer bestimmten Art von Funktion assoziiert, die verwendet wird, um die Beziehung zwischen den Prozessvariablen zu beschreiben. Stattdessen spiegeln gewichtete kleinste Quadrate das Verhalten der Zufallsfehler im Modell und können mit Funktionen verwendet werden, die entweder linear oder nichtlinear in den Parametern sind. Sie arbeitet, indem zusätzliche nichtnegative Konstanten oder Gewichte, die mit jedem Datenpunkt verbunden sind, in das Anpassungskriterium einbezogen werden. Die Größe des Gewichts zeigt die Genauigkeit der in der zugehörigen Beobachtung enthaltenen Informationen an. Die Optimierung des gewichteten Anpassungskriteriums, um die Parameterschätzwerte zu finden, ermöglicht es den Gewichten, den Beitrag jeder Beobachtung zu den endgültigen Parameterschätzungen zu bestimmen. Es ist wichtig zu beachten, daß das Gewicht für jede Beobachtung relativ zu den Gewichten der anderen Beobachtungen gegeben ist, so daß verschiedene Mengen von Absolutgewichten identische Wirkungen haben können. Vorteile von gewichteten kleinsten Quadraten Wie alle bisher diskutierten Methoden der kleinsten Quadrate sind gewichtete kleinste Quadrate eine effiziente Methode, die kleine Datensätze gut nutzt. Es teilt auch die Fähigkeit, verschiedene Arten von leicht interpretierbare statistische Intervalle für die Schätzung, Vorhersage, Kalibrierung und Optimierung. Zusätzlich ist, wie oben diskutiert, der Hauptvorteil, daß die gewichteten kleinsten Quadrate gegenüber anderen Verfahren genügen, die Fähigkeit, Regressionssituationen zu behandeln, in denen die Datenpunkte von unterschiedlicher Qualität sind. Wenn die Standardabweichung der Zufallsfehler in den Daten nicht über alle Ebenen der erläuternden Variablen konstant ist, liefert die Verwendung von gewichteten kleinsten Quadraten mit Gewichten, die umgekehrt proportional zu der Varianz bei jedem Niveau der erklärenden Variablen sind, die genauesten Parameterschätzungen. Nachteile von gewichteten kleinsten Quadraten Der größte Nachteil der gewichteten kleinsten Quadrate, die viele Menschen nicht kennen, ist wahrscheinlich die Tatsache, dass die Theorie hinter dieser Methode auf der Annahme basiert, dass die Gewichte genau bekannt sind. Dies ist fast nie der Fall in realen Anwendungen, natürlich, so geschätzt Gewichte müssen stattdessen verwendet werden. Die Wirkung der Verwendung von geschätzten Gewichten ist schwer zu beurteilen, aber die Erfahrung zeigt, dass kleine Variationen in den Gewichten aufgrund der Schätzung nicht oft eine Regressionsanalyse oder ihre Interpretation beeinflussen. Wenn jedoch die Gewichte aus kleinen Zahlen von replizierten Beobachtungen geschätzt werden, können die Ergebnisse einer Analyse sehr schlecht und unvorhersehbar beeinflusst werden. Dies ist besonders wahrscheinlich, wenn die Gewichte für Extremwerte des Prädiktors oder der erläuternden Variablen mit nur wenigen Beobachtungen geschätzt werden. Es ist wichtig, sich dieses potentiellen Problems bewusst zu sein und nur gewichtete kleinste Quadrate zu verwenden, wenn die Gewichte genau zueinander geschätzt werden können. Carroll und Ruppert (1988). Ryan (1997). Die gewichtete Regression der kleinsten Quadrate ist ebenso wie die anderen Methoden der kleinsten Quadrate empfindlich gegenüber den Auswirkungen von Ausreißern. Wenn potenzielle Ausreißer nicht untersucht und angemessen behandelt werden, werden sie voraussichtlich negative Auswirkungen auf die Parameterschätzung und andere Aspekte einer gewichteten Analyse der kleinsten Fehlerquadrate haben. Wenn eine gewichtete Regression der kleinsten Quadrate tatsächlich den Einfluss eines Ausreißers erhöht, können die Ergebnisse der Analyse weit hinter einer nicht gewichteten Analyse der kleinsten Quadrate zurückbleiben. Weitere Informationen zum gewichteten Mindestanpassungskriterium finden Sie in Abschnitt 4.3. Diskussion der Methoden zur Gewichtsabschätzung finden Sie in Abschnitt 4.5.8.5 Endpunkt Gleitender Durchschnitt Der Endpunkt Gleitender Durchschnitt (EPMA) legt einen Durchschnittspreis fest, indem er eine Gerade der kleinsten Quadrate (siehe Lineare Regression) über die letzten N Tage schließenden Preise anpasst Endpunkt der Zeile (dh die Zeile wie am letzten Tag) als Durchschnitt. Diese Berechnung wird durch eine Reihe von anderen Namen, einschließlich der kleinsten Quadrate gleitenden Durchschnitt (LSQMA), bewegte lineare Regression und Zeitreihenvorhersage (TSF). Joe Sharprsquos ldquomodified bewegt averagerdquo ist die gleiche Sache zu. Die Formel endet als ein einfacher gewichteter Durchschnitt der vergangenen N Preise, mit Gewichten gehen von 2N-1 bis - N2. Dies ist leicht aus den Formeln der kleinsten Quadrate abgeleitet, aber nur auf der Gewichtung der Verbindung zu den kleinsten Quadraten ist überhaupt nicht offensichtlich. Wenn p1 ist heute rsquos schließen, p2 yesterdays, etc, dann Die Gewichte sinken um 3 für jeden älteren Tag, und gehen für das älteste Drittel der N Tage negativ. Die folgende Grafik zeigt, dass für N15. Die Negative bedeuten, der Durchschnitt ist ldquooverweightrdquo auf die jüngsten Preise und kann Überschreitung Preisaktion nach einem plötzlichen Sprung. Im Allgemeinen jedoch, weil die gepaßte Linie bewusst durch die Mitte der neuen Preise geht, die EPMA neigt, in der Mitte der neuen Preise zu sein, oder eine Projektion von, wo sie schien, zu trimmen. Itrsquos interessant, die EPMA mit einem einfachen SMA zu vergleichen (siehe Simple Moving Average). Ein SMA zieht eine horizontale Linie durch die Vergangenheit N Tage Preise (ihre Mittel), während die EPMA eine schräge Linie zeichnet. Die Trägheitsanzeige (siehe Trägheitsmoment) nutzt die EPMA. Kevin Ryde Chart ist freie Software, die Sie es neu verteilen können, und es unter den Bedingungen der GNU General Public License zu ändern, wie sie von der Free Software Foundation Version 3 veröffentlicht wird, oder (Nach Ihrer Wahl) jede spätere Version.


No comments:

Post a Comment