Friday, October 14, 2016

Móvil Exponencial De Los Valores Que Faltan Medios

Un método simple y general para el llenado en los datos que faltan, si usted tiene carreras de datos completos, es el uso de regresión lineal. Digamos que tienes 1.000 carreras de 5 en una fila con ninguna falta. Configurar el 1000 x 1 y el vector y 1000 x 4 matriz X: Regresión le dará los números 4 a b c d que le dan un mejor partido para sus 1000 filas de datos mdash datos diferentes, diferente a b c d. A continuación, utiliza estos productos a b c d estimar (predecir, interpolar) wt0 ​​faltante. (Para pesos humanos, Id esperar abcd para ser todo alrededor de 1/4.) (Hay millones y millones de libros y artículos sobre la regresión, en todos los niveles. Para la conexión con la interpolación, sin embargo, no sé de una buena introducción a nadie) me tener un valor continuo para el que Id como para calcular una media móvil exponencial. Normalmente Id sólo tiene que utilizar la fórmula estándar para esto: donde S n es la nueva media, alfa es el alfa, Y es la muestra, y S n-1 es el promedio anterior. Desafortunadamente, debido a diversos problemas que no tienen un tiempo de muestreo consistente. Puede que sé que puedo probar, a lo sumo, por ejemplo, una vez por milisegundo, pero debido a factores fuera de mi control, puedo no ser capaz de tomar una muestra de varios milisegundos a la vez. Un caso probable más común, sin embargo, es que simple muestra un poco temprano o tardío: en lugar de toma de muestras a los 0, 1 y 2 ms. Muestreo a 0, 0,9 y 2,1 ms. Yo anticipo que, independientemente de los retrasos, mi frecuencia de muestreo será muy, muy por encima del límite de Nyquist, y por lo tanto no necesita preocuparse acerca de aliasing. Creo que puedo lidiar con esto de una manera más o menos razonable mediante la variación de la alfa apropiada, basado en la cantidad de tiempo desde la última muestra. Parte de mi razonamiento de que esto va a funcionar es que la EMA interpola linealmente entre el punto de datos anterior y la actual. Si tenemos en cuenta el cálculo de un EMA de la siguiente lista de muestras a intervalos de t: 0,1,2,3,4. Debemos obtener el mismo resultado si utilizamos 2t intervalo, donde las entradas se convierten en 0,2,4, justo Si la EMA había asumido que, en t 2 el valor había sido desde 2 t 0. que sería el mismo que el intervalo t de cálculo cálculo en 0,2,2,4,4, que su no hacer. O ¿tiene sentido en absoluto ¿Puede alguien decirme cómo variar la alfa apropiadamente Por favor muestre su trabajo. Es decir. muéstrame la matemática que demuestra que el método realmente está haciendo lo correcto. pidió a 21 Jun 09 en 13:05 Usted shouldn39t obtiene el mismo EMA de entrada diferente. Piense de EMA como un filtro, el muestreo a 2t es equivalente al muestreo hacia abajo, y el filtro se va a dar una salida diferente. Esta claro para mí desde 0,2,4 contiene componentes de frecuencia más altas que 0,1,2,3,4. A menos que la pregunta es, ¿cómo cambio el filtro sobre la marcha para hacer que dan el mismo resultado. Tal vez me estoy perdiendo algo ndash freespace Jun 21 de 09 en 15:52 Sin embargo, la entrada no es diferente, it39s simplemente tomaron muestras con menos frecuencia. 0,2,4 a intervalos 2t es como 0,, 2,, 4 a intervalos t, si el indica que la muestra es ignorado Curt Sampson ndash 21 de Jun 09 en 23:45 Esta respuesta basa en mi buena comprensión de paso bajo filtros (media móvil exponencial es en realidad un filtro de paso bajo de un solo polo), pero mi entendimiento nebuloso de lo que usted está buscando. Creo que la siguiente es lo que quiere: En primer lugar, se puede simplificar la ecuación un poco (se parece más complicado, pero es más fácil en el código). Im que va a utilizar para la salida Y y X para la entrada (en lugar de S para la salida e Y para la entrada, como lo han hecho). En segundo lugar, el valor de alfa aquí es igual a 1-e - Deltat / tau donde DeltaT es el tiempo entre muestras, y tau es la constante de tiempo del filtro de paso bajo. Digo igualdad entre comillas porque esto funciona bien cuando delta T / tau es pequeño en comparación con el 1 y alfa 1-e - Deltat / tau asymp delta T / tau. (Pero no demasiado pequeño: interminables tenga problemas de cuantificación, y a menos que recurrir a algunas técnicas exóticas que en general tienen un extra de N bits de resolución en su estado variable S, donde N log 2 (alfa)). Para mayores valores de delta T / tau el efecto de filtrado comienza a desaparecer, hasta llegar al punto donde alfa es cercano a 1 y ya está, básicamente, sólo la asignación de la entrada a la salida. Esto debería funcionar correctamente con diferentes valores de delta T (la variación de delta T no es muy importante, siempre y cuando alfa es pequeña, de lo contrario se ejecutará en algún lugar extraño Nyquist cuestiones / alias / etc), y si se está trabajando en un procesador donde la multiplicación es más barato que la división, o cuestiones de punto fijo son importantes, precalcular omega 1 / tau, y considerar tratando de aproximar la fórmula para alfa. Si realmente quieres saber cómo derivar la fórmula alfa 1-e - Deltat / tau y luego considerar su diferencial fuente ecuación: que, cuando X es una función escalón unitario, tiene la solución Y1 - e - t / tau. Para valores pequeños de DeltaT, el derivado se puede aproximar por DeltaY / delta T, produciendo DeltaT X DeltaY (XY) (delta T / tau) alfa Y tau DeltaY / (XY) y la extrapolación de alfa 1-e - Deltat / tau viene de tratando de hacer coincidir el comportamiento con el caso de la función escalón unitario. ¿Le indique los detalles sobre la quottrying para que coincida con la parte behaviorquot entiendo su solución en tiempo continuo Y 1 - exp (-t47) y su generalización a una función de paso reducido con una magnitud X y la condición inicial y (0). pero I39m no ver cómo poner estas ideas en conjunto para lograr el resultado. ndash Rhys Ulerich de mayo de 4 13 a las 22:34 Esta no es una respuesta completa, pero puede ser el comienzo de una. Su por lo que yo tengo con esto en una hora o así de jugar Im publicar como un ejemplo de lo que estoy buscando, y tal vez una inspiración para otras personas que trabajan en el problema. Comienzo con S 0. que es el promedio resultante de la media de los últimos S-1 y la muestra tomada en Y 0 0 t. (T1 - t0) es mi intervalo de muestra y alfa se establece en lo que sea apropiado para ese intervalo de la muestra y el período durante el cual deseo a la media. Consideré lo que sucede si me olvido de la muestra en t 1 y en lugar de tener que conformarse con la muestra Y2 tomada en t2. Bueno, podemos empezar por la expansión de la ecuación para ver lo que habría ocurrido si hubiéramos tenido Y1: Me he dado cuenta de que la serie parece extenderse infinitamente esta manera, ya que podemos sustituir el S n en el lado derecho de forma indefinida: Ok , por lo que no es realmente un polinomio (tonto de mí), pero si se multiplica el término inicial por uno, entonces vemos un patrón: Hm: su una serie exponencial. Quelle sorpresa Imagínese que la salida de la ecuación para un promedio móvil exponencial Así que de todos modos, tengo esta x 0 x 1 x 2 x 3. Lo que va, y estoy seguro que huele Im e o un logaritmo natural patadas por aquí, pero no puedo recordar dónde me dirigía al lado antes de correr fuera de tiempo. Cualquier respuesta a esta pregunta, o cualquier prueba de la corrección de tal respuesta, depende en gran medida del youre de datos de medición. Si se tomaron muestras en t 0 0 ms. t 1 y t 2 0,9 ms 2.1ms. pero su elección de la alfa se basa en 1-ms-intervalos, y por lo tanto desea un alfa ajustado localmente n. la prueba de la corrección de la elección significaría conocer los valores de la muestra en t1ms y t2ms. Esto lleva a la pregunta: ¿Se puede interpolar los datos razonables para tener conjeturas sanos de lo que podría haber sido en-entre los valores O puede que incluso interpolar la media en sí Si ninguno de estos es posible, a continuación, por lo que yo veo, la lógica elección de un en-entre el valor Y (t) es el promedio calculado más recientemente. es decir, Y (t) asymp S n donde n es tal que maxmial t n LTT. Esta elección tiene una consecuencia simple: Deje alfa solo, sin importar cuál era la diferencia de tiempo. Si, por otro lado, es posible interpolar sus valores, entonces esto le dará muestras constantes intervalo averagable. Por último, si es posible incluso para interpolar la media en sí, eso sería hacer que la pregunta sin sentido. contestada 21 de Jun 09 en 15:08 balpha 9830 25.8k 9679 9 9679 84 9679 115 Me gustaría pensar que puedo interpolar los datos de mi: dado que I39m muestreo a intervalos discretos, I39m ya hacerlo con una norma EMA De todos modos, supongo que necesito un quotproofquot que muestra funciona así como un EMA estándar, que también ha producirá un resultado incorrecto si los valores no están cambiando bastante bien entre períodos de muestra. ndash Curt Sampson Jun 21 de 09 en 15:21 Pero that39s lo I39m diciendo: Si se tiene en cuenta la EMA una interpolación de los valores, you39re hecho si deja alfa, ya que es (debido a la inserción de la media más reciente como Y doesn39t cambiar el promedio) . Si usted dice que necesita algo que quotworks así como una norma EMAquot - what39s mal con el original A menos que tenga más información acerca de la medición you39re de datos, los ajustes locales a alfa será, en el mejor arbitraria. ndash balpha 9830 Jun 21 de 09 en 15:31 Me gustaría dejar el valor alfa solo, y rellenar los datos que faltan. Dado que usted no sabe lo que sucede durante el tiempo en que no puedes ejemplo, puede llenar esas muestras con 0s, o mantener el valor anterior estable y utilizar esos valores para la EMA. O alguna interpolación hacia atrás una vez que haya una nueva muestra, rellene los valores que faltan, y vuelve a calcular la EMA. Lo que estoy tratando de llegar es que hay una x n de entrada que tiene agujeros. No hay manera de moverse por el hecho de que se echa en falta datos. Así que usted puede utilizar una retención de orden cero, o se establece en cero, o algún tipo de interpolación entre xn y xnM. donde M es el número de muestras que faltan y n el inicio de la brecha. Posiblemente, incluso el uso de valores antes de n. contestada 21 de Jun 09 en 13:35 de pasar una hora o así curioseaba un poco con la matemáticas para esto, yo creo que simplemente variando la alfa realidad me dará la interpolación adecuada entre los dos puntos que usted habla, pero en una forma mucho más simple. Además, creo que la variación de la alfa también se ocupará de properply con muestras tomadas entre los intervalos de muestreo estándar. En otras palabras, I39m en busca de lo que usted describe, pero tratando de utilizar las matemáticas para averiguar la forma más sencilla de hacerlo. ndash Curt Sampson Jun 21 de 09 en 14:07 Me don39t que hay una bestia como interpolationquot quotproper. Simplemente don39t sabe lo que ocurrió en el momento en que no se está muestreando. El bien y el mal interpolación implica un cierto conocimiento de lo que se ha perdido, ya que se necesita para medir en contra de que para juzgar si una interpolación es bueno o malo. A pesar de esto dicho, se puede colocar restricciones, es decir, con la máxima aceleración, velocidad, etc. Creo que si lo hace saber cómo modelar los datos que faltan, entonces usted acaba de modelar los datos que faltan, a continuación, aplicar el algoritmo de EMA, sin cambios, en vez de cambiar alfa. Sólo mi 2c :) freespace ndash Jun 21 de 09 en 14:17 Esto es exactamente lo que estaba haciendo en mi edición en la pregunta hace 15 minutos: quotYou simplemente don39t sé lo que ocurrió en el momento en que no se está muestreando, pero quot that39s verdadera incluso si realiza una muestra a cada intervalo designado. Por tanto, mi contemplación de Nyquist: siempre y cuando usted sabe las direcciones de cambio de forma de onda doesn39t más de cada par de muestras, el asunto real shouldn39t intervalo de muestra, y debe ser capaz de variar. La ecuación EMA me parece exactamente para calcular como si la forma de onda cambia linealmente desde el último valor de la muestra a la actual. ndash Curt Sampson Jun 21 de 09 en 14:26 Me don39t piensan que es muy cierto. Nyquist39s teorema requiere requiere mínimo de 2 muestras por período de ser capaz de identificar de forma exclusiva la señal. Si don39t hacer eso, se obtiene aliasing. Sería lo mismo que el muestreo como FS1 durante un tiempo, a continuación, FS2, luego de vuelta a FS1, y se obtiene aliasing en los datos cuando se muestra con FS2 si FS2 está por debajo del límite de Nyquist. También debo confesar que no entiendo lo que quiere decir con cambios quotwaveform linealmente desde última muestra a onequot actual. Podría explicar Saludos, Steve. freespace ndash Jun 21 de 09 en 14:36 ​​Esto es similar a un problema abierto en mi lista de tareas. Tengo un esquema elaborado en cierta medida, pero no tienen trabajo matemático para respaldar esta sugerencia todavía. Resumen de actualización de amplificador: Me gustaría mantener el factor de suavizado (alfa) independiente del factor de compensación (que me refiero como beta aquí). Jasons excelente respuesta ya aceptado aquí funciona muy bien para mí. Si también se puede medir el tiempo transcurrido desde la última muestra fue tomada (en múltiplos redondeadas de su tiempo de muestreo constante - por lo que 7.8 ms desde la última muestra sería de 8 unidades), que podrían ser utilizados para aplicar el suavizado varias veces. Aplicar la fórmula 8 veces en este caso. Usted ha hecho efectiva una suavización sesgado más hacia el valor actual. Para obtener un mejor suavizado, tenemos que ajustar el alfa mientras se aplica la fórmula 8 veces en el caso anterior. ¿Cómo será esta aproximación suavizado pierdas ya ha logrado 7 muestras en el ejemplo anterior Esto se aproximó en el paso 1 con un aplanado reanudación de la aplicación del valor actual de un adicional de 7 veces Si definimos un factor beta de aproximación que se aplicará junto con alfa (como alphabeta en lugar de sólo alfa), vamos a asumir que el 7 perdidas muestras estaban cambiando suavemente entre los valores de las muestras anteriores y actuales. contestada 21 de Jun 09 en 13:35 Yo pienso en esto, pero un poco de curioseaba con las matemáticas me llegué al punto donde creo que, en lugar de aplicar la fórmula de ocho veces con el valor de la muestra, que pueda hacer un cálculo de una nueva alfa que me permita aplicar la fórmula de una vez, y me da el mismo resultado. Además, esto sería tratar de forma automática con el tema de muestras desplazadas desde los tiempos de muestreo exactos. ndash Curt Sampson Jun 21 de 09 en 13:47 La única aplicación está muy bien. Lo que aún no estoy seguro acerca de cómo es bueno es la aproximación de los 7 valores que faltan. Si el movimiento continuo hace que el valor de la fluctuación mucho entre los 8 milisegundos, las aproximaciones pueden ser bastante fuera de la realidad. Pero, entonces, si usted está muestreando en 1 ms (la más alta resolución con exclusión de las muestras retardadas) que ya se han dado cuenta la fluctuación dentro de 1 ms no es relevante. Funciona este razonamiento para usted (Todavía estoy tratando de convencer a mí mismo). ndash nik Jun 21 de 09 en 14:08 derecha. Ese es el factor beta de mi descripción. Un factor beta se calcula basándose en el intervalo de diferencia y las muestras actuales y anteriores. La nueva alfa será (alphabeta) pero va a ser usada solamente para esa muestra. Mientras que usted parece ser 39moving39 la alfa en la fórmula, que tienden hacia la constante alfa (factor de suavizado) y un beta calculada de forma independiente (un factor de sintonización) que compensa las muestras se perdió hace un momento. ndash nik Jun 21 de 09 en 15: 23Smoothing suavizado y filtrado son dos de las técnicas de series de tiempo más comúnmente utilizado para eliminar ruido de los datos subyacentes para ayudar a revelar las características y componentes importantes (por ejemplo, tendencia, estacionalidad, etc.). Sin embargo, también podemos utilizar suavizado para rellenar los valores que faltan y / o llevar a cabo un pronóstico. En este tema, vamos a hablar de cinco (5) diferentes métodos de suavizado: media móvil ponderada (i WMA), suavizado exponencial simple, de suavizado exponencial doble, suavizado exponencial lineal y suavizado exponencial triple. ¿Por qué nos debe importar suavizado se utiliza muy a menudo (y abusado) en la industria para hacer un examen visual rápida de las propiedades de los datos (por ejemplo, tendencia, estacionalidad, etc.), caben en los valores que faltan, y llevar a cabo una muestra fuera de la rápida pronóstico. ¿Por qué tenemos tantas funciones de suavizado Como veremos más adelante en este documento, cada función trabaja para una hipótesis diferente acerca de los datos subyacentes. Por ejemplo, suavizamiento exponencial simple asume que los datos tienen una media estable (media o por lo menos un movimiento lento), de manera sencilla suavizado exponencial va a hacer mal en los datos de pronóstico que presentan estacionalidad o una tendencia. En este artículo, vamos a ir sobre cada función de suavizado, resaltar sus supuestos y parámetros, y demostrar su aplicación a través de ejemplos. Media móvil ponderada (WMA) Una media móvil es de uso general con datos de series de tiempo para suavizar las fluctuaciones a corto plazo y poner de relieve las tendencias o ciclos de más largo plazo. Una media móvil ponderada multiplicando los factores para dar diferentes pesos a los datos en diferentes posiciones en la ventana de muestra. La media móvil ponderada tiene una ventana fija (es decir, N) y los factores están típicamente elegido para dar más peso a las observaciones más recientes. El tamaño de la ventana (N) determina el número de puntos promediados en cada momento, por lo que un mayor tamaño de las ventanas es menos sensible a los nuevos cambios en la serie de tiempo original y un tamaño de ventana pequeña puede causar la salida alisada a ser ruidoso. Para los propósitos de la muestra de predicción: Ejemplo 1: Deja para tener en cuenta las ventas mensuales de la empresa X, utilizando un promedio de 4 meses (equivalente ponderado A) en movimiento. Tenga en cuenta que la media móvil siempre va a la zaga de los datos y el pronóstico fuera de muestra converge a un valor constante. Vamos a tratar de utilizar un sistema de ponderación (véase más adelante) que le da un mayor énfasis a la última observación. Hemos trazado el promedio móvil ponderado-iguales y WMA en el mismo gráfico. La AMM parece más sensible a los cambios recientes y fuera de la previsión de la muestra converge hacia el mismo valor que la media móvil. Ejemplo 2: Vamos a examinar la AMM en presencia de tendencia y estacionalidad. Para este ejemplo, así usar los datos de pasajeros de aerolíneas internacionales. La ventana de media móvil es de 12 meses. El MA y la AMM mantener el ritmo de la tendencia, pero el pronóstico fuera de muestra se aplana. Por otra parte, aunque la AMM exhibe cierta estacionalidad, que siempre está a la zaga de los datos originales. (Browns) simple de suavizado exponencial suavizado exponencial simple es similar a la AMM con la excepción de que el tamaño de la ventana si infinitos factores de ponderación y la disminuyen exponencialmente. Como hemos visto en la AMM, la exponencial simple es adecuado para series de tiempo con una media estable, o al menos significa un movimiento muy lento. Ejemplo 1: Le permite utilizar los datos de ventas mensuales (como lo hicimos en el ejemplo WMA). En el ejemplo anterior, se optó por el factor de suavizado para ser de 0,8, lo que plantea la pregunta: ¿Cuál es el mejor valor para el factor de suavizado La estimación del mejor valor de los datos utilizando la función TSSUB (para calcular el error), SUMSQ y Excel tablas de datos, se calculó la suma de los errores al cuadrado (SSE) y se representaron los resultados: la ESS alcanza su valor mínimo alrededor de 0,8, así que elegimos este valor para nuestra suavizado. (Holt-Winters) doble suavizado exponencial suavizado exponencial simple no hace bien en presencia de una tendencia, por lo que varias método ideado bajo el paraguas de doble exponencial se proponen para manejar este tipo de datos. NumXL apoya Holt-Winters suavizado exponencial doble, que tienen la siguiente formulación: Ejemplo 1: Vamos a examinar los datos de pasajeros de líneas aéreas internacionales Elegimos un valor alfa de 0,9 y una beta de 0.1. Tenga en cuenta que, aunque suavizado doble traza bien a los datos originales, el pronóstico fuera de muestra es inferior a la media móvil simple. ¿Cómo podemos encontrar los mejores factores de alisamiento Tomamos un enfoque similar a nuestro ejemplo simple de suavizado exponencial, pero modificado para dos variables. Calculamos la suma de los errores al cuadrado construir una tabla de datos de dos variables, y recoger los valores alfa y beta que minimizan la ESS en general. (Browns) lineal suavizado exponencial Este es otro método de la función de suavizado exponencial doble, pero tiene un factor de suavizado: suavizado Browns exponencial doble toma un parámetro menos de la función de Holt-Winters, pero no puede ofrecer un buen ajuste como la función. Ejemplo 1: Le permite utilizar el mismo ejemplo en Holt-Winters exponencial doble y comparar la suma óptima del error al cuadrado. El exponencial doble Browns no se ajusta a los datos de la muestra, así como el método de Holt-Winters, pero el fuera de la muestra (en este caso particular) es mejor. ¿Cómo podemos encontrar el mejor factor de suavizado () Utilizamos el mismo método para seleccionar el valor alfa que minimiza la suma del error al cuadrado. Por ejemplo, los datos de la muestra, la alfa se encuentra que es 0,8. (Winters) Triple suavizado exponencial El suavizado exponencial de triple toma en cuenta las variaciones estacionales, así como las tendencias. Este método requiere 4 parámetros: La formulación de alisamiento exponencial triple es más complicado que cualquiera de los anteriores. Por favor, consulte nuestro manual de referencia en línea para la formulación exacta. Ejemplo: Utilizando los datos de los pasajeros de las aerolíneas internacionales, podemos aplicar inviernos suavizado exponencial triples, encontrar los parámetros óptimos, y llevar a cabo un fuera de previsión de muestra. Obviamente, los inviernos de suavizado exponencial de triple se aplica mejor para esta muestra de datos, ya que las pistas así los valores y el fuera de previsión de muestra se observa una estacionalidad (L12). ¿Cómo podemos encontrar el mejor factor de suavizado () Una vez más, tenemos que escoger los valores que minimizan la suma total de los errores cuadrados (SSE), pero las tablas de datos pueden ser utilizados por más de dos variables, por lo que recurren a la Excel solucionador de: (1) Configuración del problema de minimización, con la ESS como la función de utilidad (2) las limitaciones de este apoyo problema Conclusión FilesWere tener un reto tratar de poner los 20 (días de mercado) de media móvil exponencial (EMA) en nuestro modelo de datos en PowerPivot. Aquí es la fórmula y muestra EMA hoja de cálculo: stockcharts / escuela / dokuidchartschool: technicalindicators: movingaverages pegado la fórmula aquí por conveniencia: SMA (media móvil simple): 10 Período de suma / 10 Multiplicador: 2 / (Período de tiempo 43 1)) EMA: x multiplicador 43 EMA (día anterior). stockcharts hoja de cálculo de muestra / escuela / data / media / chartschool / technicalindicatorsandoverlays / movingaverages / cs-movavg. xls En nuestro modelo la tabla de hechos tiene estas columnas: Símbolo Fecha Apertura Máximo Mínimo Cierre Volumen Y en la tabla de calendario que hemos identificado los días de mercado (CalendarTradingDayNumber ) como 1, de modo que podemos contar de nuevo. Queremos que el campo calculado EMA en una tabla dinámica como este contexto Filtro: una fecha seleccionada en CalendarFullDate fila de contexto: Valores FactTableSymbol: FactTableClose FactTableEMA 20D GTGT Missing Hasta ahora hemos conseguido estos campos calculados: Ema Multiplicador 2 / (Período 43 1) Promedio 20D CERCA SI (suma de CLOSEBLANK (), EN BLANCO (), (CALCULAR (PROMEDIO (FactTableCLOSE), FILTRO (ALL (Calendario), CalendarTradingDayNumberltMAX (CalendarTradingDayNumber) ampamp CalendarTradingDayNumbergtMAX (CalendarTradingDayNumber) - Período)))) Pero parece que la fórmula EMA contiene una referencia propia de los valores anteriores, y también comienza a partir de un valor SMA (Promedio 20D CLOSE). ¿Cómo podemos hacer que Gracias de antemano. Aprecio mucho su apoyo. Sábado por la, 19 de de julio de, 2014 9:42 PMStata: Análisis de datos y software estadístico Nicholas J. Cox, de la Universidad de Durham, Reino Unido Christopher Baum, Boston College egen, MA () y sus limitaciones Statarsquos comando más obvia para el cálculo de promedios móviles es la ma ( ) en función de egen. Dada una expresión, se crea un - periodo media móvil de esa expresión. De forma predeterminada, se toma como 3. debe ser impar. Sin embargo, como la entrada manual indica, egen, MA () no puede ser combinado con varlist por:. y, por esa razón, no es aplicable a los datos de panel. En cualquier caso, como está fuera del conjunto de comandos escritos específicamente para la serie de tiempo ver series de tiempo para los detalles. Enfoques alternativos para calcular los promedios de datos de panel en movimiento, hay por lo menos dos opciones. Ambos dependen de la base de datos después de haber sido tsset de antemano. Esto es muy mucho la pena hacer: no sólo se puede ahorrarse especificar repetidamente variable de panel y variable en el tiempo, pero se comporta de forma inteligente Stata dado las lagunas en los datos. 1. Escriba su propia definición usando generar Utilización de operadores de series de tiempo, tales como L. y F.. dar a la definición de la media móvil como argumento para generar una declaración. Si lo hace, usted está, naturalmente, no limitado al mismo peso (no ponderado) centrado promedios calculados por egen en movimiento, MA (). Por ejemplo, igualmente ponderados de tres periodos promedios móviles serían dados por algunos pesos y pueden ser fácilmente especificados: Puede, por supuesto, especificar una expresión como log (mivar) en lugar de un nombre de variable como mivar. Una gran ventaja de este enfoque es que Stata automáticamente hace lo correcto para datos de panel: principales y menos valores se resuelven dentro de los paneles, al igual que la lógica indica que deberían ser. La desventaja más notable es que la línea de comandos puede llegar a ser muy largo si el promedio móvil implica varios términos. Otro ejemplo es una media móvil de un solo lado basada sólo en valores anteriores. Esto podría ser útil para generar una expectativa de adaptación de lo que una variable se basa únicamente en la información hasta la fecha: ¿qué podría pronosticar una persona para el período actual, basado en los últimos cuatro valores, utilizando un esquema de ponderación fija (un retraso de 4 periodos podría ser especialmente de uso común con series de tiempo trimestrales.) 2. uso egen, filter () de SSC uso del filtro función egen escrito por el usuario () del paquete egenmore sobre la CSS. En Stata 7 (actualizado después del 14 de noviembre de 2001), se puede instalar este paquete después de lo cual ayudará puntos egenmore a los detalles de filtro (). Los dos ejemplos anteriores quedarían vacíos (En esta comparación el enfoque es tal vez generan más transparente, pero vamos a ver un ejemplo de lo contrario en un momento.) Los retardos son una numlist. lleva siendo retardos negativos: en este caso -1/1 se expande a -1 0 1 1 o plomo, lag 0, lag 1. Los coefi - cientes, otro numlist, multiplicar los elementos principales rezagados o correspondientes: en este caso, esos artículos son F1.myvar. MYVAR y L1.myvar. El efecto de la opción de normalizar es escalar cada coeficiente por la suma de los coeficientes de modo que coef (1 1 1) es equivalente a normalizar los coeficientes de 1/3 1/3 1/3 y coef (1 2 1) normalizar es equivalente a los coeficientes de 1/4 1/2 1/4. Debe especificar no sólo los retardos, sino también los coeficientes. Debido egen, MA () proporciona el caso de igual peso, la razón principal para la egen, filter () es apoyar el caso desigualmente ponderada, para el que se debe especificar coeficientes. También podría decirse que obliga a los usuarios especificar coeficientes es un poco de presión extra sobre ellos para pensar en lo que quieren coeficientes. La principal justificación de pesos iguales es, suponemos, la sencillez, pero tienen propiedades pesos iguales de dominio de frecuencia pésimos, por mencionar sólo una consideración. El tercer ejemplo anterior podría ser cualquiera de los cuales es casi tan complicado como el enfoque de generar. Hay casos en los que egen, filter () da una formulación más simple que generar. Si desea un filtro binomial nueve plazo, que los climatólogos encuentran útil, entonces se ve quizá menos horrible que, y más fácil de hacerlo bien que, igual que con el enfoque de generar, egen, filter () funciona correctamente con datos de panel. De hecho, como se ha indicado anteriormente, depende del conjunto de datos que ha sido tsset de antemano. Un consejo gráfica Después de calcular los promedios móviles, es probable que desee ver en una gráfica. El tsgraph comando escrito por el usuario es inteligente acerca de los conjuntos de datos tsset. Instalarlo en una Stata-actualizada 7 por tsgraph inst SSC. ¿Qué hay de creación de subconjuntos con si ninguno de los ejemplos anteriores, si hacen uso de restricciones. De hecho egen, MA () si no va a permitir que se determine. De vez en cuando la gente quiere usar si en el cálculo de promedios móviles, pero su uso es un poco más complicado de lo que es normalmente. Lo que se puede esperar de una media móvil calculada con si. Identifiquemos dos posibilidades: la interpretación débil: no quiero ver ningún resultado para las observaciones excluidos. interpretación fuerte: yo no quiero ni que utilice los valores de las observaciones excluidos. Aquí está un ejemplo concreto. Supongamos, como consecuencia de alguna si la condición, las observaciones 1 a 42 están incluidos pero no observaciones sobre 43. Sin embargo, el promedio móvil de 42 dependerá, entre otras cosas, en el valor de la observación 43 si el promedio se extiende hacia atrás y hacia adelante y es de longitud al menos 3, y de manera similar dependerá de algunas de las observaciones 44 en adelante en algunas circunstancias. Nuestra hipótesis es que la mayoría de la gente iría para la interpretación débil, pero si eso es correcto, egen, filter () no es compatible si cualquiera. Siempre se puede ignorar lo que quiere donrsquot o incluso establecer los valores deseados a que faltan después mediante el uso de reemplazar. Una nota sobre los resultados en los extremos de la serie faltante Debido a las medias móviles son funciones de retardos y clientes potenciales, egen, ma () produce echa en falta cuando no existen los retardos y clientes potenciales, al principio y al final de la serie. Un nomiss opción fuerza el cálculo de las más cortas, medias móviles no centrados para las colas. En cambio, ni generar ni egen, filter () lo hace, o permite, nada especial para evitar resultados que faltan. Si cualquiera de los valores necesarios para el cálculo se encuentra, entonces ese resultado no se encuentra. Corresponde a los usuarios decidir si y qué cirugía correctiva se requiere para este tipo de observaciones, presumiblemente después de ver el conjunto de datos y teniendo en cuenta cualquier ciencia subyacente que puede ponerse en juego.


No comments:

Post a Comment