Média Móvel - MA. BREAKING DOWN Média Móvel - MA. Como um exemplo SMA, considere uma segurança com os seguintes preços de fechamento durante 15 dias. Week 1 5 dias 20, 22, 24, 25, 23.Week 2 5 dias 26, 28 , 26, 29, 27.Week 3 5 dias 28, 30, 27, 29, 28.A MA de 10 dias seria a média dos preços de fechamento para os primeiros 10 dias como o primeiro ponto de dados O próximo ponto de dados iria cair o mais cedo Preço, adicione o preço no dia 11 e tomar a média, e assim por diante como mostrado abaixo. Como observado anteriormente, MAs atraso ação preço atual porque eles são baseados em preços passados quanto maior o período de tempo para o MA, maior o atraso Assim Um MA de 200 dias terá um grau muito maior de atraso do que um MA de 20 dias, porque contém preços para os últimos 200 dias A duração do MA para usar depende dos objetivos de negociação, com MA mais curtos utilizados para curto prazo de negociação E MA a mais longo prazo mais adequado para investidores de longo prazo O MA de 200 dias é amplamente seguido por investidores e comerciantes, com quebras acima e abaixo desta média móvel Ou quando duas médias se cruzam. Uma MA em ascensão indica que a segurança está em uma tendência de alta, enquanto uma MA declinante indica que ela está em uma tendência de baixa. Da mesma forma, o momento ascendente é Confirmada com um crossover de alta que ocorre quando um MA de curto prazo cruza acima de um MA de longo prazo impulso para baixo é confirmado com um crossover de baixa, que ocorre quando um MA de curto prazo cruza abaixo de um MA de longo prazo. Imagine que você tem dados sobre os preços de muitos produtos. Para cada um dos produtos que você grava informações de preço semanais. Claros set obs 200.gen prodid n. Cada produto tem um preço médio único gen prodprice rpoisson 5 7. Você tem dados sobre os preços semanais por 200 semanas expandir 200 bysort prodid gen tn etiqueta var t Semana. Existe também alguma variação sazonal 2 sen pi 50. Assim como uma tendência geral tendência geral tendência t 005. A primeira observação não está correlacionada com nada gen preço prodprice 2 5 tendência rpoisson 10 10 se t 1 substituir preço prodprice 2 Tendência sazonal 7 preço n-1 3 rpoisson 10 10 se t 2 substituir preço prodprice tendência sazonal 5 preço n-1 2 preço n-2 3 rpoisson 10 10 se t 3 substituir preço prodprice tendência sazonal 3 preço n-1 2 preço n - 2 2 preço n-3 3 rpoisson 10 10 se t 4 substituir preço prodprice tendência sazonal 3 preço n-1 175 preço n-2 125 preço n-3 1 preço n-4 3 rpoisson 10 10 se t 4. Criar um globabl para Loja global twograph. forv i 1 6 global twograph linha preço t se prodid i. twoway twograph, legenda off title Verdadeiro preço tendências para os primeiros seis produtos. Agora vamos imaginar que os dados acima gerados é a verdadeira informação de preços que é fundamentalmente inobservável. Em vez disso você tem várias coleções de dados por semana sobre os preços que cada variam por algum erro addative aleatório expandir 3.bysort prodid t gen prodobs n. gen preço pricecollect rnormal 25. No entanto, as informações de preço que você tem tem algumas entradas que 10 foram erroneamente Entrou em erro. gen entryerror rbinomial 1, 1 gen scalarerror rnormal 1.gen priceobs pricecollect 1 entryerror scalarerror etiqueta var priceobs Preço Registrado. Além disso, 35 de seus dados de preço nunca foram coletados g falta rbinomial 1, 35.drop se faltando 1. Criar um globabl para armazenar global twograph. forv i 1 6 global linha twograph priceobs t se prodid i prodobs 1.twoway twograph, legenda Off title Tendências de preços observados para os primeiros seis products. keep t priceobs prodid entryerror Estou mantendo erro de entrada no conjunto de dados como meio de comparação, embora ele não seria diretamente observado. A questão é. Você pode agora com esta messy data recuperar dados de preços que é semelhante ao original. A primeira coisa que devemos explorar é a duplicação de dados gravados. scatter priceobs t se prodid 1, title É fácil ver desvios individuais. É fácil ver os desvios individuais, mas não queremos percorrer todos os 200 produtos para identificar individualmente os valores atípicos do preço. Queremos apresentar um sistema para identificar valores atípicos. Vamos gerar uma média por produto e tempo por meio de preço médio. Vamos sinalizar qualquer observação que é 120 maior do que a média ou 80 menos do que a média gen flag pricemean priceobs 1 2 pricemean priceobs 8. Vamos ver como ele está trabalhando dois scotter priceobs t se prodid 1 scatter priceobs t se prodid 1 flag 1 Msymbol lgx title Alguns dos outliers podem ser identificados apenas olhando para a legenda média off. corr flag entryerror Nossa bandeira é correlacionada cerca de 45 com os erros de entrada Isso é bom, mas podemos fazer melhor. Eu proponho que em vez de usar apenas a média que nós construímos uma média móvel de preços e ver como cada entrada desvia da média O único problema é que o comando de média móvel requer xtset e que requer apenas uma entrada por período de tempo Então, eu digo Nós redimensionamos a variável de tempo e adicionamos como se registradas em um momento diferente da semana o número de observação. Precisamos de gerar recentemente prodobs, uma vez que não sabemos qual observação está faltando em cada produto byproducts genéricos pro genóides n. gen t2 t 4 prodobs. Xtset define o id do painel de dados do painel e o nível da série de tempo xtset prodid t2. O comando que vamos usar é tssmooth. É codificado de tal forma que, especificando ma significa média móvel e janela diz Stata quantos períodos de tempo para contar à frente e quantos atrás na movimentação de movimento. Este comando pode demorar um pouco tssmooth ma mapriceobs priceobs, janela 23 0 23 23 está em Efeito 5 semanas à frente e 5 semanas atrás O 0 diz stata não incluir inself nessa média. A média móvel é de dois pontos de referência de dispersão se prodid 1 linha mapriceobs t se prodid 1 linha pricemean t se prodid 1 title A média móvel é menos succeptable para outliers. A média móvel é mais estável do que apenas a média do tempo. Vamos tentar sinalizar usando a média móvel drop flag2 gen flag2 mapriceobs priceobs 1 2 mapriceobs priceobs 8.two scatter priceobs t se prodid 1 scatter priceobs t se prodid 1 flag2 1 msymbol lgx título A Média Móvel também pode ser lenda útil off. corr Flag2 entryerror. Solte os dados sinalizados drop if flag2 1. Colapso para o nível semanal colapso priceobs, por prodid t etiqueta var priceobs Preço médio observado. forv i 1 6 global twograph scatter priceobs t se prodid i. twoway twograph, legend off title Evolução dos preços observados para Primeiros seis produtos Os dados estão procurando muito melhor, mas ainda temos claramente alguns outliers indesejados. Poderíamos tirar proveito das tendências cruzadas de produtos para ajudar a identificar valores anormais dentro dos preços dos produtos por meio de preços médios de venda, preços médios, preços médios, preços vendidos, etc., se prodid 1 prever resid1, residual. reg priceobs aveprice se prodid 2 prever resid2, residual. reg priceobs aveprice if prodid 3 prever resid3, residual. twoway line resid1 t se prodid 1 linha priceobs t se prodid 1 line resid2 t se prodid 2 line priceobs t se prodid 2 line resid3 t se prodid 3 line priceobs t se prodid 3 title Os resíduos são indicadores claros de Outliers legenda fora. Finalmente, deixe-nos cair observações com resíduos que são maiores do que 1 5 desvios-padrão da média. qui forv i 1 200 reg tasc aveprice se prodíd i prever residtemp, residual sum residtemp substituir sinalizador residtemp-r mean r sd 1 5 residtemp-r Gota média residual. Vamos ver como ele está trabalhando dois scotter priceobs t se prodid 2 scatter priceobs t se prodid 2 flag 1 msymbol lgx title Agora apenas tentando remover alguns outliers fora legenda off. Plotting product 1 pricing relativo a outliers global twograph. forv i 1 6 global de linha twograph priceobs t se prodid i. Finalmente deixando cair a queda dos outliers se flag. Um gráfico final global twograph. forv i 1 6 global twograph scatter priceobs t se prodid i. twoway twograph, a legenda fora do título Observou tendências de preços para os primeiros seis produtos. Não tão limpo quanto nosso primeiro gráfico, mas definitivamente muito melhor. Movendo médias. Movendo médias. Com conjuntos de dados convencionais o valor médio é muitas vezes o primeiro, e um dos mais úteis, sumário estatísticas para calcular Quando os dados estão na forma de uma série de tempo , A média das séries é uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos curtos, quer precedendo o período atual, quer centrados no período atual, são freqüentemente mais úteis. Move, como o período atual se move a partir do tempo t 2, t 3, etc, eles são conhecidos como médias móveis Mas Uma média móvel simples é tipicamente a média não ponderada de k valores anteriores Uma média móvel exponencialmente ponderada é essencialmente o mesmo que uma média móvel simples, Mas com contribuições para a média ponderada pela sua proximidade com o tempo atual. Porque não há uma, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em Gráficos, analisados como uma série e usados na modelagem e previsão Uma série de modelos pode ser construída usando médias móveis e estes são conhecidos como modelos MA Se esses modelos são combinados com modelos AR autorregressivo os modelos compostos resultantes são conhecidos como ARMA ou ARIMA Modelos o I é para médias de movimento integrated. Simple. Desde uma série de tempo pode ser considerado como um conjunto de valores,, t 1,2,3,4, n a média desses valores podem ser computados Se assumir que n é bastante Grande e selecionamos um inteiro k que é muito menor que n podemos calcular um conjunto de médias de bloco ou médias móveis simples de ordem k. Cada medida representa a média dos valores de dados ao longo de um intervalo de k observações Observe que a primeira Possível MA de ordem k 0 é que, para tk Mais geralmente, podemos soltar o subscrito extra nas expressões acima e write. This afirma que a média estimada no tempo t é a média simples do valor observado no tempo t e os k - 1 etapas de tempo Se os pesos são app Lied que diminuem a contribuição de observações que estão mais distantes no tempo, a média móvel é dito ser suavizado exponencialmente As médias móveis são freqüentemente usadas como uma forma de previsão, onde o valor estimado para uma série no tempo t 1, S t 1 é Tomada como o MA para o período até e incluindo o tempo teg hoje s estimativa é baseada em uma média de valores anteriores registados até e incluindo ontem s para dados diários. Médias móveis simples podem ser vistos como uma forma de suavização No exemplo ilustrado Abaixo, o conjunto de dados de poluição atmosférica mostrado na introdução deste tópico foi aumentado por uma linha MA de 7 dias de média móvel, mostrada aqui em vermelho. Como pode ser visto, a linha MA alisa os picos e depressões nos dados e pode ser Muito útil na identificação de tendências A fórmula padrão de cálculo de forward significa que os primeiros k -1 pontos de dados não têm nenhum valor de MA, mas a partir daí os cálculos se estendem até o ponto de dados final dos valores médios diários da série. PM10, Greenwich. source London Air Quality Network. Uma razão para calcular médias móveis simples da maneira descrita é que ela permite que os valores sejam computados para todos os intervalos de tempo desde o tempo tk até o presente, e como uma nova medição é obtida para o tempo t 1, o MA para Tempo t 1 pode ser adicionado ao conjunto já calculado Isso fornece um procedimento simples para conjuntos de dados dinâmicos No entanto, existem alguns problemas com esta abordagem É razoável argumentar que o valor médio nos últimos 3 períodos, digamos, deve ser localizado no tempo T-1, não o tempo t e para um MA sobre um número par de períodos, talvez ele deve estar localizado no ponto médio entre dois intervalos de tempo Uma solução para esta questão é usar centrado MA cálculos, em que o MA no tempo t É a média de um conjunto simétrico de valores em torno de t Apesar de seus méritos óbvios, esta abordagem não é geralmente utilizada porque exige que os dados estão disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso Do Mas centrado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, removendo alguns componentes de alta freqüência de uma série de tempo e destacando mas não removendo tendências de forma semelhante à noção geral de filtragem digital. Uma forma de filtro linear É possível aplicar um cálculo de média móvel a uma série que já tenha sido suavizada, ou seja, suavizar ou filtrar uma série já suavizada Por exemplo, com uma média móvel de ordem 2, podemos considerá-la como sendo calculada usando Pesos, assim a MA em x 2 0 5 x 1 0 5 x 2 Da mesma forma, o MA em x 3 0 5 x 2 0 5 x 3 Se aplicarmos um segundo nível de suavização ou filtragem, temos 0 5 x 2 0 5 X 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 ou seja, o processo de filtragem de dois estágios ou convolução produziu um movimento simétrico ponderado variável Média, com pesos As circunvoluções múltiplas podem produzir médias móveis ponderadas bastante complexas, algumas das quais foram fou As médias de movimentação podem ser usadas para remover efeitos periódicos se computadas com o comprimento da periodicidade como um conhecido. Por exemplo, com dados mensais as variações sazonais podem frequentemente ser removidas se isto for O objetivo é aplicar uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro eo último que são ponderados por 1 2 Isto é porque haverá 13 meses no modelo simétrico tempo atual, t - 6 meses O total é Dividido por 12 Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Medias móveis ponderadas exponencialmente EWMA. Com a fórmula da média móvel simples. Todas as observações são igualmente ponderadas Se chamássemos esses pesos iguais, t cada um dos k pesos seria igual a 1 k Assim que a soma dos pesos seria 1, ea fórmula seria. Nós já vimos que as aplicações múltiplas deste processo resultam nos pesos que variam com avera exponencial levando em movimento A contribuição para o valor médio das observações que são mais removidas no tempo é deliberada reduzida, enfatizando os eventos locais mais recentes Essencialmente um parâmetro de suavização, 0 1, é introduzido, ea fórmula revisada para. Uma versão simétrica desta fórmula seria Da forma. Se os pesos no modelo simétrico forem selecionados como os termos dos termos da expansão binomial, 1 2 1 2 2q eles somarão a 1, e quando q se tornar grande, aproximar-se-á à distribuição Normal Este é um formulário Da ponderação do kernel, com o binômio agindo como a função do kernel A convolução de dois estágios descrita na subseção anterior é precisamente este arranjo, com q 1, produzindo os pesos. Em suavização exponencial é necessário usar um conjunto de pesos que somam 1 E que reduzem em tamanho geometricamente Os pesos usados são tipicamente da forma. Para mostrar que esses pesos somam a 1, considere a expansão de 1 como uma série Podemos escrever. e expandir a expressão entre colchetes usando A fórmula binomial 1-xp em que x 1 e p -1, o que dá. Isso fornece uma forma de média móvel ponderada da forma. Esta soma pode ser escrita como uma relação de recorrência. que simplifica muito a computação e evita o problema Que o regime de ponderação deve ser rigorosamente infinito para os pesos a somar a 1 para pequenos valores do que normalmente não é o caso A notação utilizada por diferentes autores varia Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escrever Por exemplo, Lucas e Saccucci, 1990, LUC1 e o website do NIST para mais detalhes e exemplos trabalhados. As fórmulas citadas acima derivam do trabalho De Roberts 1959, ROB1, mas Hunter 1986, HUN1 usa uma expressão da forma. O que pode ser mais apropriado para uso em alguns procedimentos de controle Com 1 a estimativa média é simplesmente seu valor medido ou o valor de O item de dados anterior Com 0 5 a estimativa é a média móvel simples das medições atuais e anteriores Em modelos de previsão o valor, S t é freqüentemente usado como o valor de estimativa ou previsão para o próximo período de tempo, ou seja, como a estimativa para x em Tempo t 1 Assim, temos. Isto mostra que o valor de previsão no tempo t 1 é uma combinação da média móvel ponderada exponencial anterior mais uma componente que representa o erro de previsão ponderado, no tempo t. Assumindo uma série de tempo é dado e uma previsão É necessário, um valor para é necessário Isto pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados obtidos com valores variáveis de para cada t 2,3 definindo a primeira estimativa como sendo o primeiro valor de dados observado x 1 In O valor de é importante na medida em que é usado na determinação dos limites de controle superior e inferior, e afeta o comprimento médio de execução ARL esperado antes destes limites de controle são quebrados sob a suposição Que as séries temporais representam um conjunto de variáveis independentes, aleatoriamente distribuídas, com variância comum. Nestas circunstâncias, a variância da estatística de controle é Lucas e Saccucci, 1990. Os limites de controle são geralmente definidos como múltiplos fixos dessa variância assintótica, por exemplo - 3 Vezes o desvio padrão Se 0 25, por exemplo, e os dados que estão sendo monitorados assumem uma distribuição Normal, N 0,1, quando em controle, os limites de controle serão - 1 134 eo processo atingirá um ou outro limite Em 500 passos em média Lucas e Saccucci 1990 LUC1 derivam os ARLs para uma ampla gama de valores e sob várias suposições usando procedimentos de Cadeia de Markov Eles tabulam os resultados, incluindo o fornecimento de ARLs quando a média do processo de controle foi deslocada por algum múltiplo do Desvio padrão Por exemplo, com um deslocamento 0 5 com 0 25 o ARL é menor que 50 passos de tempo. As abordagens descritas acima são conhecidas como suavificação exponencial única quando os procedimentos são ap Aplicados uma vez à série de tempo e, em seguida, análises ou processos de controle são realizados no conjunto de dados suavizado resultante Se o conjunto de dados inclui uma tendência e ou componentes sazonais, o alisamento exponencial de dois ou três estágios pode ser aplicado como um meio de remover explicitamente a modelagem destes Ver a seguir, a seção sobre Previsão abaixo e o NIST trabalhado exemplo. CHA1 Chatfield C 1975 A análise da teoria e da prática da série do tempo Chapman e salão, Londres. HUN1 Hunter J S 1986 A média móvel exponencialmente ponderada J de Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Coeficientes de Controle de Média Móvel Ponderados Exponencialmente Propriedades e Melhorias Technometrics, 32 1, 1-12. ROB1 Roberts S W 1959 Testes de gráficos de controle baseados em médias móveis geométricas Technometrics, 1, 239-250.
No comments:
Post a Comment