Análise da série de tempo tsa statsmodels. tsa contém classes modelo e funções que são úteis para a análise de séries temporais. Isso atualmente inclui modelos autoregressivos univariados (AR), modelos vetoriais vetoriais (VAR) e modelos de média móvel auto-regressiva univariada (ARMA). Ele também inclui estatísticas descritivas para séries temporais, por exemplo autocorrelação, função de autocorrelação parcial e periodograma, bem como as propriedades teóricas correspondentes de ARMA ou processos relacionados. Ele também inclui métodos para trabalhar com atraso médio-aleatório e polinômios. Além disso, estão disponíveis testes estatísticos relacionados e algumas funções auxiliares úteis. A estimativa é feita por uma Probabilidade Máxima exata ou condicional ou por mínimos quadrados condicionais, usando filtro de Kalman ou filtros diretos. Atualmente, as funções e as classes devem ser importadas do módulo correspondente, mas as classes principais serão disponibilizadas no namespace statsmodels. tsa. A estrutura do módulo está dentro statsmodels. tsa é stattools. Propriedades e testes empíricos, acf, pacf, granger-causality, teste de raiz da unidade adf, teste de caixa de jj e outros. Armadilho. Processo auto-regressivo univariante, estimativa com probabilidade máxima condicional e exata e alimente de mínimos quadrados condicionais. Processo ARMA univariante, estimativa com probabilidade máxima condicional e exata e vetorar de mínimos quadrados condicionais, var. Modelos de estimativa de processo de autoregressivo vetorial (VAR), análise de resposta de impulso, decomposição de variância de erro de previsão e ferramentas de visualização de dados kalmanf. Classes de estimativa para ARMA e outros modelos com MLE exato usando o Kalman Filter armaprocess. Propriedades de processos de arma com parâmetros determinados, isso inclui ferramentas para converter entre ARMA, MA e representação de AR, bem como acf, pacf, densidade espectral, função de resposta de impulso e sandbox. tsa. fftarma similar. Semelhante ao armaprocess, mas funciona em tsatools de domínio de freqüência. Funções auxiliares adicionais, para criar matrizes de variáveis atrasadas, construir regressores para tendências, desvios e similares. Filtros. Função auxiliar para filtrar séries temporais Algumas funções adicionais que também são úteis para análises de séries temporais estão em outras partes de modelos de estatísticas, por exemplo, testes estatísticos adicionais. Algumas funções relacionadas também estão disponíveis em matplotlib, nitime e scikits. talkbox. Essas funções são projetadas mais para o uso no processamento de sinal, onde séries temporais mais longas estão disponíveis e funcionam com mais freqüência no domínio da freqüência. Estatística descritiva e testes stattools. acovf (x, imparcial, abatimento, fft) Mídia de movimento autorregressiva Modelos de ARMA (p, q) para análise de séries temporais - Parte 3 Esta é a terceira e última publicação na mini-série de média móvel autoregressiva ( ARMA) para análise de séries temporais. Introduzimos modelos autoregressivos e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Esses modelos constituirão a base para sinais comerciais e técnicas de gerenciamento de risco. Se você ler a Parte 1 e a Parte 2, você verá que tendemos a seguir um padrão para a análise de um modelo de séries temporais. Vou repeti-lo brevemente aqui: Justificação - Por que estamos interessados neste modelo particular Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçando um correlograma de amostra para visualizar um comportamento de modelos. Simulação e montagem - Ajustando o modelo às simulações, para garantir que entendemos o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos históricos reais. Previsão - Preveja os valores subsequentes para construir sinais ou filtros comerciais. Para seguir este artigo, é aconselhável dar uma olhada nos artigos anteriores sobre análise de séries temporais. Todos podem ser encontrados aqui. Critério de Informação Bayesiano Na Parte 1 desta série de artigos, analisamos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o Bayesian Information Criterion (BIC). Essencialmente, tem um comportamento semelhante ao AIC na medida em que penaliza os modelos por ter muitos parâmetros. Isso pode levar a uma superposição. A diferença entre o BIC e o AIC é que o BIC é mais rigoroso com a penalização de parâmetros adicionais. Critério de informação bayesiano Se tomarmos a função de verossimilhança para um modelo estatístico, que tem parâmetros k, e L maximiza a probabilidade. Então o critério de informação bayesiano é dado por: Onde n é o número de pontos de dados na série temporal. Usaremos o AIC e o BIC abaixo ao escolher os modelos apropriados de ARMA (p, q). Teste de Ljung-Box Na Parte 1 desta série de artigos, Rajan mencionou nos comentários da Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano ao decidir se um modelo ARMA era um bom ajuste para um tempo Series. O teste de Ljung-Box é um teste de hipótese clássico projetado para testar se um conjunto de autocorrelações de um modelo de séries temporais ajustadas diferem significativamente de zero. O teste não prova cada atraso individual por aleatoriedade, mas prova a aleatoriedade sobre um grupo de atrasos. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série temporal em cada intervalo são i. i.d .. ou seja, as correlações entre os valores da série da população são zero. Definimos a hipótese alternativa como: Os dados da série temporal não são i. i.d. E possuem correlação em série. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra da série temporal, hat k é a autocorrelação da amostra no intervalo k e h é o número de atrasos no teste. A decisão determina se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição de qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos usar R para calcular o teste para nós, simplificando um pouco o procedimento. Média de Movimento Autogressivo (ARMA) Modelos de ordem p, q Agora que discutimos o BIC e o teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, a saber, a Média Mover Autoregressiva da ordem p, q ou ARMA (p, Q). Até o momento consideramos processos autoregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar os efeitos dos participantes do mercado, como o impulso e a reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresos ou um evento inesperado (como o derramamento de óleo da BP Deepwater Horizon). Portanto, um modelo ARMA tenta capturar esses dois aspectos ao modelar séries temporais financeiras. Note-se que um modelo ARMA não leva em consideração o agrupamento de volatilidade, um fenômeno empírico chave de muitas séries temporais financeiras. Não é um modelo condicionalmente heteroscedástico. Para isso, precisamos aguardar os modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ele mesmo ainda linear: Modelo Médio Autoregressivo da ordem p, q Um modelo de séries temporais, é um modelo médio vertical autorregressivo de ordem p, q . ARMA (p, q), se: begin xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end Onde é ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de deslocamento para trás. (Veja um artigo anterior) então podemos reescrever o acima como uma função theta e phi de: Nós podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA muitas vezes exigirá menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos do BSO, então os polinômios theta e phi às vezes podem compartilhar um fator comum, levando a um modelo mais simples. Simulações e correlações Tal como acontece com os modelos de média autorregressiva e móvel, simularemos várias séries ARMA e tentamos ajustar os modelos ARMA a essas realizações. Realizamos isso porque queremos garantir que entendamos o procedimento de montagem, incluindo como calcular intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recupere estimativas razoáveis para os parâmetros ARMA originais. Na Parte 1 e na Parte 2, construímos manualmente a série AR e MA, desenhando N amostras de uma distribuição normal e, em seguida, elaborando o modelo de séries temporais específico usando atrasos dessas amostras. No entanto, há uma maneira mais direta de simular AR, MA, ARMA e até mesmo dados ARIMA, simplesmente usando o método arima. sim em R. Comece com o modelo ARMA não trivial mais simples possível, a saber, o ARMA (1,1 ) modelo. Ou seja, um modelo de ordem autorregressivo combinado com um modelo médio móvel da ordem um. Esse modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros atrasos da própria série de tempo e os termos de ruído branco de choque. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Leve a alfa 0.5 e beta -0.5: A saída é a seguinte: Posicione também o correlograma: podemos ver que não há autocorrelação significativa, o que é de se esperar de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, devemos notar que o 95 intervalos de confiança são muito amplos (uma conseqüência dos erros padrão razoavelmente grandes). Vamos agora tentar um modelo ARMA (2,2). Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alpha1, alpha2, beta1 e beta2. Leve alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: agora podemos tentar ajustar um modelo ARMA (2,2) para Os dados: também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para o componente da média móvel (beta1 e beta2) na verdade não contêm o valor do parâmetro original. Isso descreve o perigo de tentar ajustar os modelos aos dados, mesmo quando sabemos os valores dos parâmetros verdadeiros. No entanto, para fins comerciais, precisamos ter um poder preditivo que exceda as chances e produz lucro suficiente acima dos custos de transação, para ser rentável em A longo prazo. Agora que vimos alguns exemplos de modelos ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q quando se adequa aos modelos a dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriado para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q e Em seguida, aplique o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores particulares de p, q. Para mostrar este método, vamos simular primeiro um processo particular de ARMA (p, q). Em seguida, rolaremos todos os valores de p em p e q e calcularemos o AIC. Selecionaremos o modelo com o AIC mais baixo e depois executaremos um teste de Ljung-Box nos resíduos para determinar se conseguimos um bom ajuste. Comece simulando uma série ARMA (3,2): agora criaremos um objeto final para armazenar o melhor ajuste do modelo e o menor valor AIC. Atravessamos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis de loop i e j. Se o AIC atual for menor do que qualquer AIC previamente calculado, definimos o AIC final para esse valor atual e selecionamos essa ordem. Após o término do loop, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado configurado para 0) armazenado como final. arma: Permite a saída do AIC Coeficientes de ordem e ARIMA: podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos traçar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste Ljung-Box por 20 atrasos para confirmar isso: observe que o valor p é maior do que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) fornece um Bom ajuste do modelo. Claramente, este deve ser o caso, já que nós simulamos os dados. No entanto, este é precisamente o procedimento que usamos quando chegarmos para ajustar os modelos ARMA (p, q) ao índice SampP500 na seção a seguir. Dados financeiros Agora que descrevemos o procedimento para escolher o modelo da série temporal ideal para uma série simulada, é bastante direto aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite baixar os preços de fechamento diários usando o quantmod e, em seguida, crie o fluxo de retorno de log: Realize o mesmo procedimento de montagem que para a série ARMA (3,2) simulada acima na série de retorna de registro do SampP500 usando o AIC: o modelo de melhor ajuste Tem ordem ARMA (3,3): permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário SampP500: observe que há alguns picos significativos, especialmente em atrasos maiores. Isso é indicativo de um ajuste ruim. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3). Próximas Etapas Como discutimos ao longo desta série de artigos, vimos evidências de heterocedasticidade condicional (aglomeração de volatilidade) na série SampP500, especialmente nos períodos de 2007-2008. Quando usamos um modelo GARCH mais tarde na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retornos de títulos de log. Precisamos levar em consideração a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado é diferente do modelo ARMA que consideramos neste artigo. Clique abaixo para aprender mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. A editora e seus autores não são conselheiros de investimento registrados, advogados, CPAs ou outros profissionais de serviços financeiros e não prestam assessoria jurídica, fiscal, contábil, de investimento ou outros serviços profissionais. A informação oferecida por este site é apenas de educação geral. Como cada situação factual de indivíduos é diferente, o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade ou responsabilidade por quaisquer erros ou omissões e não devem ter responsabilidade nem responsabilidade para qualquer pessoa ou entidade em relação a danos causados ou alegadamente causados direta ou indiretamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensações financeiras das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. Taxas e ofertas de anunciantes exibidos neste site mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desactualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar delas. O autor e sua editora não têm responsabilidade por atualizar informações e negar a responsabilidade pelo conteúdo, produtos e serviços de terceiros, inclusive quando acessados através de hiperlinks ou propagandas neste site. Introdução a ARIMA: modelos não sazonais. Equação de previsão ARIMA (p, d, q) : Os modelos ARIMA são, em teoria, a classe mais geral de modelos para a previsão de uma série de tempo que pode ser feita para ser 8220stationary8221 por diferenciação (se necessário), talvez em conjunção com transformações não-lineares, como registro ou desinflação (se necessário). Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo. Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ela muda de forma consistente. Ou seja, seus padrões de tempo aleatório de curto prazo sempre parecem os mesmos em um sentido estatístico. A última condição significa que suas autocorrelações (correlações com seus próprios desvios anteriores da média) permanecem constantes ao longo do tempo, ou de forma equivalente, que seu espectro de potência permanece constante ao longo do tempo. Uma variável aleatória deste formulário pode ser vista (como de costume) como uma combinação de sinal e ruído, e o sinal (se um é aparente) pode ser um padrão de reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no signo , E também poderia ter um componente sazonal. Um modelo ARIMA pode ser visto como um 8220filter8221 que tenta separar o sinal do ruído, e o sinal é então extrapolado para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação linear (isto é, regressão) em que os preditores consistem em atrasos da variável dependente ou atrasos dos erros de previsão. Isto é: valor previsto de Y uma constante ou uma soma ponderada de um ou mais valores recentes de Y e uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores atrasados de Y. é um modelo autoregressivo puro (8220 self-regressed8221), que é apenas um caso especial de um modelo de regressão e que pode ser equipado com o software de regressão padrão. Por exemplo, um modelo autoregressivo de primeira ordem (8220AR (1) 8221) para Y é um modelo de regressão simples no qual a variável independente é apenas Y rezagada em um período (LAG (Y, 1) em Statgraphics ou YLAG1 em RegressIt). Se alguns dos preditores são atrasos dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não existe nenhuma maneira de especificar o erro 8222 do último período8217s como uma variável independente: os erros devem ser computados numa base de período a período Quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros atrasados como preditores é que as previsões do modelo8217s não são funções lineares dos coeficientes. Mesmo que sejam funções lineares dos dados passados. Assim, os coeficientes nos modelos ARIMA que incluem erros atrasados devem ser estimados por métodos de otimização não-linear (8220hill-climbing8221) em vez de apenas resolver um sistema de equações. O acrônimo ARIMA significa Auto-Regressive Integrated Moving Average. Lags da série estacionada na equação de previsão são chamados quota de termos degressivos, os atrasos dos erros de previsão são chamados de termos de média de quotmoving, e uma série de tempo que precisa ser diferenciada para ser estacionada é dito ser uma versão quotintegratedquot de uma série estacionária. Modelos aleatórios e de tendência aleatória, modelos autoregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não-sazonal é classificado como quotARIMA (p, d, q) quot model, onde: p é o número de termos autorregressivos, d é o número de diferenças não-sazonais necessárias para a estacionaridade e q é o número de erros de previsão atrasados em A equação de predição. A equação de previsão é construída da seguinte forma. Primeiro, digamos a d ª diferença de Y. o que significa: Observe que a segunda diferença de Y (o caso d2) não é a diferença de 2 períodos atrás. Em vez disso, é a primeira diferença da primeira diferença. Que é o análogo discreto de uma segunda derivada, isto é, a aceleração local da série em vez da sua tendência local. Em termos de y. A equação geral de previsão é: Aqui, os parâmetros de média móvel (9528217s) são definidos de modo que seus sinais são negativos na equação, seguindo a convenção introduzida pela Box e Jenkins. Alguns autores e software (incluindo a linguagem de programação R) os definem de modo que eles tenham sinais de mais. Quando os números reais estão conectados à equação, não há ambigüidade, mas é importante saber qual a convenção que seu software usa quando você está lendo a saída. Muitas vezes, os parâmetros são indicados por AR (1), AR (2), 8230 e MA (1), MA (2), 8230 etc. Para identificar o modelo ARIMA apropriado para Y. você começa por determinar a ordem de diferenciação (D) a necessidade de estacionar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação estabilizadora de variância, como registro ou desinflação. Se você parar neste ponto e prever que a série diferenciada é constante, você ajustou apenas uma caminhada aleatória ou modelo de tendência aleatória. No entanto, a série estacionada ainda pode ter erros autocorrelacionados, sugerindo que alguns números de AR (p 8805 1) e outros termos do número MA (q 8805 1) também são necessários na equação de previsão. O processo de determinação dos valores de p, d e q que são melhores para uma determinada série temporal será discutido em seções posteriores das notas (cujos links estão no topo desta página), mas uma prévia de alguns tipos Dos modelos ARIMA não-sazonais que são comumente encontrados são dados abaixo. Modelo autoregressivo de primeira ordem ARIMA (1,0,0): se a série estiver estacionada e autocorrelada, talvez possa ser predita como um múltiplo de seu próprio valor anterior, além de uma constante. A equação de previsão neste caso é 8230, que é regredida por si mesma atrasada por um período. Este é um modelo 8220ARIMA (1,0,0) constante8221. Se a média de Y for zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 981 1 for positivo e menor que 1 em magnitude (deve ser inferior a 1 em magnitude se Y estiver estacionário), o modelo descreve o comportamento de reversão média em que o valor do período 8217 seguinte deve ser previsto 981 1 vez como Muito longe da média, já que este valor do período 8217s. Se 981 1 é negativo, ele prevê comportamento de reversão média com alternância de sinais, ou seja, ele também prevê que Y estará abaixo do período médio seguinte se estiver acima da média deste período. Em um modelo autoregressivo de segunda ordem (ARIMA (2,0,0)), haveria um termo Y t-2 também à direita e assim por diante. Dependendo dos sinais e das magnitudes dos coeficientes, um modelo ARIMA (2,0,0) pode descrever um sistema cuja reversão média ocorre de forma sinusoidalmente oscilante, como o movimento de uma massa em uma mola sujeita a choques aleatórios . ARIMA (0,1,0) caminhada aleatória: se a série Y não é estacionária, o modelo mais simples possível para isso é um modelo de caminhada aleatória, que pode ser considerado como um caso limitante de um modelo AR (1) no qual o autorregressivo O coeficiente é igual a 1, ou seja, uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como: onde o termo constante é a mudança média de período para período (ou seja, a derivação de longo prazo) em Y. Esse modelo poderia ser ajustado como um modelo de regressão sem intercepção em que o A primeira diferença de Y é a variável dependente. Uma vez que inclui (apenas) uma diferença não-sazonal e um termo constante, esta é classificada como um modelo quotARIMA (0,1,0) com constante. O modelo aleatório-sem-atrasado seria um ARIMA (0,1, 0) modelo sem constante ARIMA (1,1,0) modelo autoregressivo de primeira ordem diferenciado: se os erros de um modelo de caminhada aleatória forem autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente à equação de predição - - é Ao regredir a primeira diferença de Y em si mesma atrasada por um período. Isso produziria a seguinte equação de predição: que pode ser rearranjada para Este é um modelo autoregressivo de primeira ordem com uma ordem de diferenciação não-sazonal e um termo constante - ou seja. Um modelo ARIMA (1,1,0). ARIMA (0,1,1) sem alisamento exponencial constante e simples: outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Lembre-se de que, para algumas séries temporais não estacionárias (por exemplo, as que exibem flutuações ruidosas em torno de uma média variando lentamente), o modelo de caminhada aleatória não funciona, bem como uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média das últimas observações para filtrar o ruído e estimar com maior precisão a média local. O modelo de suavização exponencial simples usa uma média móvel ponderada exponencialmente de valores passados para alcançar esse efeito. A equação de predição para o modelo de suavização exponencial simples pode ser escrita em várias formas matematicamente equivalentes. Um dos quais é o chamado formulário 8220error correction8221, em que a previsão anterior é ajustada na direção do erro que ele fez: porque e t-1 Y t-1 - 374 t-1 por definição, isso pode ser reescrito como : Que é uma equação de previsão ARIMA (0,1,1) sem constante com 952 1 1 - 945. Isso significa que você pode ajustar um alisamento exponencial simples especificando-o como um modelo ARIMA (0,1,1) sem Constante e o coeficiente estimado MA (1) corresponde a 1-menos-alfa na fórmula SES. Lembre-se que, no modelo SES, a idade média dos dados nas previsões de 1 período anterior é de 1 945. O que significa que tenderão a atrasar tendências ou pontos de viragem em cerca de 1 945 períodos. Segue-se que a idade média dos dados nas previsões de 1 período de um ARIMA (0,1,1) - sem modelo constante é 1 (1 - 952 1). Assim, por exemplo, se 952 1 0,8, a idade média é 5. Como 952 1 aborda 1, o ARIMA (0,1,1) - sem modelo constante torna-se uma média móvel de muito longo prazo, e como 952 1 Aproxima-se de 0, torna-se um modelo de caminhada aleatória sem drift. What8217s é a melhor maneira de corrigir a autocorrelação: adicionar termos AR ou adicionar termos MA. Nos dois modelos anteriores discutidos acima, o problema dos erros auto-correlacionados em um modelo de caminhada aleatória foi consertado de duas maneiras diferentes: adicionando um valor atrasado da série diferenciada Para a equação ou adicionando um valor atrasado do erro de previsão. Qual abordagem é melhor Uma regra de ouro para esta situação, que será discutida com mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada adicionando um termo AR ao modelo e a autocorrelação negativa geralmente é melhor tratada adicionando um Termo MA. Nas séries temporais econômicas e econômicas, a autocorrelação negativa surge frequentemente como um artefato da diferenciação. (Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa). Assim, o modelo ARIMA (0,1,1), em que a diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um Modelo ARIMA (1,1,0). ARIMA (0,1,1) com alisamento exponencial constante e constante: ao implementar o modelo SES como modelo ARIMA, você realmente ganha alguma flexibilidade. Em primeiro lugar, o coeficiente estimado de MA (1) pode ser negativo. Isso corresponde a um fator de alisamento maior que 1 em um modelo SES, que normalmente não é permitido pelo procedimento de montagem do modelo SES. Em segundo lugar, você tem a opção de incluir um termo constante no modelo ARIMA, se desejar, para estimar uma tendência média não-zero. O modelo ARIMA (0,1,1) com constante tem a equação de previsão: as previsões de um período anteriores deste modelo são qualitativamente similares às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma Linha inclinada (cuja inclinação é igual a mu) em vez de uma linha horizontal. ARIMA (0,2,1) ou (0,2,2) sem alisamento exponencial linear constante: modelos de alisamento exponencial linear são modelos ARIMA que utilizam duas diferenças não-sazonais em conjunto com os termos MA. A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma atrasada por dois períodos, mas é a primeira diferença da primeira diferença - isto é. A mudança de mudança de Y no período t. Assim, a segunda diferença de Y no período t é igual a (Y t-Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Uma segunda diferença de uma função discreta é análoga a uma segunda derivada de uma função contínua: mede a quotaccelerationquot ou quotcurvaturequot na função em um determinado ponto no tempo. O modelo ARIMA (0,2,2) sem constante prediz que a segunda diferença da série é igual a uma função linear dos dois últimos erros de previsão: o que pode ser rearranjado como: onde 952 1 e 952 2 são o MA (1) e MA (2) coeficientes. Este é um modelo de suavização exponencial linear geral. Essencialmente o mesmo que o modelo Holt8217s, e o modelo Brown8217s é um caso especial. Ele usa médias móveis exponencialmente ponderadas para estimar um nível local e uma tendência local na série. As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA (1,1,2) sem alisamento exponencial linear constante de tendência amortecida. Este modelo está ilustrado nos slides que acompanham os modelos ARIMA. Ele extrapola a tendência local no final da série, mas acha-se em horizontes de previsão mais longos para introduzir uma nota de conservadorismo, uma prática que tem suporte empírico. Veja o artigo em quotPor que a Tendência Damped funciona por Gardner e McKenzie e o artigo do quotGolden Rulequot de Armstrong et al. para detalhes. Em geral, é aconselhável manter os modelos em que pelo menos um de p e q não é maior do que 1, ou seja, não tente se ajustar a um modelo como o ARIMA (2,1,2), pois isso provavelmente levará a uma superposição E quotcommon-factorquot questões que são discutidas em mais detalhes nas notas sobre a estrutura matemática dos modelos ARIMA. Implementação da planilha: os modelos ARIMA, como os descritos acima, são fáceis de implementar em uma planilha eletrônica. A equação de predição é simplesmente uma equação linear que se refere a valores passados de séries temporais originais e valores passados dos erros. Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os erros (dados menos previsões) na coluna C. A fórmula de previsão em uma célula típica na coluna B seria simplesmente Uma expressão linear que se refere a valores nas linhas precedentes das colunas A e C, multiplicadas pelos coeficientes apropriados de AR ou MA armazenados em células em outro lugar na planilha.
No comments:
Post a Comment