Friday 22 December 2017

Autoregressive integrated moving average spss


O procedimento da Série Temporária da Oficina de Treinamento On-Line da SPSS fornece as ferramentas para criar modelos, aplicando um modelo existente para análise de séries temporais, decomposição sazonal e análise espectral de dados de séries temporais, bem como ferramentas para computação de autocorrelações e correlações cruzadas. Os dois clipes de filme a seguir demonstram como criar um modelo de série de tempo de suavização exponencial e como aplicar um modelo de série de tempo existente para analisar dados de séries temporais. MOVIE: Modelo de Suavização Exponencial MOVIE: Ferramenta Modeladora Expert Expert Modelo modelo ARIMA Nesta oficina on-line, você encontrará muitos clipes de filme. Cada clipe de filme irá demonstrar algum uso específico do SPSS. Crie modelos TS. Existem diferentes métodos disponíveis no SPSS para criar Modelos de séries temporais. Existem procedimentos para modelos de suavização exponencial, univariante e multivariada Autoregressive Integrated Moving-Average (ARIMA). Esses procedimentos produzem previsões. Métodos de suavização na previsão: as médias móveis, as médias móveis ponderadas e os métodos de suavização exponencial são freqüentemente usados ​​na previsão. O objetivo principal de cada um desses métodos é suavizar as flutuações aleatórias na série temporal. Estes são eficazes quando as séries temporais não exibem tendências significativas, efeitos cíclicos ou sazonais. Ou seja, a série temporal é estável. Os métodos de suavização geralmente são bons para previsões de curto alcance. Médias móveis: as médias móveis usam a média dos valores de dados k mais recentes nas séries temporais. Por definição, MA S (valores k mais recentes) k. O MA médio muda à medida que novas observações se tornam disponíveis. Média móvel ponderada: no método MA, cada ponto de dados recebe o mesmo peso. Na média móvel ponderada, usamos pesos diferentes para cada ponto de dados. Ao selecionar os pesos, calculamos a média ponderada dos valores de dados k mais recentes. Em muitos casos, o ponto de dados mais recente recebe o maior peso e o peso diminui para pontos de dados mais antigos. A soma dos pesos é igual a 1. Uma maneira de selecionar pesos é usar pesos que minimizem o critério de erro quadrado médio (MSE). Método de suavização exponencial. Este é um método médio ponderado especial. Este método seleciona o peso para a observação mais recente e os pesos para observações mais antigas são calculados automaticamente. Esses outros pesos diminuem à medida que as observações envelhecem. O modelo básico de suavização exponencial é onde F t 1 previsão para o período t 1, t observação no período t. F t previsto para o período t. E um parâmetro de suavização (ou constante) (0 lt a lt1). Para uma série temporal, estabelecemos F 1 1 para o período 1 e as previsões subseqüentes para os períodos 2, 3, podem ser calculadas pela fórmula para F t 1. Usando essa abordagem, pode-se mostrar que o método de suavização exponencial é uma média ponderada de todos os pontos de dados anteriores nas séries temporais. Uma vez que é conhecido, precisamos conhecer t e F t para calcular a previsão para o período t 1. Em geral, escolhemos um que minimiza o MSE. Simples: apropriado para séries em que não há tendência ou sazonalidade. Componente da média móvel (q): as ordens médias em movimento especificam como os desvios da série significam para os valores anteriores são usados ​​para prever os valores atuais. O Expert Time Series Modeler determina automaticamente o melhor ajuste para os dados da série temporal. Por padrão, o Expert Modeler considera os modelos de suavização exponencial e ARIMA. O usuário pode selecionar apenas os modelos ARIMA ou Smoothing e especificar a detecção automática de outliers. O seguinte clipe de filme demonstra como criar um modelo ARIMA usando o método ARIMA e o Expert Modeler fornecido pelo SPSS. O conjunto de dados utilizado para esta demonstração é o conjunto de dados AirlinePassenger. Consulte a página Set de dados para obter detalhes. Os dados do passageiro da companhia aérea são dados como série G no livro Time Series Analysis: Forecasting and Control by Box e Jenkins (1976). O número variável é o total mensal de passageiros em milhares. Sob a transformação do log, os dados foram analisados ​​na literatura. Aplicar modelos de séries temporais. Este procedimento carrega um modelo de série temporal existente a partir de um arquivo externo e o modelo é aplicado ao conjunto de dados SPSS ativo. Isso pode ser usado para obter previsões para séries para as quais dados novos ou revisados ​​estão disponíveis sem começar a construir um novo modelo. A caixa de diálogo principal é semelhante à caixa de diálogo principal Criar modelos. Análise Espectral. Este procedimento pode ser usado para mostrar comportamentos periódicos em séries temporais. Gráficos de Seqüência. Este procedimento é usado para traçar os casos em seqüência. Para executar este procedimento, você precisa de um dado de séries temporais ou de um conjunto de dados ordenado em determinada ordem significativa. Autocorrelações. Este procedimento agrupa a função de autocorrelação e a função de autocorrelação parcial de uma ou mais séries temporais. Cross-Correlations. Este procedimento traça a função de correlação cruzada de duas ou mais séries temporais para atrasos positivos, negativos e zero. Consulte o Menu de ajuda do SPSS para obter informações adicionais sobre o modelo de séries temporais de aplicação, análise espectral, gráficos de sequência, autocorrelações e procedimentos de correlação cruzada. O Taller de Treinamento SPSS online é desenvolvido pelo Dr. Carl Lee, Dr. Felix Famoye. Assistentes assistenciais Barbara Shelden e Albert Brown. Departamento de Matemática, Universidade Central de Michigan. Todos os direitos reservados. Os modelos ARIMA ajustados foram diagnosticados usando AIC, SBC e o teste de taxa de verossibilidade de log. A estimativa de parâmetros para os modelos ARIMA foi feita usando o critério gaussiano MLE. Os modelos ARIMA instalados foram adequados, uma vez que os resíduos padronizados e os resíduos quadrados não foram significativamente correlacionados, conforme demonstrado pelas estatísticas de Ljung-Box Q. Além disso, as estatísticas de J-B rejeitaram fortemente a hipótese nula de normalidade nos resíduos para todas as séries. De acordo com os resultados e a avaliação de diferentes modelos ARIMA, conforme apresentado nas tabelas 4 e 5, respectivamente, o melhor modelo pode ser reescrito da seguinte maneira: da equação (14), com base em um nível de significância de 5%, é claro que o As observações são significativas no primeiro atraso e também a interação entre as observações e os erros são significantes em todos os atrasos para o modelo ajustado. 4.3. Previsões fora de amostra O estudo enfatizou o desempenho da previsão, o que sugere mais foco na minimização de erros de previsão fora da amostra do que na maximização da qualidade de ajuste na amostra. A abordagem adotada foi, portanto, uma modelo de mineração com o objetivo de otimizar o desempenho previsto. As eficiências dos modelos foram avaliadas usando os erros médios quadrados (MSE). O modelo que possuía o MSE mínimo foi considerado o mais eficiente. No entanto, outras propriedades estatísticas, especialmente os diagnósticos e os testes de qualidade de ajuste, foram considerados na escolha do modelo mais eficiente. O MSE para os vários modelos ARMA são apresentados na tabela 4. Tabela 4. O MSE de vários modelos ARMA. 5. Resumo, Conclusão e Recomendações O objetivo do estudo foi modelar e prever o PIB do Quênia com base na metodologia de Box-Jenkins e fornecer previsões de inflação de cinco anos do Quênia. Através da coleta e análise dos dados anuais do PIB do Quênia, determinando a ordem de integração, identificação do modelo, verificação diagnóstica, teste de estabilidade do modelo e avaliação do desempenho da previsão, o melhor modelo ARIMA foi proposto na equação (14) com base no mínimo quadrático médio Critérios de erro. Os gráficos de tempo eo correlograma foram utilizados para testar a estacionaridade dos dados. Além disso, o critério MLE gaussiano foi utilizado para estimar o modelo. 5.2. Principais achados O primeiro achado empírico principal do estudo é o modelo que foi identificado para a previsão do PIB e é apresentado abaixo: Este é o modelo de previsão do PIB no Quênia que é recomendado para uma previsão consistente. Todos os coeficientes foram estatisticamente significativos em 5 por cento. Outras propriedades estatísticas, especialmente os diagnósticos e a qualidade dos testes de ajuste, foram considerados na escolha do modelo mais eficiente. A eficiência do modelo foi determinada usando o erro quadrático médio, conforme mostrado na tabela 4. Vários modelos ARIMA com ordem diferente de termos Autoregressivos e Motivos em Movimento foram comparados com base em seu desempenho, verificados e verificados usando as estatísticas, como AIC, SBC, Log-verosimilhança , Hannan Quinn Criterion e Jarque-Bera. Os resultados indicam que o modelo proposto apresentou desempenho bem em termos de amostra e fora de amostra. A segunda descoberta empírica do estudo são as previsões do PIB de 5 anos do Quênia. As previsões de curto prazo obtidas mostram um aumento no nível do PIB do Quênia. 5.3. Conclusão e Recomendação Através da análise de séries temporais do PIB do Quênia nos anos de 1960 a 2007, o modelo ARIMA (2, 2, 2) foi estabelecido. A transformação da série pelos parâmetros do modelo transformou a seqüência residual em seqüência de ruído branco. O resultado adequado do modelo é convincente e prático usando Gretl. O PIB do Quênia está previsto no modelo. O resultado mostra que o erro relativo está dentro do intervalo de 5, o que é relativamente ideal. De acordo com os valores previstos, o PIB do Quênia mostra uma maior tendência de crescimento nos próximos cinco anos de 2017 a 2017. No entanto, o resultado de previsão deste modelo é apenas um valor previsto, a economia nacional é um sistema complexo e dinâmico. Os ajustes da política macro e as mudanças do ambiente de desenvolvimento causará a mudança relativa dos indicadores macroeconômicos. Portanto, devemos prestar atenção ao risco de ajuste na operação econômica e manter a estabilidade e continuidade da regulação e controle microeconômicos também evitar que a economia cause flutuações severas e ajuste o valor alvo correspondente de acordo com a situação atual. 5.4. Sugestões para pesquisas futuras Dos achados do estudo, as seguintes áreas são sugeridas para novas pesquisas: i. Análise da dinâmica do PIB no Quênia usando diferentes modelos. Ii. Exame de componentes individuais do PIB. Erro padrão dos resíduos 0.0976013 Tabela 6. Previsões do PIB em amostra modelos 1960-2017.ARMA e ARIMA (Box-Jenkins) Modelos ARMA e ARIMA (Box-Jenkins) Nas seções anteriores, vimos como o valor de uma série temporal univariada No tempo t. X t. Pode ser modelado usando uma variedade de expressões médias móveis. Mostramos também que componentes como tendências e periodicidade na série temporal podem ser modelados explicitamente e / ou separados, com os dados sendo decompostos em componentes de tendência, sazonal e residual. Também mostramos, nas discussões anteriores sobre autocorrelação. Que os coeficientes de autocorrelação total e parcial são extremamente úteis na identificação e modelagem de padrões em séries temporais. Esses dois aspectos da análise e modelagem de séries temporais podem ser combinados em uma estrutura de modelagem geral mais geral e, muitas vezes, muito efetiva. Em sua forma básica, esta abordagem é conhecida como modelagem ARMA (média móvel autorregressiva), ou quando a diferenciação está incluída no procedimento, modelagem ARIMA ou Box-Jenkins, após os dois autores que foram fundamentais para o seu desenvolvimento (ver Caixa ampère Jenkins, 1968 BOX1 e Box, Jenkins ampère Reinsel, 1994 BOX2). Não existe uma regra fixa quanto ao número de períodos de tempo necessários para um exercício de modelagem bem sucedido, mas para modelos mais complexos e para maior confiança nos procedimentos de ajuste e validação, muitas vezes são recomendadas séries com 50 etapas de tempo. Os modelos ARMA combinam métodos de autocorrelação (AR) e médias móveis (MA) em um modelo composto das séries temporais. Antes de considerar como esses modelos podem ser combinados, examinamos cada um separadamente. Já vimos que os modelos de média móvel (MA) podem ser usados ​​para proporcionar um ajuste adequado a alguns conjuntos de dados, e as variações nesses modelos que envolvem suavização exponencial dupla ou tripla podem lidar com componentes de tendência e periódicos nos dados. Além disso, esses modelos podem ser usados ​​para criar previsões que imitam o comportamento de períodos anteriores. Uma forma simples de tais modelos, com base em dados anteriores, pode ser escrita como: Onde os termos beta i são os pesos aplicados aos valores anteriores na série temporal, e é usual definir beta i 1, sem perda de generalidade. Assim, para um processo de primeira ordem, q 1 e temos o modelo: ou seja, o valor médio móvel é estimado como uma média ponderada dos valores passados ​​atual e imediato. Esse processo de média é, em certo sentido, um mecanismo de suavização pragmático sem uma ligação direta a um modelo estatístico. No entanto, podemos especificar um modelo estatístico (ou estocástico) que abraça os procedimentos de médias móveis em conjunto com processos aleatórios. Se deixarmos um conjunto de variáveis ​​aleatórias independentes e distribuídas de forma idêntica (um processo aleatório) com variável zero e média conhecida, podemos escrever o processo como uma média móvel da ordem q em termos de: Claramente, o valor esperado de xt abaixo Este modelo é 0, então o modelo só é válido se o xt já tiver sido ajustado para ter um valor zero ou se uma constante fixa (a média do xt) for adicionada à soma. Também é evidente que a variância de xt é simplesmente: a análise acima pode ser estendida para avaliar a covariância, cov (x t. Xtk), que encontramos rendimentos: Note que nem o valor médio, nem a covariância (ou autocovariância) No intervalo k é uma função do tempo, t. Então o processo é estacionário de segunda ordem. A expressão acima nos permite obter uma expressão para a função de autocorrelação (acf): Se k 0 rho k 1 e para k gt q rho k 0. Além disso, o acf é simétrico e rho k rho - k. O acf pode ser calculado para um processo de MA de primeira ordem: o componente de auto-regressão ou AR de um modelo de ARMA pode ser escrito na forma: onde os termos em são coeficientes de autocorrelação em atrasos 1,2. P e z t é um termo de erro residual. Observe que esse termo de erro se relaciona especificamente com o período de tempo atual, t. Então, para um processo de primeira ordem, p 1 e temos o modelo: Essas expressões indicam que o valor estimado de x no tempo t é determinado pelo valor imediatamente anterior de x (ou seja, no tempo t -1) multiplicado por uma medida alfa . Da medida em que os valores para todos os pares de valores em períodos de tempo de desfasamento 1 separados estão correlacionados (isto é, sua autocorrelação), além de um termo de erro residual, z. No tempo t. Mas esta é precisamente a definição de um processo de Markov. Então um processo Markov é um processo autoregressivo de primeira ordem. Se alfa 1, o modelo afirma que o próximo valor de x é simplesmente o valor anterior mais um termo de erro aleatório e, portanto, é uma caminhada aleatória simples de 1D. Se mais termos estiverem incluídos, o modelo estima o valor de x no tempo t por uma soma ponderada desses termos mais um componente de erro aleatório. Se substituímos a segunda expressão acima no primeiro, temos: e a aplicação repetida desses rendimentos de substituição: agora, se alfa lt1 e k é grande, esta expressão pode ser escrita na ordem inversa, com termos decrescentes e com contribuição do termo Em x no lado direito da expressão tornando-se um pouco pequeno, então temos: Como o lado direito desta expressão é o modelo xt como a soma de um conjunto ponderado de valores anteriores, neste caso termos de erro aleatório, é claro que Este modelo de AR é, de fato, uma forma de modelo MA. E se assumirmos que os termos de erro têm variância média e variável constante, então, como no modelo MA, temos o valor esperado do modelo como também 0, assumindo que o xt foi ajustado para fornecer uma média zero, com variância: Agora como Enquanto Alpha lt1, este somatório é finito e é simplesmente 1 (1-alfa), então temos: Tal como acontece com o modelo MA acima, esta análise pode ser estendida para avaliar a covariância, cov (x t. X tk) de um primeiro Ordem de processo de AR, que encontramos rendimentos: Para alfa lt1, este somatório é finito e é simplesmente alfa k (1- alfa 2), então temos: Isso demonstra que, para um modelo autoregressivo de primeira ordem, a função de autocorrelação (acf) é simplesmente definida Por potências sucessivas da autocorrelação de primeira ordem, com a condição alpha lt1. Para alpha gt0, isso é simplesmente uma potência que diminui rapidamente ou uma curva exponencial, tendendo para zero, ou para lt0 é uma curva oscilante de amortecimento, novamente tendendo para zero. Se for feita uma suposição de que as séries temporais estão estacionárias, a análise acima pode ser estendida para autocorrelações de segunda e alta ordem. Para ajustar um modelo de AR a um conjunto de dados observado, procuramos minimizar a soma de erros quadrados (um ajuste de mínimos quadrados) usando o menor número de termos que proporcionam um ajuste satisfatório aos dados. Modelos deste tipo são descritos como autoregressivos. E pode ser aplicado tanto em séries temporais como em conjuntos de dados espaciais (veja mais detalhes, modelos de autoregressão espacial). Embora, em teoria, um modelo autorregressivo possa fornecer um bom ajuste para um conjunto de dados observado, geralmente exigiria remoção prévia e tendência e componentes periódicos e, mesmo assim, talvez precisasse de uma grande quantidade de termos, a fim de proporcionar um bom ajuste aos dados. No entanto, ao combinar os modelos AR com modelos MA, podemos produzir uma família de modelos mistos que podem ser aplicados em uma ampla gama de situações. Esses modelos são conhecidos como modelos ARMA e ARIMA, e são descritos nas seguintes subseções. Nas duas subseções anteriores, introduzimos o modo de ordem MA q: e o modelo AR da ordem p: Podemos combinar esses dois modelos simplesmente adicionando-os como um modelo de ordem (p. Q), onde temos termos p AR E q termos MA: Em geral, esta forma de modelo ARMA combinado pode ser usada para modelar uma série de tempo com menos termos em geral do que um MA ou um modelo AR por eles mesmos. Ele expressa o valor estimado no tempo t como a soma de q termos que representam a variação média da variação aleatória em q períodos anteriores (o componente MA), mais a soma dos termos p AR que calculam o valor atual de x como a soma ponderada Dos mais recentes valores. No entanto, esta forma de modelo pressupõe que a série temporal é estacionária, o que raramente é o caso. Na prática, tendências e periodicidade existem em muitos conjuntos de dados, então é necessário remover esses efeitos antes de aplicar esses modelos. A remoção é geralmente realizada ao incluir no modelo um estágio de diferenciação inicial, tipicamente uma vez, duas ou três vezes, até que a série seja pelo menos aproximadamente estacionária - não exibindo tendências ou periodicidades óbvias. Tal como acontece com os processos MA e AR, o processo de diferenciação é descrito pela ordem de diferenciação, por exemplo, 1, 2, 3. Coletivamente, esses três elementos compõem um triplo: (p. D. Q) que define o tipo de modelo aplicado. Nesta forma, o modelo é descrito como um modelo ARIMA. A letra I em ARIMA refere-se ao fato de que o conjunto de dados foi inicialmente diferenciado (ver diferenciação) e quando a modelagem é completa, os resultados devem ser somados ou integrados para produzir as estimativas e previsões finais. A modelagem ARIMA é discutida abaixo. Conforme observado na subseção anterior, combinar a diferenciação de uma série temporal não estacionária com o modelo ARMA fornece uma poderosa família de modelos que podem ser aplicados em uma ampla gama de situações. O desenvolvimento desta forma estendida de modelo é em grande parte devido a G E P Box e G M Jenkins e, como resultado, os modelos ARIMA também são conhecidos como modelos Box-Jenkins. O primeiro passo no procedimento Box-Jenkins é diferenciar as séries temporais até ficar estacionário, garantindo assim que a tendência e os componentes sazonais sejam removidos. Em muitos casos, uma ou duas fases de diferenciação é suficiente. A série diferenciada será mais curta do que a série fonte por etapas de tempo c, onde c é o alcance da diferença. Um modelo ARMA é ajustado às séries temporais resultantes. Como os modelos ARIMA têm três parâmetros, existem muitas variações para os possíveis modelos que poderiam ser instalados. No entanto, a decisão sobre o que esses parâmetros devem ser pode ser guiada por uma série de princípios básicos: (i) o modelo deve ser tão simples quanto possível, ou seja, conter o menor número possível de termos, o que, por sua vez, significa os valores de p e q Deve ser pequeno (ii) o ajuste aos dados históricos deve ser o melhor possível, ou seja, o tamanho das diferenças quadradas entre o valor estimado em qualquer período passado e o valor real, deve ser minimizado (princípio dos mínimos quadrados) - os resíduos Do modelo selecionado pode então ser examinado para ver se os resíduos restantes são significativamente diferentes de 0 (veja mais adiante, abaixo) (iii) a autocorrelação parcial medida em atrasos 1,2,3. Deve fornecer uma indicação da ordem do componente AR, ou seja, o valor escolhido para q (iv) o plano da função autocorrelação (acf) pode sugerir o tipo de modelo ARIMA necessário - a tabela abaixo (do NIST) fornece orientação sobre Interpretando a forma do acf em termos de seleção do modelo. ARIMA Seleção do tipo de modelo usando forma acf A série não é estacionária. Os modelos ARIMA padrão são freqüentemente descritos pelo triplo: (p. D. Q) como observado acima. Estes definem a estrutura do modelo em termos da ordem de AR, diferenciação e modelos MA a serem usados. Também é possível incluir parâmetros semelhantes para a sazonalidade nos dados, embora tais modelos sejam mais complexos para se adequarem e interpretarem - as tripas (P. D. Q) geralmente são usadas para identificar esses componentes do modelo. Na captura de tela do SPSS mostrado abaixo, o diálogo para seleção manual de elementos estruturais não sazonais e sazonais é exibido (instalações similares estão disponíveis em outros pacotes integrados, como SASETS). Como pode ser visto, a caixa de diálogo também permite que os dados sejam transformados (normalmente para auxiliar na estabilização de variância) e para permitir que os usuários incluam uma constante no modelo (o padrão). Esta ferramenta de software particular permite a detecção de valores atípicos, se necessário, de acordo com uma série de procedimentos de detecção, mas, em muitos casos, os valores atípicos terão sido investigados e ajustados ou removidos e valores de substituição estimados antes de qualquer análise. SPSS Time Series Modeler: modelagem ARIMA, modo especialista. Uma série de modelos ARIMA podem ser instalados nos dados, manualmente ou através de um processo automatizado (por exemplo, um processo escalonado) e uma ou mais medidas usadas para avaliar qual é o melhor em termos de Ajuste e parcimônia. A comparação do modelo normalmente faz uso de uma ou mais das medidas teóricas da informação descritas anteriormente neste manual - AIC, BIC e ou MDL (a função R, arima (), fornece a medida AIC, enquanto a SPSS fornece uma gama de medidas de ajuste, incluídas uma A versão da estatística BIC outras ferramentas variam nas medidas fornecidas - Minitab. Que fornece uma variedade de métodos TSA, não inclui estatísticas de tipo AICBIC). Na prática, uma ampla gama de medidas (ou seja, além das medidas baseadas em mínimos quadrados) podem ser usadas para avaliar a qualidade do modelo. Por exemplo, o erro absoluto médio e o erro absoluto absoluto podem ser medidas úteis, pois mesmo um mínimo O ajuste de quadrados pode ainda ser fraco em alguns lugares. Uma série de pacotes de software também pode fornecer uma medida geral da autocorrelação que pode permanecer nos resíduos após o ajuste do modelo. Uma estatística freqüentemente aplicada é devido a Ljung e Box (1978 LJU1) e É da forma: onde n é o número de amostras (valores de dados), ri é a autocorrelação de amostra no intervalo i. E k é o número total de atrasos em relação aos quais a computação é realizada. Q k é aproximadamente distribuído como um chi - distribuição quadrada com graus de liberdade k - m, onde m é o número de parâmetros utilizados na montagem do modelo, excluindo qualquer termo constante ou variáveis ​​preditoras (ou seja, apenas incluindo os triplos de pd q). Se a medida é estatisticamente significativa Indica que os resíduos ainda contêm autocorrelação significativa após o modelo ter sido montado, sugerindo que um modelo melhorado deve ser buscado. Exemplo: Modelando o crescimento do número de passageiros de companhias aéreas O seguinte é um exemplo de montagem automatizada, usando o SPSS para os dados do teste Box-Jenkins-Reinsel dos números de passageiros da companhia aérea REI1 fornecidos anteriormente neste Manual. Inicialmente, nenhuma especificação das datas foram meses dentro de anos foi especificada. O modelo selecionado pelo processo automatizado foi um modelo ARIMA (0,1,12), ou seja, o processo identificou corretamente que a série exigia um nível de diferenciação e aplicava um modelo de média móvel com uma periodicidade de 12 e nenhum componente de autocorrelação para caber dados. O ajuste do modelo produziu um valor R 2 de 0.966, que é muito alto e um erro absoluto absoluto (MAE) de 75. O ajuste visual do modelo aos dados parece excelente, mas o enredo da autocorrelação residual após o encaixe e Ljung O teste de caixa mostra que a autocorrelação significativa permanece, indicando que um modelo melhorado é possível. ARIMA automatizado para passageiros da linha aérea internacional: totais mensais, 1949-1960 Para investigar isso, um modelo revisado foi ajustado, com base na discussão desse conjunto de dados por Box e Jenkins (1968) e a edição atualizada do livro Chatfields (1975 CHA1) em Que ele usa o Minitab para ilustrar sua análise (6ª edição, 2003). A série temporal foi definida como tendo uma periodicidade de 12 meses e um modelo ARIMA com componentes (0,1,1), (0,1,1). Gráficamente, os resultados parecem muito semelhantes ao gráfico acima, mas com este modelo o R-squared é 0.991, o MAE41 e a estatística Ljung-Box não são mais significativos (12.6, com 16 graus de liberdade). O modelo é, portanto, uma melhoria na versão original (gerada automaticamente), sendo composta por um MA não-sazonal e um componente de MA sazonal, sem componente autoregressivo e um nível de diferenciação para as estruturas sazonais e não sazonais. Se o encaixe é manual ou automatizado, um modelo ARIMA pode fornecer uma boa estrutura para modelar uma série temporal, ou pode ser que os modelos ou abordagens alternativas ofereçam um resultado mais satisfatório. Muitas vezes, é difícil saber antecipadamente o quão bom é um modelo de previsão dado, uma vez que é somente à luz de sua capacidade de prever valores futuros da série de dados que pode ser verdadeiramente julgado. Muitas vezes, este processo é aproximado, ajustando o modelo aos dados passados, excluindo períodos de tempo recentes (também conhecidos como amostras de retenção) e, em seguida, usando o modelo para prever esses eventos futuros conhecidos, mas mesmo isso oferece apenas uma confiança limitada em sua validade futura. A previsão a longo prazo pode ser extremamente pouco confiável usando tais métodos. Claramente, o modelo de estatísticas de tráfego aéreo internacional descrito acima não é capaz de prever corretamente os números dos passageiros até a década de 1990 e além, nem a queda de 5 anos no número de passageiros das companhias aéreas internacionais dos EUA, pós 9112001. Da mesma forma, um modelo ARIMA pode ser ajustado a valores históricos De preços de bolsa de valores ou valores de índice (por exemplo, os índices NYSE ou FTSE) e normalmente fornecerão um ajuste excelente aos dados (obtendo um valor de R-quadrado superior a 0,99), mas geralmente são pouco úteis para prever os valores futuros desses preços Ou índices. Normalmente, os modelos ARIMA são usados ​​para previsão, particularmente no campo da modelagem macro e microeconômica. No entanto, eles podem ser aplicados em uma ampla gama de disciplinas, seja na forma descrita aqui, ou aumentadas com variáveis ​​de preditores adicionais que acreditam melhorar a confiabilidade das previsões feitas. Estes últimos são importantes porque toda a estrutura dos modelos ARMA discutidos acima depende de valores anteriores e eventos aleatórios independentes ao longo do tempo, e não em quaisquer fatores explicativos ou causais. Daí, os modelos ARIMA apenas refletirão e estenderão os padrões passados, o que talvez precise ser modificado nas previsões por fatores como o ambiente macroeconômico, as mudanças tecnológicas ou o recurso a longo prazo e as mudanças ambientais. BOX1 Box G E P, Jenkins G M (1968). Alguns avanços recentes em previsão e controle. Estatística Aplicada, 17 (2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Time Series Analysis, Forecasting and Control. 3ª ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) The Analysis of Times Series: Theory and Practice. Chapman and Hall, Londres (ver também, 6º ed., 2003) LJU1 Ljung G M, Box G E P (1978) Em uma medida de falta de modelos em série Time Series. Biometrika, 65, 297303 NISTSEMATECH e-Handbook of Statistical Methods, itl. nist. govdiv898handbook Seção 6.4: Introdução às séries temporais. 2010 SPSSPASW 17 (2008) AnalyzeForecasting (Modelos de séries temporais) REI1 Reinsel G C Datasets para modelos Box-Jenkins: stat. wisc. edu

No comments:

Post a Comment