Mestrado em Matemática Financeira - Econometria dos Mercados Financeiros (FCUL e ISCTE) PDF
Document Details
Uploaded by ModernLoyalty3795
FCUL e ISCTE
Diana Aldea Mendes
Tags
Summary
This document provides an overview of econometrics, focusing on financial markets. It covers various data types, including structured and unstructured data. It introduces regression analysis and correlation, highlighting the concept that correlation does not imply causation.
Full Transcript
Mestrado em Matemática Financeira, FCUL e Iscte Econometria dos Mercados Financeiros Semana 1 Diana Aldea Mendes [email protected] Introdução O que é econometria? Técnicas e metodologias estatísticas e matemáticas desenvolvidas para responder a questões práticas provenientes de econ...
Mestrado em Matemática Financeira, FCUL e Iscte Econometria dos Mercados Financeiros Semana 1 Diana Aldea Mendes [email protected] Introdução O que é econometria? Técnicas e metodologias estatísticas e matemáticas desenvolvidas para responder a questões práticas provenientes de economia (finanças, marketing, contabilidade) Podemos avaliar teorias sobre economia e finanças, formular hipóteses, analisar dados empíricos e criar/ajustar modelos,... Econometria teórica (econometric theory): desenvolvimento de novos métodos e o estudo das suas propriedades aplicada (applied econometrics): desenvolvimento e aplicação de ferramentas para resolver questões práticas relevantes Econometria Financeira - direcionada para resolução de problemas das Finanças Empíricas 10 Introdução 11 Introdução: Dados Estruturados numéricos (quantitativos) contínuos (float, numeric) - pode tomar qualquer valor num intervalo discretos (integer) - apenas pode tomar valores discretos (contagem) categóricos (qualitativos) binários (boolean, logical) nominais e ordinais (ordered factor) Não-estruturados texto, imagens, audio 12 Introdução: Dados Natureza séries temporais (sucessão de observações medidas ao longo do tempo) Preços mensais do petróleo cross-section data (dados que caracterizam uma ou mais variáveis observadas num único momento de tempo) Preço de venda de um iphone 15 em todas as lojas online (hoje) dados em painel (panel data): são dados de tipo cross-section observados em vários momentos de tempo Variação mensal da inflação dos últimos 3 anos de todos os paises da Comunidade Europeia 13 Organização de dados (estruturados) Os dados estruturados estão organizados em tabelas (data frames), onde: Nas colunas (columns) temos: Variáveis (atributos, medições, features, etc) Nas linhas (rows) temos: Observações (registos, instâncias, etc) 14 Regressão e Correlação Existem diversas formas de associação entre variáveis numéricas. Por exemplo, podemos ter relações lineares, exponenciais ou quadráticas. O mais habitual é encontrar uma associação/relação linear entre as variáveis. Uma relação puramente linear entre duas variáveis, traduz-se num gráfico de dispersão onde os pontos se encontram dispostos sobre uma reta de declive positivo/negativo. Quando duas variáveis são independentes, o diagrama de dispersão apresenta uma mancha de pontos aleatória ou um conjunto de pontos dispostos sobre uma reta horizontal. 15 Regressão e Correlação Regressão: tem como resultado uma equação funcional que descreve o relacionamento entre variáveis; Correlação: medida do grau de relacionamento entre as variáveis, ou seja, mede a força do relacionamento existente, sem contudo indicar qual das variáveis é independente e qual é dependente (a correlação não é causal). 16 Regressão e Correlação Você já ouviu falar que o consumo de gelado está ligado a ataques de tubarão? Existe correlação entre estas duas variáveis, mas, isto não significa necessariamente que os ataques de tubarão sejam desencadeados pelo consumo de gelado: “Correlation Does Not Imply Causation” 17 Regressão e Correlação 18 Correlação/Associação entre variáveis Ró (Rho) de Spearman para ordinal vs ordinal (ou ordinal vs quantitativa) ; Tau de Kendall para ordinal vs ordinal de Pearson para quantitativas vs quantitativas. 19 Correlação de Pearson O coeficiente de correlação linear (de Pearson) entre as variáveis quantitativas e é dado por: Os coeficientes de correlação variam entre -1 e 1. Valores perto de -1 ou 1 indicam uma forte relação entre as duas variáveis, negativa se se aproximar de -1 e positiva se se aproximar de 1. Valores próximos de zero - denotam independência ou ausência de correlação. 20 Ró de Spearman Ró de Spearman - é uma medida de correlação de rankings (rank correlation) que se aplica quando pretendemos analisar a relação entre duas variáveis ordinais e. Usa no seu cálculo os valores de ordem (postos, rankings) e não os valores observados, isto é: onde ordem de entre os valores de - (ordem de entre os valores de ) 21 Ró de Spearman O cálculo do coeficiente de correlação de Spearman é mais robusto na presença de outliers e assimetrias (do que Pearson). Toma valores entre -1 e 1, tendo a mesma interpretação que o coeficiente de correlação de Pearson. Pose ser utilizado quando não existe normalidade e/ou não existe relação linear entre as variáveis. 22 Regressão Alguns Modelos de Regressão: Regressão linear (simples e múltipla) Regressão polinomial Regressão Ridge Regressão Lasso Regressão Logística Regressão quantílica Regressão com árvores de decisão 24 Regressão linear simples Regressão: técnica estatística para modelar e investigar a relação entre variáveis, baseada num modelo probabilístico: y = componente determinística + erro aleatório Regressão linear simples (a componente determinística é linear, existe uma única variável explicativa ou independente): denota-se por variável independente, por variável dependente é o erro aleatório, é o ponto de intersecção com o eixo dos yy (y-intercept), é o declive, e são os coeficientes (parâmetros) de regressão 25 Regressão linear simples (RLS) Objetivo: queremos indicar qual é a variação de como função de 26 Interpretação dos coeficientes (RLS) é o valor esperado de quando todas as outras variáveis são nulas : O aumento de uma unidade em implique uma alteração, em média, de unidades em (efeito da variável independente/explicativa sobre a variável dependente/alvo/resposta/explicada) Exemplo: Considere o seguinte modelo de regressão linear simples (reta etimada): , onde é o salário do indivíduo e representa os anos de experiência do indivíduo diz-nos qual é o valor médio do salário para trabalhadores sem experiência diz-nos quanto varia o salário por cada ano adicional de experiência 27 Regressão linear simples Processo para desenvolver um modelo, estimar os parâmetros não-conhecidos, validar e utilizar o modelo 1. Fazer uma análise gráfica (diagrama de dispersão) dos pares de pontos da a- mostra ( ) e assumir (se possível) que existe uma relação linear entre e 2. Utilizar a amostra para estimar os parâmetros não-conhecidos do modelo (ajustar o modelo) 3. Especificar a distribuição de probabilidades do termo aleatório/erro (pressupostos dos resíduos) 4. Estudar a adequabilidade estatística do modelo (validar o modelo) 5. O modelo validado pode ser utilizado para estimação e predição. 28 Regressão linear simples Passo 1: Análise gráfica Podemos ajustar uma reta aos pares de pontos? Qual é a reta que "melhor" se ajuste aos pontos? 29 Regressão linear simples Passo 2: Estimar os parâmetros (Método dos Mínimos Quadrados) Para determinar se a reta considerada ajusta-se bem os dados, calculamos os desvios verticais, , (erros, resíduos), isto é, a diferença entre os pontos observados e os pontos preditos , onde representa o desvio (resíduo) do valor. Como as observações estão afetadas de erros não é possível saber o valor exato dos coeficientes e. No entanto é possível estimá-los. O método que conduz aos melhores resultados é o método dos mínimos quadrados (OLS - ordinary least square). 30 Regressão linear simples Passo 2: Estimar os parâmetros (Método dos Mínimos Quadrados) O objetivo é encontrar estimadores dos parâmetros que minimizem a soma dos quadrados dos desvios (resíduos da regressão), isto é: onde designa-se por função de perda (loss function) As quantidades e chamam-se estimadores mínimos quadrados dos parâmetros e Portanto: a linha dos mínimos quadrados ou linha de regressão é a linha que tem a soma dos quadrados dos desvios (resíduos) mínima. 31 Regressão linear simples Passo 2: Estimar os parâmetros (Método dos Mínimos Quadrados) Condições de primeira ordem onde e e onde é o tamanho da amostra. A reta de regressão dos mínimos quadrados passa sempre pelo ponto. As estimativas obtidas e a linha de regressão são válidas só para a amostra dada. 32 Regressão linear simples Passo 3: Pressupostos do Modelo de Regressão Linear Vamos estudar agora a componente aleatória , Temos os seguintes pressupostos para o termo erro: 1. A média da distribuição de probabilidades de é zero: , 2. Homocedasticidade (variância constante): 3. Não existe autocorrelação entre e. 4. A distribuição de probabilidades de é normal: 5. A variável explicativa é independente dos resíduos: (aplica-se de imediato se a variável não for aleatória). 33 Regressão linear simples Passo 3: Pressupostos do Modelo de Regressão Linear O termo de erro empírico é a componente residual que resulta da estimação dos parâmetros. A análise dos resíduos permite avaliar se o modelo assumido é adequado. Na prática, verificamos/analisamos se o termo resídual é um processo de ruído branco gaussiano (os primeiros 4 pressupostos). 34 Regressão linear simples Passo 4: Validação do modelo (significância estatística das variáveis) Para testar a hipótese dos coeficientes estimados e serem iguais a certos valores e , contra a hipótese alternativa de serem significativamente diferentes desses valores, utiliza-se a estatística -Student, dado que não é conhecido, isto é: 35 Regressão linear simples Passo 4: Validação do modelo Na prática, vamos testar se o declive da reta é nulo (ou seja, se não depende de ) região de rejeição : ou ou: 36 Regressão linear simples Passo 4: Validação do modelo Também pode ter interesse testar se a ordenada na origem (intercept) é nula: Nota: Nos ouput's dos modelos de regressão, a vais ser associada a significância estatística da variável que multiplica o parâmetro. Se rejeitamos a , então , logo é estatisticamente significativa. 37 Regressão linear simples Passo 5: Aplicar o modelo de regressão linear Previsão: Previsão dentro da amostra (in-sample): para verificar a capacidade do modelo em fazer previsão Previsão fora da amostra (out-of-sample): prever valores futuros da variável dependente Estimar efeitos causais Estimar parâmetros para para serem usados num modelo diferente 38 Regressão linear simples Métricas de avaliação (qualidade de ajustamento) Coeficiente de determinação: , é o coeficiente de correlação amostral elevado ao quadrado. Toma valores entre 0 e 1. Interpretação: mede a percentagem de variabilidade de uma das variáveis explicada pela outra (uma medida de variabilidade é a variância). 39 Regressão linear simples Métricas de avaliação (qualidade de ajustamento) , quanto mais elevado o valor de tanto melhor o modelo ajusta- se aos dados Dizer que o coeficiente de determinação é por exemplo 0.6 significa que da variância de uma das variáveis (na regressão considera-se a variável alvo/dependente) é provocada (explicada) pela outra variável (independente) e apenas é de natureza independente. 40 Regressão linear simples Para poder utilizar o método de estimação dos mínimos quadrados (OLS), precisamos de um modelo que seja linear nos seus parâmetros (a linearidade das variáveis não é necessária). Alguns modelos não-lineares (nos parâmetros) podem ser transformados em modelos lineares fazendo substituições/transformações simples (por exemplo logaritmizar as variáveis, inverter as variáveis, etc) 41 Regressão linear simples Teorema de Gauss-Markov. Dados os pressupostos do modelo de regressão linear, os estimadores mínimos quadrados (OLS), na classe de estimadores lineares não enviesados, têm variância mínima; isto é, eles são BLUE (best linear unbiased estimators). Propriedades dos estimadores OLS Não enviesamento: Eficiência: Média dos quadrados dos erros mínima: Consistência: , (Um estimador é consistente se a distribuição de probabilidade do estimador se concentra num só ponto (o verdadeiro parâmetro) à medida que o tamanho da amostra se torna arbitrariamente grande.) 42 Mestrado em Matemática Financeira, FCUL e Iscte Econometria dos Mercados Financeiros Semana 2 Diana Aldea Mendes [email protected] Regressão linear múltipla Pretendemos modelar a variável dependente (resposta, target), , com base em variáveis independentes (preditoras, features),. Os valores esperados de são dados por uma combinação linear das variáveis independentes, isto é: Portanto, num modelo de regressão múltipla, existem eixos - um para cada variável em questão e pontos - um para cada elemento observado (tem- se uma nuvem de pontos num espaço -dimensional). Regressão linear - por ser linear nos parâmetros Regressão múltipla - por ter várias variáveis independentes 3 Regressão linear múltipla A expressão geral de um modelo de Regressão Linear Múltipla define-se por: Que corresponde a escrever um sistema linear de equações com variáveis (os 's a estimar) 4 Regressão linear múltipla Modelo de Regressão Linear Múltipla em notação matricial: onde é o vector aleatório das componentes da variável dependente (target); é a matriz (não aleatória) cujas colunas são dadas pelas observações de cada variável independente e pela constante aditiva do modelo (coluna unitária); 5 Regressão linear múltipla é o vector (não aleatório) dos parâmetros do modelo; representa a contribuição da variável sobre a variável dependente (ou seja, indica a sensibilidade de quando a respectiva variável explicativa varia uma unidade) mantendo-se todas as outras constantes; é o vector erro definido por componentes de ruído branco gaussiano; A soma de quadrados dos resíduos (SSE) é dada (em forma matricial) por: , onde e representa o valor estimado da variável dependente. 6 Regressão linear múltipla O método de estimação dos mínimos quadrados tem por objectivo encontrar um vector de estimadores que minimizem a soma dos quadrados dos resíduos (problema de otimização). Condições de primeira ordem: Obtem-se um sistema de equações lineares dadas pelas derivadas parciais de primeira ordem, isto é: Se tem característica , então a matriz é invertível e, portanto, a solução do sistema de equações é única (e determinada). 7 Regressão linear múltipla A solução única do sistema de equações corresponde ao estimador de mínimos quadrados de e é dado por: Os desvios padrão (SE) dos coeficientes estimados são dados por: Os estimadores das variâncias dos são dados pelos elementos da diagonal principal da matriz de variância-covariância, isto é 8 Regressão polinomial Forma geral do modelo de regressão polinomial de ordem : onde é um inteiro e são parâmetros não-conhecidos a estimar Quando obtem-se o modelo de regressão linear simples Para obtem-se o modelo de segunda ordem (quadrático em ), isto é: onde é a intersecção com o eixo dos desloca a parábola para esquerda e direita e representa a concavidade. Todos os modelos de regressão polinomial são lineares nos parâmetros. 9 Modelos de inter-acção Usam-se para analisar a interacção entre uma variável numérica e uma variável binária (categórica, variáveis dummy) Por exemplo: é a intersecção com o eixo dos , ou seja, o valor de quando e : mudar e provoca um deslocamento da superfície ao longo dos eixos dos e controla a rotação da superfície e : controlam o tipo de superfície e a taxa de curvatura (parabolóide, hiperbolóide, etc.) 10 Variáveis dummy As variáveis dummy são, das variáveis qualitativas nominais, aquelas que são mais utilizadas em trabalhos aplicados. Por exemplo, se se pretender estudar a diferenciação salarial entre homens e mulheres, de uma dada categoria, numa certa empresa, a variável dummy a utilizar seria, por exemplo: é é Ou seja, uma variável dummy é uma variável binária, que usualmente assume os valores 0 e 1. 11 Variáveis dummy Modelo de regressão linear com uma variável dummy (independente ou aditiva) Se , então Se , então Modelo de regressão linear com variável dummy que inter-acciona com uma variável Se , então Se , então 12 Regressão linear com variáveis dummy Efeito de uma variável dummy (aditiva) no modelo de regressão linear - muda o intercept 13 Regressão linear com variáveis dummy Efeito de uma variável dummy (inter-acção) no modelo de regressão linear - muda o ontercept e o declive 14 Regressão linear Todos os modelos de regressão apresentados são lineares nos parâmetros, o que implique que os mesmos podem ser estimados usando o método dos mínimos quadrados (OLS) Multicolinearidade e VIF Um par de variáveis dizem-se multicolineares se Detetar multicolinearidade: VIF > 5 (variance inflation factor) 15 Multicolinearidade e VIF O termo multicolinearidade é usado para indicar a presença de relações (quase) lineares, ou (quase) não-lineares, entre as variáveis explicativas (independentes) do modelo de regressão linear. Caso a correlação entre duas ou mais variáveis explicativas seja elevada, então, as estimativas dos mínimos quadrados são indeterminadas; o sistema de equações OLS conduz a uma matriz singular, não invertível, que admite infinitas soluções Soluções para a multicolinearidade: Eliminação de variáveis (problemáticas) do modelo Transformação de variáveis (e.g. dados per capita em vez de dados agregados) Análise factorial (ou ACP) das variáveis originais 16 Inferência - Test t Eliminar variáveis que tem pouca ou nenhuma contribuição na variabilidade da variável dependente. Estatística de teste: Rejeitar se : -value , onde é o nível de significância considerado. Rejeitar quer dizer que a variável independente é estatisticamente significativa para explicar a variabilidade da resposta e deve permanecer no modelo. 17 Inferência - Test F Os testes t para cada um dos parâmetros b não constituem a melhor forma para determinar a adequabilidade global do modelo (testam hipóteses que envolvem um único parâmetro). Precisamos de um modelo global (que inclui todos os b) para testar a utilidade do modelo Construímos o seguinte teste de hipóteses (a partir da estatística ) versus : pelo menos um é não-nulo 18 Inferência - Test F A estatística teste (global) utilizada para testar a utilidade do modelo é uma estatística , definida por ou seja o quociente da variabilidade explicada dividida pelos graus de liberdade do modelo sobre a variabilidade inexplicada dividida pelos graus de liberdade do erro. Quanto maior a proporção de variabilidade total, tanto maior o valor da estatística , e portanto Região de rejeição: (a distribuição só tem valores positivos e é assimétrica), ou 19 Inferência A rejeição da leva-nos a conclusão (com nível de confiança ) que o modelo escolhido e adequado e podemos proceder com a sua aplicação. Contudo, não implica que é o melhor modelo possível. Tão importante quanto ter um próximo a 1 , é que a estimativa de também seja pequena, pois os intervalos de confiança para os parâmetros de interesse são proporcionais a. O Teste permite apenas concluir que algumas variáveis explicativas são realmente importantes (mas não sabemos quais). O Teste permite selecionar as variáveis independentes (explicativas) que são significativas para o modelo. 20 Pressupostos dos resíduos Apresentam-se os 5 pressupostos que o termo erro do modelo de regressão linear (ou, no modelo estimado, o termo dos resíduos) deve verificar: 1. (os erros tem média zero) 2. (a variância dos erros é constante e finita) 3. (os erros são linearmente independentes) 4. (não existe nenhuma relação entre os erros e as variáveis independentes) 5. (os erros são normalmente distribuídos) 21 Pressupostos dos resíduos Verificação do primeiro pressuposto: Se o modelo de regressão contém um termo constante (intercept) não-nulo , então este pressuposto nunca vai ser violado Se então: pode ser negativo (portanto, a média amostral explica mais sobre a variação de do que as variáveis independentes) Pode levar ao enviesamento nas estimativas dos coeficientes. 22 Pressupostos dos resíduos Verificação do segundo pressuposto: (Homocedasticidade) Representação gráfica (diagrama de dispersão) dos resíduos vs. uma (ou mais exactamente, vs. cada uma) das variáveis independentes (método superficial) (procuramos gráficos em forma de funil, que mostram que a variância não é constante, ou seja, é heterocedástica) Como detectar a homocedasticidade (testes de hipótese): O teste de Goldfeld-Quandt ( : erros homocedásticos) Teste LM de Breusch-Pagan ( : erros homocedásticos) O teste de White ( : erros homocedásticos) 23 Pressupostos dos resíduos 24 Pressupostos dos resíduos O que acontece se os erros são heterocedásticos, mas, ignoramos este facto? Os estimadores dos mínimos quadrados continuam a ser centrados e consistentes, mas deixam de ser eficientes e os intervalos de confiança e testes de hipóteses baseados nas distribuições e não são fidedignos Remédios para a heterocedasticidade Método dos mínimos quadrados ponderados (WLS - Consiste em dividir ou deflacionar ambos os membros da equação de regressão por um fator conhecido, de modo a que o erro transformado seja homocedástico.) Estimação ML (máxima verosimilhança) Re-especificação do modelo: A transformação logarítmica muitas vezes reduz os problemas de heterocedasticidade 25 Pressupostos dos resíduos Verificação do terceiro pressuposto: (independência dos resíduos): Teste de Durbin-Watson = teste de autocorrelação de primeira ordem, com hipótese nula (os erros são independentes, não existe correlação). Se é rejeitada, então existe correlação entre resíduos sucessivos. O teste de Durbin-Watson é válido se as seguintes condições são verificadas: A regressão tem intercept não-nulo, Os regressores (variáveis independentes) são não-estocásticos, Na regressão não podem aparecer lags (desfasamentos) da variável dependente. 26 Pressupostos dos resíduos Quando o teste de Durbin-Watson falha, aplica-se o teste de Breusch-Godfrey (que permite avaliar a autocorrelação entre uma variável e qualquer lag de qualquer ordem da respetiva variável) Hipótese nula do teste de Breusch-Godfrey: : resíduos independentes (ou: o erro presente não é relacionados com nenhum dos seus valores prévios) Rejeitar a - significa que os erros são auto-correlacionados. 27 Pressupostos dos resíduos O que acontece se os erros são auto-correlacionados, mas, ignoramos este facto? Os estimadores dos mínimos quadrados continuam a ser centrados e consistentes, mas deixam de ser eficientes e os intervalos de confiança e testes de hipóteses baseados nas distribuições e não são fidedignos Remédios para a auto-correlação dos erros Método dos mínimos quadrados ponderados (WLS) Introdução dos modelos dinâmicos (o remédio mais frequente): distributed lag e autoregressive distributed lag models Estimar o modelo nas primeiras diferenças em vez de níveis (ou seja em vez de 28 Pressupostos dos resíduos Verificação do quarto pressuposto: são não-estocásticos Os estimadores dos mínimos quadrados continuam a ser centrados e consistentes, na presença de variáveis independentes estocásticas, desde que os regressores não são correlacionados com os erros da equação estimada. Caso contrário, os estimadores dos mínimos quadrados deixam de ser consistentes 29 Pressupostos dos resíduos Verificação do quinto pressuposto: A hipótese de que os resíduos são normalmente distribuídos é muito importante para a realização de testes de hipóteses e intervalos de confiança sobre os parâmetros e para verificar esta hipótese podem ser usados: Testes aos coeficientes de assimetria e de curtose Testes de Jarque-Bera, Kolmogorov-Smirnov ( : normalidade) Para grandes amostras, podemos recorrer ao Teorema do Limite Central 30 Pressupostos dos resíduos Remédios para a não-normalidade dos erros: não é obvio o que deve-se fazer Implementar um método de estimação que não assume normalidade (muito complicado) Se a causa da não-normalidade são os outliers, então utilizar variáveis dummy para remover estes valores e inserir a variável dummy na regressão Logaritmizar as variáveis (reduz assimetria) 31 Mestrado em Matemática Financeira Econometria dos Mercados Financeiros Diana A. Mendes Semana 4 - Outubro de 2024 Séries Temporais - Conceitos Básicos Uma série temporal é um conjunto de observações tomadas em instantes de tempo determinados com intervalos iguais (existe uma ordem ao longo do tempo ). Exemplos: o valor diário de uma determinada ação na Bolsa de Valores ( =dia) as temperaturas horárias de uma cidade ( =hora) o total mensal das vendas de uma loja ( =mês) consumo semanal de energia elétrica ( =semana) taxa de juros, eletrocardiograma, sensores, poluição, planeamento da rega, análise de sentimento, etc. 3 Séries Temporais - Conceitos Básicos Matematicamente, uma série temporal é definida pelos valores de uma variável (determinística ou estocástica) nos momentos de tempo equidistantes. Cada observação numa série temporal depende das outras observações prévias. Uma série temporal é representada por um gráfico de em função de (exemplos - notebook aula prática). 4 Séries Temporais - Conceitos Básicos Série temporal regular ou irregular estocástica ou determinística estacionária ou não-estacionária Conceitos base para séries temporais: Tendência, sazonalidade Estacionariedade, raiz unitária, lags, diferenças, retornos Correlação, Auto-Correlação (ACF, PACF) Processos Estocásticos Lineares, Ruído Branco (White Noise), Random Walk 5 Exemplos de séries temporais 6 Exemplos de séries temporais 7 Movimentos (componentes) das séries temporais Tendência (trend): direção geral segundo a qual o gráfico da série temporal se desenvolve, num intervalo de tempo longo. Variações cíclicas (cycle): oscilações a longo prazo (prosperidade, recessão, depressão e recuperação). Sazonalidade (seasonality): padrões (quase)idênticos, que ocorrem durante os mesmos meses, ou períodos, de anos sucessivos (o aumento das vendas de antes do Natal). Movimentos irregulares ou aleatórios (noise), referem-se aos deslocamentos esporádicos das séries temporais, provocados por acontecimentos casuais. 8 Variações cíclicas 9 Sazonalidade 10 Série temporal com sazonalidade e ciclos 11 Decomposição de uma série temporal A decomposição de uma série temporal, , nas suas componentes é dada por: , onde - componente de tendência determinística - componente de sazonalidade determinística - componente irregular (residual) Forma aditiva: Forma multiplicativa: 12 Série temporal com tendência linear (determinística) 13 Série temporal com tendência quadrática (determinística) 14 Série temporal com tendência estocástica 15 Série temporal sem tendência 16 Decomposição de uma série temporal (Python code) # import packages import pandas as pd import numpy as np # seasonal_decompose from statsmodels from statsmodels.tsa.seasonal import seasonal_decompose # read data df=pd.read_csv(‘AirPassengers.csv’) # define datetime object for index df.set_index('Month',inplace=True) df.index=pd.to_datetime(df.index) # proced with the time series decomposition result=seasonal_decompose(df['TS'], model='multiplicative') # plot time series component result.plot() # plot only the seasonal component result.seasonal.plot() 17 Operador lag (desfasagem) Para uma séries temporal, , o operador lag de 1ª ordem denota-se por e define-se por Analogamente, o operador lag de ordem é dado por: Portanto, usando o operador lag de ordem iremos obter a desfasagem de por períodos temporais ( dias, meses, etc). Nota-se que: é o momento de tempo presente, é o momento de tempo prévio e é o momento de tempo futuro. 18 Operador lag Ou seja, valores prévios (passados, históricos) de uma série temporal designam-se por lags (desfasamentos) Para a séries temporal temos: 19 Operador diferença O operador diferença denota-se por e define-se por Analogamente, o operador diferença de segunda ordem define-se como: Exemplos: diferença de ordem 4 para uma série trimestral sazonal diferença de ordem 12 para uma série mensal sazonal 20 Operador diferença Para, , a série temporal na primeira diferença é dada por: Nota-se que o operador diferença é fundamental para: cálculo de taxas de crescimento, rendibilidades, correlação e auto-correlação, estacionaridade, retirar a tendência ou a sazonalidade de uma série temporal Se a série temporal original tem elementos, então a série na primeira diferença tem elementos 21 Processo estocástico Uma série temporal pode ser vista como um processo estocástico (linear ou não- linear), isto é: , ou seja Observação = Sinal + Ruído O termo Ruído é um processo de ruído branco (white noise), ou seja, tem média nula, variância finita e constante, e não apresente correlação serial para qualquer momento de tempo. Represente a variação presente nos dados que não pode ser explicada pelo modelo aplicado. Em qualquer modelo, a parte residual deve ser um processo de ruído branco O ruído sendo totalmente não correlacionado não pode ser predito 22 Autocorrelação Com base no coeficiente de correlação de Pearson definimos a função de autocorrelação (ACF) entre os valores de uma séries temporal, e os seus lags , isto é: Quando se representa graficamente o valor obtido por cada um dos coefici-entes de autocorrelação (entre -1 e 1), obtém-se um gráfico designado por correlograma. Se a correlação é estável ao longo do tempo, então escreve-se 23 Autocorrelação parcial O coeficiente de autocorrelação parcial de ordem s denota-se por eé definido pelo coeficiente de no seguinte modelo estocástico linear Interpretação: A função de autocorrelação parcial (PACF) é a correlação entre e , mantendo todos os constantes para Por exemplo: 24 25 Estacionaridade Uma série temporal diz-se fracamente estacionária se para todo e tivermos: 1. Média constante 2. Variância finita e constante 3. Covariância constante onde é o termo lag (desfasamento). 26 Estacionaridade Se pelo menos uma das condições (1-3) não é satisfeita, então a série diz-se não- estacionária. Em termos práticos, quando provamos estacionaridade, referimos, em geral, a estacionaridade fraca. As séries estacionárias também são conhecidas como mean reverting series, pois, ao longo prazo, a média permanece constante. A existência de tendência e (ou) sazonalidade fazem uma série não-estacionária. Os modelos clássicos de séries temporais são definidos para séries estacionárias (não podem ser aplicados para séries não-estacionárias). 27 Exemplos de séries temporais com média e/ou variância não-constante (não- estacionárias) 28 O que fazer se a série temporal é não-estacionária? Para verificar se uma série é estacionária aplica-se um teste de raiz unitária, como, o teste ADF (Augmented Dickey-Fuller) ou o teste PP (Phillips-Perron). Regra geral, as séries temporais são não-estacionárias. Para estacionarizar uma série temporal aplica-se o operador diferença (ou log- diferença), tantas vezes até quando a série diferenciada se torna estacionária. Quando a série é não-estacionária por apresentar tendência, a primeira diferença é suficiente para estabilizar a série. Quando a série temporal apresenta sazonalidade, deve ser usada uma diferenciação sazonal. 29 Série integrada de ordem k Uma série estacionária em níveis, diz-se integrada de ordem zero,. Uma séries não-estacionária em níveis, mas estacionária na primeira diferença, diz- se integrada de ordem 1 e denota-se por. Uma séries não-estacionária em níveis, mas estacionária na diferença de ordem , diz-se integrada de ordem e denota-se por ou seja, foi necessário diferenciar (ou integrar) -vezes a série original para obter uma série estacionária. Todos os processos estacionários têm as funções de autocorrelação e de auto- correlação parcial convergentes para zero, quando o desfasamento de tempo cresce. 30 Tendência linear (determinística) e tendência estocástica O passeio aleatório (random walk with drift) é o processo não-estacionário base (padrão), que identifique a tendência estocástica de uma série temporal, isto é: A tendência determinística é uma função polinomial de variável tempo ( ), isto é: Reunir as duas tendências (linear e estocástica) numa única equação, isto é: 31 Teste de raiz unitária Vamos considerar a equação linear estocástica que contem as duas tendências da série temporal , isto é: Estamos interessados em testar (processo não-estacionário ou existe uma raiz unitária) (processo estacionário) Qualquer teste que tem como hipótese nula a existência de uma raiz unitária chama-se teste de raiz unitária. 32 Teste de raiz unitária Não se rejeita (não-estacionaridade ou existência de uma raiz unitária) se o valor da estatística teste for superior aos valores críticos (para os níveis de confiança de 1%, 5% e 10%) Ou: Não se rejeita a hipótese nula, , se Para correr um teste de raiz unitária precisamos de especificar se a série tem média não-nula (constant), tem tendência linear determinística (trend), as duas (trend and constant) ou nenhuma deles. Também precisamos de especificar o número de lags a usar no teste de raiz unitária 33 Teste de estacionaridade Se os testes de raiz unitária (ADF e PP, por exemplo) são discordantes na conclusão, para desempate, deve-se usar um teste de estacionaridade (por exemplo o teste de KPSS (Kwiatkowski–Phillips–Schmidt–Shin)), isto é: : série estacionária : série não-estacionária A não-rejeição da hipótese nula (isto é, ) conduz a conclusão de que a série temporal é estacionária A rejeição da hipótese nula (isto é, ) conduz a conclusão de que a série temporal é não-estacionária 34 Esquema para determinar se uma séries temporal pode ser aproximada por um passeio aleatório (série temporal cuja primeira diferença é estacionária e não-correlacionada, ou seja, move-se de forma completamente aleatória) Se a série é um passeio aleatório, parrar (não podemos prever valores futuros) Se a série não é um passeio aleatório, encontrar o modelo que se ajusta aos dados 35 Funções importantes em Python (statsmodels) # função de autocorrelação e autocorrelação parcial from statsmodels.tsa.stattools import acf from statsmodels.tsa.stattools import pacf # correlograma - ACF e PACF from statsmodels.graphics.tsaplots import plot_acf from statsmodels.graphics.tsaplots import plot_pacf # teste de raiz unitária de ADF from statsmodels.tsa.stattools import adfuller # teste de estacionaridade de KPSS from statsmodels.tsa.stattools import kpss # teste de raiz unitária com quebra de estrutura from statsmodels.tsa.stattools import zivot_andrews 36 Mestrado em Matemática Financeira, FCUL e Iscte Econometria dos Mercados Financeiros Semana 6 - Cointegração e Modelos VAR/VECM Diana Aldea Mendes [email protected] Relação entra 2 séries temporais Considere o seguinte modelo de regressão linear simples: Se os processos (séries temporais) e são estacionários, então, o modelo clássico de regressão pode aplicar-se; Se os processos e são integrados (não-estacionários) de ordens diferentes, o modelo de regressão gera resultados sem significado; Se os processos e são integrados da mesma ordem (não-estacionários) e a componente residual também é não-estacionária (contem uma tendência estocástica), então obtém-se uma regressão espúria. Se os processos e são integrados da mesma ordem e com a componente residual estacionária, então as séries dizem-se cointegradas. 3 Cointegração Definição: 2 séries temporais dizem-se cointegradas (ou, existe um vetor de cointegração) se são I(1) e a sua combinação linear é estacionária. Isto é: estacionária para integradas de ordem 1. As variáveis cointegradas passeiam de forma estocástica, mas ficam próximas uma de outra, existindo convergência para um equilíbrio ao longo prazo. 4 Cointegração Como verificar se duas séries são cointegradas? Metodologia dos dois passos de Engle-Granger (1 vector cointegrante) Metodologia de Johansen (1 ou mais vectores cointegrantes) Metodologia dos dois passos de Engle-Granger Testar a estacionaridade das variáveis (teste ADF); Caso se conclua pela não estacionaridade, deve considerar-se a hipótese destas variáveis estabelecerem uma relação de cointegração Deve calcular-se uma regressão, utilizando as duas variáveis de modo a obter uma estimativa do vector cointegrante e testar os seus resíduos de forma a concluir pela sua estacionaridade ou não. Pode concluir-se em favor da existência de cointegração entre aquelas duas variáveis, no caso dos resíduos serem estacionários. 5 Modelo VAR Os modelos estudados até agora constam duma equação de forma onde todas as variáveis contídas em são exógenas (isto é, os seus valores são determinados fora da equação) e é endógena (isto é, o seu valor é determinado (condicionado) pela equação dada). Temos então uma relação de causalidade uni-direccional de para , ou seja, as mudanças no valor das variáveis explicativas causam mudanças no valor do , mas, ao contrário não. Modelos VAR (Vector AutoRegressive) - desenvolvidos por Sims (1972, 1980, 1986, 1992) 6 Modelo VAR É um dos processos mais flexíveis, mais simples e com maior taxa de sucesso dos modelos que analisam séries temporais multivariados. Estimam sistemas dinâmicos sem utilizar perspectivas teóricas Todas as variáveis são endógenas e estacionárias O valor de uma série é explicado pela sua própria história e simultaneamente considerando outras variáveis e as suas histórias Todas as equações têm as mesmas variáveis independentes (desfasamentos até ordem d das variáveis) Estabelece relações causais (uni e bi-direcionais) entre variáveis Servem para identificar e avaliar os efeitos das inovações da política monetária sobre as variáveis macroeconómicas e para forecasting. 7 Quando aplicamos um modelo VAR? Considere um conjunto de séries temporais, com a mesma unidade de tempo e o mesmo número de onservações. Usamos um modelo VAR se Todas as séries são estacionárias (isto é, I(0)) (VAR para as séries em níveis) As séries são integradas de ordens diferentes (VAR para as séries estacionarizadas) As séries são I(1) mas não são cointegradas (VAR para as séries estacionarizadas) Nota: se 2 ou mais séries temporais são I(1) e cointegradas, então aplica-se um modelo VECM 8 Modelo VAR Exemplo Um modelo VAR simples com apenas duas variáveis e um desfasamento de um período pode ser escrito como 9 Modelo VAR Na forma básica, um modelo de ordem , consiste de um conjunto de variáveis endógenas , ,e define-se por onde são matrizes de coeficientes de tipo é um processo -dimensional com e matriz de covariância definida positiva e invariante em tempo (ruído branco). Designa-se por erro ou inovação. 10 Modelo VAR Uma das características mais importantes de um modelo é a sua estabilidade (converge para o equilíbrio após um shock), isto é, gera séries temporais estacionárias (com média, variância e covariância invariantes em tempo). Podemos estudar a estabilidade utilizando o polinómio característico, isto é: Se a eq. acima tem uma raiz , então algumas das variáveis no modelo são integradas de ordem. O modelo VAR é estável se todas as raízes estão situadas fora do circulo unitário. 11 Modelo VAR Como escolher a ordem (ou o número ótimo de lags), , do modelo VAR? O número de lags óptimo escolha-se a partir dos critérios de informação (Akaike, Schwarz, etc), sendo o melhor aquele que minimiza estes valores. A avaliação da significância das variáveis ocorre com base nos testes conjuntos sobre todos os lags de uma variável particular numa equação (teste-F), em vez de examinar estimativas individuais de coeficientes 12 Modelo VAR Para uma amostra dada das variáveis endógenas os coeficientes do processo podem ser estimados de forma eficiente aplicando o método dos mínimos quadrados separadamente para cada uma das equações Uma vez o modelo estimado podem ser feitos testes de diagnóstico (ausência de autocorrelação, heterocedasticidade, ou não-normalidade dos erros), inferência causal, forecasting e diagnóstico do comportamento dinâmico do modelo empírico (função resposta ao impulso, previsão da decomposição da variância do erro) 13 Causalidade de Granger Teste de causalidade de Granger Diz-se que não causa Granger , se todos os lags de na equação de são nulos, isto é onde Rejeitar : signifique que causa Granger. Se é o caso, e, o reverso não se verifique, então diz-se que há causalidade de Granger entre e (ou tem uma causalidade de Granger sobre ) Se causa , então os lags de devem ser significativos na equação de tem uma causalidade de Granger sobre 14 Causalidade de Granger Se os dois conjuntos de lags são significativos, então existe uma relação de causalidade bi-direcional. Se tem uma causalidade de Granger sobre (mas o reverso é falso), então diz-se que a variável é fortemente exógena (na equação de ) Se nenhum conjunto de lags é significativo, então, as variáveis são independentes A causalidade de Granger signifique que existe uma relação de correlação entre o valor presente duma variável e os valores passados de outras variáveis (não signifique que movimentos numa variável implicam movimentos noutra variável). 15 Modelo VECM Os modelos VAR são válidos se as séries são estacionárias. Caso contrário, na presença de raízes unitárias (séries I(1)), deve-se considerar uma reparametrização do modelo VAR, ou seja, um modelo VECM O modelo VAR pode ser convertido (recursivamente) num modelo VECM, isto é onde é a informação de longo prazo e éa informação de curto prazo. 16 Modelo VECM A matriz de informação de longo prazo pode escrever-se na forma representa a velocidade de ajustamento ao desequilíbrio representa a matriz de coeficientes de longo prazo ou seja os vectores cointegrantes Teorema de representação de Granger Se então as variáveis (em níveis) são estacionárias e pode usar-se um modelo VAR para as séries em níveis. Se então e não existe nenhuma relação de cointegrção no sistema. Pode usar-se um VAR para as séries em primeiras diferenças. Se então as variáveis estão cointegradas, existindo vectores cointegrantes. 17 Metodologia de Johansen (Cointegração) Determinar a característica cointegrante é o mesmo que determinar quantos vectores cointegrantes existem em , ou seja quantas colunas são nulas em Testes de cointegração (Johansen) Teste do traço: Teste do valor próprio máximo: Testam a hipótese de que há quando muito vectores cointegrantes com A estatística do (traço) testa quantas raízes são significativas como um grupo; A estatística do (max) testa qual o número significativo de raízes , contra a hipótese alternativa de um número igual a ; 18 Mestrado em Matemática Financeira, FCUL e Iscte Econometria dos Mercados Financeiros Semana 8 - Modelos ARCH/GARCH Diana Aldea Mendes [email protected] Factos estilizados das séries temporais financeiras Alguns factos estilizados das séries temporais financeiras: Abas pesadas (caudas gordas, heavy tails); Ganhos / perdas assimétricas: as perdas registadas têm maior amplitude do que os ganhos; As taxas de rendibilidade mostram um grau elevado de variabilidade em qualquer escala temporal; Clustering de volatilidade: Momentos de alta volatilidade tendem a ser seguidos por momentos de alta volatilidade; e momentos de baixa volatilidade são também seguidos por momentos de baixa volatilidade; 3 Factos estilizados das séries temporais financeiras Alguns factos estilizados das séries temporais financeiras: Efeito de alavancagem: a maioria das medidas de volatilidade apresenta uma correlação negativa com as taxas de rendibilidade dos ativos, ou seja, a volatilidade é maior após choques negativos; Correlação volume / volatilidade: os volumes de negociação de ativos estão diretamente relacionados com todas as medidas de volatilidade; Assimetria em diferentes frequências temporais: medidas mais gerais conseguem prever a volatilidade em períodos curtos de forma mais apropriada. 4 Modelos ARCH/GARCH Os modelos tradicionais estudados até agora constam duma equação linear que não pode explicar a leptocurtose, os clusters de volatilidade e o efeito de alavanca (leverage effects) Em geral, os resíduos dos modelos ARIMA são heteroscedáticos (a variância não é constante) Surge a necessidade em definir modelos que não assumem que a variância é constante -> ARCH - Autoregressive Conditionally Heteroskedastic 5 Modelos ARCH/GARCH Para definir um processo ARCH, precisamos de 2 partes distintas: Uma equação da média condicional, Uma equação da variância condicional (depende da informação do passado). Os modelos de variância tem bastante interesse: por exemplo, um detentor de ativos pode estar interessado em prever não apenas os retornos dos ativos, mas também a sua volatilidade para poder avaliar o risco dos ativos. 6 Modelos ARCH/GARCH Então um modelo (Autoregressive Conditionally Heteroskedastic) completo para a variância dos erros define-se por: Equação de média Equação de variância onde: , parâmetros do modelo, é o termo erro, é a variância de erro condicionada pela informação passada e pode ser uma variável independente ou desfasamentos da variável dependente. 7 Modelos ARCH/GARCH Nota-se que todos os coeficientes devem ser positivos e que a soma de todos os parâmetros tem de ser inferior a 1, para cumprir a condição de estacionaridade fraca. O caso geral de um modelo - onde a variância dos erros depende de lags dos erros quadrados - define-se por 8 Modelos ARCH/GARCH Vantagem principal do modelo : modela mudanças na variância e pode ser integrado nos modelos ARMA Desvantagens do modelo ARCH Em geral, é difícil decidir qual é o valor certo de q e por isso, na prática, podem ser utilizados valores elevados para o Todos os coeficientes são positivos, i.e., (pois, a variância não pode ser negativa) 9 Modelos ARCH/GARCH Testar para "efeitos ARCH" Correr um modelo de regressão linear (ou de tipo ARMA) e salvar os resíduos Definir os quadrados dos resíduos e construir a regressão , com iid Obter desta regressão. A estatística teste é definida por (o número de obs. vezes )eé distribuído como. 10 Modelos ARCH/GARCH A hipótese nula e a hipótese alternativa são definidas por Se o valor da estatística teste é maior que o valor crítico da distribuição , então rejeita-se a e conclui-se que existem evidências de ARCH A autocorrelação nos quadrados dos resíduos reflectam os clusters de volatilidade observados nos retornos e constituem uma evidência do ARCH. 11 Modelos ARCH/GARCH Uma extensão natural do ARCH é o modelo GARCH (Generalised ARCH, Bollerslev (1986)) que permite que a variância condicional seja dependente dos seus próprios lags Temos então o modelo : Que é um tipo de modelo para a equação da variância. O termo designa-se por variância condicionada (volatilidade), éa constante (intercept), é o termo de volatilidade (dá informação sobre volatilidade do periódo anterior) e é a variância prevista do último periódo. 12 Modelos ARCH/GARCH A volatilidade é entendida como uma medida da variabilidade de uma certa cotação durante um certo intervalo de tempo. Por norma, esta medida é calculada através do desvio-padrão anualizado da variação percentual das cotações diárias, semanais, mensais, sendo expressa sob a forma de percentagem. Esta medida é usada para quantificar o risco de deter um ativo que opera no mercado financeiro durante um período de tempo medindo a dispersão dos seus rendimentos. 13 Modelos ARCH/GARCH Um modelo define-se por mas, geralmente, um modelo é suficiente para capturar o clustering da volatilidade nos dados. Todos os parâmetros do modelo verificam a condição de não-negatividade. 14 Modelos ARCH/GARCH Temos a seguinte equivalência: A especificação desses modelos tem uma interpretação financeira imediata, pois, um agente faz a previsão da variância presente formando uma média pesada de uma média ao longo prazo (a constante), uma variância prevista do período anterior (o termo GARCH) e informação relativamente a volatilidade observada no período anterior (o termo ARCH). Se os retornos dos activos são inesperadamente grandes na direcção crescente ou decrescente, então o agente vai crescer a estimativa da variância para o próximo periódo. Os modelos também são adequados para os clusters de volatilidade frequentemente observados nos dados financeiros, onde alterações grandes nos retornos são geralmente seguidos por outras alterações grandes. 15 Modelos ARCH/GARCH O efeito dos shocks ao longo prazo são obtidos a partir da variância não- condicional de A variância não-condicional de é dada por quando , (garantir estacionariedade, e variância finita). designa-se por não-estacionariedade em variância (neste caso, os valores previstos da variância condicional não convergem para os seus valores não-condicionados) designa-se por GARCH integrado (ou IGARCH, os shocks do passado não se dissipam persistindo ao longo de periódos longos de tempo) 16 Modelos ARCH/GARCH Como os modelos ARCH/GARCH não são lineares, o método de estimação OLS não pode ser utilizado. Como regra geral utiliza-se o método de máxima verosimilhança (maximum likelihood, ML) para estimar os parâmetros do modelo Geralmente, os modelos GARCH assumem que os shocks positivos e negativos tem o mesmo impacto sobre a volatilidade, o que garante que a curva de impacto de informação (News Impact Curve) é simétrica. 17 Modelos ARCH/GARCH Desvantagens do modelo GARCH As restrições de não-negatividade podem ser violados Não consequem identificar os efeitos leverage Uma extensão natural do modelo GARCH, que permite o contrário deste pressuposto, vai conduzir aos modelos EGARCH (muito importantes, pois geralmente, os shocks negativos tem um impacto maior sobre a volatilidade, devido ao efeito de alavanca). 18 Bom trabalho! 19