O R-quadrado ajustado é uma versão modificada do R-quadrado que considera preditores que não são significativos em um modelo de regressão. Em outras palavras, o R-quadrado ajustado mostra se a adição de preditores adicionais melhora um modelo de regressão ou não. Para entender o R-quadrado ajustado, é necessário entender o R-quadrado.
Resumo:
- O R-quadrado ajustado é uma versão modificada do R-quadrado que se ajusta para preditores que não são significativos em um modelo de regressão.
- Comparado a um modelo com variáveis de entrada adicionais, um menor R-quadrado ajustado indica que as variáveis de entrada adicionais não estão agregando valor ao modelo.
- Comparado a um modelo com variáveis de entrada adicionais, um R-quadrado ajustado mais alto indica que as variáveis de entrada adicionais estão agregando valor ao modelo.
Qual é o R ao quadrado?
O R-quadrado, também chamado de coeficiente de determinação Coeficiente de Determinação Um coeficiente de determinação (R² ou r-quadrado) é uma medida estatística em um modelo de regressão que determina a proporção da variância no dependente, é usado para explicar o grau de quais variáveis de entrada (variáveis preditoras) explicam a variação das variáveis de saída (variáveis preditas). Ele varia de 0 a 1. Por exemplo, se o R-quadrado for 0,9, isso indica que 90% da variação nas variáveis de saída são explicadas pelas variáveis de entrada. De modo geral, um R-quadrado mais alto indica um ajuste melhor para o modelo. Considere o seguinte diagrama:
A linha azul se refere à linha de melhor ajuste e mostra a relação entre as variáveis. A linha é calculada por meio de análise de regressão Análise de regressão A análise de regressão é um conjunto de métodos estatísticos usados para estimar as relações entre uma variável dependente e uma ou mais variáveis independentes. Pode ser utilizado para avaliar a força da relação entre as variáveis e para modelar a relação futura entre elas. e é plotado onde as distâncias verticais (linhas pontilhadas azuis) dos pontos amarelos para a linha de melhor ajuste são minimizadas.
Os pontos amarelos referem-se ao gráfico das variáveis de entrada e saída. A variável de entrada é plotada no eixo x enquanto a variável de saída é plotada no eixo y. Por exemplo, o gráfico acima consiste no seguinte conjunto de dados:
As linhas pontilhadas azuis referem-se à distância do gráfico das variáveis de entrada e saída da linha de melhor ajuste. O R-quadrado é derivado da distância de todos os pontos amarelos da linha de melhor ajuste (a linha azul). Por exemplo, o diagrama a seguir ilustraria um R-quadrado de 1:
Problemas com o R-quadrado
R-quadrado vem com um problema inerente - variáveis de entrada adicionais farão o R-quadrado permanecer o mesmo ou aumentar (isso é devido a como o R-quadrado é calculado matematicamente). Portanto, mesmo que as variáveis de entrada adicionais não mostrem relação com as variáveis de saída, o R ao quadrado aumentará. Um exemplo que explica tal ocorrência é fornecido abaixo.
Compreendendo o R-quadrado ajustado
Essencialmente, o R-quadrado ajustado verifica se variáveis de entrada adicionais estão contribuindo para o modelo. Considere um exemplo de uso de dados coletados por um dono de pizza, conforme mostrado abaixo:
Suponha que o dono da pizza execute duas regressões:
Regressão 1: Preço da Massa (variável de entrada), Preço da Pizza (variável de saída)
A regressão 1 produz um R ao quadrado de 0,9557 e um R ao quadrado ajustado de 0,9493.
Regressão 2: Temperatura (variável de entrada 1), Preço da Massa (variável de entrada 2), Preço da Pizza (variável de saída)
A regressão 2 produz um R ao quadrado de 0,9573 e um R ao quadrado ajustado de 0,9431.
Embora a temperatura não deva exercer nenhum poder preditivo sobre o preço de uma pizza, o R-quadrado aumentou de 0,9557 (Regressão 1) para 0,9573 (Regressão 2). Uma pessoa pode acreditar que a Regressão 2 carrega um poder preditivo mais alto, pois o R-quadrado é mais alto. Embora a variável de entrada de temperatura seja inútil para prever o preço de uma pizza, ela aumentou o R ao quadrado. Aqui, o R-quadrado ajustado entra em ação.
O R-quadrado ajustado verifica se variáveis de entrada adicionais estão contribuindo para o modelo. O R-quadrado ajustado na Regressão 1 foi de 0,9493 em comparação com o R-quadrado ajustado na Regressão 2 de 0,9493. Portanto, o R-quadrado ajustado é capaz de identificar que a variável de entrada de temperatura não ajuda a explicar a variável de saída (o preço de uma pizza). Nesse caso, o R-quadrado ajustado indicaria ao criador do modelo o uso da Regressão 1 em vez da Regressão 2.
Exemplo de R-quadrado ajustado
Considere dois modelos:
- O Modelo 1 usa as variáveis de entrada X1, X2 e X3 para prever Y1.
- O Modelo 2 usa as variáveis de entrada X1 e X2 para prever Y1.
Qual modelo deve ser usado? As informações sobre ambos os modelos são fornecidas abaixo:
Comparando o R-quadrado entre o Modelo 1 e o Modelo 2, o R-quadrado prevê que o Modelo 1 é um modelo melhor, pois carrega um maior poder explicativo (0,5923 no Modelo 1 vs. 0,5612 no Modelo 2).
Comparando o R-quadrado entre o Modelo 1 e o Modelo 2, o R-quadrado ajustado prevê que a variável de entrada X3 contribui para explicar a variável de saída Y1 (0,4231 no Modelo 1 vs. 0,3512 no Modelo 2).
Como tal, o Modelo 1 deve ser usado, já que a variável de entrada X3 adicional contribui para explicar a variável de saída Y1.
Recursos adicionais
Finance oferece o Financial Modeling & Valuation Analyst (FMVA) ™ FMVA® Certification Junte-se a mais de 350.600 alunos que trabalham para empresas como Amazon, JP Morgan e programa de certificação Ferrari para aqueles que procuram levar suas carreiras para o próximo nível. Para continuar aprendendo e progredindo em sua carreira, os seguintes recursos financeiros serão úteis:
- Conceitos Básicos de Estatística para Finanças Conceitos Básicos de Estatística para Finanças Um conhecimento sólido de estatística é crucial para nos ajudar a entender melhor as finanças. Além disso, os conceitos de estatísticas podem ajudar os investidores a monitorar
- Método alto-baixo vs. análise de regressão Método alto-baixo vs. análise de regressão O método alto-baixo e a análise de regressão são os dois principais métodos de estimativa de custo usados para estimar os valores de custos fixos e variáveis. Normalmente, os gerentes devem dividir os custos mistos em seus componentes fixos e variáveis para prever e planejar o futuro.
- Variável independente Variável independente Uma variável independente é uma entrada, suposição ou fator que é alterado para avaliar seu impacto em uma variável dependente (o resultado).
- Tipos de análise financeira Tipos de análise financeira A análise financeira envolve o uso de dados financeiros para avaliar o desempenho de uma empresa e fazer recomendações sobre como ela pode melhorar no futuro. Os analistas financeiros realizam principalmente seu trabalho no Excel, usando uma planilha para analisar dados históricos e fazer projeções Tipos de análise financeira