O coeficiente de determinação (R² ou r-quadrado) é uma medida estatística em um modelo de regressão que determina a proporção da variância na variável dependente que pode ser explicada pela variável independente Variável independente Uma variável independente é uma entrada, suposição ou motivador que é alterado para avaliar seu impacto em uma variável dependente (o resultado). . Em outras palavras, o coeficiente de determinação informa o quão bem os dados se ajustam ao modelo (a qualidade do ajuste).
Embora o coeficiente de determinação forneça alguns insights úteis sobre o modelo de regressão, não se deve confiar apenas na medida na avaliação de um modelo estatístico. Não divulga informações sobre a relação de causalidade entre as variáveis independentes e dependentes Variável dependente Uma variável dependente é aquela que muda dependendo do valor de outra variável, chamada de variável independente. e não indica a correção do modelo de regressão. Portanto, o usuário deve sempre tirar conclusões sobre o modelo, analisando o coeficiente de determinação junto com outras variáveis em um modelo estatístico.
O coeficiente de determinação pode assumir qualquer valor entre 0 e 1. Além disso, a métrica estatística é freqüentemente expressa em porcentagens.
Interpretação do Coeficiente de Determinação (R²)
A interpretação mais comum do coeficiente de determinação é o quão bem o modelo de regressão se ajusta aos dados observados. Por exemplo, um coeficiente de determinação de 60% mostra que 60% dos dados se ajustam ao modelo de regressão. Geralmente, um coeficiente mais alto indica um melhor ajuste para o modelo.
No entanto, nem sempre é o caso de um alto r-quadrado ser bom para o modelo de regressão. A qualidade do coeficiente depende de vários fatores, incluindo as unidades de medida das variáveis, a natureza das variáveis empregadas no modelo e a transformação dos dados aplicada. Assim, às vezes, um coeficiente alto pode indicar problemas com o modelo de regressão.
Nenhuma regra universal governa como incorporar o coeficiente de determinação na avaliação de um modelo. O contexto em que a previsão ou o experimento se baseia é extremamente importante e, em diferentes cenários, os insights da métrica estatística podem variar.
Cálculo do Coeficiente
Matematicamente, o coeficiente de determinação pode ser encontrado usando a seguinte fórmula:
Onde:
- Regressão SS - a soma dos quadrados devido à regressão (soma dos quadrados explicada)
- SS total - a soma total dos quadrados
Embora os termos “soma total dos quadrados” e “soma dos quadrados devido à regressão” pareçam confusos, os significados das variáveis são diretos.
A soma total dos quadrados mede a variação nos dados observados (dados usados na modelagem de regressão). A soma dos quadrados devido à regressão mede o quão bem o modelo de regressão representa os dados que foram usados para a modelagem.
Mais recursos
Finance é o provedor oficial do Financial Modeling & Valuation Analyst (FMVA) ™ Certificação FMVA® Junte-se a mais de 350.600 alunos que trabalham para empresas como Amazon, JP Morgan e programa de certificação Ferrari, projetado para ajudar qualquer pessoa a se tornar um analista financeiro de classe mundial . Para continuar aprendendo e progredindo em sua carreira, os recursos financeiros adicionais abaixo serão úteis:
- Conceitos Básicos de Estatística em Finanças Conceitos Básicos de Estatística em Finanças Um conhecimento sólido de estatística é crucialmente importante para nos ajudar a compreender melhor as finanças. Além disso, os conceitos de estatísticas podem ajudar os investidores a monitorar
- Distribuição binomial Distribuição binomial A distribuição binomial é uma distribuição de probabilidade comum que modela a probabilidade de obter um de dois resultados sob um determinado número de parâmetros
- Teorema do Limite Central Teorema do Limite Central O teorema do limite central afirma que a média da amostra de uma variável aleatória assumirá uma distribuição quase normal ou normal se o tamanho da amostra for grande
- Análise de regressão Análise de regressão A análise de regressão é um conjunto de métodos estatísticos usados para a estimativa de relacionamentos entre uma variável dependente e uma ou mais variáveis independentes. Pode ser utilizado para avaliar a força da relação entre as variáveis e para modelar a relação futura entre elas.