Qual é o coeficiente de determinação?

O coeficiente de determinação (R² ou r-quadrado) é uma medida estatística em um modelo de regressão que determina a proporção da variância na variável dependente que pode ser explicada pela variável independente Variável independente Uma variável independente é uma entrada, suposição ou motivador que é alterado para avaliar seu impacto em uma variável dependente (o resultado). . Em outras palavras, o coeficiente de determinação informa o quão bem os dados se ajustam ao modelo (a qualidade do ajuste).

Coeficiente de determinação

Embora o coeficiente de determinação forneça alguns insights úteis sobre o modelo de regressão, não se deve confiar apenas na medida na avaliação de um modelo estatístico. Não divulga informações sobre a relação de causalidade entre as variáveis ​​independentes e dependentes Variável dependente Uma variável dependente é aquela que muda dependendo do valor de outra variável, chamada de variável independente. e não indica a correção do modelo de regressão. Portanto, o usuário deve sempre tirar conclusões sobre o modelo, analisando o coeficiente de determinação junto com outras variáveis ​​em um modelo estatístico.

O coeficiente de determinação pode assumir qualquer valor entre 0 e 1. Além disso, a métrica estatística é freqüentemente expressa em porcentagens.

Interpretação do Coeficiente de Determinação (R²)

A interpretação mais comum do coeficiente de determinação é o quão bem o modelo de regressão se ajusta aos dados observados. Por exemplo, um coeficiente de determinação de 60% mostra que 60% dos dados se ajustam ao modelo de regressão. Geralmente, um coeficiente mais alto indica um melhor ajuste para o modelo.

No entanto, nem sempre é o caso de um alto r-quadrado ser bom para o modelo de regressão. A qualidade do coeficiente depende de vários fatores, incluindo as unidades de medida das variáveis, a natureza das variáveis ​​empregadas no modelo e a transformação dos dados aplicada. Assim, às vezes, um coeficiente alto pode indicar problemas com o modelo de regressão.

Nenhuma regra universal governa como incorporar o coeficiente de determinação na avaliação de um modelo. O contexto em que a previsão ou o experimento se baseia é extremamente importante e, em diferentes cenários, os insights da métrica estatística podem variar.

Cálculo do Coeficiente

Matematicamente, o coeficiente de determinação pode ser encontrado usando a seguinte fórmula:

Fórmula

Onde:

  • Regressão SS - a soma dos quadrados devido à regressão (soma dos quadrados explicada)
  • SS total - a soma total dos quadrados

Embora os termos “soma total dos quadrados” e “soma dos quadrados devido à regressão” pareçam confusos, os significados das variáveis ​​são diretos.

A soma total dos quadrados mede a variação nos dados observados (dados usados ​​na modelagem de regressão). A soma dos quadrados devido à regressão mede o quão bem o modelo de regressão representa os dados que foram usados ​​para a modelagem.

Mais recursos

Finance é o provedor oficial do Financial Modeling & Valuation Analyst (FMVA) ™ Certificação FMVA® Junte-se a mais de 350.600 alunos que trabalham para empresas como Amazon, JP Morgan e programa de certificação Ferrari, projetado para ajudar qualquer pessoa a se tornar um analista financeiro de classe mundial . Para continuar aprendendo e progredindo em sua carreira, os recursos financeiros adicionais abaixo serão úteis:

  • Conceitos Básicos de Estatística em Finanças Conceitos Básicos de Estatística em Finanças Um conhecimento sólido de estatística é crucialmente importante para nos ajudar a compreender melhor as finanças. Além disso, os conceitos de estatísticas podem ajudar os investidores a monitorar
  • Distribuição binomial Distribuição binomial A distribuição binomial é uma distribuição de probabilidade comum que modela a probabilidade de obter um de dois resultados sob um determinado número de parâmetros
  • Teorema do Limite Central Teorema do Limite Central O teorema do limite central afirma que a média da amostra de uma variável aleatória assumirá uma distribuição quase normal ou normal se o tamanho da amostra for grande
  • Análise de regressão Análise de regressão A análise de regressão é um conjunto de métodos estatísticos usados ​​para a estimativa de relacionamentos entre uma variável dependente e uma ou mais variáveis ​​independentes. Pode ser utilizado para avaliar a força da relação entre as variáveis ​​e para modelar a relação futura entre elas.

Recomendado

O Crackstreams foi encerrado?
2022
O centro de comando do MC é seguro?
2022
Taliesin está deixando um papel crítico?
2022