O que é regressão linear múltipla?

A regressão linear múltipla se refere a uma técnica estatística usada para prever o resultado de uma variável com base no valor de duas ou mais variáveis. Às vezes, é conhecido simplesmente como regressão múltipla e é uma extensão da regressão linear. A variável que queremos prever é conhecida como variável dependente, enquanto as variáveis ​​que usamos para prever o valor da variável dependente Variável dependente Uma variável dependente é aquela que mudará dependendo do valor de outra variável, chamada de variável independente. são conhecidas como variáveis ​​independentes ou explicativas.

Regressão linear múltiplaFigura 1: Predições do modelo de regressão linear múltipla para observações individuais (Fonte)

Resumo

  • A regressão linear múltipla se refere a uma técnica estatística que usa duas ou mais variáveis ​​independentes para prever o resultado de uma variável dependente.
  • A técnica permite que os analistas determinem a variação do modelo e a contribuição relativa de cada variável independente na variância total.
  • A regressão múltipla pode assumir duas formas, ou seja, regressão linear e regressão não linear.

Fórmula de regressão linear múltipla

Regressão Linear Múltipla - Fórmula

Onde:

  • Yi é a variável dependente ou previu
  • β0 é o intercepto y, ou seja, o valor de y quando xi e x2 são 0.
  • β1 e β2 são os coeficientes de regressão que representam a mudança em y em relação a uma mudança de uma unidade em xi1 e xi2 , respectivamente.
  • βp é o coeficiente de inclinação para cada variável independente
  • ϵ é o termo de erro aleatório (residual) do modelo.

Compreendendo a regressão linear múltipla

A regressão linear simples permite que os estatísticos prevejam o valor de uma variável usando as informações disponíveis sobre outra variável. A regressão linear tenta estabelecer a relação entre as duas variáveis ​​ao longo de uma linha reta.

A regressão múltipla é um tipo de regressão em que a variável dependente mostra uma relação linear com duas ou mais variáveis ​​independentes. Também pode ser não linear , onde as variáveis ​​dependentes e independentes Variável independente Uma variável independente é uma entrada, suposição ou driver que é alterado para avaliar seu impacto em uma variável dependente (o resultado). não siga uma linha reta.

A regressão linear e não linear rastreia uma resposta específica usando duas ou mais variáveis ​​graficamente. No entanto, a regressão não linear geralmente é difícil de executar, uma vez que é criada a partir de suposições derivadas de tentativa e erro.

Suposições de regressão linear múltipla

A regressão linear múltipla é baseada nas seguintes suposições:

1. Uma relação linear entre as variáveis ​​dependentes e independentes

A primeira suposição da regressão linear múltipla é que existe uma relação linear entre a variável dependente e cada uma das variáveis ​​independentes. A melhor maneira de verificar as relações lineares é criar gráficos de dispersão e, a seguir, inspecionar visualmente a linearidade dos gráficos de dispersão. Se a relação exibida no gráfico de dispersão não for linear, o analista precisará executar uma regressão não linear ou transformar os dados usando software estatístico, como o SPSS.

2. As variáveis ​​independentes não são altamente correlacionadas entre si

Os dados não devem apresentar multicolinearidade, que ocorre quando as variáveis ​​independentes (variáveis ​​explicativas) são altamente correlacionadas entre si. Quando as variáveis ​​independentes mostram multicolinearidade, haverá problemas em descobrir a variável específica que contribui para a variância na variável dependente. O melhor método para testar a suposição é o método do fator de inflação de variância.

3. A variância dos resíduos é constante

A regressão linear múltipla assume que a quantidade de erro nos resíduos é semelhante em cada ponto do modelo linear. Este cenário é conhecido como homocedasticidade. Ao analisar os dados, o analista deve representar graficamente os resíduos padronizados contra os valores previstos para determinar se os pontos estão distribuídos de forma justa em todos os valores das variáveis ​​independentes. Para testar a suposição, os dados podem ser plotados em um gráfico de dispersão ou usando software estatístico para produzir um gráfico de dispersão que inclui o modelo inteiro.

4. Independência de observação

O modelo assume que as observações devem ser independentes umas das outras. Simplificando, o modelo assume que os valores dos resíduos são independentes. Para testar essa suposição, usamos a estatística Durbin Watson.

O teste mostrará valores de 0 a 4, onde um valor de 0 a 2 mostra autocorrelação positiva e valores de 2 a 4 mostram autocorrelação negativa. O ponto médio, ou seja, um valor de 2, mostra que não há autocorrelação.

5. Normalidade multivariada

A normalidade multivariada ocorre quando os resíduos são normalmente distribuídos. Para testar essa suposição, observe como os valores dos resíduos são distribuídos. Ele também pode ser testado usando dois métodos principais, ou seja, um histograma com uma curva normal sobreposta ou o método do Gráfico de probabilidade normal.

Mais recursos

Finanças oferece o Certified Banking & Credit Analyst (CBCA) ™ Certificação CBCA ™ O credenciamento Certified Banking & Credit Analyst (CBCA) ™ é um padrão global para analistas de crédito que cobre finanças, contabilidade, análise de crédito, análise de fluxo de caixa, modelagem de covenant, empréstimo reembolsos e muito mais. programa de certificação para aqueles que procuram levar suas carreiras ao próximo nível. Para continuar aprendendo e desenvolvendo sua base de conhecimento, explore os recursos financeiros relevantes adicionais abaixo:

  • Métodos de previsão Métodos de previsão Principais métodos de previsão. Neste artigo, explicaremos quatro tipos de métodos de previsão de receita que os analistas financeiros usam para prever receitas futuras.
  • Distribuição de Poisson Distribuição de Poisson A Distribuição de Poisson é uma ferramenta usada nas estatísticas da teoria de probabilidade para prever a quantidade de variação de uma taxa média de ocorrência conhecida, dentro
  • Variável aleatória Variável aleatória Uma variável aleatória (variável estocástica) é um tipo de variável nas estatísticas cujos valores possíveis dependem dos resultados de um determinado fenômeno aleatório
  • Análise de regressão Análise de regressão A análise de regressão é um conjunto de métodos estatísticos usados ​​para a estimativa de relacionamentos entre uma variável dependente e uma ou mais variáveis ​​independentes. Pode ser utilizado para avaliar a força da relação entre as variáveis ​​e para modelar a relação futura entre elas.

Recomendado

O Crackstreams foi encerrado?
2022
O centro de comando do MC é seguro?
2022
Taliesin está deixando um papel crítico?
2022