A regressão linear múltipla se refere a uma técnica estatística usada para prever o resultado de uma variável com base no valor de duas ou mais variáveis. Às vezes, é conhecido simplesmente como regressão múltipla e é uma extensão da regressão linear. A variável que queremos prever é conhecida como variável dependente, enquanto as variáveis que usamos para prever o valor da variável dependente Variável dependente Uma variável dependente é aquela que mudará dependendo do valor de outra variável, chamada de variável independente. são conhecidas como variáveis independentes ou explicativas.
Figura 1: Predições do modelo de regressão linear múltipla para observações individuais (Fonte)
Resumo
- A regressão linear múltipla se refere a uma técnica estatística que usa duas ou mais variáveis independentes para prever o resultado de uma variável dependente.
- A técnica permite que os analistas determinem a variação do modelo e a contribuição relativa de cada variável independente na variância total.
- A regressão múltipla pode assumir duas formas, ou seja, regressão linear e regressão não linear.
Fórmula de regressão linear múltipla
Onde:
- Yi é a variável dependente ou previu
- β0 é o intercepto y, ou seja, o valor de y quando xi e x2 são 0.
- β1 e β2 são os coeficientes de regressão que representam a mudança em y em relação a uma mudança de uma unidade em xi1 e xi2 , respectivamente.
- βp é o coeficiente de inclinação para cada variável independente
- ϵ é o termo de erro aleatório (residual) do modelo.
Compreendendo a regressão linear múltipla
A regressão linear simples permite que os estatísticos prevejam o valor de uma variável usando as informações disponíveis sobre outra variável. A regressão linear tenta estabelecer a relação entre as duas variáveis ao longo de uma linha reta.
A regressão múltipla é um tipo de regressão em que a variável dependente mostra uma relação linear com duas ou mais variáveis independentes. Também pode ser não linear , onde as variáveis dependentes e independentes Variável independente Uma variável independente é uma entrada, suposição ou driver que é alterado para avaliar seu impacto em uma variável dependente (o resultado). não siga uma linha reta.
A regressão linear e não linear rastreia uma resposta específica usando duas ou mais variáveis graficamente. No entanto, a regressão não linear geralmente é difícil de executar, uma vez que é criada a partir de suposições derivadas de tentativa e erro.
Suposições de regressão linear múltipla
A regressão linear múltipla é baseada nas seguintes suposições:
1. Uma relação linear entre as variáveis dependentes e independentes
A primeira suposição da regressão linear múltipla é que existe uma relação linear entre a variável dependente e cada uma das variáveis independentes. A melhor maneira de verificar as relações lineares é criar gráficos de dispersão e, a seguir, inspecionar visualmente a linearidade dos gráficos de dispersão. Se a relação exibida no gráfico de dispersão não for linear, o analista precisará executar uma regressão não linear ou transformar os dados usando software estatístico, como o SPSS.
2. As variáveis independentes não são altamente correlacionadas entre si
Os dados não devem apresentar multicolinearidade, que ocorre quando as variáveis independentes (variáveis explicativas) são altamente correlacionadas entre si. Quando as variáveis independentes mostram multicolinearidade, haverá problemas em descobrir a variável específica que contribui para a variância na variável dependente. O melhor método para testar a suposição é o método do fator de inflação de variância.
3. A variância dos resíduos é constante
A regressão linear múltipla assume que a quantidade de erro nos resíduos é semelhante em cada ponto do modelo linear. Este cenário é conhecido como homocedasticidade. Ao analisar os dados, o analista deve representar graficamente os resíduos padronizados contra os valores previstos para determinar se os pontos estão distribuídos de forma justa em todos os valores das variáveis independentes. Para testar a suposição, os dados podem ser plotados em um gráfico de dispersão ou usando software estatístico para produzir um gráfico de dispersão que inclui o modelo inteiro.
4. Independência de observação
O modelo assume que as observações devem ser independentes umas das outras. Simplificando, o modelo assume que os valores dos resíduos são independentes. Para testar essa suposição, usamos a estatística Durbin Watson.
O teste mostrará valores de 0 a 4, onde um valor de 0 a 2 mostra autocorrelação positiva e valores de 2 a 4 mostram autocorrelação negativa. O ponto médio, ou seja, um valor de 2, mostra que não há autocorrelação.
5. Normalidade multivariada
A normalidade multivariada ocorre quando os resíduos são normalmente distribuídos. Para testar essa suposição, observe como os valores dos resíduos são distribuídos. Ele também pode ser testado usando dois métodos principais, ou seja, um histograma com uma curva normal sobreposta ou o método do Gráfico de probabilidade normal.
Mais recursos
Finanças oferece o Certified Banking & Credit Analyst (CBCA) ™ Certificação CBCA ™ O credenciamento Certified Banking & Credit Analyst (CBCA) ™ é um padrão global para analistas de crédito que cobre finanças, contabilidade, análise de crédito, análise de fluxo de caixa, modelagem de covenant, empréstimo reembolsos e muito mais. programa de certificação para aqueles que procuram levar suas carreiras ao próximo nível. Para continuar aprendendo e desenvolvendo sua base de conhecimento, explore os recursos financeiros relevantes adicionais abaixo:
- Métodos de previsão Métodos de previsão Principais métodos de previsão. Neste artigo, explicaremos quatro tipos de métodos de previsão de receita que os analistas financeiros usam para prever receitas futuras.
- Distribuição de Poisson Distribuição de Poisson A Distribuição de Poisson é uma ferramenta usada nas estatísticas da teoria de probabilidade para prever a quantidade de variação de uma taxa média de ocorrência conhecida, dentro
- Variável aleatória Variável aleatória Uma variável aleatória (variável estocástica) é um tipo de variável nas estatísticas cujos valores possíveis dependem dos resultados de um determinado fenômeno aleatório
- Análise de regressão Análise de regressão A análise de regressão é um conjunto de métodos estatísticos usados para a estimativa de relacionamentos entre uma variável dependente e uma ou mais variáveis independentes. Pode ser utilizado para avaliar a força da relação entre as variáveis e para modelar a relação futura entre elas.