O que é LASSO?

LASSO, abreviação de Least Absolute Shrinkage and Selection Operator, é uma fórmula estatística cujo objetivo principal é a seleção de recursos e regularização de modelos de dados. O método foi introduzido pela primeira vez em 1996 pelo professor de estatística Robert Tibshirani. LASSO introduz parâmetros para a soma de um modelo, dando a ele um limite superior que atua como uma restrição para que a soma inclua parâmetros absolutos dentro de um intervalo permitido.

laço

O método LASSO regulariza os parâmetros do modelo reduzindo os coeficientes de regressão, reduzindo alguns deles a zero. A fase de seleção de recursos ocorre após a redução, onde todos os valores diferentes de zero são selecionados para serem usados ​​no modelo. Este método é significativo na minimização de erros de previsão que são comuns em modelos estatísticos. Análise Quantitativa A análise quantitativa é o processo de coleta e avaliação de dados mensuráveis ​​e verificáveis, como receitas, participação de mercado e salários, a fim de compreender o comportamento e desempenho de um o negócio. Na era da tecnologia de dados, a análise quantitativa é considerada a abordagem preferida para tomar decisões informadas. .

A LASSO oferece modelos com alta precisão de previsão. A precisão aumenta, uma vez que o método inclui a redução dos coeficientes, o que, por sua vez, reduz a variância e minimiza o viés. Ele tem melhor desempenho quando o número de observações é baixo e o número de recursos é alto. Ele depende fortemente do parâmetro λ, que é o fator de controle do encolhimento. Quanto maior se torna λ, mais coeficientes são forçados a ser zero.

Quando λ é igual a zero, o modelo se torna a regressão de mínimos quadrados ordinários. Consequentemente, quando λ aumenta, a variância diminui significativamente e o viés no resultado também aumenta. O Lasso também é uma ferramenta útil para eliminar todas as variáveis ​​irrelevantes e não relacionadas à variável de resposta.

LASSO em modelos lineares estatísticos

Um modelo estatístico é uma representação matemática real de um problema. O modelo deve expressar o problema o mais próximo possível do mundo real, tornando-o simples e fácil de entender. Um modelo é composto de variáveis ​​explicativas e de resposta.

A variável explicativa é uma variável independente que fica a critério do pesquisador. As variáveis ​​independentes são as entradas no modelo que podem ser medidas pelo pesquisador para determinar seu efeito nos resultados do modelo.

A variável de resposta é uma variável dependente Variável dependente Uma variável dependente é aquela que mudará dependendo do valor de outra variável, chamada de variável independente. que constitui o foco principal do experimento. Ele forma o resultado do experimento, que pode ser um único resultado no caso de modelos univariados, ou, no caso de modelos multivariados, resultados múltiplos.

O LASSO é parte integrante do processo de construção do modelo, especialmente usando a seleção de recursos. A fase de seleção de recursos auxilia na seleção de variáveis ​​explicativas, que são as variáveis ​​independentes e, portanto, as variáveis ​​de entrada no modelo.

As variáveis ​​de entrada são elementos importantes que determinam a saída do modelo e que auxiliam na mensuração de seu efeito nas variáveis ​​de resposta. A escolha das variáveis ​​corretas determina a precisão do modelo. A fase de seleção de recursos do LASSO auxilia na seleção adequada das variáveis.

Estimativa com LASSO

Os modelos estatísticos contam com o LASSO para seleção e regularização precisas de variáveis. Na análise de regressão linear A análise de regressão é um conjunto de métodos estatísticos usados ​​para a estimativa das relações entre uma variável dependente e uma ou mais variáveis ​​independentes. Pode ser utilizado para avaliar a força da relação entre as variáveis ​​e para modelar a relação futura entre elas. , por exemplo, LASSO introduz um limite superior para a soma dos quadrados, minimizando assim os erros presentes no modelo. O estimador LASSO depende do parâmetro λ.

O parâmetro λ controla a resistência da contração, onde um aumento em λ resulta em um aumento na contração. O limite superior da soma de todos os coeficientes é inversamente proporcional ao parâmetro λ. Quando o valor do limite superior aumenta, o parâmetro λ diminui. Quando o limite superior diminui, o parâmetro λ aumenta simultaneamente.

Conforme o limite superior aumenta em direção ao infinito, o parâmetro λ se aproxima de zero, convertendo o experimento em Mínimos Quadrados Ordinários, onde o parâmetro λ é sempre igual a zero. Quando os coeficientes do limite superior se aproximam de zero, o valor do parâmetro λ aumenta em direção ao infinito.

Geometria LASSO

O LASSO forma um losango no gráfico para sua região de restrição, conforme mostrado na imagem abaixo. A forma do diamante inclui cantos, ao contrário da forma circular formada pela regressão do cume. A proximidade do primeiro ponto com o canto mostra que o modelo vem com um coeficiente, que é igual a zero.

A região de restrições de regressão de crista forma uma forma circular que não inclui cantos semelhantes aos formados pela região de restrições LASSO quando plotada. Os coeficientes de regressão de crista podem, portanto, não ser iguais a zero.

LASSO ponderado

Weighted LASSO é o resultado de um pesquisador penalizando os coeficientes de regressão isoladamente. Isso significa que em vez de penalizar um parâmetro comum λ para todos os coeficientes, os coeficientes são penalizados individualmente, usando parâmetros diferentes.

Os pesos podem ser determinados usando um algoritmo LASSO para atribuir pesos apropriadamente para uma modelagem precisa. Uma ponderação semelhante de coeficientes de regressão é a cooperativa LASSO, onde os coeficientes são penalizados em grupos considerados semelhantes.

Recursos adicionais

Finanças é o fornecedor oficial do Certified Banking & Credit Analyst (CBCA) ™ Certificação CBCA ™ O credenciamento Certified Banking & Credit Analyst (CBCA) ™ é um padrão global para analistas de crédito que cobre finanças, contabilidade, análise de crédito, análise de fluxo de caixa, modelagem de acordos, pagamentos de empréstimos e muito mais. programa de certificação, projetado para transformar qualquer pessoa em um analista financeiro de classe mundial.

Para continuar aprendendo e desenvolvendo seu conhecimento de análise financeira, recomendamos enfaticamente os recursos financeiros adicionais abaixo:

  • Métodos de previsão Métodos de previsão Principais métodos de previsão. Neste artigo, explicaremos quatro tipos de métodos de previsão de receita que os analistas financeiros usam para prever receitas futuras.
  • Variável independente Variável independente Uma variável independente é uma entrada, suposição ou fator que é alterado para avaliar seu impacto em uma variável dependente (o resultado).
  • Regressão linear múltipla Regressão linear múltipla A regressão linear múltipla se refere a uma técnica estatística usada para prever o resultado de uma variável dependente com base no valor das variáveis ​​independentes
  • Análise de cenário Análise de cenário A análise de cenário é uma técnica usada para analisar decisões por meio da especulação de vários resultados possíveis em investimentos financeiros. Na modelagem financeira, isso

Recomendado

O Crackstreams foi encerrado?
2022
O centro de comando do MC é seguro?
2022
Taliesin está deixando um papel crítico?
2022