O que é estatística não paramétrica?

A estatística não paramétrica é um método que faz inferência estatística independentemente de qualquer distribuição subjacente. O método se ajusta a uma distribuição normal sem suposições. Habitualmente, a abordagem usa dados que geralmente são ordinais. Dados ordinais Em estatísticas, os dados ordinais são o tipo de dados em que os valores seguem uma ordem natural. Uma das características mais notáveis ​​dos dados ordinais é porque eles se baseiam em classificações e não em números.

Estatística Não Paramétrica

As estatísticas não paramétricas podem ser contrastadas com as estatísticas paramétricas. A última abordagem faz suposições explícitas sobre a distribuição dos dados observados e estima os parâmetros da distribuição usando os mesmos dados.

Resumo

  • A estatística não paramétrica é um método que desconsidera qualquer distribuição subjacente ao fazer inferência estatística.
  • Os métodos estatísticos não paramétricos visam descobrir a distribuição subjacente desconhecida dos dados observados, bem como fazer uma inferência estatística na ausência da distribuição subjacente.
  • Os pesquisadores são aconselhados a considerar os pontos fracos, fortes e potenciais armadilhas das estatísticas não paramétricas.

Compreendendo as estatísticas não paramétricas

Considere os dados com parâmetros desconhecidos µ (média) e σ2 (variância). Enquanto as estatísticas paramétricas presumem que os dados foram extraídos de uma distribuição normal. Distribuição normal A distribuição normal também é conhecida como distribuição Gaussiana ou Gauss. Esse tipo de distribuição é amplamente utilizado nas ciências naturais e sociais. O, uma estatística não paramétrica não assume que os dados são normalmente distribuídos ou quantitativos. Nesse sentido, a estatística não paramétrica estimaria a forma da própria distribuição, em vez de estimar o µ e σ2 individuais.

Por outro lado, as estatísticas paramétricas empregariam a média da amostra e o desvio padrão da amostra para estimar os valores de µ e σ2, respectivamente. A estrutura do modelo de estatísticas não paramétricas é deduzida dos dados observados, em oposição a um priori especificado . O próprio termo não paramétrico implica que o número e a natureza dos parâmetros são flexíveis, e não que faltem totalmente os parâmetros.

Tipos de estatísticas não paramétricas

Existem dois tipos principais de métodos estatísticos não paramétricos. O primeiro método procura descobrir a distribuição subjacente desconhecida dos dados observados, enquanto o segundo método tenta fazer uma inferência estatística desconsiderando a distribuição subjacente.

Métodos e histogramas de kernel Histograma Um histograma é usado para resumir dados discretos ou contínuos. Em outras palavras, um histograma fornece uma interpretação visual dos dados numéricos, mostrando o número de pontos de dados que se enquadram em uma faixa especificada de valores (chamados de “bins”). Um histograma é semelhante a um gráfico de barras verticais. No entanto, um histograma é comumente usado para estimar os valores dos parâmetros na primeira abordagem. Em contraste, o último método envolve o teste de hipóteses sem os valores reais dos dados, mas sim com base na ordem de classificação dos dados.

Os testes estatísticos não paramétricos tendem a ser mais fáceis de aplicar do que as estatísticas paramétricas, dada a falta de suposições sobre os parâmetros populacionais. Os procedimentos matemáticos padrão para o teste de hipóteses não fazem suposições sobre as distribuições de probabilidade - incluindo testes t de distribuição, testes de sinais e inferências de população única.

Por exemplo, ao testar a hipótese de que “há uma diferença nas medianas”, as duas variáveis ​​aleatórias, X e Y, definem duas distribuições contínuas entre onde a hipótese é realizada e as amostras emparelhadas são extraídas. Além de ter aplicabilidade geral, o teste também carece do poder estatístico de outros testes, visto que funciona sob algumas premissas.

Exemplos de estatísticas não paramétricas

Suponhamos que um pesquisador esteja interessado em estimar o número de bebês nascidos com icterícia no estado da Califórnia. Uma análise do conjunto de dados pode ser realizada tomando uma amostra de 5.000 bebês. Uma estimativa de toda a população de bebês com icterícia nascidos no ano seguinte é a medição derivada.

Para um segundo caso, considere dois grupos de pesquisadores diferentes. Eles estão interessados ​​em saber se o marketing geral ou o marketing comercial está associado à rapidez com que uma empresa obtém o posicionamento da marca. Supondo que o tamanho da amostra seja escolhido aleatoriamente, sua distribuição quanto à rapidez com que uma empresa realiza um posicionamento de marca Posicionamento de Mercado Posicionamento de Mercado refere-se à capacidade de influenciar a percepção do consumidor em relação a uma marca ou produto em relação aos concorrentes. O objetivo do mercado pode ser considerado normal. No entanto, um experimento que mede os objetivos estratégicos da empresa para lidar com a dinâmica do mercado (que também determina o posicionamento da marca) não pode ser assumido como tendo uma distribuição normal.

A ideia principal por trás do fenômeno é que dados selecionados aleatoriamente podem conter fatores como a dinâmica do mercado. No outro extremo, se fatores como segmento de mercado e concorrência entram em jogo, os objetivos estratégicos da empresa provavelmente não afetarão o tamanho da amostra. Essa abordagem é eficaz quando os dados carecem de uma interpretação numérica clara.

Por exemplo, os testes para determinar se os clientes preferem um determinado produto por causa de seu valor nutricional podem incluir uma classificação de suas métricas como concordo totalmente, concordo, indiferente, discordo e discordo totalmente. Nesse cenário, um método não paramétrico é útil.

Principais vantagens

O uso de abordagens estatísticas não paramétricas em pesquisas exige a devida diligência em seus pontos fracos, pontos fortes e potenciais armadilhas. É verdade que, para distribuição de dados, há excesso de curtose ou assimetria; Os testes não paramétricos baseados em classificação revelaram-se mais potentes do que os testes paramétricos.

Mesmo assim, nem todos os casos em que, se as premissas paramétricas não forem atendidas, adotamos estatísticas não paramétricas como métodos substitutos devido ao grau de confiança comparativamente baixo obtido nas estatísticas anteriores.

As estatísticas não paramétricas são apreciadas porque podem ser aplicadas com facilidade. Os dados se tornam mais aplicáveis ​​a vários testes, uma vez que os parâmetros não são obrigatórios. Mais importante, as estatísticas podem ser usadas na ausência de informações vitais, como a média, o desvio padrão ou o tamanho da amostra. Os recursos fazem com que as estatísticas não paramétricas tenham um escopo de aplicação mais amplo em comparação com as estatísticas paramétricas.

Recursos adicionais

Finanças é o fornecedor oficial da Certificação CBCA ™ de Certified Banking & Credit Analyst (CBCA) ™ O credenciamento Certified Banking & Credit Analyst (CBCA) ™ é um padrão global para analistas de crédito que cobre finanças, contabilidade, análise de crédito, análise de fluxo de caixa , modelagem de convênios, reembolsos de empréstimos e muito mais. programa de certificação, projetado para ajudar qualquer pessoa a se tornar um analista financeiro de classe mundial. Para continuar avançando em sua carreira, os recursos financeiros adicionais abaixo serão úteis:

  • Conceitos Básicos de Estatística em Finanças Conceitos Básicos de Estatística em Finanças Um conhecimento sólido de estatística é crucialmente importante para nos ajudar a compreender melhor as finanças. Além disso, os conceitos de estatísticas podem ajudar os investidores a monitorar
  • Teste de hipóteses Teste de hipóteses O teste de hipóteses é um método de inferência estatística. É usado para testar se uma afirmação sobre um parâmetro de população está correta. Testando hipóteses
  • Dados nominais Dados nominais Em estatísticas, dados nominais (também conhecidos como escala nominal) são um tipo de dados que é usado para rotular variáveis ​​sem fornecer nenhum valor quantitativo
  • Testes não paramétricos Testes não paramétricos Em estatística, os testes não paramétricos são métodos de análise estatística que não requerem uma distribuição para atender aos pressupostos necessários para serem analisados

Recomendado

O Crackstreams foi encerrado?
2022
O centro de comando do MC é seguro?
2022
Taliesin está deixando um papel crítico?
2022