Como determinar o tipo de distribuição de probabilidade para seus dados

Escrito por ehow contributor | Traduzido por bruno laget
  • Compartilhar
  • Tweetar
  • Compartilhar
  • Pin
  • E-mail
Como determinar o tipo de distribuição de probabilidade para seus dados
Descubra qual modelo melhor descreve seu conjunto de dados (Photos.com/AbleStock.com/Getty Images)

Uma vez que você já reuniu dados no seu sistema ou processo, o próximo passo é determinar qual tipo de distribuição de probabilidade o conjunto possui. Os tipos de distribuição de probabilidade são: uniforme discreta, Bernoulli, binomial, binomial negativa, Poisson, geométrica, uniforme contínua, normal (curva gaussiana ou curva sino), exponencial, gama e beta. Conseguir eliminar algumas dessas possibilidades torna o trabalho de determinar o menor valor de R-quadrado muito mais rápido.

Nível de dificuldade:
Moderadamente desafiante

Outras pessoas estão lendo

O que você precisa?

  • Software gráfico
  • Métodos para calcular o valor de R-quadrado (melhor ajuste)

Lista completaMinimizar

Instruções

    Metodologia

  1. 1

    Trace o gráfico dos dados para uma representação visual do tipo de dados.

  2. 2

    Um dos primeiros passos para determinar qual tipo de distribuição se tem – e, portanto, o tipo de equação usado para modelar os dados – é eliminar as distribuições que são inadequadas.

    • Se houver picos no conjunto de dados, não pode ser uma distribuição uniforme discreta. • Se os dados tiverem mais do que um pico, descarte Poisson ou binomial. • Se houver uma curva única, nenhum pico secundário e um declive suave em cada lado, pode ser Poisson ou gama. Mas não pode ser uma distribuição uniforme discreta. • Se os dados estiverem distribuídos igualmente, sem viés para um dos lados, é seguro descartar uma distribuição gama ou Weibull. • Se a função tiver uma distribuição por igual ou um pico no meio, não e uma distribuição geométrica ou exponencial. • Se a ocorrência de um fator flutuar com a variável ambiental, provavelmente não é uma distribuição de Poisson.

  3. 3

    Depois de eliminar algumas hipóteses da lista, faça uma análise do R-quadrado de cada tipo possível de distribuição de probabilidade que restou. Aquele com o maior valor de R-quadrado é, provavelmente, o mais correto.

  4. 4

    Elimine um ponto aberrante dos dados. Então recalcule R-quadrado. Se a mesma distribuição de probabilidade emergir como a melhor aproximação, então, existe um alto grau de confiança em que esta é a melhor distribuição para usar com o conjunto de dados.

Dicas & Advertências

  • Se os dados mostrarem múltiplos picos e uma alta dispersão, é possível que dois processos separados estejam ocorrendo simultaneamente ou que o produto da amostra está misturado. Colete os dados novamente e reanalise.
  • Valide as equações geradas contra dados posteriores para confirmar se o modelo ainda é preciso para o conjunto de dados. É possível que fatores ambientais e variações no processo tornem inadequados os modelos e equações correntes.

Não perca

Filtro:
  • Geral
  • Artigos
  • Slides
  • Vídeos
Mostrar:
  • Mais relevantes
  • Mais lidos
  • Mais recentes

Nenhum artigo disponível

Nenhum slide disponível

Nenhum vídeo disponível