Como remover valores atípicos no SPSS

Escrito por rae williams | Traduzido por paula mangia garcia terra
  • Compartilhar
  • Tweetar
  • Compartilhar
  • Pin
  • E-mail
Como remover valores atípicos no SPSS
Valores atípicos são valores extremos que podem provocar distorção dos resultados de uma análise estatística e criar conclusões imprecisas (Jupiterimages/Photos.com/Getty Images)

Valores atípicos em análises estatísticas são valores extremos que não parecem se encaixar na maioria dos conjuntos de dados. Se não forem removidos, esses valores extremos podem ter um grande efeito sobre as conclusões que podem ser extraídas dos dados em questão, porque eles podem provocar distorção dos coeficientes de correlação e linhas de melhor ajuste na direção errada. O SPSS é um dos muitos programas de análise estatística que podem ser usados ​​para interpretar um conjunto de dados e identificar e remover valores atípicos.

Nível de dificuldade:
Fácil

Outras pessoas estão lendo

Instruções

    Análise de dados exploratória

  1. 1

    Clique em "Analyze". Selecione "Descriptive Statistics" e, em seguida, em "Explore".

  2. 2

    Arraste e solte as colunas que contêm os dados das variáveis ​​dependentes na caixa chamada "Dependent List" e clique em "OK".

  3. 3

    Remova quaisquer valores atípicos identificados pelo SPSS nos diagramas de galhos e folhas ou diagramas de caixa, excluindo os pontos de dados individuais. Alternativamente, você pode definir um filtro para excluir esses pontos de dados.

  4. 4

    Selecione "Data" e, em seguida, "Select Cases" e clique em uma condição que possui os valores atípicos que você deseja excluir. Determine um valor para essa condição que exclui apenas os valores atípicos e nenhum dos pontos de dados não atípicos.

  5. 5

    Selecione a opção "If Condition is Satisfied" na caixa "Select" e, em seguida, clique no botão "If" logo abaixo. Insira a regra para excluir valores atípicos determinados na etapa anterior na caixa do canto superior direito. Por exemplo, se você estava excluindo medidas acima de 1,89m da condição de "altura" (height), você deve digitar "height < = 74.5". Clique em "Continue" e em "OK" para ativar o filtro.

    Análise de regressão

  1. 1

    No menu "Analyze", selecione "Regression" e, em seguida, "Linear". Selecione as variáveis ​​dependentes e independentes que você deseja analisar.

  2. 2

    Clique em "Save" e selecione "Cook's Distance". Os valores calculados para a distância de Cook serão salvos no seu arquivo de dados como variáveis ​​rotuladas de "COO-1".

  3. 3

    Execute um diagrama de caixa (boxplot) selecionando "Graphs" e, em seguida, "Boxplot". Clique em "Simple" e selecione "Summaries of Separate Variables". Digite "COO-1" na caixa rotulada "Boxes Represent" e, em seguida, digite uma ID ou nome para identificar os casos na caixa "Label Cases By".

  4. 4

    Amplie o boxplot no arquivo de saída dando um clique duplo sobre ele. Anote os casos que estão além das linhas pretas --- estes são seus valores atípicos. Você pode remover todos eles ou apenas os valores atípicos extremos, que estão marcados por um asterisco (*).

  5. 5

    Volte para o arquivo de dados e localize os casos que precisam ser excluídos. Comece de baixo para cima, realce o número na extremidade esquerda, na coluna cinza, para que a linha inteira seja selecionada. Clique em "Edit" e selecione "Clear". Repita este passo para cada valor atípico identificado a partir do boxplot.

Dicas & Advertências

  • Ao excluir casos na Seção 2, passo 5, comece sempre de baixo para cima no arquivo de dados porque os números de identificação mudam quando você exclui um caso. Se você fizer de cima para baixo, você irá apagar os casos errados.

Não perca

Filtro:
  • Geral
  • Artigos
  • Slides
  • Vídeos
Mostrar:
  • Mais relevantes
  • Mais lidos
  • Mais recentes

Nenhum artigo disponível

Nenhum slide disponível

Nenhum vídeo disponível