Como calcular discrepâncias?
Uma discrepância é um valor em um conjunto de dados que está longe dos outros valores. Discrepâncias podem ser causadas por erros experimentais ou de medição. Nos primeiros casos, pode ser desejável identificar valores discrepantes e removê-los dos demais dados antes de realizar uma análise estatística para evitar que afetem os resultados, uma vez que não representam fielmente a população da amostra. A maneira mais simples de identificar as discrepâncias é com o método quartil.
Step 1
Liste os dados em ordem crescente. Considere o conjunto de dados {4, 5, 2, 3, 15, 3, 3, 5}. Ordenados, o exemplo de conjunto de dados é: {2, 3, 3, 3, 4, 5, 5, 15}.
Step 2
Encontre a mediana. Esse é o número central, que divide a metade maior da metade menor. Se houver um número par de dados, a média dos dois deve ser calculada. Por exemplo: no conjunto de dados citado, os pontos médios são 3 e 4, de modo que a mediana é (3 + 4) / 2 = 3,5.
Step 3
Encontre o quartil superior, Q2, ponto de dados que divide o grupo entre os 75% menores e os 25% maiores. Se o conjunto de dados é par, faça a média de dois pontos ao redor do quartil. No exemplo anterior: (5 + 5) / 2 = 5.
Step 4
Encontre o quartil mais baixo, Q1, o ponto de dados que separa os 25% menores dos 75% maiores. Se o conjunto de dados é par, faça a média de dois pontos ao redor do quartil. No exemplo: (3 + 3) / 2 = 3.
Step 5
Subtraia o quartil inferior do quartil superior para obter o intervalo interquartil, IQ. No exemplo: Q2 - Q1 = 5 - 3 = 2.
Step 6
Multiplique o intervalo interquartil por 1,5. Some ao resultado o quartil superior e subtraia o quartil inferior. Qualquer ponto de dados fora desses valores é uma discrepância suave. Para o exemplo dado: 1,5 x 2 = 3. 3 - 3 = 0 e 5 +3 = 8. Assim, qualquer valor inferior a 0 ou superior a 8 seria uma discrepância leve. Isso significa que 15 qualifica-se como uma discrepância leve.
Step 7
Multiplique o intervalo interquartil por 3. Some ao quartil superior e subtraia o quartil inferior. Qualquer ponto de dados fora desses valores é uma discrepância extrema. Para o exemplo dado, 3 x 2 = 6. 3-6 = -3 e 5 + 6 = 11. Assim, qualquer valor inferior a -3 ou maior que 11 é uma discrepância extrema. Isso significa que 15 qualifica-se como uma discrepância extrema.
Referências
Dica
- As discrepâncias extremas são mais um indicativo de um conjunto de dados ruim do que uma suave.
- Examine as causas de todos os valores discrepantes com cuidado.
Sobre o Autor
Kaylee Finn began writing professionally for various websites in 2009, primarily contributing articles covering topics in business personal finance. She brings expertise in the areas of taxes, student loans and debt management to her writing. She received her Bachelor of Science in system dynamics from Worcester Polytechnic Institute.