Quando estamos trabalhando com poucos números é
relativamente mais fácil identificar se nossa lista de números se enquadra em
uma curva normal. Lembrando, identificar se nossa distribuição é normal vai nos ajudar a saber que tipo de teste estatístico deveremos usar em nossas análises.
Uma forma simples de saber isso é aplicar o teste “Shapiro wilk”
e analisar o valor de p-value obtido com a realização desse teste. Se o valor
for inferior a 0.05 significa que a distribuição NÃO é uma normal, caso
contrário ela é uma normal.
Por exemplo: em “R” uma forma de fazer isso é aplicando o
teste shapiro.test em uma lista de dados.
Imagine uma lista composta pelos números = (1,2,3,3,4,5,6,8,12,22,36,55),
será que essa distribuição é uma normal? Para sabermos isso basta declararmos
uma lista
numeros <-c span="">-c>
shapiro.test(numeros)
Shapiro-Wilk normality test
data: numeros
W = 0.72693, p-value = 0.001551
Como podemos ver o valor de p-value é inferior a 0.05 o que
representa que essa distribuição não é uma normal. Isso pode ser constatado
visualmente por meio da apresentação de um histograma, vide a imagem abaixo
que, realmente, temos a constatação que não se trata de uma distribuição
normal.
hist(numeros)