quarta-feira, 29 de junho de 2016

Distribuição normal - Curva Normal - Shapiro wilk

Quando estamos trabalhando com poucos números é relativamente mais fácil identificar se nossa lista de números se enquadra em uma curva normal. Lembrando, identificar se nossa distribuição é normal vai nos ajudar a saber que tipo de teste estatístico deveremos usar em nossas análises.

Uma forma simples de saber isso é aplicar o teste “Shapiro wilk” e analisar o valor de p-value obtido com a realização desse teste. Se o valor for inferior a 0.05 significa que a distribuição NÃO é uma normal, caso contrário ela é uma normal.

Por exemplo: em “R” uma forma de fazer isso é aplicando o teste shapiro.test em uma lista de dados.

Imagine uma lista composta pelos números = (1,2,3,3,4,5,6,8,12,22,36,55), será que essa distribuição é uma normal? Para sabermos isso basta declararmos uma lista

numeros <-c span="">
shapiro.test(numeros)

Shapiro-Wilk normality test
 
data:  numeros
W = 0.72693, p-value = 0.001551

Como podemos ver o valor de p-value é inferior a 0.05 o que representa que essa distribuição não é uma normal. Isso pode ser constatado visualmente por meio da apresentação de um histograma, vide a imagem abaixo que, realmente, temos a constatação que não se trata de uma distribuição normal.

hist(numeros)


Nenhum comentário:

Postar um comentário