A média é uma maneira de encontrar a tendência central de uma distribuição, contudo, a média é uma medida muito sensível a existência de outliers, ou seja, pontos fora da curva. Ela é uma boa opção quando temos a distribuição estável, sem a existência de elementos que possam distorcer a distribuição. Para tipo de dado ordinais a média não é uma boa opção para estabelecimento da tendência central.
Outra forma de fazer isso é com a mediana, que procura encontrar, em uma distribuição ordenada, o elemento central da distribuição, ou seja, o elemento que está no meio da distribuição quando ordenado. Ele sofre menos com a existência de outliers, pois eles ficam nas pontas da distribuição.
A moda é a terceira forma de análise e tem o objetivo de encontrar o elemento que mais se repete em uma distribuição. Exemplo: c(1,2,2,3,4), a moda dessa distribuição é o "2". Uma distribuição como c(1,2,3,4) não tem como calcular a moda, pois não possui elementos repetidos.
Quando o tipo de dado for ordinal o mais recomendado é usar mediana ou moda, não devemos fazer uso da média aritmética. Já quando o tipo de dado for intervalar podemos fazer o uso de média aritmética, mas se ele contar com a presença de outliers, a média pode ser afetada. A média pode ser uma opção a ser usada em uma distribuição normal, por isso, desenhe um histograma.
Nenhum comentário:
Postar um comentário