Guía teórica -
Unidad 3
Concepto
Las medidas descriptivas son
valores representativos de una
distribución, son cifras individuales que resumen la información. Se utilizan para describir ciertas características de los datos, permitiendo una comprensión más precisa si se realiza una buena interpretación de las
mismas.
Además, a partir de estas medidas se podrán realizar inferencias y pronósticos.
El análisis de la información se puede realizar a través de:
· Medidas de tendencia central y de posición.
· Medidas de dispersión.
· Medidas de asimetría (sesgo).
En esta
unidad solo se estudiarán las medidas de tendencia central y de posición.
Medidas de tendencia central y de posición:
Existe una tendencia generalizada a sintetizar situaciones de la vida cotidiana. De esta misma
manera, en estadística se trabaja con ciertas medidas que caracterizan a una población o a una muestra.
Por eso el uso de estas medidas.
Las medidas de tendencia central en particular, son medidas de posición que informan sobre
los valores centrales de un conjunto de datos.
Veremos las principales:
Media Aritmética:
Esta es la medida de tendencia central más popular y lo que el lego llama un "promedio"
o
solamente media. Se utiliza principalmente "media aritmética" para distinguir la media de la media geométrica o la
media armónica,
otros dos
casos
que se utilizan en casos muy especiales.
Se define como:
La media aritmética de un conjunto de observaciones numéricas es la suma de los valores
del conjunto dividida por el número de observaciones.
Es correcto utilizar el término "promedio"
y en su momento, lo debemos aplicar, pero en
estadística existen
otros tipos
de promedios por
lo cual puede
generar algún
tipo de
ambigüedad.
|
Siete trabajadores
de una compañía perciben los siguientes salarios:
320 360 330 340 355 325 346
El
salario medio es:
Media = $ 339,43
Al interpretar el valor podría
decirse por ejemplo que: el salario medio de los trabajadores de la compañía es de $ 339,43.
Para el cálculo en datos sin agrupar podemos considerar:
a)
Sean x1, x2 ...........xn los N datos correspondientes a una población. La media población
(simbolizada por µ) es:
b)
Sean x1, x2 ..., xn los n datos correspondientes a una muestra. La media muestral
(simbolizada por x) es:
(media aritmética) x = (x1+x2+x3+....+xn) / n
x=∑ xi/n
xi = representa a cada valor de la distribución.
N = representa al total
de
observaciones de la población.
n = representa al
total de observaciones de la muestra.
Σ = Suma de los valores de la variable.
Aparte de considerar que la media es una medida simple y común, las siguientes son algunas de las propiedades que es importante considerar:
· Se puede calcular para cualquier conjunto de datos,
luego siempre existe.
· Un conjunto de datos numéricos tiene una y sólo una media, entonces ésta siempre es única.
· Lleva a un tratamiento estadístico más de fondo; las medias de varios conjunto de datos siempre se pueden combinar en una media general
de
todos los datos.
· Es relativamente
confiable en el
sentido de
que las
medias
de muchas muestras
obtenidas a partir de la misma población usualmente no fluctúan o varían tanto como otras medidas estadísticas utilizadas para estimar la media de la población.
· Toma en cuenta todos los artículos de un conjunto de datos.
|
No obstante, al tomar todos los valores del conjunto, al existir valores extremos, la media
puede no ser representativa.
Entonces, cuando se encuentra muy afectada por un valor muy alto o muy bajo, en ocasiones es preferible describir el punto medio o el centro de un conjunto de datos con una medida estadística diferente de la media, quizá con una mediana, que veremos en esta unidad.
Para el cálculo en datos agrupados
Si cada valor x1, x2, ... xn está agrupado en una tabla con su frecuencia respectiva, f1, f2, ...
fn, la media aritmética se obtiene multiplicando cada valor (xi) por su frecuencia (fi) y la suma de los
productos se divide por el total
de
observaciones de la muestra o de la población, o sea:
Mediana:
Esta medida no se encuentra afectada por los valores extremos.
La
mediana de n valores requiere que se acomoden los datos de acuerdo con su tamaño y se define como:
La mediana es el valor que se ubica en el centro de un conjunto de datos ordenados.
La mediana deja dividida a la distribución en dos partes iguales, o sea
que tiene tantos términos inferiores como superiores a ella.
Para el cálculo, en datos sin agrupar, debe considerarse dos situaciones.
a) Número impar de datos
La mediana es el valor que se ubica en la posición [(n+1)/2].
Los salarios de los 7 trabajadores ordenados de
menor a mayor.
320 325 330 340 346 355 360
La mediana se ubica en la posición [(7 + 1)/2] = 4º lugar.
Me = $ 340
|
Interpretación: La mitad de los trabajadores tienen un sueldo inferior a $ 340 y la otra mitad superior
a dicho valor.
b) Número
par
de datos
La mediana es el valor que se ubica en las posiciones.
(n/2) y [(n + 2)/2] Los salarios de 8 trabajadores ordenados son:
320 325 330 340 346 355 360 365
La mediana se ubica entre el 4º y 5º lugar, o sea:
(8/2) = 4º
y [(8/2)/2] = 5º
Me= (340+346) /2= $ 343
Interpretación: El 50% de los empleados tienen un salario superior a $ 343 y el resto inferior al
mismo.
Algunas características de la mediana:
· La mediana no está afectada por valores extremos porque no utiliza todos los valores
para su cálculo.
· La mediana no está definida algebraicamente.
· En algunos casos, como cuando el número de datos es par, la mediana es un valor aproximado, ya que es el valor medio de los dos valores centrales.
El cálculo para datos agrupados sería:
La mediana para datos agrupados en una tabla de frecuencias con intervalos de clase es un valor aproximado a la verdadera mediana. Se puede
obtener por el método de interpolación:
En primer lugar se debe identificar el "intervalo mediano", observando la mitad del conjunto de datos
(n/2) y que la misma se encuentre dentro de las frecuencias acumuladas en ese intervalo.
Luego se aplica la siguiente fórmula:
Li: límite inferior del intervalo mediano
n: total
de
datos promediados
fa ant: frecuencia acumulada anterior al
intervalo mediano
fi med: frecuencia absoluta simple del intervalo mediano
C: amplitud del intervalo mediano.
Moda (o Modo):
Otra medida que se utiliza en ocasiones para
describir el punto medio o centro de un conjunto
de
datos es la moda, o también llamada modo, que se define simplemente como:
La moda es el valor que se presenta
con la mayor frecuencia.
Ejemplo: Los salarios de 10 trabajadores son:
365 - 320 - 340 - 370 - 380 - 340 - 355 - 340 - 326 - 340
Como el número de trabajadores
que percibe $340 es mayor que cualquier otro, la moda es
340.
Mo = $ 340
Interpretación: El sueldo más común entre los trabajadores es de $ 340.
Algunas características de la moda:
· La moda no está definida algebraicamente.
· No está afectada por valores extremos.
· Es una medida adecuada para el análisis de variables cualitativas. Por ejemplo: estado
civil
modal, nivel de instrucción modal, etc.
· En un conjunto de
datos puede
haber
una, dos
o
más modas y en algunas distribuciones puede no haber moda ya que no hay ningún valor que se presente con la mayor frecuencia.
Si la distribución tiene una moda se denomina unimodal, si tiene dos, se denomina bimodal y si tiene tres o más modas se denomina multimodal. La distribución que no presenta moda, se denomina amodal.
El cálculo para datos agrupados sería:
La moda, para una distribución de frecuencias, no puede calcularse exactamente, sino en
forma aproximada.
Los métodos de cálculos son:
a) el método directo y b) el método de interpolación mediante fórmula.
a) El método directo:
La moda directa en una distribución de frecuencias es la marca de clase o punto medio del intervalo modal.
El intervalo modal es
el que tiene la mayor frecuencia.
|
b) El método de interpolación mediante fórmula: La fórmula para el cálculo de la moda es:
Mo = Li+ (D1 / D1+D2) . c
Li: Límite inferior del intervalo modal
D1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior a la modal.
D2: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior a la modal.
c: Amplitud de la clase modal.
Otras medidas de posición:
Cuartiles:
Así como la mediana divide la distribución en dos partes iguales, los cuartiles dividen a la distribución en cuatro partes iguales (o casi
iguales).
Existen tres cuartiles:
· Primer cuartil (Q1) es el valor de la variable por debajo del cual queda el 25% de los elementos de la serie estudiada.
· Segundo cuartil (Q2) es el valor por debajo del cual queda el 50% de los elementos de la distribución. El
segundo cuartil es igual a la mediana.
· Tercer cuartil (Q3) es el valor por debajo del cual queda el 75% de los elementos de la
distribución.
Para calcular los cuartiles en los datos sin agrupar se debe seguir el siguiente procedimiento.
1') Ordenar los datos de menor a mayor.
2') Encontrar la posición que ocupa el Q1, Q2 o Q3 a través de las siguientes fórmulas:
Q1=(n+1)/4 Q2=2.(n+1)/4 Q3=3(n+1)/4
3') Buscar el dato que ocupa la posición hallada en el peso anterior.
Deciles
Los deciles (D) dividen a la distribución en diez partes iguales. Así, por ejemplo, el decil 1 (D1), deja el 10% de los valores por debajo de él; el decil 2 (D2) deja el 20% de los valores por debajo de él.
Análogamente ocurre con los deciles D3, D4... D9.
|
No se desarrollarán las fórmulas para su cálculo. No obstante, los procedimientos de dichos cálculos son análogos a los utilizados para la mediana y los cuartiles.
Recordar:
Preste atención al seleccionar las distintas herramientas estadísticas, con el fin de no aplicar aquellas que no correspondan, dado que existe una clara diferenciación entre las medidas admisibles para cada nivel de medición.
Variable
|
Nivel de medición
|
Medidas descriptivas
|
Cualitativa
|
Nominal
|
Frecuencia absoluta
Frecuencia porcentual
Moda
|
Ordinal
|
Mediana
Todas las medidas del nivel
nominal
|
|
Cuantitativa
|
Intervalar
|
Frecuencias acumuladas
Media aritmética
Amplitud (unidad 4)
Desvío estándar (unidad 4)
Todas las medidas del nivel ordinal
|
De Razón
|
Coeficiente de variación (unidad 4)
Todas las medidas del nivel
intervalar
|
|
Como usted puede
observar, las técnicas se van acumulando, es decir, que los niveles de
mediciones superiores admiten todas las técnicas de los niveles anteriores.
No hay comentarios:
Publicar un comentario