jueves, 21 de noviembre de 2013

Página 4

Guía teórica - Unidad 3

Concepto

Las   medidas   descriptiva son   valores   representativo d un distribución so cifras individuales que resumen la información. Se utilizan para describir ciertas características de los datos, permitiendo una comprensión más precisa si se realiza una buena interpretación de las mismas. Además, a partir de estas medidas se podrán realizar inferencias y pronósticos.

El análisis de la información se puede realizar a través de:
·    Medidas de tendencia central y de posición.
·    Medidas de dispersión.
·    Medidas de asimetría (sesgo).


En esta unidad solo se estudiarán las medidas de tendencia central y de posición.


Medidas de tendencia central y de posición:

Existe una tendencia generalizada a sintetizar situaciones de la vida cotidiana. De esta misma manera, en estadística se trabaja con ciertas medidas que caracterizan a una población o a una muestra. Por eso el uso de estas medidas.
Las medidas de tendencia central en particular, son medidas de posición que informan sobre los valores centrales de un conjunto de datos. Veremos las principales:

Media Aritmética:

Esta es la medida de tendencia central más popular y lo que el lego llama un "promedio"  o solamente media. Se utiliza principalmente "media aritmética" para distinguir la media de la media  geométrica  o  la  media  armónica,  otros  dos  casos  que  se  utilizan  en  casos  muy especiales.
Se define como:

La media aritmética de un conjunto de observaciones numéricas es la suma de los valores del conjunto dividida por el mero de observaciones.

Es correcto utilizar el término "promedio" y en su momento, lo debemos aplicar, pero en estadística  existen  otros  tipos  de  promedios  por  lo  cual  puede  generar  algún  tipo  de ambigüedad.




 
Siete trabajadores de una compañía perciben los siguientes salarios:

320          360         330        340        355         325         346


El salario medio es:

 µ = (320+360+330+340+355+325+346)/7= 2376/7



Media = $ 339,43

Al interpretar el valor podría decirse por ejemplo que: el salario medio de los trabajadores de la compañía es de $ 339,43.

Para el cálculo en datos sin agrupar podemos considerar:

a)      Sean x1, x2  ...........xn los N datos correspondientes a una población. La media población
(simbolizada por µ) es:

 µ =  (x1+x2+x3+....+xn) / N                                                   µ=∑ xi/N 



b)      Sean x1, x2  ..., xn los n datos correspondientes a una muestra. La media muestral
(simbolizada por x) es:
(media aritmética)       x = (x1+x2+x3+....+xn) / n         
    x=∑ xi/n 



xi  = representa a cada valor de la distribución.
N = representa al total de observaciones de la población.
n = representa al total de observaciones de la muestra.
Σ = Suma de los valores de la variable.


Aparte de considerar que la media es una medida simple y común, las siguientes son algunas de las propiedades que es importante considerar:

·    Se puede calcular para cualquier conjunto de datos,  luego siempre existe.
·    Un conjunto de datos numéricos tiene una y sólo una media, entonces ésta siempre es única.
·    Lleva a un tratamiento estadístico más de fondo; las medias de varios conjunto de datos siempre se pueden combinar en una media general de todos los datos.
·    Es  relativamente  confiable  en  el  sentido  de  que  las  medias  de  muchas  muestras obtenidas a partir de la misma población usualmente no fluctúan o varían tanto como otras medidas estadísticas utilizadas para estimar la media de la población.
·    Toma en cuenta todos los artículos de un conjunto de datos.




 
No obstante, al tomar todos los valores del conjunto, al existir valores extremos, la media puede no ser representativa.


Entonces, cuando se encuentra muy afectada por un valor muy alto o muy bajo, en ocasiones es  preferible describir el punto medio o el centro de un conjunto de datos con una medida estadística diferente de la media, quizá con una mediana, que veremos en esta unidad.


Para el cálculo en datos agrupados

Si cada valor x1, x2, ... xn está agrupado en una tabla con su frecuencia respectiva, f1, f2, ... fn, la media aritmética se obtiene multiplicando cada valor (xi) por su frecuencia (fi) y la suma de los productos se divide por el total de observaciones de la muestra o de la población, o sea:
 µ = ∑ fi.  xi/N   o      x = ∑ fi . xi/n 



Mediana:

Esta medida no se encuentra afectada por los valores extremos. La mediana de n valores requiere que se acomoden los datos de acuerdo con su tamaño y se define como:

La mediana es el valor que se ubica en el centro de un conjunto de datos ordenados.

La mediana deja dividida a la distribución en dos partes iguales, o sea que tiene tantos términos inferiores como superiores a ella.

Para el cálculo, en datos sin agrupar, debe considerarse dos situaciones.

a) Número impar de datos

La mediana es el valor que se ubica en la posición [(n+1)/2].

Los salarios de los 7 trabajadores ordenados de menor a mayor.

320         325          330        340         346         355         360

La mediana se ubica en la posición [(7 + 1)/2] = 4º lugar.

Me = $ 340




 
Interpretación: La mitad de los trabajadores tienen un sueldo inferior a $ 340 y la otra mitad superior  a dicho valor.



b) Número par de datos

La mediana es el valor que se ubica en las posiciones. (n/2) y [(n + 2)/2] Los salarios de 8 trabajadores ordenados son:
320         325         330        340          346         355         360        365

La mediana se ubica entre el 4º y 5º lugar, o sea: (8/2) = 4º  y   [(8/2)/2] = 5º


Me=   (340+346) /2= $ 343


Interpretación: El 50% de los empleados tienen un salario superior a $ 343 y el resto inferior al mismo.

Algunas características de la mediana:

·    La mediana no está afectada por valores extremos porque no utiliza todos los valores para su cálculo.
·    La mediana no está definida algebraicamente.
·    En algunos casos, como cuando el mero de datos es par, la mediana es un valor aproximado, ya que es el valor medio de los dos valores centrales.

El cálculo para datos agrupados sería:

La mediana para datos agrupados en una tabla de frecuencias con intervalos de clase es un valor aproximado a la verdadera mediana. Se puede obtener por el método de interpolación:
En primer lugar se debe identificar el "intervalo mediano", observando la mitad del conjunto de datos  (n/2) y que la misma se encuentre dentro de las frecuencias acumuladas en ese intervalo.
Luego se aplica la siguiente fórmula:

Me = Li +((n/2-fa ant)/ fi med) . c

Li: mite inferior del intervalo median
n: total de datos promediados

fa ant: frecuencia acumulada anterior al intervalo mediano
fi med: frecuencia absoluta simple del intervalo mediano
C: amplitud del intervalo mediano.



Moda (o Modo):

Otra medida que se utiliza en ocasiones para describir el punto medio o centro de un conjunto de datos es la moda, o también llamada modo, que se define simplemente como:

La moda es el valor que se presenta con la mayor frecuencia.

Ejemplo: Los salarios de 10 trabajadores son:

365 - 320 - 340 - 370 - 380 - 340 - 355 - 340 - 326 - 340

Como el mero de trabajadores que percibe $340 es mayor que cualquier otro, la moda es
340.
Mo = $ 340

Interpretación: El sueldo más común entre los trabajadores es de $ 340.



Algunas características de la moda:

·    La moda no está definida algebraicamente.
·    No está afectada por valores extremos.
·    Es una medida adecuada para el análisis de variables cualitativas. Por ejemplo: estado civil modal, nivel de instrucción modal, etc.
·    En  un  conjunto  de  datos  puede  haber  una,  dos  o  más  modas  y  en  algunas distribuciones puede no haber moda ya que no hay ningún valor que se presente con la mayor frecuencia.

Si la distribución tiene una moda se denomina unimodal, si tiene dos, se denomina bimodal y si tiene tres o más modas se denomina multimodal. La distribución que no presenta moda, se denomina amodal.


El cálculo para datos agrupados sería:

La moda, para una distribución de frecuencias, no puede calcularse exactamente, sino en forma aproximada. Los métodos de cálculos son:
a) el método directo y b) el método de interpolación mediante fórmula. a) El método directo:
La moda directa en una distribución de frecuencias es la marca de clase o punto medio del intervalo modal. El intervalo modal es el que tiene la mayor frecuencia.




 
b) El método de interpolación mediante fórmula: La fórmula para el cálculo de la moda es:



Mo = Li+  (D1  /  D1+D2) .  c


Li: Límite inferior del intervalo modal
D1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior a la modal.
D2: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior a la modal.
c: Amplitud de la clase modal.



Otras medidas de posición:

Cuartiles:

A como la mediana divide la distribución en dos partes iguales, los cuartiles dividen a la distribución en cuatro partes iguales (o casi iguales).

Existen tres cuartiles:
·    Primer cuartil (Q1) es el valor de la variable por debajo del cual queda el 25% de los elementos de la serie estudiada.
·    Segundo cuartil (Q2) es el valor por debajo del cual queda el 50% de los elementos de la distribución. El segundo cuartil es igual a la mediana.
·    Tercer cuartil (Q3) es el valor por debajo del cual queda el 75% de los elementos de la distribución.

Para calcular los cuartiles en los datos sin agrupar se debe seguir el siguiente procedimiento.
1') Ordenar los datos de menor a mayor.
2') Encontrar la posición que ocupa el Q1, Q2  o Q3  a través de las siguientes fórmulas:
Q1=(n+1)/4                                               Q2=2.(n+1)/4                     Q3=3(n+1)/4
3') Buscar el dato que ocupa la posición hallada en el peso anterior.



Deciles

Los deciles (D) dividen a la distribución en diez partes iguales. Así, por ejemplo, el decil 1 (D1), deja el 10% de los valores por debajo de él; el decil 2 (D2) deja el 20% de los valores por debajo de él. Análogamente ocurre con los deciles D3, D4... D9.




 
No se desarrollarán las fórmulas para su cálculo. No obstante, los procedimientos de dichos cálculos son análogos a los utilizados para la mediana y los cuartiles.





Recordar:

Preste atención al seleccionar las distintas herramientas estadísticas, con el fin de no aplicar aquellas  que no correspondan, dado que existe una clara diferenciación entre las medidas admisibles para cada nivel de medición.

Variable
Nivel de medición
Medidas descriptivas



Cualitativa

Nominal
Frecuencia absoluta
Frecuencia porcentual
Moda

Ordinal
Mediana
Todas las medidas del nivel nominal




Cuantitativa



Intervalar
Frecuencias acumuladas
Media aritmética
Amplitud (unidad 4)
Desvío estándar (unidad 4)
Todas las medidas del nivel ordinal

De Ran
Coeficiente de variación (unidad 4)
Todas las medidas del nivel intervalar




 
Como usted puede observar, las técnicas se van acumulando, es decir, que los niveles de mediciones superiores admiten todas las técnicas de los niveles anteriores.










No hay comentarios:

Publicar un comentario