jueves, 21 de noviembre de 2013

Análisis Combinatorio

Introducción Estadística Descriptiva

El monje











    Este video refleja una de las realidades que enfrentamos. Muchas veces nos sentimos un poco inseguros al usar estas las nuevas herramientas tecnológicas.

    Me parece bastante ilustrativo analógicamente, sobre la situación que viven algunas personas cuando se encuentran frente a una computadora.
     En ocasiones si se nos presentan situaciones nuevas nos generan miedo y nos resistimos al cambio, aunque ese cambio sea favorable y nos facilite o ayude para una mejor comprensión, una vez que se rompe esa estructura y quitamos la resistencia podemos aceptar y aprender con mayor facilidad.

Página 5


Guía teórica - Unidad 4

Medidas de dispersión o variacn

Hay casos en que debemos saber cuándo un promedio es poco representativo, entonces las medidas de variación o dispersión nos permite determinar estos casos.
A si los valores observados están muy concentrados alrededor del promedio, diremos que es mu representativo  pero,  si  los  valores  están  muy  dispersos  en  relación  al  mismo,  la representatividad es poca.
El significado de un promedio es mayor si viene acompañado de la medida de dispersión de los
 valores respecto de él.

Para expresar la dispersión se pueden usar varias medidas:
Rango

Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos.
R = xn   x1
xn= valor máximo
x1= valor mínimo.
Características del Rango:
·    Es una medida de cálculo sencillo.
·    Cuanto mayor es el rango, mayor es el campo de variación de la variable.
·    El  rango no está  afectadpor  los  valores  comprendidos  entre  el valor máximo o mínimo, al utilizar los extremos no proporciona una medida efectiva de variabilidad en
relación el valor promedio.



Varianza


La varianza es el promedio de los cuadrados de las desviaciones de los valores de la variable con respecto a su media.


La varianza poblacional se simboliza con sigma cuadrado (σ2) y la fórmula se expresa:
                                          σ 2  ∑(xi - µ)2/N





 
La varianza muestral (S2) se obtiene mediante la siguiente fórmula:
x(media aritmética)

S2  =∑ (xi - x)/n-1
 Principales características de la varianza

·   La varianza es matemáticamente lógica ya que considera los signos de los desvíos, de allí su ventaja con respecto a la desviación absoluta promedio.
·    La varianza no está expresada en unidades originales, sino en una unidad al cuadrado.
Esto es debido a la operación de elevar al cuadrado las desviaciones.
·    Cuando las varianzas son grandes se hace difícil su interpretación.

La varianza para datos de una población y una muestra, agrupados es una tabla de frecuencias se obtienen con las siguientes fórmulas:                             

                                                                                                                                                                                                                     
σ2  = ∑fi. (xi - µ)2 /N                                  o
 S2=∑ fi. (xi - x)/n-1
(media aritmética)

Desviación típica o estándar

Debido a que la varianza no está expresada en unidades originales y para restaurarlas se obtiene la raíz cuadrada de esta medida. La medida así obtenida recibe el nombre de "desviación típica o estándar"


La desviación típica es la raíz cuadrada del promedio de los cuadrados de las desviaciones de los valores con respecto a su media.

La desviación típica poblacional se simboliza con s (sigma) y la fórmula se expresa:

  σ =(xi - µ)/N  



La desviación típica muestral (S) se obtiene por:

                                                              

S= (xi - x)/n-1
 x( media aritmética) 


Principales característica de la desviación típica

·    Como la varianza, la desviación típica se calcula en base a todos los valores. Mide la dispersión alrededor de la media y no con respecto a ciertos valores como el rango.
·    La desviación estándar es matemáticamente lógica, ya que al igual que la varianza, tiene en cuenta los signos positivos y negativos de los desvíos individuales.
·    Como ya se señaló anteriormente, el desvío típico está expresado en unidades originales lo que facilita su análisis e interpretación.



 
·    Si es cero significa que todos los valores son iguales a la media aritmética y por lo tanto, no hay dispersión. 

·    A medida que los valores de una variable se alejan del promedio, mayor es la dispersión.



El desvío típico para datos de una población y una muestra, agrupados es una tabla de frecuencias se obtienen con las siguientes fórmulas

𝜎√ fi. (xi - µ)/N  


S= √fi. (xi - x)/n-1

Coeficiente de variación

Cuando se desea comparar dos distribuciones, las medidas absolutas de dispersión son útiles si los promedios de ambas son aproximadamente del mismo tamaño y las unidades de medida de  los  conjuntos  son  iguales,  de  lo  contrario  la  comparación  de  la  dispersión  se  hace complicada.
Para la comparación se requiere una medida relativa que describa una idea general de la magnitud  del  desvío  estándar  en  relación  con  la  magnitud  de  la  media.  Esta  medida  se denomina "coeficiente de variación" que se obtiene dividiendo el desvío típico sobre la media aritmética.




cv =    σ/ µ                                 cv = S /x 
x( media aritmética) 



Formas de la distribución

Por  la  forma  del  pogono,  se  puede  observar  cuando  una  distribución  es  simétrica  o asimétrica.
En el caso de que sea simétrica, los valores de la media aritmética, la mediana y la moda son iguales o casi iguales.
Si hay una asimetría (sesgo) hacia la derecha, ya que la media es mayor que la mediana y ésta mayor que la moda. En este caso x es afectada por algunos valores extremos altos.
Y si tiene una asimetría hacia la izquierda. La media es menor que la mediana y ésta menor que la moda. La media es afectada por valores extremos bajos.


En el primer caso, sería una distribución simétrica, por lo tanto  x = Me= Mo 

En el siguiente, es una distribución asimétrica hacia la derecha o asimétrica positiva, por lo cual es
(media aritmética) x> Me>Mo.

Y la última,  es una distribución asimétrica hacia la izquierda o asimétrica negativa, entonces tenemos que (media aritmética)x< Me <Mo.



Coeficiente de Asimetría de Pearson

La  asimetría  puede  medirse  a  través  de  un  coeficiente.  Uno  de  los  más  utilizado  es  el coeficiente de asimetría de Pearson que se obtiene de la siguiente manera:
Sk = (x - Mo)/ S                                    O      Sk = (x -  Me)/ S

Si Sk = 0 distribución simétrica.
Si Sk < 0 distribución asimétrica negativa.
Si Sk > 0 distribución asimétrica positiva.
x( media aritmética) 



 
Mientras más marcada sea la asimetría menos representativa es la media, siendo la mediana una medida más conveniente debido a que no recibe influencias de valores extremos.



Recordar:

Preste atención al seleccionar las distintas herramientas estadísticas, con el fin de no aplicar aquellas  que no correspondan, dado que existe una clara diferenciación entre las medidas admisibles para cada nivel de medición.

Variable
Nivel de medición
Medidas descriptivas



Cualitativa

Nominal
Frecuencia absoluta
Frecuencia porcentual
Moda

Ordinal
Mediana
Todas las medidas del nivel nominal



Cuantitativa


Intervalar
Media aritmética
Amplitud
Desvío estándar
Todas las medidas del nivel ordinal

De Ran
Coeficiente de variación
Todas las medidas del nivel intervalar




 
Como puede observar, las técnicas se van acumulando, es decir, que los niveles de mediciones superiores admiten todas las técnicas de los niveles anteriores.