miércoles, 20 de noviembre de 2013

Las estadísticas de los Atropellados


Cada 20 minutos atropellan a un hombre.
No lo decimos nosotros lo dicen las estadísticas.



¿Qué es la estadística?

Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha experimentado un gran desarrollo a lo largo de los últimos años.

¿En qué áreas se aplica la estadística?


Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras.

http://www.timerime.com/es/linea_de_tiempo/2532866/Historia+de+Estadstica/




Prezi

http://prezi.com/

Six Minutes Speaking and Presentation Skills

http://sixminutes.dlugan.com/

Ken Robinson: Changing Paradigms (Spanish)

http://www.youtube.com/watch?v=Z78aaeJR8no

Educar

http://www.educ.ar/

Especialización Docente en Educación y Tic

http://postitulo.educacion.gob.ar/

Word Reference

http://www.wordreference.com/

Página 3

                                         Unidad 2

Distribución de frecuencias:

Cuando el mero de valores que toma la variable es grande, se hace necesario resumir linformación para posibilitar la lectura y la interpretación. Una manera efectiva de reducir el tamañ de la serie y facilitar su tratamiento es mediante la confección de distribuciones de frecuencias.



Un distribució d frecuencia e un tabl dond lo dato s agrupa e clase categorías con sus respectivas frecuencias.

Con estas tablas se puede apreciar mejor la configuración de la información a la vez que se facilitan los cálculos y el análisis de los datos.


Distribucn dfrecuencias para variables continuas


   2,7
1.8
1.0
2.2
4.1
   3.8
4.8
2.5
1.4
4.5
   3.1
3.3
3.6
3.0
2.5
   5.3
3.3
3.0
5.8
4.4
   3.4
2.1
5.6
3.9
3.4


Supóngase que se analizan los índices mensuales de accidentes de las empresas industriales duna ciudad determinada. Para el estudio se seleccionan 25 establecimientos y se registra para cada una el  número de accidentes por mil horas-hombre del último mes. Los datos son los siguientes.


Estos valores constituyen una "serie simple" de datos. Son datos brutos porque todavía no han sido procesados por métodos estadísticos. O sea, son datos sin agrupar.

Organizacn dlos datos

Un primera  técnic sencill d organizació es  l "ordenación qu consist en  undisposició d lo valores  en  form ascendent  descendente.  Y así  se  obtiene  unagrupación simple.

1.0
2.5
3.1
3.6
4.5
1.4
2.5
3.3
3.8
4.8
1.8
2.7
3.3
3.9
5.3
2.1
3.0
3.4
4.1
5.6
2.2
3.0
3.4
4.4
5.8

Una de las ventajas de este arreglo es la identificación pida de valores máximos y mínimos. Sin embargo, la ordenación no resulta pctica para el análisis y pierde importancia cuando es grande el mero de datos.





Otra  técnic d organizar  lo dato para  la  evaluació del  investigado co el  objet de seleccionar extremos, valores típicos y concentración de valores, es el "arreglo de tallos hojas". Se ordenan el (o los) primero(s) dígitos de cada valor, se forman los tallos, y con lodígitos siguientes se forman las hojas. 
Para los datos del ejemplo los dígitos iniciales 
1 - 2 - 3 - 4 y 5 son los tallos y los dígitos sucesivos (decimales) son las hojas.

Índices de accidentes
Tallos
Hojas
1
8 0 4
2
7 1 5 2 5
3
8 1 4 3 3 6 0 0 9 4
4
8 1 5 4
5
3 6 8

Al igual que la ordenación, la representación de tallos y hojas tiene un utilidad limitadcuando es grande el mero de datos.


 Construccn dlas tablas dfrecuencias

La ordenación y el diagrama de tallos y hojas son técnicas que ayudan a la organización pero n puede  reconocerse  l configuració d lo índices  d accidentes  co sól volcar  los registros proporcionados por cada empresa. Para resumir estos datos en una tabla, primero se deben determinar los intervalos de clase. Un intervalo para el conjunto de índices puede ser:
2 -  ⇒ intervalo de clase o clase


Definido el intervalo se determina su frecuencia, o sea la cantidad de observaciones incluida en esa  clase. La frecuencia para este intervalo es 3, es decir que en 3 empresas ocurrieron entre 2 y 3 accidentes mensuales.
La confección de las distribuciones depende de la naturaleza y del mero  de datos. Lointervalos deben seleccionarse adecuadamente para que la configuración de la distribución no resulte confusa. Al construir las tablas de frecuencias se pierde un poco de información, pero las mismas ofrecen ventajas al momento del análisis y la interpretación.

Entre las pautas para la confección se deben considerar las siguientes:

a)   El mero de clases no debe ser ni muy grande ni muy pequo. Cuando hay muchointervalos, la amplitud de los mismos es pequeña, por lo tanto cada uno tendría pocodato  ninguno S hay  pocas  clases  co intervalo amplios,  puede  resultar  ququeden cifras relativamente significativas concentradas en unas cuantas clases.

b)   Los   intervalos   deben   tener   la   misma   amplitud   a   efectos   de   poder   hacer
comparaciones.  E algunas  situaciones  pueden  presentarse  intervalo d distinta amplitud, pero se dificulta la interpretación de la distribución. En otros casos se debe recurrir a intervalos abiertos.




c)    La confección de la distribución debe facilitar el trabajo de análisis, por lo tanto lointervalos de clase deben ser ciles de manejar.
Se puede utilizar el siguiente procedimiento para determinar la amplitud de los intervalos.

Obtener el rango o recorrido (R). El rango es la diferencia entre el valor mayor y el valomenor de la distribución.



R = Valor mayor - Valor menor.

Para la distribución de los índices de accidentes, el rango es: R = 5.8 - 1.0
R = 4.8

) Seleccionar el mero de clases (k).


Número dvalores
Número
apropiado de la distribucióintervalos
10 a 100
100 a 1.000
1.000 a 10.000
4 a 8
8 a 11
11 a 14

Para la distribución de la serie se eligen 5 clases.

Determinar la amplitud o ancho de la clase (A) dividiendo el rango sobre el mero dintervalos.
A= R/k

𝑅 = 4.8                            𝑘 = 5
𝐴 =4.8/5= 0.9 1

Por conveniencia y facilidad de lectura, el ancho del intervalo se redondea a 1.

Establecer los mites de cada clase a fin de evitar superposiciones  de clases para quningun observación caiga dentro de más de una categoría; de acuerdo a esto, el primer intervalo es "1,0 pero menos de 2,0".
Las 5 clases de la distribución de los accidentes son:

1.0 < 2.0
2.0 < 3.0
3.0 < 4.0
4.0 < 5.0

                                                   5.0 < 6.0



Tabulacn dlos datos
Definidos los intervalos de clase, se procede a determinar las frecuencias de clases (fi). 
La frecuencia de clase es la cantidad de observaciones que se incluye en cada intervalo.

Índices de
accidentes
Conteo
Cantidad de
empresas (fi)
[1.0 - 2.0)
[2.0 - 3.0[3.0 - 4.0[4.0 - 5.0[5.0 - 6.0)
///
////
////  ////
////
///
3
5
10
4
3

Las frecuencias obtenidas se denominan "frecuencias absolutas simples".
Marca de clase (xi)
La marca de clase es el punto medio del intervalo de clase; es el valor que representa a lclase. 
Se obtienen sumando el límite inferior y el límite superior de cada clase dividido entre 2.
La marca de clase para el primer intervalo es.
 𝑥𝑖  =  (Li -Ls)/2


La marca de clase para el primer intervalo es
Xi=(1,0-2,0)/2=1, 5   

Índices de
accidentes
Marca de clase
(xi)
Cantidad de
empresas (fi)
[1.0 - 2.0) [2.0 - 3.0) [3.0 - 4.0) [4.0 - 5.0) [5.0 - 6.0)
1.5
2.5
3.5
4.5
5.5
3
5
10
4
3


n = 25

Distribucn dfrecuencias relativas simples (fr)
En muchas ocasiones es preferible trabajar con una distribución de frecuencias relativas. 
La frecuenci relativa es la proporción o porcentaje del total de datos que se incluye en cadclase. 
La frecuencia relativa se calcula dividiendo la frecuencia absoluta de cada clase entre el mero total de observaciones


𝑓r =𝑓𝑖/𝑛



Si se expresa en porcentaje será:  𝑓r =(𝑓𝑖/𝑛). 100
La distribución de frecuencias relativas para los índices de accidentes de las 25 empresas es la siguiente:
Índices de
accidentes

fr
[1.0 - 2.0)
[2.0 - 3.0) [3.0 - 4.0) [4.0 - 5.0) [5.0 - 6.0)
0.12 o 12%
0.20 o 20%
0.40 o 40%
0.16 o 16%
0.12 o 12%

1 o 100%

De hecho, la suma de las frecuencias relativas debe ser igual a 1 o al 100%.


Algunas situaciones particulares con las tablas dfrecuencias

a)Distribuciones cointervalos de amplitudes desiguales

En algunos casos se construyen tablas de frecuencias con intervalos de amplitudes desiguales
Esto sucede cuando la variable de interés tiene algunas observaciones extremas altas. 
En lugar de definir pocos intervalos con igual tamaño, pero muy amplios; 
o bien muchos intervalos digual tamaño, pero más estrechos, 
es frecuente definir tamaños variables para los intervalode clase.

b) Intervalos abiertos
Cuando las series de datos tienen observaciones muy extremas, en lugar de intervalos dtamaños variables, 
se pueden utilizar intervalos con extremos abiertos.
Los intervalos abiertos son aquellos que no tienen definidos uno de los límites. 
En el primer intervalo no está definido el límite inferior y en el último, el mite superior.
Las clases abiertas se utilizan con fines de presentación, 
pero presentan dificultades para locálculos, como así también para la representación gfica.



Distribuciones dfrecuencias acumulada (fa)

Las distribuciones de frecuencias acumuladas permiten observar cuántas observaciones se hallan por debajo de ciertos valores.




Considéres l distribución  d frecuencias  simples d lo índices  d accidentes  de las  25 empresas.
Índices de
accidentes
Cantidad de
empresas (fi)

fr
[1.0 - 2.0)
[2.0 - 3.0) [3.0 - 4.0) [4.0 - 5.0) [5.0 - 6.0)
3
5
10
4
3
0.12
0.20
0.40
0.16
0.12

n = 25
1

 Índices                                                Frecuencias acumuladas (fa)
Menor que 1.0                              0
Menor que 2.0                              3
Menor que 3.0                              8 (3 + 5
Menor que 4.0                             18 (3 + 5 + 10
Menor que 5.0                             22 (3 + 5 + 10 + 4)
Menor que 6.0                              25 (3 + 5 + 10 + 4 + 3)

También se pueden confeccionar las tablas de frecuencias acumuladas relativas.

Índices de
accidentes
Cantidad de
empresas (fi)

fa

fr

far
[1.0 - 2.0)
[2.0 - 3.0) [3.0 - 4.0) [4.0 - 5.0) [5.0 - 6.0)
3
5
10
4
3
3
8
18
22
25
0.12
0.20
0.40
0.16
0.12
0.12
0.32
0.72
0.88
1.00

n = 25

1.00




Distribucn dfrecuenciapara variables discretas

Se registra el mero de hijos para cada uno de los 20 empleados de una compañía. 
Los datos, ya ordenados, son los siguientes:
1 1  1  2 2 2 2  2  2  2  3  3  3  3 3 4 4 4 5 5

La variable xi (número de hijos) toma valores entre 1 y 5. 
Como xi asume pocos valores, puede considerarse cada valor de la variable comuna clase, o sea:

Nº de hijos (xi): 1  2  3  4  5

La tabla de frecuencias simples (absolutas y relativas) queda conformada como sigue:


Número dhijos (xi)

Número de empleados (fi)
Porción de
empleados
(fr)
1
2
3
4
5
3
7
5
3
2
0.15 o 15%
0.35 o 35%
0.25 o 25%
0.15 o 15%
0.10 o 10%

n = 20
1.00 o 100%




También se puede construir una tabla de frecuencias acumuladas para la distribución del mero de hijos.

Distribucn dfrecuencias para variables cualitativas

Se registran los elemento de un población o muestra  con respecto  un atributo y los resultados obtenidos de dichas observaciones se agrupan según las distintas modalidades qutome al  atributo. 
Por ejemplo, 80 empleados de una compañía pueden clasificarse según el estado civil.

Estado civil
Nº de empleados
Porcentaje de empleados
Casado
45
56.25 %
Soltero
23
28.75 %
Divorciado
7
8.75 %
Viudo
5
6.25 %

80
100 %


Representacn gráfica dlas frecuencias simples acumuladas

Un distribució de   frecuencias  simples   co variables  contínuas   puede  representarse mediante dos gráficos:
a) Histograma;
b) Pogono de frecuencias.


a)Histograma
El histograma es un gfico de barras. 
Para cada intervalo se dibuja una barra con altura igual la frecuencia absoluta simple o frecuencia relativa simple.


b) Polígonde frecuencias

El polígono de frecuencias es un gráfico lineal que se representa con las marcas de clases. 
Sconstruy ubicand sobre  cad marc u punt  l altura  d l frecuenci absolut (o relativa), uniendo luego los puntos resultantes mediante segmentos de recta.

  Las  distribuciones  d frecuencias  acumuladas  se  representan  gráficament mediant un
"pogono de frecuencias acumuladas" u "ojiva".



  
   
Representaciógráfica pardistribucióde frecuencias simples covariables discretas.
La representación gráfica de una distribución con variables discretas se realiza en un "gficde bastones". 
Para cada valor de la variable se dibuja un segmento con altura equivalente a la frecuencia (absoluta o relativa).




Preste atención al seleccionar las distintas herramientas estadísticas, con el fin de no aplicar aquellas  que no correspondan, dado que existe una clara diferenciación entre las medidas admisibles para cada nivel de medición.

Variable
Nivede medición
Medidas descriptivas



Cualitativa

Nominal
Frecuencia absoluta
Frecuencia porcentual
Moda (unidad 3)

Ordinal
Mediana (unidad 3)
Todas las medidas denivel nominal



Cuantitativa


Intervalar
Media arittica (unidad 3)
Amplitud (unidad 4)
Desvío estándar (unidad 4)
Todas las medidas denivel ordinal

De Ran
Coeficiente de variación (unidad 4)Todas las medidas denivel intervalar