advertisement

Estadistica I 02

40 %
60 %
advertisement
Information about Estadistica I 02
Education

Published on September 29, 2008

Author: profe_simmons

Source: slideshare.net

Description

Construcción de distribuciones de frecuencia y sus gráficas
advertisement

UCV/FACES/EAC Estadísticas I Distribuciones de Frecuencia y Gráficas Prof. Leonardo Simmons

UCV/FACES/EAC

Estadísticas I

Distribuciones de Frecuencia y Gráficas

Prof. Leonardo Simmons

DISTIBUCIONES DE FRECUENCIA Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de los resultados, es decir, recoger la información de la muestra o población resumida en una tabla, que denominaremos distribución de frecuencias. en la que cada valor de la variable se le asocian sus frecuencias absolutas, relativas y acumuladas. Las distribuciones de frecuencias varían en sus columnas dependiendo del nivel de agrupación de las observaciones de la variable estudiada y si ésta corresponde a una variable cualitativa, a una variable discreta o a una variable continua.

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Caso: Variable Cualitativa (Atributo) La estructura de una DFDNA para una variable cualitativa es como sigue: Donde: X i = es el i-ésimo valor de la variable de estudio f i = es la frecuencia del i-ésimo valor de la variable H i y %h i = son la respectivas frecuencias relativas 100 1.00 n = N %h k h k f k x k : : : : %h 2 h 2 f 2 x 2 %h 1 h 1 f 1 x 1 %h h f X

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) P.ej: Se preguntó a un grupo de alumnos de Ingeniería Industrial su materia preferida y estas fueron sus respuestas: P.ej: Organicemos estas repuestas en una DFDNA:

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) De la tabla se pueden extraer conclusiones como: La materia “más preferida” por los estudientes en la muestra es matemáticas con 24% y en segundo lugar Ing. Industrial con 22% La materia “menos preferida” es Ing. Económica con 10% La proporción de alumnos que prefieren Prob. Y estadísticas es 0,20 Se puede representar gráficamente la información contenida en la DFDNA: Fuente: Encuesta Fuente: Encuesta

De la tabla se pueden extraer conclusiones como:

La materia “más preferida” por los estudientes en la muestra es matemáticas con 24% y en segundo lugar Ing. Industrial con 22%

La materia “menos preferida” es Ing. Económica con 10%

La proporción de alumnos que prefieren Prob. Y estadísticas es 0,20

Se puede representar gráficamente la información contenida en la DFDNA:

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Caso: Variable Cuantitativa (Discreta) La estructura de una DFDNA para una variable cuantitativa (Discreta) es como sigue: %H k : %H 2 %H 1 %H H k : H 2 H 1 H F k : F 2 F 1 F 100 1.00 n = N %h k h k f k x k : : : : %h 2 h 2 f 2 x 2 %h 1 h 1 f 1 x 1 %h h f X

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) P.ej: Una encuesta entre un grupo de madres-solteras, para analizar los problemas económicos que enfrentan, en determinada comunidad; arrojó los siguientes resultados acerca del número de niños (menores de 12 años) en el hogar:

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Gráficas asociadas….. Histogramas 1 2 3 4 5 % Hogares 5 15 20 25 30 10 35 No. de Niños Distribución del Porcentaje de Niños por Hogares Fuente: Encuesta de Hogares Fuente: Encuesta de Hogares

DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Gráficas asociadas….. Ojiva Ascendente Circular Fuente: Encuesta de Hogares 1 2 3 4 5 % Hogares 20 60 80 100 30 40 35 No. de Niños Distribución Acumulada del Porcentaje de Niños por Hogares Fuente: Encuesta de Hogares

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) La distribución de frecuencia de datos agrupados (DFDA) por lo general se usa para organizar los valores poblacionales o muestrales de una variable cuantitativa continua. Las observaciones de la variable se agrupan en clases o intervalos de tal manera que las frecuencias hacen referencia a la clase o intervalo de valores de la variable y no a un valor en particular como en el caso de la DFDNA. A continuación se detalla el procedimiento para construir una DFDA: Ordenar los datos Determinar el Rango (R) de la variable: R = X max - M min Determinar el número de clases o intervalos (K) de la distribución: Empíricamente Método de 2 K : K es el exponente de 2 tal que 2 K ≥ n Formula de Sturges: K = parte entera (1+ 3,32 Log (n))

La distribución de frecuencia de datos agrupados (DFDA) por lo general se usa para organizar los valores poblacionales o muestrales de una variable cuantitativa continua.

Las observaciones de la variable se agrupan en clases o intervalos de tal manera que las frecuencias hacen referencia a la clase o intervalo de valores de la variable y no a un valor en particular como en el caso de la DFDNA.

A continuación se detalla el procedimiento para construir una DFDA:

Ordenar los datos

Determinar el Rango (R) de la variable: R = X max - M min

Determinar el número de clases o intervalos (K) de la distribución:

Empíricamente

Método de 2 K : K es el exponente de 2 tal que 2 K ≥ n

Formula de Sturges: K = parte entera (1+ 3,32 Log (n))

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Calcular el rango de las clases o intervalos (C) de la distribución: C = R/K Asiganar los limites de las clases o intervalos con la siguiente regla: l 1 = X min , donde l 1 = Limite inferior de la clase 1 L 1 = l 1 + C, donde L 1 = Limite superior de la clase 1 l 2 = L 1 , donde l 2 = Limite inferior de la clase 2 L 2 = l 2 + C …..y así sucesivamente hasta llegar a que L k = X max Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla: Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior La última clase (K) es [] – cerrada en ambos limites Determinar las frecuencias relativas y acumuladas; además de la marca de clases: X i =(L i + l i )/2

Calcular el rango de las clases o intervalos (C) de la distribución:

C = R/K

Asiganar los limites de las clases o intervalos con la siguiente regla:

l 1 = X min , donde l 1 = Limite inferior de la clase 1

L 1 = l 1 + C, donde L 1 = Limite superior de la clase 1

l 2 = L 1 , donde l 2 = Limite inferior de la clase 2

L 2 = l 2 + C …..y así sucesivamente hasta llegar a que L k = X max

Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla:

Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior

La última clase (K) es [] – cerrada en ambos limites

Determinar las frecuencias relativas y acumuladas; además de la marca de clases:

X i =(L i + l i )/2

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) P.ej: La tienda CABRERA’S Y ASOCIADOS esta interesada en efectuar un análisis de sus cuentas por cobrar. Uno de los factores que más interesaba a la administración de la tienda era el de los saldos de las cuentas de crédito. Se escogió al azar una muestra aleatoria de 30 cuentas y se anotó el saldo de cada cuenta (en Miles de Bs.F) como sigue: Determinar el Rango (R) de la variable: R = X ma - M min = 93,91–7,42= 86,49 Determinar el número de clases o intervalos (K) de la distribución: Método de 2 K : K= 5 ya que 2 5 = 32 ≥ 30 Formula de Sturges: K = parte entera (1+ 3,32 Log (30)) =parte entera (5,9069=5

Determinar el Rango (R) de la variable: R = X ma - M min = 93,91–7,42= 86,49

Determinar el número de clases o intervalos (K) de la distribución:

Método de 2 K : K= 5 ya que 2 5 = 32 ≥ 30

Formula de Sturges: K = parte entera (1+ 3,32 Log (30)) =parte entera (5,9069=5

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Calcular el rango de las clases o intervalos (C) de la distribución: C = R/K = 86,49/5 = 17,298 * Nota (*): como la variable se midío con 2 decimales redondeamos el valor calculado de C con la misma cantidad de decimales, es decir: C = 17,30 Asiganar los limites de las clases o intervalos con la siguiente regla: l 1 = X min = 7,42 ; L 1 = l 1 + C = 7,42 + 17,30 = 24,72; ..y así sucesivamente Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla: Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior La última clase (K) es [] – cerrada en ambos limites Determinar las frecuencias relativas y acumuladas; además de la marca de clases: X i =(L i + l i )/2

Calcular el rango de las clases o intervalos (C) de la distribución:

C = R/K = 86,49/5 = 17,298 *

Nota (*): como la variable se midío con 2 decimales redondeamos el valor calculado de C con la misma cantidad de decimales, es decir:

C = 17,30

Asiganar los limites de las clases o intervalos con la siguiente regla:

l 1 = X min = 7,42 ; L 1 = l 1 + C = 7,42 + 17,30 = 24,72; ..y así sucesivamente

Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla:

Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior

La última clase (K) es [] – cerrada en ambos limites

Determinar las frecuencias relativas y acumuladas; además de la marca de clases:

X i =(L i + l i )/2

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Resultando la siguiente DFDA:

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Histograma 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Polígono de Frecuencia 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados 16,07 33,37 50,57 67,97 85,27

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Histograma + Polígono de Frecuencia (Integrados) 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Ojiva Ascendente 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 20 40 60 80 100 % Cuentas por Cobrar Distribución Acumulada de los Saldo de las Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) Ejemplo de interpretación de los resultados contenidos en la tabla: f 1 : Diez (10) de las cuentas investigadas tienen saldo entre 7,42 y 24,72 miles BsF, lo cual representa el 10% – h 1 – de la muestra. H 3 : 0,70 es la proporción de cuentas por pagar de la muestra con un saldo menor que 59,32 BsF. %H 3 : El 70% de las cuentas investigadas presentan saldo de a lo sumo 59,32 BsF. X 3 : La cantidad 50,67 BsF es el saldo que representa a todas las cuentas con saldo entre 42,02 y 59,32 BsF.

Ejemplo de interpretación de los resultados contenidos en la tabla:

f 1 : Diez (10) de las cuentas investigadas tienen saldo entre 7,42 y 24,72 miles BsF, lo cual representa el 10% – h 1 – de la muestra.

H 3 : 0,70 es la proporción de cuentas por pagar de la muestra con un saldo menor que 59,32 BsF.

%H 3 : El 70% de las cuentas investigadas presentan saldo de a lo sumo 59,32 BsF.

X 3 : La cantidad 50,67 BsF es el saldo que representa a todas las cuentas con saldo entre 42,02 y 59,32 BsF.

DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) Con ayuda de las gráficas podemos responder a preguntas como: ¿Que porcentaje aproximadamente de cuentas tienen saldos entre 30 y 65 BsF? Como se aprecia 30 y 65 BsF no son limites de clases por eso no podemos responder directamente con la tabla esta pregunta y nos tenemos que valer de la gráfica de frecuencias acumuladas (ojiva) para ello: -Aprox. el 40% de las cuentas tienen saldo ≤ a 30 Mil BsF -Aprox. el 73% de las cuentas tienen saldo ≤ a 65 Mil BsF Luego: 73%-40% = 33% entonces: aprox. El 33% de las cuentas tienen saldo entre 30 y 65 miles BsF 30 65 40 73 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 20 40 60 80 100 % Cuentas por Cobrar Distribución Acumulada de los Saldo de las Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados

ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Las técnicas del análisis exploratorio de datos consiste en operaciones aritméticas sencillas y gráficas fáciles de trazar, que pueden emplearse para resumir con rapidez los datos de una muestra. La técnica conocida como diagrama tallo y hoja se usa para mostrar en forma simultanea el orden del rango y la forma de un conjunto de datos. Persigue los siguientes objetivos: Representación visual de la información Descubrir un patrón de comportamiento de los datos, es decir, qué distribución pueden seguir los datos Identificar si hay valores extremos o datos anormales en la muestra Es aplicables a variables cuantitativas de valores formados por al menos dos cifras. Principio : Cada número se divide en dos partes, una que llamaremos "Tallo" y la otra denominada " ramas u Hojas".

Las técnicas del análisis exploratorio de datos consiste en operaciones aritméticas sencillas y gráficas fáciles de trazar, que pueden emplearse para resumir con rapidez los datos de una muestra.

La técnica conocida como diagrama tallo y hoja se usa para mostrar en forma simultanea el orden del rango y la forma de un conjunto de datos. Persigue los siguientes objetivos:

Representación visual de la información

Descubrir un patrón de comportamiento de los datos, es decir, qué distribución pueden seguir los datos

Identificar si hay valores extremos o datos anormales en la muestra

Es aplicables a variables cuantitativas de valores formados por al menos dos cifras.

Principio : Cada número se divide en dos partes, una que llamaremos "Tallo" y la otra denominada " ramas u Hojas".

ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Ejemplo: Considere los siguientes números: 65, 57, 79, 69, 53, 63, 71. Los tallos serán las decenas, y las hojas serán las unidades, de la siguiente manera, luego: Procedimiento: 1. Se define cómo se van a dividir los números en tallos y hojas, es decir, se identifican cuales van a ser los tallos, y cuales va a ser las hojas. 2. En una columna se listan los tallos en orden ascendente. 3. Se recorren los datos y se colocan, en la columna siguiente, las hojas de acuerdo al tallo que tengan y se ordenan en forma creciente Resto de los números (cifras secundarias) ubicadas a la derecha Hoja Formado por uno o más dígitos principales (cifras mas significativas), ubicados a la izquierda del número. Tallo 19 7 359 6 37 5 Ramas Tallo

ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Ejemplo : Considere la siguiente información sobre duración de baterías de carro, en años. Se pide: Construir el diagrama de tallos y hojas usando como tallos la parte entera. Construir el diagrama de tallos y hojas partiendo cada tallo en dos. 3.5 4.2 3.0 3.9 2.6 3.2 3.8 4.7 3.4 1.9 4.1 3.2 4.4 3.7 3.1 3.3 3.1 3.9 3.3 2.9 3.6 3.4 4.3 2.5 3.7 4.7 3.1 3.8 3.3 3.1 1.6 3.4 2.6 3.0 3.7 3.2 4.5 3.5 4.1 2.2 Duración de baterías (en años)

Ejemplo : Considere la siguiente información sobre duración de baterías de carro, en años. Se pide:

Construir el diagrama de tallos y hojas usando como tallos la parte entera.

Construir el diagrama de tallos y hojas partiendo cada tallo en dos.

ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Usando como tallos la parte entera Tallos : Dígitos principales (Parte entera); Hojas : Dígitos secundarios (Parte decimal) Partiendo cada tallo en dos En este caso el tallo 1 únicamente tendría la parte superior, y el tallo 4 tendría tanto la parte inferior como la superior 40 Total 9 1 1 2 3 4 5 6 7 7 4 25 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 5 5 6 7 7 7 8 8 9 9 3 5 2 5 6 6 9 2 1 9 1 Frecuencia Hojas Tallo

Usando como tallos la parte entera

Tallos : Dígitos principales (Parte entera);

Hojas : Dígitos secundarios (Parte decimal)

Partiendo cada tallo en dos

En este caso el tallo 1 únicamente tendría la parte superior, y el tallo 4 tendría tanto la parte inferior como la superior

ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja 40 Total 4 5 6 7 7 4 S 5 1 1 2 3 4 4 I 10 5 5 6 7 7 7 8 8 9 9 3 S 15 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 3 I 4 5 6 6 9 2 S 1 2 2 I 1 9 1 S Frecuencia Ramas Tallo

ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Observaciones: Se recomienda que el número de tallos esté entre 5 y 20. A veces, de acuerdo con la información que se tenga, pueden resultar muy pocos tallos, con lo cual las ramas quedan muy concentradas, y realmente no se obtiene mucha información. En estos casos, puede ser conveniente partir los tallos en dos: Un tallo inferior (que tenga, por ejemplo, las hojas menores que 5), y un tallo superior (que tenga las hojas mayores o iguales a cinco). Así, por ejemplo, el tallo 6 puede dividirse en 6I, para los valores entre 60 y 64, y el tallo 6S, para los valores entre 65 y 69. • Cuando se parten los tallos en dos, todos los tallos deben partirse en dos. Solamente el primero y el último tallo podrían dejarse sin partir, en caso de que en el primer tallo sólo haya información para el tallo superior, y cuando para el último tallo sólo haya información para el tallo inferior.

Observaciones:

Se recomienda que el número de tallos esté entre 5 y 20.

A veces, de acuerdo con la información que se tenga, pueden resultar muy pocos tallos, con lo cual las ramas quedan muy concentradas, y realmente no se obtiene mucha información. En estos casos, puede ser conveniente partir los tallos en dos: Un tallo inferior (que tenga, por ejemplo, las hojas menores que 5), y un tallo superior (que tenga las hojas mayores o iguales a cinco).

Así, por ejemplo, el tallo 6 puede dividirse en 6I, para los valores entre 60 y 64, y el tallo 6S, para los valores entre 65 y 69.

• Cuando se parten los tallos en dos, todos los tallos deben partirse en dos. Solamente el primero y el último tallo podrían dejarse sin partir, en caso de que en el primer tallo sólo haya información para el tallo superior, y cuando para el último tallo sólo haya información para el tallo inferior.

TAREA No. 2 Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 1 al 10 (pag. 28 al 30) Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 11 al 21 (pag. 36 al 39) Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 22 al 28 (pag. 42 al 43) Si usted trabaja identifique al una variable cuantitativa importante que corresponda con algún proceso administrativo en el que usted interviene, p.ej: ventas, inventario, personal, etc. Recolecte una muestra de al menos 50 observaciones de dicha variable y construya una DFDA y sus respectivas gráficas. Saque algunas conclusiones

Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 1 al 10 (pag. 28 al 30)

Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 11 al 21 (pag. 36 al 39)

Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 22 al 28 (pag. 42 al 43)

Si usted trabaja identifique al una variable cuantitativa importante que corresponda con algún proceso administrativo en el que usted interviene, p.ej: ventas, inventario, personal, etc. Recolecte una muestra de al menos 50 observaciones de dicha variable y construya una DFDA y sus respectivas gráficas. Saque algunas conclusiones

Add a comment

Related presentations

Related pages

Estadística 02 - YouTube

Estadística 02 Raphael Reyes. Subscribe Subscribed Unsubscribe 22 22. ... Estadistica: Estadística Descriptiva Clase 1 (Parte 1) - Duration ...
Read more

Estadística I - YouTube

Estadística I Dayis Pulido ... Estadistica 02 SECUNDARIA ... Estadistica: Estadística Descriptiva Clase 1 (Parte 1) - Duration: ...
Read more

I Jornades de Llengua i Estadística - Idescat. Institut d ...

0,10 0,09 0,07 0,05 0,04 0,02 0,01 L’esperança matemàtica d’aquesta distribució de probabilitat és 25 i moltes vegades caiem en la
Read more

estadistica | eBay - Electronics, Cars, Fashion ...

Find great deals on eBay for estadistica . Shop with confidence.
Read more

Estadística Econòmica I

Estadística Econòmica I 02/03/09 3 Idees bàsiques L’objectiu és disposar d’unes lleis de comportament que ens ajudin a prendre la decisió més ...
Read more

Estadística - Viquipèdia, l'enciclopèdia lliure

L'estadística o estatística (forma no-interferida per l'espanyol) és la ciència matemàtica relacionada amb la recopilació, anàlisi, interpretació i ...
Read more