Trabajo Estadistica Ll

INTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO CONTADURIA PÚBLICA FACULTAD INGENIERIA Y CIENCIAS BASICAS INTEGRANT

Views 94 Downloads 4 File size 857KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

INTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO CONTADURIA PÚBLICA FACULTAD INGENIERIA Y CIENCIAS BASICAS

INTEGRANTES OVALLE CARRANZA DANIELA RODRIGUEZ CORTES OSCAR EDUARDO

TUTOR GABRIELA SANCHEZ

ESTADISTICA 2 2018

OBJETIVOS

Objetivo general: Conseguir y desarrollar los conocimientos requeridos del módulo Estadística II y la aplicación de estos, los cuales son necesarios para nuestra formación a futuro, no solo en el ámbito académico, sino también el profesional, logrando con ello, mejorar nuestra capacidad de análisis e interpretación de los temas vistos, a través del desarrollo de los diferentes puntos del trabajo, utilizando las herramientas y directrices para el aprendizaje en la modalidad virtual.

Objetivos específicos: Mejorar nuestra capacidad de análisis e interpretación de ejercicios prácticos de estadística inferencial, aplicando los principios y fórmulas vistos a lo largo del curso. Desarrollar habilidades y capacidades requeridas en este tipo de trabajo en grupo a través de la modalidad virtual, con el fin de sustentar y argumentar las respuestas a las diferentes entregas (por semanas), buscando consolidar la respuesta más adecuada. Identificar las principales características del muestreo y las distribuciones muéstrales, así como la estimación de parámetros e intervalos de confianza, según se iban desarrollando cada uno de los puntos por los diferentes integrantes del grupo.

CONTEXTO

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada por el DANE. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo), además de las características generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto, regional, departamental, y para cada una de las capitales de los departamentos.

Parte 1 (semana 3 - 5) Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la base de datos dada. Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).

Desarrollo: (Hoja de Excel: Parte1_Semana3. Punto1) Según lo descrito en el enunciado del trabajo, ya que no es posible efectuar un censo para obtener la información real, se realizó la Gran Encuesta Integrada de Hogares (GEIH) a una muestra representativa de la población para las ciudades principales (13) e intermedias (11) de Colombia, buscando la información requerida sobre las condiciones de empleo de las personas, además de sus características generales de cada una de ellas. De acuerdo a lo anterior y basándome en lo visto a lo largo de estas semanas para esta estadística inferencial, yo creo que es un Muestreo Probalístico, ya que es una selección aleatoria con un margen de error (error de muestreo), de tipo Muestreo Estratificado, ya que la población se puede dividir según el archivo de Excel en grupos con características homogéneas dentro los grupos y heterogéneas entre sí. De esta forma, si la población tiene N individuos, y se ordenan aleatoriamente, entonces los primeros (o los últimos) k elementos conforman una muestra aleatoria simple de tamaño k. Este tamaño de muestra k se calcula con la siguiente formula dado que se conoce el tamaño de la población:

2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando adecuadamente y justificando:

Desarrollo: (Hoja de Excel: Parte1_Semana3. Punto2) a) Fórmula a desarrollar: De acuerdo al algoritmo seleccionado para determinar la muestra a usar en el desarrollo de este taller, se debe calcular el tamaño de muestra con la siguiente formula:

En donde, N = tamaño de la población Z = nivel de confianza, P = probabilidad de éxito, o proporción esperada Q = probabilidad de fracaso D = precisión (Error máximo admisible en términos de proporción). b) Estimación de la proporción de mujeres: De acuerdo a la información contenida en la base de datos sobre el Censo en Colombia, se obtiene la siguiente información: Cantidad de mujeres y hombres

Estimación de proporción de mujeres

Mujer

31.969

52,97%

Hombre

28.387

47,03%

60356

100,00%

Género

Total general

c) Nivel de confiabilidad Para tener en cuenta, algunos de los valores de Z de la distribución normal estándar más comunes en la resolución de ejercicios de estadística, están dados en la siguiente tabla:

Nivel de confianza deseado

1-α

α/2

z α/2

90%

0,90

0,050

1,645

95%

0,95

0,025

1,960

99%

0,99

0,005

2,575

Para el desarrollo de este taller, se selecciona este nivel de confianza del 95% dado que es el punto medio los niveles de confianza más usuales

d) Error de estimación Es el error máximo admisible en términos de proporción. Para el desarrollo de este taller, dado que no se establece un valor, se establece trabajar en la resolución de este taller con un error de 0.05. e) El tamaño de la muestra y la muestra Una vez se han determinado los valores anteriores, se procede a calcular el tamaño de la muestra y a seleccionar la muestra, como se muestra en la hoja de Excel Parte1_semana3. Punto 2. Z=

1,96

S(pxq)=

0,25

d=

0,05

N=

60356

n=

380,40

Por lo tanto, el tamaño de la muestra es 380.

Parte 1 (semana 4) Intervalo de confianza para dos variables numéricas Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias?

Desarrollo: (Hoja de Excel: Parte1_Semana4. Punto1)

Para la realización de este punto se requiere primero identificar los valores máximo y mínimo de la variable ESC de la hoja de cálculo de Excel llamada “Población”, que hace referencia al grado de escolaridad de los encuestados. Esta identificación nos ayuda a determinar la Clase a utilizar en la creación del histograma. De acuerdo a los resultados obtenidos en Excel, se muestran a continuación la tabla resumen y el grafico donde se establece el histograma para hombres y mujeres de acuerdo al grado de escolaridad: Clases

Mujeres

Hombres

Mujeres

Hombres

Mujeres

Hombres

Mujeres

Hombres

Mujeres

Hombres

5

73

77

39%

43%

5

5

73

77

39%

43%

10

46

43

63%

67%

15

15

61

51

71%

71%

15

61

51

95%

95%

10

10

46

43

95%

95%

20

9

6

100%

98%

20

20

9

6

100%

98%

0

3

100%

0

3

100%

100%

y mayor...

100% y mayor...

y mayor...

Chart Title 90 80

120% 77

73

70

61 71% 51

60 50 40

95% 95% 46

98%

100%

100%

100%

100%

80%

43

71%

60%

43%

30 20

40% 39% 9

10

20%

6

0

3

0

0% 5

15

10

20

Frecuencia Mujeres

Frecuencia Hombres

% acumulado Mujeres

% acumulado Hombres

y mayor...

Gráficamente, los resultados del histograma tanto para hombres y para mujeres, no se muestra diferencia alguna en los resultados, es decir que el nivel de

escolaridad es similar tanto en hombres como mujeres, salvo para el nivel de escolaridad de 0 a 5, dado que en este caso, el porcentaje de escolaridad es menor para las mujeres.  

El 43% de los hombres encuestados presentan un grado de escolaridad de 0-5, mientras que las mujeres presentan en esta misma categoría el 39% Es de sorprender que el porcentaje del grado de escolaridad se mayor en la categoría de 10-15 que en la categoría de 5-10, donde en ambas categorías se muestra una mayor (pero no tan significativa) participación de las mujeres a nivel de grados escolares.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Desarrollo: (Hoja de Excel: Parte1_Semana4. Punto 2 y 3) Para el cálculo del intervalo de confianza se va a utilizar la siguiente formula:

Por lo tanto utilizando las fórmulas de Excel se determinan los siguientes promedios y desviaciones estándar para la variable escolaridad en hombres y mujeres, desagregado por Bachillerato, Tecnólogo y Universidad:

Etiquetas de fila Bachiller Ninguno Postgrado Técnico o tecnológico Universitario (en blanco) Total general

Etiquetas de colum na Hom bre Sum a de ESC Prom edio de ESC 430 11,62 80 10,00 62 20,67 215 14,33 79 15,80 487 4,35 1353 7,52

Desvest de ESC 1,0 0,0 3,2 2,3 0,4 2,8 4,9

Mujer Sum a de ESC 645 80 53 96 64 476 1414

Prom edio de ESC 11,52 10,00 17,67 13,71 16,00 4,29 7,48

Desvest de ESC 1,0 0,0 1,5 1,1 0,0 2,9 4,6

Luego, haciendo uso de la formula expuesta, los resultados de los intervalos de confianza para hombres son:

Intervalo de confianza para hombres

Bachiller

Con un nivel de significancia del 95%, se tiene que Z

 

Tecnólogo

Universitario

1,645

Limite Inferior

11,54

14,08

15,72

Limite superior

11,70

14,59

15,88

El intervalo de confianza para la escolaridad en hombres para Bachillerato es de: (11.54; 11.70) El intervalo de confianza para la escolaridad en hombres para Tecnólogo es de: (14.08 ; 14.59)





El intervalo de confianza para la escolaridad en hombres para Universidad es de: (15.72 ; 15.88)

Luego, haciendo uso de la formula expuesta, los resultados de los intervalos de confianza para mujeres son: Intervalo de confianza Bachiller Con un nivel de significacia del 95%, se tiene que Z

 

Tecnologo

Universitario

1,645

Limite Inferior

11,45

13,53

16,00

Limite superior

11,59

13,90

16,00

El intervalo de confianza para la escolaridad en mujeres para Bachillerato es de: (11.45; 11.59) El intervalo de confianza para la escolaridad en mujeres para Tecnólogo es de: (13.53 ; 13.90)



El intervalo de confianza para la escolaridad en mujeres para Universidad es de: (16.00 ; 16.00)

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario

Desarrollo: (Hoja de Excel: Parte1_Semana4. Punto 2 y 3) Para el cálculo del intervalo de confianza se va a utilizar la siguiente formula:

Por lo tanto, utilizando las fórmulas de Excel se determinan los siguientes intervalos de confianza: Intervalo de confianza

Bachiller

Con un nivel de significancia del 95%, se tiene que Z

  

Tecnólogo

Universitario

1,96

Límite Inferior

0,0024

0,2920

-0,2986

Límite superior

0,2051

0,9461

-0,1014

El intervalo de confianza para la diferencia de escolaridad entre mujeres y hombres en bachillerato es (0.0024; 0.2051) El intervalo de confianza para la diferencia de escolaridad entre mujeres y hombres en Tecnólogo es (0.2920; 0.9461) El intervalo de confianza para la diferencia de escolaridad entre mujeres y hombres en Universidad es (-0,2986; -0.1014)

Parte 1 (semana 5) Prueba de hipótesis para dos variables nominales Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

Desarrollo: (Hoja de Excel: Parte1_Semana5. Punto 1, 2 y 3)

140 120 100 80 60 40 20 0

133

114

54 17

16

No

Sí Hombre



46

(en blanco) Mujer

Gráficamente se muestran diferencias no tan significativas entre hombres y mujeres frente al tema de asistir a establecimientos oficiales, dada una participación respectivamente del 29.3% y 23.5%

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de mujeres que asisten a un establecimiento oficial. Desarrollo: (Hoja de Excel: Parte1_Semana5. Punto 1, 2 y 3)

Intervalo de confianza

Hombres

Con un nivel de significancia del 95%, se tiene que Z

Mujeres

1,96

Límite Inferior

22,8%

17,5%

Límite superior

35,9%

29,4%



Por tanto, con un nivel de significancia del 95%, se tiene que el intervalo de confianza de hombres que asisten a un establecimiento oficial es (22.8%; 35.9%), dado que el porcentaje de hombres que asiste a una entidad oficial el de 29.3%



De igual manera, con un nivel de significancia del 95%, se tiene que el intervalo de confianza de mujeres que asisten a un establecimiento oficial es (17,5%; 23.5%), dado que el porcentaje de mujeres que asiste a una entidad oficial el de 23.5%

3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Prueba de hipótesis Hipótesis: el nivel de asistencia a establecimientos oficiales es mayor en hombres que en mujeres

Hipótesis nula: la asistencia entre hombres y mujeres a establecimientos oficiales es similar

La información proporcionada es:   

n_hombres= 184 n_mujeres=196 p_hombres =0.293 p_mujeres= 0.235 P-hombres -P_mujeres= 0.058

Especifica el nivel de significación de   .05 . El valor crítico para la es de 1.64. Se estima el error estándar de la diferencia de las dos proporciones:  1 1   s phm  P(1  P)  n n M   H

Donde: P

𝑃=

n H PH  nM PM nH  nM

(184𝑥0.293) + (196𝑥0.235) = 0.26 380

Por lo tanto: 1

1

𝑆 = √0.26𝑥(1 − 0.26)𝑥 (184 + 196) = 0.045

Se calcula el estadístico de prueba:

𝑍=

0.058 − 0 = 1.29 0.045

De acuerdo a los resultados, no se rechaza la hipótesis dado que el valor de Z calculado es menor que el valor crítico 1.96 y mayor que el valor critico -1.96, según el nivel de significancia establecido por el ejercicio.

CONCLUSIONES

Con el perfeccionamiento de este trabajo en grupo, a través de un ambiente de educación virtual, se aplicaron los temas vistos a lo largo del curso de Estadística II, en donde se utilizaron en la práctica los diferentes conceptos y fórmulas, así como las herramientas propias de la plataforma, en pro de la interacción y argumentación de los resultados por parte de los integrantes del grupo. Revisando las soluciones a los puntos en el foro y luego de aplicar los conocimientos vistos en estas 5 semanas, se llevó al consenso las respuestas a nivel grupal, las cuales para nosotros son las más adecuadas, esperando que se haya cumplido con el objetivo principal del ejercicio de Estadística II. Es gratificante para cada uno de nosotros, lograr el desarrollo de nuevos conceptos, conocimientos y habilidades prácticas, las cuales nos enriquecerán y complementarán sustancialmente en nuestra formación como profesionales, buscando ser egresados con un excelente nivel y competitivos laboralmente .

REFERENCIAS

http://mggp.utalca.cl/cursos/Documentos/met_de_investigacion/Cap%208_9 %20Metodologia%20de%20investigacion.pdf https://es.khanacademy.org/math/statistics-probability/confidence-intervalsone-sample