242831355-Taller-teoria-de-la-probabilidad-docx.docx

Taller teoría de la probabilidad Regresión lineal Integrantes: Wilmar Alberto Romero, Cesar Camilo Vargas Callejas 45).

Views 175 Downloads 0 File size 824KB

Report DMCA / Copyright

DOWNLOAD FILE

Citation preview

Taller teoría de la probabilidad Regresión lineal Integrantes: Wilmar Alberto Romero, Cesar Camilo Vargas Callejas 45). Un consultor está interesado en el grado de precisión con que un nuevo índice de desempeño laboral mide lo que es importante para una corporación. Una forma de verificarlo es analizar la relación entre el índice de evaluación del trabajo y el salario de un empleado. Se tomó una muestra de ocho empleados y se recabó información del salario (en miles de dólares) y el índice de evaluación del trabajo (1 a 10, donde 10 es la mejor calificación). Índice de evaluación del trabajo (X) 9 7 8 4 7 5 5 6 Salario (Y) 36 25 33 15 28 19 20 22 SOLUCION a) 𝑦 =4.2138x - 2.1132 b) 1.32860797883559 c) 𝑅 2= 0.970863288

Salario(y) 40 36

35

33

30

28 25

25

20

22

20 19

15

Salario(y)

15

10 5 0 0

2

4

6

8

10

46). La Stork Foundation desea mostrar con estadísticas que, contrariamente a la creencia popular, las cigüeñas sí traen a los bebés. Para esto ha recolectado datos sobre el número de cigüeñas y el número de bebés (ambos en miles) en varias ciudades grandes de Europa central. Cigüeñas 27 38 13 24 6 19 15 Bebés 35 46 19 32 15 31 20 a) Calcule el coeficiente de determinación de la muestra y el coeficiente de correlación de la muestra para estos datos. b) ¿Contradijo la ciencia estadística la creencia popular? SOLUCION

a) El coeficiente de determinacion de la muestra es de 0.24369817 y el coeficiente de correlación es de 0.493657948 b) La stork foundation desea mostrar con estadística que, contrariamente a la creencia popular, las cigüeñas si traen a los bebes. Para esto ha recolectado datos sobre el número de cigüeñas y el número de bebes en varias ciudades grandes de Europa Central. Lo cierto es que tanto las cigüeñas como los bebes dependen de la causa común, Z, que es el tamaño del pueblo o ciudad. En las poblaciones más grandes siempre hay más cigüeñas y más niños. Tanto cigüeñas como niños es tan correlacionados con el tamaño de la población pero no entre ellos mismos. Esto significa que el 98% de los datos se relacionan entre sí. La relación entre las dos variables es negativa y la pendiente es positiva por tanto, el signo de r es positivo.

bebes 50 45 40 35 30 25 20 15 10 5 0

46

31

32

35

bebes

19 20 15

0

10

20

30

40

Estadísticas de la regresión Coeficiente de correlación múltiple 0,97882033 Coeficiente de determinación R^2 0,95808925 R^2 ajustado 0,9497071 Error típico 2,44198722 Observaciones 7 47). Los análisis de regresión y correlación tratan la relación entre variables. El análisis de regresión, mediante ecuaciones de estimación nos permite determinar una variable desconocida a partir de un conjunto de variables conocidas. La variable desconocida se llama Dependiente; las variables conocidas se llaman variables Independientes. La correlación entre dos variables indican el grado de la relación lineal entre ellas y por tanto da una idea de qué tan bien el análisis de regresión describe la relación entre las variables.

48). Calcule el coeficiente de determinación de la muestra y el coeficiente de correlación de la muestra para el ejercicio 12-14.

Business Week y U.S. News & World Report publican clasificaciones de las mejores 20 escuelas de administración. La clasificación global del Business Week se basa en clasificaciones obtenidas de estudiantes y compañías que reclutan maestros en administración. Junto con las clasificaciones, las publicaciones reportan información sobre el costo de obtener una maestría y los salarios iniciales promedio de los graduados. Utilice los datos de la tabla MR12-1 para responder los ejercicios 12-49 a 12-52. 49). Trace un diagrama de dispersión de la clasificación USN&WR contra el costo del grado de la maestría. ¿Parece que las escuelas más caras obtienen mejores clasificaciones? Calcule el coeficiente de correlación de muestra entre estas dos variables.

Costo 45 40

38.48 37.637.639 38.5 38 37.2 37 37.5 37.1

35 30

37.2

37

36.1

35

33.5

28.5

25

24.6 22.5

Costo

20 17.36 15.4

15 10 5 0

0

5

10

Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones

15

0,49365795 0,24369817 0,2016814 5,28593898 20

20

25

ANÁLISIS DE VARIANZA Grados de libertad Regresión 1 Residuos 18 Total 19

Suma de cuadrados 162,059283 502,940717 665

Promedio de los cuadrados F 162,059283 5,80002174 27,941151

Valor crítico de F 0,02696204

Coeficien Error Estadísti Probabili Inferior Superior Inferior Superior tes típico co t dad 95% 95% 95,0% 95,0% Intercepc 23,65404 5,588336 4,232752 0,000500 11,91338 35,39470 11,91338 35,39470 ión 19 11 18 46 34 04 34 04 Variable 0,395527 0,164233 2,408323 0,026962 0,740568 0,050485 0,740568 0,050485 X1 01 35 43 04 47 56 47 56 50). ¿Existe una retribución por gastar más en una maestría? Grafique un diagrama de dispersión del salario inicial contra el costo. Ajuste una ecuación de regresión a los datos y pruebe las hipótesis apropiadas respecto a su pendiente. Solución SALARIO INICIAL

COSTO 70,2 68,6 84,96 72,2 58,11 74,26 82,86 49,07 66,62 55,5 65,28 59,87 73 59,94 56,73 64,54

37,6 38,5 37,1 37,6 37,2 37,5 38,48 24,6 38 17,36 28,5 37 39 37 36,1 22,5

56,98

37,2

65,5 47,32

15,4 35

48,2

33,5

SALARIO INICIAL CONTRA EL GASTO 45 40 35 30 25

20 15 10

y = 0.2196x + 19.206 R² = 0.0983

5 0 0

10

20

30

40

y = 19,206+ 0,2196x R² = 0,0983

50

60

70

80

90

Y=A+BX

51). ¿Los graduados de escuelas con clasificación más alta obtienen salarios iniciales más altos? Trace un diagrama de dispersión de salario inicial contra la clasificación global de Business Week. Ajuste una ecuación de regresión a los datos y pruebe las hipótesis apropiadas respecto a su pendiente. SALARIO INICIAL 70,2 68,6 84,96 72,2 58,11 74,26 82,86 49,07 66,62 55,5 65,28 59,87 73 59,94 56,73 64,54

CLASIFICACION GLOBAL BUSINESS WEEK 3 10 12 15 9 1 5 6 18 8 2 7 14 4 16 11

56,98

23

65,5

13

47,32 48,2

19 24

SALARIO INICIA CONTRA CLASIFICACION GLOBAL 30 25 20

15 10

y = -0.2281x + 25.597 R² = 0.127

5 0 0

10

20

30

y = 25,597+(0,2281x) R² = 0,127

40

50

60

70

80

90

Y=A+BX

52). ¿Qué tan fuerte es la relación entre los salarios iniciales y las clasificaciones? Calcule los coeficientes de determinación de la muestra entre los salarios iniciales y las tres clasificaciones de Business Week (globales, por estudiantes y por compañías). ¿Cuáles de estas clasificaciones explican la mayor parte de la variación en salarios iniciales? SALARIO INICIAL CONTRA CLASIFICACION BW DE 1992 SALARIO INICIAL CLASIFICACION BW 70,2 68,6 84,96 72,2 58,11 74,26 82,86 49,07 66,62 55,5 65,28

1 2 3 4 5 6 7 8 9 10 11

59,87 73 59,94 56,73 64,54 56,98 65,5 47,32 48,2

12 13 14 15 16 17 18 19 20

SALARIO INICIA CONTRA CLASIFICACION 1992 25

20

15

10

y = -0.3332x + 31.821 R² = 0.3527

5

0 0

10

20

30

40

50

60

70

80

90

R² = 0,3527 SALARIO INICIAL CONTRA CLASIFICACION BW DE ESTUDIANTES CLASIFICACION ESTUDIANTES

SALARIO INICIAL 70,2 68,6 84,96 72,2 58,11 74,26 82,86 49,07 66,62 55,5 65,28

3 10 12 15 9 1 5 6 18 8 2

59,87 73 59,94 56,73 64,54 56,98 65,5 47,32 48,2

7 14 4 16 11 23 13 19 24

Chart Title 30 25

20 15 10 y = -0.2281x + 25.597 R² = 0.127

5 0 0

10

20

30

40

50

60

70

80

90

R² = 0,127 SALARIO INICIAL CONTRA CLASIFICACION BW POR COMPAÑIAS SALARIO INICIAL COMPAÑIAS 70,2 1 68,6 4 84,96 3 72,2 2 58,11 6 74,26 12 82,86 7 49,07 8 66,62 5 55,5 11 65,28 15 59,87 14

73 59,94 56,73 64,54 56,98 65,5 47,32 48,2

10 17 13 16 9 19 20 18

Chart Title 25

20

15

10 y = -0.298x + 29.571 R² = 0.2822 5

0 0

10

20

30

40

50

60

70

80

90

R² = 0,2822 53). “Nada triunfa como el éxito” es un antiguo adagio en el negocio de la publicidad. El presidente de una distribuidora de varias líneas de automóviles ha observado que los agentes de ventas que gana los bonos más altos al final de año son los que tienen mayor probabilidad de exceder su cuota de ventas el año siguiente (y ganar otro bono alto). Bono el año pasado (miles de dólares) 7.8 Ventas arriba de cuota este año 64 73 42 Bono el año pasado (miles de dólares) 6.3 Ventas arriba de cuota este año 32 88 53

6.9 49 8.4 84

6.7 6.0 6.9 5.2 71 46 7.2 10.1 10.8 7.7 85 93

a) Desarrolle la recta que mejor se ajuste para describir estos datos. b) Calcule el error estándar de la estimación para la relación. BONO EL AÑO PASADO (MILES DE DOLARES)

VENTAS ARRIBA DE CUOTA ESTE AÑO

7,8 6,9 6,7 6 6,9 5,2

64 73 42 49 71 46

Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico estandar Observaciones Coeficie Error Estadísti Probabili Inferior Superio ntes típico co t dad 95% r 95% Intercep 2,77543 40,1457 0,06913 0,94820 114,23 108,687 ción 27 987 3826 119 804 174 Variable 9,15576 6,05232 1,51276 0,20488 7,6481 25,9597 X1 192 15 8599 593 765 003

Inferior 90,0% 88,3601 2467 3,74686 0224

Superior 90,0% 82,8092 5932 22,0583 8407

AÑO PASADO BONO CONTRA ENTAS ESTE AÑO 80 70 60 50 40 30 20

y = 9.1558x - 2.7754 R² = 0.3639

10 0 0

1

BONO EL AÑO PASADO (MILES DE

2

3

4

VENTAS ARRIBA DE CUOTA ESTE AÑO

5

6

7

8

9

DOLARES) 6,3 8,4 7,2 10,1 10,8 7,7

Intercep ción Variable X1

32 88 53 84 85 93

Coeficie Error Estadísti Probabili Inferior Superio ntes típico co t dad 95% r 95% 8,16635 44,1399 0,18501 0,86222 130,71 114,385 1607 09 0613 272 839 683 9,58412 5,15425 1,85945 0,13648 4,7263 23,8946 0983 517 7994 607 856 275

Inferior 90,0% 102,265 8748 1,40396 1345

AÑO PASADO BONO CONTRA ENTAS ESTE AÑO 120 100 80 60 40

y = 9.5841x - 8.1664 R² = 0.4636

20 0 0

2

4

Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico estandar Observaciones

6

8

0,680906208 0,463633265 0,329541581 19,95457981 6

10

12

Superior 90,0% 85,9331 7156 20,5722 0331

60. Suponga que desea saber si los negocios son mejores en comunidades con más gente mayor. Utilice una edad promedio para representar el número de personas mayores en cada área metropolitana, ajuste una ecuación de regresión para explicar VENTAS en términos de EDAD. ¿La pendiente de su regresión es significativamente mayor que cero? Con base en este análisis, ¿debe concluir que “los negocios no son mejores en comunidades con más personas mayores”? Explique su respuesta. No se encuentra en el cd no tiene solución 61). Los economistas con frecuencia están interesados en estimar funciones de consumo, que se obtienen mediante la regresión del consumo Y sobre el ingreso X (para esta regresión, los economistas llaman a la pendiente la propensión marginal al consumo). Para una muestra de 25 familias, se calculó una pendiente de 0.87 y un error estándar del coeficiente de la pendiente de regresión de 0.035. Para esta muestra, ¿la propensión marginal a consumir disminuyó a menos que el estándar de 0.94? Utilice ∝ = 0.05. Establezca las hipótesis explícitas y una conclusión. Solución Pendiente = 0.87 Error estándar= 0.035 ∝ = 0.05.

62). A diferencia del coeficiente de determinación, el coeficiente de correlación (escoja la respuesta correcta): a) Indica si la pendiente de la recta de regresión es positiva o negativa. b) Mide la fuerza de asociación entre las dos variables de manera más exacta. c) Nunca puede tener un valor absoluto mayor que 1. d) Mide el porcentaje de varianza explicado por la recta de regresión. 63). ¿Son importantes las calificaciones en la universidad para ganar un buen sueldo? Un estudiante de estadística para la administración tomó una muestra aleatoria de sueldos iniciales y promedios de calificaciones en la universidad de algunos de sus amigos recién graduados. Los datos son los siguientes: Sueldo inicial (miles de dólares): 36 30 30 24 27 33 21 27 Promedio de calificaciones: 4.0 3.0 3.5 2.0 3.0 3.5 2.5 2.5 a) Grafique estos datos. b) Desarrolle la ecuación de estimación que mejor describa los datos. c) Grafique la ecuación de estimación en el diagrama de dispersión del inciso a). Solución

A),

40 35 30 25

Sueldo inicial (miles de dólares)

20 15

Promedio de calificaciones

10 5 0 1

2

3

4

5

6

7

8

B). Estimación lineal = -0,61764706 C).

Promedio de calificaciones 5 4

4

3

3 2.5

2.5 2

3.5 3

3.5 Promedio de calificaciones

2

1 0 0

5

10

15

20

25

30

35

40

64). Un arrendador está interesado en ver si las rentas de sus departamentos son las comunes. Para esto tomó una muestra aleatoria de 11 rentas y tamaños de departamentos en complejos de departamentos similares. Los datos son los siguientes: Renta: 230 190 450 310 218 185 340 245 125 350 280 Número de recámaras: 2 1 3 2 2 2 2 1 1 2 2 a) Desarrolle la ecuación de estimación que mejor describa estos datos. b) Calcule el coeficiente de determinación. c) Pronostique la renta para un departamento de dos recámaras. Solución A). Estimación lineal = -1,858272163 B).Coeficiente de determinación R^2=

0,576169255

C). Renta

Número de recámaras 230 190 450 310 218 185 340 245 125 350 280

2 1 3 2 2 2 2 1 1 2 2

Renta 2 recamaras 116

156 110 93,5 171

176 141