Estadistica aplicada semana 6

Título de la tarea Regresión lineal Nombre Alumno Nombre Asignatura Estadística Instituto IACC 15-12-2019 Desarrollo L

Views 154 Downloads 1 File size 232KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Título de la tarea Regresión lineal Nombre Alumno Nombre Asignatura Estadística Instituto IACC 15-12-2019

Desarrollo Le han solicitado elaborar un estudio de desempeño laboral en la empresa Luz Ltda. Con el fin de observar la incidencia y determinar si es relevante que un empleado realice actividades personales en su horario de trabajo. Es por esto que se tomó como referencia el tiempo en horas que un empleado navega en internet en su puesto durante la semana hábil y verificar si existe relación entre el consumo de internet y las siguientes variables: edad, antigüedad laboral, sueldo mensual que percibe y su escolaridad, además de si el sexo del funcionario incide en este comportamiento de actividades no laborales en su lugar de trabajo. De acuerdo con los datos entregados: a) Realice un gráfico de dispersión e indique el tipo de relación entre las variables edad del trabajador y horas conectadas a internet.

Grafico de dispersión; edad vs horas conectado a Internet (semanal) 25 20 15 10 5 0 0

10

20

30

40

50

60

70

Dado la covarianza negativa, indica que hay una relación inversa. Esto se refleja en el gráfico de dispersión, donde se ve que a mayor edad, los trabajadores pasan menos tiempo conectados a internet.

b) Con respecto a las mismas variables de la letra a), construya un modelo de regresión e interprete el valor de la pendiente. y = -0.3488x + 27.39 R² = 0.7502

y = 46.392e-0.031x R² = 0.7258

y = -15.01ln(x) + 68.692 R² = 0.7404

Grafico de dispersión; edad vs horas conectado a Internet (semanal)

25 20 15 10 5 0 0

10

20

30

40

50

60

70

Al comparar los 3 modelos, se observa que el más confiable es el modelo lineal con un coeficiente de determinación del 0,7502 o 75,02% (Y = -0.3488X + 27.39). Como el modelo tiene una pendiente negativa, indica que al aumentar la edad, disminuye las horas en internet. Lo cual se valida con la respuesta A.

c) Estime el número de horas que un trabajador está conectado a internet, si tiene 62 años. Y = -0.3488X + 27.39 Y = -0.3488*62 + 27.39 Y = 5,764 horas Una persona de 62 años utiliza el internet 6 horas aproximadamente.

d) Si un trabajador está conectado 18 horas a internet, ¿qué edad se puede estimar que tiene el trabajador?

X = (-Y + 27,39)/0,3188 X = (-18 + 27,39)/0,3188 X = 26,9208716 La edad del trabajador que utiliza 18 horas de internet es 27 años aproximadamente.

e) Desde la gerencia se requiere establecer un modelo de regresión para las variables: sueldo mensual y antigüedad de los trabajadores, para realizar estimaciones respecto a esas variables. Entonces: e.1) Construya el modelo lineal y exponencial. y = 274.45e0.1074x R² = 0.8053

y = 77.473x + 48.67 R² = 0.7678

Grafico de dispersión; edad vs horas conectado a Internet (semanal)

1600

1400 1200 1000 800 600 400 200 0 0

2

4

6

8

10

12

14

16

e.2) Estime qué modelo se ajusta mejor a los datos. Justifique su respuesta. El modelo más confiable es el exponencial, porque se ajusta mejor a los datos, ya que su coeficiente de determinación es 0,8053 o 83,53%. e.3) Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador, si lleva 15 años en la empresa.

Y = 274,45*EXP(0.1074*X) Y = 274,45*EXP(0.1074*15) Y = 1.374,39525 El sueldo mensual para un trabajador que lleva 15 años en la empresa es $1.374.395.

e.4) Utilizando el mismo modelo anterior estime la antigüedad de un trabajador, con uN sueldo mensual de $750.000. X = LN (Y/274,45)/0,1074 X = LN (750/274,45)/0,1074 X = 9,36037348 años La antigüedad de una persona que gana un sueldo mensual de $750.000 es de 9 años aproximadamente.

Bibliografía

IACC (2018). Regresión lineal. Estadística. Semana 6