Regresiones Lineales y Aplicaciones

www.siresistemas.com/clases Ing. Oscar Restrepo TRABAJO DE APLICACIÓN La siguiente base de datos se conformó por la i

Views 101 Downloads 1 File size 239KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

www.siresistemas.com/clases

Ing. Oscar Restrepo

TRABAJO DE APLICACIÓN

La siguiente base de datos se conformó por la información suministrada en la entidad financiera BankAmerica, en el año anterior. A partir de esta consulta, se pretende aplicar y reforzar los diferentes temas vistos en el curso nivelatorio. SEXO

Hombre Hombre Mujer Mujer Hombre Hombre Hombre Mujer Mujer Mujer Mujer Hombre Hombre Mujer Hombre Hombre Hombre Hombre Hombre Mujer Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Hombre Hombre Hombre Hombre Hombre Hombre Hombre Mujer Hombre Hombre Hombre Mujer

TIPO DE CONTRATO

SALARIO ANUAL ( dólares)

Indefinido Anual Anual Temporal Anual Indefinido Indefinido Temporal Anual Anual Temporal Anual Temporal Indefinido Temporal Indefinido Indefinido Temporal Anual Anual Anual Indefinido Anual Anual Indefinido Indefinido Indefinido Anual Anual Anual Indefinido Indefinido Temporal Indefinido Anual Anual Indefinido Indefinido Indefinido Temporal

www.siresistemas.com/fundacion

$57500 $40200 $21450 $21900 $45000 $32100 $36,000 $21900 $27900 $24000 $30380 $28350 $27750 $35100 $27320 $40800 $46430 $42350 $26250 $38850 $21750 $24280 $16950 $21150 $31050 $60375 $32550 $42000 $31350 $29100 $31360 $36180 $19255 $23565 $35085 $23725 $29640 $30730 $60985 $35560

EXPERIENCIA LABORAL (meses) 144 236 381 190 238 67 114 215 244 143 307 165 228 240 56 444 120 432 168 144 108 49 151 314 240 284 191 209 229 324 264 252 208 240 35 288 180 258 284 284

MESES DESDE EL CONTRATO 77 78 75 80 78 79 75 76 78 80 77 78 77 78 75 76 75 76 77 77 78 78 79 78 80 76 77 78 76 77 76 78 78 78 77 77 78 78 77 78

www.siresistemas.com/

www.siresistemas.com/clases

Ing. Oscar Restrepo

Se solicita, 1. Clasificar cada variable en categórica o cuantitativa ( Discreta o continua ) Sexo: Categórico. Tipo de contrato: Categórico Salario anual: Cuantitativo continuo Experiencia laboral: Cuantitativo discreto Meses desde el contrato: Cuantitativo discreto 2. Elaborar una distribución de frecuencias, una distribución de frecuencias relativas y trace un Histograma para los datos que representa la variable “Salario Anual”. Número de datos Dato mayor Dato menor Cálculo de intevalo Número intervalos (m) Rango Ancho intervalo

40 60985 16950 6,286797971 6 44035 7339,166667

Rango= Dmayor- Dmenor Cálculo del intervalo= 1 + 3.3log(n) El número de intervalos es la aproximación al entero más cercano Ancho del intervalo = Rango/m Tabla de distribución de frecuencias No 1 2 3 4 5 6

Linf 16950 24289,167 31628,333 38967,5 46306,667 53645,833

Lsup 24289,17 31628,33 38967,5 46306,67 53645,83 60985

www.siresistemas.com/fundacion

Yi 20619,58 27958,75 35297,92 42637,08 49976,25 57315,42

fi 11 12 8 5 1 3

Fi 11 23 31 36 37 40

hi 0,275 0,3 0,2 0,125 0,025 0,075

Hi 0,275 0,575 0,775 0,9 0,925 1

www.siresistemas.com/

www.siresistemas.com/clases

Ing. Oscar Restrepo

3. Determinar los estadísticos de centro, de variación y de forma para la variable “Salario Anual”. Realice un breve informe. Medidas de tendencia central Media: Mediana: Semisuma de los datos centrales: Moda: El dato que más se repite: 21900 Medidas de dispersión: Varianza: Desviación estándar: Coeficiente de variación: Medida de forma

Breve informe: El salario promedio anual es de 32704.25, con una desviación de 10524.49. Esta desviación nos muestra que los datos están muy dispersos. El coeficiente de variación indica que el 38.18% de los datos se ajusta a la media. La asimetría nos muestra un valor cercano a cero, quiere decir que los datos están concentrados en el centro. 4. Elaborar una distribución de frecuencias porcentual y trace un diagrama circular porcentual para la variable “Tipo de Contrato”. Realice un breve informe. Tabla de frecuencias No Indefinido  Anual  Temporal 

www.siresistemas.com/fundacion

fi  16  16  8 

Fi  16  32  40 

hi(%) Hi(%) 40  40  40  80  20  100 

www.siresistemas.com/

www.siresistemas.com/clases

Ing. Oscar Restrepo

Breve informe: Existen tres tipos de contratos: Indefinido, temporal y anual. En los 40 datos se tiene igual concentración en el indefinido y anual (80%) entre los dos. El menor porcentaje de empleados tiene contrato temporal (20%). Esto nos ayuda a pensar que existe cierta estabilidad laboral. 5. Aplicar las técnicas de Análisis Exploratorio de Datos ( Diagrama de Tallo y Hojas y Diagrama de Caja)para la variable “Experiencia laboral”. realice un breve comentario sobre lo encontrado. Diagrama de Tallo y Hojas fi  0  1  2  3  4 

35  08  08  07  32 

49  14  09  14  44 

56  20  15  24 

67  43  44  44 51 65 68 80 90 91 228  29  36 38 40 40 40 44 52 58 64 81 

84  84 

84  88

Para realizar el diagrama de Tallo y Hojas se seleccionó las centenas como el tallo y las decenas y unidades como las hojas. Existen más datos concentrados en el intervalo de 2 centenas, es decir entre 200 y 300. Diagrama de Caja: Luego de organizar los datos de menor a mayor se encontró que: 228,5 

Mediana  Cuartil 1   Cuartil 3 

149,25  269 

X

X

35

444 149.25

228.5

269

El 25% de la experiencia laboral es inferior a 149.5, y otro 25% es superior a 269 meses. Además el 50% de los datos centrales están entre 149.25 y 269 meses.

www.siresistemas.com/fundacion

www.siresistemas.com/

4 12 18 4 2

www.siresistemas.com/clases

Ing. Oscar Restrepo

6. Elaborar la Tabla de Contingencia que relacione las variables “Tipo de Contrato” (en la columna) y “Sexo” del empleado (en la fila). Contingencia 

Tipo Contrato

Sexo  Hombre  Mujer  Total general 

Anual  8  8  16 

Indefinido Temporal 14  4  2  4  16  8 

Total  general  26  14  40 

7. Con base en la Tabla de Contingencia evaluar las siguientes probabilidades: a. El empleado sea hombre P=26/40=0.65 b. El empleado es contrato indefinido P=16/40=0.4 c. El empleado es de contrato temporal o anual P=(16+8)/40=0.6 d. El empleado sea mujer o de contrato temporal P=(14+8-4)/40=0.45 e. Dado que el empleado es hombre, que sea de contrato indefinido P=14/26= 0.5384 f. El empleado es de contrato indefinido, dado que es mujer P=2/14=0.1428 g. El empleado no sea contrato anual P= 24/40=0.60 8. Al suponer que la variable “Salario Anual” sigue una distribución aproximadamente normal, con media aritmética = $ 31268 y una desviación estándar = $ 10568 , calcular la probabilidad de que un empleado tenga un salario: a. Entre $20000 y $40000

La probabilidad es de 64.93% b. Mayor de $ 50000

www.siresistemas.com/fundacion

www.siresistemas.com/

www.siresistemas.com/clases

Ing. Oscar Restrepo

La probabilidad es de 3.84% c. El 90% de los empleados, ¿qué salario tienen?

El 90% de los empleados tienen un salario inferior a 44847.88 9. Siendo la variable independiente “ Experiencia laboral” y la variable dependiente “Salario Anual”, a. Determinar la ecuación de regresión

Los resultados son: N=40

Reemplazando se tiene

La ecuación de regresión es:

b. Interpretar el valor de la pendiente La pendiente significa que por cada mes de experiencia laboral el salario aumenta en $15.80 c. Dibujar el diagrama de dispersión y trazar la línea de “mejor ajuste”

www.siresistemas.com/fundacion

www.siresistemas.com/

www.siresistemas.com/clases

Ing. Oscar Restrepo

d.

e. Estimar el salario anual de un empleado que tiene una experiencia laboral de 200 meses

f. Calcular el error estándar de estimación e interprete su valor

La dispersión de los datos respecto a la recta dada es de 10690.59. Es una dispersión muy alta. g. Calcular el coeficiente de determinación y el coeficiente de correlación. interprete cada valor Coeficiente de determinación:

La variación en la experiencia laboral explica un 1.97% de la variabilidad en el salario anual. Este coeficiente es muy bajo indicando que los datos se ajustan en casi nada a la recta encontrada. Coeficiente de correlacion: El coeficiente de determinación es muy pequeño. h. Calcular la covarianza e interprete su valor

www.siresistemas.com/fundacion

www.siresistemas.com/

www.siresistemas.com/clases

Ing. Oscar Restrepo

La covarianza es muy alta. Existe una gran dispersión entre las dos variables. 10. Elabore la distribución de probabilidades para la variable Meses desde el contrato.

x  75 76 77 78 79 80 Suma 

p(x)  0,1 0,15 0,25 0,375 0,05 0,075 1

E.J.J.R

www.siresistemas.com/fundacion

www.siresistemas.com/