UNIVERSIDAD NACIONAL DEL SANTA FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS E INFORMÁT
Views 68 Downloads 0 File size 1MB
UNIVERSIDAD NACIONAL DEL SANTA FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS E INFORMÁTICA
ASIGNATURA:
Ing. Análisis Multidimensional
TEMA:
Ejercicios
DOCENTE:
America Odar Rosario
CICLO:
IV
ESTUDIANTE:
Baes Vásquez Diego Fernando
NVO. CHIMBOTE – PERÚ SEPTIEMBRE - 2016
PROBLEMA N°1 El siguiente es un conjunto de datos experimentales codificados acerca de la resistencia a la compresión de una aleación específica a diferentes valores de concentración de cierto aditivo(n=15) CONCENTRACIÓN X 10 15 20 25 30 a) b) c) d)
RESISTENCIA A LA COMPRESIÓN Y1 Y2 Y3 25.2 27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8
Grafica los datos y obtenga el diagrama de dispersión Estime la ecuación de regresión mínimo cuadrática Pruebe la validez del modelo(α=0.01) Prueba la realidad de la regresión: Use(α=0.01)
Resultados: Muestra las medidas para las variables dependiente e independiente: Estadísticos descriptivos Media Desviación típica X Y1 Y2 Y3
20,000 29,460 30,380 30,260
N
7,9057 2,5648 1,9486 2,2030
5 5 5 5
Muestra la correlación entre las variables dependientes e independientes: Correlaciones X
Y1
Y2
Y3
Correlación de Pearson
X
1,000
,635
,487
,912
,635 ,487 ,912
Sig. (unilateral)
Y1 Y2 Y3 X
1,000 ,829 ,409 ,125
,829 1,000 ,133 ,203
,409 ,133 1,000 ,016
,041
,247 ,415
N
.
Y1 Y2
,125 ,203
Y3 X Y1 Y2
,016 5 5 5
. ,041 ,247 5 5 5
. ,415 5 5 5
. 5 5 5
Y3 5 5 5 5 𝐑𝟐 , nos indica que es el 97% de la variación de la resistencia a la comprensión esta explicada por la concentración.
Mode
Resumen del modelob Estadísticos de cambio Error típ.
R
Durbinde la Cambio en Sig. R Cambio Cambio Watson R cuadrado R cuadrado estimaci corregida ón cuadrado en F gl1 gl2 en F ,98 ,970 ,880 2,7370 ,970 10,791 3 1 ,219 2,870 a 5
lo 1
a. Variables predictores: (Constante), Y3, Y2, Y1 b. Variable dependiente: X P=0,219 (p>0.05). Por lo que debemos aceptarla Ho y rechazar 𝐻1 . El valor de F=10,791, tiene un valor de P=0, 219 (p>0.05). Se concluye que no hay relación entre Resistencia a la comprensión y concentración. ANOVAb Suma de cuadrados 242,509
Modelo 1 Regresión Residual Total
3
Media cuadrática 80,836
7,491
1
7,491
250,000
4
gl
F 10,791
Sig. ,219a
a. Variables predictores: (Constante), Y3, Y2, Y1 b. Variable dependiente: X Ecuación de Regresión: Coeficientesa
Modelo
Coeficientes no estandarizados
Intervalo de confianza de 95.0% para B
Coeficientes tipificados
B -124,179
Error típ. 30,440
Y1
-,368
1,134
-,119
-,325
,800
-14,775
14,039
Y2
1,892
1,374
,466
1,377
,400
-15,565
19,348
Y3
3,224
,745
,898
4,330
,144
-6,236
12,684
1 (Constante)
Beta
t -4,079
Límite Límite Sig. inferior superior ,153 -510,953 262,596
a. Variable dependiente: X 𝑋̂𝑖 = −124,179 − 0.368𝑦1 + 1,892𝑦2 + 3,224𝑦3
A cada valor de Concentración le corresponde un destino de Resistencia de correlación basado en la disminución constante de -124,179 menos 0.368 veces el valor de la resistencia de correlación 1, más 1,892 veces el valor de la resistencia de correlación 2 y más 3,224 veces el valor de la resistencia de correlación 3.
Diagrama de dispersión con la línea de regresión:
𝑋̂𝑖 = −124,179 − 0.368𝑦1
𝑋̂𝑖 = −124,179 + 1,892𝑦2
𝑋̂𝑖 = −124,179 + 3,224𝑦3
Tablas Resumen: Valores promedio, desviación estándar, mínimo y máximo de Concentración y Correlación a la comprensión 1, 2 y 3: Variables
Media
Máxima
Mínima
X Y1 Y2 Y3
20,000 29,460 30,380 30,260
30 31.7 32.6 32.8
10 25.2 27.3 27.8
Desviación Estándar 7,9057 2,5648 1,9486 2,2030
Matriz de Correlación: Variables X Y1 Y2 Y3
X 1 0.635 0.487 0.912
Y1 0.635 1 0.829 0.409
Y2 0.487 0.829 1 0.133
Y3 0.912 0.409 0.133 1
𝑋̂𝑖 = −124,179 − 0.368𝑦1 Interpretación de los gráficos anteriores y su ecuación de línea de regresión:
𝑋̂𝑖 = −124,179 + 3,224𝑦3 Nos indica que la relación es positiva, ya que a mayor resistencia a la compresión, mayor Concentración. 𝑋̂𝑖 = −124,179 + 1,892𝑦2 Nos indica que la relación es positiva, ya que a mayor resistencia a la Compresión, mayor Concentración. Nos indica que la relación es negativa ya que a mayor resistencia a la compresión, menor Concentración. 𝑋̂𝑖 = −124,179 + 3,224𝑦3
CV% 395.28 87.06 64.14 72.8
PROBLEMA N°3 Una compañía desea modelar la relación entre sus ventas y las ventas de la industria en general VENTAS DE LA CIA( Y) 0,5 1,0 1,0 1,4 1,3 1,6
VENTAS DE LA INDUSTRIA (X) 10 12 13 15 14 15
a. Encontrar una recta que se ajuste a los datos b. ¿parecen contribuir las rentas de la industria con alguna información a la predicción de las rentas de la Compañía? Probar en el nivel 1% c. Si las ventas de la industria es 16, determinar intervalos de confianza del 95% para las rentas individuales y para las ventas promedio de la compañía d. Estimar el intervalo de confianza para la pendiente poblacional e. Grafique la línea de regresión estimada en el diagrama de dispersión Resultados Los siguientes resultados son las salidas del SPSS: 1. La tabla I Muestra las medidas para las variables dependiente e independiente Tabla 1. Estadísticos descriptivos Media
Desviación típica
N
Ventas de la Cia 1,1333 ,38816 6 Rentas de la Industria 13,1667 1,94079 6 2. La Tabla 2 muestra la correlación entre las variables dependientes e independientes Nota: La correlación entre las mismas variables siempre es 1 Tabla2. Correlaciones Ventas de la Cia Correlación de Pearson Sig. (unilateral) N
Ventas de la Cia Rentas de la Industria Ventas de la Cia Rentas de la Industria Ventas de la Cia
Rentas de la Industria
1,000
,973
,973 . ,001 6
1,000 ,001 . 6
Rentas de la Industria 6 6 2 3. La tabla 3 muestra el Coeficiente de correlación y su cuadro. 𝑅 expresa la porción de varianza de la variable Dependiente, que esta explicada por la variable independiente.
En el ejemplo 𝑅 2. Toma un valor moderado(es máximo 1) y 𝑅 2, nos indica que es el 94.8% de la variación de la cantidad de Ventas de la compañía esta explicada por las Rentas de la industria 𝑹𝟐 Corregida es una corrección a la baja de 𝑅 2 que se basa en el número de casos y de variables independientes. El error típico de estimación es la desviación típica de los residuos, es decir la desviación típica de las distancias entre las puntuaciones en la variable independiente y los pronósticos efectuados con la regresión. En general cuanto mejor es el ajuste, más pequeño es este error típico. Tabla 4 Resumen ANOVA nos informa si existe o no relación entre las variables. El Tabla 3. Resumen del modelob Estadísticos de cambio R Error típ. R Cambio Sig. Modelo R cuadrado de la Cambio cuadrado en R gl1 gl2 Cambio corregida estimación en F cuadrado en F a 1 ,973 ,948 ,935 ,09933 ,948 72,347 1 4 ,001 a. Variables predictoras: (Constante), Rentas de la Industria b. Variable dependiente: Ventas de la Cia estadístico F permite contrastar la hipótesis nula de la pendiente de la recta de regresión es cero. En el ejemplo el valor P=0,001(p0.05) Lo cual prueba que 𝛽1 = 0 lo que indica que debemos aceptar Ho y rechazar 𝐻1 lo que nos lleva a concluir que no existe relación entre coeficiente de absorción relativa (Y) y la Temperatura C°(X). ANOVAa Modelo Regresión 1
Residual
Suma de cuadrados
gl
Media cuadrática
324,483
1
324,483
3622,374
5
724,475
F ,448
Sig. ,533b
Total 3946,857 6 a. Variable dependiente: coeficiente b. Variables predictoras: (Constante), temperatura 5. Ecuación de la regresión La tabla 05 Muestra los coeficientes de la recta de regresión. La columna denominada Coeficientes no estandarizados contiene los coeficientes de regresión que definen la ecuación de regresión en puntuaciones directas. El coeficiente Constante(es el origen de la recta 𝛽0 ) y el Coeficiente Rentas de Industria es dependiente de la recta de regresión (𝛽1 ).
Durbin Watson
2,531
Los coeficientes Beta (coeficientes de regresión estandarizados) son los coeficientes que definen la ecuación de regresión cuando esta se obtiene tras estandarizar las variables originales, es decir, tras convertir las puntuaciones directas en típicas. En el análisis de regresión lineal simple, el coeficiente de regresión estandarizado corresponde a la única variable independiente presente en la ecuación coincide exactamente con el coeficiente de correlación de Pearson. En el análisis de Regresión múltiple, los coeficientes de regresión estandarizados permiten valorar la importancia de cada variable independiente dentro de una ecuación.
Modelo
Coeficientes no estandarizados B
1
(Constante)
Error típ.
11,701
temperatura ,522 a. Variable dependiente: coeficiente
Coeficientesa Coeficientes tipificados
Sig.
Beta
23,472 ,779
t
,287
Intervalo de confianza de 95,0% para B
,498
,639
Límite inferior -48,637
,669
,533
-1,482
Límite superior 72,038 2,525
Con los resultados de la Tabla 05 construimos la ecuación de regresión: Ŷi = 11,701 + 0,522Xi Ventas de la Compañía = 11,701 + 0.522 Rentas de la Industria A cada valor de Coeficiente de absorción relativa le corresponde un pronóstico de Temperatura basado en la disminución constante de 11,701 más 0.522 veces del valor de la Temperatura C° DIAGRAMA DE DISPERCION
Cuando x=25
Ŷi = 11,701 + 0,522Xi Ŷi = 11,701 + 0,522(25) Ŷi = 24,751
Ŷi=22.75 Resultados de la investigación
Tabla 01 Resumen estadístico de valores promedio, desviación estándar, mínimo y máximo de Coeficientes de absorción relativa y temperatura C° Variables
Media
Coeficientes de absorción relativa 25,8571
temperatura C°
27,1429
Máxima
Mínima
Desviación estándar
CV%
46
5
25,64780
99,17
50
10
14,09998
51,94
Tabla 02 Matriz de Correlación de Coeficientes de absorción relativa y temperatura C° Coeficientes de absorción relativa
temperatura C°
Coeficientes de absorción relativa
1
0.287
temperatura C°
0.287
1
La correlación de variables de interés del estudio muestra una relación positiva o directa entre las Coeficientes de absorción relativa y temperatura C°
FIGURA 01 DIAGRAMA DE DISPERSIÓN CON LA LÍNEA DE REGRESIÓN. La relación existente entre las Coeficientes de absorción relativa y temperatura C° se ilustra en la FIGURA 01, a mayor Temperatura C° los Coeficientes de absorción relativa se ven aumentados Modelo de regresión:
Ŷi = 11,701 + 0,522Xi
El valor positivo de la pendiente (𝛽1 ). Nos indica que la relación es directa o positiva, es decir amayorTemperatura C (X)mayorCoeficientes de absorción relativa (Y). PROBLEMA N°8 Se desea purificar por destilación a presión reducida Salicilato de metilo a una presión de 15 mmHg considerando que la temperatura de ebullición es una función de la presión y a partir de los siguientes datos experimentales de presión y temperatura de Salicilato de metilo. P(MHG) - X 1 5 10 20 40 60 100 200 400 760
T(°C) - Y 54 81.6 95.3 110 126.2 136.7 150 172.6 197.5 223.2
Graficar un diagrama de dispersión.
Obtenga una ecuación que mejor describa la relación entre la temperatura y la presión y determine si el modelo hallado es válido.
Coeficientes no estandarizados
Modelo 1 (Constante)
B
Coeficientesa Coeficientes estandarizados
Error estánda r
Beta
t
-378,972 119,634 Presion en mHg
3,998
,833
95.0% intervalo de confianza para B
,862
Sig.
Límite inferior
3,16 ,013 8
-654,848
-103,096
4,80 ,001 2
2,078
5,918
a. Variable dependiente: Temperatura en °C
Ecuación de Regresión:
Límite superior
Ŷi = -378.972 + 3.998 Xi
Resumen del modelob Estadísticos de cambio Cambio R Error en R Mode R cuadrado estándar de cuadrad lo R cuadrado ajustado la estimación o a 1 ,862 ,742 ,710 131.68324 ,742 a. Predictores: (Constante), Presion en mHg b. Variable dependiente: Temperatura en °C
Cambio en F 23,061
gl1 1
Sig. Cambio en gl2 F 8 ,001
P=0,001 (p0.05). Por lo que debemos aceptar la Ho y rechazar 𝐻1 es decir 𝛽1 = 0 Conclusión El valor de F=416.925 tiene un valor de P=0, 990 (p>0.05) Lo cual prueba que 𝛽1 = 0 lo que indica que debemos aceptar
3,005
TABLA 04 ANOVAa Modelo
Suma de cuadrados Regresión
1
Media cuadrática
1269,054
1
1269,054
12,175
4
3,044
1281,230
5
Residual Total
df
F
Sig.
416,925
,000b
Ecuación de la regresión La tabla 05 Muestra los coeficientes de la recta de regresión. La columna denominada Coeficientes no estandarizados contiene los coeficientes de regresión que definen la ecuación de regresión en puntuaciones directas. El coeficiente Constante(es el origen de la recta 𝛽0 ) y el Coeficiente Rentas de Industria es dependiente de la recta de regresión (𝛽1 ). Los coeficientes Beta (coeficientes de regresión estandarizados) son los coeficientes que definen la ecuación de regresión cuando esta se obtiene tras estandarizar las variables originales, es decir, tras convertir las puntuaciones directas en típicas. En el análisis de regresión lineal simple, el coeficiente de regresión estandarizado corresponde a la única variable independiente presente en la ecuación coincide exactamente con el coeficiente de correlación de Pearson. En el análisis de Regresión múltiple, los coeficientes de regresión estandarizados permiten valorar la importancia de cada variable independiente dentro de una ecuación.
Modelo
Tabla Nº 5 Coeficientesa Coeficientes no Coeficient estandarizados es tipificados B
1
(Constante) X ºC
Error típ.
5.822
1,263
,568
,028
t
Sig.
Beta
,995
Intervalo de confianza de 95,0% para B
-4,611
,010
Límite inferior 2.317
20,419
,000
,491
a. Variable dependiente: Ventas de la compañía Con los resultados de la Tabla 05 construimos la ecuación de regresión: Ŷi = 5,822+ 0,568 Xi
Gramos = 5,822 + 0,568 ºC A cada valor de los ºC le corresponde un pronóstico Gramos basado en la disminución constante de 5,822 más 0,568 veces del valor de los ºC.
Límite superior 9,328 ,645
PROBLEMA N°15 Ocho personas que han sido capacitadas en un nuevo programa, se escogen al azar, para utilizar adecuadamente dicho programa y dar respuesta a las consultas hechas (Y) por los usuarios de una empresa, después del nuero indicado de días de capacitación X, como se representan en el cuadro adjunto. Los datos parecen sugerir que la relación entre X e Y puede describirse en forma curvilínea. Nº DE CONSULTAS Y TIEMPO DE CAPACITACIÓN X
15 1
18 2
25 3
30 4
35 5
45 6
53 7
70 8
a) Graficar los datos en un diagrama de dispersión y señale el modelo probable de ajuste a los datos. b) Obtenga una ecuación (modelo matemático) que mejor relacione el número de consultas (Y) y el tiempo de capacitación(X). c) Estime el número de consultas de promedio e individual realizadas de usuarios con un tiempo de capacitación de 5,5 días. Solucion: La tabla 1 Muestra las medidas para las variables dependiente e independiente Estadísticos descriptivos Media Desviación típica Nº de consultas Tiempo de Capacitación
31,57 4,00
N
13,879 2,160
7 7
La Tabla 2 muestra la correlación entre las variables dependientes e independientes Nota: La correlación entre las mismas variables siempre es 1 Correlaciones Nº de consultas Correlación de Pearson Sig. (unilateral) N
Nº de consultas
Tiempo de Capacitacion
1,000
,989
Tiempo de Capacitacion Nº de consultas
,989 .
1,000 ,000
Tiempo de Capacitacion Nº de consultas
,000 7
. 7
Tiempo de Capacitacion
7
7
La tabla 3: Muestra el Coeficiente de correlación y su cuadro. 𝑅 2 expresa la porción de varianza de la variable Dependiente, que esta explicada por la variable independiente. En el ejemplo 𝑅 2.
Toma un valor moderado(es máximo 1) y 𝑅 2, nos indica que es el 97,9% de la variación de la cantidad de Nº de consultas esta explicada por las el Tiempo de capacitación. 𝑹𝟐 Corregida es una corrección a la baja de 𝑅 2 que se basa en el número de casos y de variables independientes. El error típico de estimación es la desviación típica de los residuos, es decir la desviación típica de las distancias entre las puntuaciones en la variable independiente y los pronósticos efectuados con la regresión. En general cuanto mejor es el ajuste, más pequeño es este error típico, en este caso es de 2, 197. Resumen del modelob Estadísticos de cambio R Error típ. cuadrad Cambio R de la DurbinSig. Modelo R o en R Cambio cuadrado estimació gl1 gl2 Cambio Watson corregid cuadrad en F n en F a o ,989 234,34 1 0,979 0,975 2,197 0,979 1 5 0 1,298 a 9 a. Variables predictoras: (Constante), Tiempo de Capacitación b. Variable dependiente: Nº de consultas Tabla 4: Nos informa si existe o no relación entre las variables. El estadístico F permite contrastar la hipótesis nula de la pendiente de la recta de regresión es cero. En el ejemplo el valor P=0,000(p