Ejercicios (Analisis Multidimensional)

UNIVERSIDAD NACIONAL DEL SANTA FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS E INFORMÁT

Views 68 Downloads 0 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL DEL SANTA FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS E INFORMÁTICA

ASIGNATURA:

Ing. Análisis Multidimensional

TEMA:

Ejercicios

DOCENTE:

America Odar Rosario

CICLO:

IV

ESTUDIANTE:

Baes Vásquez Diego Fernando

NVO. CHIMBOTE – PERÚ SEPTIEMBRE - 2016

PROBLEMA N°1 El siguiente es un conjunto de datos experimentales codificados acerca de la resistencia a la compresión de una aleación específica a diferentes valores de concentración de cierto aditivo(n=15) CONCENTRACIÓN X 10 15 20 25 30 a) b) c) d)

RESISTENCIA A LA COMPRESIÓN Y1 Y2 Y3 25.2 27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8

Grafica los datos y obtenga el diagrama de dispersión Estime la ecuación de regresión mínimo cuadrática Pruebe la validez del modelo(α=0.01) Prueba la realidad de la regresión: Use(α=0.01)

Resultados: Muestra las medidas para las variables dependiente e independiente: Estadísticos descriptivos Media Desviación típica X Y1 Y2 Y3

20,000 29,460 30,380 30,260

N

7,9057 2,5648 1,9486 2,2030

5 5 5 5

Muestra la correlación entre las variables dependientes e independientes: Correlaciones X

Y1

Y2

Y3

Correlación de Pearson

X

1,000

,635

,487

,912

,635 ,487 ,912

Sig. (unilateral)

Y1 Y2 Y3 X

1,000 ,829 ,409 ,125

,829 1,000 ,133 ,203

,409 ,133 1,000 ,016

,041

,247 ,415

N

.

Y1 Y2

,125 ,203

Y3 X Y1 Y2

,016 5 5 5

. ,041 ,247 5 5 5

. ,415 5 5 5

. 5 5 5

Y3 5 5 5 5 𝐑𝟐 , nos indica que es el 97% de la variación de la resistencia a la comprensión esta explicada por la concentración.

Mode

Resumen del modelob Estadísticos de cambio Error típ.

R

Durbinde la Cambio en Sig. R Cambio Cambio Watson R cuadrado R cuadrado estimaci corregida ón cuadrado en F gl1 gl2 en F ,98 ,970 ,880 2,7370 ,970 10,791 3 1 ,219 2,870 a 5

lo 1

a. Variables predictores: (Constante), Y3, Y2, Y1 b. Variable dependiente: X P=0,219 (p>0.05). Por lo que debemos aceptarla Ho y rechazar 𝐻1 . El valor de F=10,791, tiene un valor de P=0, 219 (p>0.05). Se concluye que no hay relación entre Resistencia a la comprensión y concentración. ANOVAb Suma de cuadrados 242,509

Modelo 1 Regresión Residual Total

3

Media cuadrática 80,836

7,491

1

7,491

250,000

4

gl

F 10,791

Sig. ,219a

a. Variables predictores: (Constante), Y3, Y2, Y1 b. Variable dependiente: X Ecuación de Regresión: Coeficientesa

Modelo

Coeficientes no estandarizados

Intervalo de confianza de 95.0% para B

Coeficientes tipificados

B -124,179

Error típ. 30,440

Y1

-,368

1,134

-,119

-,325

,800

-14,775

14,039

Y2

1,892

1,374

,466

1,377

,400

-15,565

19,348

Y3

3,224

,745

,898

4,330

,144

-6,236

12,684

1 (Constante)

Beta

t -4,079

Límite Límite Sig. inferior superior ,153 -510,953 262,596

a. Variable dependiente: X 𝑋̂𝑖 = −124,179 − 0.368𝑦1 + 1,892𝑦2 + 3,224𝑦3

A cada valor de Concentración le corresponde un destino de Resistencia de correlación basado en la disminución constante de -124,179 menos 0.368 veces el valor de la resistencia de correlación 1, más 1,892 veces el valor de la resistencia de correlación 2 y más 3,224 veces el valor de la resistencia de correlación 3.

Diagrama de dispersión con la línea de regresión:

𝑋̂𝑖 = −124,179 − 0.368𝑦1

𝑋̂𝑖 = −124,179 + 1,892𝑦2

𝑋̂𝑖 = −124,179 + 3,224𝑦3

Tablas Resumen: Valores promedio, desviación estándar, mínimo y máximo de Concentración y Correlación a la comprensión 1, 2 y 3: Variables

Media

Máxima

Mínima

X Y1 Y2 Y3

20,000 29,460 30,380 30,260

30 31.7 32.6 32.8

10 25.2 27.3 27.8

Desviación Estándar 7,9057 2,5648 1,9486 2,2030

Matriz de Correlación: Variables X Y1 Y2 Y3

X 1 0.635 0.487 0.912

Y1 0.635 1 0.829 0.409

Y2 0.487 0.829 1 0.133

Y3 0.912 0.409 0.133 1

𝑋̂𝑖 = −124,179 − 0.368𝑦1 Interpretación de los gráficos anteriores y su ecuación de línea de regresión:

𝑋̂𝑖 = −124,179 + 3,224𝑦3 Nos indica que la relación es positiva, ya que a mayor resistencia a la compresión, mayor Concentración. 𝑋̂𝑖 = −124,179 + 1,892𝑦2 Nos indica que la relación es positiva, ya que a mayor resistencia a la Compresión, mayor Concentración. Nos indica que la relación es negativa ya que a mayor resistencia a la compresión, menor Concentración. 𝑋̂𝑖 = −124,179 + 3,224𝑦3

CV% 395.28 87.06 64.14 72.8

PROBLEMA N°3 Una compañía desea modelar la relación entre sus ventas y las ventas de la industria en general VENTAS DE LA CIA( Y) 0,5 1,0 1,0 1,4 1,3 1,6

VENTAS DE LA INDUSTRIA (X) 10 12 13 15 14 15

a. Encontrar una recta que se ajuste a los datos b. ¿parecen contribuir las rentas de la industria con alguna información a la predicción de las rentas de la Compañía? Probar en el nivel 1% c. Si las ventas de la industria es 16, determinar intervalos de confianza del 95% para las rentas individuales y para las ventas promedio de la compañía d. Estimar el intervalo de confianza para la pendiente poblacional e. Grafique la línea de regresión estimada en el diagrama de dispersión Resultados Los siguientes resultados son las salidas del SPSS: 1. La tabla I Muestra las medidas para las variables dependiente e independiente Tabla 1. Estadísticos descriptivos Media

Desviación típica

N

Ventas de la Cia 1,1333 ,38816 6 Rentas de la Industria 13,1667 1,94079 6 2. La Tabla 2 muestra la correlación entre las variables dependientes e independientes Nota: La correlación entre las mismas variables siempre es 1 Tabla2. Correlaciones Ventas de la Cia Correlación de Pearson Sig. (unilateral) N

Ventas de la Cia Rentas de la Industria Ventas de la Cia Rentas de la Industria Ventas de la Cia

Rentas de la Industria

1,000

,973

,973 . ,001 6

1,000 ,001 . 6

Rentas de la Industria 6 6 2 3. La tabla 3 muestra el Coeficiente de correlación y su cuadro. 𝑅 expresa la porción de varianza de la variable Dependiente, que esta explicada por la variable independiente.

En el ejemplo 𝑅 2. Toma un valor moderado(es máximo 1) y 𝑅 2, nos indica que es el 94.8% de la variación de la cantidad de Ventas de la compañía esta explicada por las Rentas de la industria 𝑹𝟐 Corregida es una corrección a la baja de 𝑅 2 que se basa en el número de casos y de variables independientes. El error típico de estimación es la desviación típica de los residuos, es decir la desviación típica de las distancias entre las puntuaciones en la variable independiente y los pronósticos efectuados con la regresión. En general cuanto mejor es el ajuste, más pequeño es este error típico. Tabla 4 Resumen ANOVA nos informa si existe o no relación entre las variables. El Tabla 3. Resumen del modelob Estadísticos de cambio R Error típ. R Cambio Sig. Modelo R cuadrado de la Cambio cuadrado en R gl1 gl2 Cambio corregida estimación en F cuadrado en F a 1 ,973 ,948 ,935 ,09933 ,948 72,347 1 4 ,001 a. Variables predictoras: (Constante), Rentas de la Industria b. Variable dependiente: Ventas de la Cia estadístico F permite contrastar la hipótesis nula de la pendiente de la recta de regresión es cero. En el ejemplo el valor P=0,001(p0.05) Lo cual prueba que 𝛽1 = 0 lo que indica que debemos aceptar Ho y rechazar 𝐻1 lo que nos lleva a concluir que no existe relación entre coeficiente de absorción relativa (Y) y la Temperatura C°(X). ANOVAa Modelo Regresión 1

Residual

Suma de cuadrados

gl

Media cuadrática

324,483

1

324,483

3622,374

5

724,475

F ,448

Sig. ,533b

Total 3946,857 6 a. Variable dependiente: coeficiente b. Variables predictoras: (Constante), temperatura 5. Ecuación de la regresión La tabla 05 Muestra los coeficientes de la recta de regresión. La columna denominada Coeficientes no estandarizados contiene los coeficientes de regresión que definen la ecuación de regresión en puntuaciones directas. El coeficiente Constante(es el origen de la recta 𝛽0 ) y el Coeficiente Rentas de Industria es dependiente de la recta de regresión (𝛽1 ).

Durbin Watson

2,531

Los coeficientes Beta (coeficientes de regresión estandarizados) son los coeficientes que definen la ecuación de regresión cuando esta se obtiene tras estandarizar las variables originales, es decir, tras convertir las puntuaciones directas en típicas. En el análisis de regresión lineal simple, el coeficiente de regresión estandarizado corresponde a la única variable independiente presente en la ecuación coincide exactamente con el coeficiente de correlación de Pearson. En el análisis de Regresión múltiple, los coeficientes de regresión estandarizados permiten valorar la importancia de cada variable independiente dentro de una ecuación.

Modelo

Coeficientes no estandarizados B

1

(Constante)

Error típ.

11,701

temperatura ,522 a. Variable dependiente: coeficiente

Coeficientesa Coeficientes tipificados

Sig.

Beta

23,472 ,779

t

,287

Intervalo de confianza de 95,0% para B

,498

,639

Límite inferior -48,637

,669

,533

-1,482

Límite superior 72,038 2,525

Con los resultados de la Tabla 05 construimos la ecuación de regresión: Ŷi = 11,701 + 0,522Xi Ventas de la Compañía = 11,701 + 0.522 Rentas de la Industria A cada valor de Coeficiente de absorción relativa le corresponde un pronóstico de Temperatura basado en la disminución constante de 11,701 más 0.522 veces del valor de la Temperatura C° DIAGRAMA DE DISPERCION

Cuando x=25

Ŷi = 11,701 + 0,522Xi Ŷi = 11,701 + 0,522(25) Ŷi = 24,751

Ŷi=22.75 Resultados de la investigación

Tabla 01 Resumen estadístico de valores promedio, desviación estándar, mínimo y máximo de Coeficientes de absorción relativa y temperatura C° Variables

Media

Coeficientes de absorción relativa 25,8571

temperatura C°

27,1429

Máxima

Mínima

Desviación estándar

CV%

46

5

25,64780

99,17

50

10

14,09998

51,94

Tabla 02 Matriz de Correlación de Coeficientes de absorción relativa y temperatura C° Coeficientes de absorción relativa

temperatura C°

Coeficientes de absorción relativa

1

0.287

temperatura C°

0.287

1

La correlación de variables de interés del estudio muestra una relación positiva o directa entre las Coeficientes de absorción relativa y temperatura C°

FIGURA 01 DIAGRAMA DE DISPERSIÓN CON LA LÍNEA DE REGRESIÓN. La relación existente entre las Coeficientes de absorción relativa y temperatura C° se ilustra en la FIGURA 01, a mayor Temperatura C° los Coeficientes de absorción relativa se ven aumentados Modelo de regresión:

Ŷi = 11,701 + 0,522Xi

El valor positivo de la pendiente (𝛽1 ). Nos indica que la relación es directa o positiva, es decir amayorTemperatura C (X)mayorCoeficientes de absorción relativa (Y). PROBLEMA N°8 Se desea purificar por destilación a presión reducida Salicilato de metilo a una presión de 15 mmHg considerando que la temperatura de ebullición es una función de la presión y a partir de los siguientes datos experimentales de presión y temperatura de Salicilato de metilo. P(MHG) - X 1 5 10 20 40 60 100 200 400 760

T(°C) - Y 54 81.6 95.3 110 126.2 136.7 150 172.6 197.5 223.2

Graficar un diagrama de dispersión.

Obtenga una ecuación que mejor describa la relación entre la temperatura y la presión y determine si el modelo hallado es válido.

Coeficientes no estandarizados

Modelo 1 (Constante)

B

Coeficientesa Coeficientes estandarizados

Error estánda r

Beta

t

-378,972 119,634 Presion en mHg

3,998

,833

95.0% intervalo de confianza para B

,862

Sig.

Límite inferior

3,16 ,013 8

-654,848

-103,096

4,80 ,001 2

2,078

5,918

a. Variable dependiente: Temperatura en °C

Ecuación de Regresión:

Límite superior

Ŷi = -378.972 + 3.998 Xi

Resumen del modelob Estadísticos de cambio Cambio R Error en R Mode R cuadrado estándar de cuadrad lo R cuadrado ajustado la estimación o a 1 ,862 ,742 ,710 131.68324 ,742 a. Predictores: (Constante), Presion en mHg b. Variable dependiente: Temperatura en °C

Cambio en F 23,061

gl1 1

Sig. Cambio en gl2 F 8 ,001

P=0,001 (p0.05). Por lo que debemos aceptar la Ho y rechazar 𝐻1 es decir 𝛽1 = 0 Conclusión El valor de F=416.925 tiene un valor de P=0, 990 (p>0.05) Lo cual prueba que 𝛽1 = 0 lo que indica que debemos aceptar

3,005

TABLA 04 ANOVAa Modelo

Suma de cuadrados Regresión

1

Media cuadrática

1269,054

1

1269,054

12,175

4

3,044

1281,230

5

Residual Total

df

F

Sig.

416,925

,000b

Ecuación de la regresión La tabla 05 Muestra los coeficientes de la recta de regresión. La columna denominada Coeficientes no estandarizados contiene los coeficientes de regresión que definen la ecuación de regresión en puntuaciones directas. El coeficiente Constante(es el origen de la recta 𝛽0 ) y el Coeficiente Rentas de Industria es dependiente de la recta de regresión (𝛽1 ). Los coeficientes Beta (coeficientes de regresión estandarizados) son los coeficientes que definen la ecuación de regresión cuando esta se obtiene tras estandarizar las variables originales, es decir, tras convertir las puntuaciones directas en típicas. En el análisis de regresión lineal simple, el coeficiente de regresión estandarizado corresponde a la única variable independiente presente en la ecuación coincide exactamente con el coeficiente de correlación de Pearson. En el análisis de Regresión múltiple, los coeficientes de regresión estandarizados permiten valorar la importancia de cada variable independiente dentro de una ecuación.

Modelo

Tabla Nº 5 Coeficientesa Coeficientes no Coeficient estandarizados es tipificados B

1

(Constante) X ºC

Error típ.

5.822

1,263

,568

,028

t

Sig.

Beta

,995

Intervalo de confianza de 95,0% para B

-4,611

,010

Límite inferior 2.317

20,419

,000

,491

a. Variable dependiente: Ventas de la compañía Con los resultados de la Tabla 05 construimos la ecuación de regresión: Ŷi = 5,822+ 0,568 Xi

Gramos = 5,822 + 0,568 ºC A cada valor de los ºC le corresponde un pronóstico Gramos basado en la disminución constante de 5,822 más 0,568 veces del valor de los ºC.

Límite superior 9,328 ,645

PROBLEMA N°15 Ocho personas que han sido capacitadas en un nuevo programa, se escogen al azar, para utilizar adecuadamente dicho programa y dar respuesta a las consultas hechas (Y) por los usuarios de una empresa, después del nuero indicado de días de capacitación X, como se representan en el cuadro adjunto. Los datos parecen sugerir que la relación entre X e Y puede describirse en forma curvilínea. Nº DE CONSULTAS Y TIEMPO DE CAPACITACIÓN X

15 1

18 2

25 3

30 4

35 5

45 6

53 7

70 8

a) Graficar los datos en un diagrama de dispersión y señale el modelo probable de ajuste a los datos. b) Obtenga una ecuación (modelo matemático) que mejor relacione el número de consultas (Y) y el tiempo de capacitación(X). c) Estime el número de consultas de promedio e individual realizadas de usuarios con un tiempo de capacitación de 5,5 días. Solucion: La tabla 1 Muestra las medidas para las variables dependiente e independiente Estadísticos descriptivos Media Desviación típica Nº de consultas Tiempo de Capacitación

31,57 4,00

N

13,879 2,160

7 7

La Tabla 2 muestra la correlación entre las variables dependientes e independientes Nota: La correlación entre las mismas variables siempre es 1 Correlaciones Nº de consultas Correlación de Pearson Sig. (unilateral) N

Nº de consultas

Tiempo de Capacitacion

1,000

,989

Tiempo de Capacitacion Nº de consultas

,989 .

1,000 ,000

Tiempo de Capacitacion Nº de consultas

,000 7

. 7

Tiempo de Capacitacion

7

7

La tabla 3: Muestra el Coeficiente de correlación y su cuadro. 𝑅 2 expresa la porción de varianza de la variable Dependiente, que esta explicada por la variable independiente. En el ejemplo 𝑅 2.

Toma un valor moderado(es máximo 1) y 𝑅 2, nos indica que es el 97,9% de la variación de la cantidad de Nº de consultas esta explicada por las el Tiempo de capacitación. 𝑹𝟐 Corregida es una corrección a la baja de 𝑅 2 que se basa en el número de casos y de variables independientes. El error típico de estimación es la desviación típica de los residuos, es decir la desviación típica de las distancias entre las puntuaciones en la variable independiente y los pronósticos efectuados con la regresión. En general cuanto mejor es el ajuste, más pequeño es este error típico, en este caso es de 2, 197. Resumen del modelob Estadísticos de cambio R Error típ. cuadrad Cambio R de la DurbinSig. Modelo R o en R Cambio cuadrado estimació gl1 gl2 Cambio Watson corregid cuadrad en F n en F a o ,989 234,34 1 0,979 0,975 2,197 0,979 1 5 0 1,298 a 9 a. Variables predictoras: (Constante), Tiempo de Capacitación b. Variable dependiente: Nº de consultas Tabla 4: Nos informa si existe o no relación entre las variables. El estadístico F permite contrastar la hipótesis nula de la pendiente de la recta de regresión es cero. En el ejemplo el valor P=0,000(p