Parcial1.docx

Universidad Nacional de Colombia Análisis de Regresión Carrera de Estadística Primer Parcial – Abril 16 de 2020 Nombre:_

Views 70 Downloads 0 File size 90KB

Report DMCA / Copyright

DOWNLOAD FILE

  • Author / Uploaded
  • juan
Citation preview

Universidad Nacional de Colombia Análisis de Regresión Carrera de Estadística Primer Parcial – Abril 16 de 2020 Nombre:_________________________________________________________________ Nota: _________/50 1.

Suponga Y N (Xβ , Σ ) con Σ=σ 2 [ ( 1−ρ ) I k + ρ J k ], 0 ≤ ρ≤ 1. Responda las siguientes preguntas:

1 k

1 k

a. Defina A1=I k − J k y A2= J k , muestre que A1 y A2 son idempotentes, A1 A 2=0 y

b. c. 2.

Σ={ ( 1−ρ ) A 1 +[1+(k−1) ρ] A 2 }σ 2 1 1 A 1 y B 2= 2 A 2. Muestre que q 1 y q 2 son Sea q i=Y t Bi Y , i = 1, 2, con B1= 2 σ [1+( k−1)ρ] σ ( 1−ρ ) independientes y se distribuyen como chi-cuadrados, y encuentre los parámetros de la distribución. Según los resultados anteriores cuál sería el modelo de regresión empleado en este problema. Basado en b., juzgue la hipótesis teniendo en cuenta ese modelo de regresión.

Suponga que se realizan n replicaciones en k diferentes valores de la variable predictora. Los datos son obtenidos en parejas

( y ij , x i ) xi .

, para

i=1,2,...,k

y

j=1,2,...,n

. Sea

¯yi⋅¿ ¿ que denota la media de

las observaciones en a. Demuestre que los coeficientes de regresión estimados en los siguientes modelos son

idénticos: b. c. d.

y ij =β 0 + β 1 x i+ eij y ´y i ∙ =γ 0+ γ 1 x i+ d i Para cada modelo presentado en a) escriba E ( Y )= Xβ , especificando X y β . Compare la suma de cuadrados de los residuales en los dos modelos dados en a). Obtenga la varianza del valor estimado de la media de y i para un nuevo valor x i, denotado por x ¿.

3. En un modelo sin intercepto, suponga que: σ^ 2=120, ^β=(2 81)t , Var ( ^β 1 )=21 , Var ( ^β 2 )=15 , Var ( ^β 3 )=25,

Cov ( ^β1 , ^β2 ) =−24 , Cov ( ^β1 , ^β3 ) =12 y Cov ( ^β1 , β^ 2 ) =−16 . a. Estime el vector de parámetros de β bajo la restricción β 1−2=β 2 +3=β 3+5 . b. Muestre que el estimador encontrado en a. es insesgado y obtenga su varianza. Interprete este resultado. c. Pruebe la hipótesis β 1−2=β 2 +3=β 3+5 , utilizando n=55 y un nivel de significancia del 5%. d. Obtenga una región de confianza del 95% para la hipótesis planteada en a., realice el gráfico en tres dimensiones. 4.

Se utiliza un modelo de regresión múltiple para relacionar viscosidad ( y ) de un producto químico con: temperatura ( x 1) y tiempo de reacción ( x 2 ¿ . El modelo inicial ajustado fue:

y i=250+1.85 x i 1+ 10.4 xi 2 , i=1,2, … , 20 SCRes=123.3 , SCT cm=1283.1 , σ^ ^β =0.23 y σ^ ^β =1.82 1

a. b.

2

Construya la tabla de análisis de varianza para el modelo de regresión lineal. ¿El modelo global es estadísticamente útil para predecir la viscosidad del producto químico? ¿Qué proporción de la variabilidad total en la viscosidad está explicada por las variables explicativas?

c. d. e.

5.

Pruebe la hipótesis de que existe relación entre cada variable explicativa y la viscosidad y obtenga un intervalo de confianza del 95% para cada parámetro, interprete los resultados. Calcule una estimación de la viscosidad promedio estimada cuando x 1=110 ° F y x 2=2.5 hr . Obtenga e interprete un intervalo de confianza del 95% para la predicción obtenida. Suponga que se añade otra variable de regresión al modelo, velocidad de agitación ( x 3). El nuevo valor de la suma de cuadrados del residuo es SCRes=105.1. Calcule un estadístico F para evaluar la contribución al modelo de esta nueva variable a un nivel de significancia del 5%, ¿a qué conclusiones puede llegarse?

Una persona tiene una parrilla caliente y un panecillo de hamburguesa vacío, pero ha jurado dejar las hamburguesas grasientas. ¿Es buena una hamburguesa sin carne? Los datos de la tabla siguiente dan puntuación de sabor y textura (entre 0 y 100) para 12 marcas de hamburguesas sin carne junto con el precio, número de calorías, cantidad de grasa y una cantidad de sodio por hamburguesa. Algunas de estas marcas tratan de imitar el sabor de la carne, no así otras. Se desea realizar una regresión de la puntuación de sabor y en las cuatro variables predictoras: precio, calorías, grasa y sodio. Los datos obtenidos son los siguientes: Marca 1 2 3 4 5 6 7 8 9 10 11 12

Puntos 70 45 43 41 39 30 68 56 40 34 30 26

Precio 91 68 92 75 88 67 73 92 71 67 92 95

Calorías 110 90 80 120 90 140 120 170 130 110 100 130

Grasa 4 0 1 5 0 4 4 6 4 2 1 2

Sodio 310 420 280 370 410 440 440 520 180 180 330 340

a. Plante el modelo de regresión múltiple y juzgue la hipótesis global de relación de las variables explicativas con la variable respuesta. b. Estime los parámetros del modelo de regresión lineal múltiple planteado en a. e interprete la relación de cada uno de los parámetros del modelo en términos del problema. c. Calcule e interprete el coeficiente de determinación apropiado. d. Juzgue la hipótesis de que cada una de las variables explicativas está relacionada con la variable puntuación de sabor utilizando el modelo planteado en a. e. Si desea reajustar el modelo al eliminar una de las variables independientes, ¿cuál eliminaría? ¿Por qué?