Se tienen los datos de las horas estudiadas para la materia de matemáticas (x) en una semana y las calificaciones obteni
Views 128 Downloads 0 File size 209KB
Se tienen los datos de las horas estudiadas para la materia de matemáticas (x) en una semana y las calificaciones obtenidas en el examen final de un grupo de estudiantes (y) Horas Calificaciones ∑ de Estudio
Residuos
∑
X
Y
xi*yi
xi2
18
10
180
324
∑
Ajustado y
yi2
∑(
∑(
)
)
(xi-x)2
(yi-y)2
75.69 11.6281
9
117
169
15
8
120
225
8.39026275
e2
0.82305025
0.67741171
81
13.69 5.8081 0.60973725
0.37177951
64
32.49 1.9881
100 10.82305025
13
E=y-Y
9.36337775
1.36337775
1.85879889
10
9.5
95
100
6.93059025
90.25
0.49
8.4681 2.56940975
6.60186646
12
8.4
100.8
144
7.90370525
70.56
7.29
3.2761 0.49629475
0.24630848
4
5
20
16
4.01124525
25
28.09 2.5281 0.98875475
0.97763596
7
6
42
49
5.47091775
36
5.29
0.27992803
3
2
6
9
4
39.69 21.0681
0.3481 0.52908225 1.52468775
2.32467274
1.49780275
2.24341308
10.89 2.5281 0.01563975
0.0002446
3.52468775
5
3
15
25
18.49 12.8881
9 4.49780275
6
5
30
36
9.3
6.59
725.8
1,097
4.98436025
25
504.81 232.1 70.529
M
x
y
4.82 2.66 ̅
9.30 6.59
I.C. 2.99 1.65
a) Construye un diagrama de dispersión para estos datos ¿Parece que será adecuado un modelo de línea
recta? Se observa que los datos aparentemente siguen un comportamiento lineal por lo que se procede a ajustar un modelo de regresión lineal simple por mínimos cuadrados. 12 y = 0.4866x + 2.065 R² = 0.7791
Calificaciones
10 8 6
Y Linear (Y)
4 2 0 0
5
10 Horas de Estudio
15
20
b) Ajusta una recta de regresión lineal simple mediante mínimos cuadrados
∑
∑ ̅
∑
̂
̅
(
̅
∑
) (
( (
̂
(
) )
̂ ̂
( ̂
̂
̂
̅
̅
̂
̂
( (
El ajuste por mínimos cuadrados es: ̂
) ) )
)
La pendiente es positiva lo que nos indica que las horas de estudio impactan de manera positiva a las calificaciones de los estudiantes y por cada unidad de tiempo en horas de estudio las calificaciones crecen en 0.48866 La siguiente figura muestra la gráfica de dispersión junto con la recta de regresión ajustada por mínimos cuadrados. 12 y = 0.4866x + 2.065 R² = 0.7791
Calificaciones
10 8 6
Y Linear (Y)
4 2 0 0
5
10 Horas de Estudio
15
20
c) Construye intervalos del 95% de confianza Utilizando un intervalo de confianza del 95%, tenemos que el nivel de significancia es 0.05 y el número de datos es de 10. Calculamos la desviación estándar de cada conjunto de datos, y obtenemos los siguientes valores:
∑(
̅
∑(
∑
(
̅)
)
̂)
Para el intervalo de confianza de
(̂
√
̅
[
tenemos:
]
√
(
̂
√
[
]
[
√ (
[
])
)
Para el intervalo de confianza de (̂
tenemos: ̂
√
√
√ (
( (
)
)
Para el intervalo de confianza de (
)
√
(
(
(
)
tenemos: (
)
)
) (
)
)
̅
)
])
d) Calcula el estadístico para probar hipótesis pueden sacar acerca del papel de la variable x?
¿Qué conclusiones se
Hipótesis:
Estadístico de prueba ̂ √
̅
[
Como | | parámetro
[
]
, o sea
] , no se rechaza
por lo que el
no es significativo para el modelo y podríamos omitirlo
con
Estadístico de prueba ̂ √
√
Como | |
, o sea
, no se rechaza
por lo que existe
correlación entre x e y.
a) Forma la tabla de análisis de varianza y prueba el significado de la regresión al nivel a=0.05% TABLA DE ANÁLISIS DE VARIANZA Fuentes de variación Regresión
Suma de Cuadrados SSR
1
Cuadrado medio MSR
Error
SSE
n-2
MSE
Total
SST
n-1
Suma de cuadrados total:
Grados de libertad
F0 MSR/MSE
∑(
̅)
Suma de cuadrados de la regresión: ∑( ̂
̅)
Suma de cuadrados del error: ∑(
̂)
TABLA DE ANÁLISIS DE VARIANZA Fuentes de variación Regresión
Suma de Cuadrados 54.9469
Grados de libertad 1
Cuadrado medio 54.9469
Error
15.582
8
1.94775
Total
70.529
9
F0 28.21044795
Hipótesis
, o sea lo tanto existe evidencia estadística para suponer que
rechazamos la
, por