Regresion logaritmica

Regresion logaritmica Este modelo de regresión es una alternativa cuando el modelo lineal no logra un coeficiente de det

Views 146 Downloads 5 File size 150KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Regresion logaritmica Este modelo de regresión es una alternativa cuando el modelo lineal no logra un coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento que puede considerarse potencial o logarítmico. La forma más simple de tratar de establecer la tendencia es a través de un diagrama de dispersión o nube de puntos.

Este modelo también es conocido como potencial, Cobb-Douglas de primer grado o exponencial inverso.

Ecuación característica La función que define el modelo es la siguiente:

Yi=A*XBi* E Yi : Variable dependiente, iésima observación A, B: Parámetros de la ecuación, que generalmente son desconocidos E:Error asociado al modelo Xi :Valor de la í-esima observación de la variable independiente al sustituir los parámetros por estimadores, el modelo adopta la siguiente forma:

yi=a*xbi la ecuación se transforma aplicando logaritmos de ambos lados, con lo cual se convierte a una forma lineal:

Ln yi= Ln a +b*Ln xi

Tabla de datos Para el ajuste de un conjunto de datos al modelo geométrico de regresión, se construye la siguiente tabla de datos:

X

Y

Ln x

Ln y

(ln x)2

(ln y)2

Ln X*ln y

Σln x

Σln y

Σ(ln x)2

Σ(lny)2

ΣLnx*lny

Debido a las propiedades de los logaritmos, ningún valor de x ni de y puede ser negativo. En tal caso, lo que se hace es definir un valor de x o de y muy pequeño (Ej: 0.00000001)Se puede trabajar con logaritmos naturales o logaritmos base 10.

Estimadores del modelo los estimadores para el ajuste del modelo se calculan de la siguiente manera

B=

Fuente de Variación

Grados de libertad

Regresión

1

∑ lnx∗∑ ln y −

∑ lnx∗∑ ln y

n 2 2 ∑ (lnx ) (lnx ) − ∑ n

Suma de cuadrados

Cuadrado medio

F calculada

b* (ΣLnxlnyΣ(Lnx)*Σ(lny)/n)

S.C. Reg/1

C.M.Reg/C.M.Error

Error

n-2

S.C. Total- S.C. Regresión

S.C. Error/(n-2)

Total

n-1

Σ(lny)2-(Σlny)2 /n

n-1

Ln a=

∑ ln y−b∗∑ lnx n

Análisis de varianza para la regresión Con el objeto de determinar si el modelo explica o no el fenómeno en estudio, se realiza el análisis de varianza, que se calcula de la siguiente manera

F tabulada

Ho: El modelo no explica el fenómeno en estudio Ha: El modelo sí explica el fenómeno en estudio Para buscar en la tabla la F tabulada, se usan el el numerador los grados de libertad de regresión y en el denominador, de acuerdo al nivel de significancia escogido (los más usuales son al 5% y al 1%)Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso contrario se acepta

Grado de ajuste del modelo Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinación, de la siguiente manera

R2=

lny ∑ lnx∗lny−∑ lnx∗∑ ¿ n ¿ b∗¿ ¿

El valor de r2 tiene un rango entre 0 y 1. No puede obtenerse valores negativos.

Pruebas de Hipótesis para el modelo Para el coeficiente b Para probar la hipótesis de que el coeficiente b es igual a un valor b´, ser igual a cero, se procede de la siguiente manera: Se plantea la hipótesis Ho:b=b´ y la alternativa Ha: b≠ b´ Se calcula el estadístico :

T=

b−b ´ sb

Sb es conocido como el error standard de b y se calcula de la siguiente manera:

Sb=



cuadrado medio de error ∑ (lnx)2 2 (lnx) − ∑ n

El cuadrado medio del error se obtiene del anàlisis de varianza. Se busca en la tabla de t de student el valor tabulado para los siguientes datos: n-2 grados de libertad y un nivel α/2 Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, se acepta. Para el coeficiente a Se puede probar la hipótesis de que el coeficiente a es igual a un valor a´, para lo cual se sigue el siguiente procedimiento: Se define la hipótesis: Ho: a=a´ y la alternativa Ha: a≠a´ Se calcula el error standard para a con la siguiente fórmula:

∑ (lnx)2−

∑ (lnx)2

n ¿ n∗¿ Sb= cuadrado medio de error∗∑ (lnx)2 ¿ √¿ El cuadrado medio del error se obtiene del análisis de varianza Se calcula el estadístico de prueba:

T=

ln a−ln a ´ sa

Se obtiene en la tabla de t de student el estadístico comparador, con los siguientes datos: n-2 grados de libertad y nivel α/2 Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la hipótesis se acepta

Intervalos de confianza Para el coeficiente b El intervalo de confianza para el coeficiente b se calcula así:

IC:B ±T =



cuadrado medio de error∗∑ (lnx)

2

√∑

(lnx)2 ∑ (lnx) − 2

n

El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2

Para el coeficiente a El intervalo de confianza para el coeficiente a se calcula así:

(lnx)2 ∑ ∑ (lnx) − 2

Lna

n ¿ ± = n∗¿ cuadrado medio de error∗∑ (lnx)2 ¿ t∗√ ¿

El cuadrado medio del error se obtiene del análisis de varianza El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2

para la media de y Un intervalo de confianza para la respuesta media de y, dado x0 sería:

Ln

´y ± =



t∗ cuadrado medio de error



1 + n

( lnx 0−lnx m ) .2 2 2 ∑ (lnx) ∑ (lnx) − n

El cuadrado medio del error se obtiene del análisis de varianza.El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2 El valor de xm que aparece en la fórmula es el promedio de valores de los logaritmos de x

para la estimación de y El intervalo de confianza para la estimación de y, dado un valor de x 0 se obtiene de la siguiente manera:

Ln

´ˇy ± =



t∗ cuadrado medio de error



1 + n

2

( lnx 0−lnx m ) . 2 2 ∑ (lnx) ∑ (lnx) − n

El cuadrado medio del error se obtiene del análisis de varianza. El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2El valor de xm que aparece en la fórmula es el promedio de valores de x.

DIAGRAMA DE DISPERSION

El diagrama de dispersión muestra una tendencia logarítmica aunque hay incrementos fuertes de potencia , los niveles de ruido no crecen excesivamente.

Estimadores del modelo x 100 500 1000 5000 10000

y 60 80 90 99 120 SUMAS:

Ln x 4.6052 6.2146 6.9078 8.5172 9.2103 35.4551

Ln y 4.0943 4.3820 4.4998 4.5951 4.7875 22.3588

(ln x)2 21.2076 38.6214 47.7171 72.5426 84.8304 264.9190

(ln y)2 16.7637 19.2022 20.2483 21.1151 22.9201 100.2493

Lnx*Lny 18.8552 27.2326 31.0836 39.1375 44.0944 160.4033

B=

35.4551∗22.3588 5 2 (35.4551) 264.619− 5

160.4033−

22.3588−0.1374∗354551 5

=0.1374

=3.497

a=e3.497=33.0164 y=33.0164 Grado de ajuste del modelo 35.4551−22.3588 5 ¿ 0.1374∗¿ ¿

160.4033−

R2=

=0.9586

Se puede concluir que el grado de ajuste del modelo es alto, por lo que el modelo es confiable para hacer predicciones.

Análisis de varianza del modelo Suma de cuadrado de regresión

0.1374*(160.4033Suma de cuadrado total

35.4551−22.3599 5

)=0.255

1002493-

2

(22.3588) 5

=2661

Suma de cuadrados del error : 0.2661-0.255= 0.0111 Grados de libertad de regresion=1 Grados de libertad totales= 5-1=4 Grados de libertad del error=5-2=3 Cuadrado medio de regresión= 0.255/1=0.255 Cuadrado medio del error= 0.0111/3=0.0037 F Calculada=0.255/0.0037=68.91 F Tabulada (1,3,0.01)= 34.12

TABLA DE ANDEVA

Fuente de Variación Regresión Error Total

Grados de libertad 1 4 5

Suma de cuadrados 0.2550 0.0111 0.2661

Cuadrado medio 0.255 0.0037

F calculada

F tabulada

68.91

34.12*

Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo cual se concluye que el modelo sì explica el fenòmeno en estudio y que los resultados obtenidos no se deben a la casualidad. Què lectura en decibeles se obtiene al aplicar una potencia de 3,000 vatios? Para esto, simplemente se utiliza la ecuaciòn anteriormente encontrada por estimaciòn, sustituyendo el valor de x por 3,000

y= 33.164*(3000)0.1374=99.63 se puede aplicar la operaciòn equivalente por medio de los logaritmos de los estimadores:

Ln y= 3.497+0.1374*Ln(3,000)=4.59707 4.59707

Finalmente, y=e

=99.63

Pruebe la hipòtesis de que b=1 con un 99% de confianza Inicialmente se plantea Ho: b=1 y su alterna Ha: b≠1

error standard de b:

35.455 ¿ ¿ ¿2 ¿ Sb= =0.0165 ¿ 264919−¿ 0.0037 ¿ √¿ El valor de t de student de calcula de la siguiente manera: (el logaritmo de 1 es cero)

T=

1−1374 0.0655

=13.169

El valor de t se obtiene en la tabla de t de student, con 5-2=3 grados de libertad y (1-.99)/2=0.005 de α, siendo el valor igual a 5.841 Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el coeficiente b no es igual a 1.

Calcule intervalos de confianza al 95% para a y b El valor de t de student al 95% con 3 grados de libertad es= 3.182 Intervalo de confianza para b:

0.1374

±

3.182*

3.4551 ¿ ¿ ¿2 ¿ =0.1374 ± 0.5266 ¿ 264.919−¿ 0.0037 ¿ √¿

El intervalo final será entonces el siguiente: -0.3892< B< 0.664

intervalo de confianza para a:

3.497

±

3.182*

3.4551 ¿ ¿ ¿2 ¿ ¿ =3.497 ± 0.3833 264.919−¿ 5∗¿ 0.0037∗264.919 ¿ √¿

El intervalo final para el logaritmo de a sería: 3.1137< Ln A