Manual SAS-Ramiro Ochoa

UNIVERSIDAD CATÓLICA BOLIVIANA “SAN PABLO” UNIDAD ACADÉMICA CAMPESINA – CARMEN PAMPA INTRODUCCIÓN AL MANEJO DEL SAS (SI

Views 229 Downloads 7 File size 862KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD CATÓLICA BOLIVIANA “SAN PABLO” UNIDAD ACADÉMICA CAMPESINA – CARMEN PAMPA

INTRODUCCIÓN AL MANEJO DEL SAS (SISTEMA DE ANÁLISIS ESTADÍSTICO)

ING. RAMIRO RAÚL OCHOA TORREZ

LA PAZ – BOLIVIA 2013

INTRODUCCION AL MANEJO DEL SAS

Introducción al manejo del SAS (Sistema de Análisis Estadístico)

Ramiro Raúl OCHOA TORREZ

 Ramiro Raúl OCHOA TORREZ Celular 71980140 E – mail: [email protected] La Paz - Bolivia

ii

Ing. Ramiro Raúl OCHOA TORREZ

CONTENIDO

CONTENIDO 1. 

INTRODUCCIÓN ........................................................................................................................... 1  1.1.  Introducción ........................................................................................................................... 1  1.2.  Comenzando con el SAS .......................................................................................................... 1  1.2.  Menú y herramientas ............................................................................................................... 2  1.2.1.  Menús ........................................................................................................................... 2  1.2.2.  Iconos del menú .............................................................................................................. 7  1.3.  Ventanas del SAS ................................................................................................................... 8  2.  PROGRAMACIÓN EN EL SAS ......................................................................................................... 9  2.1.  Introducción ........................................................................................................................... 9  2.2.  Programa .............................................................................................................................. 9  2.3.  Estructura de un programa SAS................................................................................................. 9  2.3.1.  Sentencia DATA .............................................................................................................. 9  2.3.1.1.  Formas de asignar el nombre ......................................................................................... 9  2.3.1.2.  Opciones asociados a la sentencia DATA ....................................................................... 10  2.3.2.  Sentencia input ............................................................................................................. 10  2.3.2.1.  Tipos de variables ......................................................................................................... 10  2.3.2.2.  Formas del INPUT ......................................................................................................... 11  2.3.2.3.  Tipos de variables ...................................................................................................... 12  2.3.3.  Sentencia CARDS ......................................................................................................... 12  2.3.4.  Sentencia PROC ........................................................................................................... 12  2.3.4.1.  Proc ANOVA ............................................................................................................. 12  2.3.4.2.  Proc CHART ............................................................................................................. 13  2.3.4.3.  Proc CORR .............................................................................................................. 13  2.3.4.4.  Proc FREQ ............................................................................................................... 13  2.3.4.5.  Proc GLM ................................................................................................................. 14  2.3.4.6.  Proc REG ................................................................................................................ 14  2.3.4.7.  Proc LATTICE ........................................................................................................... 15  2.3.4.8.  Proc MEANS............................................................................................................. 15  2.3.4.9.  Proc PLOT ............................................................................................................... 15  2.3.4.10.  Proc PRINT .......................................................................................................... 15  2.3.4.11.  Proc PRINCOMP ................................................................................................... 16  2.3.4.12.  Proc SORT ........................................................................................................... 16  2.3.4.13.  Proc TTEST .......................................................................................................... 16  2.3.4.14.  Proc UNIVARIATE ................................................................................................. 16  2.4.  Interpretación de resultados .................................................................................................... 17  3.  ESTADÍSTICA BÁSICA ................................................................................................................. 18  3.1.  Estadísticos básicos .............................................................................................................. 18  3.2.  Distribución de frecuencias ..................................................................................................... 19  4.  SUPUESTOS DEL ANÁLISIS DE VARIANZA .................................................................................... 22  4.1.  Normalidad .......................................................................................................................... 22  4.2.  Homogeneidad de varianzas ................................................................................................... 26  5.  DISEÑO COMPLETAMENTE AL AZAR (DCA)................................................................................... 31  5.1.  DCA con igual número de repeticiones ...................................................................................... 31  5.2.  DCA con diferente número de repeticiones ................................................................................ 37  5.3.  DCA con muestreo ................................................................................................................ 44  6.  DISEÑO BLOQUE AL AZAR (DBA) ................................................................................................. 52  6.1.  DBA con igual número de repeticiones ...................................................................................... 52  6.2.  DBA con muestreo ................................................................................................................ 56  7.  DISEÑO CUADRADO LATINO (DCL) .............................................................................................. 64  7.1.  DCL con igual número de repeticiones ...................................................................................... 64  Ing. Ramiro Raúl OCHOA TORREZ

i

INTRODUCCION AL MANEJO DEL SAS

8. 

COMPARACIONES ORTOGONALES .............................................................................................. 72  8.1.  Comparaciones ortogonales de experimentos simples.................................................................. 72  9.  EXPERIMENTOS FACTORIALES ................................................................................................... 76  9.1.  DCA con arreglo factorial ........................................................................................................ 76  9.1.1. DCA con arreglo factorial – dos factores ................................................................................... 76  9.1.2.  DCA con arreglo factorial – tres factores ............................................................................ 84  9.2.  DBA con arreglo factorial ........................................................................................................ 92  9.2.1.  DBA con arreglo factorial – dos factores ............................................................................. 92  9.2.2.  DBA con arreglo factorial – tres factores............................................................................. 95  9.3.  DCL con arreglo factorial ........................................................................................................ 99  9.3.1.  DCL con arreglo factorial – dos factores ............................................................................. 99  10.  PARCELAS DIVIDIDAS ........................................................................................................... 103  10.1.  DCA con arreglo en parcelas divididas .................................................................................... 103  10.2.  DBA con arreglo en parcelas divididas .................................................................................... 107  10.3.  DCL con arreglo en parcelas divididas .................................................................................... 111  11.  PARCELAS SUBDIVIDIDAS ..................................................................................................... 117  11.1.  DBA con arreglo en parcelas subdivididas ............................................................................... 117  12.  ARREGLO EN FRANJAS......................................................................................................... 122  12.1.  Arreglo en franjas ............................................................................................................... 122  13.  DISEÑOS JERÁRQUICOS O ANIDADOS ................................................................................... 126  13.1.  Jerarquicos o anidados ........................................................................................................ 126  14.  EXPERIMENTOS EN SERIE O REPETIDOS ............................................................................... 131  14.1.  Serie de experimentos ......................................................................................................... 131  15.  BIBLIOGRAFIA ...................................................................................................................... 135 

ii

Ing. Ramiro Raúl OCHOA TORREZ

INTRODUCCION

1. INTRODUCCIÓN 1.1.

Introducción

El sistema SAS (Statistical Analisys System) es un software que abarca múltiples campos de trabajo, entre los más destacados se tiene:         

Entrada, recuperación y manejo de datos simples y mediante programación. Gráficos. Análisis estadístico y matemático. Investigación operativa y gestión de proyectos. Control de calidad. Diseño de experimentos. Desarrollo de aplicaciones Planificación de negocios, predicción y soporte a la decisión. Gestión financiera.

El sistema SAS consta de una serie de módulos, cada uno de ellos orientado a una tarea especifica. El estudio del SAS comienza básicamente por aprender el manejo de un lenguaje de programación para manejar los datos, procedimientos sencillos para el análisis de datos. 1.2.

Comenzando con el SAS

Para empezar a trabajar con el programa, basta con elegir de la opción programas del menú inicio de Windows y seleccionar la opción The SAS System en programas, seguidamente seleccionamos The SAS System For Windows V8, dependiendo de la versión del programa SAS, puede ser versión 6.11, versión 6.12, versión 8.0, versión 8.0 e, versión 9.0, se obtiene la pantalla temporal, con información de la versión.

La pantalla del entorno SAS, la que nos permitirá a trabajar con el SAS.

Ing. Ramiro Raúl OCHOA TORREZ

1

INTRODUCCION AL MANEJO DEL SAS

1.2.

Menú y herramientas

En la línea superior de la pantalla vemos el icono de SAS. En la línea siguiente se presenta la Barra de menú, que contiene el menú general de SAS con todas sus opciones (File, Edit, View, Tools, Run, Solutions, Windows y Help). La tercera línea presenta la Barra de herramientas, cuyo contenido son diferentes iconos que permiten acceder rápidamente a tareas más comunes en el trabajo con la aplicación sin necesidad de acudir al menú general.

1.2.1.

Menús

A continuación se explica la finalidad de las distintas opciones que aparecen en la barra de menú del programa, presentando diversos tipos de menús desplegables, facilitando la tarea con el programa: 

File. Si nos situamos en el menú File, de la barra del menú principal, se presentan las siguientes opciones:

2

Ing. Ramiro Raúl OCHOA TORREZ

INTRODUCCION

Definiendo cada una, tendremos:                  

New, abre un archivo vació para editar una nueva sintaxis. Open, abre archivos ya existentes. Close, cierra el archivo actual. Append, añadir un archivo existente al contenido actual del editor. Open Object, abre un objeto seleccionando en el explorador. Save, guarda el archivo actual. Save as, guarda el archivo actual con otro nombre o tipo. Save as Object, guarda el archivo actual con otro nombre o tipo de objeto. Import Data, nos permite importar Datos ASCII, para el editor Export Data, permite exportar Datos del editor a ASCII. Page Setup, nos permite configurar la página. Print Setup, configuración de la impresión. Print Preview, vista previa de la ventana actual. Print, imprime el contenido del editor. Send Mail, envía por correo electrónico el contenido del editor. Datos usados recientemente, muestra los archivos editados recientemente. Exit, sale del SAS Edit. desglosando este menú tendremos:

Ing. Ramiro Raúl OCHOA TORREZ

3

INTRODUCCION AL MANEJO DEL SAS

Definiendo cada una, tendremos:            

Undo, deshace la última acción. Redo, rehace la última acción desecha. Cut, corta la selección para almacenar en el portapapeles. Copy, copia la selección para almacenar en el portapapeles. Paste, pega el contenido del portapapeles en la ubicación actual del cursor. Clear, borra la selección. Clear All, borra todo el contenido. Select All, selecciona todo el contenido Collapse All, compacta todo el contenido. Expand All, expande todo el contenido. Find, busca los datos que se especifiquen. Replace, remplazar un contenido por otro. View. Desglosando su opciones tenemos:



Definiendo tenemos:     

Enhanced Editor, editor avanzado. Program Editor, editor de programas. Log, nos presenta la ventana Log. Output, ventana de salida. Graph, ventana de gráficos. 4

Ing. Ramiro Raúl OCHOA TORREZ

INTRODUCCION

   

Results, ventana de resultados. Explorer, ventana del explorador. Contents Only, nos presenta los contenidos del SAS. My Favorite Folders, nos permite realizar una exploración en búsqueda de nuestros archivos. Tools. Desglosando su opciones tenemos:



       

Query, realiza preguntas SQL con los ficheros de Datos especificados. Table Editor, edita ficheros de Datos nuevos o ya existentes mediante filas y columnas. Graphics Editor, edita gráficos. Report Editor, genera informes con las variables de los conjuntos de Datos. Image Editor, abre el editor de imágenes. Text Editor, abre el editor de texto. Customize, configura menús y barras de herramientas. Options, configura opciones del sistema, del editor, etc. Run. Desglosando el menú tenemos:



Donde tenemos:        

Submit, ejecuta el programa escrito en el editor. Recall Last Submit, recupera el texto del último programa ejecutado. Signon. Remote Submit, ejecución remota de programa. Remote Get, búsqueda de remoto. Remote Display, despliegue remoto. Signoff Solutions, desglosando sus opciones tenemos:

Ing. Ramiro Raúl OCHOA TORREZ

5

INTRODUCCION AL MANEJO DEL SAS

Donde tenemos:       

Analysis, despliega todas las materias que se pueden trabajar en el SAS. Development and programming, trabajo en desarrollo y programación. Reporting, trabajo en informes. Accessories, accesorios gráficos de edición, juegos, etc. ASSIST, nos presenta el asistente del SAS. Desktop, nos presenta el escritorio del SAS. EIS / OLAP Aplication Builder, trabajo en aplicaciones OLAP. Windows. Sus opciones son:



Nos presenta: Minimize all windows, minimiza todas las ventanas abiertas. Cascade, presenta las ventanas como cascada. Tile vertically, presenta todas las ventanas abiertas en el monitor en forma vertical. Tile horizontally, presenta todas las ventanas abiertas en el monitor en forma horizontal. Resize, nos presenta la ventana de resultados Output.  Docked.  Las siguientes opciones, nos sirve para seleccionar a las diferentes ventanas: Editor, Log, Result, Outup y Explorer.    



Help. Sus opciones son:

6

Ing. Ramiro Raúl OCHOA TORREZ

INTRODUCCION

Definiendo tenemos:       1.2.2.

SAS System help, nos presenta los temas de ayuda del SAS. Using This Windows, referencias del uso de las ventanas. Books and Training, referencias para la práctica del SAS. Getting Started whit SAS Software, guía del manejo del SAS. SAS on the Web, ayuda del SAS en la Web. About SAS System, nos presenta las referencias del el SAS y el equipo. Iconos del menú

Los iconos que nos presenta el menú principal son:

Por orden de colocación se izquierda a derecha, los iconos de la barra de herramientas significan lo siguientes: Introducción de comandos Nuevo archivo, también Empleado para borrar el contenido de una ventana Abrir archivo Guardar archivo Imprimir archivo Vista preliminar Cortar Copiar Pegar Deshacer Nueva librería Explorador del SAS Ejecución del programa Borrar todo Interrupción Ayuda del SAS

Ing. Ramiro Raúl OCHOA TORREZ

7

INTRODUCCION AL MANEJO DEL SAS

1.3.

Ventanas del SAS

El modo de trabajo del SAS es el empleo de una serie de ventanas (la presentación siguiente fue realizada con la opción Tile vertically de Windows, del menú del SAS):

Las cuales las principales son:  PROGRAM EDITOR. Se utiliza para escribir programas, esta ventana corresponde a la ventana de sintaxis, por lo tanto es editable.  LOG. Se utiliza para hacer un seguimiento de la ejecución. En esta ventana se consulta y revisa todo lo que se ha ejecutado, aparecen mensajes de advertencia y de error en caso necesario y se informa sobre la velocidad de ejecución y recursos.  OUTPUT. Para presentar la salida textual y numérica. Cuando se ejecutan procedimientos de SAS, en esta ventana se muestran los listados, tablas y/o resultados.  GRAPH. Para representar la salida de graficas.  EXPLORER. Nos presenta el explorador del SAS en la parte izquierda, similar este al explorador de Windows, principalmente cuando se hace correr los datos.

8

Ing. Ramiro Raúl OCHOA TORREZ

PROGRAMACIÓN EN EL SAS

2. PROGRAMACIÓN EN EL SAS 2.1.

Introducción

Para utilizar de una forma optima la extraordinaria flexibilidad y potencia del SAS es necesario trabajar con los procedimientos SAS, lo que exige un mínimo de conocimiento básico del lenguaje de programación SAS y en concreto de la estructura de cada uno de los procedimientos que se ilustrara con ejemplos. 2.2.

Programa

Un programa en el SAS es una serie de sentencias y procedimientos colocadas en orden definido, bajo un lenguaje o sintaxis determinada, con el cual se puede ejecutar una determinada tarea. 2.3.

Estructura de un programa SAS

Se debe tomar en cuenta las siguientes reglas para escribir enunciados: Los enunciados o sentencias SAS pueden comenzar o terminar en cualquier posición de la línea. Los enunciados SAS terminan con un punto y coma (;) al final de la sentencia. Pueden aparecer más de un enunciado SAS en la misma línea. Los enunciados SAS pueden empezar en una línea y terminar en otra. Los elementos de una sentencia SAS deben separarse de los elementos vecinos por uno o más espacios en blanco.  Si los elementos de un enunciado SAS están conectados por caracteres especiales, los espacios en blanco son innecesarios. Por ejemplo, en el enunciado X=Y, los espacios en blanco son innecesarios, puesto que el signo igual es un carácter especial.     

2.3.1.

Sentencia DATA

Las sentencias de tipo DATA permiten crear un archivo de datos SAS, siendo un grupo de instrucciones generalmente ubicada al inicio de cada trabajo, la instrucción DATA consiste de la palabra clave DATA que señala el comienzo del paso DATA, seguido de un nombre que identifique al archivo SAS. 2.3.1.1.

Formas de asignar el nombre

Existen diferentes formas de asignar el nombre a la sentencia DATA, el nombre puede consistir de:  NOMBRE DE UNA SOLA PALABRA. Se le asigna un solo nombre, una palabra de máximo 8 caracteres (de preferencia se maneja solo siete caracteres), para crear un archivo temporáneo, que desaparecerá en el momento de terminar la sesión SAS, por ejemplo: DATA var; DATA altura; DATA peso_1;

(se crea un archivo temporario llamado var) (se crea un archivo temporario llamado altura) (se crea un archivo temporario llamado peso_1)

 DOS NOMBRES SEPARADOS POR UN PUNTO. Se puede crear un archivo de datos en forma permanente asignando a la sentencia DATA dos nombres separados por un punto, la primera palabra corresponde al nombre de la LIBRERÍA SAS en el cual reside el archivo de datos SAS cuyo nombre es la palabra que sigue al punto. La librería SAS se puede crear mediante la sentencia LIBNAME, por ejemplo:

Ing. Ramiro Raúl OCHOA TORREZ

9

INTRODUCCION AL MANEJO DEL SAS

DATA millb.var;

(se crea un archivo permanente llamado var, que se almacena en la librería SAS denominado millb)

 MÁS DE UN NOMBRE. Se puede crear cualquier número de datos SAS con una sola sentencia DATA, esto se puede hacer asignando un nombre para cada uno de los archivos con la instrucción DATA, por ejemplo: DATA var1 var2; 2.3.1.2.

(esta instrucción me indica que se crea dos archivos de datos SAS con los nombres var1 y var2)

Opciones asociados a la sentencia DATA

Algunas sentencias del formato de salida de los resultados, se pueden indicar mediante la sentencia OPTIONS, seguida de los comandos deseados:  LINESIZE (LS). Indica el número de columnas por pagina (ancho): OPTIONS LS=76; OPTIONS LS=47;  PAGESIZE (PS). Indica el número de líneas por pagina (alto de pagina): OPTIONS PS=54; OPTIONS PS=24;  NODATE. No incluirá la fecha a la salida de los resultados: OPTIONS LS=76 PS=56 NODATE;  NONUMBER. No incluirá el número de pagina a la salida de los resultados: OPTIONS LS=76 PS=56 NODATE NONUMBER; 2.3.2.

Sentencia input

La instrucción INPUT, describe al SAS el arreglo de las líneas de datos, indicando la forma en la que se introduce los datos a la computadora y los tipos de datos. Describiendo al SAS el arreglo de las líneas de datos, SAS emplea la información que encuentra en estas líneas para producir las observaciones de un conjunto de datos, teniendo las siguientes características:   

La instrucción INPUT lee las líneas de datos. Asigna nombres a las variables SAS que corresponden a los campos de datos Indica si una variable es numérica o de caracteres (alfanuméricos). Para esto se hace uso del signo $ para indicar si una variable es alfanumérica

2.3.2.1.

Tipos de variables

En el SAS se distinguen dos tipos de variables:  NUMÉRICAS. Cuando los valores que toma la variable son numéricas: 154 256 12 10

Ing. Ramiro Raúl OCHOA TORREZ

PROGRAMACIÓN EN EL SAS

144 0.2  ALFANUMÉRICAS. Cuando los valores que toman las variables contienen al menos un carácter alfabético: a, b, c, etc.: Local Var1 Var2 IBTA_80 2.3.2.2.

Formas del INPUT

El INPUT tiene dos formas:  FORMA DE COLUMNA. Se especifica donde encontrar las variables en el registro de entrada por medio de la posición de la columna: DATA ejemplo; INPUT nombre $ 1-8 sexo $ 11 edad 13–14;

(indica que se han creado las variables alfanuméricas nombre que ocupa las columnas 1 a 8, la variable alfanumérica sexo que ocupa la columna 11 y la variable numérica edad que ocupa las columnas 13 a 14)

Sus restricciones son: 

Las posiciones para las variables son fijas.

 FORMA DE LISTA. Se listan las variables en el orden en el cual aparecen en el registro de entradas, por ejemplo: DATA ejemplo; INPUT bloque tratam rend;

(indica que se han creado las variables bloque, tratam y rend)

Cuando el SAS lea los datos el valor entre un espacio y otro corresponde a una variable diferente. Bloque tratam rend 1 1 125 1 2 258 1 3 254 Sus restricciones son:    

Las variables deben estar en el orden especificado. Los campos deben estar separados por uno o más espacios blancos. En los valores para las variables alfanuméricas, no se permiten espacios en blanco intermedios, la longitud máxima es de 8 caracteres. Los campos en blanco causan que los nombres de las variables y sus valores se desfasen. Hay que indicar un valor faltante por un punto (.).

 FORMA DE LINEAS. Para leer un conjunto de datos con más de una observación por línea, se usa el puntero de dirección @@, por ejemplo: Ing. Ramiro Raúl OCHOA TORREZ

11

INTRODUCCION AL MANEJO DEL SAS

INPUT bloque trat rend @@; 1 1 548 1 2 478 1 3 789 2.3.2.3.

2 2 2

1 2 3

874 741 598

Tipos de variables

Existen dos tipos principales de variables que se emplean con la instrucción INPUT:  VARIABLES ESTUDIO. Son denominada así, porque ayudan a identificar a los valores que se introducen, como ser:  Factores de estudio (variedades, densidades, raciones, etc.).  Tratamientos.  Variables independientes.  VARIABLES DE RESPUESTA. Son todas las variables que representan a las mediciones efectuadas del material de estudio, como ser:      2.3.3.

Altura. Peso. Rendimiento. Largo. Variables dependientes.

Sentencia CARDS

Cuando los datos forman parte del programa, se hace uso de la sentencia CARDS, la cual le indica al SAS que las líneas que siguen a continuación son los datos de las diferentes variables sean estas variables de estudio y/o variables de respuesta. Esta sentencia viene después de la sentencias INPUT, por ejemplo: DATA ejemplo; INPUT bloque trat rend @@; CARDS; 1 1 548 1 2 478 1 3 789 2.3.4.

2 2 2

1 2 3

874 741 598

Sentencia PROC

Las sentencias PROC se ejecutan después de INPUT, transformación de datos, CARDS y/o después de los datos, cuando los datos forman parte del programa. Para mostrar que las sentencias introducidas son programas y hay que ejecutarlos, al final de todas las sentencias se coloca la sentencia RUN. Lo que nos permitirá ejecutar la sentencia PROC. Algunas de las sentencias usuales son: 2.3.4.1.

Proc ANOVA

Es uno de los procedimientos más empleados en el análisis de los diseños experimentales, realizando el análisis de la varianza de datos balanceados, que tienen la misma cantidad de datos y repeticiones. Siendo su enunciado:

12

Ing. Ramiro Raúl OCHOA TORREZ

PROGRAMACIÓN EN EL SAS

PROC ANOVA; CLASS TRAT BLOQ; MODEL REND=TRAT BLOQ; RUN; (1) (2) (3) (4) 2.3.4.2.

(1)1 (2) (3) (4)

Nos indica que el PROC (procedimiento) a emplear es ANOVA (análisis de varianza). El comando CLASS señala las variables a estudiar en este caso TRAT (tratamiento) y BLOQ (bloques). El comando MODEL nos señala el modelo a emplear en el análisis de varianza, señalando en la primera parte la variable de respuesta REND (rendimiento) y en la segunda parte las variables en estudio TRAT BLOQ (tratamientos y bloques). El comando RUN, señala la ejecución del procedimiento antes señalado. Proc CHART

Se emplea para la obtención de un diagrama de barras. Siendo su instrucción: PROC CHART; HBAR SEXO; RUN; (1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es CHART (diagrama de barras). El comando HBAR, se emplea para la realización de barras horizontales de la variable SEXO. RUN, ejecuta el procedimiento. PROC CHART; VBAR SEXO; RUN;

(1) (2) (3) 2.3.4.3.

(1) (2) (3)

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es CHART (diagrama de barras). El comando VBAR, se emplea para la realización de barras verticales de la variable SEXO. RUN, ejecuta el procedimiento. Proc CORR

Realiza el análisis de correlación, obteniéndose el coeficiente de correlación entre dos variables. Siendo su enunciado: PROC CORR; (1) VAR REND ALTURA; (2) RUN; (3) (1) (2) (3) 2.3.4.4.

Nos indica que el PROC (procedimiento) a emplear es CORR (análisis de correlación). El comando VAR, se emplea para la selección de las variables a ser analizadas mediante el análisis de correlación, en este caso REN (rendimiento) y ALTURA (altura) RUN, ejecuta el procedimiento. Proc FREQ

Se emplea para la obtención de tablas de frecuencias para todas las variables en el archivo de datos de más reciente creación, empleándose para ello la declaración: Para cada comando se indica el número correspondiente entre paréntesis y el significado de este con el respectivo valor p.e. PROC ANOVA (1), más abajo se aprecia el significado de este comando (1) Nos indica que el PROC (procedimiento a emplear es ANOVA (analisis de varianza). Esto no se coloca en el Editor solo es explicativo.

1

Ing. Ramiro Raúl OCHOA TORREZ

13

INTRODUCCION AL MANEJO DEL SAS

PROC FREQ; RUN; (1) (2)

(1) (2)

Nos indica que el PROC (procedimiento) a emplear es FREQ (distribución de frecuencias). RUN, ejecuta el procedimiento.

Para obtener una tabla de tabulacion cruzada, se emplea la declaración: PROC FREQ; TABLES EDAD*SEXO; RUN; (1) (2) (3)

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es FREQ (distribución de frecuencias). TABLES, señala que realizara una tabla de tabulacion cruzada de las variables EDAD*SEXO (edad x sexo). RUN, ejecuta el procedimiento.

2.3.4.5.

Proc GLM

Al igual que la sentencia ANOVA, la opción GLM (General Linear Models) es una de las más empleadas, usa el principio de mínimos cuadrados para ajustar un modelo de efectos fijos, a cualquier tipo de datos, el procedimiento realiza análisis univariados como multivariados, así como los datos no son balanceados o sea cuando se tiene diferente número de repeticiones por tratamiento o factor, o diferentes niveles por factor. Cuando se especifica dos o más variables dependientes, GLM automáticamente agrupa aquellas variables dependientes con la misma estructura de los valores perdidos. Su forma es: PROC GLM; CLASS TRAT BLOQ; MODEL REND=TRAT BLOQ; RUN;

(1) (2) (3) (4)

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es GLM (General Linear Models). El comando CLASS señala las variables a estudiar en este caso TRAT (tratamiento) y BLOQ (bloques). El comando MODEL nos señala el modelo a emplear en el análisis de varianza, señalando en la primera parte la variable de respuesta REND (rendimiento) y en la segunda parte las variables en estudio TRAT BLOQ (tratamientos y bloques). (4) El comando RUN, señala la ejecución del procedimiento antes señalado. 2.3.4.6. Proc REG Realiza el análisis de regresión simple y múltiple, con la siguiente sentencia: PROC REG; MODEL Y=X; RUN; (1) (2) (3)

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es REG (análisis de regresión). MODEL, señala que el análisis de regresión múltiple empleara el siguiente modelo, teniendo como variable dependiente Y y como variable independiente X. RUN, ejecuta el procedimiento.

Para un análisis de regresión múltiple tendremos la siguiente sentencia: PROC REG; 14

(1) Ing. Ramiro Raúl OCHOA TORREZ

PROGRAMACIÓN EN EL SAS

MODEL Y=X1 X2 X3 X4; RUN; (1) (2) (3) 2.3.4.7.

(2) (3)

Nos indica que el PROC (procedimiento) a emplear es REG (análisis de regresión). MODEL, señala que el análisis de regresión múltiple empleara el siguiente modelo, teniendo como variable dependiente Y y como variables independientes X1, X2, X3 y X4. RUN, ejecuta el procedimiento. Proc LATTICE

Este procedimiento es el encargado de realizar el análisis de varianza para un diseño en latices. Su enunciado es: PROC LATTICE DATA=EJEM; (1) VAR REND; (2) RUN; (3) (1) (2) (3) 2.3.4.8.

Nos indica que el PROC (procedimiento) a emplear es LATTICE (latice) de DATA=EJEM (del archivo llamado ejem). VAR REND, señala que la variable de respuesta a ser analizadas mediante latices será REND (rendimiento). RUN, ejecuta el procedimiento. Proc MEANS

Esta sentencia le pide al SAS que realice los estadísticos descriptivos univariados de variables numéricas. Esta sentencia tiene muchos parámetros, siendo su enunciado: PROC MEANS MEAN SUM MIN MAX; BY TRAT; VAR REND; RUN; (1) (2) (3) (4) 2.3.4.9.

(1) (2) (3) (4)

Nos indica que el PROC (procedimiento) a emplear es MEANS, que presentara la media (MEAN), la suma total (SUM), el valor máximo (MIN) y el valor máximo (MAX). BY TRAT, los análisis antes solicitados serán realizados de la variable de estudio TRAT (tratamiento). VAR REND, señala que los análisis serán realizados de la variable de respuesta REND (rendimiento). RUN, ejecuta el procedimiento. Proc PLOT

El procedimiento PLOT grafica los valores de una variable entera contra los valores de otra variable, produciendo un diagrama bidimensional de puntos dispersos. Siendo su enunciado: PROC PLOT; PLOT X*Y; RUN; (1) (2) (3) 2.3.4.10.

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es PLOT (grafico). PLOT X*Y, el grafico deberá ser realizado de las variables X y Y. RUN, ejecuta el procedimiento. Proc PRINT

Ing. Ramiro Raúl OCHOA TORREZ

15

INTRODUCCION AL MANEJO DEL SAS

Produce un listado de las variables de un archivo de datos SAS. Se puede especificar el archivo a usar, si no se especifica, SAS usa el último que fue creado. PROC PRINT; (1) BY ESPEC; (2) VAR TRAT; (3) RUN; (4) Nos indica que el PROC (procedimiento) a emplear es PRINT. BY ESPEC, se obtiene el listado por valores de la (s) variable (s) que sigue al enunciado BY. VAR, se indica cuales variables se deben presentar, por defecto se presentan todas. RUN, ejecuta el procedimiento.

(1) (2) (3) (4) 2.3.4.11.

Proc PRINCOMP

Realiza un el análisis en componentes principales. Su enunciado es de la forma: PROC PRINCOMP COV OUT=PRIN; VAR JULY JANUARY; RUN; (1)

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es PRINCOMP COV OUT=PRIN, componentes principales y salida de las covarianzas. VAR JULY JANUARY, se indica cuales variables deberán ser analizadas. RUN, ejecuta el procedimiento.

(2) (3) 2.3.4.12.

Proc SORT

Clasifica los datos, indicándole las variables por la cual se realizara la clasificación. Su enunciado esta dado por: PROC SORT; BY TRAT; RUN; (1) (2) (3)

(1) (2) (3)

Nos indica que el PROC (procedimiento) a emplear es SORT. BY TRAT, indica que la clasificación será hecha de la variable TRAT (tratamiento). RUN, ejecuta el procedimiento.

2.3.4.13.

Proc TTEST

Realiza la prueba de t de Student para probar la hipótesis que las medias de dos grupos de muestras (muestras no pareadas) son iguales. Su enunciado es: PROC TTEST; CLASS TRAT; VAR REND; RUN; (1) (2) (3) (4)

(1) (2) (3) (4)

Nos indica que el PROC (procedimiento) a emplear es TTEST. CLASS TRAT, señala que la variable en estudio es TRAT (tratamiento). VAR REND, indica que la variable de respuesta a ser empelada en la prueba de T es REND (rendimiento) RUN, ejecuta el procedimiento.

2.3.4.14. 16

Proc UNIVARIATE Ing. Ramiro Raúl OCHOA TORREZ

PROGRAMACIÓN EN EL SAS

Realiza la prueba de normalidad de datos, Su enunciado es:

(3)

PROC UNIVARIATE NORMAL PLOT; (1) VAR REND; (2) RUN; (3) Nos indica que el PROC (procedimiento) a emplear es UNIVARIATE, más la realización del grafico de distribución normal de los datos (NORMAL PLOT). VAR REND, indica que la variable de respuesta a ser empelada en la prueba de normalidad será REND (rendimiento) RUN, ejecuta el procedimiento.

2.4.

Interpretación de resultados

(1) (2)

En el caso de los programas estadísticos, muchos de los mismos no presentan el valor tabular, como el de Ft, siendo este valor remplazado por la Probabilidad (Pr), en cuyo caso la interpretación se lleva a cabo realizando una comparación del valor Probabilidad y el nivel de significancia, siendo la toma de decisión de la siguiente forma:   

Si el valor de: Si el valor de: Si el valor de:

Pr > 0.05  ns (No significativo) Pr ≤ 0.05  * (Significativo al 5% ) Pr ≤ 0.01  ** (Altamente significativo al 1%)

Como por ejemplo si se tiene un valor de Probabilidad de 0.0380, asumimos como valor de significancia el 0.05 y el 0.01, teniendo:

Se puede apreciar que la conclusión se la realiza tomando en cuenta la superficie que ocupa el nivel de significancia, comparado con la probabilidad encontrada, como en el ejemplo, en la figura de la izquierda se aprecia que la superficie del 5% (0.05) es mayor al valor que ocupa la probabilidad encontrada (0.038), por lo que se rechaza la hipótesis nula, esto aun nivel de significancia del 5%. En el caso de la figura de la izquierda, el valor de la superficie encontrada (0.038), es mayor al valor de la significancia propuesta (0.01), por lo que se acepta la hipótesis nula.

Ing. Ramiro Raúl OCHOA TORREZ

17

INTRODUCCION AL MANEJO DEL SAS

3. ESTADÍSTICA BÁSICA 3.1.

Estadísticos básicos

Para el cálculo de los estadísticos más habituales se hace uso del procedimiento MEANS, con el cual se puede calcular: N NMISS MEAN STD MIN MAX RANGE SUM VAR USS CSS STDERR CV SKEWNESS KURTOSIS T PRT SUMWGT

Número de observaciones sobre el cual se basan los cálculos El número de valores perdidos La media La desviación estándar El valor mínimo El valor máximo El rango La suma La varianza La suma de cuadrados no corregida La suma de cuadrados corregida El error estándar de la media El coeficiente de variación Una medida de asimetría Una medida de kurtosis El valor de la t de Student para probar la hipótesis que la media de la población es cero La probabilidad de un valor absoluto mayor para la t de Student anterior Suma de los valores de WEIGTH

Ejercicio Los datos corresponden a valores del extracto de malta de cebada Kindred cultivada en 14 localidades, en los viveros de cebada del Valle del Mississippi durante 1948. La población para la cual se ha de hacer alguna inferencia, puede considerarse como valores de extracto de malta de cebada Kindred cultivada durante 1948 en la región que abarcan los viveros del Valle del Mississippi. (Steel & Torrie 1992) 77.7 75.4

76.0 76.0

76.9 76.0

74.6 73.9

74.7 77.4

76.5 76.6

74.2 77.3

Introduciendo los datos en el SAS tendremos: OPTIONS NODATE NONUMBER; DATA ESTBAS; LABEL EXTRAC='EXTRACTO DE MALTA'; INPUT EXTRAC @@; CARDS; 77.7 76.0 76.9 74.6 74.7 76.5 74.2 75.4 76.0 76.0 73.9 77.4 76.6 77.3 ; PROC MEANS N MEAN STD MIN MAX RANGE VAR USS STDERR CV; RUN;

(1) (2) (3) (4) (5) (6)

(7) (8)

Revisando las sentencias tenemos: 18

Ing. Ramiro Raúl OCHOA TORREZ

ESTADISTICA BASICA

(1) (2) (3)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA ESTBAS, le indicamos que genere un archivo con el nombre ESTBAS. Con LABEL EXTRAC=’EXTRACTO DE MALTA’; le indicamos que nombre a la variable EXTRAC, con el nombre de Extracto de Malta. Con INPUT EXTRAC @@; le indicamos que ingrese la variable EXTRAC en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Como se menciono anteriormente con el PROC MEANS, le pedimos que nos presente: N (Número de observaciones sobre el cual se basan los cálculos), MEAN (La media), STD (La desviación estándar), MIN (El valor mínimo), MAX (El valor máximo), RANGE (El rango), SUM (La suma), VAR (La varianza), USS (La suma de cuadrados no corregida), CSS (La suma de cuadrados corregida), STDERR (El error estándar de la media), CV (El coeficiente de variación). Con RUN; le señalamos que es ejecutable.

(4) (5) (6) (7)

(8)

La salida de los resultados que nos presenta el SAS será: The SAS System The MEANS Procedure Analysis Variable : EXTRAC EXTRACTO DE MALTA (1) (2) (3) (4) (5) (6) (7) N Mean Std Dev Minimum Maximum Range Variance ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 14 75.9428571 1.2270755 73.9000000 77.7000000 3.8000000 1.5057143 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Analysis Variable : EXTRAC EXTRACTO DE MALTA (8) (9) (10) Coeff of USS Std Error Variation ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 80762.02 0.3279497 1.6157879 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

De la salida de resultados apreciamos que: (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

N. El número de observaciones sobre el cual se basan los cálculos es 14 Mean. La Media es 75.9428571 Std Dev. El desvió estándar es 1.2270755 Minimun. El valor mínimo es 73.90 Maximun. El Valor máximo es 77.70 Range. El rango es 3.80 Variance. La varianza es 1.5057143 USS. La suma de cuadrados sin corregir es 80762.02 Std Error. El error estándar de la media es 0.3279497 Coeff of Variation. El coeficiente de variación es 1.6157879 %

3.2.

Distribución de frecuencias

Otra de las funciones que se emplean frecuentemente es la realización del cálculo de la distribución de frecuencias. Ejercicio Ing. Ramiro Raúl OCHOA TORREZ

19

INTRODUCCION AL MANEJO DEL SAS

Se tienen los datos de edades (en años cumplidos) de doce personas (Eduardo 2003). 16

15

17

14

16

17

16

15

14

16

18

15

Introduciendo los datos en el SAS tendremos: OPTIONS NODATE NONUMBER; DATA FREQ; LABEL EDAD='EDAD DE PERSONAS'; INPUT EDAD @@; CARDS; 16 15 17 14 16 16 15 14 16 18 ; PROC FREQ DATA=FREQ; RUN;

(1) (2) (3) (4) (5) (6)

17 15

(7) (8)

Revisando las sentencias tenemos: (1) (2) (3) (4) (5) (6) (7) (8)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA FREQ, le indicamos que genere un archivo con el nombre FREQ. Con LABEL EDAD=’EDAD DE PERSONAS’; le indicamos que el nombre de la variable EXTRAC, tendra una etiqueta de Edad de Personas. Con INPUT EDAD @@; le indicamos que ingrese la variable EDAD en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Con la opción PROC FREQ DATA=FREQ, indicamos que se va ha realizar una distribución de frecuencias del archivo Freq. Con RUN; le señalamos que es ejecutable.

Los resultados que obtendremos será: The SAS System The FREQ Procedure EXTRACTO DE MALTA (3) (4) (5) Cumulative Cumulative EDAD Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 14 2 16.67 2 16.67 15 3 25.00 5 41.67 16 4 33.33 9 75.00 17 2 16.67 11 91.67 18 1 8.33 12 100.00 (1)

(2)

Los resultados presentados nos muestran 5 columnas, definiendo cada una de ellas tenemos: (1) (2) (3)

EDAD. Los valores de la edad de las personas. Frequency. La frecuencia o presencia de cada uno de los valores. Percent. El porcentaje correspondiente a cada una de las frecuencias. 20

Ing. Ramiro Raúl OCHOA TORREZ

ESTADISTICA BASICA

(4) (5)

Cumulative Frequency. La frecuencia acumulada. Cumulative Percent. El porcentaje acumulado.

Ing. Ramiro Raúl OCHOA TORREZ

21

INTRODUCCION AL MANEJO DEL SAS

4. SUPUESTOS DEL ANÁLISIS DE VARIANZA 4.1.

Normalidad

Ejercicio En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella, se tomaron cuatro macetas por tratamiento. Obteniéndose los siguientes rendimientos (Padrón 1996): Maceta 1 2 3 4

T1 101 93 93 96

T2 51 61 59 58

T3 83 68 72 75

T4 67 40 46 52

T5 29 45 51 42

En este caso no se considera los tratamientos, solo los datos: 101 93 93 96

51 61 59 58

83 68 72 75

67 40 46 52

29 45 51 42

Para la introducción se datos se puede realizar estos, tomando en cuenta si se va tratar de una manera columnar o en filas, en el caso de filas se tendrá: OPTIONS NODATE NONUMBER; DATA NORMAL; INPUT REND @@; CARDS; 101 51 83 67 29 93 59 72 46 51 ; PROC UNIVARIATE NORMAL PLOT; VAR REND; RUN;

93 96

61 58

68 75

40 52

45 42

(1) (2) (3) (4) (5)

(6) (7) (8)

Revisando las sentencias tenemos: (1) (2) (3) (4) (5) (6)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA NORMAL, le indicamos que genere un archivo con el nombre NORMAL. Con INPUT REND @@; le indicamos que ingrese la variable REND (rendimiento) en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Con la opción PROC UNIVARIATE NORMAL PLOT, le pedimos que realice le procedimiento de normalidad y el grafico de normalidad. (7) VAR REND, con esta sentencia se pide la realización del análisis de la variable REND (rendimiento). (8) Con RUN; le señalamos que ejecute los comandos mencionados. Los resultados que obtendremos será:

22

Ing. Ramiro Raúl OCHOA TORREZ

SUPUESTOS DEL ANALISIS DE VARIANZA RENDIMIENTO The UNIVARIATE Procedure Variable: REND Moments (1) (2) (3) (4) (5) (6)

N Mean Std Deviation Skewness Uncorrected SS Coeff Variation

20 64.1 20.7336492 0.34126669 90344 32.3457866

Sum Weights Sum Observations Variance Kurtosis Corrected SS Std Error Mean

20 1282 429.884211 -0.8626058 8167.8 4.63618491

(7) (8) (9) (10) (11) (12)

Basic Statistical Measures Location (13) (14) (15)

Mean Median Mode

Variability

64.10000 60.00000 51.00000

Std Deviation Variance Range Interquartile Range

20.73365 429.88421 72.00000 30.50000

(16) (17) (18) (19)

NOTE: The mode displayed is the smallest of 2 modes with a count of 2. Tests for Location: Mu0=0 Test

-Statistic-

-----p Value------

Student's t Sign Signed Rank

t M S

Pr > |t| Pr >= |M| Pr >= |S|

13.82602 10 105

W D W-Sq A-Sq

0.4285 >0.1500 >0.2500 >0.2500

(21) (22) (23) (24)

Quantiles (Definition 5) Quantile

Estimate

100% Max 99% 95% 90%

101.0 101.0 98.5 94.5

En el procedimiento se debe tomar en cuenta no incluir los tratamientos, porque en el análisis de los datos se toma a todos de una manera general para determinar si la totalidad de los datos tienen o no una distribución normal, para nuestro caso de los resultados del SAS rescatamos: (1) (2)

N. Total de datos 20 Mean. Media 64.1

Ing. Ramiro Raúl OCHOA TORREZ

23

INTRODUCCION AL MANEJO DEL SAS

(3) (4) (5) (6) (7) (8) (9) (10) (11) (12)

Std Deviation. Desvió estándar 20.7336492 Skewness. Medida de asimetría 0.34126669 Uncorrected SS. Suma de cuadrados sin corregir 90344 Coeff Variation. Coeficiente de variación 32.34579 Sum Weights. Suma de valores ponderados 20 Sum Observations. Suma de la totalidad de observaciones 1282 Variance. Varianza 429.884211 Kurtosis. Medida de Kurtosis – 0.8626058 Corrected SS. Suma de cuadrados corregida 8167.8 Std Error Mean. Error estándar de la media 4.63618491

Más abajo nos presenta las medidas de estadística básica (Basic Statistical Measures): (13) (14) (15) (16) (17) (18) (19)

Mean. Media 64.10000 Median. Mediana 60.00000 Mode. Moda 51.00000 Std Deviation. Desvió estándar 20.73365 Variance. Varianza 429.88421 Range. Rango 72.00000 Intercuartile Range. Rango intercuartil 30.50000

Seguidamente nos presenta la prueba de situación de que la media es igual a cero (Test for Location: MuO=0), esta nos presenta en tres columnas Test (Prueba), Statistic (Estadístico) y p Value (Valor de la probabilidad): (20)

Student’s t. Prueba de T con el valor de T 13.82602, el valor de la probabilidad (Pr > | t |) D) >0.1500 Cramer-von Mises. Prueba de Cramer, valor de la prueba W-Sq 0.05233, el valor de la probabilidad (Pr > W-Sq) >0.2500 Anderson-Darling. Prueba de Anderson y Darling, valor de la prueba A-Sq 0.357493, el valor de la probabilidad (Pr > A.Sq) 0.2500

Más abajo nos presenta la definición de cuantiles, en dos columnas el quantil (Quantile) y valor estimado (Estimate). Presenta la división de los datos en cuartas partes.

24

Ing. Ramiro Raúl OCHOA TORREZ

SUPUESTOS DEL ANALISIS DE VARIANZA RENDIMIENTO The UNIVARIATE Procedure Variable: REND Quantiles (Definition 5)

(26) (25)

Quantile 75% Q3 50% Median 25% Q1 10% 5% 1% 0% Min

Estimate 79.0 60.0 48.5 41.0 34.5 29.0 29.0

Extreme Observations ----Lowest-------Highest--Value Obs Value Obs 29 40 42 45 46 Stem 10 9 8 7 6 5 4 3 2

5 9 20 10 14

83 93 93 96 101

Leaf 1 336 3 25 178 11289 0256

3 6 11 16 1

# 1 3 1 2 3 5 4

9 1 ----+----+----+----+ Multiply Stem.Leaf by 10**+1

Boxplot | | | +-----+ *--+--* | | +-----+ | |

RENDIMIENTO

105+ | | | 65+ | | | 25+

The UNIVARIATE Procedure Variable: REND Normal Probability Plot

+*+++

* * +*+++ *+++++ +*+*+ ++*** *+**** * *+*+* +++++ ++*++ +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2

Continuando con la interpretación de los Cuarteles, tenemos: Ing. Ramiro Raúl OCHOA TORREZ

25

INTRODUCCION AL MANEJO DEL SAS

(25) (26)

25% Q1. El primer cuartil Q1, es el valor que tiene una cuarta parte, o 25% 75% Q3. Tercer cuartil Q3, es el valor que tiene tres terceras partes, o 75%

Más abajo nos presenta las observaciones extremas en dos columnas Lowest (valores bajos) y Highest (valores altos), estos divididos a su vez en dos columnas donde tenemos el valor (Value) y el número de la observación (Obs). Seguidamente tenemos dos figuras, el primero de la izquierda la figura de ramas y hojas (Stem Leaf) y el de la derecha la figura de cajas (Boxplot). En la figura de ramas y hojas la interpretación se la hace multiplicando los valores por 10, o sea para el primer dato Stem 10, Leaf 1 siendo el valor 101, este esta consignado como un solo dato. El siguiente valor de Stem 9 y Leaf 336, me indica que tengo 3 valores: 93, 93 y 96. En el caso de la figura de cajas, que se basa en la media, los cuartiles y los valores extremos. La caja representa el rango intercuartil que encierra el 50% de los valores y tiene la mediana dibujada dentro, el rango intercuartil tiene como extremos el cuartil superior Q3 y el cuartil inferior Q1. Además se incluye la extensión de los datos mediante segmentos que se extienden de la caja hacia el valor máximo y hacia el valor mínimo. En vez de visualizar los valores individuales, se representa estadísticos básicos de la distribución: la mediana, el centil 25, el centil 75 y los valores extremos de la distribución, para su interpretación se consideran dos categorías de casos extremos, en función a cuanto se alejan con respecto del 50% central de la distribución. Aquellos casos con valores alejados más de tres veces el rango intercuartil desde el extremo superior o inferior de la caja (casos más extremos) y aquellos valores que están alejados entre 1.5 y tres veces de dicho rango. Los valores más pequeños y más grandes que estén dentro de los limites primer cuartil –1.5 y tercer cuartil +1.5, veces el rango intercualtil (IQR) constituyen los wiskers del grafico y aparecen representados mediante líneas horizontales dibujadas a ambos extremos de la caja central. Para nuestro ejemplo de la posición de la mediana (Med = 60) podemos determinar la tendencia central. El ancho de la caja nos da una idea de la variabilidad de las observaciones. Si la mediana no esta en el centro de la caja, podemos deducir que la distribución es asimétrica (si esta próxima al limite inferior de la caja, asimétrica positiva y, si esta próxima al limite superior, asimétrica negativa). La mediana (Med) es 60, el Cuartil 1 (Q1) es 48.5, el Cuartil 3 (Q3) es 79. Posteriormente tenemos la figura de probabilidad normal (Normal Probability Plot), donde se aprecia la distribución de los datos, observando si estos están dispersos o no. Conclusión De todos estos valores para determinar si los datos tienen una distribución normal son los de las pruebas de normalidad las que se deben considerar como es el caso de Shapiro-Wilk (21), donde si el valor de probabilidad es mayor a 0.05 se concluye que los datos presentan una distribución normal, si el valor de Pr < W es inferior a 0.05 se concluye que los datos no tienen una distribución normal a un nivel de significancia del 5% (α = 0.05), si el valor de Pr< W es inferior al 0.01 se concluirá que los datos no presentan una distribución normal al nivel de significancia del 1%. De similar forma se interpreta las otras pruebas (22), (23) y (24). Para nuestro ejemplo, el valor de Pr < W es 0.4285 (superior a 0.05 y 0.01) por lo que se concluye que los valores tienen una distribución normal. 4.2.

Homogeneidad de varianzas

26

Ing. Ramiro Raúl OCHOA TORREZ

SUPUESTOS DEL ANALISIS DE VARIANZA

Cuando se requiere realizar una prueba de homogeneidad de varianzas de mas de dos muestras, se puede hacer uso de la prueba de Bartlett, que se emplea para determinar si hay o no homogeneidad de varianzas. Otro método de determinación de la homogeneidad de varianzas es la prueba de F MÁXIMA. Ejercicio En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella, se tomaron cuatro macetas por tratamiento. Obteniéndose los siguientes rendimientos (Padrón 1996): Maceta 1 2 3 4

T2 51 61 59 58

T1 101 93 93 96

T3 83 68 72 75

T4 67 40 46 52

T5 29 45 51 42

La hipótesis a probar será: Ho: σ2T1 = σ2T2 = σ2T3 = σ2T4 = σ2T5 Ha: σ2T1 ≠ σ2T2 ≠ σ2T3 ≠ σ2T4 ≠ σ2T5 4.2.1.

Prueba de Bartlett

Los datos que se deben colocar en el Editor de programas (PROGRAM EDITOR) del SAS con los comandos respectivos será: OPTIONS NODATE NONUMBER; DATA BARTLETT; INPUT TRAT $ REND @@; CARDS; T1 101 T2 51 T1 93 T2 61 T1 93 T2 59 T1 96 T2 58 ; PROC ANOVA; TITLE'RENDIMIENTO'; CLASS TRAT; MODEL REND=TRAT; MEANS TRAT/HOVTEST=BARTLETT; RUN;

T3 T3 T3 T3

83 68 72 75

T4 T4 T4 T4

67 40 46 52

T5 T5 T5 T5

29 45 51 42

(1) (2) (3) (4) (5)

(6) (7) (8) (9) (10) (11)

La descripción de cada una de las sentencias empleada (1) (2) (3) (4) (5) (6) (7) (8)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA BARTLETT, le indicamos que genere un archivo con el nombre BARTLETT. Con INPUT TRAT $ REND @@; le indicamos que ingrese la variable TRAT $ (tratamiento variable alfanumérica) y REND (rendimiento) en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Con la opción PROC ANOVA, le pedimos que realice le procedimiento de análisis de varianza. CLASS TRAT, señalamos la variable en estudio. MODEL REND=TRAT, agregamos el modelo con la variable de respuesta y la variable de estudio.

Ing. Ramiro Raúl OCHOA TORREZ

27

INTRODUCCION AL MANEJO DEL SAS

(9) (10)

MEANS TRAT /HOVTEST=BARTLETT, sentencia que indica que de los promedios de los tratamientos realice la prueba de Barltlett. Con RUN; le señalamos que es ejecute.

Dándonos como resultado: RENDIMIENTO The ANOVA Procedure Class Level Information Class TRAT

Levels 5

Values T1 T2 T3 T4 T5

Number of observations RENDIMIENTO

20

The ANOVA Procedure

Dependent Variable: REND Source Model Error Corrected Total

Sum of Squares 7285.800000 882.000000 8167.800000

DF 4 15 19 R-Square 0.892015

Source TRAT

Coeff Var 11.96274 DF 4

Mean Square 1821.450000 58.800000

Root MSE 7.668116

Anova SS 7285.800000

Level of TRAT T1 T2 T3 T4 T5

DF 4

N 4 4 4 4 4

Chi-Square 4.5524 RENDIMIENTO

Pr > F F ChiSq TRAT

4

0.4447

0.9787

DISEÑO COMPLETAMENTE AL AZAR The ANOVA Procedure Level of TRAT

N

A B C D E

5 5 5 5 5

------------ALTURA----------Mean Std Dev 13.4000000 14.4000000 11.6000000 11.4000000 11.8000000

1.14017543 1.14017543 1.14017543 1.14017543 1.48323970

En la última parte se presenta la prueba de Bartlett para las varianza de los tratamientos: (1) (2) (3) (4)

Source, variable analizada en la prueba de Bartlett TRAT (Tratamiento) DF, grados de libertad (DF = 4) Chi – Square, valor de Chi – cuadrado (Chi – Square = 0.4447) Pr > ChiSq, valor de la probabilidad mayor a ChiSq (Pr > ChiSq = 0.9787)

Conclusión Apreciando el valor de probabilidad de la prueba de Bartlett este nos presenta una probabilidad Pr > ChiSq = 0.9787 superior al valor de 0.05, por lo tenemos no significancia, al no ser significativo aceptamos la hipótesis nula de que las varianzas son homogéneas por lo que tenemos Ho: σ2A = σ2B = σ2C = σ2D = σ2E. 5.2.

DCA con diferente número de repeticiones

Ejercicio Los datos siguientes se refieren a los pesos finales de corderos alimentados durante 90 días con una ración que contenía 14 % de proteína. Los tratamientos fueron definidos de la siguiente manera (Rodríguez, 1991): Tratamiento 1 2 3 4 T1 T2 T3 Ing. Ramiro Raúl OCHOA TORREZ

I 47 50 57

Corderos Castrados Enteros Implantados con Sinovex S Implantados con Estil Bestrol II 52 54 53

III 56 54

IV 51 57 37

INTRODUCCION AL MANEJO DEL SAS

T4

62

65

74

50

Modelo lineal aditivo Yij = μ + i + εij Donde: Yij μ i εij Tratamiento Repetición

= Una observación cualquiera = Media poblacional = Efecto del i – ésimo tratamiento = Error experimental i… j…

t… r…

1… 1…

4 4

Las Hipótesis a probar serán: Ho: Ha:

1 = 2 = 3 = 4 1 ≠ 2 ≠ 3 ≠ 4

Introduciendo los datos al PROGRAM EDITOR del SAS, con el cuidado de que los tratamientos que no tienen igual número de repeticiones, tenemos: OPTIONS NODATE NONUMBER; DATA DCA_UF; LABEL PESFIN='PESO FINAL'; INPUT TRAT $ PESFIN; CARDS; T1 47 T2 50 T3 57 T4 62 T1 52 T2 54 T3 53 T4 65 T2 56 T3 54 T4 74 T1 51 T3 57 T4 50 ; PROC GLM; CLASS TRAT; MODEL PESFIN=TRAT; MEANS TRAT/DUNCAN; MEANS TRAT/TUKEY; RUN;

(1) (2) (3) (4) (5) (6)

(7) (8) (9) (10) (11) (12)

Revisando las sentencias introducidas tenemos: (1) (2)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCA_UF; le indicamos que genere un archivo con el nombre DCA_UF.

38

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO COMPLETAMENTE AL AZAR

(3) (4) (5) (6) (7) (8) (9)

Con LABEL PESFIN=’PESO FINAL’; le indicamos al SAS que la variable PESFIN, tendrá como etiqueta o nombre ‘Peso final’. Con INPUT TRAT $ PESFIN; le indicamos que ingrese las variables TRAT (tratamiento) y con el comando $ indicamos que es del tipo alfanumérico y PESFIN como variable de respuesta en forma en forma columnar. CARDS; le señala que los datos vienen a continuación. Seguidamente se observan los datos ordenados en forma columnar. PROC GLM; le indica que realice el calculo de análisis de varianza en base del modelo lineal general; considerando que se tiene diferente número de repeticiones por tratamiento. CLASS TRAT; le señala cual variable es la de estudio o de clasificación para nuestro caso la variable tratamiento (TRAT). MODEL PESFIN=TRAT; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar (Yij = μ + i + εij) de donde se coloca como: Yij = μ + i + εij Variable de respuesta = Tratamientos o Variables de estudio Peso final = tratamientos

(10) (11) (12)

No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del modelo. MEANS TRAT/DUNCAN; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los procese con la pruebas de Duncan. MEANS TRAT/DUNCAN; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los procese con la pruebas de Tukey. Con RUN; le señalamos que las sentencias anteriores son ejecutables.

La salida de los resultados que el SAS nos presentara será:

Ing. Ramiro Raúl OCHOA TORREZ

39

INTRODUCCION AL MANEJO DEL SAS The SAS System The GLM Procedure

(3) Class TRAT

(1)

Class Level Information (4) (5) Levels Values 4 T1 T2 T3 T4

Number of observations

(2)

14

(6)

The SAS System The GLM Procedure Dependent Variable: PESFIN

PESO FINAL

(8)

(18)

(9)

Source Model Error Corrected Total

DF 3 10 13 (14) R-Square 0.479640

(7) (10) Sum of Squares 313.5476190 340.1666667 653.7142857

(15) Coeff Var 10.44160

(11) Mean Square 104.5158730 34.0166667

(16) Root MSE 5.832381

(12)

(13)

F Value 3.07

Pr > F 0.0776

(17) PESFIN Mean 55.85714

(19)

Source TRAT

DF 3

Type I SS 313.5476190

Mean Square 104.5158730

F Value 3.07

Pr > F 0.0776

(20)

Source TRAT

DF 3

Type III SS 313.5476190

Mean Square 104.5158730

F Value 3.07

Pr > F 0.0776

(1) (2) (3) (4) (5) (6)

El procedimiento empleado (General Linear Models Procedure) Información de la variable analizada así como sus niveles (Class Level Information) El nombre de la variable analizada (Class TRAT) en nuestro ejemplo TRAT representa tratamientos Los niveles de la variable analizada (Levels) para nuestro caso 4 Los valores que toman los niveles de la variable analizada (Values) en nuestro ejemplo: T1, T2, T3 y T4 El número de observaciones en el juego de datos (Number of observations in data set = 14)

Avanzando para apreciar la siguiente salida de resultados tendremos el análisis de varianza propiamente dicho: (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) (17)

La variable de respuesta analizada y su etiqueta (Dependent Variable: PESFIN PESO FINAL). Las fuentes de variación (Source) Grados de libertad (DF) Suma de cuadrados (Sum of Squares) Cuadrados medios (Mean Square) F calculado (F value) El valor de probabilidad mayor a F (Pr > F) Coeficiente de determinación (R-Square) Coeficiente de variación (CV) Raíz cuadrada del Cuadrado medio del error (Root MSE) Promedio general de la variable de respuesta (ALTURA Mean)

40

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO COMPLETAMENTE AL AZAR

Como se puede apreciar, la salida del análisis de varianza, nos presenta en este caso tres partes: (18) (19) (20)

La primera constituida por las fuentes de variación Model, Error y Corrected Total; La segunda esta nuestra variable de clasificación o estudio TRAT, con la Suma de Cuadrados (SS) con el tipo I, La tercera también esta nuestra variable de clasificación o estudio TRAT, con la Suma de Cuadrados (SS) con el tipo III, Siendo los valores de las tres iguales, esto se debe a que tenemos una única variable de estudio que son los tratamientos.

(18)

Source Model Error Corrected Total

DF 3 10 13 R-Square 0.479640

Sum of Squares 313.5476190 340.1666667 653.7142857

Coeff Var 10.44160

Mean Square 104.5158730 34.0166667

Root MSE 5.832381

F Value 3.07

Pr > F 0.0776

PESFIN Mean 55.85714

(19)

Source TRAT

DF 3

Type I SS 313.5476190

Mean Square 104.5158730

F Value 3.07

Pr > F 0.0776

(20)

Source TRAT

DF 3

Type III SS 313.5476190

Mean Square 104.5158730

F Value 3.07

Pr > F 0.0776

Al igual que en el anterior ejercicio debemos organizar la salida del SAS, para tener un ANVA, para tal caso en la primera parte (18) los valores que corresponden a Model son remplazados por los valores de TRAT de la segunda (19) o la tercera parte (20), siendo en este caso indistinto al ser los mismos valores, pero en caso de que se tengan diferentes valores lo más recomendable es tomar los valores de la Suma de Cuadrados con el Tipo III (20), por ser el más ajustado a los efectos del modelo. Quedando nuestro ANVA de la siguiente forma: Source TRAT Error Corrected Total R-Square 0.479640

Sum of DF Squares Mean Square F Value 3 313.5476190 104.5158730 3.07 10 340.1666667 34.0166667 13 653.7142857 Coeff Var Root MSE PESFIN Mean 10.44160 5.832381 55.85714

Pr > F 0.0776ns

Conclusión La conclusión de los resultados como ya se indico anteriormente, se la realiza tomando en cuenta el valor de probabilidad presentado, Pr > F = 0.0776, siendo este valor superior al 0.05 (5%) por lo que no se encuentran diferencias entre tratamientos. Por lo que podemos afirmar que no se tienen diferencias en los pesos finales de corderos alimentados durante 90 días con una ración que contenía 14 % de proteína. La segunda parte de la salida del SAS de la ventana OUTPUT, nos presenta la prueba de medias de Duncan:

Ing. Ramiro Raúl OCHOA TORREZ

41

INTRODUCCION AL MANEJO DEL SAS The SAS System The GLM Procedure Duncan's Multiple Range Test for PESFIN (1) NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 10 Error Mean Square 34.01667 Harmonic Mean of Cell Sizes 3.428571

(2) (3) (4)

NOTE: Cell sizes are not equal. Number of Means Critical Range

2 9.93

3 10.37

4 10.63

Means with the same letter are not significantly different. (8) Duncan Grouping Mean N TRAT A 62.750 4 T4 A B A 55.250 4 T3 B A B A 53.333 3 T2 B B 50.000 3 T1

(5) (6) (7)

La siguiente salida del SAS será la prueba de Duncan: (1) (2) (3) (4) (5) (6) (7) (8)

Señala que controla el error de tipo I y no así la proporción de los experimentos (This test controls the type I comparisonwise error rate, not the experimenwise error rate) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 10) El cuadrado medio del error (Error Mean Square = 34.01667) Al ser una prueba de comparación múltiple presenta el número de medias (tratamientos) empleados en el análisis (Number of Means), para nuestro caso al tener solo 5 tratamientos nos presentara: 2, 3, 4 y 5. El rango critico para cada promedio o valor referencial de Duncan (Critical Range) Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly different), que nos indica que los promedios con la misma letra no son significativamente diferentes. Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada promedio.

Conclusión Con relación a la prueba de Duncan, se aprecia que se formulan dos grupos representados por las letras de la agrupación de Duncan (Duncan Grouping), de estos se aprecia que un primer grupo esta formado por los tratamientos T4, T3 y T2, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los tratamientos T3, T2 y T1 representados por la letra B. Concluyendo que el tratamiento T4 posee un promedio de peso final significativamente superior, siendo el tratamiento T1, el tratamiento el que registra el promedio más bajo de peso final. 42

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO COMPLETAMENTE AL AZAR

Más abajo nos presenta la prueba de medias de Tukey, siendo su salida: The SAS System The GLM Procedure Tukey's Studentized Range (HSD) Test for PESFIN NOTE: This test controls the Type I experimentwise error rate.

(1)

Alpha 0.05 Error Degrees of Freedom 10 Error Mean Square 34.01667 Critical Value of Studentized Range 4.32658

(2) (3) (4) (5)

Comparisons significant at the 0.05 level are indicated by ***.

TRAT Comparison T4 - T3 T4 - T2 T4 - T1 T3 - T4 T3 - T2 T3 - T1 T2 - T4 T2 - T3 T2 - T1 T1 - T4 T1 - T3 T1 - T2

Difference Between Means 7.500 9.417 12.750 -7.500 1.917 5.250 -9.417 -1.917 3.333 -12.750 -5.250 -3.333

(6)

Simultaneous 95% Confidence Limits -5.117 20.117 -4.211 23.045 -0.878 26.378 -20.117 5.117 -11.711 15.545 -8.378 18.878 -23.045 4.211 -15.545 11.711 -11.236 17.902 -26.378 0.878 -18.878 8.378 -17.902 11.236

Siguiendo con la presentación de resultados del SAS, tenemos la prueba de Tukey: (1) (2) (3) (4) (5) (6) (7)

Controla el error de tipo I y la proporción de los experimentos (This test controls the type I experimentwise error rate) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 10) El cuadrado medio del error (Error Mean Square = 34.01667) El valor critico del rango studentizado (Critical Value of Studentized Range = 4.32658) Más abajo una indicación de que significa la salida de Tukey (Comparisons significant at the 0.05 level are indicated by ***), las comparaciones significantivas a un nivel del 0. 05 se indican por * * *. Por ultimo nos presenta las diferentes comparaciones realizadas entre tratamientos (TRAT comparison), la diferencia entre medias (Difference Between Means) y el limite de confianza simultaneo al 95% (Simultaneous 95% Confidence Limit).

Conclusión Se aprecia que ninguna de las comparaciones resulto significativa. Por lo que se concluye que ninguno de los tratamientos presenta una superioridad en el peso final con relación a otro tratamiento.

Ing. Ramiro Raúl OCHOA TORREZ

43

INTRODUCCION AL MANEJO DEL SAS

La particularidad de la salida de los resultados de la prueba de Duncan se debe a que los datos no están balanceados, es decir no están en la misma proporción. 5.3.

DCA con muestreo

Ejercicio Los datos que se muestran a continuación se refieren a producciones parciales de forraje de maíz verde, tomadas como muestras ante la imposibilidad de medir la producción total de cada unidad experimental. Los tratamientos consisten en cantidades diferentes de estiércol incorporado al suelo como mejorador (Ibáñez, 2000). Dosis 0 t / ha 4 t / ha 6 t / ha 2 t / ha Modelo lineal aditivo Donde: Yijk μ i εij εijk Tratamiento Repetición Muestra

Muestra 1 2 3 1 2 3 1 2 3 1 2 3

I 24 23 21 25 28 30 56 65 58 24 19 23

II 19 21 24 31 24 32 62 60 59 21 22 24

III 18 19 22 28 32 36 61 60 64 23 18 22

IV 23 22 20 34 33 29 62 60 61 19 21 23

Yijk = μ + i + εij + εijk = Una observación cualquiera = Media poblacional = Efecto del i – ésimo tratamiento (dosis) = Error experimental de la unidad experimental = Error de la muestra (sub unidad experimental) i… j… k…

t… r… m…

1… 1… 1…

4 4 3

Las hipótesis a probar serán: Ho: Ha:

0 t/ha = 2 t/ha = 4 t/ha = 6 t/ha m1 = m2 = m3 0 t/ha ≠ 2 t/ha ≠ 4 t/ha ≠ 6 t/ha m1 ≠ m2 ≠ m3

Introduciendo los datos al PROGRAM EDITOR del SAS tendremos:

44

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO COMPLETAMENTE AL AZAR OPTIONS NODATE NONUMBER; DATA DCAMUE; LABEL RENFOR='RENDIMIENTO DE FORRAJE'; INPUT DOSIS $ MUESTRA RENFOR @@; CARDS; 0_t_ha 1 24 0_t_ha 1 0_t_ha 2 23 0_t_ha 2 0_t_ha 3 21 0_t_ha 3 4_t_ha 1 25 4_t_ha 1 4_t_ha 2 28 4_t_ha 2 4_t_ha 3 30 4_t_ha 3 6_t_ha 1 56 6_t_ha 1 6_t_ha 2 65 6_t_ha 2 6_t_ha 3 58 6_t_ha 3 2_t_ha 1 24 2_t_ha 1 2_t_ha 2 19 2_t_ha 2 2_t_ha 3 23 2_t_ha 3 0_t_ha 1 19 0_t_ha 1 0_t_ha 2 21 0_t_ha 2 0_t_ha 3 24 0_t_ha 3 4_t_ha 1 31 4_t_ha 1 4_t_ha 2 24 4_t_ha 2 4_t_ha 3 32 4_t_ha 3 6_t_ha 1 62 6_t_ha 1 6_t_ha 2 60 6_t_ha 2 6_t_ha 3 59 6_t_ha 3 2_t_ha 1 21 2_t_ha 1 2_t_ha 2 22 2_t_ha 2 2_t_ha 3 24 2_t_ha 3 ; PROC GLM; CLASS DOSIS MUESTRA; MODEL RENFOR=DOSIS MUESTRA(DOSIS); TEST H=DOSIS E=MUESTRA(DOSIS); LSMEANS DOSIS/PDIFF; MEANS DOSIS/DUNNETT('0_t_ha'); RUN;

18 19 22 28 32 36 61 60 64 23 18 22 23 22 20 34 33 29 62 60 61 19 21 23

(1) (2) (3) (4) (5) (6)

(7) (8) (9) (10) (11) (12) (13)

Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7) (8) (9)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCAMUE; le indicamos que genere un archivo con el nombre DCAMUE. Con LABEL RENFOR=’RENDIMIENTO DE FORRAJE’; le indicamos al SAS que la variable RENFOR, tendrá como etiqueta o nombre ‘Rendimiento de forraje’. Con INPUT DOSIS $ MUESTRA RENCOR @@; le indicamos que ingrese las variables dosis (alfanumérico), muestra (numérico) y rendimiento de forraje en forma de filas. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos nuestros datos ordenados en forma de filas. PROC GLM; le indica que realice el calculo de análisis de varianza se base en el modelo lineal general; CLASS DOSIS MUESTRA; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables será dosis (DOSIS) y muestra (MUESTRA). MODEL RENFOR=DOSIS MUESTRA(DOSIS); este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con muestreo (Yijk = μ + i + εij + εijkj), donde se coloca como: Yijk = μ + i + εij + εijk Variable de respuesta = Tratamientos o Variables de estudio

Ing. Ramiro Raúl OCHOA TORREZ

45

INTRODUCCION AL MANEJO DEL SAS

Producción de forraje verde = Dosis Muestra No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. (10)

TEST H=DOSIS E=MUESTRA(DOSIS); con esta sentencia le indicamos al SAS que para el caso de la variable Dosis, la obtención de su valor calculado de F (F value) tomara como cuadrado medio del error al cuadrado medio de la Muestra(Dosis). Para esto se debe recordar la forma de obtención de los valores al realizar el calculo del ANVA: FV i Trat εij EE εijk EM Total

GL t–1 t(r – 1) rt(m – 1) trm – 1

SC SCt SCE SCEM SCT

CM SCt / GLt SCE / GLE SCEM / GLEM

Fc CMt / CME CME / CMEM

Ft f(GLt, GLE) f(GLE, GLEM)

Podemos observar que para el calculo del Fc de los Tratamientos se lo obtiene dividiendo los Cuadrados medios de los tratamientos entre los Cuadrados medios del Error Experimental (CMt / CME) y que para la obtención del valor de Fc de Error experimental este se obtiene dividiendo los Cuadrados medios del error experimental entre los Cuadrados medios del error de Muestreo (CME / CMEM). En este caso para el análisis con el SAS se debe indicar cual valor va ha ser considerado como dividendo, toda vez que el SAS considera un solo error experimental (en este caso el error de muestreo) como divisor para todas las fuentes de variación en estudio. (11) (12) (13)

LSMEANS DOSIS/PDIFF; con esta sentencia le solicitamos al SAS que realice la comparación de medias de la prueba de DMS, realizando todas las comparaciones posibles entre las dosis (PDIFF) MEANS TRAT/DUNNETT(‘0_t_ha); con esta sentencia le solicitamos al SAS que realice la prueba de Dunnett, tomando como testigo al tratamiento 0_t_ha. Con RUN; le señalamos que las sentencias anteriores son ejecutables.

La salida de los resultados que el SAS nos presentara será: The SAS System The GLM Procedure

(3) Class DOSIS MUESTRA

(1)

Class Level Information (4) (5) Levels Values 4 0_t_ha 2_t_ha 4_t_ha 6_t_ha 3 1 2 3 Number of observations

(2)

48

Donde apreciamos: (1) (2) (3) (4) (5) (6)

El procedimiento empleado General Linear Models Procedure (GLM) Información de la variable analizada así como sus niveles (Class Level Information) El nombre de las variables analizadas (Class DOSIS MUESTRA) Los niveles de las variables analizada (Levels) Dosis 4 y Muestra 3 Los valores que toman los niveles de la variable analizada (Values), en este caso para DOSIS 0_t_ha, 2_t_ha, 4_t_ha y 6_t_ha; para MUESTRA 1, 2 y 3. El número de observaciones en el juego de datos (Number of observations in data set = 48) 46

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO COMPLETAMENTE AL AZAR

La siguiente salida es del ANVA: The SAS System The GLM Procedure Dependent Variable: RENFOR

RENDIMIENTO DE FORRAJE

(3)

(13)

Source Model Error Corrected Total

(1) (2)

(4)

(9) R-Square 0.979692

(5) (6) (7) Sum of DF Squares Mean Square F Value 11 12506.56250 1136.96023 157.88 36 259.25000 7.20139 47 12765.81250 (10) (11) (12) Coeff Var Root MSE RENFOR Mean 8.025541 2.683540 33.43750

(8) Pr > F F F F F) Coeficiente de determinación (R-Square) Coeficiente de variación (CV) Raíz cuadrada del Cuadrado medio del error (Root MSE) Promedio general de la variable de respuesta (ALTURA Mean)

Como se puede apreciar, la salida del análisis de varianza, nos presenta en este caso cuatro partes: (13) (14) (15)

La primera constituida por las fuentes de variación Model, Error y Corrected Total; La segunda y tercera presenta nuestras variables de clasificación o estudio DOSIS y MUESTRA(DOSIS), con la Suma de Cuadrados (SS) con el tipo I. La tercera presenta nuestras variables de clasificación o estudio DOSIS y MUESTRA(DOSIS), con la Suma de Cuadrados (SS) con el tipo III

Ing. Ramiro Raúl OCHOA TORREZ

47

INTRODUCCION AL MANEJO DEL SAS

(16)

La cuarta parte donde se menciona que para el calculo de los valores de F value (Fc) para DOSIS se tomo como cuadrado medio del error a MUESTRA(DOSIS).

El ordenamiento se lo realizara en dos partes: 1° Parte Estos valores deben ser organizados para su mejor interpretación, primeramente se considera el punto (16) donde se considero como termino de Error a MUESTRA*DOSIS, los valores correspondientes a Dosis lo remplazamos en el punto (15) correspondientes el análisis de nuestras fuentes de variación considerando el error de tipo III. (15)

Source DOSIS MUESTRA(DOSIS)

DF 3 8

Type III SS 12469.89583 36.66667

Mean Square 4156.63194 4.58333

F Value 577.20 0.64

Pr > F F F F F F 0.05  ns (No significativo) Pr ≤ 0.05  * (Significativo al 5% ) Pr ≤ 0.01  ** (Altamente significativo al 1%)

Si el valor de: Si el valor de: Si el valor de:

Conclusión La conclusión de los resultados como ya se indico, se la realiza tomando en cuenta el valor de probabilidad presentada, en el caso de Dosis el valor de Pr > F = 0.0001, siendo este valor inferior al 0.05 e inferior al 0.01, por lo que se acepta la Hipótesis alterna (Ha: 0 t/ha ≠ 2 t/ha ≠ 4 t/ha ≠ 6 t/ha), por lo que podemos indicar que entre dosis se encuentran diferencias altamente significativas en el rendimiento de forraje. En el caso de las muestras su valor de Pr > F es igual a 0.7418, valor superior a 0.05, por lo se acepta la Hipótesis nula (Ho: m1 = m2 = m3), por lo que señalamos que entre muestras no se tienen diferencias estadísticas o significativas, siendo las muestras de cada tratamiento similares en el rendimiento de forrajes. Por otra parte se tuvo un coeficiente de variación de 8.025541%, debajo de 30%, por lo que los datos se encuentran dentro de los márgenes de aceptabilidad, con un promedio general de 33.43750 de rendimiento de forraje. Otro valor que se puede considerar para la interpretación de resultados es el R-Square (R2) que es el coeficiente de determinación con un valor de 0.979692, valor que multiplicando por 100 será 97.9692%, es decir que el 97.9692% del rendimiento de forraje esta influenciado por las dosis y las muestras, el restante porcentaje se algo más del 2% se debe a otros factores. Más abajo nos presenta la salida de la prueba de la DMS, de donde analizando su salida tenemos: The SAS System The GLM Procedure Least Squares Means

DOSIS 0_t_ha 2_t_ha 4_t_ha 6_t_ha

RENFOR LSMEAN

LSMEAN Number

21.3333333 21.5833333 30.1666667 60.6666667

1 2 3 4

Least Squares Means for effect DOSIS Pr > |t| for H0: LSMean(i)=LSMean(j)

(1)

Dependent Variable: RENFOR i/j

1 2 3 4

1 0.8208 F 0.0471

PROD Mean 832.0000

Mean Square 1539.00000 24382.33333 49920.33333

F Value 1.25 19.82 40.57

Pr > F 0.4443 0.0480 0.0241

La salida del ANVA, en este caso nos presenta 2 partes: (1) (2)

La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación. La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son: Bloques, Columnas y Tratamientos.

Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2) donde se tienen todas las fuentes de variación (Bloque, Columna y Tratamientos) en la primera parte (1) en vez de los valores de Model:

(1)

Source Model

66

DF 6

Sum of Squares 151683.3333

Mean Square 25280.5556

F Value 20.55

Pr > F 0.0471

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO CUADRADO LATINO Error Corrected Total

2 8 R-Square 0.984037

Source BLOQ COL TRAT

(2)

2460.6667 154144.0000

Coeff Var 4.215878 DF 2 2 2

1230.3333

Root MSE 35.07611

Anova SS 3078.00000 48764.66667 99840.66667

PROD Mean 832.0000

Mean Square 1539.00000 24382.33333 49920.33333

F Value 1.25 19.82 40.57

Pr > F 0.4443 0.0480 0.0241

F Value 1.25 19.82 40.57

Pr > F 0.4443ns 0.0480* 0.0241*

Dando como resultado final para su interpretación mediante las reglas de decisión:   

Pr > 0.05  ns (No significativo) Pr ≤ 0.05  * (Significativo al 5% ) Pr ≤ 0.01  ** (Altamente significativo al 1%)

Si el valor de: Si el valor de: Si el valor de: Source BLOQ COL TRAT Error Corrected Total

DF 2 2 2 2 8 R-Square 0.984037

Sum of Squares 3078.00000 48764.66667 99840.66667 2460.6667 154144.0000

Coeff Var 4.215878

Mean Square 1539.00000 24382.33333 49920.33333 1230.3333

Root MSE 35.07611

PROD Mean 832.0000

Conclusión Como conclusión podemos indicar que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un valor de probabilidad (Pr > F) mayor a 0.05 (0.4443), en tanto que entre Columnas y Tratamientos se tienen diferencias significativas por que sus valores de probabilidad son inferiores a 0.05 (0.0480 y 0.0241 respectivamente) de lo cual concluimos que las diferentes dietas (A, B y C) presentan diferencias significativas con relación a sus valores de producción de leche. Teniéndose por otra parte un coeficiente de variación de 4.215878% mostrando un alto grado de confiabilidad de los datos y un promedio general de 832.00 litros producción de leche Por otra parte se puede agregar la sentencia MEANS BLOQ COL TRAT/DUNCAN; a todo el procedimiento y con esto se pide la realización de la prueba de medias de Duncan para Bloques, Columna y Tratamientos.

Ing. Ramiro Raúl OCHOA TORREZ

67

INTRODUCCION AL MANEJO DEL SAS OPTIONS NODATE NONUMBER; DATA DCL; INPUT BLOQ $ COL TRAT $ PROD; CARDS; I 1 A 608 II 1 B 715 III 1 C 884 I 2 B 885 II 2 C 1087 III 2 A 771 I 3 C 940 II 3 A 766 III 3 B 832 ; PROC ANOVA; TITLE'DISEÑO CUADRADO LATINO'; CLASS BLOQ COL TRAT; MODEL PROD=BLOQ COL TRAT; MEANS BLOQ COL TRAT/DUNCAN; RUN;

(1)

Revisando la sentencia introducida tenemos: (1)

MEANS BLOQ COL TRAT/DUNCAN; realizara la prueba de medias de Duncan para los bloques, columnas y tratamientos.

Los resultados serán en este caso los mismos que se analizaron anteriormente, con la variante de que se adicionaron en la parte final la prueba de Duncan para Bloques, Columna y Tratamientos. La primera salida corresponde a los Bloques o Periodos: DISEÑO CUADRADO LATINO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Number of Means Critical Range

2 123.2

3 117.7

Means with the same letter are not significantly different. Duncan Grouping A A A A A

Mean 856.00

N 3

BLOQ II

829.00

3

III

811.00

3

I

Conclusión

68

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO CUADRADO LATINO

En el caso de los bloques que vienen a ser en nuestro ejemplo los Periodos, se confirma la no significancia encontrada en el análisis de varianza, observándose que ninguno de los bloques o periodos es estadísticamente diferente (Presentan la misma letra “A”), pero si se tienen diferencias numéricas donde el Bloque II o Periodo II es el que registra los valores más altos de producción de leche, siendo el Periodo I el que menor promedio de producción de leche registro. La siguiente salida corresponde a las Columnas o Vacas: DISEÑO CUADRADO LATINO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Number of Means Critical Range

2 123.2

3 117.7

Means with the same letter are not significantly different. Duncan Grouping A A B A B B

Mean 914.33

N 3

COL 2

846.00

3

3

735.67

3

1

Conclusión En el caso de las Columnas o Vacas se observa que estas son diferentes (Presentan diferentes letras A y B), donde la Columna 2 o Vaca 2 es la es significativamente superior en producción de leche al resto de las Columnas o Vacas, en tanto que la Columna 1 o Vaca 1 es la que presenta el menor promedio de producción de leche, siendo este valor significativamente diferente al de las dos anteriores Columnas o Vacas. Por ultimo se tiene la que corresponde a los Tratamientos:

Ing. Ramiro Raúl OCHOA TORREZ

69

INTRODUCCION AL MANEJO DEL SAS DISEÑO CUADRADO LATINO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Number of Means Critical Range

2 123.2

3 117.7

Means with the same letter are not significantly different. Duncan Grouping A

Mean 970.33

N 3

TRAT C

B B B

810.67

3

B

715.00

3

A

Conclusión En el caso de los tratamientos en estos se forman 2 grupos claramente diferenciados con letras diferentes (Duncan Grouping), de estos el tratamiento C es el que mayor promedio de producción de leche obtuvo, siendo este valor significativamente superior al de los tratamientos B y A, siendo que esos dos últimos tratamientos presentan estadísticamente similares promedios de producción de leche. También se puede pedir la realización de la prueba de Medias de Scheffe, esto se lo hace añadiendo el respectivo comando a la parte de procedimiento: OPTIONS NODATE NONUMBER; DATA DCL; INPUT BLOQ $ COL TRAT $ PROD; CARDS; I 1 A 608 II 1 B 715 III 1 C 884 I 2 B 885 II 2 C 1087 III 2 A 771 I 3 C 940 II 3 A 766 III 3 B 832 ; PROC ANOVA; TITLE'DISEÑO CUADRADO LATINO'; CLASS BLOQ COL TRAT; MODEL PROD=BLOQ COL TRAT; MEANS TRAT/SCHEFFE; RUN;

(1)

Revisando la sentencia introducida tenemos: (1)

MEANS TRAT/SCHEFFE; realizara la prueba de medias de Scheffe para tratamientos. 70

Ing. Ramiro Raúl OCHOA TORREZ

DISEÑO CUADRADO LATINO

Los resultados del ANVA serán en este caso los mismos que se analizaron anteriormente, con la variante de que solo se tendrá la prueba de medias para Tratamientos. Siendo los resultados: DISEÑO CUADRADO LATINO The ANOVA Procedure Scheffe's Test for PROD NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Critical Value of F 19.00000 Minimum Significant Difference 176.55 Means with the same letter are not significantly different. Scheffe Grouping

Mean

N

TRAT

A A A

970.33

3

C

810.67

3

B

715.00

3

A

B B B

Conclusión En el caso de los tratamientos en estos se forman 2 grupos claramente diferenciados con letras diferentes (Scheffe Grouping), de estos el tratamiento C es el que mayor promedio de producción de leche obtuvo, siendo este valor significativamente superior al de los tratamientos B y A, siendo que esos dos últimos tratamientos presentan estadísticamente similares promedios de producción de leche. En muchos de los ensayos solo es necesario realizar la prueba de medias (Duncan, Tukey, LSD, etc.) de los tratamientos, para la realización de las pruebas de medias de los bloques y columnas, se deben tomar en cuenta que el experimento es llevado a cabo en la parte agrícola o en la parte pecuaria. En el caso anterior si se lleva a cabo en la parte pecuaria las fuentes de variación bloques y columnas pueden tener otra significación, como se vio en el ejercicio anterior en el cual las columnas representan las vacas y los bloques los periodos. En el caso de un ensayo en la parte agrícola, se deben considerar que representa los bloques o columnas, o si se tienen dos fuentes de variación en el terreno.

Ing. Ramiro Raúl OCHOA TORREZ

71

INTRODUCCION AL MANEJO DEL SAS

8. COMPARACIONES ORTOGONALES

8.1.

Comparaciones ortogonales de experimentos simples

Ejercicio Los siguientes datos provenientes de rendimiento de kg/ha, corresponden a el cultivo de quinua, bajo la incorporación de abonos orgánicos y fertilizantes químicos, el ensayo fue realizado bajo un diseño bloques al azar con cuatro bloques (IBTA, 1988) N° T1 = T2 = T3 = T4 = T5 = Bloque I II III IV

T1 233.20 182.57 231.97 340.23

Tratamiento Testigo 4 t MO 8 t MO 12 t MO 46 – 00 – 00 (Urea)

T2 243.12 314.76 253.56 478.64

T3 300.71 209.06 375.17 476.44

T4 549.08 441.61 408.49 658.33

T5 562.36 506.91 554.16 520.40

En el caso de las comparaciones ortogonales, se debe considerar que los tratamientos puedan agruparse, planeando comparaciones independientes con los totales de cada tratamiento. Para esto recurriremos al uso de coeficientes para su desarrollo, respetando las reglas definidas para estos, donde el número de comparaciones independientes se obtiene con la formula (t – 1), donde t es el numero de tratamientos. Siendo este valor igual al número de GL de los tratamientos. Los tratamientos deben estar hábilmente agrupados y seleccionados, cuando son independientes reciben el nombre de ortogonales. La prueba es utilizada para comparar grupos de tratamientos y entre tratamientos. La suma de los coeficientes debe ser igual a 0 (cero), y la suma de los productos de los coeficientes correspondientes a las comparaciones cualesquiera debe ser necesariamente igual a cero. Para nuestro ejercicio tenemos cinco tratamientos, y por tanto el número de comparaciones que tenemos será: #C = t – 1 #C = 5 – 1 #C = 4 (4 comparaciones) Formulando las comparaciones mediante los coeficientes y respetando las reglas para su formulacion tenemos: # Comparación C1 C2 C3 C4

72

Testigo T1 4 0 0 0

4 t MO T2 –1 1 2 0

8 t MO T3 –1 1 –1 1

12 t MO T4 –1 1 –1 –1

Urea T5 –1 –3 0 0

Σ 0 0 0 0

Ing. Ramiro Raúl OCHOA TORREZ

COMPARACIONES ORTOGONALES

Este paso es importante para la realización de Comparaciones Ortogonales en el SAS, porque son los coeficientes los que deben introducirse en el PROGRAM EDITOR del SAS, la opción de contrastes ortogonales solo esta disponible cuando el procedimiento PROC es GLM: OPTIONS NODATE NONUMBER; DATA DBA; INPUT BLOQ $ TRAT $ REND; CARDS; I T1 233.2 II T1 182.57 III T1 231.97 IV T1 340.23 I T2 243.12 II T2 314.76 III T2 253.56 IV T2 478.64 I T3 300.71 II T3 209.06 III T3 375.17 IV T3 476.44 I T4 549.08 II T4 441.61 III T4 408.49 IV T4 658.33 I T5 562.36 II T5 506.91 III T5 554.16 IV T5 520.4 ; PROC GLM; TITLE'DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES'; CLASS BLOQ TRAT; MODEL REND=BLOQ TRAT/SS3; RUN; */TYPE-ORDER----------------------T1- T2- T3- T4- T5 */ CONTRAST'T1 VS T2 T3 T4 T5' TRAT 4 -1 -1 -1 -1; CONTRAST'T1 VS T2 T3 T4 T5' TRAT 4 -1 -1 -1 -1; CONTRAST'T2 T3 T4 VS T5' TRAT 0 1 1 1 -3; CONTRAST'T2 VS T3 T4' TRAT 0 2 -1 -1 0; CONTRAST'T3 VS T4' TRAT 0 0 1 -1 0; RUN;

(1)

(2) (2) (3) (4) (5) (6)

Revisando la sentencia introducida tenemos: (1) (2) (3) (4) (5) (6)

La primera parte es la que corresponde en este caso para un diseño bloques al azar, considerando bloques y tratamientos en el modelo. Revisando tenemos a TRAT como variable de estudio. CONTRAST’T1 VS T2 T3 T4 T5’ TRAT 4 –1 –1 –1 –1; Primer contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. CONTRAST’T2 VS T3 T4 T5’ TRAT 0 1 1 1 –3; Segundo contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. CONTRAST’T2 VS T3 T4’ TRAT 0 2 –1 –1 0; Tercer contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. CONTRAST’T3 VS T4’ TRAT 0 0 1 –1 0; Cuarto contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. RUN; ejecuta los comandos.

Ing. Ramiro Raúl OCHOA TORREZ

73

INTRODUCCION AL MANEJO DEL SAS

Lo que nos dará los siguientes resultados: DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES The GLM Procedure Class Level Information Class Levels Values BLOQ 4 I II III IV TRAT 5 T1 T2 T3 T4 T5 Number of observations 20 DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES The GLM Procedure Dependent Variable: REND Sum of Source DF Squares Mean Square F Value Model 7 333112.8945 47587.5564 11.06 Error 12 51620.9708 4301.7476 Corrected Total 19 384733.8653 R-Square 0.865827 Source BLOQ TRAT

Coeff Var 16.72992 DF 3 4

Root MSE 65.58771

Type III SS 76221.3290 256891.5655

Pr > F 0.0002

REND Mean 392.0385

Mean Square 25407.1097 64222.8914

F Value 5.91 14.93

Pr > F 0.0103 0.0001

La primera parte corresponderá al análisis de varianza de un diseño bloques al azar, el cual lo organizamos como ya mencionamos anteriormente. La segunda parte corresponde al análisis de varianza de las comparaciones ortogonales: DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES The GLM Procedure Dependent Variable: REND Contrast (1) (2) (3) (4)

T1 T2 T2 T3

VS T3 VS VS

T2 T3 T4 T5 T4 VS T5 T3 T4 T4

DF

Contrast SS

Mean Square

F Value

Pr > F

1 1 1 1

105191.7106 61814.0656 29311.1672 60574.6221

105191.7106 61814.0656 29311.1672 60574.6221

24.45 14.37 6.81 14.08

0.0003 0.0026 0.0228 0.0028

La salida del ANVA de comparaciones ortogonales los interpretamos de la siguiente forma: Como fuente de variación toma a la primera comparación T1 VS T2 T3 T4 T5. (1) (2) Como fuente de variación toma a la segunda comparación T2 VS T3 T4 T5. Como fuente de variación toma a la tercera comparación T2 VS T3 T4. (3) Como fuente de variación toma a la cuarta comparación T3 VS T4. (4) En función de las reglas de decisión similar a las del ANVA interpretamos y realizamos las conclusiones:   

Si el valor de: Si el valor de: Si el valor de: 74

Pr > 0.05  ns (No significativo) Pr ≤ 0.05  * (Significativo al 5% ) Pr ≤ 0.01  ** (Altamente significativo al 1%) Ing. Ramiro Raúl OCHOA TORREZ

COMPARACIONES ORTOGONALES

Dándonos finalmente: T1 T2 T2 T3

VS T3 VS VS

T2 T3 T4 T5 T4 VS T5 T3 T4 T4

1 1 1 1

105191.7106 61814.0656 29311.1672 60574.6221

105191.7106 61814.0656 29311.1672 60574.6221

24.45 14.37 6.81 14.08

0.0003** 0.0026** 0.0228* 0.0028**

Conclusión Como conclusión podemos indicar que entre la comparación del Testigo (T1) con el resto de los tratamientos con aplicación (T2, T3, T4 y T5) existen diferencias altamente significativas en el rendimiento del cultivo de quinua, en el caso de la segunda comparación tenemos que los abonos orgánicos (T2, T3 y T4) comparada con la Urea (T5) presentan diferencias altamente significativas en el rendimiento de quinua, la comparación del tratamiento 2 (4 t MO) con los tratamientos 3 y 4 (8 y 12 t MO) presentan significancia (Pr < 0.05) en los valores del rendimiento de quinua; por ultimo en la comparación del tratamiento 3 (8 t MO) con el tratamiento 4 (12 t MO) presentan diferencias altamente significativas (Pr < 0.01) en el rendimiento de quinua.

Ing. Ramiro Raúl OCHOA TORREZ

75

INTRODUCCION AL MANEJO DEL SAS

9. EXPERIMENTOS FACTORIALES 9.1.

DCA con arreglo factorial

9.1.1. DCA con arreglo factorial – dos factores Ejercicio En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta de Kochia scoparia, bajo dos condiciones de cultivo y de cuatro alturas de corte (Rodríguez 1991). Condiciones Altura de Corte (cm) 25 Invierno 50 75 100 25 Verano 50 75 100

I 14.9 17.5 20.7 22.5 16.8 19.9 23.5 25.8

II 14.3 16.6 19.6 21.9 17.3 20.3 23.2 26.4

III 15.0 17.2 21.4 22.6 16.4 21.4 23.0 25.9

IV 14.3 16.3 20.3 21.8 17.1 20.8 24.1 27.1

Modelo lineal aditivo: Yijk = µ + αi + βj + αβij + εijk Donde: Yijk µ αi βj αβij εijk

= Una observación = Media poblacional = Efecto del i – esimo nivel del factor A (Condiciones) = Efecto del j – esimo nivel del factor B (Altura de corte) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Condicion x Altura de corte) = Error experimental A B Repetición

i… j… k…

a… b… r…

1… 1… 1…

2 4 4

Las hipótesis a probar serán: Ho:

Invierno = Verano (Condiciones) 25 = 50 = 75 = 100 (Altura de corte cm) Invierno – 25 = … = Verano – 100

Ha:

Invierno ≠ Verano (Condiciones) 25 ≠ 50 ≠ 75 ≠ 100 (Altura de corte cm) Invierno – 25 ≠ … ≠ Verano – 100

Introduciendo los datos en el SAS tendremos:

76

Ing. Ramiro Raúl OCHOA TORREZ

EXPERIMENTOS FACTORIALES OPTIONS NODATE NONUMBER; DATA DCAFAC1; INPUT CONDICION $ ALTURA FIBRA; CARDS; INVIERNO 25 14.9 INVIERNO 50 17.5 INVIERNO 75 20.7 INVIERNO 100 22.5 VERANO 25 16.8 VERANO 50 19.9 VERANO 75 23.5 VERANO 100 25.8 INVIERNO 25 14.3 INVIERNO 50 16.6 INVIERNO 75 19.6 INVIERNO 100 21.9 VERANO 25 17.3 VERANO 50 20.3 VERANO 75 23.2 VERANO 100 26.4 INVIERNO 25 15.0 INVIERNO 50 17.2 INVIERNO 75 21.4 INVIERNO 100 22.6 VERANO 25 16.4 VERANO 50 21.4 VERANO 75 23.0 VERANO 100 25.9 INVIERNO 25 14.3 INVIERNO 50 16.3 INVIERNO 75 20.3 INVIERNO 100 21.8 VERANO 25 17.1 VERANO 50 20.8 VERANO 75 24.1 VERANO 100 27.1 ; PROC GLM; CLASS CONDICION ALTURA; MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA; MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN; RUN;

(1) (2) (3) (4) (5)

(6) (7) (8) (9) (10)

Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7)

Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCAFAC; le indicamos que genere un archivo con el nombre DCAFAC. Con INPUT CONDICION $ ALTURA FIBRA; le indicamos que ingrese las variables Condición, Altura y Fibra. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos nuestros datos ordenados en forma de filas. PROC GLM; le indica que realice el calculo de análisis de varianza considerando el modelo lineal. CLASS CONDICION ALTURA; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Condición y Altura.

Ing. Ramiro Raúl OCHOA TORREZ

77

INTRODUCCION AL MANEJO DEL SAS

(8)

MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con arreglo factorial (Yijk = µ + αi + βj + αβij + εijk), donde se coloca como: Yijk = µ + αi + βj + αβij + εijk Variable de respuesta = Variables de estudio Fibra = Condición Altura Condición*Altura No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo.

(9) (10)

MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN; le pedimos al SAS que realice la prueba de medias de Duncan para los factores de estudio Condición y Altura, y también nos presente los promedios de la interacción de ambos factores. Con RUN; le señalamos que las sentencias anteriores son ejecutables.

Los resultados del SAS serán en la primera parte el análisis de varianza: The SAS System The GLM Procedure Class Level Information Class Levels Values CONDICION 2 INVIERNO VERANO ALTURA 4 25 50 75 100 Number of observations The SAS System The GLM Procedure

32

Dependent Variable: FIBRA

(1)

Source Model Error Corrected Total

DF 7 24 31 R-Square 0.983594

(2)

Source CONDICION ALTURA CONDICION*ALTURA

Sum of Squares 419.5246875 6.9975000 426.5221875

Coeff Var 2.675165 DF 1 3 3

Mean Square 59.9320982 0.2915625

Root MSE 0.539965

Anova SS 84.8253125 330.7684375 3.9309375

F Value 205.55

Pr > F F