Unidades Estadisticas

Descripción completa

Views 218 Downloads 3 File size 449KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ELEMENTOS O UNIDADES: Son las personas animales u objetos de cualquier tipo que contienen determinada información, puede ser simple o compuesta; Es simple cuando en el caso de una persona Compuesta en el caso de una familia o empresas. Por ejemplo, 1) si se evalúa la memoria de los aspirantes a un puesto en el restaurante X, las unidades son cada uno de los aspirantes. 2) Si se estudia el fenómeno de deserción escolar de las escuelas primarias públicas de alguna localidad , las unidades son cada una de las escuelas de dicha región. 3) Si a un comerciante le interesa el volumen de ventas semanal de su comercio durante el último año, las unidades son cada una de las semanas de ese año. POBLACIÓN_DE INDIVIDUOS: Es el conjunto de todos los elementos, individuos o unidades estadísticas que poseen determinadas características que son comunes a todos los elementos que integran el . Frecuentemente se alude a ella como población objetivo, en razón de que sobre ella recae el objetivo o el interés del estudio. Ejemplos: 1) el conjunto de aspirantes al empleo del restaurante X, 2) el conjunto de escuelas primarias públicas de 3) el conjunto de semanas a lo largo del último año. VARIABLE Valor atributo que varia (cambia o se modifica): Es una prde la que se desea conocer su existencia, tamben se le conoce com Carácter: propiedad rasgo o cualidad de los elementos de la población, se denota siempre con un símbolo representado por letra, como x y, g, x, La variable puede tomar un valor , que también es llamado modalidad, cualquiera dentro de un conjunto de elementos determinado denominado dominio de la variable o rango, si la variable no puede asumir otro valor o no varía se le llama constante. Las variables estadísticas se clasifican de acuerdo con el tipo de valores que pueden tomar en: Variable cualitativa. Es aquella cuyos valores expresan atributos. Ejemplo: Tipo de trastorno que presentan los pacientes de un servicio de salud mental (de ansiedad, de atención, de sueño, etc.) Variable cuasi-cuantitativa. Es aquella cuyos valores indican un orden o jerarquía. Ejemplo: Nivel de deserción escolar (bajo, medio, alto). Variable cuantitativa. Es aquella cuyos valores expresan cantidades numéricas. Dentro de las variables cuantitativas se diferencian las llamadas discretas de las continuas. Se consideran discretas aquellas cuyos valores son puntos aislados; esto es, cuando todo valor tiene un consecutivo. Se dice que dos valores son consecutivos cuando no puede existir un valor de la variable entre ellos. Ejemplo: Cantidad de palabras recordadas. Se consideran continuas a las variables que, al menos teóricamente, pueden tomar cualquier valor dentro de un intervalo numérico. Ejemplo: Tiempo de reacción ante un estímulo. Hay variables que no son discretas ni continuas pero no se tratarán en este curso. PARÁMETRO: Es una característica fija, generalmente numérica, de la población de valores de una variable. Por ejemplo, si la variable es el tiempo de reacción de sujetos entrenados ante un estímulo, un parámetro es el tiempo Usualmente el parámetro resulta siendo la moda de un estudio sensal,

ESTADIGRAFO ESTADÍSTICO: Es un valor numérico (o funcion) que se refiere a una característica general de los elementos , pero obtenida de una muestra. Es una característica muestral y, como tal, es una variable porque sus valores dependen de la muestra que salga seleccionada (piense que dada una población pueden extraerse muchas muestras diferentes). Cada valor del estadístico se obtiene como función de las observaciones de una muestra. Por ejemplo, tiempo promedio de reacción de 10 individuos que fueron entrenados. Porcentaje de consumidores entre 100 encuestados que manifestaron tener una actitud positiva frente al producto. ESTIMADOR: Es un estadístico cuyos valores se consideran próximos a un parámetro que, por ser generalmente desconocido, se desea estimar. FRECUENCIA ABSOLUTA: Es la cantidad de veces que cada valor de la variable aparece en un conjunto de datos. La suma de todas las frecuencias absolutas coincide con la totalidad de los datos Unidades Estadisticas: Es el o los elementos de quien o de quienes se investiga una propiedad o una caracteristica; puede ser una familia, un animal una sustancia quimica, un grupo de la sociedad, un grupo de empresas etc etc. La unidad estadística puede ser simple o compuesta: Simple en el caso de una persona Compleja: en el caso de una familia o una empresa, en cualquiera de los casos se asume que el caso es individual. Poblacion o universo: Es el conjunto (grupo, total o general) de individuos o unidades estadísticas que posseen determinadas propiedades que son comunes a todos los elementos que integra el colectivo o conglomerado. La población se define como: El “conjunto completo de individuos, objetos o datos que el investigador está interesado en estudiar” Muestra: Una muestra es una porción representativa de una determinada población. Cuando no se puede realizar un censo, se recurre al muestreo, que es la herramienta que se utiliza para determinar qué porción de la realidad se estudiará. Existen distintos tipos de técnicas para conformar una muestra, entre ellas: TIPOS DE TECNICAS PARA CONFORMAR UNA MUESTRA Muestreo de conveniencia o por selección intencionada: aquí la muestra similar al universo objetivo es seleccionada a partir de métodos no aleatorios. La representatividad de dicha muestra es determinada por el investigador de manera subjetiva. Por funcionar de esta manera, las muestras suelen tener sesgos, por lo que lo ideal es recurrir a esta técnica cuando no quede ninguna otra alternativa. Muestreo aleatorio: en este todos los elementos que lo componen tienen exactamente la misma posibilidad de ser elegidos. Estos elementos son seleccionados de forma azarosa por medio de números aleatorios. Existen distintas formas de realizar el muestreo aleatorio, entre ellas:

1-Muestreo probabilıstico: es aquel en el que cada muestra tiene la misma probabilidad de ser elegida. Todos los elementos de la población tiene la misma posibilidad de ser elegido 2 . Muestreo no probabilistico: en el que la persona que selecciona la muestra es quien procura que sea representativa, dependiendo de su intencion u opinion, siendo por tanto la representatividad subjetiva. Es una muestra dirigida en donde la selección de elementos depénde del criterio del investigador 3. Muestreo sin norma: se toma la muestra sin norma alguna, de cualquier manera, siendo la muestra es representativa si la población es homogénea y no se producen sesgos de selección 1. Muestreo aleatorio simple: este método es muy simple y se caracteriza por la extracción de los individuos de una lista de forma azarosa. O sea al azar, Cuando el universo es muy numeroso y complejo, no suele resultar eficaz. 2. Muestreo sistemático: en este caso, el primer individuo se extrae al azar y a partir de este se elije, a intervalos constantes, el resto. Este método resulta más sencillo que el muestreo aleatorio simple y además no precisa de un listado elaborado para seleccionar a los individuos 3. Muestreo aleatorio estratificado: para realizar este muestreo se debe dividir a la población en grupos de acuerdo a un carácter específico y luego, cada uno de estos grupos es muestreado aleatoriamente, obteniendo así una parte que sea proporcional a la muestra. Estos muestreo son útiles cuando la característica que determina la división de la población está relacionada con la variable que quiera estudiarse. 4. Muestreo aleatorio por conglomerados: aquí, la población es dividida en grupos que posean características similares entre ellos. Luego de realizar esto, algunos grupos son analizados completamente dejando de lado al resto. 5. Muestreo mixto: en este caso se utilizan al menos dos de los métodos mencionados anteriormente. Esto ocurre cuando la población a estudiar es sumamente compleja, por lo que la aplicación de un solo método resultaría difícil o resultaría ineficiente. La muestra. Es el conjunto de la población construido de manera tal que conserva las características más relevantes de la población. Existen dos tipos de muestra: 1- Muestras probabilísticas: en estas, todos los elementos de la población tienen la misma posibilidad de ser escogidos. Se obtiene definiendo las características de la población, el tamaño de la muestra y a través de una selección aleatoria y/o mecánica de las unidades de análisis. para garantizar que la probabilidad exista hay que tomar ciertos requisitos, tales como “el azar estadístico”, este implica garantizar que un criterio de sorteo sea utilizado para elegir la muestra. 2- Muestras no probabilísticas: la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador o del que hace la muestra. No permite establecer probabilidades iguales, hay un sesgo.

Elegir entre una muestra probabilística y una no probabilística se determina con base en los objetivos de estudio, el esquema de la investigación y el alcance de sus contribuciones. ¿Cómo se hace una muestra probabilística? Las muestras probabilísticas tienen muchas ventajas, la principal es que puede medirse el tamaño de error en nuestras predicciones. Puede decirse incluso, que el principal objetivo en el diseño de una muestra probabilística es reducir al mínimo este error al que se le suele llamar error estándar. Para una muestra probabilística es necesario básicamente 2 cosas: determinar el tamaño de la muestra (n) y seleccionar los elementos maestrales de manera que todos tengan la misma probabilidad de ser elegidos. El tamaño de la muestra (tanto probabilística como no prob) depende de 1) Disposición poblacional o variabilidad: No podemos asumir la homogeneidad de la población, por lo tanto la muestra tiene que representar la heterogeneidad de la población. (cuánto + heterogénea es la población, + grande va a ser la muestra) 2) El nivel de confianza (significación estadística): Asociado a la probabilidad del éxito, si yo quiero un mayor nivel de confianza necesito agrandar el tamaño de la muestra. 3) El error de estimación: para tener un menor error de estimación, debo aumentar el tamaño de la muestra. A partir de estos 3 criterios elijo el tamaño de la muestra (“n”), no necesariamente el “n” más grande es mejor, depende también de la manera en que fueron seleccionados los casos. Existen “errores muestrales” (es un problema de estimación, por ejemplo si usaste un nivel de confianza menor del que necesitabas) y “no muestrales” (cuestiones de relevamiento, por ejemplo, si en los cuestionarios hay preguntas ambigüas) estos últimos no se pueden medir. REPRESENTATIVIDAD: Una muestra representativa es aquella que permite afirmar que las características y fenómenos hallados en la muestra se pueden generalizar a toda la población, es decir, si la muestra lo tiene, lo debe tener toda la población evaluada. Para hallar una muestra representativa hay que ceñirse a procedimientos estadísticos muy estrictos, dependiendo de las características de la población como edad, ocupaciones, frecuencias, tiempos, tamaños etc .... Forma de seleccionar una muestra: Definir los sujetos que van a ser medidos Deleimitar la población, si es probalistica puede ser ssimple, estrateficada,y por racimos , si es no probalistica sujetos voluntarios, experimentos, sujetos-tipo y por cuotas. Definir el tamaño de la muestra Aplicar el procedimiento desolucion Obtener la muestra Para seleccionar una muestra lo primero que hay que hacer es definir la unidad de análisis. El “quienes van a ser medidos” depende de precisar claramente el problema a investigar y los objetivos de la investigación.

Una vez definida la unidad de análisis, hay que delimitar la población que va a ser estudiada y sobre la cual se pretende generalizar los resultados. La población es el conjunto total de las unidades de análisis. Un estudio no será mejor por tener una población más grande, sino que la calidad del trabajo estriba en delimitar claramente la población con base a los objetivos del estudio. Las poblaciones deben situarse claramente en torno a sus características de contenido, lugar y en el tiempo. Un da to e s ta dí s ti c o e s ca da u n o d e lo s va lo re s qu e se h a o b t en id o a l re a liza r u n e stu d io e sta d íst ico . UN DATO ESTADISTICO es toda aquella información o testimonio sobre determinado fenomeno de la naturaleza, la sociedad o el pensamiento pueden ser un atributo que es igual a cualidad o un valor que es igual a cantidad.. Aquiere la connotación de variable estadsitica cuando la cualidad o valor identificado en un fenomeno individual o colectivo existe y se desa observavar, registrar, clasificar, agrupar, sumarizar con un fin estadístico determinado. Ejemplo: Juan gomes es un estudiante regular, inscrito rnel presente ciclo en ests institución, su edad 18 años 3 mses y 5 dias soltero,masculino, nacido en la capital de este país y a aprobado todos los cursos de los ciclos escolares anteriores: Analisis: a- Juan Gomez es la unidad estadística (simple y finita) es el fenómeno caso de estudio individual. b- La población o universo se puede adumir que son todos los estudienates inscritos en esta institución el presente año escolar c- Los datos o variables a observar son: 1-Cuantitativa (valor) continua discreta: es Un estudiantes (no admite fraccionamiento) cuantitativa valor discontinua edad 18 años 3 meses y 5 dias. 2- cualitativas: estado Civil: soltero sexo masculino lugar de ancimiento o nacionalidad esta capital, este país grado académico al que corresponde etc.

Informacion: La estadística es un lenguaje que permite comunicar información basados en datos cuantitativos. Estadístico y Parámetro Estadístico : valor numérico que describe una característica de la muestra y se obtiene mediante la manipulación algebraica de sus datos Ejemplo : Suponga se tomó una muestra representativa de los estudiantes regulares de la Universidad de los Andes. Para esta muestra se calculó: edad promedio, rendimiento promedio, porcentaje de estudiantes que fuman. Estadístico y Parámetro Parámetro : valor numérico que describe una característica de la población (Pardo Merino). Los parámetros se estiman a partir de la información aportada por una muestra de la población. Ejemplo : Si se considera como universo a todos los estudiantes regulares de la Universidad de Los Andes, la edad promedio de estos, el porcentaje de estudiantes de sexo femenino que fuman, el ingreso medio todos los estudiantes, son valores que describen a este conjunto. Contenido Estadístico y Parámetro Estadístico : valor numérico que describe una característica de la muestra y se obtiene mediante la manipulación algebraica de sus datos. (Pardo Merino) Ejemplo : Suponga se tomó una muestra representativa de los estudiantes regulares de la Universidad de los Andes. Para esta muestra se calculó: edad promedio, rendimiento promedio, porcentaje de estudiantes que fuman. “La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de información numérica”. Ejemplo: Un director de escuela desea conocer las aptitudes de cinco secretarias que trabajan en dicha institución. Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 82, 85, 95, 92 y 91. La medida estadística que emplea el Director es la aptitud promedio o media aritmética, la cual es la suma de los valores obtenidos dividida por el número de observaciones. Entonces, la calificación promedio es: 82+85+95+92+91 = 445 = 89 55 28 El cálculo de la media aritmética, simple como es, es una parte importante de la estadística descriptiva. El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna inferencia o generalización acerca de las aptitudes de

otras secretarias. Este método es de naturaleza descriptiva, debido a que el promedio condensa y describe la información obtenida, por ejemplo en el caso de las secretarias significa que el promedio de las aptitudes de las cinco secretarias es 89%. La descripción de los datos también puede hacerse usando representaciones gráficas como veremos posteriormente. Estadística Inferencial Si el interés del Director de la escuela va más allá de la información obtenida, necesitará otras técnicas distintas a los métodos descriptivos. Por ejemplo; podría desear conocer la aptitud promedio de las demás secretarias, pero carece del tiempo o de los recursos para aplicar una prueba a todas ellas. Podría utilizar la calificación promedio de las cinco secretarias como base para realizar una inferencia o estimación acerca de la aptitud promedio de todas las secretarias. Con ese fin, necesitará conocer otra rama de la Estadística conocida como Estadística Inferencial o Inferencia Estadística. Definición La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas Escala de medición, es una clasificación acordada con el fin de describir la naturaleza de la información contenida dentro de los números asignados a los objetos y, por lo tanto, dentro de una variable Escalas de medición son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales. Las tablas se explicarán por sí mismas enteramente. como los gráficos, se ha de dar suficiente información en el título y en los encabezamientos de columnas y filas de la tabla para permitir que el lector identifique fácilmente su contenido. Como el título será por lo general lo primero que se lee en detalle, deberá suministrar toda la información esencial sobre el contenido de la tabla y deberá especificar el tiempo, lugar, material ó estudio experimental y relaciones que se presenten en la tabla. Para cada variable numérica se han de dar las unidades. La función del rayado es dar claridad de interpretación. Las anotaciones de numéricas del cero se han de escribir explícitamente. Una anotación numérica no debe comenzar con una punto decimal.

Los números que indican valores de la misma característica se han de dar con el mismo número de decimales.Introducción . Gráficos estadísticos Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia (coordenadas), permiten presentar información cuantitativa. La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla. Gráficos estadísticos Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.

TABLAS: El manejo de la información requiere de la ordenación de datos de tal forma que permita la obtención de una forma más fácil la obtención de conclusiones acerca de la muestra. Una primera ordenación se realiza mediante el manejo de tablas, en las que se ordenan los datos de acuerdo a ciertas características de los dato s. El manejo de datos discretos permite la manipulación de tablas, sobre todo cuando el número de datos no es muy reducido. manipulación de datos mediante el manejo de datos discretos y continuos. Las variables a ser manejadas en el estudio, en el caso de valores discretos, se puede representar mediante una tabla en la que se representa los variables mediante variables con nombre como (xi) y el

número de veces en que un dato se representara mediante frecuencias, frecuencias absolutas, frecuencias relativas. La representación de esta tabla mediante frecuencias se le conoce como tabla estadística cuya función es la determinar la frecuencia de cada clase las cuales aparecen a un lado de cada clase. La representación generalmente se da como sigue: Frecuencias simples y relativas Frecuencia f(xi)

Frecuencia relativa f(xi)/N= ni/N

X1 X2 X3 .

(el número veces ni que se repite Xi ) f(X1 )= n1 f(X2 )= n2 f(X3 )= n3 .

f(X1 )/N= n1/N f(X2 )/N= n2/N f(X3 )/N= n3/N .

.

.

.

.

.

.

.

. f(Xn-1 ) = nn-1 f(Xn)= nn

. f(Xn-1 )/N= nn-1/N f(Xn)/N= nn/N

Variable (Xi)

Xn-1 Xn

Un ejemplo de clasificación de datos. Se presenta una tabla que muestra las calificaciones obtenidas en un examen de matemáticas, y a su lado se presenta el número de alumnos que obtuvieron esas calificaciones. Variable (Ci) C i= calificaciones obtenidas

Frecuencias simples y relativas Frecuencia f(xi) =f i Frecuencia relativa h(xi) frecuencia absoluta (El número veces que se repite Xi ) (El número veces que se repite Xi ) h(xi) = f(xi)/n

10

1

1/20

9

3

3/20

8

2

2/20

7

3

3/20

6

4

4/20

5

2

2/20

4

1

1/20

3

2

2/20

2

1

1/20

1

1

1/20

En el caso de las variables continuas se debe de dividir los intervalos en los que debe de distribuirse la información, en este caso existen varios criterio sobre los que debemos de plantear la distribución. Uno de ellos, de los más comunes, consiste en determinar la cantidad de parámetros. Dentro de las frecuencias que aparecen en las tablas, las más comunes, son frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa. La frecuencia absoluta f(xi) se determina como el número de veces que se repite un dato xi. La frecuencia absoluta acumulada Fi: Para un determinado valor se considera como la frecuencia de cada dato xi mas la suma de los valores anteriores a dicha suma.

Fi   ni

donde

ni

son el numero de datos acumulados de las clases anteriores

La frecuencia relativa hi : es el cociente hi =fi/N , en algunas ocasiones se representa como ni/N, donde N es el número total de datos, corresponde a la suma de todas la frecuencias individuales de cada clase, y ni o fi los datos en cada

clase. Las frecuencias relativas representan el porciento de veces en que ocurre un dato. Como veremos en teoría de probabilidades, el concepto de frecuencia relativa nos conduce a un concepto de probabilidad. La frecuencia relativa acumulada Hi : es la suma de los valores acumulados de la frecuencia relativa n

Frecuencia relativa acumulada  H i   hi   i 1

fi N

la suma de las frecuencias relativas que se han acumulado, incluyendo la clase sobre la que se esta calculando la frecuencia relativa. Un diagrama de barras, también conocido como diagrama de columnas, este esta conformado por barras rectangulares de longitudes proporcional al de los valores que representan. Los gráficos de barras son usados para comparar dos o más valores. Las barras pueden estar orientadas horizontal o verticalmente y sirven para lo mismo. Ejemplo Este diagrama de ejemplo está basado en los resultados de la Elección del Parlamento Europeo en el 2004 y en el de 1999. La tabla siguiente lista el número de asientos asignadas a cada partido. Los resultados de 1999 han sido multiplicados por 1.16933, para compensar el cambio en el número de asientos entre estos años. Grupo Asientos (2004) Asientos (1999) a escala EURO 66 49 200 210 EFA 42 56 EDD 15 19 ELDR 67 60 EPP 276 272 UEN 27 36 Otros 66 29 Un gráfico de barras visualizando los resultados anteriores de la elección del 2004 se vería así: (Si todos los datos fuesen ordenados en orden descendiente este tipo de gráfico de barras sería llamado un Diagrama de Pareto.)

Este gráfico de barras muestra ambos resultados (2004 y 1999) BARRAS Consiste en dos ejes perpendiculares y una barra o rectángulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque también se puede hacer en el vertical). El otro eje se gradúa según los valores de las frecuencias. La representación gráfica consiste en dibujar una barra o un rectángulo para cada uno de los valores de la variable de altura igual a su frecuencia Diagrama de sectores (pastel): Consiste en dividir un círculo en tantos sectores como valores de la variable. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente. HISTOGRAMA : Es un caso particular del diagrama anterior en el caso de variables continuas. Si los intervalos son correlativos, los rectángulos aparecen pegados en la representación gráfica. En caso de que la amplitud de los intervalos no se igual para todos, hay que hacer coincidir el área del rectángulo con la frecuencia del intervalo. Un ejemplo muy utilizado de histograma es una pirámide de población.. POLIGONO DE FRECUENCIAS: Representamos dos ejes perpendiculares y representamos en el horizontal los valores de la variable y en el vertical las frecuencias. Representamos los puntos que tiene por primera coordenada el valor de la variable y por segunda el valor de la frecuencia. Uniendo todos los puntos obtenemos una línea poligonal que es la representación que buscamos. Tipos de gráficos estadísticos  Barras, Líneas, Circulares, ,Áreas, Cartogramas, Mixtos, Histogramas Otros  Dispersograma  Pictogramas Gráficos de barras verticales

Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar:  una serie  dos o más series (también llamado de barras comparativas)

Gráficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.  para una serie  para dos o más series

Gráficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser:  Verticales  Horizontales

Gráficos de barras comparativas Se utilizan para comparar dos o más series, para comparar valores entre categorías. Las barras pueden ser:  Verticales  horizontales

Gráficos de barras apiladas Se usan para mostrar las relaciones entre dos o más series con el total. Las barras pueden ser:  verticales  horizontales

Gráficos de líneas En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar:  una serie  dos o más series

Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.

Gráficos circulares Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar. Se pueden ser:  En dos dimensiones  en tres dimensiones

   

Gráficos de Áreas En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo. Pueden ser: Para representar una serie para representar dos o más series en dos dimensiones en tres dimensiones.

Cartogramas Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color.

Gráficos Mixtos En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series. Pueden ser:  en dos dimensiones  en tres dimensiones.

Histogramas Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma.

OTROS Gráficos En esta categoría se encuentran la mayoría de los gráficos utilizados en publicidad. Se los complementa con un dibujo que esté relacionado con el origen de la información a mostrar. Son gráficos llamativos, atraen la atención del lector. Dispersograma Los dispersogramas Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

Pictogramas

Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Pueden ser:  En dos dimensiones  En tres dimensiones.

Conclusión embargo, hoy día Excel dispone de muchos más tipos de gráficos. Cada tipo de gráfico se diferencia de los demás por la clase de marcas de datos que utiliza. Por ejemplo, el gráfico de columnas utiliza columnas como marcas de datos; el de círculos, utiliza círculos; etc. El motivo de que haya tantos tipos de gráficos diferentes no es solamente estético. Cada uno de los tipos de gráficos está especialmente indicado para representar los datos de una manera distinta. Por lo tanto, si quieres obtener la máxima eficacia al crear tus gráficos y presentar tus datos de la mejor manera posible debes tener esto muy en cuenta; que cada tipo de grafico esta destinado para una labor especifica. la media aritmética (también llamada promedio o simplemente media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.

la media aritmetica es como el promediO, primero se suman todos los numeros y luego se divide entre lo que son,,, ejemplo: 5,4,6,3,8,4 si los suman te dan 30 y ya nomas divides 30 entre los que son, los cuales son 6, osea que la media aritmetica de 5,4,6,3,8,4 es 5 De fi ni c i ón de medi a na : E s el va lo r que oc upa e l lu ga r ce n t ra l de todos l os da t o s cua ndo é s tos e s tán o rd e na d o s d e me n o r a ma yo r . L a me di a na se re pre se n t a p o r M e . La

me di a na

se

p u e de

ha l l a r

só lo

p a ra

va ri a bl es

c ua nti ta ti va s . Cá l c ul o de l a me di a na 1 O rde namos lo s da tos d e me nor a ma yor . 2 S i la se rie t i e n e un

núme ro i mpa r de me di da s

la

m e di a na e s la puntua c i ón c e ntral d e la m ism a . 2 , 3 , 4 , 4 , 5 , 5, 5 , 6 , 6 Me = 5 3 S i la se rie t ien e un número pa r de pu n tu a cione s la m e di a na e s la medi a e nt re la s d o s puntua c i one s ce ntra l e s . 7 , 8 , 9 , 1 0 , 1 1, 12 Me = 9 . 5 Cá l c ul o de l a me di a na pa ra da tos agrupa dos La

me di a na

se

e n cu en t ra

en

el

i nte r va l o

d o nd e

la

fr e c ue nc ia a c umul a da lle ga h a st a la mi ta d de la s uma de l as fr e c ue nc ia s a bs oluta s . E s d e cir t en em o s qu e b u sca r e l in t e rva lo e n e l qu e se e n cue n t re

.

L i e s e l lím it e in f e rio r d e la cla se d o nd e se en cu en tra la m e d ia n a.

e s la sem isum a d e la s f re cue n cia s ab so lu ta s. Fi-1

es

la

frec ue nc i a

a c umula da

a n t e rio r

a

la

cla se

m e d ia n a. a i e s la am p litu d de la cla se . L a me di a na e s inde pe ndi e nte d e la s a mpli tude s d e los i nte r va l os . E j e mpl o Ca l c ul a r la me dia na d e u na d ist rib u ció n e sta d íst ica qu e vie n e d a da po r la sigu ie n t e t ab la : fi

Fi

[6 0 , 63 )

5

5

[6 3 , 66 )

18

23

[6 6 , 69 )

42

65

[6 9 , 72 )

27

92

[7 2 , 75 )

8

100

100

1 0 0 /2 = 50 Cla se d e la m e d ian a : [6 6 , 6 9 )

De fi ni c i ón de moda : La mo d a e s el va lo r que ti e ne ma yo r f re cu e n cia ab so lu ta . S e re p re se n ta po r M o . S e p u ed e h a lla r la moda p a ra va ri a bl es c ua l i ta ti va s y c ua nti ta ti va s . Ha l l a r la moda d e la d ist rib u ción : 2 , 3 , 3 , 4 , 4 , 4, 5 , 5 M o = 4 S i e n u n gru p o h a y dos o va ri a s puntua c i one s co n la m i s ma

fre c ue nci a

y

e sa

f re cue n cia

es

la

má xim a ,

la

di s tr i buc i ón e s bi moda l o mul ti moda l , e s d e cir, t ie n e va ri a s m oda s . 1 , 1 , 1 , 4 , 4 , 5, 5 , 5 , 7 , 8 , 9 , 9 , 9 M o = 1 , 5 , 9 Cu a n do t od a s las puntua c i one s d e u n gru po t ie ne n la m i s ma frec ue nci a , no h a y moda . 2 , 2 , 3 , 3 , 6 , 6, 9 , 9 S i dos puntua c i one s a d ya c e nte s t ie n e n la fre c ue nc ia m á x i ma , la moda e s e l prome dio d e la s d o s pun t u a cio n e s a d ya ce n t e s. 0 , 1 , 3 , 3 , 5 , 5, 7 , 8 Mo = 4

Cá l c ul o de l a moda pa ra da tos a grupa dos 1 º Todos l os i nte rv a l os tie ne n la mis ma ampl i tud.

L i e s e l lím it e inf e rio r d e la cla se m od a l. f i e s la f re cu en cia a b so lut a de la cla se mo d a l. f i - - 1 e s la f re cu encia a b so lu t a inm ed ia t am en t e inf e rior a la cla se mo da l. f i - + 1 e s la f re cue n cia a b so lu t a inme d ia t am e nt e p o st e rio r a la cla se mo da l. a i e s la am p litu d de la cla se . T am b ié n se u t iliza o t ra fórmula de la moda qu e d a un va l or a pr ox i ma do d e é st a :

E j e mpl o Ca l c ul a r la moda d e u n a d ist rib u ción e sta d íst ica qu e vie n e d a da p o r la sigu ie n t e ta b la: fi [6 0 , 63 )

5

[6 3 , 66 )

18

[6 6 , 69 )

42

[6 9 , 72 )

27

[7 2 , 75 )

8 100

2 º Los i nte rva l os ti e ne n a mpli tude s di s ti nta s . E n p rime r lu ga r t en e mo s qu e h a lla r la s a lt u ra s.

L a cla se mo da l e s la qu e t ie ne m a yo r a lt u ra .

La

fórmul a

de

la

moda

a prox ima da

cua nd o

exist e n

d ist in t a s a mp lit u des e s:

E j e mpl o En

la

sigu ie n t e

t a b la

se

m uest ra

la s

ca lif icacio n e s

(su sp e n so , a p rob ad o , n ot a b le y so b re sa lie n te ) o b t en ida s p o r u n gru p o d e 5 0 a lum no s. Ca lc ul a r l a moda . fi

hi

[0 , 5 )

15

3

[5 , 7 )

20

10

[7 , 9 )

12

6

[9 , 1 0 )

3

3

50

De s vi a c i ón me di a : La d e svia ció n me d ia e s la m e d ia arit m é t ica de l os va lo re s a b so lut o s de la s d e svia cio n e s re sp e cto a la m ed ia . L a des vi a c i ón medi a se rep re sen t a p o r

E j e mpl o Ca lcu la r la de s vi a c i ón me dia de la d ist rib u ció n : 9 , 3 , 8 , 8 , 9 , 8, 9 , 1 8

De s vi a c i ón me di a pa ra da tos a grupa dos : S i l os da tos vi e ne n a gr upa dos e n una t a b la d e f re cue n cia s , l a e x pre s i ón de l a d e svia ció n me d ia e s :

E j e mpl o : Ca lc ul ar l a de svia ción me d ia de la dis tri buc i ón: xi

fi

xi · fi

|x - x |

|x - x | · f i

[1 0 , 15 )

12.5

3

37.5

9 . 2 86

2 7 . 85 8

[1 5 , 20 )

17.5

5

87.5

4 . 2 86

2 1 . 43

[2 0 , 25 )

22.5

7

1 5 7 .5

0 . 7 14

4 . 9 98

[2 5 , 30 )

27.5

4

110

5 . 7 14

2 2 . 85 6

[3 0 , 35 )

32.5

2

65

1 0 . 17 4

2 1 . 42 8

21

4 5 7 .5

9 8 . 57

La desviación estándar también se basa en la desviación respecto al promedio. Pero en lugar de usar valores absolutos, elevamos al cuadrado las desviaciones. Elevar al cuadrado las desviaciones elimina números negativos, porque al multiplicar dos números negativos resultaráun número positivo. La desviación estándar es, probablemente, la medida de dispersión más usada. Cuanto mayor es la desviación típica, mayor es la dispersión de los datos alrededor de la media LA formula de calculo es: Esto es, la desviación de cada puntuación respecto a la media es elevada al cuadrado, luego se suman todas las desviaciones cuadradas y se divide entre el número total de puntuaciones y a esta división se 2()XXsN−=Σ extrae la raíz cuadrada. Se interpreta en relación a la media La amplitud total se define como la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. Cuando la variable sea continua, para el cálculo deben utilizarse los límites exactos. Cuanto más grande sea el rango, mayor serála dispersión de los datos de una distribución. •La gran ventaja que presenta es su facilidad de cálculo. •El inconveniente que presenta esta medida, es que no considera todos los datos, es muy inestable e insensible al tamaño de la muestra. Ej.2:Dado el siguiente conjunto de datos: 3, 5, 8, 10, 12, 15 y 16. La amplitud total es igual a 15 Dónde:EjemploEj.1:Dado el siguiente conjunto de datos: 2, 2, 5, 7, 9, 9, 9, 10, 10, 12 y 18 .La amplitud total es igual a 16.Dónde:18216At=−16313 ESTADISTICAS ¿QUÉ ES LA ESTADÍSTICA? Estadística es una disciplina que sistematizado las técnicas de recolección y análisis de datos; nos permite inferir consecuencias a partir de estos.

Una población es el conjunto total de todos los individuos u objetos que poseen una característica común observable, que sean de interés en un estudio. Son ejemplos de una población:  Los alumnos de un curso.  Los pacientes de un hospital.  Los votantes de una comuna. Es un subconjunto de la población. Es de un tamaño menor al total de la población y la estadística pretende obtener conclusiones válidas que pueden aplicarse al total a partir de los resultados observados en la muestra. Son ejemplos de muestra:  1.820 televidentes escogidos al azar.  Los automovilistas que acceden a contestar una encuesta de opinión.  Uno de cada diez sacos de maíz de un cargamento. Se le llama marca de clase a los valores representativos de todos los valores incluidos en el intervalo respectivo; equivale a la semisuma de los límites inferior y superior de un intervalo. Los límites inferiores y superiores son los valores mínimo y máximo de una distribución. V.g: En un curso de 50 alumnos, se le pidió a un profesor que pesará a todos, los datos obtenidos son los siguientes: LIMITE SUPERIOR: 98 LIMITE INFERIOR: 38 La amplitud es el tamaño numérico que existe entre los intervalos. Considerando el siguiente ejemplo, la amplitud es igual a 5. intervalo

Frecuencia

11 - 15

5

16 - 20

8

El recorrido o campo de variación de la variable, es la diferencia entre el mayor valor que toma la variable y el menor. Por ejemplo, si el mayor valor es 85 y el menor es 17, entonces el recorrido es:

FRECUENCIAS.

Situación: En un curso de 50 alumnos, se le pidió a un profesor que pesará a todos los alumnos, los datos obtenidos son los siguientes: Intervalos (peso nº de alumnos Porcentaje (%) en kg.) 35 - 39

2

4

40 - 44

0

0

45 - 49

1

2

50 - 54

1

2

55 - 59

2

4

60 - 64

3

6

65 - 69

8

16

70 - 74

6

12

75 - 79

11

22

80 - 84

6

12

85 - 89

4

8

90 - 94

4

8

95 - 99

2

4

tabla construir un histograma y un polígono de frecuencia. DESVIACIÓN MEDIA Y LA DESVIACIÓN ESTANDÁR? Son valores que tipifican una muestra y en torno de los cuales se agrupan la mayoría de los datos, estos se denominan estadígrafos. A continuación definiremos cada uno de estos.  MEDIA ARITMETICA: Corresponde a la suma de todos los datos dividido por el numero total de ellos. Es lo que se conoce como "promedio". La media aritmética es uno de los estadígrafos más usados, por el hecho de ser de muy fácil cálculo.  MODA: Corresponde al valor que mas se repite, ésta sirve para describir una distribución si sólo se desea tener una idea aproximada y rápida de donde está la mayor concentración de observaciones. También se la utiliza para describir la forma de algunas distribuciones. Puede ocurrir que en un conjunto de datos no haya moda, como en: 3; 4; 7; 9; 10; 11; 13. O también que haya varios valores con la mayor frecuencia, en estos casos la moda queda indeterminada.  MEDIANA: La mediana es aquel valor que ocupa el lugar central, de modo que la mitad de los casos queda por debajo de ese valor y la otra mitad por encima. Por ejemplo si consideramos: 2; 3; 5; 7; 11; 13; 16; 18; 25. La mediana es M = 11. Si el conjunto de valores es un número par, entonces se calcula la media aritmética a los dos valores del centro.





DESVIACION MEDIA: Corresponde a la diferencia numérica entre una medida individual o número y la media aritmética de una serie completa de tales medidas o números. Por ejemplo, si la media de alturas de todos los alumnos de un curso es 1,51 m y uno de ellos mide 1,63m, la desviación media de su altura con respecto a la media es de +0.12 metros. DESVIACIÓN ESTANDAR: Es un dato que representa la variabilidad existente en un conjunto de datos, ya que por ejemplo dos conjuntos de datos pueden presentar la misma media aritmética, pero poseer distinta variabilidad, por eso este estadígrafo nos permite saber acerca de la variabilidad o dispersión de los datos. Matemáticamente se define como "la raíz cuadrada del promedio de los cuadrados de las desviaciones medias de cada valor de la variable con respecto de la media aritmética" ESTADIGRAFOS ANTERIORES. Intervalos

frecuencia

1–5

9

6 – 10

13

11 - 15

3

16 - 20

2

88 - 77 - 74 - 64 - 67 - 69 - 49 - 82 - 69 - 71 38 - 65 - 86 - 68 - 77 - 84 - 66 - 73 - 75 - 58 94 - 78 - 67 - 75 - 78 - 89 - 69 - 91 - 84 - 62 50 - 72 - 39 - 62 - 58 - 74 - 79 - 81 - 70 - 79 90 - 81 - 79 - 86 - 97 - 78 - 75 - 90 - 98 - 81. 88 - 77 - 74 - 64 - 67 - 69 - 49 - 82 - 69 - 71 38 - 65 - 86 - 68 - 77 - 84 - 66 - 73 - 75 - 58 94 - 78 - 67 - 75 - 78 - z9 - 69 - 91 - 84 - 62 50 - 72 - 39 - 62 - 58 - 74 - 79 - 81 - 70 - 79 90 - 81 - 79 - 86 - 97 - 78 - 75 - 90 - 98 - 81. Al organizar los datos en una tabla de frecuencia, se obtiene:

1 - 2 - 2 - 2 - 3 - 3 - 4 - 4 - 5 - 6 - 7 - 7 - 8 - 8 - 8 - 8- 8- 8 - 8 - 9 - 9 - 10 - 12 - 13 15 - 16 - 19 Media Aritmética:  = 7.5 27 " 7.5 es el valor de la media aritmética para los datos dados." Moda: De los datos anteriores, la moda corresponde a "8". Mediana: En los datos anteriores, la mediana es el valor "8" ennegrecido. DESVIACIÓN ESTANDAR:  las desviaciones medias de cada valor, calculadas anteriormente se elevan al cuadrado = 42.25 , 30.25 , 30.25 , 30.25 , 20.25 , 20.25 , 12.25 , 12.25 , 6.25 , 2.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 2.25 , 2.25 , 6.25 , 20.25 , 30.25 , 56.25 , 72.25 , 132.25. la suma de los cuadrados se divide por el promedio menos 1 = - 1 = 81.65  

calculamos la raíz cuadrada de 81.65 = " 81.65 = 9.04 el valor de la desviación estándar es de 9.04 en el ejemplo señalado.

DESVIACIÓN MEDIA: Datos = 1 - 2 - 2 - 2 - 3 - 3 - 4 - 4 - 5 - 6 - 7 - 7 - 8 - 8 - 8 D. media = -6.5 , -5.5, -5.5 , -5.5 , -4.5 , -4.5 , -3.5 , -3.5 , -2.5 , -1.5 , -0.5 , -0.5 , 0.5 , 0.5 , 0.5 Datos = 8 - 8 - 8 - 8 - 9 - 9 - 10 - 12 - 13 - 15 - 16 - 19 D. media = 0.5 , 0.5 , 0.5 , 0.5 , 1.5 , 1.5 , 2.5 , 4.5 , 5.5 , 7.5 , 8.5 , 11.5.-