Resumen Tema 1

TEMA 1. RESUMEN 1 Noción de Estadística. Estadística Descriptiva e inferencia estadística 2 Población, muestra y otros c

Views 66 Downloads 6 File size 176KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

TEMA 1. RESUMEN 1 Noción de Estadística. Estadística Descriptiva e inferencia estadística 2 Población, muestra y otros conceptos estadísticos básicos 3 Presentación

de

los

datos.

Distribuciones

de

frecuencias y representaciones gráficas 4 Fuentes estadísticas en España

Estadística I Grado en Turismo

1

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos

Población. Colectivo o grupo al que se refiere la investigación estadística. Elementos o unidades estadísticas. Entes reales o potenciales que integran la población.

Características o variables estadísticas. Propiedades, cualidades o rasgos que poseen los elementos de la población y que van a ser objeto del análisis estadístico.

Variables cuantitativas. Los caracteres que son susceptibles de ser medidos, es decir, aquéllos en los que el resultado de su observación se puede cuantificar de una manera objetiva.

Variables cualitativas o atributos. Los restantes. A las distintas formas en que se puede presentar un atributo se les denomina modalidades o categorías. Las variables cuantitativas se clasifican, atendiendo al número de valores que pueden tomar, en discretas y continuas. Las variables discretas son aquéllas que toman valores aislados, a lo sumo en cantidad numerable (número de hijos de la pareja, número de habitaciones de un hotel, número de clientes de un establecimiento, etc.). Las variables continuas son las que pueden tomar cualquier valor en un intervalo dado, por ejemplo, la altura de las personas comprendidas entre dos tallas fijas, los salarios percibidos por los trabajadores de un determinado sector, las distancias recorridas por los turistas que llegan a un cierto destino desde distintos puntos, el ingreso familiar mensual de las familias de un determinado barrio, la tasa mensual de parados en el sector industrial, etc. En cuanto a los atributos, se clasifican en ordinales y nominales, según que sus categorías sean susceptibles de ser ordenadas o no lo sean. Por otra parte, cuando las observaciones de una variable cuantitativa tienen una referencia temporal distinguiremos entre las correspondientes a variables que expresan flujos (es decir, aquéllas para las que el valor que asignamos a Estadística I Grado en Turismo

2

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos un periodo de tiempo corresponde a todo él tomado como unidad) y las correspondientes a variables que expresan stocks (es decir, aquéllas para las que el valor que asignamos a un periodo de tiempo corresponde a una medición realizada en un instante del mismo que se toma como representante). En las variables que expresan flujos tiene sentido la acumulación de los valores observados en distintos sub-periodos de uno más amplio para obtener el valor correspondiente a este último (por ejemplo, el dato semanal como suma de los datos diarios), mientras que en las que expresan stocks esto no tiene sentido. Por otra parte, atendiendo a que se observen las características de interés en toda la población o sólo en una parte de ella, hablaremos de observación exhaustiva, si se observan las variables de interés en todos y cada uno de los elementos de la población, parcial, cuando observamos las características de interés en una parte de la población y mixta, si algunas características se observan exhaustivamente y otras sólo parcialmente. A su vez, la observación parcial puede hacerse en una subpoblación (subconjunto de elementos de la población con alguna característica en común que los distingue del resto) o en una muestra (los elementos que la componen no presentan ninguna característica especial que los distinga del resto). La muestra puede ser aleatoria, si los elementos que la forman han sido seleccionados al azar, o no aleatoria que es aquélla en la que los elementos que la forman han sido seleccionados según ciertos criterios fijados de antemano. Cuando la observación es exhaustiva, las técnicas de la Estadística Descriptiva permiten obtener conclusiones válidas para toda la población; sin embargo, si la observación es parcial, con estas técnicas sólo podremos extraer conclusiones válidas para la subpoblación o muestra que ha sido observada. Si queremos extraer conclusiones válidas para la población a partir de lo observado en una parte de ella, será necesario que esa parte sea aleatoria y recurrir, además de a la descripción de los datos, a la Inferencia Estadística, lo que está fuera del alcance de este curso. Estadística I Grado en Turismo

3

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos Por otra parte, atendiendo a que nuestro interés se centre en conocer la evolución de una cierta característica a lo largo del tiempo o en su comportamiento en un instante del mismo, utilizaremos datos temporales (o longitudinales), transversales o un panel de datos, si nuestro interés se centra en ambos aspectos. Llamamos observaciones transversales a las obtenidas de los distintos elementos en un mismo instante o intervalo de tiempo. Por ejemplo, los salarios en distintos obreros, pero referidos todos al mismo tiempo. Sin embargo si, fijado un obrero, observamos el salario en distintos instantes o intervalos de tiempo,

obtenemos

observaciones

temporales.

Dichas

observaciones

expresan la evolución temporal del carácter estudiado en la unidad estadística sobre la que se realizan las distintas observaciones. Cada vez se utilizan con más frecuencia los paneles de datos, en los que se combinan observaciones de corte transversal con observaciones temporales. Por ejemplo, volumen salarial de los empleados de 50 empresas del sector de la construcción en Málaga en los últimos 10 años. Una característica distintiva entre las observaciones temporales y transversales es la de dependencia. Las observaciones temporales suelen ser dependientes, cada observación depende de las anteriores. Lo anterior, en general, no suele ocurrir cuando las observaciones son transversales.

Distribuciones de frecuencias: Datos no agrupados. Cuando disponemos de pocas observaciones o cuando, aún siendo muchas, aparecen pocos valores distintos, trabajaremos con distribuciones de datos no agrupados. Estas estadísticas se presentan en una tabla con dos columnas. En la primera columna suelen figurar los distintos valores de la variable, frecuentemente ordenados en orden creciente, y en la segunda el número de veces que cada valor ha sido observado, es decir, su frecuencia absoluta de observación.

Estadística I Grado en Turismo

4

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos Para un conjunto de

N

datos relativos a una variable

X,

emplearemos la

siguiente notación1:

x1, x2,…, xk, k≤N, son los distintos valores observados de la variable X, ordenados de menor a mayor. Para

i = 1, 2,…, k, ni es

valor

xi de la variable X; es decir, el número de veces que dicho valor

la frecuencia absoluta de observación del

aparece repetido en las observaciones. k

n1+ n2 +…+ nk = N, lo que, abreviadamente, se escribe

∑ ni = N .

i =1

Los distintos valores observados acompañados de sus frecuencias se presentan en una tabla como la siguiente:

xi x1 x2 … xi … xk ni n1 n2 … ni … nk N O, alternativamente,

xi x1 x2 . . . xk

ni n1 n2 . . . nk N

1

Si lo que manejamos es un atributo, al que representamos mediante A, escribiremos A1,…,Ak para representar las k modalidades distintas que A presenta en ese conjunto de N observaciones.

Estadística I Grado en Turismo

5

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos

Diagrama de barras. Para obtenerlo, marcamos en el eje de abscisas los distintos valores observados y sobre cada uno de ellos se levanta una barra vertical de altura igual a su frecuencia de observación.

Datos agrupados. Para las distribuciones de frecuencias con datos agrupados utilizaremos la siguiente notación:

N es el número total de observaciones de una variable X. Li-1 - Li, i = 1,…, k, son los k intervalos o clases en los que se encuentran las observaciones. k≤N.

ni, i = 1,…, k, es el número de observaciones en el i-ésimo intervalo o, lo que es lo mismo, la frecuencia absoluta de observación correspondiente a Li-1 - Li.

ai, i = 1,…, k, es la amplitud del intervalo Li-1 - Li, es decir, ai = Li - Li-1. xi, i = 1,…, k, es la marca de clase o representante de las observaciones en el intervalo Li-1-Li, y se define como Estadística I Grado en Turismo

6

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos

xi =

Li −1 + Li ; 2

Histograma. El histograma se obtiene pintando en el eje de abscisas los extremos de los intervalos y levantando sobre ellos rectángulos de área igual o proporcional a su frecuencia. Si todos los intervalos son de la misma amplitud, podemos pintar rectángulos de base el intervalo y de altura la frecuencia. De este modo obtendremos rectángulos de área proporcional a la frecuencia y la constante de proporcionalidad será esa amplitud (a) común a todos ellos. Si los intervalos son de distinta amplitud, se pintan rectángulos de área igual a la frecuencia, utilizando para cada intervalo una altura igual a su frecuencia dividida por su amplitud. Sobre el intervalo Li-1 - Li pintamos un rectángulo de altura hi, siendo

Intervalos

Estadística I Grado en Turismo

7

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos

Polígono de frecuencias. Se obtiene al unir con trazos rectos los puntos medios de los lados superiores de rectángulos contiguos.

Intervalos

Frecuencias absolutas acumuladas. Se representan por Ni, i = 1,...,k, y se definen como

N1 = n1 y Nk = N, siendo N el número total de observaciones. Frecuencias relativas. Son las proporciones que resultan de dividir cada frecuencia (ni) por el número total de observaciones (N). La frecuencia relativa se representa mediante fi,

fi = Estadística I Grado en Turismo

8

ni . N María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos Para un conjunto de N observaciones con k valores o intervalos distintos, se cumple que

Fi =

Ni ; N

Fk = 1.

Polígono de frecuencias acumuladas o diagrama de escalera. En el eje de

abscisas se marcan los distintos valores, sobre cada valor se levanta una barra discontinua paralela al eje de ordenadas y de altura igual a la frecuencia acumulada (absoluta o relativa) del valor y, por último, se une, mediante trazos horizontales, cada barra con la inmediata posterior, teniendo en cuenta que antes del primer valor el trazo horizontal coincide con el eje de abscisas y después del último el trazo horizontal es de altura N, 1 o 100, según que estemos trabajando con frecuencias absolutas, relativas o porcentuales.

Estadística I Grado en Turismo

9

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos

Ojiva o polígono de frecuencias acumuladas. En el eje de abscisas se marcan el extremo inferior del primer intervalo y los extremos superiores de todos los intervalos. En el eje de ordenadas las frecuencias acumuladas (absolutas, relativas o porcentuales). Pintamos en los ejes los puntos que tienen abscisa en el extremo superior de cada intervalo y ordenada la frecuencia acumulada correspondiente a la clase que dicho extremo representa. Pintamos también el punto que tiene como abscisa el extremo inferior del primer intervalo y como ordenada cero. Los puntos así obtenidos se unen entre sí (cada uno con su inmediato a la derecha) mediante trazos rectos. Por último, hemos de tener en cuenta que antes del punto correspondiente al extremo inferior del primer intervalo la gráfica coincide con el eje de abscisas y que después del punto que corresponde al extremo superior del último intervalo la gráfica coincide con la recta y=N o y=1, según que estemos trabajando con frecuencias absolutas o relativas.

Estadística I Grado en Turismo

10

María Dolores Sarrión Gavilán Curso 2012-2013

Tema 1. Conceptos básicos

Diagrama de sectores. Círculo dividido en sectores, uno por cada modalidad que el atributo presenta. La amplitud del ángulo que determina a cada sector debe ser proporcional a la frecuencia de la modalidad que el mismo representa. Se utiliza para distribuciones de frecuencias absolutas, relativas o de porcentajes de un atributo.

Pictogramas. Dibujos que representan al atributo y cuyo tamaño es, para cada modalidad, proporcional a la frecuencia con la que la misma se presenta.

Cartogramas o mapas. Se utilizan cuando las modalidades son áreas geográficas o cuando interesa visualizar una cierta variable según la zona geográfica en la que haya sido observada (estadísticas geográficas). Las distintas frecuencias (o los distintos valores o intervalos) se representan con tramas tanto más densas cuanto mayor es su valor. Estadística I Grado en Turismo

11

María Dolores Sarrión Gavilán Curso 2012-2013