Unidad 1 Estadistica Inferencial

UNIDAD I INTRODUCCION A LA ESTADISTICA INFERENCIAL I 1.1 Breve historia de la estadística 1.2 Concepto de estadística 1.

Views 308 Downloads 1 File size 173KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIDAD I INTRODUCCION A LA ESTADISTICA INFERENCIAL I 1.1 Breve historia de la estadística 1.2 Concepto de estadística 1.3 Estadística descriptiva 1.4 Estadística inferencial 1.5 Breve historia a la estadística inferencia 1.6 Teoría de la decisión en estadística 1.7 Componentes de una investigación estadística 1.8 Recolección de datos 1.9 Estadística para métrica( población y muestra aleatoria) 1.10 Aplicación 1.1Historia de la estadística. Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del imperio. Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra. Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos. Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadísticas

semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico. Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística. Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la especulación sobre si la población aumentaba, decrecía o permanecía estática. En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años terminados en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros. Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones. Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría Estadística; la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones. Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del

cálculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Física como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las físicas. 1.2 Concepto de estadística Estadística es el estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias científicas partiendo de tales datos. El principal objetivo de la Estadística consiste en poder decir algo con respecto a un gran conjunto de personas, mediciones u otros entes (población) con base en las observaciones hechas sobre sólo una parte (muestra) de dicho gran conjunto. La capacidad para "decir algo" sobre poblaciones con base en muestras está basada en supuestos con respecto a algún modelo de probabilidad que permite explicar las características del fenómeno bajo observación. 1.3 Estadística descriptiva Implica la abstracción de varias propiedades de conjuntos de observaciones, mediante el empleo de métodos gráficos, tabulares ó numéricos. Entre estas propiedades, están la frecuencia con que se dan varios valores en la observación, la noción de un valor típico o usual, la cantidad de variabilidad en un conjunto de datos observados y la medida de relaciones entre 2 ó más variables. 1.4 Estadística inferencial. El principal objetivo de la Estadística consiste en poder decir algo con respecto a un gran conjunto de personas, mediciones u otros entes (población) con base en las observaciones hechas sobre sólo una parte (muestra) de dicho gran conjunto. La capacidad para "decir algo" sobre poblaciones con base en muestras está basada en supuestos con respecto a algún modelo de probabilidad que permite explicar las características del fenómeno bajo observación. 1.5 Introducción a la estadística inferencial La estadística inferencial es necesaria cuando queremos hacer alguna afirmación sobre más elementos de los que vamos a medir. La estadística inferencial hace que ese salto de la parte al todo se haga de una manera “controlada”. Aunque nunca nos ofrecerá seguridad absoluta, sí nos ofrecerá una respuesta probabilística. Esto es importante: la estadística no decide; sólo ofrece elementos para que el investigador o el lector decidan. En muchos casos, distintas personas perciben diferentes conclusiones de los mismos datos. El proceso será siempre similar. La estadística dispone de multitud de modelos que están a nuestra disposición. Para poder usarlos hemos de formular, en primer lugar, una pregunta en términos estadísticos. Luego hemos de comprobar que nuestra situación se ajusta a algún modelo (si no se ajusta no tendría sentido usarlo). 1.6 Teoría de la decisión en estadística Los estudios de casos reales, que se sirven de la inspección y los experimentos, se denominan teoría descriptiva de decisión; los estudios de la toma de decisiones racionales, que utilizan la lógica y la estadística, se llaman teoría preceptiva de decisión. Estos estudios se hacen más complicados cuando hay más de un individuo, cuando los resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de los distintos resultados son desconocidas. La teoría de decisión comparte características con la teoría de juegos, aunque en la teoría de decisión el „adversario‟ es la realidad en vez de otro jugador o jugadores. Al hacer un análisis sobre esta teoría, y mirándola desde el punto de vista de un sistema, se puede decir que al tomar una decisión sobre un problema en particular, se debe tener en cuenta los puntos de dificultad que lo componen, para así empezar a estudiarlos uno a uno hasta obtener una solución que sea acorde a lo que se esta esperando obtener de este, y sino, buscar otras soluciones que se acomoden a lo deseado.

La teoría de decisión, no solamente se puede ver desde el punto de vista de un sistema, sino en general, porque esta se utiliza a menudo para tomar decisiones de la vida cotidiana, ya que muchas personas piensan que la vida es como una de las teorías; La teoría del juego, que para poder empezarlo y entenderlo hay que saber jugarlo y para eso se deben conocer las reglas de este, para que no surjan equivocaciones al empezar la partida. 1.7 Componentes de una investigación estadística. * Preparación del trabajo. Se limita a la redacción de las instrucciones para recabar los datos, definición precisa de los datos que se necesitan; diseño de formularios y planillas, planificación y organización del trabajo en el espacio y en el tiempo. * Recopilación de los datos. En ella se recaban los datos necesarios para la investigación, mediante encuestas, muestreos, censos, o se toman de fuentes secundarias o registros y publicaciones. * Evaluación y depuración de los datos. Los datos recopilados, en la vida real, suelen adolecer de imperfecciones y errores varios; debidos a la ignorancia, a malos entendidos, a intereses creados o a prejuicios sociales, de parte de quien aporta los datos o de quien los recaba. De allí que el paso inmediato sería una depuración y evaluación de tales datos, a fin de subsanar o mitigar las influencias y efectos de tales errores e imperfecciones. Para lograrlo se recomiendan los siguientes procedimientos: * Revisión total de los cálculos, de las tabulaciones y del procedimiento utilizado. * Confrontar los datos recopilados, con los obtenidos al cálculo, con los de otras regiones o países, tomados en otras ocasiones o con otra finalidad. * Repetir al muestreo, el mismo trabajo, en zonas estratégicamente escogidas; cuando en las verificaciones anteriores se hubieran obtenido notorias discrepancias. * Presentación de los datos. Los datos suelen estar presentados en forma tabular, en cuadros de doble entrada, proporcionales, porcentuales, o en valores promedios. También suelen representarse gráficamente, mediante: Histogramas, polígonos, diagramas figurados, prismogramas, pictogramas, dibujos acotados, entre otros. * Análisis e interpretación. Podría decirse que es ésta la fase más amplia de todas y en la cual la investigación rinde sus mejores frutos. Desde la más remota antigüedad se ha venido aplicando el análisis estadístico a las investigaciones demográficas, socioeconómicas, fiscales, entre otros. Obteniéndose así índices y tendencias de natalidad, mortalidad, mortinalidad (nacidos muertos), nupcialidad, inmigración, emigración, etc. De generalización más reciente tenemos los índices y tendencias del costo de la vida, de tan rotunda actualidad; los cuales se obtienen sumando los costos promedios de alimentos, vivienda, medicinas, ropas y servicios consumidos por una persona, familia, estándar, en el período que se estudia. Igualmente, los índices de productividad o relación entre la producción y las horas - hombre de trabajo en ella utilizadas. 1 8 .Recolección de datos Es el uso de técnicas e instrumentos para la recopilar información acerca de un determinado tema que es objeto de investigación. Técnicas de recolección de datos. * Entrevista * Encuesta * Observación * Sesión de grupo

En estadística se emplean una variedad de métodos distintos para obtener información de los que se desea investigar. Los datos estadísticos necesarios para una investigación, 1.9 Estadística para métrica La estadística paramétrica es una rama de la estadística que comprende los procedimientos estadísticos y de decisión están basados en las distribuciones de los datos reales. Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál es la media y la desviación de dicha normal. La media y la desviación típica de la desviación normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente que distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico, que nos ayude a conocer primero la distribución. Población y muestra. Al recoger datos relativos a las características de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fábrica, suele ser imposible o nada práctico observar todo el grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado población o universo, se examina una pequeña parte del grupo, llamada muestra. Una población puede ser finita o infinita. Por ejemplo, la población consistente en todas las tuercas producidas por una fábrica un cierto día es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita. Si una muestra es representativa de una población, es posible inferir importantes conclusiones sobre las poblaciones a partir del análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecerá al establecer nuestras conclusiones. La parte de la estadística que sólo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadística descriptiva o deductiva. Muestra aleatoria: muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros y con la misma probabilidad. 1.10 Aplicaciones de la estadística La estadística es un potente auxiliar de muchas ciencias y actividades humanas: sociología, sicología, geografía humana, economía, etc. Es una herramienta indispensable para la toma de decisiones. También es ampliamente empleada para mostrar los aspectos cuantitativos de una situación. La estadística está relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones. El resultado de estudio de dichos procesos, denominados procesos aleatorios, puede ser de naturaleza cualitativa o cuantitativa y, en este último caso, discreto o continúa. Son muchas las predicciones de tipo sociólogo, o económico, que pueden hacerse a partir de la aplicación exclusiva de razonamientos probabilísticos a conjuntos de datos objetivos como son, por ejemplo, los de naturaleza demográfica. Las predicciones estadísticas, difícilmente hacen referencia a sucesos concretos, pero describen con considerable precisión en el comportamiento global de grandes conjuntos de sucesos particulares. Son predicciones que, en general, no acostumbran resultar útiles. La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos: * En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos. * En las ciencias sociales y económicas: es un pilar básico del desarrollo de la demografía y la

sociología aplicada. * En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y microeconómicos. * En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera. El proceso de aplicación de la estadística implica una serie de pasos: Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico). Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos. Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos. Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional). Conclusiones La Estadística es el estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias científicas partiendo de tales datos. Sirve como auxiliar en muchas ciencias y está relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones. En las que se utilizan datos agrupados , no agrupados, distribuciones etc.