You are on page 1of 42

Universidad Autnoma de Nuevo Len Facultad de Ciencias Polticas y Administracin Publica

Tema 1:Introduccin a la estadstica. Equipo 1: 1-Samantha Carolina Garca Snchez. 2-Dora Elia Bonilla Leal. 3-Mara Vernica Castro Puente. 4-Elvia Nayeli Rodrguez Castillo. 5-Ramn Ren Cisneros Rivera. 6-Jos de Jess Trevio Cruz. 7-Alberto E. Martnez Vigil. Fecha de exposicin: Jueves 7 de febrero del 2008.

Tema 1: Introduccin a la Estadstica

1.1 1.2 1.3 1.4 1.5

Concepto y Clasificacin de Estadstica Medidas de: Escalas y estadgrafos Tabulacin y Representacin de Datos Medidas de Tendencia Central Medidas de Variabilidad

La palabra estadstica tiene fundamentalmente dos significados. El primero de ellos se refiere a datos clasificados, especialmente numricos, acerca de una clase de objetos. En segundo trmino, se llama estadstica a la ciencia que trata de la recoleccin, anlisis, interpretacin y representacin de datos numricos. La estadstica tiene su origen en dos reas de inters que en apariencia tiene muy poco en comn: la ciencia poltica y los juegos de azar. Quiz aquellos que hayan seguido la carrera de algunos lideres polticos conciban la vida poltica como un juego de azar en el que en ciertos periodos o sexenios la fortuna les sonre, mientras que en otros periodos son victimas de ataques, o peor aun, del olvido. En el siglo XXXI a.C., mucho antes de construir las pirmides, los egipcios analizaban los datos de la poblacin y la renta del pas. Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica.

Los gobiernos han tenido intereses desde la antigedad en contar a las personas de dicho lugar, sus propiedades y en especial los impuestos que recaudaban o podan recaudar. Ya en el antiguo testamento se menciona censos de carcter militar, mientras que en babilonia, china Egipto y roma se elaboraban censos con propsitos fiscales. El primer censo del que se tiene noticia en Mxico data del ao 1116, cuando el rey chichimeca Xlotl ordeno que fueran censados todos sus sbditos. Para contarlos, cada uno tiro una piedra en un montn llamado nepohualco (contadero). Se formaron as doce montones de piedras y, de acuerdo con los cdices, el resultado arrojo la cifra de 3200000 personas.

Desde fines de siglo XIX, salvo en la poca de la revolucin mexicana, se han conducido censos generales de poblacin y vivienda cada 10 aos.
Es a travs de su lectura que vemos como ha evolucionado la sociedad mexicana a lo largo del tiempo. Los problemas asociados a la descripcin, resumen y anlisis de los datos de los cencos ha dado lugar al desarrollo de mtodos que constituyen una de las partes de la estadstica que ms ha sido estudiada, la estadstica descriptiva.

En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico.

El empleo de la estadstica tanto en la vida profesional como en multitud de aspectos de la vida personal ha aumentado considerablemente en las ultimas dcadas. Esto se debe, por un lado, a la necesidad de aplicar mtodos cuantitativos en muchas reas del quehacer humano, tales como la administracin de empresas, las finanzas, la medicina, la psicologa, la produccin, la contaminacin ambiental, la poltica, etc. Por otro lado, la tecnologa computacional ha avanzado considerablemente y hoy en da es posible manipular datos de manera sencilla y eficiente con el uso de paquetes estadsticos o de una hoja de clculo en una computadora personal. Existen por lo menos tres razones para estudiar la estadstica: (1) los datos se encuentran en todos lados (2) las tcnicas estadsticas se utilizan para la toma de muchas decisiones que afectan nuestra vida, y (3) sin importar su lnea de trabajo futura, usted tendr que tomar decisiones que involucran datos. El conocimiento de los mtodos estadsticos ayudara a tomar esas decisiones con mayor efectividad.

Qu es la estadstica? Estadstica . La ciencia de recolectar, clasificar, describir e interpretar datos numricos. La estadstica es una rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. Es tambin el lenguaje universal de la ciencia, tanto en sus ramas fsicas como sociales. La comprensin y el uso de la estadstica nos permite comunicar ms exactamente los descubrimientos de las investigaciones estadsticas. La estadstica es tambin un instrumento que, utilizado con cuidado y precisin, nos permite describir nuestros resultados y adoptar decisiones al respecto a lo que nos dicen.

El primer campo de actuacin de la estadstica, como se ha visto, es la demografa. De esta ciencia ha tomado la nomenclatura (poblacin, individuo).

El campo de la estadstica puede dividirse en dos reas: estadstica descriptivas y estadsticas de inferencias. La estadstica descriptiva es aquella parte del tema en que piensa la mayora de la gente cuando oye la palabra estadstica. Consiste en el rea de la estadstica dedicada a la recoleccin, presentacin y descripcin de datos numricos. Tambin es el conjunto de mtodos para organizar, resumir y presentar los datos de manera informativa. Tiene sus races en la necesidad de las grandes organizaciones polticas y sociales de guardar registros.

El proceso que sigue la estadstica descriptiva para el estudio de una cierta poblacin consta de los siguientes pasos: - Seleccin de caracteres dignos de ser estudiados. - Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres seleccionados. - Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro de cada carcter. - Representacin grfica de los resultados (elaboracin de graficas estadsticas

La estadstica de inferencia tambin denominada inferencia estadstica y estadstica inductiva, y se refiere a las tcnicas de interpretar los valores que se obtienen a partir de las tcnicas descriptivas y a la tcnica de tomar decisiones sobre la base de los resultados. Trabaja con muestras, subconjuntos formados por algunos individuos de la poblacin. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. Cmo se selecciona la muestra, cmo se realiza la inferencia, y qu grado de confianza se puede tener en ella son aspectos fundamentales de la estadstica inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadstica, probabilidad y matemticas. Su principal objetivo es encontrar algo sobre una poblacin basndose en una muestra tomada de dicha poblacin.

La probabilidad su concepto se desarrollo histricamente para estudiar los juegos de azar, una definicin de probabilidad que solo es valida cuando todos los resultados son igualmente probables es: Si hay n posibilidades igualmente probables y una de ella debe ocurrir, entonces la probabilidad de que ocurra alguna de k de estas n posibilidades es k/n. Es una rama interesada en el concepto y medicin de la incertidumbre de que suceda algn evento de inters. De esto podemos deducir que la probabilidad de que suceda un evento es un nmero real entre cero y uno. Entre mas pequeo sea este numero, el evento es menos probable, y entre mas cercano a uno sea este numero, el evento es mas probable. Cuando la probabilidad es igual a (0.5), el evento tiene la misma probabilidad e ocurrir que de no ocurrir.

Una poblacin puede constar de individuos, incluir objetos y estar formada por un grupo de medidas. Entonces cabe mencionar que una poblacin, en el sentido estadstico, no siempre se refiere a personas. Por lo tanto la definicin exacta de poblacin es la siguiente: Conjunto de todos los posibles individuos, objetos o medidas de inters Por lo general siempre se toma una muestra de una poblacin para inferir algo acerca de la misma.

Una muestra no es ms que una porcin, o parte, de la poblacin de inters para su anlisis. Un parmetro es la medida numrica que describe una caracterstica de la poblacin. Un estadstico es la medida numrica que describe alguna caracterstica de la muestra. Los mtodos inferenciales utilizan los datos de la muestra para calcular los estadsticos que proporcionan los estimados de las caractersticas de una poblacin.

Tipos de datos.
Los datos son los valores observados de las variables, por ejemplo las respuestas de una encuesta. Existen 2 tipos de variables: categricas y numricas. Las variables categricas producen respuestas categricas como s o no. Las variables numricas producen respuestas tales como la estatura en metros. Las variables numricas a su vez se dividen en discretas y continuas. Las variables numricas discretas producen respuestas numricas que surgen de un proceso de conteo. Las variables numricas continuas producen respuestas numricas que surgen de un proceso de medicin.
Tipo de dato Categrico Tipo de preguntas Posee actualmente acciones o bonos? Numrico discreto A cuntas revistas esta suscrito actualmente? Numrico continuo Cunto mide? ___________ mts. ___________ revistas Respuestas Si No

Las variables pueden clasificarse con base a su escala de medida. La manera en que se clasifican las variables afecta en gran parte la forma como se utilizan en el anlisis. a) Las variables pueden ser: 1- Nominales 2- Ordinales 3- De intervalo 4- De razn

Una Medida de Escala Nominal se crea cuando se utilizan nombres para establecer categoras dentro de las cuales las variables pueden registrarse exclusivamente, es decir estas clasificaciones se utilizan para datos y categoras distintas y separadas. Las Medidas en Escala Ordinales son las que clasifican las observaciones en categoras con un orden significativo. En una escala de intervalo las variables se miden de manera numrica, y al igual que los datos ordinales, llevan inherente un rango u ordenamiento. Sin embargo, a diferencia de los rangos ordinales, la diferencia entre los valores es importante. A diferencia de una medida en escala nominal, la de escala ordinal s muestra un ordenamiento o secuencia de los datos. Las encuestas de opinin con frecuencia una medida en escala ordinal como totalmente de acuerdo, de acuerdo, sin opinin, en desacuerdo, totalmente en desacuerdo.

Las Medidas en Escala de Intervalo son medidas en una escala numrica en la cual el valor cero es arbitrario pero la diferencia entre los valores es importante.
Las Medidas de Escala de Razn son medidas numricas que se basan en un sistema numrico en el cual el cero es significativo, es un valor fijo en cualquier escala y la diferencia entre valores es importante.

b) Estadgrafos
Los estadgrafos estn enfocados a llevar a cabo inferencias sobre patrones de la poblacin, observados a partir de la muestra. Sin embargo, una tarea importante es la construccin de juicios acerca de la certeza de los valores obtenidos para los estadgrafos, es decir, una gran parte del estudio de la estadstica consiste en la determinacin de la confianza sobre los estadgrafos. En general debemos de considerar que los estadgrafos son construidos en la optimizacin de recursos y en el acceso a la interpretacin de la poblacin. La clasificacin dada para los estadgrafos los divide en:

* Especficos estn enfocados a estadgrafos que permiten describir parmetros propios del rea por lo cual el trmino especifico se refiere a la obtencin de parmetros que solo tienen utilidad en un rea del conocimiento. Ejem.- (Administrativos o de produccin, clnicos, econmicos, matemticos, informticos, pticos, entre otros.)

*De Posicin (Como la media, mediana, moda, percentiles, entre otros.)


*De Dispersin (desviacin estndar, varianza, rango, amplitud, entre otros.) Los estadgrafos de posicin y de dispersin son estadgrafos que no estn sujetos a un rea particular, por ejemplo, la media es un estadgrafo que no depende de un rea del conocimiento sino que puede ser una herramienta en diversas reas del conocimiento, as vemos que se usa en la economa, en el rea mdica, en el reas administrativas, entre otras.

Razn Comparacin de compra Conveniencia Gastos de envo gratis Variedad en la seleccin Velocidad total

Porcentaje 23 33 34 6 4 100

G rfic a de pas tel


4 6 34 23

V eloc idad V ariedad de s elec c in C omparac in de c ompras C onvenienc ia G as tos de envi gratis 33

10 pero menos de $15 15 pero menos de $20 20 pero menos de $25 25 pero menos de $30 30 pero menos de $35 35 pero menos de $40 40 pero menos de $45 45 pero menos de $50 50 pero menos de $55 55 pero menos de $60 60 pero menos de $65

1 0 2 3 7 14 8 5 8 1 1

0 0 4 13 13 12 4 1 2 1 0

100 80 60 40 20 0 0 1 2 3 4 5

Grfica de barras agrupadas del riesgo y objetivo de los fondos

Promedio Alto Valor Crecimiento 0 50 100 Bajo

1.4 Medidas de Tendencia Central


La mayor parte de las series de datos muestran una clara tendencia a agruparse alrededor de un cierto punto central. Entonces dada cualquier serie de datos particular, por lo general es posible seleccionar algn valor o promedio tpico para describir toda la serie de datos. Este valor descriptivo tpico es una medicin de tendencia central o de ubicacin.
Cinco tipos de promedios a menudo usados como mediciones de tendencia central. Son la media aritmtica, mediana, moda, el rango medio y el eje medio.

Cinco tipos de promedios a menudo usados como mediciones de tendencia central. Son la media aritmtica, mediana, moda, el rango medio y el eje medio. *Media aritmtica: es la ms comn. Se calcula sumando todas las observaciones de una serie de datos y luego dividiendo el total entre el nmero de elementos involucrados. *Mediana: es el valor medio de una secuencia ordenada de datos. *Moda: es el valor de una serie de datos que aparece con ms frecuencia. Se obtiene fcilmente de una clasificacin ordenada. *Rango Medio: es el promedio de las observaciones menores y mayores de una serie se datos. *Eje Medio: es el promedio del primer y tercer cuartiles de una serie de datos. (Cuartiles: mediciones de ubicacin no central, se emplean particularmente al resumir o describir las propiedades de grandes series de datos numricos)

1.5 Medidas de Variabilidad


La variacin es la cantidad de dispersin o propagacin en los datos. Dos series de datos pueden diferir tanto en la tendencia central como en la variacin. Pero tambin dos series de datos pueden tener las mismas mediciones de tendencia central, pero diferir grandemente en trminos de variacin. Algunas de stas medidas de variabilidad son:

*Rango: es la diferencia entre la mayor y la menor observacin en una serie de datos. *Rango intercuartil: (propagacin media) es la diferencia entre el tercer y cuarto cuartiles en una serie de datos. *La varianza y la desviacin estndar: toman en cuenta cmo se distribuyen todos los valores en los datos. *Varianza de muestra: es aproximadamente el promedio de las diferencias cuadradas entre cada una de las observaciones en una serie de datos y la media. As, para una muestra que contiene n observaciones, X1, X2, Xn, la varianza de muestra (dada por el smbolo S2) puede escribirse como
( X X ) 2 ( X 2 X ) 2 ... ( X n X ) 2 S 1 n
2 ___ ___ ___

*Desviacin estndar de muestra: (dada por el smbolo S) es simplemente la raz cuadrada de la varianza de muestra.
S

( X1 X )2
i 1

___

n 1

La varianza y la desviacin estndar miden la dispersin promedio alrededor de la media, es decir, como las observaciones mayores fluctan por encima de esta y como las observaciones menores se distribuyen por debajo de esta.

Los conjuntos de datos representan la interseccin entre la oferta y la demanda de informacin, de acuerdo con los recursos disponibles.
En cuanto a la divulgacin de la informacin estadstica; para que esta sea oportuna y confiable es indispensable contar con un programa de publicaciones bien diseado y ejecutado, se requiere una modernizacin constante de medios.