Вы находитесь на странице: 1из 3

CONCEPTOS BASICOS DE ESTADISTICA Qu es la Estadstica?

La Estadstica es una ciencia que estudia las caractersticas de un conjunto de casos para hallar en ellos regularidades en el comportamiento, que sirven para describir el conjunto y para efectuar predicciones. La Estadstica tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A travs de la cuantificacin y el ordenamiento de los datos intenta explicar los fenmenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Se hizo una encuesta a 8976 personas, de las cuales 8707 respondieron que calman su dolor de cabeza tomando una aspirina. Si la encuesta est bien hecha, este dato puede ser utilizado por los mdicos, quienes podran afirmar que si un paciente sufre de dolor de cabeza, tiene un 97 % de probabilidad de calmarla tomando una aspirina. Poblacin o Universo: es el total del conjunto de elementos u objetos de los cuales se quiere obtener informacin. Aqu el trmino poblacin tiene un significado mucho ms amplio que el usual, ya que puede referirse a personas, cosas, actos, reas geogrficas e incluso al tiempo. La poblacin debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la poblacin bajo estudio. Por lo tanto, al definir una poblacin, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias, debemos especificar cules y cundo: escuelas primarias de la Capital, ao 2008.El tamao de una poblacin viene dado por la cantidad de elementos que la componen. Muestra: es un subconjunto de unidades de anlisis de una poblacin dada, destinado a suministrar informacin sobre la poblacin. Para que este subconjunto de unidades de anlisis sea de utilidad estadstica, deben reunirse ciertos requisitos en la seleccin de los elementos. Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la poblacin que se defina tenga tamao infinito, y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observacin exhaustiva puede ser muy elevado, el tiempo de recoleccin de la informacin muy extenso, o ms an, la observacin de los elementos puede ser destructiva. Por ejemplo, si quisiramos hacer un estudio de la calidad de una centena de fsforos, no podramos probarlos a todos pues los destruiramos. A una consultora le encargan hacer un estudio acerca de cul es la intencin del voto de los ciudadanos de una ciudad en las prximas elecciones. Como no es posible encuestar a todos los ciudadanos, la consultora toma un grupo de 500 y sobre l analiza la variable. Con los datos recopilados sobre esta muestra, se puede hacer una proyeccin de los votos que obtendr cada candidato. Importante!!! Para que el estudio estadstico sea confiable, es muy importante que la seleccin de los individuos de una muestra resulte representativa de la poblacin que se analiza, o sea, se deben obtener de ella resultados aproximadamente iguales a los que se hubieran obtenido considerando el total de la poblacin. Variable: son los caracteres o cualidades de la poblacin que es objeto de estudio o anlisis. Por ejemplo: edad, ingreso de un individuo, sexo, cantidad de lluvia cada, etc. Nivel de medicin: las variables pueden ser medidas con mayor o menor grado de precisin segn la escala de medida utilizada para su observacin. Podemos distinguir los siguientes niveles de medicin de una variable: Nominal: slo permite clasificar a las unidades de anlisis en categoras. Por ejemplo: sexo varn y mujer -. Ordinal: adems de clasificar a los elementos en distintas categoras, permite establecer una relacin de orden de las mismas. Por ejemplo: clase social baja, media y alta-. Intervalar: permite clasificar, ordenar y medir la distancia entre las diferentes categoras. Por ejemplo: edad. Las variables se clasifican en dos grupos de acuerdo al nivel de medicin utilizado para su observacin:

Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la caracterstica que miden de la unidad de anlisis es una cualidad. No se pueden medir y se expresan con palabras. Ejemplos : Sexo: Femenino Masculino Color de ojos Color del cabello Variables cuantitativas: son las variables medidas en escala intervalar, puesto que lo que miden es una cantidad. se expresan por medio de un nmero. DISCRETAS Cuando solo pueden tomar algunos valores determinados. Ejemplos : N de padres vivos N de hermanos CONTINUAS Cuando pueden tomar infinitos valores comprendidos entre dos valores determinados. Ejemplos : Altura, peso, etc La Estadstica se divide en dos ramas: La estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de descriptores numricos son la media y la desviacin estndar. Resmenes grficos incluyen varios tipos de figuras y grficos. La inferencia estadstica, que se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin), etc. Tablas de distribucin de frecuencias. Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla, que denominaremos distribucin de frecuencias, en la que cada valor de la variable se le asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Por tanto, llamaremos distribucin de frecuencias a un agrupamiento de datos en clases acompaada de sus frecuencias: frecuencias absolutas, frecuencias relativa o frecuencia porcentuales. En caso de que las variables estn al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas, y frecuencias acumuladas porcentuales. Las distribuciones de frecuencias varan en dependencia si corresponden a una variable discreta o a una variable continua. Ejemplo 1: Variable Continua: El restaurant El Choro Loco estaba interesado en efectuar un anlisis de sus cuentas por cobrar. Uno de los factores que ms interesaba a la administracin de la tienda era el de los saldos de las cuentas de crdito. Se escogi al azar una muestra aleatoria de 30 cuentas y se anot el saldo de cada cuenta (en unidades monetarias) como sigue: 77.97 43.66 13.02 17.97 89.19 12.18 8.15 29.75 7.42 34.40 43.13 79.61 90.99 93.91 20.64 21.10 17.64 81.59 60.94 43.97

32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68 Solucin: 1. Se ordenan los datos de menor a mayor: ( 7.42, 8.15, , , , 90.99, 93.91 ) donde: Vmin. = valor mnimo = 7.42 Vmax. = valor mximo = 93.91 2. Se halla el rango (R) de la poblacin o muestra: R = valor mayor valor menor = Vmax. Vmin. = 93.91 7.42 = 86.49 3. Se halla el numero de intervalos de los datos: "k" con la formula de Sturges.

K=1+3.322(log n) Nota: en el ejemplo en estudio n=30 por cuanto que son 30 clientes en la muestra: K = 1 + 3.322 (log 30) = 1 + 3.322 (1.477) el log fue obtenido segn calculadora = 1+ 4.9069 = 5.9069 ~ 6 aproximado al siguiente entero 4. Determinar la amplitud de la clase: "C" Nota: obsrvese que se va a trabajar con una cifra significativa ms cmodaC hasta los milsimos para evitar que algn dato coincida con el lmite de clases, o sea como los datos estn dados en centsimos, se calculo Clases 7.420 21.835 21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495 79.495 93.910 Total Simbologa utilizada: Xi = Punto medio o marca de clases fi = frecuencia absoluta hi = frecuencia relativa Fi = frecuencia absoluta acumulada descendente Fi = frecuencia absoluta acumulada ascendente Hi = frecuencia relativa acumulada descendente Hi = frecuencia relativa acumulada ascendente Nota: Obsrvese que el lmite inferior de la primera clase es el valor mnimo ( Vmin.=7.42 ) y el lmite superior es el resultado de Vmax.+C = 7.42+14.415 = 21.835. El lmite inferior de la siguiente clase es igual al lmite superior de la clase anterior y el lmite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ). Obsrvese que el lmite superior de la ltima clase es igual al valor mayor ( Xi=93.91 ) Xi 14.628 29.043 43.458 57.873 72.288 86.703 30 fi 10 4 5 3 3 5 1.00 hi 0.33 0.13 0.17 0.10 0.10 0.17 Fi 10 14 19 22 25 30 Fi 30 20 16 11 8 5 Hi 0.33 0.46 0.63 0.73 0.83 1.00 Hi 1.00 0.67 0.54 0.37 0.27 0.17

Вам также может понравиться