Вы находитесь на странице: 1из 7

Introduccin a la estadstica

Formatted: Font color: Accent 1

Estadstica. La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y

analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis.
Estadstica descriptiva. Ciencia que estudia las tcnicas mediante las cuales se recopilan,
Formatted: Font color: Accent 1 Formatted: Font: 12 pt, Font color: Accent 1 Formatted: Font color: Accent 1

coleccionan, y organizan datos e informacin los cuales pueden representarse grficamente.


Probabilidad. Ciencia que estudia la posibilidad de que suceda un evento de inters, llamado

Formatted: Font: 12 pt, Font color: Accent 1

experimento, por ejemplo: 1. El lanzamiento de un par de dados y sus posibles resultados. 2. El lanzamiento de una moneda honrada. 3. La adquisicin de un boleto para un determinado sorteo. En los ltimos aos el estudio de la estadstica ha revolucionado, lo cual ha dado vida a una nueva rama: la Estadstica Inferencial.
Estadstica Inferencial. Ciencia que auxilindose en la recoleccin de datos y grficas de la

Formatted: Font color: Accent 1 Formatted: Font: 12 pt, Font color: Accent 1 Formatted: Font color: Accent 1 Formatted: Font: 12 pt, Font color: Accent 1

estadstica descriptiva y las leyes de la probabilidad nos ayuda a tomar decisiones razonadas. La industria, la salud, la agricultura, la ciencia poltica, la mercadotecnia y principalmente el control de calidad, son algunas de las muchas aplicaciones de la estadstica con sus dos ramas. Simplificando podemos obtener la siguiente definicin de Eestadstica:
Formatted: Font color: Accent 1

Estadstica. La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y

Formatted: Font: 12 pt, Font color: Accent 1

analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. La encuesta es una de muchas herramientas disponibles para recolectar datos. Una meta comn de las encuestas es reunir datos de una pequea parte de un grupo ms grande para aprender algo acerca de este ltimo. Una meta comn e importante de la estadstica es aprender acerca de un grupo examinando los datos de algunos de sus miembros. En dicho contexto los trminos muestra y poblacin adquieren importancia.
Formatted: Font color: Accent 1

Definiciones Datos son las observaciones recolectadas (como mediciones, gneros, respuestas de encuesta). Poblacin es la coleccin completa de todos los elementos (puntuaciones, personas, mediciones, etctera) a estudiar. Se dice que la coleccin es completa, pues incluye a todos los sujetos que se estudiarn. Censo es la coleccin de datos de cada uno de los miembros de la poblacin. Muestra es un subconjunto de miembros seleccionados de una poblacin. Nota: debemos enfocarnos en los siguientes conceptos clave:

Formatted: Font: 12 pt, Font color: Accent 1

*Los datos mustrales deben reunirse de una forma adecuada, como en un proceso de seleccin aleatoria. *Si los datos mustrales no se renen de forma adecuada, resultaran tan intiles que ninguna cantidad de tortura estadstica podra salvarlos.
Formatted: Font color: Accent 1

Tipos de datos
Parmetro es una medicin numrica que describe algunas caractersticas de una poblacin. Estadstico es una medicin numrica que describe algunas caractersticas de una muestra. Los datos cuantitativos consisten en nmeros que representan conteos o mediciones. Los datos cualitativos (o categricos o de atributo) se dividen en diferentes categoras que se distinguen por alguna caracterstica no numrica. Datos discretos resultan cuando el nmero de posibles valores es un nmero finito, o bien, un nmero que puede contarse. (Es decir, el nmero de posibles valores es 0, 1, 2, etctera). Datos continuos (numricos) resultan de un infinito de posibles valores que pueden asociarse a puntos de alguna escala continua, cubriendo un rango de valores sin huecos ni interrupciones. Nivel de medicin nominal son los datos consistentes exclusivamente en nombres, etiquetas o categoras que no pueden acomodarse segn un esquema de orden (por ejemplo, de bajo a alto). Los datos estn en el nivel de medicin ordinal cuando pueden acomodarse en algn orden, aunque no es posible determinar diferencias entre los valores de los datos o tales diferencias carecen de significado. El nivel de medicin de intervalo se parece al nivel ordinal, pero con la propiedad adicional de que la diferencia entre dos valores de datos cualesquiera tiene un significado. Sin embargo, los datos en este nivel no tienen un punto de partida inherente (natural) desde cero (donde nada de la cantidad est presente). El nivel de medicin de razn se parece al nivel de intervalo, aunque tiene la propiedad adicional de que s tiene un punto de partida o cero inherente (donde cero indica que nada de la cantidad est presente). Para valores en este nivel, tanto las diferencias como las proporciones tienen significado. Muestra de respuesta voluntaria (o muestra autoseleccionada) es aquella donde los sujetos deciden ser incluidos por s mismos.

Formatted: Font: 14 pt, Font color: Accent 1 Formatted: Font: 12 pt, Font color: Accent 1

Formatted: Font color: Accent 1 Formatted: Font: 12 pt, Font color: Accent 1

Diseo de experimentos
Existen dos puntos principales que son bastante sencillos. Es necesario entender que el mtodo usado para reunir los datos es extremadamente importante, y debemos reconocer que la aleatoriedad resulta importante en particular.

Formatted: Font: 14 pt, Font color: Accent 1 Formatted: Font: 12 pt, Font color: Accent 1

*Si los datos muestrales no se renen de manera adecuada, stos podran resultar intiles por completo, de tal forma que ninguna cantidad de tortura estadstica los salvara. *La aleatoriedad por lo general juega un papel crucial para determinar cules son los datos a reunir. Los mtodos estadsticos se rigen por los datos. Por lo regular obtenemos datos de dos fuentes distintas: los estudios observacionales y los experimentos. En un estudio observacional, observamos y medimos caractersticas especficas, aunque no intentamos manipular a los sujetos que estamos estudiando. En un experimento aplicamos algn tratamiento y luego procedemos a observar sus efectos sobre los sujetos. Hay diferentes tipos de estudios observacionales: Estudio transeccional, los datos se observan, miden y renen en un solo momento. Estudio retrospectivo (o de control de caso), los datos se toman del pasado (a travs del examen de registros, entrevistas y otros medios). Estudio prospectivo (o longitudinal o cohorte), los datos se renen en el futuro y se toman de grupos (llamados cohortes) que comparten factores comunes. Elementos claves en el diseo de experimentos: 1.- Controlar efectos de las variables a travs de un estudio ciego, bloques, diseos experimental completamente aleatorizado, diseo experimental rigurosamente controlado. 2.- Replica 3:- Aleatorizacin. Los resultados de los experimentos algunas veces se empobrecen a causa de la confusin. La confusin ocurre en un experimento cuando el experimentador no es capaz de distinguir entre los efectos de diferentes factores. Intente planear el experimento de manera que no se presente confusin. Ahora definiremos algunos de los mtodos de muestreo ms comunes. Muestra aleatoria los miembros de una poblacin se seleccionan de manera que cada miembro individual tiene la misma posibilidad de ser elegido. Muestra aleatoria simple del tamao de n sujetos, se selecciona de manera que cada posible muestra del mismo tamao n tenga la misma posibilidad de ser elegida. Adems del muestreo aleatorio, hay otras tcnicas de muestreo en uso, y las ms comunes se describen aqu: En el muestreo sistemtico, elegimos algn punto de partida y luego seleccionamos cada ksimo (por ejemplo cada quincuagsimo) elemento en la poblacin. Con el muestreo de conveniencia, simplemente se utilizan resultados que sean muy fciles de obtener. Con el muestreo estratificado, subdividimos la poblacin en al menos dos diferentes subgrupos (o estratos) que comparten las mismas caractersticas (por ejemplo, el gnero o la categora de edad) y despus realizamos un muestreo de cada subgrupo (o estrato).

Formatted: Font: 12 pt

En el muestreo por racimos, primero dividimos el rea de la poblacin en secciones (o racimos), despus seleccionamos aleatoriamente algunos de estos racimos, y luego elegimos a todos los miembros de los racimos seleccionados. Errores de muestreo Por muy bien que usted planee y ejecute el proceso de recoleccin de muestras, es probable que ocurra algn error en los resultados: Un error de muestreo es la diferencia entre el resultado de una muestra y el verdadero resultado de la poblacin; tal error es consecuencia de las posibles fluctuaciones de las muestras. Un error no de muestreo ocurre cuando los datos de una muestra se obtienen, registran o analizan de forma incorrecta (como cuando se selecciona una muestra sesgada o predispuesta, cuando se usa un instrumento de medicin defectuoso o cuando se cometen errores al copiar los datos). Descripcin, exploracin y comparacin de datos Caractersticas importantes de los datos 1. Centro: Valor representativo o promedio que indica la localizacin de la mitad del conjunto de los datos. 2. Variacin: Medida de la cantidad en que los valores de los datos varan entre s. 3. Distribucin: Naturaleza o forma de la distribucin de los datos (tales como normales, uniformes o sesgadas). 4. Datos distantes: Valores muestrales que estn muy alejados de la vasta mayora de los dems valores de la muestra. 5. Tiempo: Caractersticas cambiantes de los datos a travs del tiempo. DISTRIBUCIONES DE FRECUENCIAS Tomas o Filas de Datos: Una toma o fila de datos consiste en datos obtenido que no han sido organizados numricamente, por ejemplo los pesos de los estudiantes de quinto semestre de la especialidad electrnica del plantel compuertas. Ordenacin: Una ordenacin es un conjunto de datos numricos en orden creciente o decreciente. La deferencia entre el mayor y el menor se llama rango de ese conjunto de datos. Distribucin de Frecuencias: Una distribucin de frecuencias es una tabla en la cual se agrupa en clases los valores posibles para una variable y se registra el nmero de valores observados que corresponde a cada clase. Los datos organizados en una distribucin de frecuencias se denominan datos agrupados; por el contrario, para los datos no agrupados, se enumeran todos los valores observados de la variable aleatoria. Nmero de clase: El nmero de clase, es la divisin en la cual podemos ordenar la toma de datos obtenidos en campo. Una frmula de aproximacin para calcular el nmero de clases es la llamada Regla de Sturges, la cual matemticamente se define como: N0 = 1 + 3, 22 log N donde: N0 = total de numero de clases
Formatted: Font: 12 pt Formatted: Font: 12 pt

Formatted: Font: 12 pt

Formatted: Font: 12 pt

Formatted: Font: 12 pt Formatted: Font: 12 pt Formatted: Font: 12 pt

N= total de datos obtenidos en campo. log = logaritmo de Briggs.

Formatted: Font: 12 pt

Formatted: Font: 12 pt

Amplitud de clase. Es el valor que se le aumenta a la cantidad menor de los datos o valores obtenidos, para as elaborar las distribuciones de frecuencia, matemticamente se expresa:

V max Vnin A 1 3,22 log N


donde: maxV = valor mximo de los datos obtenidos en campo. minV = valor mnimo.

Formatted: Font: 12 pt

Formatted: Font: 12 pt

N0= nmero de clases= 1 + 3, 22 log N

Formatted: Font: 12 pt Formatted: Font: 12 pt

El resultado final de la amplitud de clase debe estrictamente obtenerse en numero entero; en caso contrario deber redondearse, si el decimal es mayor a 0.5 se aumentara una unidad al resultado obtenido.

Formatted: Font: 12 pt

Intervalos de clase. Indica el rango de los valores incluidos dentro de una clase y puede ser determinar restando el lmite exacto inferior de clase de su lmite exacto superior. Los lmites de clase inferiores son las cifras ms pequeas que pueden pertenecer a las diferentes clases. (Los lmites de clase inferiores de la tabla son 0, 100, 200, 300 y 400). Los lmites de clase superiores son las cifras ms grandes que pueden pertenecer a las diferentes clases. (Los lmites de clase superiores de la tabla son 99, 199, 299, 399 y 499). Las fronteras de clase son las cifras utilizadas para separar las clases, aunque sin los espacios creados por los lmites de clase. Se obtienen de la siguiente manera: se determina el tamao del espacio entre el lmite de clase superior de una clase y el lmite de clase inferior de la siguiente. Se suma la mitad de esa cantidad a cada lmite de clase superior, para obtener las fronteras de clase superiores; se resta la mitad de esa cantidad de cada lmite de clase inferior, para obtener las fronteras de clase inferiores. (Los espacios de la tabla son exactamente de una unidad, de modo que a los lmites de clase superiores se les suma 0.5 y a los lmites de clase inferiores se les resta - 0.5. Las fronteras de la primera clase son - 0.5 y 99.5, en tanto que las de la segunda clase son 99.5 y 199.5, y as sucesivamente. La lista completa de fronteras utilizadas para todas las clases es la siguiente: 0.5, 99.5, 199.5, 299.5, 399.5 y 499.5.)

Las marcas de clase son los puntos medios de las clases. (Las marcas de clase de la tabla son 49.5, 149.5, 249.5, 349.5 y 449.5). Cada marca de clase se calcula sumando el lmite de clase inferior con el lmite de clase superior y dividiendo la suma entre dos. Se representa por x La anchura de clase es la diferencia entre dos lmites de clase inferiores consecutivos o dos fronteras de clase inferiores consecutivas. (La anchura de clase que se utiliza en la tabla es igual a 100). Tabla 2-2 Distribucin de frecuencias de los niveles de cotinina (Tabla) de los fumadores Cotinina Frecuencia 099 11 100199 12 200299 14 300399 1 400499 2 Frecuencia. Se define como el nmero de veces en que se repite un suceso y se representa por la letra f Histograma. Un Histograma o Histograma de frecuencias, consiste en un conjunto de rectngulos, que pueden ser: (a) Con bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase. (b) reas proporcionales a las frecuencias de clase. Polgono de Frecuencias. Es un grfico de trozos de la frecuencia de clase con relacin a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectngulos del Histograma. Distribuciones de Frecuencias Relativas. La frecuencia relativa de una clase es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje, por lo tanto la suma de las frecuencias relativas de todas las clases es 100. Si se acumulan las frecuencias relativas de varias clases, a la tabla obtenida, se le llama tabla de frecuencia relativas. Distribuciones de Frecuencias Acumuladas. La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese intervalo de clase. Una tabla que presenta varias frecuencias acumuladas se llama tabla de frecuencias acumuladas A las distribuciones de frecuencias acumuladas tambin se les conoce como ojivas. Curvas de Frecuencia Los datos obtenidos pueden considerarse usualmente como pertenecientes a una muestra de una poblacin grande. Ya que son posibles muchas observaciones sobre esa poblacin, siendo
Formatted: Font: 12 pt

posible escoger intervalos de clase muy pequeas y tener todava nmeros razonables en cada clase.

Вам также может понравиться