Вы находитесь на странице: 1из 8

GENERACIN DE DATOS ESTADISTICOS LUIS ROS H

PARTE 1. LA RECOLECCIN DE DATOS ESTADSTICOS La recoleccin de datos no consiste solamente en apuntar lo que se observa, sino que conlleva un arduo trabajo cuyo resultado consiste en unas observaciones crticas, en donde se ocultan un sinfn de detalles no siempre pertinentes. La coleccin de datos requiere estructura, incluso un plan experimental y un mtodo de observacin. La recoleccin de datos estadsticos puede realizarse a travs de: a)ESTUDIOS EXPERIMENTALES, en donde el investigador tiene control sobre el diseo del experimento y se utilizan, como elemento fundamental, procesos de aleatorizacin. Estos estudios pueden ser de dos tipos:

MUESTREO (estudiar una parte para obtener informacin EXPERIMENTO (asignar tratamientos y ana-lizar efectos).

acerca del total)

b) ESTUDIOS OBSERVACIONALES, en donde se observan situaciones ya existentes, se comparan respuestas de individuos en varias categoras. En ellos, el investigador no tiene control sobre las variables de estudio y no hay un proceso de aleatorizacin. c) LOTES de datos, es decir, conjuntos de datos disponibles. Ya sea que hayan sido recolectados por otros, que se hayan recabado con otro propsito, pero que puedan ser tiles para resolver un problema especfico. La nocin de lote es un tanto vaga y no depende de la definicin de una variable, ni de una realizacin de un experimento aleatorio; ni siquiera depende del concepto tradicional de muestra, aleatoria o no. Los lotes pueden ocurrir individualmente, como simples conjuntos de observaciones de una sola variable, pueden ser mltiples, es decir, conjuntos de observaciones de varias variables diferentes. Los lotes individuales son las estructuras de datos menos complicadas. Los tres procedimientos mencionados para recabar informacin, son la estrategia por medio de la cual se obtienen DATOS ESTADSTICOS y deben realizarse en las mejores condiciones posibles con el fin de que la informacin resultante sea de buena calidad. Generalmente se llevan a cabo a travs de un PROTOCOLO, en donde se consignan las especificaciones correspondientes. Es decir, en un protocolo se detallan, entre otras cosas de carcter tcnico, el tipo de estudio, los mtodos para asignar tratamientos, el diseo de muestreo, etc.

FORMAS DE RECOLECCIN DE DATOS: En pocas recientes, y en virtud de los factores inherentes a la competencia por la productividad, y a la lucha por el poder en todos los sentidos, se ha hecho indispensable conocer bien las actitudes y las opiniones de los individuos. As, es muy importante darse cuenta de lo que opinan los consumidores, los votantes, las asociaciones, los grupos constituidos, etc., para la toma de decisiones. Esta tarea de recabar informacin se realiza a travs de algn instrumento, como: cuestionarios, entrevistas personales, preguntas por telfono, etc., mediante un proceso al que se le conoce con el popular nombre de encuesta.

La ENCUESTA, adems, se utiliza tambin como elemento de evaluacin y control para medir la efectividad de algn programa, pues bien conducida puede generar informacin precisa. Los principales Elementos de una Encuesta se detallan en seguida: EL PROPSITO: El primer paso para disear una encuesta, es definir con claridad el propsito objetivo de la encuesta. Es decir, para qu se realiza. Este propsito justifica y explica el proyecto y se convierte en la gua que fijar las futuras acciones. Esto implica que el encuestador tiene un claro conocimiento del problema inherente. La encuesta debe concretarse a tratar de resolver este problema. Toda informacin adicional, aunque sea interesante, puede alargar y complicar el trabajo en forma innecesaria. LA HIPTESIS: Una vez que el problema se ha establecido y aislado con claridad, es necesario formular una o varias hiptesis, que no son otra cosa que suposiciones, fundadas en la experiencia conocimiento, acerca de la naturaleza y/o solucin del problema involucrado. Si no se tiene una buena base para la formulacin de las hiptesis, entonces conviene desarrollar varios objetivos para enmarcar adecuadamente el alcance del cuestionario. Las hiptesis deber ser redactadas con mucho cuidado. No deben contener juicios personales de tipo creencia, ni enunciados tendenciosos, y deben ser lo ms especficas que se pueda. En un sentido estricto, una hiptesis debe poderse traducir en un enunciado que sea posible investigar cientficamente. LA PLANIFICACIN: La planificacin de la encuesta tiene como finalidad asegurar que se recaben suficientes datos que puedan proporcionar una solucin al problema de investigacin. Esta tarea tiene las siguientes partes: a) La Recoleccin de los Datos. Aqu se precisa cules y cuntos datos se requieren, atendiendo al propsito y a las hiptesis del estudio. Determinando con precisin el tipo de informacin que buscar el cuestionario y definiendo con claridad a quines se les debe preguntar. Como generalmente slo se estudia una parte de la poblacin de inters en virtud de las dificultades tcnicas y fsicas, ser necesario recurrir a algn esquema adecuado de muestreo, que tome en cuenta el riesgo que implica el tamao de la muestra, en un sentido probabilstico. Es conveniente tomar en cuenta los pros y contras cuando se usa una cuestionario para estar seguros de que es el mtodo ms satisfactorio. Asimismo, se deben considerar diferentes diseos de estudio, para ver si resultados diferentes tendran, de hecho, implicaciones diferentes por las hiptesis y las acciones que se tomarn. b) La Organizacin de la Informacin. En esta parte de la planeacin se especifica la manera como deber manejarse la informacin, tanto para que pueda ser incorporada a procesos de cmputo como para ser sometida a un buen anlisis. Las tareas bsicas de este apartado consisten en: Decidir acerca del tipo de instrumento (cuestionario) que se usar, la naturaleza de las preguntas, etc.

Plantear una buena estrategia para capturar la informacin pertinente, que puede ser a
travs de cualquiera 1. 2. 3.

a) Cuestionario, b) Entrevista, c) Encuesta telefnica, considerando en de los casos, los siguientes aspectos: El costo. La proporcin de posibles respuestas. La honestidad de las respuestas.

Disear adecuadamente el formato de las preguntas para decidir si se hacen PREGUNTAS ABIERTAS (donde los respondientes pueden crear sus propias respuestas) PREGUNTAS CERRADAS (donde los respondientes eligen una opcin de un nmero limitado de respuestas), o quizs una combinacin de las dos. Listar las reas globales de inters y redactar preguntas especficas, teniendo presente la poblacin de respondientes y asegurarse que las preguntas son suficientemente simples para que se entiendan fcilmente. Las preguntas deben seguir un orden lgico. Establecer categoras codificadas para cada pregunta de manera que el manejo de los datos se haga ms fcil. c) Anlisis de la Informacin. El anlisis que se haga de la informacin debe ser congruente con los datos obtenidos. Es necesario precisar qu mtodo estadstico se utilizar y con qu nivel de confianza se enunciarn las conclusiones. Los resultados deben ser descritos a travs de sumarios y grficos y debe hacerse, preferentemente, inferencia estadstica. LAS CONCLUSIONES En este apartado se consigna el resumen del trabajo en forma de conclusiones y/o recomendaciones. Se debe tener cuidado de no violar los supuestos bsicos de la estadstica, para que las conclusiones sean correctas.

PARTE 2: ELEMENTOS BSICOS DE MUESTREO La teora del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribucin de una caracterstica en una poblacin y las distribuciones de dicha caracterstica en todas sus muestras. Las ventajas de estudiar una poblacin a partir de sus muestras son principalmente: Costo reducido: Si los datos que buscamos los podemos obtener a partir de una pequea parte del total de la poblacin, los gastos de captura y tratamiento de los datos sern menores. Mayor rapidez: El manejo de pocos datos implica un ahorro considerable de tiempo. En este contexto, el proceso de inferencia estadstica comprende dos tareas:

La Seleccin de la muestra (muestreo). La Extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la poblacin
(inferencia). Los Diseos de Muestreo forman una metodologa muy importante para el trabajo estadstico y son parte del Protocolo de Investigacin cuando se realiza un Estudio. Bsicamente, son mtodos que definen la manera en que debe tomarse la las muestras necesarias para la recoleccin de informacin pertinente. Existen diferentes esquemas que se han diseado para distintos tipos de poblaciones y que, utilizando el poder de la inferencia estadstica y el muestreo probabilstico, pueden producir datos de mucha calidad. Es decir, los esquemas de muestreo proporcionan conjuntos de datos que pueden representar con mucha propiedad a la poblacin entera de donde se tom la muestra. Para que una muestra sea til, como factor de informacin, debe ser REPRESENTATIVA, es decir, debe asegurar con un alto grado de confianza QUE SE PARECE a la poblacin de donde procede. Adems, es necesario que dicha muestra: a) sea lo suficientemente grande (en un sentido probabilstico) y b) que no tenga SESGO, lo que quiere decir que todos los elementos de donde se extrae, deben tener la misma oportunidad de ser seleccionados. El SESGO significa error. Cuando decimos que se quiere una muestra INSESGADA (que no tenga sesgo), entonces queremos una muestra libre de error, lo que es, prcticamente, imposible, pues existen muchas fuentes de error, tanto dentro del mtodo de muestreo como fuera de l. EL ERROR DE MUESTREO es la diferencia entre el verdadero valor de una caracterstica poblacional (parmetro) y el valor de dicha caracterstica obtenido en la muestra. En un CENSO (toda la poblacin) no hay error de muestreo. Sin embargo, cuando no es posible hacer un censo, tendremos que tomar una muestra. En general, entre ms grande sea la muestra, menor ser el error de muestreo.

PARTE 3: DISEOS DE MUESTREO: Consideremos una poblacin finita, de la que se quiere extraer una muestra. Si el proceso de seleccin garantiza que cada uno de los elementos de la poblacin tiene la misma oportunidad de ser incluidos en dicha muestra, el proceso de seleccin se denomina muestreo aleatorio. Este tipo de muestreo, es probabilstico; descansa en los principios de la probabilidad y la regularidad estadstica y hace uso de los procesos de aleatorizacin. Este tipo de muestreo es el que produce el menor error posible de muestreo y, por tanto, muestras insesgadas. Una muestra aleatoria, entonces, cumple con los siguientes requisitos: 1) cada elemento de la poblacin de donde se toma, tiene la seleccionado. misma oportunidad de ser

2) la seleccin de un elemento de la poblacin no influye en la seleccin de algn otro elemento. El muestreo aleatorio se puede realizar bajo dos esquemas: Muestreo aleatorio sin reposicin. En este esquema se regresa cada uno de los n elementos seleccionados de una poblacin E, antes de hacer una nueva extraccin. Con esto, la poblacin permanece estable y su estructura es constante. 2. Muestreo aleatorio con reposicin En este esquema se realizan extracciones de n elementos de una poblacin E de tamao N, de tal modo que, en cada repeticin, el elemento extrado sea regresado a la poblacin. De esta forma un elemento puede ser extrado varias veces.

MUESTREO ALEATORIO SIMPLE: El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio simple, (MAS) en donde El MAS es un mtodo para seleccionar objetos de una poblacin, de tal manera que cada uno de ellos tenga la misma oportunidad de ser seleccionado (Condicin de ALEATORIEDAD) Adems, la seleccin de un elemento de la poblacin, no debe influir en la seleccin de otro (Condicin de INDEPENDENCIA). Este esquema debe utilizarse en poblaciones homogneas, es decir, poblaciones cuyos miembros tienen esencialmente las mismas caractersticas que se tiene inters en medir. Para seleccionar una muestra aleatoria simple se sigue el siguiente proceso: 1) Se construye un MARCO DE MUESTREO adecuado, de tal manera que todas las unidades de muestreo estn debidamente identificadas. Sin embargo, cuando se tienen poblaciones muy grandes, puede ser muy complicado elaborar los marcos de muestreo correspondientes. 2) Se realiza un PROCESO DE ALEATORIZACIN; esto es, se utilizan estrategias para seleccionar un conjunto de nmeros aleatorios. Las ms comunes se realizan a travs de

urnas, tablas de nmeros aleatorios y programas electrnicos que pseudo aleatorios. (Cada uno se toma de manera independiente y al azar).

generan

nmeros

En general, un proceso para generar nmeros aleatorios consiste en utilizar una urna, ya sea fsica simulada por computadora, que contiene los diez dgitos del 0 al 9, y de la cual se extraen, con reemplazo, series de nmeros que pueden ser arreglados en tablas, llamadas tablas de nmeros aleatorios. Estas tablas se utilizan para realizar procesos de aleatorizacin. Procedimiento general para la generacin de muestras aleatorias: Si se tiene una lista de nmeros aleatorios de k cifras, una poblacin de N individuos, y se quiere tomar una muestra de tamao n, entonces:

a) se

ordena la poblacin (usando cualquier criterio) de modo que a cada uno de sus elementos le corresponda un nmero del 1 a N. seguida, de la tabla de nmeros aleatorios, se extraen fracciones decimales (u) con tres cuatro lugares decimales. Estas fracciones se multiplican por el tamao de la poblacin (N) para obtener los n individuos de la muestra,

b) En

MUESTREO ALEATORIO ESTRATIFICADO: Se le llama muestreo aleatorio estratificado al diseo de muestreo en el que se divide la poblacin de N individuos, en k subpoblaciones o estratos, atendiendo a un determinado criterio que pueda ser importante en el estudio, de tamaos respectivos N1, ..., Nk,, con N1 + + Nk = N, y en cada una de estas subpoblaciones se realizan muestreos aleatorios simples de tamao ni. La designacin de los elementos que deben ser elegidos en cada uno de los estratos se realiza mediante varios procedimientos, entre los que se pueden mencionar la asignacin proporcional y la asignacin optima. Ejemplo 1: Suponga que se quiere realizar un estudio sobre la poblacin de estudiantes de la Universidad, en el que mediante una muestra de tamao 10 se quiere obtener informacin sobre el uso de los servicios de cafetera. Si se considera que el comportamiento de la poblacin, con respecto a esta variable, no es homogneo, y se puede dividir a la poblacin en dos estratos: Estudiantes masculinos (60% del total); Estudiantes femeninos (40% restante). entonces ambos grupos se pueden repartir proporcionalmente el nmero total de elementos, en funcin de sus respectivos tamaos (6 hombres y 4 mujeres). Esto es lo que se denomina asignacin proporcional. Hay muchos criterios para dividir una poblacin en estratos; algunos de ellos son: EL GNERO (hombre, mujer); LA EDAD (menos de 18, de 18 a 28, de 29 a 39, etc.); LA OCUPACIN (empleado, profesional, obrero, etc.). En este sentido, el muestreo aleatorio estratificado requiere un conocimiento ms profundo de las caractersticas de los elementos de la poblacin para establecer los criterios de estratificacin. Una muestra aleatoria estratificada es superior a una muestra aleatoria simple en el sentido de que divide a la poblacin en grupos homogneos, lo que conduce a una menor variabilidad en la muestra. Adems, se puede alcanzar un buen grado de precisin, con muestras ms pequeas.

MUESTREO SISTEMTICO: Cuando los elementos de la poblacin se pueden ordenar, ya sea en registros o en una lista, un muestreo sistemtico consiste en el siguiente proceso:

N Se calcula la cantidad k = n

Se elige aleatoriamente un nmero m, entre 1 y k; Se toma como muestra los elementos em , em+k , em+2k ,
Cuando el criterio de ordenacin de los elementos en la lista es tal que los elementos ms parecidos tienden a estar ms cercanos, el muestreo sistemtico suele ser ms preciso que el aleatorio simple, ya que recorre la poblacin de un modo ms uniforme.

MUESTREO NO PROBABILSTICO: Este tipo de muestreo, se realiza sin tomar en cuenta criterios probabilsticos y son ms bien, orientados por criterios subjetivos. Algunas formas utilizadas para este tipo de muestreo son: Muestreo de Juicio: El procedimiento consiste simplemente en apoyarse en la opinin de un experto en la materia que se estudia, para definir los elementos que deber contener la muestra. La representatividad de la muestra queda determinada solamente por el juicio del experto. Como no es una muestra aleatorizada, no debe ser usada para fines de inferencia estadstica. Muestreo por Conveniencia: En este mtodo, el responsable selecciona la muestra de la manera que es relativamente ms fcil y conveniente. Muestreo por Cuota: En este mtodo, el responsable selecciona la muestra, cuidando que contenga un determinado nmero de elementos con ciertas caractersticas.

TIPOS DE SESGO EN EL MUESTREO Ejemplo 2: Un canal de televisin de esta ciudad invita a su teleauditorio a que llame por telfono para dar su opinin acerca de un determinado problema regional. Se recabaron 874 llamadas. Cree usted que la muestra es representativa de la poblacin del estado? No. La muestra presenta los siguientes tipos de
SESGO:

sesgo de seleccin: los invitados a llamar por telfono fueron nicamente los que miraban el programa de noticias; esto excluy a todas las personas que vean otros programas en ese momento y a todas las personas que no vean televisin. sesgo de respuesta: las personas que respondieron se auto-seleccionaron, el tema les motiv lo suficiente para tomar el telfono, (y es posible, incluso, que algunos hubieran llamado ms de una vez). Por tanto esta muestra puede no representar a toda la poblacin en una manera exacta, aunque el tamao de la muestra sea grande.

Ejemplo 3: Un consorcio bancario hace una encuesta telefnica acerca de la calidad de sus servicios, tomando 400 de sus clientes al azar. Qu problemas potenciales existen en usar este tipo de encuestas para obtener datos? Los principales problemas que se pueden presentar son: a) Nmeros telefnicos no enlistados. Si se usa el directorio telefnico como una fuente de nmeros, hay muchas personas que no aparecen en l, por tener nmeros confidenciales. b) Llamadas no contestadas. Hay personas que no estn frecuentemente en casa. c) Respuestas inexactas y deshonestas. Problema fuera del control directo del encuestador.

Вам также может понравиться