Вы находитесь на странице: 1из 28

Contenido

ndice de figuras

iii

ndice de tablas

Nomenclatura

Estadstica descriptiva

1. Elementos generales

1.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2. Formas del saber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3. Qu es estadstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.4. Clasificacin de la estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.5. Algunos trminos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.6. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ii

CONTENIDO

1.7. Medicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.8. La investigacin estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

1.9. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

1.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

Referencias

18

Figuras

1.1. Pierre-Simon Laplace (1749-1827). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

iii

iv

FIGURAS

Tablas

vi

TABLAS

Parte I

Estadstica descriptiva

Captulo

Elementos generales
1.1.

Introduccin

En las ltimas dcadas la estadstica ha alcanzado un alto grado de desarrollo, hasta el punto de involucrarse
en la mayora de las reas del conocimiento. La estadstica es una ciencia1 auxiliar para todas las ramas
del saber, y su utilidad es evidente teniendo en cuenta que la mayora de los quehaceres y las decisiones en
cualquier disciplina involucran cierto grado de incertidumbre o incerteza.
Los crticos de la estadstica afirman que a travs de la estadstica es posible mostrar o comprobar casi cualquier
cosa; esta es una concepcin ligera y profana que se deriva de la ignorancia de la disciplina estadstica, dado
que en estos casos se desconoce la teora subyacente y la forma adecuada de interpretar los resultados que
permiten obtener conclusiones acertadas y precisas. As, algunos investigadores tendenciosos han abusado de
la estadstica, elaborando investigaciones de intencin, teniendo previamente los resultados que les interesa
mostrar a personas ingenuas y no conocedoras de las tcnicas estadsticas. Otros, por ignorancia o negligencia,
tambin abusan de la estadstica utilizando mtodos no apropiados o razonamientos errneos que conducen al
fracaso de sus investigaciones.
Solo adentrndose en un mundo especfico como en las ciencias sociales, la economa y la administracin, por
ejemplo, es posible percibir que la estadstica es una herramienta que permite dar luz y obtener resultados, y
por tanto beneficios, en cualquier tipo de estudio terico o aplicado, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordados desde la perspectiva de las leyes deterministas2 . Pierre-Simon
1 La ciencia es el conjunto de conocimientos obtenidos mediante la observacin y el razonamiento, sistemticamente
estructurados y de los que se deducen principios y leyes generales (Real Academia Espaola, 2012a). Surge de la
obtencin del conocimiento mediante la observacin de patrones regulares, de razonamientos y de experimentacin en
mbitos especficos, a partir de los cuales se generan preguntas, se construyen hiptesis, se deducen principios y se
elaboran leyes generales y esquemas metdicamente organizados (Wikipedia, 2012b).
2 Teora que supone que la evolucin de los fenmenos naturales est completamente determinada por las condiciones

CAPTULO 1. ELEMENTOS GENERALES

Laplace 3 , quien contribuy enormemente al desarrollo de la teora de probabilidades, afirm: Podemos mirar
el estado presente del universo como el efecto del pasado y la causa de su futuro. Se podra condensar un
intelecto que en cualquier momento dado sabra todas las fuerzas que animan la naturaleza y las posiciones
de los seres que la componen; si este intelecto fuera lo suficientemente vasto para someter los datos al anlisis,
podra condensar en una simple frmula el movimiento de los grandes cuerpos del universo y del tomo ms
ligero; para tal intelecto nada podra ser incierto y el futuro as como el pasado estaran frente sus a ojos.

Figura 1.1: Pierre-Simon Laplace (1749-1827).

1.2.

Formas del saber

Los seres humanos poseen mayores o menores conocimientos, segn el modo y el grado de participacin en
la cultura; pero de cualquier forma las formas y tipos de conocimientos generan dos modos principales del
saber que son el saber cotidiano y el saber cientfico. Se sabe de manera natural por el solo hecho de
vivir, y se sabe cientficamente cuando existe una disposicin de conocer y de indagar en lo desconocido con
los procedimientos pertinentes.
El saber cotidiano es el conocimiento que se adquiere en la experiencia cotidiana, y trata de conocimientos
levemente conectados y arraigados entre s; sin embargo, pueden ser conocimientos superficiales constituidos
por una yuxtaposicin de casos y hechos. Es el modo espontneo de conocer que se caracteriza por ser superficial
y se conforma con lo aparente, puesto que est apoyado solo en la evidencia inmediata de lo que pasa, por lo
que nicamente percibe la superficie de una realidad. Adems, este saber cotidiano no es sistemtico, tanto en
el proceso de adquisicin y vinculacin de la informacin, como en el modo de establecer cnones de validacin
de la informacin; se limita a percibir lo inmediato a travs de experiencias, vivencias, estados de nimo y
emociones de la vida diaria, permaneciendo en el nivel de la certeza sensorial.
iniciales (Real Academia Espaola, 2012c).
3 Fotografa tomada de la pgina web http://www.educared.org/global/premiointernacional/finalistas/710/
biograf/Blaplace.html.

1.3. QU ES ESTADSTICA?

De otra parte, se entiende por conocimiento cientfico, al conjunto de conocimientos racionales, ciertos o
probables, que obtenidos de manera metdica y verificados empricamente, se sistematizan orgnicamente,
cuyos contenidos son susceptibles de ser transmitidos.
El saber cientfico es racional, puesto que exige el uso de la razn y de una serie de elementos fundamentales,
como definiciones, proposiciones e hiptesis. Es cierto o probable, porque se trata con verdades parciales, sujetas
a correccin cuando nuevas experiencias demuestran la necesidad de rectificacin. En la ciencia no existe
la certeza absoluta. El conocimiento cientfico es metdico, ya que no se obtiene al azar, sino mediante reglas
lgicas, que acompaadas de procedimientos tcnicos se organizan segn convenciones establecidas. Tambin
requiere la confrontacin con la realidad y la sistematizacin orgnica, porque no se trata de conocimientos
inconexos sino de un saber ordenado lgicamente, constituyendo un sistema de generalizaciones y principios
que relacionan los hechos entre s, deduciendo leyes y teoras. Adems, los conocimientos de una ciencia deben
ser transmisibles por medio de un lenguaje que le sea propio y que debe responder a todas las exigencias de
claridad y precisin.

1.3.

Qu es estadstica?

Para definir la estadstica se debe precisar cada una de las tcnicas que se emplean en los diferentes campos en
los que interviene. La definicin dada en seguida permite apreciar la relacin entre la estadstica y el mtodo
cientfico4 .

Definicin 1.3.1. La estadstica es la ciencia que se ocupa de los mtodos


y las tcnicas para recoger, clasificar, resumir y analizar conjuntos de datos;
as como de realizar inferencias a partir de ellos, con la finalidad de tomar
decisiones racionales en situaciones que impliquen incerteza.
Nota. Los datos asociados con una realidad determinada pueden provenir de muchas fuentes, como registros
histricos, diseos experimentales o muestras.

1.4.

Clasificacin de la estadstica

La estadstica se divide en dos grandes ramas de estudio, que son la estadstica descriptiva, cuando los resultados del anlisis no pretenden ir ms all del conjunto de datos observado, y la estadstica inferencial,
cuando el objetivo del estudio es obtener conclusiones para un conjunto de datos ms amplio a partir de uno
de menor tamao. Estas dos ramas no son independientes; por el contrario, son complementarias, y juntas
proporcionan suficiente informacin sobre la realidad, para que quien tenga poder de decisin, pueda tomar
las medidas necesarias con el mayor grado de certeza posible.
4 El mtodo cientfico es el camino a seguir mediante una serie de operaciones, reglas y procedimientos fijados
de antemano de manera voluntaria y reflexiva, para alcanzar un determinado fin que puede ser material o conceptual
(Prez, 2004, p. 188).

CAPTULO 1. ELEMENTOS GENERALES

Definicin 1.4.1. La estadstica descriptiva describe y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan
la informacin contenida en ellos.

La estadstica descriptiva evidencia tal cual es una situacin y muestra lo que hay ; permite explicar las
observaciones que se hagan sobre un evento, fenmeno o problema de investigacin, evidenciando propiamente
la forma como los hechos ocurrieron o se manifestaron.

Definicin 1.4.2. La estadstica inferencial apoyndose en el clculo de


probabilidades y a partir de un conjunto de datos menor, permite efectuar
estimaciones, predicciones u otras generalizaciones sobre un conjunto de datos
mayor.

La estadstica inferencial toma lugar cuando a partir de los resultados obtenidos de un conjunto de datos dado
se obtienen conclusiones acerca de un conjunto de datos ms amplio. Es decir, las conclusiones que se obtienen
de los datos en estudio, rebasan los lmites de los mismos. Generalmente, el anlisis estadstico inferencial se
lleva a cabo para mostrar relaciones de causa y efecto, y para probar hiptesis y teoras.

1.5.

Algunos trminos importantes

El objeto de estudio de la estadstica son los fenmenos colectivos5 , donde el comportamiento de una serie de
caractersticas est afectado por la aleatoriedad6 intrnseca de la naturaleza de los fenmenos en cuestin. A
continuacin se presentan algunos trminos empleados frecuentemente en la investigacin de tales fenmenos.

Definicin 1.5.1. Los individuos o elementos son los entes que se quieren
investigar. As, una poblacin, colectivo, o universo, se refiere al conjunto de todos los individuos o mediciones que satisfacen ciertas caractersticas
propias de la investigacin.
Nota. La definicin 1.5.1 no se refiere nicamente a los seres vivos; una poblacin puede estar constituida por
los habitantes de un pas o por los peces de un estanque, as como por los establecimientos comerciales de un
barrio o las viviendas de una ciudad.
5 Tambin se puede tratar de un fenmeno individual repetido a travs del tiempo (detalles en la seccin 1.6). ste
se puede entender como un fenmeno colectivo al considerar las ocasiones de medicin como los elementos unitarios.
6 La aleatoriedad es una caracterstica asociada a todo proceso cuyo resultado no es previsible, ms que en razn
de la intervencin del azar, y por ende no se puede determinar en ningn caso antes de que ste se produzca.

1.5. ALGUNOS TRMINOS IMPORTANTES

Llevando a cabo una investigacin se deben tener en cuenta algunas caractersticas esenciales al delimitar la
poblacin en estudio, a saber, la homogeneidad, el tiempo, la cantidad y el espacio.
La homogeneidad se refiere a que todos los miembros de la poblacin tengan en comn las caractersticas
que se vayan a considerar en la investigacin. Por ejemplo, si se investiga la incidencia de la drogadiccin en
mujeres adolescentes, hay que definir precisamente el rango de edad de las jvenes de inters, de forma tal que
todas las mujeres consideradas sean de la edad requerida.
El tiempo se refiere al perodo cuando se ubicara eventualmente la poblacin de inters. Determinar si el estudio corresponde a la observacin de los elementos en un momento determinado, o si corresponde al seguimiento
de los individuos a lo largo del tiempo.
La cantidad se refiere al tamao de la poblacin. La falta de recursos como tiempo, dinero, espacio y
materiales puede limitar la extensin de la poblacin que se quiere investigar. Por ejemplo, si se quiere
estudiar la preferencia de los colombianos frente a un producto determinado, no es necesario tener en cuenta
todas las personas econmicamente activas del pas, sino aquellos individuos que tengan participacin en el
mercado del producto en cuestin.
El espacio se refiere al lugar donde se localiza la poblacin de inters. Tambin, la falta de recursos puede
obligar al investigador a limitar el estudio a un conjunto de elementos ms especfico. Siguiendo el ejemplo
anterior, puede que dicho producto se ofrezca principalmente en zonas particulares de las ciudades intermedias.
Una poblacin puede ser, segn su tamao, de dos tipos, a saber, finita o infinita. Una poblacin finita es
aquella en la que el nmero de elementos que la conforma es finito. De otra parte, una poblacin infinita es
aquella en la que el nmero de elementos que la forma es infinito, o es tan grande que se puede considerar
infinito. Por ejemplo, si se realiza un estudio sobre los productos que hay en el mercado, hay tantos y de tantas
calidades que esta poblacin se puede considerar como infinita.

Definicin 1.5.2. Se denomina muestra a un subconjunto de individuos o


mediciones de una poblacin.
Nota. La cantidad de individuos de una muestra se simboliza con n, mientras que la cantidad de elementos
que constituyen una poblacin finita se representa con N .
Se distinguen dos tipos de muestras. La clasificacin de una muestra depende de cun representativa sea de la
poblacin, lo que se identifica por el mtodo de obtencin de la misma. Se tienen las muestras obtenidas a partir
de procesos de muestreo no probabilstico y de muestreo probabilstico. Las muestras no probabilsticas
se caracterizan porque el diseo muestral7 correspondiente se realiza en forma subjetiva, arbitraria, segn
el criterio del investigador o del entrevistador de campo. En el muestreo no probabilstico no existe una
oportunidad real de que un elemento en particular de la poblacin sea seleccionado y por lo tanto no es
posible calcular la confiabilidad de las inferencias asociadas. De otra parte, las muestras probabilsticas
se fundamentan en la posibilidad que tiene cada elemento de la poblacin en hacer parte de la muestra. En
7 El diseo muestral comprende todos los aspectos relacionados con la obtencin de una muestra respecto a las
caractersticas objeto de estudio, como los objetivos de la investigacin, la estructura de la poblacin y los recursos
disponibles (humanos, financieros, materiales, de disponibilidad de tiempo, etc.).

CAPTULO 1. ELEMENTOS GENERALES

estas muestras, dadas ciertas condiciones de confiabilidad, error mximo admisible y tamao poblacional, se
deja al azar el diseo de la muestra. El muestreo probabilstico permite medir la confiabilidad de los procesos
de inferencia y el error de muestreo que est asociado intrnsecamente en el proceso (Soto, 2001, p.31-33).
El muestreo es indispensable para el investigador ya que en la mayora de aplicaciones no es conveniente o
posible medir a todos los miembros de una poblacin, esto es, realizar un censo. En tales casos, se requiere
una muestra representativa de la poblacin con el propsito de obtener conclusiones vlidas acerca de todo el
colectivo en estudio.
El tamao de la muestra depende de la precisin con que el investigador desee llevar a cabo el estudio; se debe
usar una muestra tan grande como sea posible teniendo en cuenta los recursos disponibles. Cuanto ms grande
sea el tamao de muestra, mayor ser la posibilidad de que la muestra sea representativa de la poblacin.

Definicin 1.5.3. Se llama parmetro a una funcin definida sobre los valores de una caracterstica medible de una poblacin. Similarmente, se denomina
estadstico (observado) a una funcin definida sobre los valores de una caracterstica medible de una muestra.
Nota. Los conceptos de parmetro y estadstico son casi idnticos. La nica diferencia radica en el conjunto
de datos donde cada cual es calculado; mientras un estadstico se calcula utilizando los datos de una muestra,
un parmetro se calcula utilizando los datos de una poblacin.
Ejemplo 1.5.1. El promedio muestral y el promedio poblacional de una poblacin finita son ejemplos de
un estadstico y de un parmetro respectivamente. Suponga que X representa una caracterstica medible de
inters (detalles en la seccin 1.6 y ??) y que xi representa el valor de X asociado con el i-simo individuo;
as, el promedio muestral observado de X, denotado con x
, se define como:
x
=

n
1X
x1 + x2 + . . . + xn
=
xi
n
n i=1

Anlogamente, se define el valor del promedio poblacional de X, denotado por X , como:


X =

N
x1 + x2 + . . . + xN
1 X
=
xi
N
N i=1


Nota. Las expresiones dadas el ejemplo 1.5.1 son casi idnticas, pero la diferencia salta a la vista: en la primera
frmula, se tiene la informacin de una muestra; mientras que en la segunda expresin, se tiene la informacin
de una poblacin.

1.6.

Variables

Las variables constituyen la materia prima de toda investigacin estadstica. En una investigacin lo primero
que se debe hacer es delimitar la cuestin a investigar, lo que permite evidenciar las variables preponderantes
del estudio.

1.6. VARIABLES

Definicin 1.6.1. Una variable es una caracterstica observable o medible de


un individuo, que se describe acorde con una escala de medicin bien definida.
Cada rasgo, aspecto o caracterstica de una poblacin constituye una variable.

Algunos ejemplos de variables son la edad, el gnero, la raza, la nacionalidad, la estatura, el peso, el ingreso,
el nmero de nacimientos, la tasa de suicidios, el producto interno bruto, entre otras.
Nota. Las variables como la inteligencia, el gusto, el miedo y la vocacin, por ejemplo, no son variables
observables. Tales caractersticas se denominan variables latentes. Cmo realizar estudios que involucren
este tipo de variables? Generalmente se emplean variables auxiliares que reflejen el atributo que se quiere
investigar, como los coeficientes de inteligencia y las escalas de valores o afinidad, por ejemplo.
Las variables se pueden clasificar segn su naturaleza como variables numricas (cuantitativas) o categricas
(cuantitativas).
Las variables categricas son aquellas que se expresan en forma verbal como categoras o atributos. El
gnero, la raza, la afiliacin poltica, la nacionalidad y la profesin son ejemplos de variables cualitativas.
Las variables numricas son aquellas que varan en trminos de cantidad y se registran o expresan en forma
numrica. La edad, el peso, la estatura, la temperatura y el salario son ejemplos de variables cuantitativas. A
su vez, estas variables se clasifican como sigue:
Variables discretas: no admiten siempre un valor intermedio entre dos valores cualesquiera de la
variable. Por ejemplo, el nmero de hijos de una persona es una variable cuantitativa discreta.
Variables continuas: siempre admiten un valor intermedio entre dos valores cualesquiera de la variable.
Por ejemplo, el salario de un empleado medido en millones de pesos es una variable cuantitativa continua.
En ocasiones, por simplicidad, conviene expresar las variables cuantitativas como variables categricas. Por
ejemplo, las calificaciones de los estudiantes pueden ser categorizadas y expresadas como una variable cualitativa. As, el investigador puede utilizar una escala numrica de 0 a 5 para observar las calificaciones de
los estudiantes, y por comodidad expresar las observaciones por medio de categoras acordes con un rango
especfico de valores en el que la calificacin del estudiante se encuentre, como por ejemplo, deficiente, regular,
bueno y excelente.
De otra parte, las variables tanto cualitativas como cuantitativas, tambin pueden ser clasificadas como variables transversales o longitudinales. Las primeras son aquellas en las que el momento de recoleccin de
la informacin es el mismo para todos los individuos, o simplemente no es objeto de estudio; mientras que las
variables longitudinales son observadas repetidamente a travs del tiempo.
Ejemplo 1.6.1. Una empresa de consultora est creando un par de formularios para dos clientes que necesitan
informacin sobre un grupo particular de compaas que les son de inters. El primer formulario indaga sobre el
estado actual de las empresas de exportacin respecto al ao pasado, y necesita establecer de stas: el porcentaje
de aumento de sus ventas respecto al ao pasado, la cantidad de clientes nuevos que tiene este ao, el nmero
de empleados que maneja y los grupos industriales a los que exporta. De otro lado, el segundo formulario busca
conocer los sectores industriales que se encuentran en crecimiento constante y su posible horizonte financiero.

CAPTULO 1. ELEMENTOS GENERALES

Para esto requiere establecer de las industrias: el sector en el que se encuentra, el porcentaje de aumento en la
produccin y la cantidad de clientes nuevos respecto al mes anterior. Clasificar las variables de inters. Cul
formulario es necesario diligenciar ms de una vez?
Solucin:
Para el primer formulario, el porcentaje de aumento de sus ventas respecto al ao pasado es una variable
cuantitativa continua, ya que este valor puede ser cualquier nmero real. La cantidad de clientes nuevos que
tiene este ao es una variable cuantitativa discreta, dado que si se tienen 10 u 11 clientes nuevos no es posible
tener 10.5, por ejemplo. El nmero de empleados que maneja tambin es una variable cuantitativa discreta,
siguiendo el mismo razonamiento de la variable anterior. Por ltimo, los grupos industriales a los que exporta
es una variable cualitativa, puesto que est asociada con un nmero finito de valores cualitativos, a saber,
industrial, comercial y de servicios.
En relacin con el segundo formulario, el sector en el que se encuentra es una variable cualitativa como la
ltima variable del formulario anterior. Adems, el porcentaje de aumento en la produccin y la cantidad de
clientes nuevos respecto al mes anterior son variables cuantitativas, continua y discreta respectivamente, tal y
como se explic para el primer formulario.
De otra parte, lo que se debe determinar en cuanto al diligenciamiento de los formularios es el objetivo de cada
uno, es decir, la razn de ser de cada cual. El primer formulario pretende responder a una cuestin puntual
referida a una comparacin entre la actualidad y un tiempo pasado, mientras que el segundo est diseado
para conocer una tendencia con el propsito de conjeturar sobre una situacin futura. Luego, lo ms adecuado
es que el primer formulario sea diligenciado una sola vez en el tiempo para realizar dicha comparacin (estudio
transversal), mientras que el segundo formulario requiere que sea diligenciado varias veces para establecer la
tendencia del crecimiento en el tiempo (estudio longitudinal). Por ende las variables del primer formulario son
variables transversales y las del segundo son variables longitudinales.

Nota. Un mismo formulario puede contener variables transversales y longitudinales.

1.7.

Medicin

Cuando se habla de estadsticas o de mtodos estadsticos se est inmerso necesariamente en el campo de la


medicin. Se quiere obtener informacin precisa del objeto en relacin con las caractersticas de inters, que al
ser medibles, deben procurar informacin concisa y concreta del fenmeno investigado. Toda informacin que
pueda ser obtenida con estas caractersticas se considera real y verdadera, y por tanto se le adjudica validez.
Por consiguiente, la medicin es fundamental para que los juicios sean acertados y vlidos.

Definicin 1.7.1. La medicin es un proceso mediante el cual se asignan


valores cuantitativos o cualitativos a los atributos de los elementos objeto de
estudio, de acuerdo con unas reglas claramente preestablecidas.

1.7. MEDICIN

Cuando se trata de objetos fsicos el proceso de medicin es directo, porque es cuestin de seguir cuidadosamente unas reglas acordadas de antemano expresadas mediante una escala determinada. Por ejemplo, es fcil
tomar la estatura de una persona, dado que no hay dificultades en asignar un nmero a la distancia que hay
desde la planta de los pies hasta la coronilla del individuo de acuerdo con la escala de una cinta mtrica.

Definicin 1.7.2. Una escala de medicin es un esquema especfico para asignar smbolos o nmeros con el objeto de designar los valores de una
variable.

La taxonoma ms conocida sobre las escalas de medicin la presenta Stevens (1951), quien las clasifica en
nominales, ordinales, de intervalos y de razn:
La escala nominal es aquella donde se clasifican los individuos en categoras distintas. Consiste en agrupar
los individuos de acuerdo con alguna cualidad que los hagan propios de una categora determinada.
Es posible utilizar nmeros en las escalas nominales, pero stos no representan magnitudes absolutas. Los
nmeros solo se utilizan con el propsito de etiquetar una determinada categora. Por ejemplo, en algunas
encuestas se asigna el nmero 1 al gnero masculino y el nmero 2 al gnero femenino, con el propsito de
facilitar el almacenamiento y manejo de la informacin, pero ello no quiere decir que el gnero masculino tenga
mayor o menor valor que el gnero femenino.
Los nmeros utilizados para efectos de identificacin en una escala nominal, nunca se utilizan para llevar a
cabo procedimientos aritmticos. Su nica funcin es identificar. De hecho, la medicin en una escala nominal
es limitada porque solo permite efectuar una clasificacin, mas no establecer la magnitud de lo que se clasifica.
La escala ordinal es aquella donde se clasifican las unidades de observacin en una posicin en relacin con
cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Cuando se asignan nmeros es solo
para indicar el orden de las posiciones de lo que se est identificando. Por ejemplo, una junta directiva se
encuentra analizando tres diferentes alternativas A, B y C para una campaa de mercadeo, y deciden que
la alternativa A es la mejor y que la B es la peor; as, se han ordenado las alternativas de acuerdo con la
conveniencia para la campaa, pero no es posible evidenciar qu tan conveniente es la alternativa A respecto
a las otras dos alternativas.
Con una escala ordinal tampoco se deben llevar a cabo las operaciones aritmticas. La diferencia que pueda
haber entre los elementos observados, no est constituida por unidades absolutas que se puedan utilizar para
determinar la distancia entre los objetos medidos. Por ejemplo, en una carrera en la que no ha sido tomado
el tiempo de los competidores, es posible establecer quin lleg primero, y quin lleg segundo, pero no es
posible establecer la diferencia entre los tiempos de llegada de los competidores.
La escala de intervalo es aquella donde se ordenan los elementos segn la magnitud del atributo que
representan y se proveen intervalos iguales entre las unidades de medida. No posee un cero absoluto, dado
que es establecido por convencin de forma arbitraria por los expertos en el rea de estudio; el 0 no implica
la ausencia del atributo. Por ejemplo, la escala de medida de la inteligencia posee un valor 0, pero ste no
indica que un ser humano no tenga inteligencia. Anlogamente, si la temperatura de un objeto es 0 grados

10

CAPTULO 1. ELEMENTOS GENERALES

centgrados, no es cierto que dicho elemento carezca de temperatura, ya que la designacin del valor 0 es
arbitraria y convencional.
Una diferencia de cierta magnitud en una escala de intervalo significa lo mismo para todas las posibles diferencias con esa misma magnitud. Por ejemplo, la diferencia en la temperatura entre 1 y 2 es equivalente
a la diferencia entre 101 y 102.
Por ltimo, la escala de razn es aquella donde el punto 0 no es arbitrario y corresponde a una total ausencia
de la caracterstica observada. Por ejemplo, la escala de medicin de una regla de 10 centmetros es de razn,
la cual est dividida en 10 unidades cada una de igual magnitud a partir de un punto 0 absoluto y verdadero.
Algunas variables con las que se utiliza este tipo de escala se refieren a la ejecucin de tareas motoras y a los
aspectos fisiolgicos. Dos ejemplos clsicos de la escala de razn son las medidas empleadas para cuantificar
la estatura y el peso de una persona. Adems, dado el carcter absoluto del 0, la razn entre los valores
involucrados en esta escala de medida hace sentido.

1.8.

La investigacin estadstica

En esta seccin se seala el esquema de una investigacin estadstica, de la cual se har nfasis en los tpicos
que se consideran de mayor relevancia e inters para el lector. El esquema de una investigacin estadstica es
el siguiente:
i. Planteamiento del problema.
ii. Introduccin y justificacin.
iii. Preguntas de investigacin y/o formulacin de las hiptesis.
iv. Objetivos.
v. Fundamentacin terica y de referencia.
vi. Poblacin, muestra y medicin.
vii. Diseo de la investigacin.
viii. Presentacin y publicacin.
ix. Cronograma y presupuesto.
x. Bibliografa.
Nota. Este es apenas un esquema de una investigacin estadstica y no es lineal e irreversible.

Planteamiento del problema


Qu realidad interesa investigar?
En una investigacin es absolutamente necesario establecer qu y por qu se quiere estudiar algo. Para ello, se
debe lograr una delimitacin clara, concreta e inteligible del problema que se quiere abordar, con el propsito de

1.8. LA INVESTIGACIN ESTADSTICA

11

evidenciar su accesibilidad y solubilidad, de forma tal que por medio de una revisin bibliogrfica responsable
sea posible conocer el estado del arte, los resultados obtenidos en investigaciones similares y corroborar las
proposiciones bsicas concebidas inicialmente.

Introduccin y justificacin
Qu se sabe de la realidad que interesa investigar? Por qu interesa investigar esta realidad?
Antes de realizar cualquier investigacin es obligatorio identificar qu se sabe acerca de la realizad que se
quiere examinar, con el propsito de establecer un punto de partida propio y real para el estudio. Esto permite
contextualizar e involucrar a todos los agentes de quienes pueda depender en alguna medida la investigacin.
Por lo mismo es muy importante justificar apropiadamente por qu es menester investigar tal realidad. De aqu
depende que sea interesante y conveniente para todos los actores involucrados, pues de ello depende muchas
veces la consecucin de los recursos.

Preguntas de investigacin y/o formulacin de las hiptesis


Qu particularidades interesan de los hechos objeto de estudio?
Una hiptesis es una explicacin provisional de los hechos objeto de estudio y su formulacin depende del
conocimiento que el investigador posea sobre la poblacin investigada. Una hiptesis estadstica debe ser
susceptible de prueba, esto es, se debe poder docimar o juzgar para su aceptacin o rechazo.

Objetivos
Qu se quiere encontrar en el fenmeno objeto de estudio? Qu se espera que suceda con la intervencin?
Luego de establecer los hechos objeto de estudio, se debe presupuestar hasta dnde se quiere llegar con la
investigacin; en otras palabras, se debe fijar cules son los objetivos de la investigacin. stos se deben
plantear de tal forma que no haya lugar a confusiones o ambigedades. Adems, es recomendable diferenciar
los objetivos a corto, mediano y largo plazo, as como los objetivos generales y los especficos.

Fundamentacin terica y de referencia


En qu se apoya el investigador para estudiar esta realidad?
Se debe evidenciar todo el bagaje terico que dirige la investigacin, describiendo completamente el sustento
terico del problema y las evidencias de todo tipo que se encuentren alrededor del mismo. En la fundamentacin
tambin se definen los trminos ms relevantes del estudio, ilustrando sus principales rasgos y caractersticas.

12

CAPTULO 1. ELEMENTOS GENERALES

Poblacin, muestra y medicin


Quines forman parte de la realidad que se estudia? De ellos, quines sern los informantes? Qu y cmo
se quiere medir?
La unidad de observacin, entendida como cada elemento de la poblacin estudiada, debe ser definida
previamente, de tal forma que se destaquen todas sus caractersticas; pues, al fin de cuentas, es sobre las
unidades de observacin que se hace la medicin. Una unidad de observacin puede estar constituida por un
elemento (unidad de observacin simple) o por varios elementos (unidad de observacin compleja).
De otra parte, el criterio sobre el proceso de medicin debe ser previamente definido y unificado. Por ejemplo, si
se trata de medidas de longitud, volumen o peso, se debe establecer bajo qu unidad de medida se tomarn las
observaciones, ya sea en metros, pulgadas, libras, kilogramos, etc. As mismo, se deben detallar las condiciones
bajo las cuales se ha de efectuar la toma de la informacin.
En variadas circunstancias, estudiar todos y cada uno de los elementos que conforman la poblacin no es
aconsejable, ya sea porque los recursos econmicos y humanos son limitados, la homogeneidad de sus elementos
no justifica un censo, o tal vez porque puede ser necesario destruir la unidad de observacin. Por tales motivos
se recurre al anlisis de los elementos de una muestra con el fin de hacer inferencias respecto a la poblacin.
La muestra en cuestin debe ser representativa de la poblacin, esto es, sus elementos deben ser escogidos de
manera aleatoria de tal forma que reflejen las caractersticas propias de todos los individuos que conforman el
colectivo en estudio.

Diseo de la investigacin
Cmo se desarrolla la investigacin? Cmo se organiza la investigacin?
En esta etapa se presenta el panorama metodolgico completo que evidencia la forma como se organiza todo el
proceso de investigacin y los aspectos metodolgicos esenciales que guan el trabajo del investigador. En esta
fase es de suma importancia la claridad y la precisin para dar cuenta del posicionamiento del investigador en
el mapa metodolgico de la investigacin cientfica. Dentro del panorama metodolgico se deben contemplar
de manera particular los siguientes aspectos: recoleccin, crtica, clasificacin y ordenacin, y anlisis de la
informacin.
Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, que ha de partir a
menos que se tenga experiencia con muestras anlogas de una o varias muestras piloto8 en las que se pondrn
a prueba los instrumentos de medicin y se obtendr una idea preliminar de la variabilidad de la poblacin,
con el fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de los parmetros con la
precisin deseada.
8 Una muestra piloto es un subconjunto de objetos de estudio que no son necesariamente seleccionados bajo el
rigor terico de una muestra probabilstica. Una muestra piloto permite realizar una descripcin preliminar del fenmeno
de estudio y probar varios pasos metodolgicos de la investigacin, con el fin de realizar correcciones y examinar los
supuestos tericos de las etapas posteriores.

1.9. COMENTARIOS

13

Establecer las fuentes de informacin, as como la complejidad del instrumento de medicin, son decisiones que
se han de tomar teniendo en cuenta todos los factores involucrados en la observacin de los elementos objeto
de estudio. Se debe, entonces, descubrir dnde est la informacin, cmo y a qu costo se puede conseguir.
Despus de reunir la informacin pertinente, se necesita la depuracin de los datos recogidos. Para hacer la
crtica de la informacin, es fundamental el conocimiento de la poblacin por parte de quien depura, para que
sea posible detectar, por ejemplo, falsedades en las respuestas, incomprensin a las preguntas, o respuestas al
margen de todas las posibles causas de nulidad de una pregunta. Una vez separado el material de desecho de
la informacin debidamente depurada se procede a establecer las clasificaciones respectivas, y con la ayuda
de hojas de trabajo, se ordenan las respuestas y se preparan los modelos de tabulacin de las variables que
intervienen en la investigacin. Los avances tecnolgicos hacen que estas tareas, manualmente dispendiosas,
puedan ser realizadas en corto tiempo.
La estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones de primera mano
en aseveraciones cuya confiabilidad puede ser evaluada en la toma de decisiones. Esta es la fase de clculo de
los estadsticos, el ajuste de los modelos y la prueba de las hiptesis estadsticas, con el fin de establecer y
redactar las conclusiones definitivas.

Presentacin y publicacin
La informacin adquiere ms claridad cuando se presenta en una forma adecuada. Los cuadros, las tablas y
los grficos facilitan el anlisis, pero se debe tener especial cuidado con las variables que se van a presentar
y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes que, antes que
claridad, creen confusin. Adems, la eleccin de los medios para mostrar los resultados, se debe hacer no solo
en funcin de las variables de inters, sino del lector a quien va dirigido el informe.

1.9.

Comentarios

En este captulo se presentan algunos conceptos bsicos de estadstica, con el propsito de alentar su estudio
y esclarecer las concepciones falsas que se tengan al respecto, como creer que la estadstica nicamente trata
con los porcentajes y las frecuencias que aparecen continuamente en los peridicos. As, en este captulo y en
los siguientes, se muestra una concepcin real de la estadstica descriptiva por medio de sus aplicaciones, dado
que es una herramienta de gran utilidad, que requiere un uso adecuado e inteligente.
Es indispensable tener claras las premisas y los fundamentos de la estadstica, para que posteriormente se
entiendan los conceptos que se presentan, se apliquen los mtodos de manera correcta, y se analicen los
resultados obtenidos objetivamente, con el fin de no cometer errores astronmicos como, por ejemplo, establecer
que tomar caf produce cncer, conclusin que eventualmente podra surgir de un estudio cuyos pacientes
son en su mayora fumadores.

14

CAPTULO 1. ELEMENTOS GENERALES

Por ltimo, se resalta la importancia de una investigacin cientfica como herramienta de estudio, dado que
a travs de las hiptesis, los protocolos y/o las metodologas desarrolladas en una investigacin de tales
caractersticas, es posible obtener conclusiones vlidas sobre un tema de inters, con el propsito de tomar
decisiones conscientes en situaciones que impliquen incertidumbre.

1.10.

Ejercicios

1.1 Clasificar segn su naturaleza y establecer la escala de medicin de las siguientes variables:
a. Estrato socio-econmico.

j. Edad en aos cumplidos.

b. Gnero.

k. Categora de un hotel.

c. Nmero de errores.

l. Opinin.

d. Filiacin poltica.

m. Profesin.

e. Calificacin de una prueba.

n. Nmero de hermanos.

f. Nivel educativo.
g. Estatura.

. Ingresos mensuales.

h. Temperatura.

o. Utilidades anuales.

i. Clasificacin tnica.

p. Tiempo requerido para ejecutar una tarea.

1.2 Proponer una posible unidad de observacin para cada variable del numeral anterior.
1.3 Un investigador educativo quiere evaluar la efectividad de un nuevo mtodo para ensear a leer a estudiantes sordos. El aprovechamiento al final del periodo de enseanza se mide con la puntuacin del estudiante
en una prueba de lectura.
a. Cul es la variable de estudio? Qu tipo de variable de es? Cul es la escala de medicin?
b. Cul es la unidad de observacin?
c. Identificar la poblacin de inters para el investigador.
1.4 Una empresa tuvo el ao pasado algunas ventas de gran importancia. Los datos correspondientes (en
millones de pesos) se muestran en la siguiente tabla:

100,224.95
97,788.97
83,544.03
92,809.99

103,534.54
104,677.53
85,503.09
95,635.89

80,479.93
96,922.26
113,221.35
109,069.38

97,141.20
111,849.34
108,896.68
101,072.17

88,540.67
97,658.20
111,106.26
105,795.74

a. Calcular la venta promedio.


b. Calcular la media muestral de cada una de las muestras conformadas por las siguientes observaciones:
{10; 15}, {1; 2; 5; 10; 13} y {1; 4; 7; 9; 12; 15; 19; 20}. Las observaciones estn ordenadas por filas.
c. Qu puede concluir de los valores obtenidos en el numeral anterior?
1.5 Haciendo un estudio sobre la intencin de voto en una poblacin conformada por 5 millones de votantes,
de los cuales 2,900,000 son mujeres, se elige una muestra formada por 3,000 personas. Cuntas mujeres y
cuntos hombres deber haber en la muestra elegida guardando las proporciones dadas en la poblacin?

1.10. EJERCICIOS

15

1.6 Cules son las principales diferencias entre la estadstica descriptiva y la estadstica inferencial?
1.7 Las siguientes poblaciones son finitas o infinitas? Por qu?
a. Artculos elaborados por una fbrica determinada.
b. Lotes de artculos elaborados por una fbrica determinada el ao pasado.
c. Bacterias que se encuentran en un pozo.
d. Empresas nacionales cuyas utilidades superan un milln de dlares anuales.
e. Posibles causas de la mala alimentacin en una poblacin determinada.
f. Epidemias reportadas en el mundo el ao pasado.
1.8 Dada las motivaciones actuales que se tienen sobre el estudio del ser humano y sus interacciones con el sexo
opuesto, un centro de investigacin decidi estudiar a tres grupos de personas de manera independiente.
El primero est conformado por 15 hombres y 15 mujeres, el segundo por 20 hombres y 10 mujeres, y
el tercero por 10 hombres y 20 mujeres. El objetivo del estudio es detectar los comportamientos que se
encuentran solamente en uno de los grupos, es decir, aquellos comportamientos que no se tengan en ms
de uno de ellos. Este estudio hara uso de la estadstica descriptiva o de la estadstica inferencial? Por
qu?
1.9 En los siguientes casos identificar la poblacin, la muestra, la unidad de observacin, la variable de inters
y si la medicin es cuantitativa o cualitativa:
a. Varias veces durante el da un ingeniero de control de calidad de una fbrica, seleccionada aleatoriamente
algunos artculos producidos, los examina y registra el nmero de imperfecciones que encuentra en cada
artculo.
b. Durante una auditora, cierta cantidad de cuentas de una firma fueron seleccionadas aleatoriamente y
examinadas en busca del nmero de errores.
c. Un examen de inteligencia es aplicado a un grupo de nios que reciben educacin especial. Todos los
nios cursan el segundo grado y han sido escogidos para recibir un nuevo programa de instruccin
impartido en una escuela del distrito. El examen debe ser aplicado antes y despus de que reciban la
instruccin.
d. Un gerente desea conocer si aquellos empleados que reciben 25 das de vacaciones son ms productivos durante el ao que aquellos que reciben solo 15 das. El gerente selecciona una muestra de 40
trabajadores y registra su rendimiento.
1.10 En los siguientes casos distinguir las muestras aleatorias de las que no lo son:
a. Un fabricante necesita tener la certeza de que menos del 2 % de los artculos de un embarque son
defectuosos, de modo que prueba cierta cantidad de ellos tomados de los que vienen arriba de un
cargamento.
b. El Ministerio de Salud desea saber si una tienda particular rene los requisitos del cdigo sanitario.
Para ello decide visitar la tienda el quinto da de cada mes.
c. La rectora de una universidad desea establecer la proporcin de estudiantes activos que estn de
acuerdo con una reforma del reglamento estudiantil, por lo que contrata a un grupo de personas para
indagar sobre tal cuestin a los estudiantes que logren contactar un da determinado en la plaza central
de la institucin.

16

CAPTULO 1. ELEMENTOS GENERALES

1.11 Establecer las diferencias entre:


a. Parmetro y estadstico.
b. Poblacin y muestra.
c. Muestro probabilstico y muestreo no probabilstico.
1.12 Enumerar los siguientes trminos en el orden adecuado: conocimiento, datos e informacin. Justificar.
1.13 Identificar tres tpicos actuales relacionados con la poltica, la economa y las ciencias sociales, de los
cuales se requiera algn tipo de informacin. Describir la informacin que se necesita para investigar cada
tpico.
1.14 Describir tres tcnicas reconocidas del muestro no probabilstico.
1.15 Realizar el esqueleto de una investigacin cientfica para un tema que le sea de particular inters, en el
cual haga mencin de los puntos ms importantes de una investigacin estadstica.

Referencias

Blanco, L. (2004). Probabilidad. Unibiblos.


Christensen, H. (2008). Estadstica paso a paso. Trillas.
Freund, J., Miller, I., and Miller, M. (2000). Estadstica matemtica con aplicaciones. Prentice Hall.
Genz, A. and Bretz, F. (2009). Computation of Multivariate Normal and t Probabilities. Lecture Notes in
Statistics. Springer-Verlag, Heidelberg.
Genz, A., Bretz, F., Miwa, T., Mi, X., Leisch, F., Scheipl, F., and Hothorn, T. (2012). mvtnorm: Multivariate
Normal and t Distributions. R package version 0.9-9992.
Gut, A. (2005). Probability: A graduate Course. Springer.
Hogg, R., McKean, J., and Craig, A. (2005). Introduction to Mathematical Statistics. Prentice Hall, sixth
edition.
Ibarra, O. (2006). Estadstica para la administracin turstica. Trillas.
Martnez, C. (2000). Estadstica y muestreo. Ecoe Ediciones, dcima edicin edition.
Mendenhall, W., Beaver, R., and Beaver, B. (2008). Introduccin a la probabilidad y estadstica. Cengage
Learning, dcimo segunda edicin edition.
Prez, G. (2004). Pedagoga social. Educacin social. Narcea. 4
Purcell, E. and Varberg, D. (1993). Clculo con geometra analtica. Pearson.
R Core Team (2012). R: A Language and Environment for Statistical Computing. R Foundation for Statistical
Computing, Vienna, Austria. ISBN 3-900051-07-0.
Real Academia Espaola (2012a). Ciencia. Diccionario de la lengua espaola. http://lema.rae.es/drae/
?val=ciencia. 1
Real Academia Espaola (2012b). Complacencia. Diccionario de la lengua espaola. http://lema.rae.es/
drae/?val=complacencia.

17

18

REFERENCIAS

Real Academia Espaola (2012c). Determinismo. Diccionario de la lengua espaola. http://lema.rae.es/


drae/?val=determinismo. 2
Real Academia Espaola (2012d). Tasa. Diccionario de la lengua espaola. http://lema.rae.es/drae/?val=
tasa.
Resnick, S. (1998). A probability path. Birkhuser.
Ross, S. (1998). A First Course in Probability. Prentice Hall, Fifth Edition edition.
Rudin, W. (1976). Elements of Mathematical Analisys. McGraw Hill, third edition.
Sarabia, J., Gmez, E., and Vzquez, F. (2007). Estadstica actuarial. Teora y aplicaciones. Pearson.
Soong, T. (2004). Fundamentals of Probability and Statistics for Engineers. John Wiley & Sons.
Soto, O. (2001). Fundamentos conceptuales de estadstica. Technical report, Universidad Nacional de Colombia. 1.5
Stevens, S. (1951). Handbook of Experimental Psychology, volume 1. Wiley. 1.7
Sturges, H. A. (1926).
21(153):6566.

The choice of a class interval.

Journal of the American Statistical Association,

Thomas, G. B. (2006). Clculo una variable. Pearson.


Wikipedia (2012a). Asimetra estadstica. http://es.wikipedia.org/wiki/Asimetra_estadstica.
Wikipedia (2012b). Ciencia. http://es.wikipedia.org/wiki/Ciencia. 1
Wikipedia (2012c). Diagrama de venn. http://es.wikipedia.org/wiki/Diagrama_de_Venn.
Wikipedia (2012d). Estimacin estadstica. http://es.wikipedia.org/wiki/Estimacin.

ndice temtico

cientfico, 3
medible, 7
medicin, 8
muestra, 5
no probabilstica, 5
piloto, 12
probabilstica, 5
muestreo, 6
no probabilstico, 5
probabilstico, 5

aleatoriedad, 4
atributo, 7
categora, 7
censo, 6
cero absoluto, 9
ciencia, 1
colectivo, 4
crtica de la informacin, 13
diseo
muestral, 5

objetivos, 11
observable, 7

elementos, 4
escala
de intervalo, 9
de medicin, 9
de razn, 10
nominal, 9
ordinal, 9
estadstica, 1, 3
clasificacin de, 3
descriptiva, 3, 4
inferencial, 3, 4
estadstico, 6

parmetro, 6
poblacin, 4
finita, 5
infinita, 5
promedio
muestral, 6
poblacional, 6
recoleccin
de la informacin, 12
saber, 2
cientfico, 2
cotidiano, 2

hiptesis, 11
estadstica, 11

ley determinista, 1

unidad
de medida, 12
de observacin, 12
compleja, 12
simple, 12
universo, 4

mtodo

variable, 6, 7

individuos, 4
investigacin
cientfica, 12
estadstica, 10

19

20

NDICE TEMTICO

auxiliar, 7
cualitativa, 7
cuantitativa, 7
continua, 7
discreta, 7
latente, 7
longitudinal, 7
transversal, 7

Вам также может понравиться