Академический Документы
Профессиональный Документы
Культура Документы
Captulo 1. INTRODUCCIN
1.1 Qu es la estadstica? ESTADSTICA es el arte de realizar inferencias y
sacar conclusiones a partir de datos imperfectos. Los datos son generalmente
imperfectos en el sentido que an cuando posean informacin til no nos
cuentan la historia completa. Es necesario contar con mtodos que nos
permitan extraer informacin a partir de los datos observados para
comprender mejor las situaciones que los mismos representan. Algunas
tcnicas de anlisis de datos son sorprendentemente simples de aprender y
usar ms all del hecho que la teora matemtica que las sustentan puede ser
muy compleja. Todos, an los estadsticos, tenemos problemas al enfrentarnos
con listados de datos. Existen muchos mtodos estadsticos cuyo propsito es
ayudarnos a poner de manifiesto las caractersticas sobresalientes e
interesantes de nuestros datos que pueden ser usados en casi todas las reas
del conocimiento. Los mtodos estadsticos pueden y deberan ser usados en
todas las etapas de una investigacin, desde el comienzo hasta el final. Existe
el convencimiento de que la estadstica trata con el ANLISIS DE DATOS (quizs
porque esta es la contribucin ms visible de la estadstica), pero este punto de
vista excluye aspectos vitales relacionados con el DISEO DE LAS
INVESTIGACIONES. Es importante tomar conciencia que la eleccin del mtodo
de anlisis para un problema, se basa tanto en el tipo de datos diponibles como
en la forma en que fueron recolectados.
1.2 Por qu estudiar estadstica? Porque los datos estadsticos y las
conclusiones obtenidas aplicando metodologa estadstica ejercen una
profunda influencia en casi todos los campos de la actividad humana. En
particular, la estadstica invade cada vez ms cualquier investigacin relativa
a salud pblica. Este crecimiento, probablemente relacionado con el inters
por aumentar la credibilidad y confiabilidad de las investigaciones, no garantiza
que en todos los casos la metodologa estadstica haya sido correctamente
utilizada, o peor an, que sea vlida.
Por qu debe preocuparnos la aplicacin incorrecta de mtodos estadsticos
en un trabajo cientfico o en un informe tcnico? - Porque las conclusiones
pueden ser incorrectas. - Porque no todos los lectores estn en condiciones de
detectar el error, y esto genera un importante ruido en la bibliografa
cientfica (Aunque este argumento tiende a sobredimensionar la importancia de
un paper, existe considerable evidencia que los lectores sin formacin
metodolgica tienden a aceptar como vlidas las conclusiones
valores que estas variables toman para esta persona. Cuando se disea una
investigacin, se intenta estudiar de qu modo una o ms variables (variables
independientes) afectan a una o ms variables de inters (variables
dependientes). Por ejemplo en un experimento, el investigador impone a los
sujetos condiciones (variable independiente) y estudia el efecto de la misma
sobre una caracterstica del sujeto (aparicin de una cierta caracterstica,
modificacin de una condicin, etc.). Un paso importante al comenzar a
manejar un conjunto de datos es identificar cuntas variables se han registrado
y cmo fueron registradas esas variables, lo que permitir definir la estrategia
de anlisis. En el ejemplo anterior algunas de las variables son nmeros y otras
son letras que indican categoras. A continuacin se presenta una clasificacin
de los distintos tipos de datos que podemos encontrar. Debe notarse que
distintos autores usan distintos criterios para clasificar datos por lo que
presentaremos aqu un criterio que resulta til desde el punto de vista de
seleccionar el mtodo de anlisis estadstico ms apropiado para los mismos.
2.2 TIPOS DE DATOS
2.2.1 DATOS CATEGRICOS O CUALITATIVOS Las variables categricas resultan
de registrar la presencia de un atributo. Las categoras de una variable
cualitativa deben ser definidas claramente durante la etapa de diseo de la
investigacin y deben ser mutuamente excluyentes y exhaustivas. Esto
significa que cada unidad de observacin debe ser clasificada sin ambigedad
en una y solo una de las categoras posibles y que existe una categora para
clasificar a todo individuo. En este sentido, es importante contemplar todas las
posibilidades cuando se construyen variables categricas, incluyendo una
categora tal como No sabe / No contesta, o No registrado u Otras, que asegura
que todos los individuos observados sern clasificados con el criterio que
define la variable. Los datos categricos se clasifican en dicotmicos,
nominales y ordinales.
a) Dos categoras (DICOTMICOS) El individuo o la unidad de observacin
puede ser asignada a solo una de dos categoras. En general, se trata de
presencia - ausencia del atributo y es ventajoso asignar cdigo 0 a la ausencia
y 1 a la presencia. Ejemplos:
1) varn mujer
2) embarazada - no embarazada
3) fumador - no fumador
4) hipertenso normotenso
Debe notarse que los ejemplos 1) y 2) definitivamente cubren todas las
categoras, mientras que 3) y 4) son simplificaciones de categoras ms
complejas. En 3) no est claro donde se asignan los ex-fumadores, en tanto
que en 4) fue necesario establecer un criterio de corte para armar una variable
categrica a partir de una variable numrica.
b) Ms de dos categoras
CATEGORAS NOMINALES No existe orden obvio entre las categoras.
Ejemplos: pas de origen, estado civil, diagnstico.
CATEGORAS ORDINALES Existe un orden natural entre las categoras.
Ejemplos:
1) Tabaquismo: No fuma / ex-fumador / fuma 10 cigarrillos diarios / fuma >
10 cigarrillos diarios
2) Severidad de la patologa: Ausente / leve / moderado / severo.
An cuando los datos ordinales puedan ser codificados como nmeros como en
el caso de estadios de cncer de mama de I a IV, no podemos decir que una
paciente en el estadio IV
tiene un pronstico dos veces ms grave que una paciente en estadio II, ni que
la diferencia entre estadio I y II es la misma que entre estadio III y IV. En
cambio, cuando se considera la edad de una persona, 40 aos es el doble de
20 y una diferencia de 1 ao es la misma a travs de todo el rango de valores.
Por esta razn, debemos ser cuidadosos al tratar variables cualitativas,
especialmente cuando se han codificado numricamente, ya que no pueden
ser analizadas como nmeros sino que deben ser analizados como categoras.
Es incorrecto presentar, por ejemplo, el estadio promedio de cncer en un
grupo de pacientes. En la prctica clnica se usan escalas para definir grados
de un sntoma o de una enfermedad, tales como 0, +, ++, +++. Es importante
definir operativamente este tipo de variables y estudiar su confiabilidad de
modo de asegurar que dos observadores puestos frente al mismo paciente, lo
clasificarn en la misma categora.
2.2.2 DATOS NUMRICOS Una variable es numrica cuando el resultado de la
observacin o medicin es un nmero. Se clasifican en:
a) Discretos. La variable slo puede tomar un cierto conjunto de valores
posibles. En general, aparecen por conteo. Ejemplo: nmero de miembros del
hogar, nmero de intervenciones quirrgicas, nmero de casos notificados de
una cierta patologa.
b) Continuos. Generalmente son el resultado de una medicin que se expresa
en unidades. Las mediciones pueden tomar tericamente un conjunto infinito
de valores posibles dentro de un rango. En la prctica los valores posibles de la
variable estn limitados por la precisin del mtodo de medicin o por el modo
de registro. Ejemplos: altura, peso, pH, nivel de colesterol en sangre. La
distincin entre datos discretos y continuos es importante para decidir qu
mtodo de anlisis estadstico utilizar, ya que hay mtodos que suponen que
los datos son continuos. Consideremos por ejemplo, la variable edad. Edad es
continua, pero si se la registra en aos resulta ser discreta. En estudios con
adultos, en que la edad va de 20 a 70 aos, por ejemplo, no hay problemas en
tratarla como continua, ya que el nmero de valores posibles es muy grande.