Вы находитесь на странице: 1из 106

Programa de Capacitacin y Formacin Profesional en Derechos Humanos

Fase de formacin especializada


P ro gram a de estud io

El empleo de la estadstica aplicada a la investigacin en derechos humanos

Directorio institucional
Presidente Luis Gonzlez Placencia Consejo Mercedes Barquet Montan Jos Antonio Caballero Jurez Jos Luis Caballero Ochoa Miguel Carbonell Snchez Denise Dresser Guerra Manuel Eduardo Fuentes Muiz Patricia Galeana Herrera Mnica Gonzlez Contr Nashieli Ramrez Hernndez Jos Woldenberg Karakowsky Visitaduras generales Primera Mario Ernesto Patrn Snchez Segunda Rosalinda Salinas Durn Tercera Jos Antonio Guevara Bermdez Cuarta Guadalupe ngela Cabrera Ramrez Quinta Luis Jimnez Bueno Contralora Interna Rosa Mara Cruz Lesbros Secretaras Ejecutiva Jos Luis Gutirrez Espndola Promocin de los Derechos Humanos e Incidencia en Polticas Pblicas Gerardo Sauri Surez Consultora General Jurdica Fernando Francisco Coronado Franco Direcciones generales Quejas y Orientacin Alfonso Garca Castillo* Administracin Irma Andrade Herrera Comunicacin por los Derechos Humanos Daniel Robles Vzquez Educacin por los Derechos Humanos Paz Echeique Pascal Direccin Ejecutiva de Seguimiento Montserrat Matilde Rizo Rodrguez Centro de Investigacin Aplicada en Derechos Humanos Ricardo A. Ortega Soriano Secretara Particular de la Presidencia Gabriela Gutirrez Ruz Coordinaciones Asesores Mara Jos Morales Garca Interlocucin Institucional y Legislativa Soledad Guadalupe Lpez Acosta Tecnologas de Informacin y Comunicacin Rodolfo Torres Velzquez Servicios Mdicos y Psicolgicos Sergio Rivera Cruz* Servicio Profesional en Derechos Humanos Mnica Martnez de la Pea
* Encargado de despacho

Programa de Capacitacin y Formacin Profesional en Derechos Humanos

Fase de formacin especializada


P ro gram a de estud io

El empleo de la estadstica aplicada a la investigacin en derechos humanos

Contenidos: Marisol Luna Contreras. Coordinacin de contenidos: Mnica Martnez de la Pea, coordinadora del Servicio Profesional en Derechos Humanos; Rossana Ramrez Dagio, subdirectora de Formacin Profesional, y Hctor Rosales Zarco, jefe de Departamento de Contenidos. Coordinacin acadmica de contenidos: Jorge Pelez Padilla, profesor-investigador de la Academia de Derecho de la Universidad Autnoma de la Ciudad de Mxico (uacm), integrante del Colectivo en Estudios Crticos del Derecho (radar); Carlos Mara Pelayo Moller, doctorando en el Instituto de Investigaciones Jurdicas de la Universidad Nacional Autnoma de Mxico (unam); Mylai Burgos Matamoros, profesora de la Facultad de Derecho (unam/uacm), y Guillermo E. Estrada Adn, profesor de tiempo completo en la Facultad de Derecho (unam) y profesor en El Colegio de Mxico. Editor responsable: Alberto Nava Cortez. Cuidado de la edicin: Brbara Lara Ramrez. Diseo de portada: Maru Lucero. Diseo y formacin: Maru Lucero y Analaura Galindo. Correccin de estilo: Solar, Servicios Editoriales, S. A. de C. V. Lectura de planas: Karina Rosala Flores Hernndez.

Primera edicin, 2012 D. R. 2012, Comisin de Derechos Humanos del Distrito Federal Av. Universidad 1449, col. Florida, pueblo de Axotla, del. lvaro Obregn, 01030 Mxico, D. F. www.cdhdf.org.mx Ejemplar de distribucin gratuita, prohibida su venta. Se autoriza la reproduccin total o parcial de la presente publicacin siempre y cuando se cite la fuente.

El empleo de la estadstica aplicada a la investigacin en derechos humanos*

* Marisol Luna Contreras. Profesora-investigadora de la Facultad Latinoamericana de Ciencias Sociales (Flacso), sede Mxico; actuaria por la Universidad Nacional Autnoma de Mxico (unam) y maestra en Poblacin por Flacso-Mxico. Cuenta con la especialidad en Estadstica aplicada por el Instituto de Investigaciones en Matemticas Aplicadas y Sistemas (iimas-unam). Sus principales temas de investigacin son la mortalidad materna, el uso y la satisfaccin con la salud materna y el gasto en salud y educacin en los hogares. Todas las opiniones presentadas en este texto son responsabilidad exclusiva de la autora.

ndice

El empleo de la estadstica aplicada a la investigacin en derechos humanos Marisol Luna Contreras Presentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Mdulo i. Qu utilidad tienen las investigaciones cuantitativas de derechos humanos? . . . . . . . . . 9 Mdulo ii. Cules son los componentes bsicos de una investigacin estadstica? . . . . . . . . . . . . . 10 Mdulo iii. Algunos ejercicios de estadstica descriptiva (la tabla de frecuencia) . . . . . . . . . . . . . . . . 12 Mdulo iv. Algunos ejercicios de estadstica descriptiva (medidas descriptivas) . . . . . . . . . . . . . . . . . 14 Mdulo v. Tablas de contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Bibliografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Autoevaluacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Clave de respuestas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Presentacin

l Servicio Profesional en Derechos Humanos (spdh) fue creado en 2005 con el propsito de responder a la demanda de especializacin en el trabajo que desempea la Comisin de Derechos Humanos del Distrito Federal (cdhdf) como organismo pblico autnomo.

A partir de la creacin del spdh, la Comisin ha realizado un esfuerzo significativo para la consolidacin y el desarrollo de los procesos de ingreso y ascenso, capacitacin, formacin y evaluacin anual del desempeo. La presente gua ha sido elaborada a partir del trabajo conjunto de la Coordinacin del Servicio Profesional en Derechos Humanos de la cdhdf con las y los coordinadores acadmicos de las reas modulares del spdh y, desde luego, las y los autores de los contenidos del presente material, quienes sern las y los responsables de la imparticin de los cursos presenciales a las y los integrantes del Servicio. La Fase de formacin especializada, a la que pertenece esta gua, se integra por contenidos tendientes a satisfacer las necesidades especficas de formacin de cada una de las reas sustantivas que integran la cdhdf: defensa, promocin y estudio. Los materiales que conforman este documento han sido construidos con la expectativa de reflexionar sobre la aplicacin prctica de los diversos aspectos que conforman la materia de los derechos humanos en el rea de estudio, y comprende contenidos en torno a la metodologa aplicada a los derechos humanos; el empleo de la estadstica aplicada a la investigacin de los derechos humanos y respecto de la metodologa para la identificacin, elaboracin y evaluacin de indicadores de polticas pblicas en materia de derechos humanos.

Esta segunda edicin de la Fase de formacin especializada constituye un paso importante hacia la consolidacin de una metodologa ad hoc de enseanza de los derechos humanos dirigida a las y los servidores pblicos de los organismos pblicos autnomos encargados de protegerlos, pues sin duda est encaminada a fortalecer la defensa y la promocin de los derechos humanos en nuestro pas. Coordinacin del Servicio Profesional en Derechos Humanos

Mdulo i. Qu utilidad tienen las investigaciones cuantitativas de derechos humanos?

10

Las investigaciones cuantitativas

Evidenciar el hacer y los problemas pblicos. En materia de derechos humanos sirven para: Sealar las violaciones de los derechos humanos y evaluar sus efectos. Fincar responsabilidades.

M dulo
i
Para hacer una investigacin estadstica se necesita: Los registros administrativos.

La estadstica

Rama de las matemticas encargada de recopilar los datos, describirlos y analizarlos para obtener conclusiones acerca de la poblacin objeto de estudio.

Una investigacin cuantitativa se puede hacer a partir de:

Una base de datos

Debe contener informacin resumida en variables o atributos de la poblacin o muestra especfica de unidades de observacin que pueden ser individuos, pases, regiones, etctera.

Para alimentar bases de datos de una investigacin estadstica se utilizan:

Diversas fuentes

Las ms importantes para efectuar una investigacin cuantitativa en derechos humanos son:

Las encuestas pblicas.

Fase

de formacin especializada

11

os derechos y las garantas son el objeto ms deseado para quienes habitan en un rgimen democrtico.

La defensa de los derechos humanos se convirti en una necesidad y en una exigencia de la vida moderna para evitar las atrocidades del abuso del poder, en cualquiera de sus acepciones (poltica, econmica, etc.), que han padecido millones de personas en todo el mundo y a travs del tiempo. Acontecimientos tan desastrosos como la segunda Guerra Mundial dejaron en la historia colectiva lecciones que obligan a reconsiderar el papel de los gobiernos y los ciudadanos en la construccin social. A la fecha, se han intensificado los esfuerzos globales para no repetir tan lamentables sucesos. No slo se trata de sealar que las violaciones a los derechos ocurren, sino de evaluar sus efectos, as como de identificar patrones sistemticos que brinden informacin respecto a los derechos que se vulneran, la frecuencia con que ocurren estas violaciones, quines son las vctimas y quines los victimarios, entre otros factores. Guardar registros de la informacin brinda la posibilidad de mostrar evidencias para hacer pblicos los problemas y fincar responsabilidades a quienes atentan contra la estabilidad social.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

12

Durante varios aos, diversos gobiernos en el mundo, en particular los latinoamericanos, han atravesado por intensos procesos de reformas institucionales que han afectado positiva y negativamente las reglas del juego democrtico: En Mxico, delinear las reglas para un efectivo imperio de la ley ha sido un largo e inacabado camino en busca de las instituciones que, en concordancia con la creacin de mayores espacios ciudadanos, constituyan restricciones a los abusos y vicios gubernamentales.1 Muchas reformas institucionales orientadas al fortalecimiento de los regmenes democrticos han intentado ofrecer mecanismos de accin para la expresin de la ciudadana a fin de hacer factibles los derechos y garantas o, en su caso, conformar acciones para la transformacin de la vida social basadas en la organizacin y defensa de estos derechos por parte de los ciudadanos, organizaciones sociales pblicas y privadas, e incluso la creacin de organismos autnomos que conforman una nueva configuracin del quehacer gubernamental y ciudadano. Durante este tiempo de intensas transformaciones sociales surgen diversas interrogantes: cmo evaluar que las reformas emprendidas hayan tenido los efectos esperados? y cmo comprobar que los cambios puestos en marcha en materia de defensa y procuracin de derechos humanos hayan sido los adecuados para el conjunto social? Para responder estas preguntas se deben elaborar mediciones e indicadores que permitan generar datos comparables y as realizar un anlisis cuantitativo de stos. Sin embargo, es posible medir conceptos como dignidad humana? La respuesta es s, aunque la tarea de cuantificarlos resulte todo un reto. La base fundamental para analizar con informacin cuantitativa son los datos. Gran parte se obtiene de los registros administrativos y, en algunos casos, de encuestas elaboradas para recabar informacin ad hoc. En Mxico, el trabajo realizado por las comisiones de derechos humanos consiste en recomendaciones sustentadas jurdicamente mediante una diversidad de razonamientos respecto de un solo tema. Aun cuando la informacin es extensa y difcil de delimitar, una de las bases para realizar anlisis cuantitativo radica en la capacidad para ordenar los datos. Adicionalmente, el uso de encuestas es cada vez ms frecuente en el mbito

M dulo
i

Para una visin amplia respecto de los procesos de reforma institucional que han emprendido diversos pases en la larga marcha hacia la consolidacin de su democracia, vase Andreas Schedler, Larry Diamond y Marc Plattner, The Self-restraining State: Power and Accountability in New Democracies, Boulder, Lynn Riener, 1999.

Fase

de formacin especializada

13

internacional de los derechos humanos,2 aunque en Mxico an hace falta elaborar ms ejercicios con este propsito. Por otra parte, si al contexto de la defensa de los derechos humanos se aaden los cambios producidos por la construccin de una sociedad de la informacin, se entender la trascendencia del anlisis de datos y la informacin cuantitativa, donde sta adquiere un papel esencial para establecer procesos de relaciones sociales que van desde el uso de nuevas formas de comunicacin virtual y en tiempo real, hasta la generacin de derechos de informacin pblica y la posibilidad de guardar registros de informacin relevante para los ciudadanos. No se trata slo de exigir cuentas y pedir informacin a los gobiernos para saber lo que tienen en sus registros y lo que se suelen reservar. El punto ms relevante de la solicitud de informacin es su anlisis y la observacin de posibles patrones de regularidad en el comportamiento gubernamental, as como identificar si se acta de manera sistemtica y cules son los efectos, negativos o positivos, en la formacin de espacios pblicos con una visin amplia del respeto a las garantas y derechos de los individuos. Las herramientas estadsticas ayudan a identificar esos patrones y a tratar de encontrar soluciones adecuadas con base en las evidencias halladas. Uno de los objetivos de esta gua es esclarecer algunos conceptos del anlisis cuantitativo de datos, como muestra, media, mediana y moda, entre otros, as como sus aplicaciones prcticas al anlisis relacionado con el estudio de los derechos humanos. Cabe sealar que la estadstica es una herramienta que va de la mano de cuestiones concretas de metodologa cuantitativa. Esta gua no desarrollar temas de metodologa, aunque algunos de sus conceptos estn ms que relacionados con sta.
i

Cules son las fuentes ms importantes para una investigacin cuantitativa en derechos humanos? La fuente ms importante de informacin en Mxico para el tema de los derechos humanos son los registros administrativos. De hecho, gran parte de las actividades de las comisiones de derechos humanos se basa en el
2

An son pocos los libros que relacionan directamente la estadstica y los derechos humanos. Para profundizar en la historia y en el contexto en que se comienzan a utilizar los datos, la informacin y la estadstica en anlisis de derechos humanos, as como en la importancia de su sistematizacin para introducirse en la aplicacin de tcnicas analticas, vanse Jana Asher et al., Statistical Methods for Human Rights, Nueva York, Springer, 2007; y Thomas B. Jabine, Human Rights and Statistics, Getting the Record Straight, Filadelfia, University of Pennsylvania Press, 1992.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

14

desarrollo de recomendaciones sustentadas en un extenso anlisis jurdico. Sintetizar y sistematizar esa informacin es uno de los retos ms grandes de administracin de la informacin para el anlisis de los derechos humanos.3 Uno de los primeros pasos para el anlisis cuantitativo es contar con la informacin que conformar las variables de las bases de datos, lo que ayudar a establecer caractersticas y descripciones de los objetivos fundamentales de anlisis que, en general, sern las personas que acuden a los servicios de la Comisin de Derechos Humanos del Distrito Federal (cdhdf), as como los tipos de problemas que se resuelven. Por otra parte, algunas encuestas tratan asuntos relacionados con los derechos humanos, como la Encuesta Nacional de Cultura Poltica, la Encuesta Nacional sobre Discriminacin en Mxico, la Encuesta Nacional de la Juventud y la Encuesta Nacional sobre Violencia contra las Mujeres, entre otras, las cuales incluyen preguntas sobre el papel del gobierno en la atencin a problemticas sociales, as como acerca de la percepcin de las y los mexicanos en torno al cumplimiento de los derechos en el pas. Adicionalmente, encuestas como Latinobarmetro captan informacin respecto al cumplimiento de libertades y garantas en distintos pases latinoamericanos, incluido Mxico.

M dulo
i

Qu es la estadstica? La estadstica es la rama de las matemticas encargada de recopilar datos, describirlos y analizarlos para obtener conclusiones acerca de la poblacin objeto de estudio. Bsicamente, la estadstica tiene dos ramas: 1) La estadstica descriptiva, relacionada con la descripcin y clasificacin de los datos. 2) La estadstica inferencial, que permite obtener conclusiones a partir de los datos. Esta gua se centrar en la estadstica descriptiva.

Vase Thomas Jabine, op. cit.

Fase

de formacin especializada

15

Figura 1. Ramas de la estadstica Estadstica Estadstica descriptiva Organizar. Resumir. Presentar datos.

Estadstica inferencial Obtener conclusiones a partir de los datos.

Qu caractersticas tiene la investigacin estadstica? La investigacin estadstica descansa en el anlisis cuantitativo de datos. Por ello se requiere una base de datos que contenga informacin resumida en variables o atributos de una poblacin o muestra especfica, o de unidades de observacin, como individuos, pases, regiones, etc. La informacin sintetizada y captada en variables permitir elaborar asociaciones y relaciones entre los diversos atributos de los objetos de estudio, con la finalidad de explicar los patrones de lo que se denomina comportamiento de un fenmeno determinado. Un ejemplo muy sencillo es el siguiente: para conocer y describir algunas caractersticas de las personas que acudieron a presentar una queja ante la cdhdf durante 2011, es necesaria informacin bsica, como su sexo y edad, lo que permitir elaborar una breve descripcin de la proporcin de mujeres que asisti, respecto del total, e incluso saber si las edades varan respecto a las de los hombres que se presentaron durante el mismo ao.4 Asimismo, una investigacin de corte estadstico requiere tambin informacin sobre un grupo de poblacin de inters en un momento determinado, que lo hace sujeto de anlisis comparable. En el ejemplo, los datos estarn circunscritos a las personas que interpusieron una queja (gestin) ante la Comisin durante 2011, la cual resulta de inters para el anlisis.

Para el caso de la cdhdf, la gestin de casos puede ser de oficio o iniciada por algn individuo o grupo, por lo que el sexo de las personas que intervienen en el proceso no necesariamente ser hombre o mujer. Por ello se aclara que en los ejemplos en que se usa esta caracterstica, se recurre a todas las categoras que considera la Comisin.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Mdulo ii. Cules son los componentes bsicos de una investigacin estadstica?

18

Componentes bsicos de la investigacin estadstica 1) Poblacin Conjunto de elementos delimitados en un espacio y tiempo determinados.

La poblacin total constituye

2) La unidad de anlisis Entidad (persona, grupo, institucin, pas, etc.) sobre la cual se realizar el anlisis estadstico y a la que se desea estudiar para obtener conclusiones al respecto. La unidad bsica para recoger la informacin que sirve de sustento a las mediciones estadsticas y que brinda insumos en forma de datos con los que se realiza el estudio de nuestra unidad de anlisis se denomina:

Si la poblacin es muy grande, resulta costoso, tardado o imposible su anlisis, se recurre a una:

M dulo
ii

3) Muestra Subconjunto de la poblacin.

4) Unidad de observacin

Se deben precisar los elementos que identifican a la poblacin.

De cada elemento se observan y registran una o ms: Caractersticas que se observan en los elementos de la poblacin o muestra de estudio.

5) Variables

A los posibles valores que adquieren se les denomina:

6) Datos

Deben integrarse en una:

Deben ser interpretados

Base de datos Mediante inferencia estadstica se atribuyen a la poblacin las caractersticas ms significativas que se obtuvieron en la muestra. Existen dos mtodos de inferencia estadstica: Pruebas de hiptesis. Estimacin puntual y por intervalos.

Reunin de datos de una poblacin objeto de estudio mediante variables de distinto tipo, de forma ordenada y sistematizada.

Fase

de formacin especializada

19

Conceptos de poblacin y muestra La investigacin que utilice la estadstica como herramienta para el anlisis de datos debe distinguir e identificar la poblacin (objeto de la investigacin), la muestra, la unidad de anlisis y medicin, las variables que se incluirn en el anlisis y el tipo de escala de dichas variables. Poblacin: conjunto de elementos delimitados en un espacio y tiempo determinados. En una investigacin, la poblacin se define al especificar los elementos de nuestro inters y las caractersticas que deben tener para formar parte del estudio. Muestra: subconjunto de la poblacin que debe contener un nmero determinado de elementos para ser representativo de sta. Para la investigacin estadstica es fundamental especificar claramente la poblacin objeto de estudio, de manera que se distingan los elementos que forman parte de ella y los que no lo son. Ejemplos:

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

ii

20

Ejemplo 1

Se trabajar con las gestiones recibidas durante 2010 en la oficina central de la cdhdf y que hayan concluido. En este caso, la poblacin de inters debe cumplir tres caractersticas: a) ser gestiones recibidas en la oficina central; b) haber sido recibidas durante 2010; c) tener estatus de gestin concluida. Obsrvese en el cuadro 1 cmo se eligen los elementos de la poblacin.
Cuadro 1. Ejemplo de delimitacin de la poblacin objeto de estudio
Unidad donde fue recibida Unidad Norte Ao de recepcin 2010 Estatus de la gestin Concluida Es parte de la poblacin? Explicacin No es parte de la poblacin, no cumple con dos de las tres caractersticas: fue recibida en otra sede y en otro ao. Aunque fue recibida en la sede de inters, no es parte de la poblacin, pues se recibi en otro ao y no ha sido concluida. Por tanto, no cumple con las tres caractersticas. Aunque fue recibida en la sede de inters y ha concluido, la gestin es de 2009 y slo interesan las recibidas durante 2010. Por tanto, no es parte de la poblacin. S es parte de la poblacin, ya que cumple con los tres criterios: fue recibida en la oficina central en 2010 y ha concluido.

M dulo
ii

Oficina central

2009

No concluida

Oficina central

2009

Concluida

Oficina central

2010

Concluida Fuente: elaboracin propia.

Ejemplo 2

En este caso interesan las gestiones recibidas va telefnica durante 2009 para orientacin verbal. La poblacin de inters sern todas aquellas gestiones que cumplan con tres caractersticas: a) haber sido recibidas en 2009; b) haber sido atendidas por va telefnica; c) el servicio debi ser de orientacin verbal. Por lo tanto, no interesan ni la sede de recepcin ni su estatus de gestin.
Cuadro 2. Ejemplo de delimitacin de la poblacin objeto de estudio
Unidad donde fue recibida Unidad Norte Ao de recepcin 2010 Estatus de la gestin Concluida Va de entrada Correo electrnico Servicio Orientacin verbal Es parte de la poblacin? Explicacin No es parte de la poblacin; no cumple con dos de las tres caractersticas: fue recibida en otro ao y lleg por correo electrnico. Aunque fue recibida en 2009 por va telefnica, el servicio requerido fue de suplencia de queja, por lo tanto, no es parte de la poblacin.

Oficina central

2009

Concluida

Telefnica

Suplencia de queja

Fase

de formacin especializada

21

Unidad donde fue recibida

Ao de recepcin

Estatus de la gestin

Va de entrada

Servicio

Es parte de la poblacin?

Explicacin S es parte de la poblacin, cumple con los tres criterios: fue recibida en 2009 por va telefnica y fue para orientacin verbal. Aqu no es importante la oficina de recepcin ni su estatus de gestin. S es parte de la poblacin, cumple con los tres criterios: fue recibida en 2009 por va telefnica y fue para orientacin verbal. Aqu no interesa la oficina de recepcin ni su estatus de gestin.

Unidad Poniente

2009

Concluida

Telefnica

Orientacin verbal

Oficina central

2009

Concluida

Telefnica

Orientacin verbal

Fuente: elaboracin propia.

Ejemplo 3

Se analizar el tipo de derecho que, presuntamente, se viol con mayor frecuencia en todas las gestiones concluidas y recibidas en las cinco unidades de atencin de la cdhdf durante 2011. Es este caso deben tomarse en cuenta los 47238 registros, es decir, toda la informacin de la que se dispone. Como se observa, esta poblacin es demasiado grande. Cuando esto ocurre, examinar cada elemento sera demasiado costoso, tomara demasiado tiempo y, en ocasiones, resultara imposible. Para ahorrar tiempo y recursos econmicos, as como para estudiar y comprender mejor algn fenmeno de inters, se recomienda elegir slo algunos elementos de la poblacin, los cuales formarn un subconjunto. A este subconjunto le llamaremos muestra. Obsrvese en la figura 2 cmo todos los elementos de la muestra son tambin elementos de la poblacin.
Figura 2. Relacin entre la poblacin y la muestra

Poblacin Muestra

Fuente: elaboracin propia.

Bsicamente, las muestras se toman con dos tipos de mtodos: muestreos probabilsticos y no probabilsticos. En el muestreo probabilstico cada elemento es susceptible de ser elegido, y su probabilidad conocida de ser seleccionado es distinta de cero. Si lo anterior no se cumple, entonces se trata de un muestreo no probabilstico.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

ii

22

En cada tipo de muestreo hay diferentes mtodos para seleccionar los casos. La eleccin de un mtodo u otro depende de los propsitos de la investigacin, de la experiencia y el conocimiento previo del investigador acerca del problema por analizar y de los recursos econmicos, de infraestructura y humanos con los que se cuente. Los mtodos para cada tipo de muestreo se exponen en el cuadro 3.5
Cuadro 3. Tipos de muestreo, mtodos y caractersticas
Muestreo Probabilstico Mtodos Aleatorio. Aleatorio estratificado. Por conglomerados. Combinaciones de los anteriores. De juicio. Por conveniencia. Por cuotas. Bola de nieve. Caractersticas Cada elemento de la poblacin objeto de estudio tiene una probabilidad conocida y distinta de cero. La seleccin de la muestra utiliza la teora de la probabilidad. Permite una evaluacin objetivo de los resultados y estimar su grado de confianza y de precisin. La seleccin de los elementos de la muestra depende de los criterios del investigador. No hay manera de estimar el grado de confianza y de precisin de los resultados.

M dulo
ii
5

No probabilstico

Fuente: elaboracin propia.

La unidad de anlisis de la investigacin estadstica es la entidad (persona, grupo, institucin, pas, etc.) acerca de la cual se realizar el anlisis estadstico y a la que se estudiar para sacar conclusiones al respecto. Debe establecerse en los objetivos y en la definicin del problema de investigacin. La unidad de anlisis sintetiza e identifica la poblacin en funcin de la cual se definir el tamao de la muestra. Por su parte, la unidad de observacin es la que se toma como base para reunir la informacin que sustenta las mediciones estadsticas y brinda datos con los que se realizar el estudio de la unidad de anlisis.6
Ejemplo 4

Se investigar si los derechos humanos de las mujeres que se encuentran en reclusin en el Distrito Federal estn garantizados. En este caso, la unidad de anlisis (poblacin) son todas las mujeres recluidas tanto en el Centro Femenil de Readaptacin Social de Santa Martha Acatitla como en el de Tepepan. Debido al tamao de esa poblacin, entrevistar a todas las reclusas sera costoso y tomara mucho tiempo, por lo que se obtiene una muestra aleatoria de ellas. Por tanto, las mujeres seleccionadas en la muestra son la unidad de

Para ms informacin sobre los tipos de muestreo, mtodos, ventajas y desventajas, vanse Yvn Angulo Reyes, Muestreo, en Haroldo Elorza Prez-Tejeda, Estadstica para las ciencias sociales del comportamiento y de la salud, 3 ed., Mxico, Cengage Learning, 2007, pp. 179-210; Juan Fernndez Durn y Rubn Hernndez, Muestreo, en Vctor Aguirre et al., Fundamentos de probabilidad y estadstica, 2 ed., Mxico, Jit Press, 2007, pp. 1-32 (cap. 11). 6 Julio Csar ngel Gutirrez, Estadstica general aplicada, Medelln, Fondo Editorial Universidad Eafit (col. Acadmica), 2007, p. 49.

Fase

de formacin especializada

23

observacin de la investigacin, a fin de que el anlisis brinde conclusiones respecto de la poblacin total.

Datos, variables y escalas de medicin en estadstica Una vez delimitada la poblacin y la unidad de observacin, para responder a preguntas de inters se debe recolectar la informacin de cada uno de los elementos que la conforman. A estas caractersticas les denomina variables. Las variables son cada una de las caractersticas que se observan en los elementos de la nuestra poblacin o muestra de estudio, las cuales son susceptibles de ser cuantificadas o registradas. No necesariamente tienen un carcter numrico. En cada elemento se pueden observar y registrar una o ms variables; a los posibles valores que toman se les llama datos.7 A la informacin recabada de toda la poblacin se le llama censo o informacin censal; o si derivan de una muestra, informacin muestral. Las variables se clasifican en cualitativas y cuantitativas (vase el cuadro 4).
Cuadro 4. Tipos de variables usadas en estadstica, sus caractersticas y ejemplos
Tipos de variables Cualitativos Caractersticas Corresponden a cualidades o atributos de los elementos de anlisis. Tienen un nmero fijo de categoras. Todos los elementos deben clasificarse slo en una de las categoras. Ejemplos Variable Categoras Sexo Femenino, masculino. Entidad de residencia Aguascalientes, Baja California, Baja California Sur Zacatecas. Mes de nacimiento Enero, febrero, marzo diciembre. Tipo de horario Matutino, vespertino, mixto. Color de ojos Negro, caf, verde, azul Estado conyugal Soltero, casado, viudo, divorciado, separado. Variables Nmero de hijos Nmero de delitos Estatura de adultos Peso de los nios menores de un ao Ingreso mensual Nmero de gestiones recibidas en un da Valores que puede tomar 0, 1, 2 0, 1, 2 [1.40, 2.50] [1,8] [0,] 0, 1, 2 Tipo Discreta Discreta Continua Continua Continua Discreta

Cuantitativos

Se obtienen mediante un proceso de conteo o de medicin. Cuando se obtienen por conteo, se les llama discretos. Cuando son resultado de una medicin son continuos.

Fuente: elaboracin propia.

Vctor Aguirre y Begoa Artaloitia, Anlisis exploratorio de datos, en Vctor Aguirre et al., Fundamentos de probabilidad y estadstica, 2 ed., Mxico, Jit Press, 2007, pp. 1-68 (cap. 1).

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

ii

24

Adems de ser cuantitativa o cualitativa, una variable tambin se puede clasificar en una escala de medicin. Dichas escalas se dividen en nominales, ordinales y de intervalo o razn. Las variables cualitativas slo pueden tener atributos de escalas nominales y ordinales; una variable cuantitativa puede ser de intervalo o de razn. A continuacin mencionamos algunas caractersticas y ejemplos de cada tipo de escala. Escala nominal: son datos que slo pueden ser clasificados en categoras. No es posible establecer una relacin de orden entre ellas, solamente se puede decir si el elemento pertenece a la categora o no, o si tiene o no el atributo. Adems, todos y cada uno de los elementos deben ser clasificados en una y slo una categora. Ejemplos: 1) Sexo. 2) Estado conyugal. 3) Color de ojos. 4) Si tiene o no hijos. 5) Carcter de la gestin. 6) Nacionalidad. 7) Tipo de servicio de la gestin. 8) Va de entrada de la gestin.

M dulo
ii

Escala ordinal: los valores de la variable se agrupan en categoras que permiten establecer una relacin de orden entre ellas, segn el grado de posesin del atributo que tengan, si la cantidad que posee un elemento es mayor o menor que la cantidad que posee otro. Con las variables de este tipo de escala no es posible hacer ninguna de las operaciones aritmticas bsicas: suma, resta, multiplicacin y divisin. Ejemplos: 1) 2) 3) 4) Nivel socioeconmico. Orden de llamadas en un da. Identificador de gestin. Identificador de persona.

Escala de intervalo: cuando un elemento posee mayor o menor cantidad de una variable que otro, tambin es posible determinar la diferencia de magnitud entre dos elementos medidos. Para hacerlo, es necesario tener una medida origen o cero, establecida a conveniencia por el investigador u otra ya definida. Este tipo de variables permiten las operaciones de suma o resta.

Fase

de formacin especializada

25

Ejemplos: 1) 2) 3) 4) Temperatura en C. El resultado de la suma de las caras al lanzar dos dados. Edad en aos cumplidos. El tiempo.

Escala de razn: entre este tipo de variables s existe el cero e indica la ausencia total de la variable. Adems, el cero no es un punto arbitrario de la escala, sino que est fijo. Estas variables permiten las cuatro operaciones aritmticas bsicas y, adems, realizar comparaciones entre las proporciones o razones. Ejemplos: 1) Peso. 2) Talla (estatura). 3) Ingreso. 4) Edad. 5) Nmero de hijos. 6) Tiempo de espera en una sala de urgencia.
Debemos destacar que las diferentes escalas de medicin son acumulativas, es decir, la escala ordinal posee las propiedades de una nominal, adems del orden entre categoras; por lo tanto, la escala ordinal es ms fuerte que la nominal, ya que sus datos poseen ms informacin. Asimismo, la escala de intervalo es a su vez nominal y ordinal, mientras que la escala de razn tiene todas las propiedades de la escala de intervalo. Siempre es posible transformar datos que se encuentran en cierta escala a una ms dbil, simplemente ignorando la informacin extra que contiene.8

En la figura 3 se observa la relacin entre las diferentes escalas de medicin.


Figura 3. Relacin entre las escalas de medicin utilizadas en estadstica
Nominal Ordinal Intervalo Razn

Fuente: elaboracin propia.

Ibidem, pp. 1-5.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

ii

26

Una variable puede ser transformada en otro tipo de escala siempre que sea de rango inferior a la utilizada inicialmente. Como se observa en la figura 3, una variable de razn se puede convertir en una de intervalo, ordinal o nominal; y una de intervalo, en ordinal o nominal. De la misma manera, una variable ordinal se puede transformar en una nominal. Esto se hace mediante la agrupacin de categoras.
Ejemplo 5

La variable nmero de hijos de una persona es de razn y toma valores de 0, 1, 2, 3, etc. Formamos dos grupos: las personas que no tienen hijos las ponemos en el grupo A; las que s tienen hijos, en el grupo B. Tambin les podramos asignar un valor numrico. Por ejemplo, al grupo A le adjudicamos el valor 1, y a los del B, el 2. De esta manera, la nueva variable, formada por los dos grupos, es una variable nominal, ya que no le podemos asignar valor numrico al hecho de tener o no hijos, simplemente son categoras que clasifican (vase el cuadro 5).
Cuadro 5. Ejemplo de transformacin de una variable de razn a una variable nominal
Variable de razn Nmero de hijos 0 1 2 S: B = 2 Variable nueva de tipo nominal Tiene o no tiene hijos? No: A = 1

M dulo
ii

n
Fuente: elaboracin propia.

Este proceso de transformacin de las variables es prctico; sin embargo, se pierde informacin. En el ejemplo 5, al observar el registro de una persona con el valor 2 o la letra B de la nueva variable, es decir, la transformada, slo sabemos que s tiene hijos, pero no cuntos. Por lo tanto, se recomienda reunir siempre la informacin de las variables con la mayor precisin y detalle y, en la medida de lo posible, en escala de razn, ya que despus si fuera necesario ser ms fcil transformarlas a la escala que nos convenga para el tipo de anlisis estadstico que deseemos realizar.9

Miguel A. Martnez Gonzlez y Jorkin de Irala Estvez, Procedimientos descriptivos, en Bioestadstica amigable, 2 ed., Madrid, Daz de Santos, 2006, pp. 17 y 18.

Fase

de formacin especializada

27

La estadstica descriptiva y la estadstica inferencial dentro de la investigacin estadstica Una vez delimitadas la poblacin, la muestra, la unidad de observacin, las variables que se utilizarn, as como la manera de medirlas, el siguiente paso es analizar e interpretar los datos. Clasificar de manera correcta las variables de la investigacin servir para determinar los diferentes modelos matemticos y el tratamiento que se les dar.10 Analizar e interpretar los datos requiere de tcnicas de la estadstica descriptiva y de la estadstica inferencial: Las tcnicas de la estadstica descriptiva, que se vern con detalle en los mdulos iv y v, se utilizan para el anlisis descriptivo de la informacin con el objetivo de recabar, clasificar, resumir y analizar las caractersticas de la poblacin o muestra para luego deducir conclusiones sobre su estructura y composicin.11 Si se usa informacin de una muestra aleatoria, habr que utilizar herramientas estadsticas para sacar conclusiones acerca de la poblacin a partir de dicha muestra; a esto se le conoce como inferencia estadstica. La inferencia estadstica12 atribuye a la poblacin las caractersticas ms significativas obtenidas en la muestra.13 Existen dos mtodos de inferencia estadstica: - Estimacin puntual y por intervalos: se proponen estimaciones de los valores de la caracterstica de la poblacin que deseamos investigar14 usando la informacin de la muestra. Siempre estn sujetas a error (la diferencia entre el valor del parmetro de la poblacin y el valor estadstico de la muestra). La probabilidad de cometer este error es calculable. - Pruebas de hiptesis: en este mtodo hay que establecer una hiptesis estadstica respecto al valor que esperamos de la caracterstica de la poblacin que investigamos, la cual se evaluar con informacin generada a partir de la muestra.15 Por lo tanto, una hiptesis estadstica es una sentencia sobre la naturaleza de una poblacin y, por lo general, se formula a partir de determinada caracteIbidem, p. 13. Mara Teresa Icart Isern et al., Elaboracin y presentacin de un proyecto de investigacin y una tesina, Barcelona, Universitat de Barcelona (Salud pblica), p. 72. 12 Esta gua es una introduccin a las tcnicas de la estadstica descriptiva. Respecto a las tcnicas de estadstica inferencial vanse los captulos del 9 al 13 de Kenneth D. Hopkins et al., Estadstica bsica para las ciencias sociales y del comportamiento, 3 ed., Mxico, Prentice Hall, 1997, pp. 143-270; y Haroldo Elorza Prez-Tejeda, op. cit., pp. 179- 210. 13 Howard B. Christensen, Estadstica paso a paso, 3 ed., Mxico, Trillas, 2008, pp. 20-25. 14 En estadstica, a esta caracterstica se le llama comnmente parmetro. 15 Haroldo Elorza Prez-Tejeda, Estadstica para las ciencias sociales, op. cit., p. 308.
10 11

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

ii

28

rstica de la poblacin. Para contrastar una hiptesis estadstica se decide si parece congruente con los datos de la muestra. A esta hiptesis se le conoce como hiptesis nula y se indica con H0. Para contrastar la hiptesis nula se recurre a la hiptesis alternativa y se denota como H1. As pues, la H0 se rechazar si parece incongruente con los datos de la muestra; en caso contrario, se acepta como vlida.16
La diferencia entre el contraste de hiptesis y la estimacin puntual y por intervalos consiste en que la primera establece una hiptesis acerca del parmetro antes de realizar el estudio; con fundamento en el resultado del estadstico muestral, se rechaza o no dicha hiptesis. En cambio, en la estimacin por intervalo se consideran todos los posibles valores del parmetro.17

M dulo
ii

Ejemplo 6

Un poltico mexicano comenta a los medios de comunicacin que la edad promedio de las mujeres asesinadas en Ciudad de Jurez entre 2009 y 2010 es de 30 aos. Las personas de la Comisin Estatal de Derechos Humanos consideran que la afirmacin no es correcta y, con base en una muestra aleatoria de la informacin disponible en sus registros de los aos correspondientes, desean refutar la aseveracin. Por lo tanto, las hiptesis estadsticas que plantean las personas de la Comisin son: H0: el promedio de edad de las mujeres asesinadas entre 2009 y 2010 en Ciudad Jurez es de 30 aos. H1: el promedio de edad de las mujeres asesinadas entre 2009 y 2010 en Ciudad Jurez es distinto de 30 aos. El anlisis de la poblacin o muestra seleccionada mediante la estadstica descriptiva es un paso indispensable y necesario en cualquier investigacin cuantitativa, independientemente de que se utilicen o no tcnicas de estadstica inferencial. La seleccin y aplicacin de tcnicas estadsticas debe ser parte de la planeacin de la investigacin. Por lo tanto, antes de emplearlas, se deben llevar a cabo los pasos mencionados en la fase de induccin, curso iii, mdulo iii, donde se exponen, entre otros temas, la formulacin de objetivos y la elaboracin de hiptesis de investigacin. 18

Sheldon Ross, Introduccin a la estadstica, Barcelona, Revert, 2007, pp. 385-387. Ibidem, p. 308. 18 Mylai Burgos Matamoros, Fundamentos bsicos para la metodologa de la investigacin aplicada, en Programa de capacitacin y formacin profesional en derechos humanos, Mxico, Comisin de Derechos Humanos del Distrito Federal, 2011, pp. 187-195.
16 17

Fase

de formacin especializada

29

Qu es una base de datos? Una base de datos consiste en la recopilacin y ordenamiento de los atributos (datos) asociados a los individuos de la poblacin objetivo. Las caractersticas que se medirn son las variables y, como vimos, stas pueden ser cualitativas o cuantitativas. Las variables que se consideran para generar una base de datos dependen completa y exclusivamente de los intereses de quien har uso de ella, as como del medio por el cual rena la informacin de su inters. Por esta razn, no es requisito que una base de datos contenga todos los tipos de variables a la vez, sino slo las que sern de utilidad, ya sea para estudio, comprensin o mejora de los servicios ofrecidos. Al reunir los datos de una poblacin objeto de estudio a travs de variables de distinto tipo, ordenada y sistematizadamente, se elabora (confecciona, construye) una base de datos. Para juntar la informacin se puede recurrir a registros administrativos, encuestas, ejercicios ad hoc de levantamiento de informacin, etctera. Es muy importante que los resultados de una encuesta o investigacin se presenten de manera clara y concisa, ya que normalmente recopilan gran cantidad de informacin y es preferible que se puedan leer fcil y rpidamente para tener una idea precisa de lo que representan en conjunto, ms all del comportamiento individual. Ejemplo de una base de datos es la informacin que el Sistema Integral de Gestin de Informacin (Siigesi) de la cdhdf registra de las gestiones que realizan durante un periodo determinado. Para los fines de esta gua, se utilizar una base de datos de 47328 gestiones recibidas durante 2011 que se encuentra en un archivo de Excel llamado Tabla de servicios, y de la cual se pueden obtener tablas dinmicas. Una tabla dinmica es un recurso de Excel que permite resumir, organizar y agrupar gran cantidad de datos en un cuadro. Se le llama dinmica porque se puede modificar, reorganizar, mostrar u ocultar informacin de acuerdo con las necesidades del usuario.19 La base de datos del ejemplo, como cualquier otra, se compone de columnas y renglones. En los renglones se asentarn cada una de las gestiones presentadas a la Comisin y nuestras observaciones; las columnas son las variables o atributos recabados de cada una de las gestiones (vase la figura 4). Las variables que contiene la base de datos de esta gua son:20

19

20

Paco Mega Morales, Ya s Excel, pero necesito ms, 2 ed., Madrid, Visin, 2007, p. 168. Subdireccin de Estadstica de la cdhdf, Sistema Integral de Gestin de Informacin (Siigesi), Mxico, marzo de 2011, pp. 1-6.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

ii

30

Folio de gestin (id_gestion) permite identificar de manera nica la gestin mediante un folio numrico. Es una variable cuantitativa discreta. Fecha de creacin (Fecha_creacin): con esta variable sabemos el da, mes y ao en que fue creada la gestin, por lo tanto, es una variable cuantitativa discreta. Estatus de la gestin (Status_gestion): indica el estado de la gestin; en la base de datos todas las gestiones estn concluidas. Tipo de investigacin (Investigacion): variable nominal con tres categoras: - Directa: cuando el servicio es solicitado por el o la peticionario(a). - De reserva: cuando el servicio es solicitado por el o la peticionario(a), pero menciona que sus datos de identificacin personal deben mantenerse en reserva por temor a represalias. - De oficio: son las gestiones o servicios que se inician motu proprio. Unidad donde se recibi la gestin (Nombre_unidad): es una variable cualitativa nominal que identifica en cul de las cinco unidades de la cdhdf se recibi la gestin: oficina central, Unidad Norte, Unidad Oriente, Unidad Poniente o Unidad Sur. Forma en la que se present la gestin (Via_entrada): variable cualitativa nominal que cuenta con nueve categoras: correo, correo electrnico, escrito, fax, medios masivos de comunicacin, oficina de informacin pblica, personal, por actuacin de la cdhdf, telefnica. Tipo de servicio ofrecido (Servicio): variable nominal que cuenta con las siguientes categoras: aportacin a expediente de queja, aportacin a remisin, asesora para formular escrito, canalizacin con oficio, curso de queja, curso de remisin, documento improcedente, expediente de colaboracin, informacin sobre la cdhdf, medidas precautorias, orientacin verbal, orientacin verbal con solucin inmediata, remisin, respuesta a peticiones por escrito, respuesta a peticiones va electrnica, revisin de escrito, servicio de colaboracin y suplencia de queja. Categora de servicio ofrecido (Super_tipo): agrupacin de la variable servicio ofrecido y es una variable cualitativa nominal con dos categoras: Servicios de Defensa y Prevencin y Servicios de Proteccin. Identificador de persona (Id_persona): permite identificar de manera nica a la persona que levanta la gestin mediante un folio numrico. Es una variable cuantitativa discreta. Carcter de la persona que presenta la gestin (Caracter): variable cualitativa nominal con tres categoras: - Peticionario(a): el servicio solicitado es en beneficio de un tercero. - Agraviado: el servicio lo solicita la presunta vctima (puede ser una sola persona o un colectivo o grupo). - Ambos: el servicio solicitado es en beneficio de la persona que lo solicita.

M dulo
ii

Fase

de formacin especializada

31

Edad de la persona que presenta la gestin (Edad): variable cuantitativa discreta. Sexo de la persona que presenta la gestin (Sexo): variable cualitativa nominal y cuenta con cuatro categoras: masculino, femenino, de oficio y colectiva. Nacionalidad de la persona que presenta la gestin (Nacionalidad): variable cualitativa nominal. Rango de edad de la persona que presenta la gestin (Rango): variable cualitativa ordinal que resulta de la agrupacin de la variable edad.
Figura 4. Estructura de una base de datos
ii

Las columnas corresponden a las variables. Filas (renglones) representan cada uno de los casos (gestiones)

Nombre de las variables

Fuente: elaboracin propia.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Mdulo iii. Algunos ejercicios de estadstica descriptiva (tabla de frecuencias)

34

La tabla de frecuencias

La manera de obtener una tabla de frecuencias cambia si se trata de:

Es un arreglo sistemtico que organiza y resume la informacin de una variable.

Variable cualitativa

Cuenta con los siguientes elementos:

Clase: caracterstica o variable que se mide. Frecuencia absoluta o de clase: nmero de datos que se presentan en una clase dada. Su smbolo es fi. El total de casos (n) es igual a la suma de estas frecuencias. Frecuencia relativa: fraccin de datos que pertenecen a la clase. Se interpretan como un porcentaje; se obtiene al dividir la frecuencia absoluta entre el total de casos (n). Usualmente se multiplica por 100 y se simboliza mediante pi.

Para comprender las variables cualitativas y sacar conclusiones acerca de su comportamiento real se utilizan:

M dulo
iii
Elementos Variable cuantitativa

Representaciones grficas.

Grfica circular o de sectores. Grfica de barras.

Tabla de frecuencias para variables cuantitativas discretas

Tabla de frecuencias para variables cuantitativas continuas

Intervalo de clase: determinado por un lmite inferior y un lmite superior. El nmero de intervalos depende del criterio de quien genera la tabla. Frecuencia absoluta: nmero de datos que se presentan en una intervalo determinado; su smbolo es fi. Frecuencia relativa: fraccin de datos que pertenecen al intervalo. Se interpreta como un porcentaje y se obtiene al dividir la frecuencia absoluta entre el total de datos (n); su smbolo es pi. Frecuencia absoluta acumulada: suma de todas las frecuencias absolutas de los intervalos anteriores ms la frecuencia absoluta del intervalo que le corresponde. El valor para el ltimo intervalo es igual al nmero de datos. Se denota mediante Fi. Frecuencia relativa acumulada: suma de todas las frecuencias relativas de los intervalos anteriores ms la frecuencia relativa del intervalo que le corresponde. Tambin se puede calcular dividiendo las frecuencias absolutas acumuladas entre el total de datos (n), y se denota mediante Pi. Marca de clase: la marca de clase es el punto medio de cada intervalo; se denota mediante mi. Elementos

Un histograma representa distribuciones de frecuencia cuya variable es continua y viene dada en intervalos o clases.

Fase

de formacin especializada

35

n los mdulos anteriores se revisaron los elementos bsicos de una investigacin estadstica en derechos humanos, los conceptos de poblacin y muestra, el tipo de escalas de medicin de las variables, as como la forma como se construye una base de datos a partir de las quejas recibidas en la cdhdf.

El objetivo de este mdulo es explicar y ejemplificar algunas tcnicas utilizadas en estadstica descriptiva, por lo que se centrar en las tablas de frecuencias y en las representaciones grficas. En el prximo apartado se abordarn algunas medidas de resumen, como la media, mediana, moda, desviacin estndar y varianza. Nuestra fuente de informacin ser la base de datos que contiene 47238 gestiones recabadas en las cinco unidades de la cdhdf, proporcionada por la Subdireccin de Estadstica de la Comisin.

Las tablas de frecuencias y la representacin grfica de los datos La tabla de frecuencias, llamada tambin distribucin de frecuencias, es un arreglo sistemtico que organiza y resume la informacin de una variable. Adems ayuda a identificar las veces que aparece cada categora o modalidad en la muestra o poblacin, tambin es el primer paso en la descripcin de los datos recogidos.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

36

La manera de obtener una tabla de frecuencias no es la misma para una variable cualitativa que para una variable cuantitativa.

Tablas de frecuencias para variables cualitativas Las tablas de frecuencias para las variables cualitativas tienen los siguientes elementos: Clase: caracterstica o variable que se mide. Hay tantas clases como nmero de categoras en las que se pueden clasificar los datos. Frecuencia absoluta o de clase: cantidad de datos que se presentan en una clase determinada. Su smbolo es fi. El total de casos (n) es igual a la suma de estas frecuencias. Frecuencia relativa: datos que corresponden en la clase. Puede interpretarse como un porcentaje y se obtiene al dividir la frecuencia absoluta (fi) entre el nmero total de casos (n). Usualmente, se multiplica por 100 y su smbolo es pi. Adems, la suma de frecuencias relativas es igual a 1 (o a 100%).
Ejemplo 7

M dulo
iii

Con el archivo de Excel llamado Tabla de servicios.xls y con la variable Investigacin indagaremos si la mayora de las investigaciones, del total presentado en 2011 ante la cdhdf, son directas. La manera ms sencilla de averiguarlo es mediante una tabla de frecuencias. En este caso, la variable de inters Investigacin es cualitativa nominal, y tiene tres categoras o clases: de oficio, de reserva y directas, adems de que el total de casos es n = 47238. Por lo tanto, debemos obtener una tabla de frecuencias para variables cualitativas mediante los siguientes pasos: 1) Abrir el archivo Tabla de servicios.xls en Excel. 2) En la hoja de gestiones y con ayuda del mouse, seleccionamos el conjunto de datos, incluido el nombre de las variables. 3) Despus, en el men Insertar, oprimir el cono de Tabla dinmica (vase la figura 5a). Aparecer la ventana Crear tabla dinmica (vase la figura 5b). En el recuadro Tabla o rango aparece el rango de datos que se seleccion previamente. 4) Dejar activada la opcin de Nueva hoja de clculo y oprimir Aceptar (vase la figura 5). 5) Automticamente aparecer una nueva hoja que contiene la tabla dinmica con la cual se trabajar en los mdulos iii, iv y v. Esta tabla tiene la misma estructura que la mostrada en la primera parte de la figura 6. 6) Selecciona la variable Investigacin del men, luego campos para agregar al informe y, automticamente, aparecer como campo de fila.

Fase

de formacin especializada

37

7) En el recuadro Valores arrastra con el mouse la variable Investigacin. Esto da como resultado la frecuencia absoluta o de clase (fi) para las clases De oficio, De reserva y Directa, tal como se muestra en el segundo panel de la figura 6.
Figura 5. Men Insertar, submen Tabla dinmica

a)

b)

Figura 6. Tabla dinmica generada


iii
El
empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

38

Para manipular los valores de la tabla dinmica es necesario realizar la conversin de los valores obtenidos. Primero se seleccionan las celdas de la tabla dinmica. Posteriormente se realiza un pegado especial en el que se seleccionan slo valores en una celda diferente, por ejemplo D4. Esto pega todos los valores sin referencia a la tabla dinmica. Para obtener la frecuencia relativa (pi) se realiza el siguiente procedimiento: 1) Seleccionar la celda de la derecha del primer total y teclear, por ejemplo, =E5/$E$8 (vase la figura 7). Esto divide el valor de la celda E5 entre el valor de la celda E8, que es la suma de todas las categoras.21 2) Oprimir Enter para obtener el valor de la pi de la clase De oficio. 3) Copiar la frmula en las celdas F6 a F8 arrastrando el cursor de la esquina inferior derecha, para obtener la pi de las dos categoras restantes. 4) Realizar la suma total de las tres frecuencias absolutas. Esto se hace colocando el cursor en la celda F8 y escribiendo la siguiente frmula: = suma(F5,F7). Al oprimir Enter, aparecer como resultado un nmero 1. Es posible hacer lo anterior posicionndose en la celda F8 y dando clic en el cono Autosuma. 5) Para obtener el porcentaje del total de investigaciones que corresponde a cada categora, se debe obtener pi en porcentaje: dar clic en el cono de porcentaje despus de seleccionar las celdas de F5 a F8 para desplegar el resultado en trminos de 100% en lugar de 1. El resultado se muestra en el cuadro 6. De ser necesario, dar clic en el botn Aumentar decimales, para una mejor visualizacin de los resultados. 6) Finalmente, se recomienda asignar un ttulo a la tabla, as como a cada columna, tal y como se observa en el cuadro 6.
Figura 7. Generacin de las frecuencias absoluta y relativa en Excel a partir de una tabla dinmica

M dulo
iii
21

Figura 3. Generacin de las frecuencias absoluta y relativa en Excel a partir de una tabla dinmica

El smbolo $ en la frmula hace que la celda E8 se quede fija, por lo que, al ser copiada la frmula, el valor correspondiente a E8 ser el mismo para el resto de los clculos.

Fase

de formacin especializada

39

Cuadro 6. Ejemplo de una tabla de frecuencia de una variable cualitativa


Tabla de frecuencias absoluta y relativa para la variable Investigacin Investigacin De oficio De reserva Directa Total general Frecuencia absoluta (fi) 480 233 46525 47238 Frecuencia relativa (pi) 1.02% 0.49% 98.49% 100%

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Ahora debemos interpretar la tabla de frecuencias y responder a la pregunta planteada anteriormente. Una forma de hacerlo es la siguiente: del total de investigaciones presentadas durante 2011 ante la cdhdf, 98.49% son de tipo directa; poco ms de 1%, de oficio, y el resto (0.49%), de reserva. Por lo tanto, la mayora de las investigaciones presentadas en las cinco unidades son de tipo directa. Otra manera de responder a la pregunta del ejemplo 7 es utilizando una representacin grfica. La representacin grfica de un conjunto de datos resulta muy eficaz para facilitar la comprensin y extraer conclusiones acerca del comportamiento real de las variables. Es necesario que el impacto visual de la representacin grfica resuma la informacin en forma clara, concisa y atractiva.22 Si bien es similar a la tabla de frecuencias, es distinta para las variables cuantitativas y cualitativas; en el ltimo tipo, las representaciones grficas ms usadas son la grfica circular o de sectores y las grficas de barras.

Grfica circular o de sectores Este mtodo grfico es uno de los ms simples y usuales, adems de un valioso instrumento auxiliar de anlisis y presentacin de la informacin. Este diagrama en forma de crculo es particularmente til para visualizar las diferencias de frecuencia entre algunas categoras de nivel nominal,23 adems de que el ngulo del sector ser proporcional a la frecuencia absoluta o relativa de cada una de las clases de la variable.

22 23

Haroldo Elorza Perez-Tejeda, op. cit., p. 20. Ibidem, p. 21.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

40

Ejemplo 8

Con los datos del ejemplo 7 se obtendr la grfica de sectores. Para realizarla en Excel, se parte de la tabla de frecuencias. Los pasos a seguir son: 1) Seleccionar las celdas que contienen el nombre de las categoras y la de los valores de las frecuencias relativas (pi).24 En la opcin Insertar, seleccionar la opcin de grfica Circular. Aparecer un men; hay que escoger la primera opcin: Grfico 2D. Automticamente, aparecer la grfica que se muestra en la parte derecha de la figura 8. 2) Slo resta aadir un ttulo y la fuente de donde se obtuvieron los datos. Esto se hace con la opcin Herramientas de grficos, submen Ttulo de grficos. Ah seleccionamos Ttulo superpuesto centrado y, en la parte el cuadro donde aparece la leyenda Texto del grfico, se escribe el ttulo (vase la figura 9). 3) Para poner la fuente de donde se obtuvieron los datos, en el men Insertar oprimir el cono Cuadro de texto y, al final del cuerpo de la grfica, arrastrar el mouse para hacer un cuadro, que aparecer marcado en azul con lneas discontinuas (vase la figura 9) y se escribe el siguiente texto: Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf. 4) Tambin puede aadirse el porcentaje que corresponde a cada rea al seleccionar el men Herramientas de grficos y oprimir el submen Etiquetas de grficos, y luego la opcin Ajuste perfecto. La grfica resultante se muestra en la figura 10.
Figura 8. Pasos para la elaboracin de grficas circulares o de sectores en Excel

M dulo
iii
24

Tambin es posible hacer la grfica de sectores utilizando la frecuencia absoluta. Para eso, en lugar de seleccionar los valores de las frecuencias relativas pi, se debern escoger los de las frecuencias absolutas fi.

Fase

de formacin especializada

41

Figura 9. Pasos para dar formato a las grficas en Excel

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

42

Figura 10. Ejemplo de una grfica circular o de sectores realizada en Excel


Distribucin porcentual de las gestiones recibidas en la CDHDF durante 2011 segn tipo de investigacin

De o cio 1.0% De reserva 0.5% Directa 98.5%

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

En la grfica circular se observa que el rea sombreada mayor corresponde a las investigaciones de tipo directa y que el rea de las investigaciones de reserva es mucho menor. Por lo tanto, se concluye que la mayora de las investigaciones recibidas en la Comisin durante 2011 fueron de tipo directa.

M dulo
iii

Grfica de barras Otra representacin grfica de las variables cualitativas es la grfica de barras, que consiste en un conjunto de columnas separadas que representan la frecuencia o el porcentaje de cada uno de los valores o categoras de la variable de inters; la altura de cada barra ser proporcional a la frecuencia relativa o absoluta.25
Ejemplo 9

Para saber en qu sede se recibieron ms gestiones durante 2011, se emplear la grfica de barras. Al igual que en la grfica de sectores, primero se obtiene la tabla de frecuencias. Al realizar todos los pasos del ejemplo 7, pero usando la variable Nombre_Unidad, se logra las siguientes frecuencias.

25

Haroldo Elorza Perez-Tejeda, op. cit., p. 21.

Fase

de formacin especializada

43

Cuadro 7. Frecuencias absoluta y relativa para la variable Nombre_Unidad


Nombre _Unidad Oficina central Unidad Norte Unidad Oriente Unidad Poniente Unidad Sur Total general Frecuencia absoluta (fi) 38579 2005 2242 972 3440 47238 Frecuencia relativa (pi) 81.67% 4.24% 4.75% 2.06% 7.28% 100%

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Los pasos para ejecutar una grfica de barras en Excel son: 1) Seleccionar las celdas con el nombre de las categoras y con los valores de las frecuencias relativas (pi).26 En la opcin Insertar, seleccionar la opcin de grfica Columna. Elegir la primera opcin: Columna en 2D. Automticamente aparecer la grfica que se muestra en la parte derecha de la figura 11. 2) Para aadir el ttulo, la fuente de la cual se obtuvo la informacin y la etiqueta de los datos, hay que seguir los pasos del 2 al 4 del ejemplo 8. 3) Para quitar la gua de la serie de datos, se selecciona y se oprime la tecla Supr. Y el resultado es la grfica que aparece al final de la figura 11.

Figura 11. Pasos para la elaboracin de grficas de barras en Excel

26

Tambin se puede hacer la grfica de sectores utilizando la frecuencia absoluta; para eso, en lugar de seleccionar los valores de pi, se optar por los de fi.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

44

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

En la grfica de barras se observa que al eje horizontal (x) le corresponde la variable de inters Nombre_unidad; y al eje vertical (y), la frecuencia relativa, es decir, el porcentaje del total de las gestiones de cada sede dentro del total de las gestiones recibidas durante 2011. Adems, como la barra perteneciente a la categora de la oficina central es la ms alta, se puede concluir que es la sede que recibi ms gestiones. Otra manera sencilla de interpretar la frecuencia relativa (pi) es la siguiente: de cada 100 gestiones que recibi la cdhdf durante 2011, 82 se recibieron en la oficina central, 7 en la Unidad Sur, 5 en Unidad Oriente, 4 en la Norte y slo 2 en Unidad Poniente. Como se ve, no hay una nica manera de interpretar los resultados. Tanto las tablas de frecuencias como las grficas de sectores y las de barras son igualmente vlidas.

M dulo
iii

Tablas de frecuencias para variables cuantitativas discretas Las tablas de frecuencias para las variables de tipo cuantitativo son muy similares a las de los datos cualitativos. Sin embargo, debido a que no hay una divisin tcita entre valores cuantitativos, es necesario dividirlos en intervalos. Los intervalos sern, entonces, equivalentes a las clases. Los elementos son: Intervalo de clase: determinado por un lmite inferior y un lmite superior. El nmero de intervalos depende del criterio de quien genere la tabla. Frecuencia absoluta: nmero de datos que se presentan en un intervalo determinado y se representa mediante fi. Frecuencia relativa: fraccin de datos que caen en el intervalo. Se puede interpretar como un porcentaje y se obtiene al dividir la fre-

Fase

de formacin especializada

45

cuencia absoluta entre el nmero total de datos (n); se representa mediante pi. Frecuencia absoluta acumulada: es la suma de todas las frecuencias absolutas de los intervalos anteriores ms la frecuencia absoluta del intervalo que le corresponde. El valor para el ltimo intervalo es igual al nmero de datos. Su smbolo es Fi. Frecuencia relativa acumulada: es la suma de todas las frecuencias relativas de los intervalos anteriores ms la frecuencia relativa del intervalo que le corresponde. Tambin se puede calcular dividiendo las frecuencias absolutas acumuladas entre el nmero total de datos (n); su smbolo es Pi.
Ejemplo 10

Para conocer el patrn de edad de las personas que levantaron alguna gestin durante 2011 ante la cdhdf, se crear una tabla de frecuencias con la variable edad. Esta variable contiene la informacin de edad en aos cumplidos de las personas que presentaron las gestiones durante el periodo analizado, por lo tanto es cuantitativa, discreta y de intervalo. Los pasos para obtener esta tabla son: 1) Para obtener la frecuencia absoluta (fi) y la relativa (pi) de la tabla de frecuencias de la variable de inters, se seguirn los pasos del 2 al 4 del ejemplo 7. 2) Una vez hecho lo anterior, para obtener Fi se posicionar el cursor en la celda G5 y se escribir la siguiente frmula =E5. Este valor debe darnos un resultado igual al del primer rengln de fi, tal y como se muestra en el primer panel de la figura 12. 3) Para obtener el siguiente dato, se posiciona el cursor en la celda inferior (E6) y se escribe =E6+G5. Esto suma el valor de la frecuencia absoluta del primer valor ms la frecuencia absoluta del segundo valor (vase la figura 12). 4) Se copia la frmula anterior para todas las celdas subsecuentes hacia abajo con excepcin de la ltima (la del Total general), pues la penltima celda acumula los 46499 casos totales.27 De esta manera, cada celda es la suma de su valor de frecuencia absoluta ms todos los anteriores; es acumulativa.
iii

27

Se quit la opcin de categora En blanco debido a que no aportaba informacin alguna. Sin embargo, es importante mencionar que en esta categora se agrupan las gestiones colectivas y, por lo tanto, no se puede asignar un valor nico a la variable edad.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

46

Figura 12. Generacin de la frecuencia relativa, absoluta y absoluta acumulada en una tabla de frecuencias en Excel a partir de una tabla dinmica con una variable cuantitativa discreta

M dulo
iii

Para obtener la frecuencia relativa acumulada (Pi), hay que seguir los siguientes pasos: 1) Seleccionar la celda junto a la frecuencia relativa (F5) y escribir la frmula =F5, por ejemplo, por ser esta la primera celda de la frecuencia relativa (vase la figura 13). 2) Seleccionar la celda inferior (G6) y escribir =F6+H5 (vase la figura 13). 3) Se copia la frmula anterior para todas las celdas subsecuentes hacia abajo con excepcin de la ltima, pues la penltima celda acumula 100% de los casos totales (vase la figura 13).
Figura 13. Generacin de la frecuencia relativa acumulada en una tabla de frecuencias en Excel a partir de una tabla dinmica con una variable cuantitativa

Fase

de formacin especializada

47

El resultado de la tabla de frecuencia anterior se aprecia en la cuadro 8.


Cuadro 8. Frecuencia absoluta y relativa, simple y acumulada para la variable Edad
Edad 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

fi
83 47 49 85 78 71 99 98 78 88 57 74 89 101 146 182 177 239 238 288 319 342 413 426 468 576 522 560 699 628 711 592 675 687

pi
0.2% 0.1% 0.1% 0.2% 0.2% 0.2% 0.2% 0.2% 0.2% 0.2% 0.1% 0.2% 0.2% 0.2% 0.3% 0.4% 0.4% 0.5% 0.5% 0.6% 0.7% 0.7% 0.9% 0.9% 1.0% 1.2% 1.1% 1.2% 1.5% 1.4% 1.5% 1.3% 1.5% 1.5%

Fi
83 130 179 264 342 413 512 610 688 776 833 907 996 1097 1243 1425 1602 1841 2079 2367 2686 3028 3441 3867 4335 4911 5433 5993 6692 7320 8031 8623 9298 9985

Pi
0.2% 0.3% 0.4% 0.6% 0.7% 0.9% 1.1% 1.3% 1.5% 1.7% 1.8% 2.0% 2.1% 2.4% 2.7% 3.1% 3.4% 4.0% 4.5% 5.1% 5.8% 6.5% 7.4% 8.3% 9.3% 10.6% 11.7% 12.9% 14.4% 15.7% 17.3% 18.5% 20.0% 21.5%

Edad 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

fi
697 741 793 731 959 737 794 801 841 786 699 791 845 812 709 716 693 598 630 565 577 552 523 487 448 438 493 400 401 320 280 282 234 218

pi
1.5% 1.6% 1.7% 1.6% 2.1% 1.6% 1.7% 1.7% 1.8% 1.7% 1.5% 1.7% 1.8% 1.7% 1.5% 1.5% 1.5% 1.3% 1.4% 1.2% 1.2% 1.2% 1.1% 1.0% 1.0% 0.9% 1.1% 0.9% 0.9% 0.7% 0.6% 0.6% 0.5% 0.5%

Fi
10682 11423 12216 12947 13906 14643 15437 16238 17079 17865 18564 19355 20200 21012 21721 22437 23130 23728 24358 24923 25500 26052 26575 27062 27510 27948 28441 28841 29242 29562 29842 30124 30358 30576

Pi
23.0% 24.6% 26.3% 27.8% 29.9% 31.5% 33.2% 34.9% 36.7% 38.4% 39.9% 41.6% 43.4% 45.2% 46.7% 48.3% 49.7% 51.0% 52.4% 53.6% 54.8% 56.0% 57.2% 58.2% 59.2% 60.1% 61.2% 62.0% 62.9% 63.6% 64.2% 64.8% 65.3% 65.8%

Edad 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 96 97 9999

fi
252 228 184 199 147 147 140 127 144 97 72 54 73 74 53 46 35 45 26 24 14 14 22 4 9 3 4 2 1 13683

pi
0.5% 0.5% 0.4% 0.4% 0.3% 0.3% 0.3% 0.3% 0.3% 0.2% 0.2% 0.1% 0.2% 0.2% 0.1% 0.1% 0.1% 0.1% 0.1% 0.1% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 29.4% 100%

Fi
30828 31056 31240 31439 31586 31733 31873 32000 32144 32241 32313 32367 32440 32514 32567 32613 32648 32693 32719 32743 32757 32771 32793 32797 32806 32809 32813 32815 32816 46499

Pi
66.3% 66.8% 67.2% 67.6% 67.9% 68.2% 68.5% 68.8% 69.1% 69.3% 69.5% 69.6% 69.8% 69.9% 70.0% 70.1% 70.2% 70.3% 70.4% 70.4% 70.4% 70.5% 70.5% 70.5% 70.6% 70.6% 70.6% 70.6% 70.6% 100%

Total 46499

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

48

En el cuadro 8 se muestra, por ejemplo, que de las 46499 gestiones presentadas ante la cdhdf, que tienen informacin sobre edad, 841 fueron presentadas por personas de 42 aos de edad, lo que equivale a 1.78% del total de las gestiones. Tambin se observa que poco menos de un tercio (29.4%) de las gestiones tiene como valor 9999 en la variable Edad, el cual corresponde a la informacin de las gestiones realizadas en la categora De oficio, por lo que la variable edad no aplica. Por otro lado, el cuadro 8 no es muy til, pues tiene aproximadamente 100 renglones, y la mayora tiene menos de 2% de los casos debido al amplio rango de edades que se maneja. Para afinar la informacin, se recomienda abordar la edad como una variable cualitativa ordinal, uniendo las edades en grupos, ya sea de manera quinquenal (de 5 en 5 edades), decenal (de 10 en 10 edades) o cualquier otro tipo de agrupacin que satisfaga las necesidades de la investigacin. Una vez hecho esto, la tabla de frecuencias se construir igual que en el ejemplo 7. En el siguiente ejemplo se describir el proceso para convertir la variable Edad de cuantitativa discreta en cualitativa ordinal.
Ejemplo 11

M dulo
iii

Para que una variable sea considerada continua, deber tomar cualquier valor intermedio entre dos valores sucesivos, lo que no sucede con la edad, pues comnmente se pregunta en aos cumplidos. Por lo tanto, como ya se mencion, la edad en aos cumplidos es una variable cuantitativa discreta, ya que no se toman edades intermedias. Sin embargo, debido a la gran cantidad de datos en este caso, es recomendable agrupar las edades para una lectura ms simple, tanto de la tabla como de las grficas. De esta manera, convertiremos la variable Edad de cuantitativa discreta en cuantitativa ordinal. Primero se crearn grupos de edad por grupos decenales, es decir, los grupos irn de 0 a 9 aos, de 10 a 19 aos, etc. Como la edad mayor en este caso es menor a 99, el ltimo intervalo por considerar ser 90-99 aos. Los casos sin informacin en esta variable, o con valor 9999, no se tomarn en cuenta. Para agrupar las edades en Excel el procedimiento es el siguiente: 1) Despus de realizar los siete primeros pasos del ejemplo 7, se obtiene una tabla dinmica con la variable Edad. 2) Para hacer el grupo de 0 a 9 aos, se seleccionan las celdas con la etiqueta de estas edades. Despus, en el men Datos, se oprime el botn Agrupar y, automticamente, aparece una nueva columna con la leyenda de Grupo 1.

Fase

de formacin especializada

49

3) Para formar el grupo de edades de 10 a 19 aos, se seleccionan las celdas de las edades 10 a 19 aos. Se oprime Agrupar del men Datos. Una vez hecho esto, aparecer el grupo 2. 4) Para generar el resto de los grupos, repetimos los pasos anteriores. Recuerde que el grupo 3 corresponde a las edades 20 a 29, el grupo 4 a las edades 30 a 39, y as sucesivamente, en grupos de diez, hasta el grupo 10, de 90 a 99. Sin embargo, como en este ejemplo slo tenemos hasta los 97 aos, se selecciona hasta esa edad para el ltimo grupo. Como los valores 9999 y En blanco no interesa conservarlos, estas dos opciones se incorporarn al grupo 11 (vase el primer panel derecho de la figura 14). 5) Para colapsar los grupos con el fin de obtener la frecuencia absoluta que se encuentra del lado izquierdo de (fi), se oprime el botn la etiqueta de cada nmero, para cada uno de los grupos (vase el segundo panel izquierdo de la figura 14). 6) La tabla final se muestra en el segundo panel derecho de la figura 14. 7) Para encontrar fi, pi, Fi y Pi, adems de dar formato a la tabla, slo hay que seguir los pasos de los ejemplos anteriores. Recuerde que slo nos interesa usar la informacin de los 10 primeros grupos. 8) El cuadro 9 es nuestro resultado final.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Figura 14. Ejemplo de cmo transformar una variable cuantitativa discreta en una variable cualitativa ordinal

iii

50

M dulo
iii

Cuadro 9. Ejemplo de una tabla de frecuencias para una variable de tipo cualitativa ordinal. Distribucin en grupos decenales de la edad de las personas que realizaron las gestiones ante la cdhdf durante 2011
Grupo de edad 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total Frecuencia absoluta (fi) 776 1591 4953 7323 7794 5511 3108 1311 404 45 32816 Frecuencia absoluta acumulada (Fi) 776 2367 7320 14643 22437 27948 31056 32367 32771 32816 Frecuencia relativa (pi) 2.4% 4.8% 15.1% 22.3% 23.8% 16.8% 9.5% 4.0% 1.2% 0.1% 100% Frecuencia relativa acumulada (Pi) 2.4% 7.2% 22.3% 44.6% 68.4% 85.2% 94.6% 98.6% 99.9% 100%

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Como se observa, el cuadro 9 es ms sencillo de leer que el cuadro 8, ya que tiene tan slo 10 grupos o renglones en vez de 100. Al seguir los pasos del ejemplo 9, se obtiene una grfica de barras con fi (vase la figura 15).

Fase

de formacin especializada

51

Figura 15. Ejemplo de una grfica de barras para una variable cualitativa ordinal
Distribucin de la frecuencia de la edad de las personas en grupo decenales que realizaron las gestiones ante la CDHDF durante 2011
30% 25% 20% 15% 10% 5%
2.4% 4.8% 15.1% 16.8% 23.8% 22.3%

9.5% 4.0% 1.2% 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 0.1% 90-99

0%
0-9

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Tabla de frecuencias para variables cuantitativas continuas Las tablas de frecuencias para las variables cuantitativas continuas tienen los mismos elementos que las cuantitativas discretas (fi, pi, Fi y Pi), ms una columna titulada Marca de clase, que es el punto medio de cada intervalo y se representa mediante mi.
Ejemplo 12

Como la base de datos utilizada hasta ahora no cuenta con una variable cuantitativa continua, la elaboracin de una tabla de frecuencia de este tipo se realiza con datos de una fuente externa. Supngase que se cuenta con la informacin del tiempo que esperaron 27 personas para levantar una denuncia ante la cdhdf de la Unidad Poniente. El tiempo se registr en horas y los datos son:

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Con la informacin de la tabla de frecuencias y de la grfica de barras se observa que la mayora de las gestiones realizadas ante la Comisin en 2011 fueron interpuestas por mujeres y hombres de entre 20 y 59 aos de edad, y que aproximadamente una cuarta parte (23.8%) de las gestiones provinieron de personas de entre 40 y 49 aos de edad; los grupos de edad que tienen menos representacin son los de los menores de 19 aos, 7 de cada 100 gestiones son de mujeres y hombres de este grupo de edad, y slo 0.1% son mayores de 90 aos.

iii

52

2.3 3.7 4.3 4.8

2.7 3.8 4.3 4.9

3.3 3.8 4.4 5.1

3.6 3.9 4.4 5.1

3.7 4.0 5.2 8.2

3.7 4.4 5.4 8.9

3.7 4.7 5.9

Fuente: elaboracin propia con base en la informacin simulada.

Con esta informacin ese analizar el patrn de tiempo de espera para levantar una denuncia en la Unidad Poniente. Para realizar una tabla de frecuencias los pasos son: 1) Se registran los datos en Excel en una columna columna A, por ejemplo. A este tipo de arreglo se le conoce como Datos no agrupados. 2) Se ordenan los datos seleccionando toda la columna con la informacin del tiempo de espera. En el men Datos, se oprime el botn , el cual ordena de menor a mayor, de manera automtica, los datos seleccionados. As se identifica el valor mnimo (2.3 horas, y se encuentra en la celda B3) y el valor mximo (8.9 horas, localizado en la celda B29). 3) Despus se obtiene la amplitud, que es el valor mximo menos el valor mnimo. En Excel se sita el cursor en la celda B1, por ejemplo, y se escribe la siguiente frmula: =B29 B3, la cual dar como resultado 6.6. 4) Para decidir los intervalos de clase necesarios, llamaremos k a dicho valor. Sin prdida de generalidad, se puede optar por una k = 4, es decir, una tabla de frecuencias con 4 intervalos de clase.28 Para fijar el ancho de cada intervalo de clase, se le asigna tambin un valor arbitrario y se le llama c. Se recomienda que k * c sea un poco mayor que la amplitud de los datos. En este caso, se elige c = 1.7. El valor c no necesariamente es un nmero entero. Adems, k * c = 6.8 es mayor que la amplitud (6.6). Para realizar los clculos de manera sencilla, se anotan estos valores en las celdas de la hoja de clculo de Excel (vase la figura 16). 5) Es importante mencionar que los extremos de los intervalos de clase se denominan lmite inferior (representado por L inf ) y lmite superior (indicado por L sup). 6) Se elige el valor inicial que limitar el primer intervalo de clase y a partir del cual se obtendrn todos los puntos que limitarn a cada uno de los siguientes intervalos. El primer L inf deber ser un nmero menor al valor mnimo observado. En el ejemplo, el mnimo observado es de 2.3 horas, por lo que se puede elegir como L inf del primer intervalo el valor 2. Para obtener el
28

M dulo
iii

Es importante recordar que un intervalo de clase se utiliza para resumir, simplificar y manipular gran cantidad de datos de tipo cuantitativo.

Fase

de formacin especializada

53

siguiente L inf , se le suma el valor de c. Como ya se tienen los datos en Excel, basta escribir la siguiente frmula =E3 + $C$33 (vase la figura 17). Este procedimiento da como resultado un L inf del segundo intervalo de 3.7. Como del valor de c se encuentra en la celda C33, que se utilizar en el resto de los intervalos, se agregan los signos de $ para fijar el valor de la celda. Para obtener el L inf del resto de los intervalos, slo se copia la frmula en las celdas siguientes, posicionando el cursor en la celda E5 y, poniendo el mouse en la parte inferior izquierda del rectngulo (aparecer una pequea cruz), arrastrar el mouse hasta la celda que corresponde al cuarto intervalo de clase (vase la figura 17). El L sup del primer intervalo de clase ser igual al L inf del segundo, y as sucesivamente. Para hacerlo, slo se pone en la celda F4 la siguiente frmula =E5. Despus se copia en el segundo y tercer intervalo (vase la figura 17). Note que los valores observados de los L inf no estarn contenidos en dicho intervalo. Por ejemplo, en el segundo intervalo de clase se obtiene el L inf = 3.7 y el L sup =5.4, por lo que las observaciones con valor igual a 3.7 no seran parte este intervalo, sino del primer intervalo de clase. Las observaciones con valor igual a 5.4 s son parte de este segundo intervalo. 7) El valor del L sup del ltimo intervalo de clase se obtiene sumando 1.7 (que es el valor c) al L inf . Para hacerlo en Excel, se pone la siguiente frmula: = E7 + C33. El resultado debe ser igual al mostrado en la figura 17. 8) Para obtener fi, se realiza el conteo de las observaciones cuyos valores pertenecen a cada intervalo de clase. Por ejemplo, hay 8 observaciones en los valores 2.0 y 3.7. Una vez obtenidas las fi, si se suman estos conteos, el valor resultante debe ser el total de las observaciones, es decir, 27. 9) Para obtener pi, Fi y Pi, se siguen del paso 2 al 7 del ejemplo 10. Observe cmo el ltimo valor de Fi es igual al total de observaciones, es decir, 27. De la misma manera, la suma de la columna pi debe ser 1 o 100, en caso de que se maneje como porcentaje (vase segundo panel de la figura 17). 10) Al agrupar las observaciones en intervalos de clase se pierde el valor o magnitud que tenan antes, por ello es conveniente elegir un punto central del intervalo de clase como el valor que represente la magnitud de todas las observaciones que se clasificaron en dicho intervalo. A este valor se le llama, como se mencion, marca de clase (mi).29 Para obtenerlo, basta con hacer la siguiente operacin para cada intervalo:

29

Vctor Aguirre y Begoa Artaloitia, Anlisis exploratorio de datos, op. cit., pp. 1-16.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

54

mi=

L sup L inf 2

En Excel se escribe en la celda K3 la siguiente frmula: =(E3 + F3)/2. Se aade el ttulo de la tabla de frecuencias, de las columnas y la fuente (vase el segundo panel de la figura 17). El resultado final se muestra en el cuadro 10.

Al arreglo de datos de una tabla de frecuencias como la que se acaba de obtener se le conoce como datos agrupados.
Figura 16. Ejemplo para generar una tabla de frecuencias en Excel para una variable cuantitativa continua

M dulo
iii
Fase
de formacin especializada

55

Figura 17. Generacin de una tabla de frecuencias en Excel para una variable cuantitativa continua

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

56

Cuadro 10. Tabla de frecuencias del tiempo que esperaron las personas para levantar una denuncia ante la cdhdf en la Unidad Poniente
Intervalos de clase 1 2 3 4 Total Lmite inferior (L inf) 2.0 3.7 5.4 7.1 Lmite superior (L sup) 3.7 5.4 7.1 8.8 Frecuencia absoluta (fi) 8 16 1 2 27 Frecuencia absoluta acumulada (Fi) 8 24 25 27 Frecuencia relativa (pi) 29.6% 59.3% 3.7% 7.4% 100% Frecuencia relativa acumulada (Pi) 29.6% 88.9% 92.6% 100% Marcas de clase (mi) 2.85 4.55 6.25 7.95

Fuente: elaboracin propia con base en la informacin simulada.

Con base en los resultados de la tabla anterior, se sabe que 30% de las personas que levantaron una denuncia en la Unidad Poniente esperaron entre 2.0 y 3.7 horas. El 59% esper ms de 3.7 horas y menos de 5.4 horas. Utilizando los valores de Fi, concluimos que 89% de las personas esperaron menos de 5.4 horas para levantar una denuncia. Cabe mencionar que si se cambia el ancho de las clases, la distribucin de frecuencia tambin cambia. Sin embargo, la interpretacin es similar.30

M dulo
iii

Histograma31 Otra forma de conocer el patrn de tiempo de espera es mediante el uso de un histograma de frecuencias. Un histograma es un diagrama til para representar distribuciones de frecuencia cuya variable es continua y viene dada en intervalos o clases.32
Este tipo de grfica es una forma especial de una grfica de barras, en la cual los intervalos de clase estn representados por el ancho de las barras y las frecuencias de las observaciones son proporcionales a las reas de los rectngulos. La altura de las barras puede ser la frecuencia absoluta o la relativa, el perfil del histograma ser el mismo, sin embargo, es ms informativo con frecuencias relativas puesto que as tenemos una idea del porcentaje de observaciones que ocurrieron por intervalo.33

Ibidem, pp. 1-17. Otras representaciones grficas se utilizan para las variables de tipo cuantitativas, como los diagramas de caja y brazos, diagramas de puntos, diagrama de tallos y hojas, polgonos de frecuencias y la ojiva. Para consultar la manera de realizarlos, vase Vctor Aguirre y Begoa Artaloitia, op. cit., pp. 1-23. 32 Haroldo Elorza Prez-Tejeda, op. cit., p. 24. 33 Vctor Aguirre y Begoa Artaloitia, op. cit., pp. 1-18.
30 31

Fase

de formacin especializada

57

De esta manera, el histograma se construye como la grfica de barras con la diferencia de que las columnas no estn separadas, sino unidas, lo que le da continuidad.
Ejemplo 14

Para realizar el histograma del tiempo de espera de las personas que acudieron a la cdhdf en la Unidad Poniente, se utilizar la tabla de frecuencias del ejemplo anterior. 1) Con los datos de la tabla del cuadro 10 se seleccionan los valores de la frecuencia relativa (pi)34 de la tabla, columna 6, referentes a los intervalos de clase. No es necesario seleccionar la ltima fila, pues no es un intervalo, sino la suma de todos los valores anteriores. 2) Una vez hecho lo anterior, en el men Insertar se selecciona la opcin Columna y luego la primera opcin: Columna en 2D. Automticamente aparecer la grfica que se muestra en la parte derecha del primer panel de la figura 18. 3) La grfica que se obtuvo tiene las barras separadas como en una variable de tipo cualitativa, y lo que se requiere es un histograma. Para que las barras ocupen todo el ancho del intervalo, se da clic sobre alguna de las barras; con el botn derecho se despliega el men y se elige Dar formato a la serie de datos. Del submen se selecciona Ancho del intervalo y se arrastrar el cursor completamente hacia el lado izquierdo Sin intervalo, y se oprime el botn Cerrar. De esta manera no hay intervalo ni espacio entre las barras y, por lo tanto, se convierte en un histograma, es decir, las barras son continuas y no hay valores de la tabla de datos que no se encuentren considerados en la grfica (vase el segundo panel de la figura 18). 4) Para incluir los ttulos, la fuente de la cual se obtuvo la informacin y la etiqueta de los datos,35 se siguen los pasos del 2 al 4 del ejemplo 10. La grfica resultante debe ser igual a la del panel 3 de la figura 18.

Recuerde que tambin se puede hacer con la frecuencia absoluta, slo que en lugar de seleccionar la columna de fi se debe optar por la de pi. 35 Se recomienda usar las mi como etiquetas del eje X.
34

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

58

Figura 18. Ejemplo de cmo generar un histograma de frecuencias relativas para una variable continua

M dulo
iii
Fase
de formacin especializada

59

Distribucin de la frecuencia del tiempo que esperaron las personas para poder levantar una denuncia ante la CDHDF en la unidad Poniente
60% 50% 40% 30% 20% 10%
3.7% 4.4% 29.6% 59.3%

0%
2.9 4.6 6.3 8.0

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

La interpretacin es la misma que la de tabla de frecuencias, pero es ms sencillo e informativo utilizar un histograma. De la grfica anterior se deduce que el tiempo de espera de casi 60% de las personas corresponde a 4.6 horas, y que tan slo 3.7% de las personas tuvieron un tiempo de espera de alrededor de 6.3 horas.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iii

Mdulo iv. Algunos ejercicios de estadstica descriptiva (medidas descriptivas)

62

Medidas descriptivas

Se basan en unos cuantos nmeros para mostrar aspectos relevantes de la distribucin de frecuencias.

Media. Promedio aritmtico de un conjunto de mediciones. Medida de tendencia central que separa los datos de una distribucin en dos partes de igual frecuencia. Por lo tanto, es el valor que deja 50% de los valores de la variable. Moda. Valor o valores que ocurren con mayor frecuencia en un conjunto de mediciones. Valores numricos que ubican la parte central de la distribucin de frecuencia.

Medidas de tendencia central

las ms utilizadas son:

Amplitud. Mide la distancia entre la observacin de mayor valor y la de menor valor. Medidas de variabilidad o distribucin las ms utilizadas son: Varianza. Promedio de los cuadrados de las desviaciones de las observaciones respecto a su media. Desviacin estndar. Raz cuadrada positiva de la varianza.

M dulo
iv

Cuantifican la variabilidad o dispersin de un conjunto de observaciones (datos), es decir, qu tanto se alejan de las medidas de tendencia central como la media.

Fase

de formacin especializada

63

Medidas descriptivas Hasta el momento se ha visto cmo elaborar tablas de frecuencias y algunas grficas, tanto para variables cualitativas como cuantitativas, las cuales resumen la informacin y ayudan a visualizar los valores que aparecen con mayor o menor frecuencia. A pesar de que esta descripcin es bastante til, hay descripciones de otro tipo, basadas en unos cuantos nmeros, que muestran aspectos relevantes de la distribucin de frecuencias. Por ejemplo, si lo que interesa es exponer la parte central de la distribucin de frecuencias, debern usarse medidas de tendencia central. Si el objetivo es conocer las variaciones de los datos observados respecto a un valor central de distribucin, se utilizarn entonces medidas de variabilidad. A las medidas de tendencia central y de variabilidad se les conoce como medidas descriptivas.36 Este tipo de medidas, con excepcin de la moda, slo deben aplicarse en variables cuantitativas.37A continuacin se definirn y ejemplificarn las medidas descriptivas ms utilizadas en la investigacin cuantitativa.

36 37

Vctor Aguirre y Begoa Artaloitia, op. cit., pp. 1-24. Este tipo de medidas se obtienen tanto con datos agrupados como no agrupados; sin embargo, slo se mostrar su aplicacin con datos agrupados, ya que con el uso de las herramientas la manipulacin de datos no agrupados es relativamente sencilla.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iv

64

Medidas de tendencia central Las medidas de tendencia central son valores numricos que ayudan a localizar la parte central de la distribucin de frecuencia; las ms utilizadas son la media, la mediana y la moda.
Media

Es el promedio aritmtico de un conjunto de mediciones y es la ms comn. Con los datos de una poblacin, el promedio de todas sus mediciones es la media poblacional para una poblacin de tamao N. La media poblacional comnmente se representa con y se obtiene mediante la siguiente frmula:

Con los datos de una muestra se utiliza la media muestral para una muestra de tamao n, cuyo smbolo es X y se obtiene de la siguiente manera:

La media es un indicador de la tendencia central en el caso de una distribucin no muy sesgada y sin observaciones atpicas.38
Mediana

Es la medida de tendencia central que separa los datos de una distribucin en dos partes de igual frecuencia. Por lo tanto, la mediana es el valor que deja 50% de los valores de la variable, tanto por encima como por debajo de ella, siempre y cuando estn ordenados de manera ascendente o descendente. Por lo general, se indica con Me. La ventaja de esta medida de tendencia central es su cualidad de nica, adems de que los valores extremos (muy pequeos o muy grandes) no tienen efectos importantes en ella, lo que s ocurre con la media. Tanto la media como la mediana se encuentran en la misma unidad de medicin de la variable. Por ejemplo, si se dispone de los datos del ingreso mensual en pesos de las personas que viven en la Delegacin Iztapalapa, se sabr que la media del ingreso mensual es de 2359 pesos. Este resultado deber leerse de la siguiente manera: el ingreso promedio mensual de las personas que residen en la Delegacin Iztapalapa es de 2359 pesos.

M dulo
iv

38

Vctor Aguirre y Begoa Artaloitia, Anlisis exploratorio de datos, op. cit., pp. 1-27.

Fase

de formacin especializada

65

Moda

Para los datos de tipo cuantitativo no agrupados es el valor o valores que ocurren con mayor frecuencia en un conjunto de mediciones. Y en el caso de los datos agrupados en intervalos, se llama clase modal a toda clase cuya frecuencia sea superior o igual a la de sus dos clases contiguas. Al igual que en la media y la mediana, y para las variables cuantitativas, la moda se debe interpretar en unidades de medicin de la variable. Asimismo, sta es la nica medida de tendencia central que se puede obtener para las variables cualitativas. Para encontrar este valor, se utilizar la tabla de frecuencias o algunas grficas y, mediante la observacin, se determinar el valor que ms se repite: a) Para las variables cualitativas basta observar la clase con mayor frecuencia absoluta (o frecuencia relativa). b) Tambin se obtiene observando la grfica de barras: la moda ser(n) aquella(s) clase(s) que tenga(n) la(s) barra(s) ms alta(s). Con la grfica de sectores, ser la clase que ocupe mayor rea en la grfica. Si este valor es nico, se dice que la distribucin de frecuencias es unimodal. Sin embargo, en la prctica se presentan casos en los que hay dos valores que se repiten ms que sus vecinos, y entonces la distribucin es bimodal. Si hay ms, decimos que es multimodal. O, en los casos en que no existe la moda, no hay ningn valor que ocurra con mayor frecuencia.

Medidas de variabilidad o dispersin Las medidas de variabilidad, tambin conocidas como de dispersin, cuantifican la variabilidad o dispersin de un conjunto de observaciones (datos), es decir, qu tanto se alejan los datos de las medidas de tendencia central como la media. Estas medidas de variabilidad sern pequeas si no hay diferencias muy grandes entre los valores observados, pero resultarn grandes en caso contrario.39 Entre las medidas de variabilidad ms utilizadas se encuentran la amplitud, la varianza y la desviacin estndar.

39

Ibidem, pp. 1-30 a 1-31.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iv

66

Amplitud

Es la ms simple de todas y tambin se conoce como rango. Esta medida descriptiva mide la distancia entre la observacin de mayor valor y la de menor valor, por lo que est en la misma unidad de medicin que la variable utilizada para su obtencin. Se saca mediante: R = Amplitud = valor mximo valor mnimo. Una de sus ventajas es que se obtiene de manera fcil; sin embargo, al no considerar todos los datos, es muy inestable e insensible al tamao de la muestra. Esta medida ayuda a comparar la dispersin entre variables que tengan la misma unidad de medicin.
Varianza

Es el promedio de los cuadrados de las desviaciones de las observaciones respecto a su media. Se calcula para la poblacin usando la siguiente frmula:

Pero si los datos son de una muestra en vez de ser de una poblacin, se aplica

Las unidades en que se expresa la varianza son el cuadrado de la unidades originales de la medicin, de aqu su dificultad para interpretarla. Adems, su valor se puede distorsionar por la presencia de valores extremos, muy pequeos o muy grandes.40
Desviacin estndar

M dulo
iv

Como ya se mencion, la varianza tiene por unidades el cuadrado de las unidades de los datos, por ello es comn usar su raz cuadrada positiva, a la que se denomina desviacin estndar. La finalidad es obtener una medida de dispersin con las mismas unidades que los datos. Su frmula es:

40

Ibidem, pp. 1-31 a 1-32.

Fase

de formacin especializada

67

s = s

si tenemos datos de la poblacin.

S = S 2 si tenemos datos de la muestra.


Esta medida de dispersin mide la variabilidad en trminos de la distancia entre cada dato y la media. La varianza y la desviacin estndar son estadsticas que se pueden distorsionar si hay datos atpicos, es decir, si las observaciones presentan datos muy pequeos o muy grandes.41
Ejemplo 14

Se analizarn algunas caractersticas de edad de 45 personas (mujeres y hombres) que presentaron una denuncia en la oficina central de la cdhdf (los datos se muestran en el cuadro 11).42 Las preguntas que se debern responder son: la edad de las mujeres, en promedio, es mayor que la de los hombres?, cul es edad modal del grupo de las mujeres y cul es la de los hombres?, la edad mediana de las mujeres es igual a la de los hombres?, cul de los dos grupos presenta mayor variabilidad?
Cuadro 11. Datos de edad de 45 mujeres y hombres que presentaron una denuncia en la oficina central de la cdhdf
Nmero 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Edad Mujeres 26 58 28 48 16 22 27 47 13 46 41 41 41 48 55 48 55 19 Hombres 59 24 59 23 58 47 37 93 61 26 23 36 77 52 38 22 44 28

41

42

Idem. Las 45 personas sern la poblacin con la que se harn las comparaciones de manera puntual. En caso de que se tratara de una muestra, se utilizaran las tcnicas de la estadstica inferencial.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iv

68

Nmero 19 20 21 22 23

Edad Mujeres 51 42 72 48 37 Hombres 33 29 25 34

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Para contestar los cuestionamientos anteriores, se deben obtener las medidas de tendencias central y la variabilidad de la variable Edad para cada grupo, es decir, para mujeres y para hombres. Una manera de realizarlo es mediante las herramientas de Anlisis de datos, que permiten procedimientos de estadstica descriptiva e inferencial de manera rpida y sencilla. En ocasiones, Excel no trae cargado este men. La incorporacin de este conjunto de herramientas se hace siguiendo estos pasos: 1) Desde el men Datos, hacer clic en el botn derecho del mouse. Aparecer una ventana con cuatro opciones, elegir Personalizar herramientas de acceso rpido. 2) En la ventana Opciones de Excel, seleccionar la opcin Complementos. 3) En el cuadro del centro, optar por Herramientas para anlisis. En la parte inferior de esta ventana, oprimir el botn Ir. Aparecer una ventana igual a la del tercer panel de la figura 19. Una vez all, seleccionar Herramientas para anlisis y oprimir Aceptar. 4) Con lo anterior se iniciar el proceso de instalacin. 5) Al finalizar, deber aparecer la opcin de Anlisis de datos en el men Datos. Tal como aparece en la parte derecha del panel final de la figura 19.

M dulo
iv

Figura 19. Procedimiento para instalar las herramientas para anlisis de Excel

Fase

de formacin especializada

69

1) Los datos del cuadro 11 debern estar en una hoja de Excel, tal como se ejemplifica en el primer panel de la figura 20. Observe que la primera columna slo indica el nmero de casos y, con este nmero, se sabe que hay 23 observaciones de mujeres y 22 de hombres. Adems, la informacin de la columna B es la edad de cada una de las mujeres que acudieron a la oficina central de la cdhdf a presentar una queja. Los datos de la columna C corresponden a la edad de los hombres. 2) Despus, del men Datos, se elige la opcin Anlisis de datos. Automticamente aparece una ventana, seleccionar Estadstica descriptiva y Aceptar. 3) Cuando aparezca una ventana como la del tercer panel de la figura 20, hay que ingresar los datos de entrada y salida. En la opcin y se seleccionan los datos Rango de entrada, se oprime el cono

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Cuando tenemos incorporada a Excel la opcin Anlisis de datos, el procedimiento para obtener las medidas descriptivas y responder a las preguntas planteadas al principio de este ejemplo es el siguiente:

iv

70

4)

5) 6)

7)

de las edades del grupo de las mujeres (celdas de B3 a B25). Se deja seleccionada la opcin Columnas, ya que los datos se encuentran de esta forma. Como no se eligi el ttulo de la columna, debemos dejar deseleccionada la opcin Rtulos en la primera fila (vase el tercer panel de la figura 20). Para este ejemplo es conveniente que los resultados aparezcan en esta hoja de trabajo, por ello, en Opciones de salida se selecciona . Con ayuda la opcin Rango de salida y se oprime el cono del mouse seleccione un conjunto de celdas. Finalmente, elija la opcin Resumen de estadsticas y Aceptar (vase el tercer panel de la figura 20). Automticamente aparece una tabla con el ttulo Columna 1, tal como se muestra en la parte derecha del tercer panel de la figura 20. Para obtener las estadsticas descriptivas de los hombres, deben repetirse todos los pasos anteriores, pero esta vez seleccionando las observaciones de este grupo. Finalmente, se incluyen los ttulos, la fuente de donde se obtuvieron los datos y slo se usarn las medidas descriptivas antes revisadas. La tabla final se muestra en el cuadro 12.43

Figura 20. Ejemplo de cmo obtener las medidas de descriptivas utilizando la opcin Anlisis de datos de las herramientas para anlisis de Excel

M dulo
iv
43

Para el resto de las medidas descriptivas que muestra Excel, vase Vctor Aguirre y Begoa Artaloitia, op. cit., pp. 1-24 a 1-35, y Haroldo Elorza Prez-Tejeda, op. cit., pp. 39-71.

Fase

de formacin especializada

71

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iv

72

Cuadro 12. Estadsticas descriptivas de edad de 45 mujeres y hombres que presentaron una denuncia en la oficina central de la cdhdf
Medida descriptiva Media Mediana Moda Desviacin estndar Varianza de la muestra Rango Mnimo Mximo Mujeres 40.39 42.00 48.00 14.85 220.52 59.00 13.00 72.00 Hombres 42.18 36.50 59.00 19.18 367.97 71.00 22.00 93.00

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

En respuesta a las preguntas planteadas, se observa que la edad promedio de las mujeres que presentaron una denuncia en la oficina central de la cdhdf es de 40.4 aos, mientras que, en promedio, los hombres tienen 42.2 aos; de lo que se concluye que las mujeres son ms jvenes que los hombres. Lo anterior se corrobora con la edad modal, pues la de los hombres es 11 aos mayor que la de las mujeres, con 59 y 48 aos, respectivamente. Sin embargo, si se observa el valor de la edad mediana de ambos grupos, se ve que es menor la de los hombres, es decir, mientras que la mitad de las mujeres tiene 42 aos, 50% de los hombres tiene 36.5 aos, es decir, casi seis aos menos. Esto se debe a que en ambos grupos de edad hay casos atpicos, personas muy jvenes y personas de la tercera edad. Entre las mujeres, la edad mnima es de 13 aos y la mxima de 72, lo que significa una amplitud de 59 aos. En el grupo de los hombres, la edad mnima es de 22 aos y la mxima de 93, con una amplitud de 71 aos. Por lo tanto, no se puede afirmar que, en general, las mujeres que presentaron una denuncia sean ms jvenes que los hombres, pero s se puede decir que, en promedio, las denunciantes son ms jvenes que los denunciantes. En cuanto a la variabilidad, en promedio, los hombres se alejan ms de su media, con un valor de la desviacin estndar de 19 aos; en cambio, las mujeres se alejan un poco menos (casi 15 aos). Por lo tanto, se concluye que entre los hombres que presentaron una denuncia en la oficina central de la cdhdf hay ms variabilidad en la edad que entre las mujeres. Si no se utiliza la opcin Anlisis de Datos, Excel tiene un conjunto de funciones estadsticas mediante la cuales se obtienen las medidas descriptivas de un conjunto de observaciones revisadas en este mdulo. El siguiente cuadro muestra la manera como se debe escribir la descripcin de cada una de ellas.

M dulo
iv

Fase

de formacin especializada

73

Cuadro 13. Descripcin de alguna funciones estadsticas que proporciona Excel


Medida descriptiva Media o promedio Mediana Mnimo Mximo Moda Desviacin estndar Varianza Descripcin de lo que realiza Excel Devuelve el promedio de los argumentos. Devuelve la mediana de los nmeros dados. Devuelve el valor mnimo de una lista de argumentos. Devuelve el valor mximo de una lista de argumentos. Devuelve el valor ms frecuente en un conjunto de datos. Calcula la desviacin estndar basada en una muestra. Calcula la varianza de una muestra. Funcin en Excel =promedio() =mediana() =min() =max() =moda() =desvest() =var()

Ejemplo 15

De todas las gestiones recibidas en la cdhdf durante 2011, se analizar la moda de la variable Sexo, es decir, se ver si hay ms gestiones levantadas por hombres, por mujeres, colectivas o de oficio. Lo anterior se responde usando una tabla de frecuencias para variables cualitativas o mediante una representacin grfica de barras o de sectores. Al realizar todos los pasos de los ejemplos 7, 8 y 9 usando la variable Sexo, se obtienen el cuadro y las grficas que se muestran a continuacin.
Cuadro 14. Frecuencia absoluta y relativa del sexo de las personas que realizaron una gestin en la cdhdf durante 2011
Sexo Colectiva De oficio Femenino Masculino Total Frecuencia absoluta (fi) 739 226 23064 23209 47238 Frecuencia relativa (pi) 1.6% 0.5% 48.8% 100% 49.1%

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Ntese que la clase o categora con mayor fi y pi es Masculino. Por lo tanto, la moda de la variable Sexo de las gestiones recibidas por la Comisin en 2011 es Masculino. Lo anterior se corrobora con la grfica de barras de la figura 21. A pesar de que la diferencia en la altura de las barras de las categoras Femenino y Masculino es muy pequea, la ms alta corresponde a los hombres. Adems, se observa que la categora De oficio se encuentra con menos frecuencia entre las gestiones realizadas en 2011 ante la Comisin. As pues, la categora modal de dichas gestiones es Masculino.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iv

74

Figura 21. Ejemplo de cmo obtener la categora modal de una variable cualitativa utilizando una grfica de barras
Distribucin porcentual del sexo de las personas que hicieron una gestin ante la CDHDF en 2011 48.8% 49.1%

60% 50% 40% 30% 20% 10% 0%

1.6% Colectiva

0.5% de Oficio Femenino Masculino

De la misma manera, en la grfica circular la mayor rea corresponde a la categora Masculino.


Figura 22. Ejemplo de cmo obtener la categora modal de una variable cualitativa utilizando una grfica circular
Distribucin porcentual del sexo de las personas que hicieron una gestin ante la CDHDF en 2011 1.6% 0.5%

Colectiva de Oficio 49.1% 48.8% Femenino Masculino

M dulo
iv

Fuente: elaboracin propia con base en la informacin proporcionada por la Fuente: elaboracin propia con base en proporcionada por la Subdireccin de Estadstica Subdireccin de Estadstica de la lainformacin CDHDF. de la cdhdf.

Ejemplo 16

Cul es la moda del tiempo de espera de 27 personas para levantar una denuncia ante la cdhdf de la Unidad Poniente? Para resolver este ejemplo se usarn los datos del ejemplo 12 y la funcin de Excel para obtener la moda. Los pasos son:

Fase

de formacin especializada

75

Capturar las observaciones en una hoja de Excel. Para obtener la moda, posicionar el cursor en una celda, por ejemplo la D3, escribir =moda(B3, B29) y oprimir Enter (vase la figura 23). El resultado obtenido es 3.7, por lo que el tiempo de espera con mayor frecuencia entre las 27 personas que levantaron una denuncia ante la cdhdf en 2011 es de 3.7 horas.
Figura 23. Ejemplo de cmo obtener la moda de una variable cuantitativa

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

iv

Mdulo v. Tablas de contingencia

78

Tablas de contingencia

Analizar la relacin entre dos o ms variables de tipo nominal u ordinal.

Permiten comparaciones para dos o ms subpoblaciones o subgrupos respecto de una variable de inters, con base en la informacin disponible.

Los datos que componen una tabla de contingencia son:

Los porcentajes correspondientes. Las frecuencias absolutas.

De la informacin mostrada en las tablas de contingencia se desprenden preguntas que se contestan en funcin de la variable de inters. Por ejemplo:

Hay alguna diferencia en las distribuciones de acuerdo con cada subgrupo? Qu magnitud tiene esa diferencia? A qu obedece esa diferencia?

Para leer (interpretar) una tabla de contingencia es necesario saber exactamente las variables de la informacin observada y las categoras que la componen.

M dulo
v
Fase
de formacin especializada

79

as tablas de contingencia analizan la relacin entre dos o ms variables de tipo nominal u ordinal.44 Por ejemplo, se examina la relacin entre la actitud de un grupo de personas hacia la igualdad entre los sexos, y para hacerlo se divide la poblacin en hombres y mujeres. De esa forma, se ver cmo se distribuyen las frecuencias entre quienes estn a favor de la igualdad o en contra, y cmo se comportan por diferencia de sexo. Las tablas de contingencia son tiles para analizar la informacin de variables cualitativas. Con ello se hacen comparaciones entre dos o ms subpoblaciones o subgrupos respecto de una variable de inters, con base en la informacin disponible. En el ejemplo del siguiente esquema se muestran dos variables de tipo nominal; la variable de inters es la Actitud de las personas a favor o en contra de la igualdad entre los sexos. Los subgrupos se determinan por las diferencias entre las dos categoras de la variable Sexo, es decir, mujeres u hombres.
v

44

Como se vio en la seccin Datos, variables y escalas de medicin en la estadstica, una variable nominal se refiere a datos que slo pueden ser clasificados en categoras, mientras que una variable ordinal se agrupa en categoras de acuerdo con el grado de la magnitud del atributo que tienen. Respecto al uso de tablas de contingencia y del anlisis a partir de stas en la inferencia estadstica, vase Juan Javier Snchez Carrin, Anlisis de tablas de contingencia, Centro de Investigaciones Sociolgicas, Siglo XXI, Madrid, 1992. Las variables de tipo nominal y ordinal se explicaron en el mdulo II.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

80

Cuadro 15. Ejemplo de una tabla de contingencia


Sexo Mujer Hombre Total por columna Fuente: elaboracin propia. Actitud (Igualdad entre los sexos) A favor w y w+y En contra x z x+z w+x y+z Gran total = w + x + y + z Total por fila

Los datos de una tabla de contingencia pueden ser las frecuencias absolutas de la variable, o bien los porcentajes correspondientes. Si se tienen las frecuencias absolutas, se pueden obtener: Los porcentajes de cada casilla; a estos valores se les llama frecuencias relativas conjuntas y se calculan dividiendo el valor de cada casilla entre el valor ubicado en el Gran total, para luego multiplicarlo por 100. Estas frecuencias relativas dan una idea de la frecuencia con que se presentan simultneamente ambos atributos en la poblacin o muestra (vase el cuadro 16). Los porcentajes de los totales por fila o por columna; a estos valores se les llama frecuencias relativas marginales. Se denominan as porque se presentan en los mrgenes de la tabla de contingencia para indicar la frecuencia con la que se presenta el atributo en la poblacin por s mismo. Para calcularlos, debemos dividir el valor total de categora entre el valor ubicado en el Gran total y, despus, se debe multiplicar por 100 (vase el cuadro 16).45
Cuadro 16. Ejemplo de cmo obtener las frecuencias relativas conjuntas y marginales en una tabla de contingencia
Sexo A favor Mujer Actitud (Igualdad entre los sexos) En contra Total por fila

w 100 x (w + x + y + z)

x x 100 (w + x + y + z)

( w + x) x 100 (w + x + y + z)

Hombre

y x100 (w + x + y + z)

z x 100 (w + x + y + z) ( x + z) x 100 (w + x + y + z)

( y + z) 100 x (w + x + y + z)
Gran total =

M dulo
v

Total por columna

(w + y) x 100 (w + x + y + z)
Fuente: elaboracin propia.

(w + x + y + z) 100 x (w + x + y + z)

45

Vctor Aguirre y Begoa Artaloitia, op. cit., pp. 1-37 a 1-38.

Fase

de formacin especializada

81

Las frecuencias relativas condicionales para cada variable se obtienen al dividir las frecuencias conjuntas entre la correspondiente frecuencia marginal (vanse los cuadros 16 y 17).46
Cuadro 17. Ejemplo de cmo obtener las frecuencias relativas condicionales para la variable Sexo
Sexo A favor Mujer Actitud (Igualdad entre los sexos) En contra Totales por fila

w x 100 ( w + x) y x 100 ( y + z)

x x 100 ( w + x) z x 100 ( y + z)

( w + x) x 100 = 100 ( w + x) ( y + z) x 100 = 100 ( y + z)


Gran Total=

Hombre

Total por columna

(w + y) ( x + z) x 100 x 100 ( w + x + y + z ) x 100 = 100 (w + x + y + z) (w + x + y + z) (w + x + y + z)

Fuente: elaboracin propia.

Cuadro 18. Ejemplo de cmo obtener las frecuencias relativas condicionales para la variable Actitud
Sexo A favor Mujer Actitud (igualdad entre los sexos) En contra Totales por fila

w x 100 (w + y) y x 100 (w + y) (w + y) x 100 = 100 (w + y)

x x 100 ( x + z) z x 100 ( x + z) ( x + z) x 100 = 100 ( x + z)

( w + x) x 100 (w + x + y + z) ( y + z) x 100 (w + x + y + z)
Gran Total=

Hombre

Totales por columna

(w + x + y + z) x 100 (w + x + y + z)

Fuente: elaboracin propia.

46

Idem.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

De la informacin mostrada en las tablas de contingencia, regularmente se formulan preguntas que pueden responderse en funcin de la variable de inters, como, hay alguna diferencia en las distribuciones de acuerdo con cada subgrupo?, qu tan grande es la diferencia?, a qu obedece esa diferencia?

82

Para leer (interpretar) de manera correcta una tabla de contingencia es necesario saber exactamente cules son las variables de la informacin que se observa y las categoras que la componen. En nuestro ejemplo, la variable Sexo se compone de dos categoras: Hombre y Mujer, y la variable Actitud tambin: A favor y En contra. Posteriormente, se observan los totales respecto de cada subgrupo de poblacin y se leen los resultados en funcin de la variable de inters, por ejemplo, qu porcentaje de los que estn a favor son hombres respecto de quienes estn a favor y son mujeres. Lo mismo se lleva a cabo para ambos grupos en la opcin En contra. A continuacin se muestra un ejemplo de cmo elaborar una tabla de contingencia en Excel utilizando una tabla dinmica.
Ejemplo 17

Para comparar la va de entrada de las gestiones recibidas en la cdhdf durante 2011 con el tipo de servicio de la gestin: de defensa y prevencin o de proteccin. Para saber si estas dos caractersticas de las gestiones se relacionan, se obtiene una tabla de contingencia con las variables de tipo nominal Va de entrada y Super_tipo, as como sus respectivas frecuencias relativas conjuntas, marginales y condicionales. Los pasos a seguir, utilizando el archivo de trabajo Tabla de servicios, son: 1) Seguir los siete primeros pasos del ejemplo 8 para obtener una tabla dinmica de la variable Va de entrada. sta ser la variable de los renglones o filas. Observe que tiene nueve categoras (vase primer panel de la figura 24). 2) La variable de las columnas ser Super_tipo, con dos categoras. Para colocarla en la tabla, se arrastra con el mouse a la ventana Rtulos de columna. Automticamente aparece una tabla de contingencia de nueve renglones (filas) y dos columnas (vase el segundo panel de la figura 24). 3) Para dar un formato adecuado, se escribe el ttulo de la tabla, de la variable columna, de la variable rengln y de la fuente de informacin. El resultado final se muestra en el cuadro 19.

M dulo
v
Fase
de formacin especializada

83

Figura 24. Ejemplo de cmo obtener una tabla de contingencia utilizando una tabla dinmica en Excel

Cuadro 19. Distribucin del tipo de va de entrada de la gestin y del tipo de servicio de las gestiones recibidas en la cdhdf durante 2011
Tipo de servicio Va de entrada de la gestin Correo Correo electrnico Escrito Fax Medios masivos de comunicacin Oficina de informacin pblica Personal Por actuacin de la cdhdf Telefnica Total Servicios de defensa y prevencin 13 1926 1702 7 11 3 13516 12 10866 28056 Servicios de proteccin 4 993 2479 40 188 1 5616 22 9839 19182 Total 17 2919 4181 47 199 4 19132 34 20705 47238

En el cuadro 19 se observa que la combinacin ms frecuente entre las gestiones recibidas en la Comisin son las de Servicios de defensa y prevencin con va de entrada personal, mientras que las menos frecuentes son las de Servicios de proteccin con va de entrada en alguna oficina de informacin pblica. Esto se sabe porque la primera combinacin tiene el mayor

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

84

nmero en la tabla de contingencia (13516 gestiones), y la segunda tiene el menor nmero (1 gestin). En los totales por columna se observa que la categora modal del tipo de servicio es Servicios de defensa y prevencin, puesto que presenta un nmero mayor de observaciones (28056 gestiones). Mientras que la categora modal de la Va de entrada es la Telefnica, con 20705 gestiones. Para obtener las frecuencias relativas conjuntas y las marginales los pasos son: 1) Al dar clic derecho en la celda Cuenta de Va_entrada aparecer un men como el que se muestra en el primer panel de la figura 25. Al seleccionar la opcin Configuracin de campo de valor aparecer un recuadro titulado Configuracin de campo de valor. En este ltimo, seleccione la pestaa Mostrar valores como y observe que en la ventana aparece la leyenda Normal (vase la figura 25). 2) Al dar clic en la flecha que est junto a Normal aparecer un men con diferentes opciones; seleccione % de total y oprima Aceptar. Esto conduce a la tabla de frecuencias relativas conjuntas y marginales que se muestra en el segundo panel de la figura 25. 3) Si le ponemos el ttulo a la tabla, a la variable Columna, a la variable Rengln y a la fuente de informacin, el resultado es el que se muestra en el cuadro 20.
Figura 25. Ejemplo de cmo obtener las frecuencias relativas conjuntas y las marginales en una tabla de contingencia utilizando una tabla dinmica en Excel

M dulo
v
Fase
de formacin especializada

85

Cuadro 20. Distribucin porcentual del tipo de va de entrada de la gestin y del tipo de servicio de las gestiones recibidas en la cdhdf durante 2011
Tipo de servicio Va de entrada de la gestin Correo Correo electrnico Escrito Fax Medios masivos de comunicacin Oficina de informacin pblica Personal Por actuacin de la cdhdf Telefnica Total Servicios de defensa y prevencin (%) 0.028 4.077 3.603 0.015 0.023 0.006 28.613 0.025 23.003 59.393 Servicios de proteccin (%) 0.008 2.102 5.248 0.085 0.398 0.002 11.889 0.047 20.829 40.607 Total (%) 0.036 6.179 8.851 0.099 0.421 0.008 40.501 0.072 43.831 100

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

De cada 100 gestiones recibidas en la Comisin, 29 fueron para atender Servicios de defensa y prevencin y la va de entrada fue personal, lo que la convierte en la mayor frecuencia relativa conjunta.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

Con las frecuencias relativas conjuntas y marginales se obtienen las mismas conclusiones que con las frecuencias absolutas, slo que los porcentajes permiten una interpretacin en trminos de 100% de las gestiones recibidas en 2011 en la cdhdf. Por ejemplo:

86

Las gestiones de Servicios de defensa y prevencin atendidas de manera telefnica equivalen a 23% del total de las gestiones recibidas en la Comisin durante 2011. Slo 0.002% de las gestiones fueron de Servicios de proteccin, las cuales ingresaron al sistema de la cdhdf mediante una oficina de informacin pblica. Asimismo, con las frecuencias relativas marginales, las gestiones se distribuyen en 100% en cada una de las categoras de cada variable (de la columna y del rengln), por ejemplo: Del total de gestiones recibidas, y sin tomar en cuenta la variable Tipo de servicio, la categora Telefnica fue la ms frecuente (44%); le sigue la Personal, ya que 4 de cada 10 gestiones recibidas entraron con esta modalidad. La va de entrada menos frecuente es la de Oficina de informacin pblica. Por su parte, sin diferenciar entre la va de entrada de las gestiones, poco ms de 59% del total de las gestiones recibidas en 2011 en la cdhdf son de Servicios de defensa y prevencin y el resto de Servicios de proteccin. Como se observa, con los resultados del cuadro 20 se obtienen las mismas conclusiones que con los resultados del cuadro 19. A pesar de que los resultados anteriores son tiles para conocer la distribucin de las gestiones, quiz el inters se centre en saber si el tipo de servicio vara relativamente con la va de entrada de las gestiones. Para averiguarlo se debe condicionar la variable Va de entrada respecto al Tipo de servicio. Para obtener esta tabla en Excel se siguen los tres pasos anteriores, pero en lugar de seleccionar % de total debemos escoger %de la fila (vase la figura 26); el resultado se muestra en el cuadro 21.
Figura 26. Ejemplo de cmo obtener la frecuencia relativa condicionada de la variable de la fila en una tabla de contingencia utilizando una tabla dinmica en Excel

M dulo
v
Fase
de formacin especializada

87

Cuadro 21. Distribucin porcentual del tipo de va de entrada de la gestin segn el tipo de servicio de las gestiones recibidas en la cdhdf durante 2011
Tipo de servicio Va de entrada de la gestin Correo Correo electrnico Escrito Fax Medios masivos de comunicacin Oficina de informacin pblica Personal Por actuacin de la cdhdf Telefnica Total Servicios de defensa y prevencin (%) 76.47 65.98 40.71 14.89 5.53 75.00 70.65 35.29 52.48 59.39 Servicios de proteccin (%) 23.53 34.02 59.29 85.11 94.47 25.00 29.35 64.71 47.52 40.61 Total (%) 100 100 100 100 100 100 100 100 100 100

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

El cuadro 21 debe leerse por renglones (filas), ya que en esa direccin va la suma de 100%. Por ejemplo, del total de gestiones recibidas en la cdhdf durante 2011 por correo, la mayora (77%) fueron de Servicios de defensa y prevencin; en cambio, de las gestiones recibidas va fax, poco ms de 85% fueron de Servicios de proteccin. Un dato que llama la atencin es que de cada 100 gestiones recibidas por medios masivos de comunicacin, 95 son de Servicios de proteccin. La informacin del cuadro 21 se puede transferir a una grfica de barras apiladas a 100% para una interpretacin ms sencilla. El procedimiento en Excel es el siguiente: 1) Seleccionar todas las celdas de la columna, incluidas las etiquetas de cada categora, excepto la categora de Total. 2) En el men Insertar se selecciona la opcin Barra.47 Aparecer un men, en el cual se elige la tercera opcin: Barra 100% apilada. Automticamente aparecer la grfica que se muestra en el segundo panel de la figura 27. 3) Para aadir el ttulo, la fuente de la cual se obtuvo la informacin y la etiqueta de los datos, hay que seguir del paso 2 al 4 del ejemplo 8. Puede suprimirse la gua de la serie de datos seleccionando y oprimiendo la tecla Suprimir. La grfica resultado es la que aparece al final de la figura 27.

47

La opcin Columna en este caso no es recomendable debido a que se tienen muchas categoras y con nombres extensos; es mejor usar una grfica de barras horizontales.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

88

Figura 27. Ejemplo de cmo obtener una grfica de barras horizontal apiladas a 100% en Excel

Distribucin porcentual del tipo de va de entrada de la gestin segn el tipo de servicio de las gestiones recibidas en la cdhdf durante el 2011 Telefnica Por actuacin de la CDHDF Personal Oficina de informacin pblica Medios masivos de comunicacin Fax Escrito E-mail Correo 0% 20% 40% 60% 80% 100%

Servicios de Defensa y Prevencin Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la CDHDF.

Servicios de Proteccin

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

M dulo
v

Desde la grfica anterior se puede concluir que, al parecer, hay cierta relacin entre la forma en que se reciben las gestiones en la cdhdf y el tipo de servicio. Si se agrupan los medios a los cuales las personas recurrieron, como correo, correo electrnico y personal, se observa que la mayora de las gestiones pertenece a la categora Servicios de defensa y prevencin. Pero si se toman las vas de entrada, Medios masivos de comunicacin, Por actuacin de la cdhdf y Fax, que pueden considerarse medios de comunicacin colectivos, los tipos de

Fase

de formacin especializada

89

gestin ms frecuentemente recibidos son Servicios de proteccin. Finalmente, no hay una tendencia clara en las vas de entrada Escrito y Telefnica, ya que las gestiones se reparten de manera muy similar entre los dos tipos de servicios. Para saber si el tipo de servicio vara respecto a la va de entrada, debe obtenerse la tabla de frecuencias relativas siguiendo los tres primeros pasos de la primera tabla de contingencia, pero debe optarse por % de columna en lugar de % del total (vase la figura 28). El cuadro resultante es el nmero 22.
Figura 28. Ejemplo de cmo obtener la frecuencia relativa condicionada de la variable de la columna en una tabla de contingencia utilizando una tabla dinmica en Excel

Cuadro 22. Distribucin porcentual del tipo de servicio de las gestiones segn la va de entrada de las gestiones recibidas en la cdhdf durante 2011
Tipo de servicio Va de entrada de la gestin Correo Correo electrnico Escrito Fax Medios masivos de comunicacin Oficina de informacin pblica Personal Por actuacin de la cdhdf Telefnica Total Servicios de defensa y prevencin (%) 0.05 6.86 6.07 0.02 0.04 0.01 48.18 0.04 38.73 100 Servicios de proteccin (%) 0.02 5.18 12.92 0.21 0.98 0.01 29.28 0.11 51.29 100 Total (%) 0.04 6.18 8.85 0.10 0.42 0.01 40.50 0.07 43.83 100

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

90

Como en el caso anterior, se obtiene la grfica de barras apilada a 100%. En este caso, la opcin son las barras verticales, porque es ms fcil interpretar los resultados. Los pasos para hacerlo en Excel son: 1) Seleccione todas las celdas de la columna, incluidas las etiquetas de cada categora, excepto la del Total. 2) En el men Insertar se selecciona Columna. Aparecer otro men, en el cual se debe escoger Columna 100% apilada. 3) Al igual que en la grfica anterior, se le da formato y el resultado es el que aparece al final de la figura 29.
Figura 29. Ejemplo de cmo obtener una grfica de barras vertical apiladas a 100% en Excel

100% 80% 60%

Distribucin porcentual del tipo de va de entrada de la gestin segn el tipo de servicio de las gestiones recibidas en la CDHDF durante el 2011
Telefnica Por actuacin de la CDHDF Personal Oficina de informacin pblica Medios masivos de comunicacin Fax Escrito E-mail Correo

M dulo
v

40% 20% 0%

Servicios de Defensa y Prevencin

Servicios de Proteccin

Fuente: elaboracin propia con en base en la informacin proporcionada por la Subdireccin de Fuente: elaboracin propia con base la informacin proporcionada por la Subdireccin de Estadstica Estadstica de la CDHDF. de la cdhdf.

Fase

de formacin especializada

91

La grfica anterior debe leerse por columnas, ya que en esa direccin se suma 100%. Con esta grfica se concluye que en ambos tipos de servicios analizados, las vas de entrada ms utilizadas son la Personal y la Telefnica.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

M dulo

92

Bibliografa
Aguirre, Vctor, y Begoa Artaloitia, Anlisis exploratorio de datos, en Vctor Aguirre et al., Fundamentos de probabilidad y estadstica, 2 ed., Mxico, Jit Press, 2007. ngel Gutirrez, Julio C., Estadstica general aplicada, Medelln, Fondo Editorial Universidad Eafit (col. Acadmica), 2007. Angulo Reyes, Yvn, Muestreo, en Haroldo Elorza Prez-Tejeda, Estadstica para las ciencias sociales del comportamiento y de la salud, 3 ed., Mxico, Cengage Learning, 2007. Asher, Jana, et al., Statistical Methods for Human Rights, Nueva York, Springer, 2007. Burgos Matamoros, Mylai, Fundamentos bsicos para la metodologa de la investigacin aplicada, en Programa de capacitacin y formacin profesional en derechos humanos, Mxico, Comisin de Derechos Humanos del Distrito Federal (serie Cuadernos de capacitacin para el spdh), 2011. Christensen, Howard B., Estadstica paso a paso, 3 ed., Mxico, Trillas, 2008. Elorza Prez-Tejeda, Haroldo, Estadstica para las ciencias sociales del comportamiento y de la salud, 3 ed., Mxico, Cengage Learning, 2007. Fernndez Durn, Juan, y Rubn Hernndez, Muestreo, en Vctor Aguirre et al., Fundamentos de probabilidad y estadstica, 2 ed., Mxico, Jit Press, 2007. Hopkins, Kenneth D., et al., Estadstica bsica para las ciencias sociales y del comportamiento, 3 ed., Mxico, Prentice Hall, 1997. Icart Isern, Mara Teresa, et al., Elaboracin y presentacin de un proyecto de investigacin y una tesina, Barcelona, Universitat de Barcelona, 2006. Jabine, Thomas, Human Rights and Statistics, Getting the Record Straight, Filadelfia, University of Pennsylvania Press, 1992. Martnez Gonzlez, Miguel A. y Jorkin de Irala Estvez, Procedimientos descriptivos, en Bioestadstica amigable, 2 ed., Madrid, Daz de Santos, 2006. Mega Morales, Paco, Ya s Excel, pero necesito ms, 2 ed., Madrid, Visin, 2007. Ross, Sheldon, Introduccin a la estadstica, Barcelona, Revert, 2007. Snchez Carrin, Juan Javier, Anlisis de tablas de contingencia, Centro de Investigaciones Sociolgicas, Siglo XXI, Madrid, 1992.

Fase

de formacin especializada

93

Schedler, Andreas, et al., The Self-restraining State, Power and Accountability in New Democracies, Boulder, Lynn Riener, 1999. Subdireccin de Estadstica de la marzo de 2011.
cdhdf,

Sistema Integral de Gestin de Informacin (Siigesii), Mxico,

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

94

Ejercicios
Ejercicio 1
Objetivo: repasar los conceptos ms importantes del curso. Instrucciones: relacione los conceptos de la primera columna con las definiciones de la segunda.
Concepto 1. Poblacin Definicin a) Es aquella en la que los valores de la variable se agrupan en categoras, las cuales permiten establecer una relacin de orden entre las categoras, de acuerdo con el grado de posesin del atributo que tienen. b) En este tipo de variable el cero indica la ausencia total de la cantidad a medir y no es un punto arbitrario de referencia. c) Es la que hace referencia a datos que slo pueden ser clasificados en categoras. No es posible establecer una relacin de orden entre ellas, solamente se puede decir si el elemento pertenece a la categora o no, o si tiene o no el atributo. d) Es la recopilacin y ordenamiento de los atributos (datos) referentes a los individuos de la poblacin objetivo. e) En este tipo de variables, adems de afirmar que un elemento posee ms o menos cantidad de variable que otro, tambin es posible determinar la magnitud de la diferencia entre dos elementos medidos. f) Conjunto de elementos delimitados en un espacio y tiempo determinados. Dentro de una investigacin, se define al especificar qu o cules elementos son de inters y qu caractersticas deben tener para formar parte del estudio. g) Es la entidad (persona, grupo, institucin, pas, etc.) sobre la cual se realizar el anlisis estadstico y que se desea estudiar para sacar conclusiones al respecto. La unidad de anlisis es la entidad que sintetiza e identifica la poblacin y en funcin de la cual se definir el tamao de la muestra. h) Es un proceso por el cual se atribuyen a la poblacin las caractersticas ms significativas obtenidas en la muestra. i) Es aquella que se toma como base para recoger la informacin que sirve de sustento para las mediciones estadsticas y que brindar insumos en forma de datos con los que se realizar el estudio de nuestra unidad de anlisis. j) Es un subconjunto de la poblacin. Debe contener un nmero determinado de elementos para ser representativa de la poblacin.

2. Muestra 3. Unidad de anlisis

4. Variable de escala nominal 5. Base de datos

6. Inferencia estadstica

7. Variable de tipo ordinal

8. Variable de escala de intervalo 9. Variable de escala de razn

10. Unidad de observacin

Respuesta 1

Respuesta 2

Respuesta 3

Respuesta 4

Respuesta 5

Respuesta 6

Respuesta 7

Respuesta 8

Respuesta 9

Respuesta 10

Instrucciones: para obtener lo que se pide en los siguientes ejercicios, utilice la tabla dinmica obtenida del archivo de Excel llamado Tabla de servicios con la cual se trabaj a lo largo del curso.

Fase

de formacin especializada

95

Ejercicio 2
Objetivo: obtener estadsticas descriptivas y representaciones grficas de variables cualitativas. 1) Para saber cul es la forma principal en la que se presentaron las gestiones en 2011 ante la cdhdf, es decir, cul es la principal va de entrada de ellas. Responda y obtenga: a) Qu tipo de variable es Via_entrada? b) Obtenga la tabla de frecuencia de la variable. c) Interprete los resultados. 2) Realice una grfica de sectores en la que se aprecie la proporcin de investigaciones recibidas en cada una de las sedes de la cdhdf. Para esto responda y obtenga: a) Qu tipo de variable es Nombre_unidad? b) Obtenga la tabla de frecuencias de la variable. c) Obtenga la grfica de sectores. No olvide poner el ttulo y fuente a la grfica. d) Interprete los resultados obtenidos. 3) Realice una grfica de barras para determinar la frecuencia absoluta del carcter de las gestiones realizadas durante 2001 ante la cdhdf. Para esto responda y obtenga: a) Qu tipo de variable es Caracter? b) Obtenga la tabla de frecuencias de la variable. c) Obtenga la grfica de barras. No olvide poner el ttulo y la fuente a la grfica. d) Interprete los resultados obtenidos.

Ejercicio 3
Objetivo: transformacin de una variable de intervalo en una variable ordinal. 1) Sin tomar en cuenta los casos con edad no especificada, es decir, casos con valor de 9999 y sin informacin, trasforme la variable Edad de cuantitativa de intervalo en cualitativa ordinal agrupando los valores en grupos quinquenales (cada cinco aos). Realice tambin la tabla de frecuencias y la grfica de barras de esta nueva variable. Interprete los resultados y no olvide poner el ttulo y la fuente de la grfica.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

96

Ejercicio 4
Objetivo: obtener estadsticas descriptivas y representaciones grficas de variables cuantitativas. 1) La siguiente tabla representa la frecuencia absoluta del tiempo en das, en el que fueron resueltas 157 de las gestiones presentadas ante la oficina central de la cdhdf en 2011. Complete la informacin de la tabla (pi, Fi, Pi y mi) y realice un histograma de frecuencias relativas. Interprete los resultados y no olvide poner el ttulo y la fuente de la grfica.
Cuadro 1. Distribucin del tiempo (en das) en que fueron resueltas las gestiones presentadas en la oficina central de la cdhdf en 2011
Intervalo 1 2 3 4 5 6 Total Lmite inferior (Linf) 0 10 20 30 40 50 Lmite superior (Lsup) 10 20 30 40 50 60 Frecuencia absoluta (fi) 5 20 40 45 38 9 157 Frecuencia absoluta acumulada (Fi) Frecuencia relativa (pi) Frecuencia relativa acumulada (Pi) Marcas de clase (mi)

Fuente: elaboracin propia con base en la informacin simulada.

2) Interesa conocer algunas caractersticas de la edad de las personas que presentaron su denuncia va correo electrnico y por escrito ante la Unidad Norte de la cdhdf; los datos se muestran en la tabla 2. Entre las preguntas que se quiere responder estn: cul es la edad promedio, modal y la edad mediana de ambos grupos?, cul de los dos grupos presenta mayor variabilidad? Interprete los resultados comparando los valores de ambos grupos.
Cuadro 2. Datos de la edad de las personas que presentaron una denuncia en la Unidad Norte de la cdhdf
Nmero 1 2 3 4 5 6 7 8 9 10 Edad de las personas que presentaron su queja va: Escrito 52 27 39 34 7 61 57 40 33 57 Correo-e 85 85 85 30 87 40 46 19

Fase

de formacin especializada

97

Cuadro 2. Datos de la edad de las personas que presentaron una denuncia en la Unidad Norte de la cdhdf (continuacin)
Nmero 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Edad de las personas que presentaron su queja va: Escrito 66 52 46 52 83 76 80 80 76 46 46 44 46 37 53 46 44 33 Correo-e

Fuente: elaboracin propia con base en la informacin proporcionada por la Subdireccin de Estadstica de la cdhdf.

Ejercicio 5
Objetivo: obtener e interpretar una tabla de contingencia. 1) Compare el sexo de las personas que iniciaron una gestin ante la cdhdf durante 2011 y diga si el tipo de servicio de la gestin es de Defensa y prevencin o de Proteccin. Para saber si hay relacin entre estas dos caractersticas de las gestiones, obtenga una tabla de contingencia con las variables Sexo y Super_tipo, con sus respectivas frecuencias relativas conjuntas, marginales y condicionales. Interprete los resultados y no olvide poner el ttulo y la fuente de la tabla.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

98

Autoevaluacin
1. Rama de las matemticas que se encarga de recopilar datos, describirlos y analizarlos para obtener conclusiones acerca de la poblacin objeto de estudio. a) Estadstica descriptiva. b) Estadstica. c) Estadstica inferencial. d) Estadstica experimental. 2. Cul(es) de los siguientes enunciados es (son) verdadero(s)? i. Las variables cualitativas slo pueden tener atributos de escalas nominales u ordinales. ii. Las variables cuantitativas slo pueden ser continuas. iii. Las variables cuantitativas slo pueden ser de escala o de intervalo. a) Slo iii. b) Slo i y ii. c) Slo i y iii. d) Slo ii y iii. 3. Para cada una de las siguientes variables, si su escala de medicin es nominal, coloque n; en caso de ser ordinal, una o; si es de intervalo, identifquelo con una i, y si es razn, con una r. i. Sexo. ii. Ingreso mensual. iii. Edad en aos cumplidos. iv. Fecha en la cual se levanta una queja. v. Tipo de servicio de la gestin. vi. Nmero de quejas gestionadas en un mes. vii. Tiempo que se tardan en registrar una queja. viii. Aos aprobados de escolaridad. xi. Identificador de la gestin. a) b) c) d)
i-N; ii-R; iii-I; iv-O; v-N; vi-R; vii-R; viii-I; ix-O. i-N; ii-R; iii-I; iv-R; v-N; vi-O; vii-I; viii-I; ix-N. i-N; ii-N; iii-N; iv-O; v-O; vi-R; vii-R; viii-I; ix-I. i-N; ii-R; iii-I; iv-N; v-N; vi-R; vii-O; viii-I; ix-O.

4. Cul(es) de los siguientes enunciados es (son) verdadero(s)? i. Poblacin es un conjunto de elementos delimitados en un espacio y tiempo determinados. ii. Todas las muestras son de tipo probabilsticas. iii. Todos los elementos de la muestra son tambin elementos de la poblacin. iv. La unidad de anlisis es la entidad que sintetiza e identifica la poblacin y en funcin de la cual se deber definir el tamao de la muestra.

Fase

de formacin especializada

99

a) Slo i, ii y iii. b) Slo ii, iii y iv. c) Slo iii y iv. d) Slo i, iii y iv. 5. Es la recopilacin y ordenamiento de los atributos (datos) referentes a los individuos de la poblacin objetivo. a) Poblacin. b) Base de datos. c) Muestra. d) Tabla dinmica. 6. Es un arreglo sistemtico que tiene como objetivo organizar y resumir la informacin de una variable ya sea cualitativa o cuantitativa. a) Tabla de frecuencias. b) Base de datos. c) Muestra. d) Intervalo de clase. 7. Cul(es) de los siguientes enunciados es (son) verdadero(s)? i. La moda siempre es nica. ii. La moda es una medida de tendencia central que puede ser obtenida tanto para variables de tipo cualitativo como cuantitativo. iii. La moda en una variable puede no existir. a) Slo iii. b) Slo i y ii. c) Slo i y iii. d) Slo ii y iii. 8. Cul(es) de los siguientes enunciados es (son) verdadero(s)? i. Las grficas de un conjunto de datos facilitan la comprensin y extraccin de conclusiones acerca del comportamiento de las variables. ii. Un histograma es un diagrama til para representar distribuciones de frecuencia cuya variable es continua y viene dada en intervalos o clases. iii. De las representaciones grficas ms usadas para las variables cualitativas son las grficas circulares y las grficas de barras. a) Slo i. b) Slo ii. c) Slo iii. d) i, ii y iii.

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

100

9. Las medidas de tendencia central ms utilizadas en la estadstica descriptiva son: a) Amplitud y desviacin estndar. b) Media, moda y mediana. c) Mximo y mnimo. d) Todas las anteriores 10. Sirve para analizar la relacin entre dos o ms variables de tipo nominal u ordinal a) Tabla de frecuencias. b) Media. c) Tabla de contingencia. d) Desviacin estndar.

Fase

de formacin especializada

101

Clave de respuestas 1 b 2 c 3 a 4 d 5 b 6 a 7 d 8 d 9 b 10 c

El

empleo de la estadstica aplicada a la investigacin en derechos humanos

Fase de formacin especializada. El empleo de la estadstica aplicada a la investigacin en derechos humanos, se termin de editar en octubre de 2012. Para su composicin se utilizaron los tipos Futura y Rotis Sans Serif.

En el marco del Programa de Derechos Humanos y Medio Ambiente y comprometida con la ecologa y el cuidado del planeta, la Comisin de Derechos Humanos del Distrito Federal edita este material en versin electrnica para reducir el consumo de recursos naturales, la generacin de residuos y los problemas de contaminacin.

Comisin de Derechos Humanos del Distrito Federal


Oficina sede
Av. Universidad 1449, col. Florida, pueblo de Axotla, del. lvaro Obregn, 01030 Mxico, D. F. Tel.: 5229 5600

Unidades desconcentradas
Norte Payta 632 col. Lindavista, 07300 Mxico, D. F. Tel.: 5229 5600, ext.: 1756 Sur Av. Prol. Div. del Norte 5662, Local B, Barrio San Marcos, del. Xochimilco, 16090 Mxico, D. F. Tel.: 1509 0267 Oriente Cuauhtmoc 6, 3er piso, esquina con Ermita, Barrio San Pablo, del. Iztapalapa, 09000 Mxico, D. F. Tels.: 5686 1540, 5686 1230 y 5686 2087

Centro de Consulta y Documentacin


Av. Universidad 1449, edificio B, planta baja, col. Florida, pueblo de Axotla, del. lvaro Obregn, 01030 Mxico, D. F. Tel.: 5229 5600, ext.: 1818

www.cdhdf.org.mx

www.cdhdf.org.mx

Вам также может понравиться