Вы находитесь на странице: 1из 5

DIAGRAMA DE CAJAS O BOX PLOT Qu es y qu medidas se usan en su construccin?

Es un grfico representativo de las distribuciones de un conjunto de datos en cuya construccin se usan cinco medidas descriptivas de los mismos, a saber: mediana, primer cuartil, tercer cuartil, valor mximo y valor mnimo. Qu informacin muestra? Esta presentacin visual, asocia las cinco medidas que suelen trabajarse de forma individual. Presenta al mismo tiempo, informacin sobre la tendencia central, dispersin ysimetra de los datos de estudio. Adems, permite identificar con claridad y de forma individual, observaciones que se alejan de manera poco usual del resto de los datos. A estas observaciones se les conoce como valores atpicos. Por su facilidad de construccin e interpretacin, permite tambin comparar a la vez varios grupos de datos sin perder informacin ni saturarse de ella. Esto ha sido particularmente importante a la hora de escoger esta representacin para mostrar la opinin de los estudiantes respecto a la actuacin docente a travs de las diversas preguntas del instrumento utilizado. Partes del Boxplot: El nombre original del grfico introducido por Jhon Tukey en 1977 es Box and whisker plot, es decir, diagrama de caja y bigote. En efecto, el grfico consiste en un rectngulo (caja) de cuyos lados superiores e inferior se derivan respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes). La caja y los bigotes estn ubicados paralelos a un eje rotulado, que en este caso est en la escala del 1 al 5 e indica el puntaje obtenido en una pregunta segn la opinin de los estudiantes que llenaron el instrumento de opinin. Las partes del Boxplot se identifican como sigue:

1.-Lmite superior: Es el extremo superior del bigote. Las opiniones por encima de este lmite se consideran atpicas. Para ms detalles consultesobre la construccin de los lmites y los valores atpicos. 2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como mximo el 75% de las opiniones de los estudiantes. 3.-Mediana: Coincide con el segundo cuartil. Divide a la distribucin en dos partes iguales. De este modo, 50% de las observaciones estn por debajo de la mediana y 50% est por encima.

4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como mximo el 25% de las opiniones de los estudiantes 5.-Lmite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor se consideran atpicas. Para ms detalles consulte sobre la construccin de los lmites y los valores atpicos. 6.-Valores atpicos: Opiniones que estn apartadas del cuerpo principal de datos. Pueden representar efectos de causas extraas, opiniones extremas o en el caso de la tabulacin manual, errores de medicin o registro. Se colocan en la grfica con asteriscos (*) o puntos (.) segn se alejan menos o ms del conjunto de datos. Se utiliza un superndice numrico para indicar el nmero de veces que aparece ese dato como atpico. NOTA: Esta presentacin en lnea del Boxplot est en primera versin y aun en proceso de mejora. Se sealan los datos atpicos con una circunferencia (o) en el caso de ser nica la observacin. En caso contrario, usted slo ver un tringulo ($). Si esto sucede, debe remitirse al reporte numrico para verificar la cantidad de observaciones atpicas por pregunta. 7.-Media aritmtica: Es lo que tradicionalmente se conoce comopromedio. Originalmente no forma parte del boxplot, sin embargo, se consider su inclusin para dar una idea del puntaje general obtenido por pregunta. Actualmente se trabaja en la elaboracin deestadsticos ms representativos que la media aritmtica para describir el conjunto de datos. Cmo se interpreta? Tenga en cuenta las siguientes consideraciones a la hora de interpretar el boxplot: .-Mientras ms larga la caja y los bigotes, ms dispersa es la distribucin de datos. .-La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media aritmtica) puede variar, sin embargo, recuerde que la cantidad de elementos entre una y otra es aproximadamente la misma. Entre el lmite inferior y Q1 hay igual cantidad de opiniones que de Q1 a la mediana, de sta a Q3 y de Q3 al lmite superior. Se considera aproximado porque pudiera haber valores atpicos, en cuyo caso la cantidad de elementos se ve levemente modificada. .-La lnea que representa la mediana indica la simetra. Si est relativamente en el centro de la caja la distribucin es simtrica. Si por el contrario se acerca al primer o tercer cuartil, la distribucin pudiera ser sesgada a la derecha (asimtrica positiva) o sesgada a la izquierda (asimtrica negativa respectivamente. Esto suele suceder cuando las opiniones de los estudiantes tienden a concentrase ms hacia un punto de la escala. .-La mediana puede inclusive coincidir con los cuartiles o con los lmites de los bigotes. Esto sucede cuando se concentran muchos datos en un mismo punto, en este caso, cuando muchos estudiantes opinan igual en determinada pregunta. Pudiera ser este un caso particular de una distribucin sesgada o el caso de una distribucin muy homognea. .-Las opiniones emitidas como No aplica (N/A) cuando en realidad s aplica o las opiniones nulas (cuando el estudiante no opina en una pregunta), no son tomadas en cuenta para elaborar el boxplot de esa pregunta. Por esta razn encontrar que en ocasiones no hay igual nmero de opiniones para todas las preguntas. .-Debe estar atento al nmero de estudiantes que opina en cada pregunta. Lo que pareciera ser dispersin en los resultados, en ocasiones podra deberse a un tamao de muestra muy pequeo: pocos estudiantes opinaron. Debe ser cauteloso a la hora de interpretar. En estos casos se sugiere remitirse al reporte numrico.

.-En trminos comparativos, procure identificar aquellas preguntas cuyos boxplot parecen diferir del resto. Pudiera con esto encontrar fortalezas o debilidades en su actuacin segn la opinin de los estudiantes. Se observa una variabilidad muy grande en cuanto a las impresiones que los estudiantes tienen del profesor en los diferentes aspectos de su actuacin. Esto se concluye porque no existe una tendencia homognea en las respuestas por pregunta. Las opiniones son muy homogneas y positivas en la pregunta 5: Logra comunicarse efectivamente con el estudiante. Este aspecto resalta en la actuacin del docente y adems todos los estudiantes encuestados coinciden en ello. Tambin se considera muy positiva la impresin que los estudiantes tienen en cuanto a los aspectos que se refieren a las preguntas 2, 6, 9, 12 y 13; salvo un par de opiniones que difieren del resto en las preguntas 2 y 6, las respuestas son homogneas. Note que estas opiniones separadas son datos atpicos pues se alejan del cuerpo de datos. Note tambin que por el proceso de mejora que sufren los grficos presentados en lnea, debe remitirse al reporte numrico en la pregunta 2 para verificar el nmero de respuestas atpicas dado que el smbolo representativo por el momento es ($), mas no as en la 9 pues ya se coment que el smbolo () se refiere a slo un dato atpico y en este caso vale 2. Observe que segn la opinin de los estudiantes el aspecto de la pregunta 17: Realiza la entrega y revisin oportuna de los resultados de las evaluaciones revela el puntaje ms bajo respecto al resto de las pregunta, lo cual pudiera ser un aspecto a considerar por el docente dado que adems el 50% de los estudiantes le otorga el puntaje ms bajo. Note que aqu la mediana es 1, lo que indica que la mitad de las observaciones est all (no por debajo porque no hay valor ms bajo) Note que algunos boxplot no tienen bigotes. En estos casos, como por ejemplo en la pregunta 19, el lmite inferior coincide con el Q1 y el lmite superior coincide con el Q3. En esta pregunta se evidencia simetra y bastante variabilidad. El resto de las preguntas presentan alta variabilidad por lo que deben leerse cuidadosamente en funcin del punto donde se concentra la mayor cantidad de informacin, esto es, viendo la posicin de la mediana (vase Simetra). Esta alta variabilidad indica que la opinin de los estudiantes respecto a los planteamientos es bastante heterognea. Glosario Cuartiles: Son valores que dividen a la distribucin en cuatro partes iguales en cuanto a la cantidad de datos. As, tenemos que el Primer cuartil (Q1), es el valor por debajo del cual ocurre el 25% de las observaciones y el Tercer cuartil (Q3) es aquel por debajo del cual ocurre el 75% de las observaciones. Siguiendo en esta lnea, el Segundo cuartil (Q2) coincide con la mediana de la distribucin. Dispersin: Indica la variabilidad del conjunto de datos: cmo se distribuyen los datos de estudio. Una dispersin grande indica un conjunto de datos heterogneos e implica poca utilidad de una medida de tendencia central nicamente para describir la distribucin. Estadsticos: son valores representativos que proporcionan informacin sobre la serie en cuanto a su posicin en la escala de medicin, agrupamiento en torno a un valor, distribucin de los datos y concentracin en una regin entre otros. Los estadsticos proveen informacin sobre una muestra. Cuando se trabaja con toda la informacin (poblacin) se le denomina parmetro.

Mediana: Es medida de tendencia central. Es un dato de la distribucin que la divide en dos partes iguales de forma tal que por debajo y por encima de ella se encuentra como mximo el 50% de los datos de estudio. Por ejemplo, si las opiniones de cinco estudiantes (en puntaje del 1 al 5) fueron: 1-1-3-4-5, entonces 3 es la mediana; o si los puntajes fueron: 1-1-3-4-5-5, la mediana est entre 3 y 4 y la consideramos como 3,5. Media aritmtica o promedio: Es un estadstico de tendencia central. Representa una especia de punto de equilibrio para el conjunto de datos. Para calcularlo se emplean todos los datos de la distribucin por lo que tiene la desventaja de verse afectada por datos muy grandes o pequeos, lo que conlleva a que en ocasiones no sea representativa de la distribucin. Resulta de sumar todos los datos de la distribucin y dividirlos entre el total de datos. Simetra: Indica la forma del conjunto de datos, lo cual implica observar dnde se concentra la informacin. Para el estudio de la forma de una distribucin, tambin se usan los trminos sesgo o asimetra. Una distribucin puede ser: .-Simtrica: en este tipo de distribuciones la media, la moda y la mediana coinciden y los datos se distribuyen de igual forma a ambos lados de estas medidas. En el contexto, hay igual nmero de opiniones por encima que por debajo de la mediana.

.-Asimtrica positiva o sesgada a la derecha: los datos tienden a concentrarse hacia la parte inferior de la distribucin y se extienden ms hacia la derecha. La media suele ser mayor que la mediana en estos casos. En el contexto, las

opiniones se concentran en un puntaje menor y las de mayor puntaje estn ms dispersas.

.-Asimtrica

negativa o sesgada a la izquierda: los datos tienden a concentrarse hacia la parte superior de la distribucin y se extienden ms hacia la izquierda. La media suele ser menor que la mediana en estos casos. En el contexto, las opiniones se concentran en un puntaje mayor y las de menor puntaje estn ms dispersas.

Medida de Tendencia central: Estadstico que procura aportar informacin sobre la localizacin central de la distribucin de datos. Son: la media aritmtica, la moda, la mediana, la media geomtrica y la media armnica, y se emplean de acuerdo al objetivo del estudio y al tipo de dato que se tenga. Valor Mnimo o Mximo: Es el dato ms pequeo o ms grande de la distribucin, respectivamente. En este contexto, es el puntaje ms bajo o ms alto otorgado por los estudiantes en determinada pregunta.

Вам также может понравиться