Вы находитесь на странице: 1из 8

UNIVERSIDAD CENTRAL DE ECUADOR NOMBRE: Maribel Hernndez. CURSO: sexto. FECHA: 09/09/2013.

BOX PLOTS Un diagrama de caja es una representacin pictrica de la distribucin de un conjunto de datos. Se utiliza para ilustrar una serie de caractersticas de la distribucin: los valores mnimo y ms, los cuartiles, el rango y el rango intercuartil. El diagrama de caja consiste en una lnea de nmero adecuada adyacente a la que se dibuja una caja rectangular extendindose desde la parte inferior para el cuartil superior, as que encierra el medio 50% de los datos. Dentro de esta caja se dibuja una lnea vertical para marcar la ubicacin de la mediana. Desde los extremos de la caja de lneas rectas, generalmente se llama bigotes, se dibujan paralelas a la lnea nmero extendiendo a los valores ms altos y ms bajos de la distribucin para ilustrar el intervalo de datos. Por lo tanto la gama y todos los tres cuartiles se ilustran en un diagrama entero.
Hi

Lo

Q1

Q2

Q3

La ilustracin entera se llama una caja y bigotes, o, como es comnmente conocida, una Trama de la caja. El diagrama de caja localiza las posiciones exactas de Lo (el valor ms bajo o mnimo del conjunto de datos), Q 1 (el cuartil inferior), Q2 (la mediana), Q3 (el cuartil superior) y Hi (el valor ms alto o mximo del conjunto de datos), en ese orden. Caja de dos o ms parcelas pueden extraerse el mismo diagrama para comparar las distribuciones. Considere estas parcelas de caja para las marcas obtenidas por el mismo conjunto de candidatos en tres diferentes pruebas con una marca mxima de 70. Qu informacin se puede deducir de las siguientes parcelas caja?

50

100

10

20

30

40

50

60

70

Test 1

Test 2 Test 3
Lo Q1 Q2 Q3 Hi
(Median)

Prueba 1: la mediana est ms cerca el cuartil inferior (Q 1). Esto demuestra que el candidatos dieron un rendimiento pobre. Las marcas en esta prueba estn en el rango de 15 a 57. El 25% ms bajo de la gama de las puntuaciones de 15 a 20; el 50% medio de las puntuaciones se sitan entre 20 y 50; el 25% de las partituras estn en el rango de 50 a 57. Prueba 2: La mediana est en medio de la trama de la caja y los bigotes son iguales en longitud. Esto demuestra que las marcas se distribuyen igualmente en ambos lados de la media. Tan una distribucin es simtrica, lo que indica que el 50% de los estudiantes obtuvo una marca ms alta que la mediana. Esto implica que el 50% restante de los estudiantes obtuvo una marca inferior a la mediana. Las marcas en esta gama de prueba de 10 a 60. El 25% ms bajo de la gama de las puntuaciones de 10 a 20; el 50% medio de las puntuaciones se sitan entre 20 y 50; el 25% de la gama de las puntuaciones de 50 a 60. Prueba 3: La mediana es ms estrecha que el cuartil superior (Q 3). Esto demuestra que el desempeo de los candidatos fue mejor. Tenga en cuenta tambin que el bigote inferior es ms larga que la superior barba. Esto indica que la gama del 25% de los candidatos es ms ampliamente difundida. Las marcas en esta prueba estn en el rango 5 a 57. El 25% ms bajo de la gama de las puntuaciones de 5 a 20; el 50% medio de las puntuaciones se sitan entre 20 y 50; el 25% de la gama de las puntuaciones de 50 a 57. .

Construir un diagrama de caja de un simple conjunto de datos


1. Para cada uno de los siguientes conjuntos de puntuaciones funcion el nmero

cinco Lo Resumen, Q1, Q2 (mediana) y Q3 Hi en ese orden e ilustrar la distribucin mediante un diagrama de caja. a) 20, 18, 17, 23, 19, 21. b) 11, 12, 13, 15, 7, 6, 5, 10, 14, 8, 9. c) 108, 108, 110, 101, 110, 111, 104, 104, 105, 107. d) 4, 5, 5, 1, 1, 2, 8, 8, 9, 9, 8, 7, 2. La siguiente tabla muestra la informacin de deducir de cada conjunto de datos mediante una hoja de clculo. (Resultados similares tambin pueden obtenerse por mtodos de lpiz y papel, pero pueden ser ligeramente diferentes).
a 17 23 18.25 19.5 20.75 b 5 15 7.5 10 12.5 c 101 111 104.25 107.5 109.5 d 1 9 2 5 8

Lo Hi Q1 Q2 = (median) Q3

a.

b.

c.

d.
0 1 2 3 4 5 6 7 8 9 10

Lo

Q1

Q2 Median

Q3

Hi

Construir un diagrama de caja de una curva de frecuencia acumulativa Ejemplo: La velocidad de los coches en km/h, viajando a lo largo de una carretera principal se registran en la tabla2 y la tabla de frecuencias acumuladas se registra en la tabla1.
Table 1 Speed km/h Less than 20 Less than 30 Less than 40 Less than 50 Less than 60 Less than 70 No. of cars (Cumulative frequency) 4 17 69 144 184 200 Table 2 Speed km/h 0 20 20 30 30 40 40 50 50 60 60 70 Total No. of cars (Frequency) 4 13 52 75 40 16 200

200 180

100%

No. of Cars (Cum Frequency)

140 120 100 80 60 40 20 0 0 10 20 30 Speed (km/h) 40 50 60 70

75% Q3

Median

50%

Lower Quartile

25% Q1

0%

Box plot
lowest value Q1 Q2 (median) Q3 highest value

10

20

30

40

50

60

70

La mediana y los cuartiles superiores e inferiores pueden calcularse utilizando las frmulas usuales
3(n +1) n +1 n +1 , y 2 4 4

respectivamente de la curva de frecuencia

acumulativa. Un mtodo alternativo es utilizar la escala percentil en el lado derecho del grfico, como se puede facilitar la construccin de la trama de la caja utilizando las proyecciones horizontales y verticales. Debe recordarse que en agrupar datos Q1, Q2 (la mediana) y Q 3 son necesariamente las estimaciones de las verdaderas estadsticas. Tasks: 1. En la siguiente tabla de frecuencia acumulativa muestra el peso en kilogramos de 75 chicos mayores. Dibujar la curva de frecuencia acumulativa y de l podr valorar: a) la mediana; b) el rango intercuartlico;

Percentile

160

Upper Quartile

c) el nmero de chicos de 69,5 kg o menos; d) el nmero de nios que pesen ms de 71,5 kg. Ilustrar la distribucin mediante un diagrama de caja
Weight(kg) (Upper Boundary ) 66 67 68 69 70 71 72 73 74 75 Cumulative Frequency 5 8 12 20 35 47 59 68 72 75

2. 140 alumnos sentaron dos exmenes en espaol. En la tabla de frecuencia muestra la distribucin de sus marcas.
Marks 0 10 11 - 20 21 30 31 40 41 50 51 60 61 70 71 80 81 90 91 - 100 First Examination Frequency 0 3 10 34 42 32 12 5 2 0 Second Examination Frequency 4 6 9 9 12 20 42 22 10 6

Construccin de tablas de frecuencia acumulativa y dibujar las curvas de frecuencia acumulativa para cada examen en el mismo grfico. a) Estimar las medianeras. b) Encontrar las gamas intercuartlico. c) Si la marca de pase para el primer examen fue 45, Cuntos alumnos pasan? d) Qu porcentaje de los alumnos fall este examen? e) Alumnos 78 si fallaron en el segundo examen, lo que fue la marca pase? f) Utilizar un diagrama de caja para comparar las dos distribuciones y comentar el nivel de dificultad de los exmenes y el rendimiento de los alumnos.

Solutions: 1.) y b): desde la curva de frecuencia acumulativa son las estimaciones de la mediana y el rango intercuartlico: La mediana: 70.3 El rango intercuartlico: 71,8 68,8 = 3 c) 28 alumnos d) 25 estudiantes e) el diagrama de caja se muestra debajo de la curva

Cumulative frequency

80 70 60 50 40 30 20 10

100%

75% Q3

50% Q2

25% Q1 0%
65 66 67 68 69 Weight (kg) 70 71 72 73 74 75

Box Plot

2. Tablas de frecuencias el acumulado son los siguientes: Median


Marks First Examination Frequency 0 3 10 34 42 32 12 5 2 0 Second Cumulative Examination Frequency Frequency 68.8 70.3 First 71.8 Second 66 4 10 0 4 6 20 3 10 9 30 13 19 9 40 47 28 12 50 89 40 20 60 121 60 42 70 133 102 22 80 138 124 10 90 140 134 6 100 140 140

Lo

Q1

Q2

Q3

Hi

75

0 10 11 - 20 21 30 31 40 41 50 51 60 61 70 71 80 81 90 91 - 100

Curvas de frecuencia acumulativa


Cumulative Frequency

140 120 100 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100

First exam

Second exam

140 120 100 80 60 40 20

Box Plots 0
0 10 20 30 40 50 60 70 80 90 100

Marks Q1 Q2 Q3 Q1 Q2 Q3

10

a) a partir de las curvas de frecuencia acumulativa las estimaciones de las medianas de las dos distribuciones son 45 y 63. 0 44 63 70 100 36 45 55 100 b) las gamas intercuartlico son 19 y 26. c) unos 70 estudiantes pasaron con una marca de 45 o ms. d) 50% fall el examen. e) la marca pase era 65 f) comparando los diagramas de dos caja vemos que en el primer examen 50% de los estudiantes tienen una marca en el rango de 36 a 55 y en el segundo examen 50% de los estudiantes tiene una marca en el rango de 44 a 70. El segundo examen aparentemente era ms fcil teniendo en cuenta tambin el hecho de que la marca promedio era 63, superior y 45.

Вам также может понравиться