Академический Документы
Профессиональный Документы
Культура Документы
Esta frase, atribuida al escritor Andrew Lang, resume de manera muy precisa la razn de ser de
la estadstica: predecir el comportamiento de un fenmeno, o simplemente sacar conclusiones
acerca de un conjunto de datos.
La persona que toma decisiones necesita analizar datos adecuadamente. No es suficiente
generar informacin, recopilarla u ordenarla. Los administradores deben adquirir la capacidad
de leer los datos que ofrece la estadstica, desde su lenguaje matemtico. As como un buen
mdico interpreta anlisis clnicos y cualquier cantidad de estudios (radiografas,
electrocardiogramas, tomografas, etc.) para realizar un diagnstico acertado y posteriormente
devolver la salud a su paciente, de la misma forma un gerente necesita interpretar la
informacin estadstica para tomar decisiones, planificar, ejercer control sobre las operaciones
o simplemente, conocer el estado de las cosas. Esto es a la vez una ciencia y un arte: todos
podemos aprender las guas tcnicas que a continuacin expondremos, pero cada uno de
nosotros puede desarrollar ms habilidad al explotar su curiosidad y con el tiempo, ser capaz
de ver cosas que los dems no ven. Es as como dos mdicos, que tienen delante de s los
mismos anlisis clnicos y estudios del mismo paciente, pueden llegar a conclusiones distintas.
La continua preparacin y la experiencia nos ayudarn a mejorar nuestra habilidad para
interpretar informacin estadstica.
Uno de los principios del modelo de gestin de la calidad desarrollado por la organizacin ISO
en su familia de normas de calidad 9000 (2008) pide realizar un enfoque basado en hechos
para la toma de decisin: Las decisiones eficaces se basan en el anlisis de los datos y la
informacin. Para la administracin adecuada de la calidad (una de las principales actividades
de los egresados de Ingeniera o Administracin) la toma de decisiones solo podra ser eficaz si
se tiene la capacidad de analizar datos. Nuestros procesos mentales pueden verse influenciados
por una cantidad muy amplia de variables psicolgicas, ambientales, emocionales, o
simplemente por la aleatoriedad que existe en el comportamiento de los procesos controlados
por el ingeniero o administrador. Solo el anlisis de datos concretos, bien organizados e
interpretados, nos permitir tomar decisiones acertadas.
Ventajas
Como medida descriptiva, la media aritmtica o promedio es quizs la medida de tendencia
central ms conocida y una de las ms simples de calcular. Muchas personas, sin necesidad de
Herramientas estadsticas para ingeniera
Poblacin B
4
8
8
7
8
7
= 7.00
Tabla 1. Datos de dos poblaciones para el clculo de las correspondientes medias aritmticas
En la poblacin A, la media aritmtica vale 7.5 y la poblacin B alcanza un promedio de 7.0, esto
debido a un nico dato diferente, el cual es notoriamente ms bajo que el resto: el nmero 4.
Imagina que damos un contexto escolar a estos nmeros, y los datos que tenemos son las
calificaciones de un par de alumnos: el primero de ellos (datos de A), podra acceder a una
calificacin de 8, bajo ciertos criterios de redondeo, mientras que el segundo alumno
(representado en la poblacin de datos B) no se mover ms all de 7. Una sola calificacin
marca una gran diferencia.
Lo mismo pasara si fuesen un par de vendedores y estuviramos comparando sus ventas de la
semana. O si estamos comparando dos motores basndonos en una serie sucesivas de pruebas
donde medimos los kilmetros recorridos por litro de combustible. Es justo o razonable
medirlos y compararlos basndonos en una medida como esta? Esa decisin o juicio solamente
puede hacerla el tomador de decisiones. La Estadstica ofrece un nmero que podra parecer
fro. Es responsabilidad de quien usa esta informacin conocer cmo se obtiene y valorar su
utilidad en funcin al conocimiento de sus bondades y deficiencias.
Otra medida de tendencia central muy utilizada es la mediana. Una vez que hemos aprendido a
calcularla, sabemos que este nmero representa un valor que esta al centro de la serie
ordenada de datos, es decir, colocados linealmente y ordenados de menor a mayor, la mediana
Herramientas estadsticas para ingeniera
Poblacin B
4
7
7
8
8
8
= 7.00
Mediana = 7.50
Como puede apreciarse, la tabla 2 nos muestra que la mediana en ambas poblaciones es igual a
7.50, es decir, bajo la visin que nos ofrece la mediana, ambas poblaciones son iguales. Esta
medida descriptiva discrimin la existencia de un dato atpico (el primer dato de la Poblacin B
con valor de 4). Para realmente afectar la mediana, necesitamos modificar sustancialmente la
poblacin B.
Desventajas
La mediana requiere de un proceso de clculo un tanto ms complicado respecto a la media
aritmtica: implica ordenar datos para luego buscar un valor determinado. Eso se complica si
tenemos una cantidad grande de datos, pero si consideramos que hoy en da existen
herramientas informticas de uso tan comn como una hoja de clculo que puede hacer el
trabajo por nosotros, esta dificultad se ve superada rpidamente.
Media aritmtica
Mediana
Figura 1: Forma que tomara una distribucin simtrica de datos, donde media aritmtica y mediana coinciden en el mismo valor.
Por otro lado, cuando existe una diferencia entre los valores de la media aritmtica y la
mediana, podramos concluir que existe alguna clase de asimetra en la forma como se
distribuyen los datos, y por lo tanto se presentar un sesgo, el cual puede identificarse
analizando comparativamente ambas medidas de tendencia central.
En la poblacin B de la tabla nmero 2, podemos apreciar que el promedio (o media aritmtica)
de los datos adquiere un valor de 7.00 mientras que la mediana es de 7.50, y esto ocurre porque
existe un dato atpico de bajo valor, representado por el nmero 4. El sesgo entonces lo
encontramos hacia los valores bajos de la distribucin, quienes jalan el promedio mas no la
mediana. Grficamente, podemos ver este sesgo hacia la izquierda en la figura 2. Recordemos
que en una escala, los valores de menor valor estn a la izquierda.
Figura 2: el sesgo (izquierda) desplaza la media aritmtica hacia ese mismo lado, con respecto a la mediana.
Figura 3: los valores en el extremo superior de la escala provocan un sesgo que atrae el promedio hacia la derecha con respecto a la mediana.
Medidas de dispersin
Dentro de este grupo de medidas, tenemos el rango, la varianza y la desviacin estndar. Al
igual que las medidas de tendencia central, podemos calcular las medidas de dispersin tanto
para una muestra como para una poblacin. Recientemente has aprendido a calcularlas y ahora
aprenderemos un poco acerca de cmo interpretarlas.
Las medidas de dispersin, en general, te indican qu tan diferentes son los datos entre s.
Como su nombre lo indica, estas medidas analizan qu tan dispersos estn los datos unos
respecto de otros, o cada uno de los datos con respecto a la medida que marca la tendencia
central. Porque para el administrador o ingeniero que toma decisiones, los datos que estn ms
dispersos proporcionan una idea o nocin distinta respecto a los datos que estn distribuidos de
forma compacta. Veamos como funciona esto.
La primera medida de dispersin que analizaremos, es el rango. Para calcularlo, tuvimos que
calcular la diferencia entre el dato ms grande y el dato ms pequeo. Con los datos empleados
previamente, calculamos esta medida y resumimos los datos en la siguiente tabla.
Poblacin A
7
7
7
8
8
8
= 7.50
Mediana = 7.50
Rango = 1
Varianza = 0.25
Desviacin Estndar = 0.5
Poblacin B
4
7
7
8
8
8
= 7.00
Mediana = 7.50
Rango = 4
Varianza = 2.0
Desviacin Estndar = 1.41
Ventajas
El rango es sumamente fcil de calcular, no es ms que la diferencia entre dos cantidades, eso
nos ofrece una medida de dispersin sencilla y fcil de interpretar, ya que es la diferencia que
existe entre el valor ms alto y el ms bajo. Por ejemplo, para la poblacin A, el rango es la resta
de 8 7 = 1.
Desventajas
El rango, al igual que el promedio, se ve afectado por los datos atpicos. En el caso de nuestro
ejemplo en la Tabla 3, la poblacin B ofrece un rango ms grande, debido al nico dato atpico
en la serie: R = 8 4 = 4. Fuera de eso, ambas poblaciones son casi idnticas.
Ventajas
Como habrs podido observar cuando aprendiste a calcular la varianza y la desviacin estndar,
estas medidas descriptivas estn fuertemente vinculadas, solamente las diferencia un operador
adicional: la raz cuadrada aplicada a la varianza para obtener la desviacin estndar. Qu
beneficio tiene esto? En primer lugar, las unidades de referencia que acompaan o dan
contexto a los datos vuelven a su normalidad por medio de esa raz cuadrada, es decir, si en la
varianza tenamos pesos o dlares cuadrados o litros cuadrados, la raz cuadrada aplicada
para la obtencin de la desviacin estndar nos arroja de vuelta pesos, dlares o litros con una
potencia 1 (uno), unidades que tienen apego a nuestra realidad y pueden interpretarse.
Otra ventaja de la desviacin estndar es que no necesita de otra medida de este tipo para
darnos significado, es decir, no siempre es necesario tener dos grupos de datos distintos, con
dos desviaciones estndar, para darles significado a su variabilidad. Por s sola, la desviacin
estndar nos puede dar informacin relevante acerca de la variabilidad o dispersin de un
conjunto de datos, eso la convierte en la medida de dispersin por excelencia en la Estadstica,
empleada en el anlisis de datos, en la inferencia estadstica y en distribuciones de probabilidad.
Por ejemplo, la regla emprica nos ayuda a conocer la dispersin de un conjunto de datos,
conociendo nicamente su media aritmtica y la desviacin estndar.
Desventajas
Comparativamente hablando, la desviacin estndar es la medida de dispersin que ms
operaciones matemticas nos requiere, al menos entre las medidas que hemos analizado en
este recurso. Esta desventaja es relativa, considerando que las calculadoras cientficas y las
hojas de clculo nos permiten obtener estos valores fcilmente.
Histograma
El histograma es un mtodo grfico empleado para analizar variables cuantitativas continuas,
principalmente. Su interpretacin bsica nos debera llevar a analizar cmo los datos se
concentran, distribuyen o dispersan.
Por medio de este grfico, el analista puede identificar la morfologa de la distribucin de los
datos: ver como se distribuyen a lo largo de la escala del eje horizontal, la cual cuantifica la
variable estudiada. Con un solo vistazo, la persona puede identificar, entre otras cosas:
la dispersin de los datos (desde dnde hasta dnde se distribuyen, dentro de la escala
de la variable).
En todo anlisis de este tipo, siempre es bueno pensar que la grfica no existe por s misma: es
la representacin grfica de una situacin real, existente dentro de un contexto de negocios,
laboral o personal. Por eso, si para hacer la grfica tuvimos que conservar nicamente la
informacin cuantitativa, objetiva, que nos ofrece la realidad, y desechamos lo subjetivo,
deberamos devolver el contexto subjetivo a la grfica, durante nuestro anlisis, para entender
el fenmeno que estamos analizando, pero teniendo cuidado de que el aporte cualitativo que
hagamos sea consecuencia del anlisis cuantitativo de la grfica, de lo contrario, la utilidad de la
herramienta se pierde.
A continuacin, presentamos algunos ejemplos de histogramas con sus correspondientes
anlisis.
Ejemplo 1
En la siguiente grfica, puede apreciarse la produccin que ha tenido un aserradero durante un
periodo de 30 das.
FRECUENCIA
6
5
5
2
1
0
8000-8247
8248-8495
8496-8743
INTERVALOS
8744-8991
8992-9239
En este histograma, podemos ver que la distribucin tiene una forma asimtrica, es decir, los
datos se acumulan ms a la izquierda de la grfica, dnde se ubican los valores bajos,
particularmente en las dos primeras categoras o clases. Rpidamente podemos ver que la
moda (barra ms alta) est en la primera clase, donde se producen de 8,000 a 8,247 pies
Herramientas estadsticas para ingeniera
10
Frecuencia
200
150
100
50
0
18-22
23-27
28-32
33-37
38-42
43-47
48-52
53-57
58-62
63-67
Edad
11
En este histograma podemos apreciar inmediatamente que las edades oscilan entre los 18 hasta
los 67 aos, perfectamente entendible ya que es la edad productiva de una persona. Lo
interesante en esta distribucin es que pareciera que los jvenes tienen preponderancia en la
empresa, y gradualmente disminuye la presencia de adultos conforme aumentan en edad, es
decir, conforme incrementa la edad del trabajador, disminuye su presencia en la empresa, lo
cual se nota en el escalonamiento que se aprecia en el histograma conforme pasamos de una
clase a otra, de izquierda a derecha en la grfica. Esto quizs es natural a toda organizacin, ya
que sus trabajadores se van retirando poco a poco, y son reemplazados por jvenes. Algo que
tambin llama la atencin, es que el grupo de personas ms jvenes (de 18 a 22 aos) tienen un
frecuencia pequea que rompe con el escalonamiento antes mencionado. Para el analista, sera
algo interesante para investigar o analizar con mayor profundidad, tal vez consiguiendo datos
de otro tipo, de otras fuentes.
Analizando mejor la grfica, vemos que la moda se encuentra en la categora de 23 a 27 aos, y
a partir de ah disminuye gradualmente la distribucin, que obviamente es asimtrica,
acumulando la mayora de los datos (trabajadores) entre los 23 y los 42 aos, con un sesgo
hacia la derecha, donde se localizan los valores ms altos, pero menos frecuentes tambin.
Intentando devolver contexto a este histograma, quienes conocen este tema podran intentar
responder preguntas como las siguientes:
Referencias bibliogrficas
David M. Levine, Mark L. Berenson, Timothy C. Krehbiel (2006). Estadstica para administracin.
Pearson Educacin
12