Вы находитесь на странице: 1из 30

INTRODUCCIÓN

Desde los conocimientos de la civilización han existidos formas sencillas de


estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en
piedras, rocas, palos de madera y paredes de cuevas para contar el número de
personas, animales o ciertas cosas. Hacia el año 3,000 A. C. los babilonios
usaban pequeñas tablillas de arcillas para recopilar datos tabulados sobre la
producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los
egipcios analizaban los datos de la población y la renta del país mucho antes de
construir las pirámides en el siglo XXXI A. C.

En 1662 apareció el primer estudio estadístico notable de población, titulado


Observations on the London Bills of Mortality.

El desarrollo de la Estadística se fundamenta científicamente a partir de los años


30 a raíz de los problemas planteados en la sociedad industrial, por el desarrollo
de otras ramas de las Matemáticas y de otros campos como la Biología, Medicina,
Informática.

Diversos vocablos que se citan como antecedente del término estadística:

STATUS: (Latín) situación, posición o estado

STATERA: (Griego) Balanza, ya que la estadística se mide o se pes

STAAT: (Alemán) Estado como expresión de unidad política superior

Estadística se ocupa de reunir, organizar y analizar datos numéricos y que ayuda


a resolver problemas como el diseño de experimentos y la toma de decisiones.

En nuestros días, la estadística se ha convertido en un método efectivo para


describir con exactitud los valores de datos económicos, políticos, sociales,
psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y
analizar dichos datos.

El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos,
sino sobre todo en el proceso de “interpretación” de esa información. El desarrollo
de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilísticas; los resultados de éstas se
pueden utilizar para analizar datos estadísticos. La probabilidad es útil para
comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadístico.

TABLA DE CONTENIDO
ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

En todo estudio o investigación estadística se requiere medir las características en


los individuos, objetos o cosas de interés; de esta manera se obtiene una
colección de valores de la variable correspondiente; es decir se genera un
conjunto de datos; ya sea una población estadística o una muestra estadística.

Es indispensable y útil disponer con métodos de organización y presentación de


los datos recopilados que permitan conocer cómo se reparten éstos, entre los
posibles valores que puede tomar la variable de interés. Las representaciones
tabulares y gráficas, brindan la oportunidad de procesar la información recopilada,
aún más, se pueden convertir en instrumentos útiles, puesto que pueden expresar
o transmitir, de manera rápida y sencilla, las tendencias o regularidades que
manifiesten los datos.

Las tablas estadísticas permiten resumir la información, en la primera columna


aparece la variable de estudio y los valores que pueda tomar, en la o las
siguientes columnas aparecen las frecuencias absolutas u otras que el estudio
requiera.

ORGANIZACIÓN DE LOS DATOS

Aquí se utilizan mucho las tablas estadísticas.

TABLAS

Las tablas estadísticas permiten resumir la información, en la primera columna


aparece la variable de estudio y los valores que pueda tomar, en la o las
siguientes columnas aparecen las frecuencias absolutas u otras que el estudio
requiera.

PARTES PRINCIPALES DE UN CUADRO ESTADÍSTICO

1.- Número De Cuadro Estadístico

Es el código o elemento de identificación que permite ubicar el cuadro en el


interior de un documento. El número se anota junto con la palabra “CUADRO”, por
ejemplo:

Cuadro Nº 1
2.- Título

Es la descripción resumida del contenido del cuadro. La redacción del título debe
ser breve, claro y completo, de modo que se puedan deducir sin ambigüedad qué
tipo de información contiene el cuadro.

QUE.- Qué hay en el cuadro, Se refiere al hecho observado o característica


principal

DONDE.- se refiere al geográfico o Institución al que corresponde la información.

COMO.- Como están ordenados o clasificados los datos en el cuadro. La variable


ubicada en la fila se identifica con preposición “por” y la que está en la columna se
antepone “según”

CUANDO.-A qué momento o periodo de tiempo está, referida la información;


puede ser un periodo de varios años, meses, semanas o a un momento
específico.

EJEMPLO DE TÍTULO 1:

QUE.- Población: edades, peso etc.; de los alumnos del Instituto “Pablo Casals”;
Nacimientos vivos; alumnos matriculados; producción de maíz, etc.

DONDE.- Del departamento de La Libertad; del Instituto “Pablo Casals”; etc.

COMO.- por nivel de Hemoglobina según especialidad; por carreras del Instituto
“Pablo Casals”; según programas; por distritos según sectores.

Encabezamiento: Por mes, por sexo, por provincia, por causa, por producto, etc.

Columna matriz: Según corregimiento, según provincia, según causa, según


producto, etc.

CUANDO.-12 de julio del 2014; Diciembre del 2014; ejercicio 2015, periodo 2014-
2015; etc.

3.- Concepto o Encabezamiento

Son las descripciones de las filas y columnas de un cuadro estadístico: el


encabezamiento se ubica en la parte superior del cuerpo del cuadro. Indica las
variables y sus categorías o valores, también puede indicar un periodo de tiempo.

Ejemplo: EDAD DE LOS ALUMNOS DEL INSTITUTO “PABLO CASALS”


SEGÚN FRECUENCIAS, DEL 10 DE DICIEMBRE 2014
Ordenamiento de columna matriz y encabezado

- En la columna matriz se colocan las características con más niveles y


subniveles; mientras que se prefiere colocar en el encabezado las que tienen
menos niveles. No es recomendable colocar más de tres niveles de clasificación
en los encabezados.

- Se prefiere una columna matriz larga y un encabezado corto.

- Los nombres de las características más extensas se colocan en la columna


matriz.

- El título o etiqueta se escribe con letras mayúsculas y las subclasificaciones en


minúscula y sólo la primera letra lleva mayúscula; estos nombres se escriben en
singular, en pocas excepciones se usa el plural. Debe evitarse las repeticiones de
palabras.

- Cuando los datos del cuadro se refieren al sexo de las personas, se prefiere
usar el término “AMBOS SEXOS” en lugar de “TOTAL”

4.- Cuerpo Del Cuadro

Es el contenido numérico del cuadro, es la parte donde se colocan los datos


correspondientes a las características o variables indicados en el encabezamiento
o en los conceptos, es decir, presenta la distribución de los elementos según la
clasificación en categorías de las variables. Es recomendable colocar las cifras de
los grandes totales en forma horizontal y en la parte superior del cuerpo del
cuadro.

5.- Nota De Pie o Llamadas

Se usa para aclarar algunos términos o siglas, y también para indicar que
elementos están o no incluidos en algunos de los conceptos del cuadro.

6.- Fuente

Es la indicación al pie del cuadro, que sirve para nombrar la publicación, entidad,
estudio o fuente de donde se obtuvieron los datos utilizados para construir el
cuadro, la identificación de la fuente permite, si fuera el caso, comprobar la
información o para obtener información complementaria. Hay dos tipos de fuentes:

- Primaria, cuando se obtiene directamente de la unidad de análisis o cuando se


recurre a los propios formularios de una encuesta
- Secundarias, cuando se recurre a documentos, boletines o cuadros estadísticos
publicados.

7.- Nota De Unidad De Medida

Se escribe debajo del título original, se usa cuando se abrevia la escritura de las
cifras y para expresar en que unidades está expresada la variable. Por ejemplo,
millones de nuevos soles, miles de personas, miles de dólares, Kilos, etc.

8.- Elaboración

Es una indicación que se coloca debajo de la fuente y sirve para mencionar el


responsable que utilizando datos originales o de la fuente elaboró el cuadro
estadístico final: indica la responsabilidad de la publicación del cuadro. A veces
resulta útil indicar la fecha de la elaboración.

Ejrmplo:
Vamos a considerar por separado los caso de datos cualitativos y cuantitativos.

ORGANIZACIÓN DE LOS DATOS CUALITATIVOS

En este caso la agrupación de los datos es muy sencilla y se hace de acuerdo a


las modalidades que presente la variable en estudio. Mediante un conteo se
determina el número de datos (también llamado frecuencia) correspondiente a las
diferentes categorías de la variable. Este procedimiento es válido para cualquier
cantidad de datos.

 Categorías de la variable: modalidades de la variable.


 Frecuencia absoluta ("f"): nº de veces que aparece una modalidad de una
variable.
 Frecuencia relativa ("fr") o proporción ("p"): razón entre la frecuencia
absoluta y el nº de casos total.

 Porcentaje ("P"): tanto por ciento correspondiente a una modalidad de la


variable.

Ejemplo: Tabla correspondiente a la variable sexo.


ORGANIZACIÓN DE LOS DATOS CUANTITATIVOS

Para organizar y agrupar datos de tipo cuantitativo discretos o continuos, se utiliza


un procedimiento similar, pero más laborioso, al utilizado con los datos
cualitativos.

Distribución de frecuencias: intervalos y sus correspondientes frecuencias.

 Intervalo: nº de valores numéricos de la variable englobados en una clase.


 Intervalo simple o datos sin agrupar: una unidad de medida en cada
intervalo.
 Intervalo compuesto o datos agrupados: dos o más unidades de medida
en cada intervalo.
 Límites:
 Límites aparentes: puntuaciones del instrumento de medida.
 Límites reales: límite real superior ("l.r.s")
 Límite real inferior ( "l.r.i.").

 Punto medio del intervalo (Xm):

 Amplitud del intervalo ("i"): magnitud del segmento de valores que


incluye.

Ejemplo: Distribución de frecuencias de intervalos simples y compuestos:

Distribución de frecuencias de intervalos simples:


Distribución de frecuencias de intervalos compuestos:
DISTRIBUCIONES DE FRECUENCIAS.

Las primeras tareas de la Estadística Descriptiva son ordenar, clasificar y


resumir los datos obtenidos en alguna investigación, para ello se concentran en
tablas de frecuencia que pueden ser de los siguientes tipos:

a) Absoluta.

b) Relativa.

c) Acumulada.

d) Relativa acumulada.

Con el análisis de las distribuciones de frecuencias se puede determinar la


tendencia de la variable de estudio. Recordemos que la variable de estudio
puede ser nominal, ordinal, discreta o continua, y que esta característica
incidirá las construcciones de tablas estadísticas.

Tipos de frecuencias.

Llamaremos Frecuencia Absoluta al número de veces que se repite un mismo


dato o valor de una variable. Se simboliza con fa.

La Frecuencia relativa es la proporción de elementos que pertenecen a una


categoría o valor de una variable y se obtiene dividiendo su frecuencia absoluta
entre el número total de elementos y se representa con el símbolo fr. Se puede
expresar en fracción, con valores decimales o en porcentajes.

La frecuencia acumulada de un valor de una variable, es la que se obtiene


sumando la frecuencia absoluta

Correspondiente a este valor, con las frecuencias absolutas de todos los


valores anteriores a él. Se simboliza con fac.

Se Denomina frecuencia relativa acumulada a un valor de una variable, a la


que se obtiene sumando la frecuencia relativa correspondiente a este valor,
con las frecuencias relativas de todos los valores anteriores a él. Se simboliza
con frac. Se puede expresar en fracción, en forma decimal o en porcentaje.

Ejemplo: La siguiente tabla estadística contiene los diferentes tipos de


distribuciones de frecuencias.
Número de computadoras por familia en un fraccionamiento perteneciente al
municipio de San Luis Río Colorado.

REPRESENTACIÓN DE LOS DATOS

En los análisis estadísticos, es frecuente utilizar representaciones visuales


complementarias de las tablas que resumen los datos de estudio. Con estas
representaciones, adaptadas en cada caso a la finalidad informativa que se
persigue, se transmiten los resultados de los análisis de forma rápida, directa y
comprensible para un conjunto amplio de personas.

Cuando se muestran los datos estadísticos a través de representaciones gráficas,


se ha de adaptar el contenido a la información visual que se pretende transmitir.
Para ello, se barajan múltiples formas de representación.

REPRESENTACIÓN GRÁFICA DE LOS DATOS CUALITATIVOS

DIAGRAMA DE PASTEL:

Las gráficas circulares, también llamados gráficos de pastel, gráficos de torta o


gráficas de 360 grados, son recursos estadísticos que se utilizan para representar
porcentajes y proporciones. El número de elementos comparados dentro de un
gráfico circular puede ser de más de 4.Al igual que en la gráfica de barras, el
empleo de tonalidades o colores facilita la diferenciación de los porcentajes o
proporciones. A diferencia de otros tipos de gráficos, el circular no tiene ejes x o y.
Permite medir y analizar los datos para apoyar la toma de decisiones.

EJEMPLO:

DIAGRAMA DE BARRAS:

Se usa cuando se pretende resaltar la representación de porcentajes de datos que


componen un total. Una gráfica de barras contiene barras verticales que
representan valores numéricos, generalmente usando una hoja de cálculo. Las
gráficas de barras son una manera de representar frecuencias; las frecuencias
están asociadas con categorías. Una gráfica de barras se presenta de dos
maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es
horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener
una representación gráfica de la diferencia de frecuencias o de intensidad de la
característica numérica de interés.
Tipos de gráficos

 Gráficos de barras verticales:

Los Gráficos de barras verticales representan valores usando trazos verticales,


aislados o no unos de otros, según la variable a graficar sea discreta o continua.
Pueden usarse para representar una o más series.

 Gráficos de barras horizontales:

Los Gráficos de barras horizontales representan valores discretos a base de


trazos horizontales, aislados unos de otros. Se utilizan cuando los textos
correspondientes a cada categoría son muy extensos. Pueden usarse para
representar una o más series.
 Gráficos de barras proporcionales:

Los Gráficos de barras proporcionales se usan cuando lo que se busca es resaltar


la representación de los porcentajes de los datos que componen un total. Dichas
barras pueden ser verticales u horizontales.

 Gráficos de barras comparativas:

Los Gráficos de barras comparativas son las mismas barras ya utilizadas que
pueden utilizarse para comparar dos o más series, para comparar valores entre
categorías.
 Gráficos de barras apiladas:

Los Gráficos de barras apiladas se usan para mostrar las relaciones entre dos o
más series con el total. Las barras también pueden ser verticales u horizontales.

PICTOGRAMA:

Un pictograma es un tipo de gráfico que representa mediante dibujos la


característica estudiada. Éstos representan las frecuencias relativas o absolutas
de una variable cualitativa o discreta.
Los pictogramas comparan las frecuencias entre diferentes categorías o períodos
de tiempo.

Tipos de pictograma

1. Gráfico de barras

Las barras son dibujos o símbolos de longitud proporcional a la frecuencia de cada


categoría o valor.

2. Gráfico de dibujos

Cada uno de los dibujos o símbolos equivale a ciertas unidades de frecuencia


relativa o absoluta. Cuantos más dibujos haya en cada categoría, mayor será la
frecuencia.
3. Gráfico de áreas

El dibujo o símbolo varía de tamaño proporcionalmente a la frecuencia. Cuanto


mayor sea el área del dibujo, mayor será su frecuencia o cantidad.
ORGANIZCION DE DATOS PARA DATOS CUANTITATIVOS

HISTOGRAMA:

Un histograma es una representación gráfica de datos agrupados mediante


intervalos. Los datos provienen de una variables cuantitativas continuas. Gracias a
él puedes hacerte rápidamente una idea de la distribución de los datos o muestra.

También cabe emplear variables cualitativas ordinales, siendo necesario que el


número de datos sea alto.

Un histograma es un conjunto de barras rectangulares verticales que su altura es


proporcional a las frecuencias absolutas de cada uno de los intervalos (también se
pueden representar las frecuencias relativas o frecuencias relativas porcentuales).

Los intervalos abarcan todo el conjunto sin cortarse, de manera que un elemento
está solo en un intervalo. La base de cada barra vertical es proporcional a la
amplitud del intervalo.

Construcción de un histograma

Para construir un histograma es necesario previamente construir una tabla de


frecuencias. Lo construiremos siguiendo los siguientes pasos:

1. En el eje de abcisas (eje horizontal) se colocan los intervalos, de menor a


mayor.

2. En el eje de ordenadas (eje vertical) se representan las frecuencias absolutas


de cada uno de los intervalos. También se suelen representar las frecuencias
relativas.
3. Se dibujan barras rectangulares de anchura igual y proporcional al intervalo. La
altura es la frecuencia absoluta. Las barras rectangulares se dibujan adyacentes la
una a la otra, pero no intersectan entre ellas. Por tanto, todas las barras tocan con
las de al lado, a no ser que un intervalo tenga frecuencia cero (la altura de la barra
será también cero).

Ejemplo:

En una ciudad se realiza un estudio para observar la distribución de la población


según la edad. La ciudad tiene censados 1.324.861 habitantes.

Para el estudio de la distribución de las edades se va a construir un histograma en


grupos decenales (intervalos de diez años).

1. En el eje de abscisas se colocan los intervalos de edades (grupos decenales).

2. En el eje de ordenadas se representa el número de personas que tienen ese


rango de edad en la fecha del estudio (frecuencias absolutas).

3. Se dibujan rectángulos de anchura igual y proporcional al intervalo (en nuestro


caso todos tendrán la misma anchura) y de altura igual a la frecuencia absoluta.

El histograma resultante será el siguiente:


POLIGONO DE FRECUENCIA:

Un polígono de frecuencias se forma uniendo los extremos de las barras de un


diagrama de barras mediante segmentos.

También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.

Ejemplo:

Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:

Hora Temperatura

6 7º

9 12°

12 14°
15 11°

18 12°

21 10°

24 8°

La grafica es:
POLÍGONOS DE FRECUENCIA PARA DATOS AGRUPADOS:

Para construir el polígono de frecuencia se toma la marca de clase que coincide


con el punto medio de cada rectángulo de un histograma.

Ejemplo:

El peso de 65 personas adultas viene dado por la siguiente tabla:

ci fi Fi

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

[110, 120) 115 2 65

65

Siendo la gráfica:
POLÍGONO DE FRECUENCIAS ACUMULADAS

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se


obtiene el histograma de frecuencias acumuladas o su correspondiente polígono.
OJIVA PORCENTUAL

Es un gráfico de línea que se diseña utilizando en el eje horizontal las fronteras


superiores de una distribución de frecuencias. La información se obtiene de la
columna de frecuencias acumuladas (absoluta o relativa). Las características son
las siguientes:

•En el eje horizontal se colocan las fronteras superiores de cada intervalo

•Todos los puntos tienen la misma distancia en el eje X

•Las líneas permanecen unidas

•El primer extremo termina sobre el eje horizontal

•Los datos son numéricos o continuos

•En el cambio de intervalo es posible colocar el valor de la frecuencia absoluta o


relativa para una mejor comprensión de los datos.

•La forma general de una ojiva es la siguiente:

EJEMPLO:

Se va a utilizar el mismo ejemplo de la muestra de 50 restaurantes dentro de la


ciudad.

Objetivo: Trazar la ojiva a partir de la distribución de frecuencias


Siga paso a paso las siguientes indicaciones para trazar la ojiva:

1. Calcular la frecuencia acumulada de la distribución agregándole una nueva


columna a la derecha, el primer intervalo es el mismo valor de la frecuencia
absoluta, a partir del segundo se va acumulando con todos los intervalos
anteriores.

2. Trace una línea horizontal.

3. Trace una línea vertical junto a la horizontal.

4. Haga 9 marcas en la línea horizontal todas a la misma distancia.


5. Haga 10 marcas en la línea vertical total a la misma distancia.

6. Coloque la primera frontera superior que es 21, es el primer valor que se marca
en el eje horizontal.

7. A continuación se colocan las demás fronteras superiores hasta llegar a 70


(ninguna marca debe quedar en blanco).

8. En el eje vertical se coloca la escala para las frecuencias, se empieza en 5 y


termina en 50 (50 es el total de los datos).

9. La primera fase tendrá una forma similar a la siguiente:

10. Para la primera frontera (es la primera inferior = 10) no existe ningun dato en la
muestra que sea menor que 10, por lo tanto la frecuencia acumulada es 0 y el
punto se ubica en 10 sobre el eje horizontal.

11. En la segunda frontera (es la primera superior = 21) existe 1dato en la muestra
que son menores que 21, se coloca (21, 1).

12. En la tercera frontera (es la segunda superior = 28) existen 5 datos; pero como
en el intervalo anterior hay 1, en total son 6.
13. En la cuarta frontera (es la tercera superior = 35) existen 7 datos, pero como
en los intervalos anteriores hay 5 y 11 respectivamente.

14. Se sigue haciendo los cálculos restantes hasta que la gráfica queda de la
siguiente manera:

DIGRAMA DE DISPERCION:

Los diagramas de dispersión son una forma fenomenal de expresar datos de dos
variables, y hacer predicciones basadas en los datos. Al contrario de los
histogramas y los diagramas de caja, los de dispersión muestran valores de datos
individuales.

Este es el diagrama de dispersión que expresa la cantidad de dinero que se ganó


Mateo cada semana trabajando en la tienda de su padre.
Las semanas están diagramadas en el eje x, y la cantidad de dinero que se ganó
en esa semana en el eje y. En general, la variable independiente (la variable que
no está influenciada por nada) está en el eje x y la variable dependiente (la que es
modificada por la variable independiente) está en el eje y.

En este diagrama podemos ver que en la semana 2 Mateo se ganó alrededor de


$125, y en la semana 18 estuvo cerca de los $165. Pero más importante aún es la
tendencia. Por ejemplo, con estos datos podemos ver que Mateo gana cada vez
más según pasan las semanas. Quizá su padre le da más horas a la semana o
más responsabilidades.

CORRELACIÓN

Con los diagramas de dispersión podemos ver cómo se relacionan ambas


variables entre sí. Esto es lo que se conoce como correlación. Hay tres tipos de
correlación: positiva, negativa y nula (sin correlación).

• Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por
ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la
altura, el pie también.

• Correlación negativa: es cuando una variable aumenta y la otra disminuye. El


tiempo de estudio y el tiempo que pasas jugando videojuegos, tienen una
correlación negativa, ya que cuando tu tiempo de estudio aumenta, no te queda
tanto tiempo para jugar videojuegos.

• Sin correlación: no hay una relación aparente entre las variables. Los puntos en
tus videojuegos y tu talla de zapato no parece tener ninguna correlación; mientras
una aumenta, la otra no tiene ningún efecto.

El diagrama de dispersión que analizamos tiene una fuerte correlación positiva: a


medida que las semanas aumentan, su pago también.

LÍNEA DE AJUSTE

Usamos la "línea de ajuste" para hacer predicciones basándonos en datos


pasados. Hay muchas y muy complicadas fórmulas para encontrar esta recta, pero
por ahora solo la dibujaremos a través de los puntos en la gráfica para que se
ajuste a la tendencia que nos marcan los datos. Cuando dibujes la recta,
asegúrate de que encaje con la mayor parte de los datos. Si hay un punto que
está muy por encima o muy por debajo con respecto al resto (los atípicos) déjalo
fuera de la recta.

Usando esta recta podemos predecir cuánto dinero se ganará Mateo en 20


semanas de trabajo (asumiendo que el patrón continúa).

Вам также может понравиться