Вы находитесь на странице: 1из 6

1.

DIAGRAMA TALLO-HOJA
Es un semigráfico que permite presentar la distribución de una variable cuantitativa. Consiste en
separar cada dato en el último dígito (que se denomina hoja) y las cifras delanteras restantes (que
forman el tallo).

2. DISTRIBUCION DE LOS DATOS


A la agrupación de datos en categorías mutuamente excluyentes que indican el número de
observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La
distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
número existente en cada clase.

2.1 Distribución simétrica


Una tabla de clasificación o distribución de frecuencias permite mostrar cómo se clasifican los
sujetos pertenecientes a una muestra o población de acuerdo a las modalidades, categorías o
valores de una sola variable.
2.2 Distribución de frecuencia acumulada ojiva
La frecuencia total de todos los valores menores que el límite real superior de clase de un intervalo
de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase inclusive. Por
ejemplo, la frecuencia acumulada hasta el intervalo de clase 66 - 68 inclusive en la Tabla 1, es 5 +
18 + 42 = 65, significando que 65 estudiantes tienen alturas menores que 68,5 pulgadas.

Un gráfico que muestre las frecuencias acumuladas menores que cualquier límite real superior de
clase trazado sobre los límites reales superiores de clase se llama polígono de frecuencias
acumuladas u ojiva y se muestra en la Fig. 2-2 para la distribución de la altura de los estudiantes.

En algunos casos es preferible considerar una distribución de frecuencias acumuladas de todos


los valores mayores o iguales al límite real inferior de clase de cada intervalo de clase. En este caso
consideramos las alturas de 59,5 pulgadas o más, 62,5 pulgadas o más, etc., ésta se llama a
veces distribución acumulada o más, mientras que la considerada anteriormente es la distribución
acumulada menor que. De la una se obtiene fácilmente la otra. Las correspondientes ojivas se
llaman o más y menor que. Siempre que nos refiramos a distribuciones acumuladas u ojivas sin
especificar, se entenderá que son del tipo menor que.

2.3 Distribución de frecuencias relativas


Describe los porcentajes del número total de observaciones correspondiente a cada categoría. Una
distribución de frecuencia relativa no nos indica cuál es el número de observaciones en cada
categoría, sino cuál es el porcentaje de observaciones en cada categoría. Esta información es muy
valiosa.

Género Porcentaje del total matriculado (1998)


Niños 79,7 %
Niñas 20,3 %

En el cuadro se representa la distribución de frecuencias relativa. Las distribuciones de frecuencias pueden


ser relativamente simples, como en el cuadro, pero también pueden ser más complejas y proporcionar mucha
más información, como veremos más adelante.
3. CÁLCULO DE MEDIDAS (CONSIDERANDO LOS DATOS COMO UNA POBLACIÓN)
Conceptos clave
 Población: Total de elementos bajo estudio
 Muestra: Subconjunto de elementos de la población (debería ser representativo de la
población)
 Individuos: Elementos individuales de la población
 Variables: Características de los individuos
Medidas de Estadística Descriptiva: Un paso clave a la hora de analizar un conjunto de datos
es lo que se denomina “estadística descriptiva” y que consiste, como el nombre indica, en
describir los datos mediante una serie de medidas que permitan caracterizar principalmente su
distribución y su dispersión.

3.1 Medidas de la tendencia central (media y mediana)


Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la
distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución,


independientemente de que esté más o menos centrada, se habla de estas medidas como medidas
de posición.1 En este caso se incluyen también los cuantiles entre estas medidas. Entre las
medidas de tendencia central tenemos:
 Media aritmética: también llamada promedio o media, de un conjunto infinito de números es
el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del
principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de
todos sus valores dividida entre el número de sumandos.
 Mediana: representa el valor de la variable de posición central en un conjunto de datos
ordenados. Si la serie tiene un número par de puntuaciones la mediana es la media entre
las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me = 9,5
Existen dos métodos para el cálculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.

3.2 Medidas de dispersión (desviación estándar y varianza)


Desviación estándar o típica
La desviación estándar o desviación típica es una medida de la dispersión de los valores de la
variable analizada representada en sus mismas unidades. Su cálculo se realiza mediante la raíz
cuadrada de la varianza y por lo tanto su representación es simplemente σ o s dependiendo de si
representa a la población o a la muestra.
Ejemplo: Manteniendo nuestro conjunto de 5 datos: [1, 2, 2, 5, 10], la desviación estándar
sería de 3,67.
Error estándar: sirve para medir cómo de bien una muestra representa a la población. El cálculo del
error estándar se realiza dividiendo la desviación estándar por la raíz cuadrada del total de valores
de la muestra.
Varianza: es una medida de la dispersión de los valores de la variable analizada respecto a su valor
medio. Se calcula obteniendo el valor medio del cuadrado de sus residuos (diferencias de cada valor
respecto a la media)

4. CALCULO DE MEDIDAS (CONSIDERANDO LOS DATOS COMO UNA MUESTRA)

4.1 Medidas de tendencia central: media


La media aritmética es el promedio o medición de tendencia central de uso más común. Se calcula
sumando todas las observaciones de una serie de datos y luego dividiendo el total entre el número
de elementos involucrados. La expresión algebraica puede describirse como:

Para simplificar la notación se usa convencionalmente el término:

donde:

= media aritmética de la muestra

= sumatoria de todos los valores de Xi


4.2 Medidas de dispersión (desviación estándar y varianza).
Parámetros estadísticos que indican como se alejan los datos respecto de la media aritmética.
Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son
el rango, la desviación estándar y la varianza.

La desviación estándar mide el grado de disersión de los datos con respecto a la media, se denota
como s para una muestra o como σ para la población.

La varianza es otro parámetro utilizado para medir la dispersión de los valores de una variable
respecto a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones
respecto a la media. Su expresión matemática es:

donde Xi es el dato i-ésimo y es la media de los N datos.

BIBLIOGRAFÍA
 https://www.ecured.cu/Medidas_de_dispersi%C3%B3n
http://educacionestadisticageneral.blogspot.com/2009/08/curvas-de-frecuencias.html
 http://educacionestadisticageneral.blogspot.com/2009/08/curvas-de-frecuencias.html
 https://es.khanacademy.org/math/probability/data-distributions-a1
 https://es.slideshare.net/rial08/distribucion-de-frecuencias-3093811
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN
FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA

Probabilidad y estadística

Actividad Fundamental #1

Matricula: 1815068

Nombre Alumno: Ivonne Jocabed Rivera Castillo

Carrera: Ingeniero en Tecnología de Software (ITS)

Profesor: Dr. Luis Chávez Guzmán

Salón: 4-205
Hora: M M4-M6

Semestre Agosto-Diciembre 2019

Вам также может понравиться