Вы находитесь на странице: 1из 11

Formulario

Representación tabular (Cuando solo hay xi e fi y se tiene que hacer lo demás: hi, Fi,
hi%, Hi%).

𝑓𝑖
1. Frecuencias Relativas. ℎ𝑖 = 𝑛

2. Frecuencias Absolutas acumuladas. 𝐹𝑖 = ∑𝑚


𝑖=1 𝑓𝑖

3. Frecuencias Relativas acumuladas. 𝐻𝑖 = ∑𝑚


𝑖=1 ℎ𝑖

Las porcentuales ya son muy pollas no seas malo.

- Para graficar: xi vs. fi, se debe tener en cuenta que lo que hace es un polígono, es decir
una FIGURA CERRADA, señalando el nombre y número de gráfico, así como su fuente
y la señalización de las frecuencias en el polígono en las intersecciones.

- Para graficar: xi vs. Hi%, se debe tener en cuenta que la figura ya no va cerrada, se tiene
que graficar la OJIVA, se debe señalizar H% en las intersecciones, el resto es igual que
el anterior

Intervalos de clase [Se agrupa en intervalos “[xi-1’ xi’)”; luego se hace la marca de clase,
el ploteo (o conteo en la muestra según los intervalos), las frecuencias absolutas
(también según el intervalo), hi%, Fi%, Hi%]


1. Forma del intervalo. [𝑥𝑖−1 − 𝑥𝑖′ )

𝑥𝑖−1 +𝑥𝑖′
2. Marca de clase. 𝑥𝑖 = 2

3. Rango o recorrido general. 𝑅 = 𝑚𝑎𝑥. −𝑚𝑖𝑛.

4. Número de clases. 𝑚 = 1 + 3.3 𝑥 𝑙𝑜𝑔(𝑛); n = La suma de todos los fi, Nro. De la


población.
𝑅
5. Amplitud de clase. 𝐶 = 𝑚; este valor debe ser redondeado al mayor valor que le
sigue. (e.g. 32.3 ≈ 33, no a 32).

- La realización de los gráficos es similar, solo que son HISTOGRAMAS y se tienen que
señalizar las marcas de clase en lo que abarca el rectángulo.
Medidas estadísticas.

1. Promedio aritmético o media ( ).

1.1. Cálculo

1.1.1. Media para datos no tabulados (Solo una serie de datos “xi”).

∑𝑛𝑖=1 𝑥𝑖 𝑥1 + ⋯ + 𝑥𝑛
𝑥̅ = =
𝑛 𝑛

1.1.2. Media para datos tabulados (Con “xi” y “fi” en una tabla).

∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ =
𝑛

Si se tiene datos en intervalos de clase “[xi-1’ xi’)”, se debe utilizar la marca de


clase como “xi”:

𝑥𝑖−1 − 𝑥𝑖′
𝑥𝑖 =
2
1.2. Propiedades.

1.2.1. 𝑃(𝑘) = 𝑘; 𝑘 = 𝑐𝑡𝑒.


1.2.2. 𝑃(𝑘𝑥𝑖 ) = 𝑘𝑃(𝑥𝑖 ); 𝑘 = 𝑐𝑡𝑒.
1.2.3. 𝑃(𝑘𝑥𝑖 + 𝑎) = 𝑘𝑃(𝑥𝑖 ) + 𝑎; 𝑘 = 𝑐𝑡𝑒. , 𝑎 = 𝑐𝑡𝑒. , 𝑘 ≠ 𝑎
1.2.4. 𝑃(𝑘𝑥𝑖 ± 𝑦𝑖 ) = 𝑃(𝑥𝑖 ) ± 𝑃(𝑦𝑖 ); 𝑘 = 𝑐𝑡𝑒. , 𝑎 = 𝑐𝑡𝑒. , 𝑘 ≠ 𝑎

2. Moda (Mo).

2.1. Cálculo

2.1.1. Moda (Mo) para datos no tabulados (Solo una serie de datos “xi”).

- La moda en este caso es SOLO EL NÚMERO QUE MÁS SE REPITE. La


distribución sería unimodal.
- Si hubiese dos números con la misma cantidad repetida, la moda serían
AMBOS NÚMEROS. La distribución sería bimodal (polimodal para más de
2)
- Si no hubiese ningún número que se repita más de una vez, no existe moda.
La distribución sería amodal.

2.1.2. Moda (Mo) para datos tabulados (Con “xi” y “fi” en una tabla).

Es el VALOR DE LA VARIABLE QUE MÁS SE REPITE (QUE TIENE


MAYOR FRECUENCIA), esto es Mo = xi; para una xi con mayor fi
2.1.3. Moda (Mo) para datos tabulados en intervalos de clase (“[xi-1’ xi’)”).


𝐷1
𝑀𝑜 = 𝑥𝑖−1 + 𝐶𝑖 [ ]
𝐷1 + 𝐷2
𝐷1 = 𝑓𝑖 − 𝑓𝑖−1 ; 𝐷2 = 𝑓𝑖 − 𝑓𝑖+1

[x'i-1 x'i) fi
a- a+b 10 [𝑎 + 2𝑏; 𝑎 + 3𝑏) = IMo (Intervalo Modal)
a+b - a+2b 8 fi-1 ′
𝑥𝑖−1 = 𝑎 + 2𝑏
a+2b - a+3b 12 fi
𝑏 = 𝐶𝑖 = Amplitud de clase modal
a+3b - a+4b 10 fi+1

3. Mediana (Me).

3.1. Cálculo.

3.1.1. Mediana (Me) para datos no tabulados (Solo una serie de datos “xi”).

3.1.1.1. Variable con un número impar de datos.

- Primero se ordenan los datos de menor a mayor


- La mediana (Me) es el DATO O PUNTUACIÓN CENTRAL DE
LOS DATOS PREVIAMENTE ORDENADOS.

3.1.1.2. Variable con un número par de datos.

- Primero se ordenan los datos de menor a mayor.


- Como se puede observar, EN EL CENTRO NO QUEDA UNO, SI
NO DOS VALORES.
- La mediana (Me) ES EL PROMEDIO O SEMISUMA DE ESTOS
VALORES CENTRALES.
3.1.2. Mediana (Me) para datos tabulados (Con “xi” y “fi” en una tabla y
NECESARIAMENTE LAS FRECUENCIAS ACUMULADAS).

- Se determinan los factores de posición.

n/2; Si el número de datos es Par.


n+1/2; Si el número de datos es impar

- Luego la Mediana (Me) por puntos discretos.

Si Fj-1 < n/2 < Fj; Entonces Me = xj (Para un Fj)


𝑥𝑗−1 +𝑥𝑖
Si n/2 = Fj-1; Entonces Me = 2

xi fi Fi
a 12 12 58
Fj-1 Factor de posición: = 26
b 13 25 2
n/2
c 15 40 Como Fj-1 < n/2 < Fj; entonces: Me = xj = c
Fj
d 18 58
TOTAL 58

3.1.3. Mediana (Me) para datos agrupados en intervalos ((“[xi-1’ xi’)”).” en una
tabla y NECESARIAMENTE LAS FRECUENCIAS ACUMULADAS).

𝑛
− 𝐹𝑗−1

𝑀𝑒 = 𝑥𝑖−1 + 𝐶𝑗 [ 2 ]
𝐹𝑗 − 𝐹𝑗−1

Donde:

n/2 (o n+1/2 si es impar): Factor de posición de la mediana (Previamente


mostrado como se halla). (40/2=20)1
Fj-1: Frecuencia absoluta acumulada inmediata anterior al factor n/2. 2
Fj: Frecuencia absoluta acumulada inmediata posterior al factor n/2. 3

𝑥𝑖−1 : Límite inferior del intervalo medio (IMe). 4
𝐼𝑀𝑒: Intervalo que se relaciona con Fj. … 5

[x'i-1 x'i) fi fi
a - a+x 10 10
a+x - a+2x 8 18 2
4
(x’j-1)a+2x - a+3x (xj) …5 12 30 3
a+3x - a+4x 10 40
TOTAL 40 1
4. Varianza (S2).

4.1. Varianza para datos no tabulados.

4.1.1. Fórmula general.

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1

4.1.2. Fórmula práctica.


𝑛 (∑𝑛𝑖=1 𝑥𝑖 )2 1
𝑆 2 = {∑ 𝑥𝑖2 − }
𝑖=1 𝑛 𝑛−1

4.2. Varianza para datos tabulados.

4.2.1. Fórmula general.

2
∑𝑚 2
𝑖=1(𝑥𝑖 − 𝑥̅ ) 𝑓𝑖
𝑆 =
𝑛−1

4.2.2. Fórmula práctica.


𝑛 (∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 )2 1
2
𝑆 = {∑ 𝑥𝑖2 𝑓𝑖 − }
𝑖=1 𝑛 𝑛−1

- xi: Cada valor de la variable si es discreta (Con “xi” y “fi” en una tabla)
- xi: Marca de clase si es variable continua (Con “[xi-1’ xi’)”)

4.3. Propiedades.

4.3.1. 𝑉(𝑥𝑖 ) ≥ 0
4.3.2. 𝑉(𝑘) ≥ 0
4.3.3. 𝑉(𝑘𝑥𝑖 ) = 𝑘 2 𝑉(𝑥𝑖 ); k = cte.
4.3.4. 𝑉(𝑘𝑥𝑖 + 𝑏) = 𝑘 2 𝑉(𝑥𝑖 ); k = cte.; b = cte.
4.3.5. 𝑉(𝑥𝑖 ± 𝑦𝑗 ) = 𝑉(𝑥𝑖 ) ± 𝑉(𝑣𝑗 ); x e y son variables independientes

5. Desviación típica

𝑆 = √𝑆 2

- Para estimar la desviación típica de una población a partir de los datos de una
muestra se utiliza la fórmula (cuasi desviación típica)

∑𝑛 (𝑥𝑖 − 𝑥̅ )2 𝑛𝑖
𝑆 = √ 𝑖=1
𝑛−1

SUAVE QUE ESTA VAINA NO SE USA PERO SI PIDEN … AHÍ ESTÁ


6. Coeficiente de variación de Pearson.

𝑆
𝐶𝑉 =
|𝑥̅ |

- Número de veces que la desviación típica contiene a la media aritmética y por lo


tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de
la media.
- Si CV < 30% los datos son HOMOGÉNEOS.
- Si CV > 30% los datos son HETEROGÉNEOS.

7. Medida de asimetría.

- Distrib. Es simétrica: Me, Mo y .


- Asimétrica a la der. = Si frec. (absol. o relav.) descienden más lent. Por la der.
Más que por la izq.
- Asimétrica por la der. = Más lent. Por la izq.

- Coeficiente de asimetría de Pearson.

𝑥̅ − 𝑀𝑜
𝐴𝒔 =
𝑆
Si As = 0, es simétrica.

Poblaciones Inferencia de poblaciones


(muestra)

∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2 ∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
Varianza 𝑛 𝑛−1

∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2 ∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
Desviación típica √ √
𝑛 𝑛−1

Coef. De Variación
𝑆
𝐶𝑉 =
|𝑥̅ |

Rango: Dif. Entre el valor de las observaciones mayor y menor


Regresión Lineal Simple
estudia la relación existente entre las dos variables X e Y. .
Estableceremos un modelo para explicar la causa (Y) en términos del efecto (X), del tipo
Sgte.
y=a + bx + ei
con el menor error posible entre e Y,
Donde:
Y: Variable dependiente (explicada, pronosticada, regresando o variable respuesta)
X: Variable independiente (explicativa, predictora o regresora)
a : Ordenada en el origen (punto en que la línea intercepta o corta al eje y)
b : Pendiente de la Ecuación ( magnitud de cambio del incremento o decremento de la
variable Y por cada unidad de incremento de X)
e: Error aleatorio: con E(e)= O ; V( e) = σ2 Los errores aleatorios u observaciones diferentes
son v.a. no correlacinadas

La regresión también puede ser de la forma:

+ ei

de forma que sea una variable que toma valores próximos a cero.

Por tanto:

 Si b>0, las dos variables aumentan o disminuyen a la vez; R.L.Positiva o Directa


 Si b<0, cuando una variable aumenta, la otra disminuye; R.L. Negativa o inversa
 Si b = 0, no existe relación lineal entre las variables.
X y
o
Temperatura F % de Cobre xy x2 y2
20 65 1300 400 4225
35 76 2660 1225 5776
28 68 1904 784 4624
40 89 3560 1600 7921
23 66 1518 529 4356
38 85 3230 1444 7225
36 82 2952 1296 6724
220 531 17124 7278 40851

1. Regresión de Y sobre X : + ei

Lo que nos da las relaciones buscadas, determinándose los parámetros de la ecuación de


regresión:

La cantidad b se denomina coeficiente de regresión de Y sobre X.

Donde:

 Sxy = ΣYi X i - (Σ Y i ) (Σ X i )
n
 Sx2 = Sxx = Σ X i ² - (Σ X i )²
n
Sx= √𝑆𝑥𝑥 Sy=√𝑆𝑦𝑦

3. Supuestos del modelo

 Supuesto 1: E(e ) = 0

Es decir la media de lso errores a lo largo de una serie infinitamente larga de


experimentos es 0 para cada valor de xi
 Supuesto 2: V( e ) = σ2 para todo valor de x
 Supuesto 3: Los errores asociados a cualquiera de dos observaciones
distintas son independientes.

4. Error estándar de Estimación (Se)

Medida de error “típico” que expresa el grado de dispersión de los


valores de Yi alrededor de la recta de regresión.
(𝑺𝒙𝒚 )𝟐
Se = √ CME …(1) 𝑺𝑪𝑬 = 𝑺𝒚𝒚 − 𝑺𝒙𝒙

Pero:
CME = SCE …(2)
n -2

Si Se = 0; indica que existe una relación lineal perfecta entre las variables.

5. Estimación de la varianza del error

𝑺𝑪𝑴
̂𝟐 =
𝝈
𝒏−𝟐
6. Error estándar estimado de la pendiente

̂𝟐
𝝈
𝑺𝒆(𝒃) = √
𝑺𝒙𝒙

7. Error Estándar estimado de la ordenada al origen

𝟏 𝒙̅𝟐
𝑺𝒆(𝒂 ̂𝟐 [ +
̂) = √𝝈 ]
𝒏 𝑺𝒙𝒙

8. Coeficiente de Correlación Muestral

Mide el grado de asociación lineal entre las variables x, y en la muestra.

Donde:
Nos gustaría tener que r=1, pues en ese caso ambas variables tendrían la misma
varianza, pero esto no es cierto en general. Todo lo que se puede afirmar, como
sabemos, es que

Por ello:

 Si el ajuste es bueno (Y se puede calcular de modo bastante aproximado


a partir de X y viceversa).
 Si el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir
de X y viceversa).
 │r│≈ -1 el ajuste es bueno (Y se puede calcular de modo bastante aproximado a
partir de X y viceversa).

 Si las variables X e Y no están relacionadas (linealmente al menos), por


tanto no tiene sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos
variables no posean ninguna relación en el caso r=0, ya que si bien el ajuste lineal
puede no ser procentente, tal vez otro tipo de ajuste sí lo sea.

r ≈1 r ≈ -1 r≈0 r≈0

 Ahora si

Figura: es lo mismo que decir que las observaciones de ambas


variables están perfectamente alineadas. El signo de r, es el mismo que el

de , por tanto nos indica el crecimiento o decrecimiento de la recta.


9. Coeficiente de Determinación ( R2 )

Sirve para determinar la bondad del ajuste de Y en función de X o viceversa),


representan además la proporción de varianza explicada por la regresión lineal.

lo que resumimos en la siguiente proposición:

Donde: 0 < R2 < 1

 Propiedades del coeficiente de Correlación

Вам также может понравиться