Академический Документы
Профессиональный Документы
Культура Документы
Grado en Farmacia
Primer curso
2
Índice general
2. Interpolación polinómica 39
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2. Análisis previo (existencia y unicidad) . . . . . . . . . . . . . . . . . . . . . . . 39
2.3. Método de las Diferencias Divididas . . . . . . . . . . . . . . . . . . . . . . . . 40
3
4 ÍNDICE GENERAL
4. Programación lineal 59
4.1. Introducción / motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2. Aplicaciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3. Resolución por el método geométrico . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3.1. Análisis previo: Regiones factibles . . . . . . . . . . . . . . . . . . . . . 61
4.3.2. Método geométrico en regiones factibles acotadas . . . . . . . . . . . . . 63
4.3.3. Sobre la existencia de solución y regiones factibles no acotadas . . . . . 63
5. Estadı́stica descriptiva 65
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2. Distribuciones estadı́sticas. Representaciones gráficas . . . . . . . . . . . . . . . 65
5.2.1. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2.2. Tablas estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.3. Representaciones gráficas . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.3. Medidas de posición y dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.3.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.2. Medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Reales R = “clausura/completado” de Q
(N ⊂ Z ⊂ Q ⊂ R) recta real; axioma del supremo = Teor. de Cantor = Teor. de Bolzano
imposibilidad de resolver ecuaciones como x2 + 1 = 0.
Complejos C = {a + bi : a, b ∈ R, i2 = −1}
(N ⊂ Z ⊂ Q ⊂ R ⊂ C) Toda ecuación algebraica tiene solución en C
7
8 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
Propiedades:
Reflexiva: ∀a ∈ Q : a ≤ a.
Antisimétrica: a ≤ b, b ≤ a ⇒ a = b.
Transitiva: a ≤ b, b ≤ c ⇒ a ≤ c.
Además, dicha relación es total: ∀a, b ∈ Q, a ≤ b ó b ≤ a.
La relación de orden es compatible con la suma y el producto:
Para “completar” la recta hasta llenarla debemos ampliar hasta los números reales. [más
adelante veremos axiomas sobre su construcción: del supremo, y el Teorema de Bolzano.]
R es un cuerpo ordenado
1.1. NÚMEROS REALES Y NOCIONES BÁSICAS SOBRE FUNCIONES 9
En todo R se pueden definir operaciones suma (+) y producto (·) que extienden las defi-
nidas antes, y una relación de orden (≤) que también es total.
Dados a, b ∈ R, diremos que
a ≥ b si b ≤ a.
a < b si a ≤ b y a 6= b.
a > b si b < a.
Propiedades de R:
∀x ∈ R, x > 0, ∃n ∈ N : x < n.
Entre dos números reales distintos siempre existe un racional, y en consecuencia, infinitos
racionales.
10 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
Subconjuntos de R. Intervalos
Definición 1.4. Se llama dominio de una función f (lo denotaremos por Dom f ) al conjunto
de valores para los que está bien definida f (x) :
f : Domf ⊂ R → R : x 7→ f (x).
Habrá ocasiones en que nos den una fórmula y debamos hallar el dominio en que es válida
aplicarla:
√
f (x) = x Domf = R+ .
1
f (x) = Domf = R\{0}.
x
Imagen o rango o recorrido de f ≡ valores que toma f :
y
6 y = x2
y=x
√
y= x
-
x
Simetrı́a respecto la bisectriz
-
• •
x
A • B
b b
V V = − 2a , p(− 2a )
1.2. FUNCIONES ELEMENTALES 13
√
−b ± b2 − 4ac
A, B =
2a
Para grados superior a 2 debemos esperar a tener más herramientas para conocer su re-
presentación gráfica.
Para el estudio del signo de un polinomio, resultará muy útil conocer procedimientos de
factorización. Recordamos brevemente con ejemplos cómo se aplica la Regla de Ruffini para
dividir (y eventualmente factorizar) un polinomio de grado cualquiera entre otro de grado
uno.
Se toman los coeficientes del polinomio del numerador y el elemento opuesto (cambio de
signo) del coeficiente de grado cero del denominador y opera como en el ejemplo (se baja el
primer coeficiente, multiplica, se sube el resultado y se suma):
x3 − 3x2 − 7x − 8
Ejemplo 1.8. Queremos calcular el cociente
x−5
1 -3 -7 8
5 5 10 15
1 2 3 7
Observa los números obtenidos a través de la operación anterior. Salvo el último (recua-
drado), que es el resto, los demás, denotan los coeficientes de un polinomio un grado menor,
o sea, 2:
Esto nos dice que
x3 − 3x2 − 7x − 8 = (x − 5)(x2 + 2x + 3) + 7
El caso interesante se produce cuando el resto es cero (en lugar de 7), eso dice que cierto
número (en este caso habrı́a sido 5) es un cero o raı́z del polinomio y, por tanto, que éste
puede factorizarse como (x − 5) por otro polinomio de un grado menos.
Ejemplo 1.9. Sea q(x) = x4 + x3 − 7x2 + 4. Puedes comprobar que q(2) = 0, eso indica
que q(x) = (x − 2)r(x) con r(x) otro polinomio de grado 3. Para hallarlo desarrollamos por
Ruffini (ojo, hay que poner los coeficientes de todos los monomios, incluidos 0 por aquéllos
que no aparecen):
1 1 -7 0 4
2 2 6 -2 -4
1 3 -1 -2 0
Comprueba, desarrollando el producto, que se tiene la siguiente igualdad:
Funciones racionales
p(x)
f (x) = con p y q funciones polinómicas.
q(x)
Domf = {x ∈ R : q(x) 6= 0} = R\{x ∈ R : q(x) = 0}.
Función exponencial
f (x) = ax , a ∈ R, a > 0, x ∈ R. Domf = R.
Propiedades:
ar+s = ar as , (ar )s = ar·s , (a · b)r = ar · br
Si x, y ∈ R, x < y :
ax < ay cuando a > 1 (creciente).
ax > ay cuando a < 1 (decreciente).
2x
50
45
40
35
30
25
20
15
10
−6 −4 −2 0 2 4 6
x
Propiedades:
x
loga 1 = 0, loga a = 1, loga (x · y) = loga x + loga y, loga (xm ) = m · loga x, loga y = loga x −
loga y.
1.2. FUNCIONES ELEMENTALES 15
log(x)
2
1.5
0.5
−0.5
−1
−1.5
−2
0 1 2 3 4 5 6
x
Funciones trigonométricas
sin(x)
0.5
−0.5
−1
−6 −4 −2 0 2 4 6
x
cos(x)
0.5
−0.5
−1
−6 −4 −2 0 2 4 6
x
Función tangente:
sen x
f (x) = tg x = .
π
cos x
Domf = R\{ 2 + kπ : k ∈ Z}, Imf = R, π−periódica.
tan(x)
−2
−4
−6
−6 −4 −2 0 2 4 6
x
1 1 1
cosec x = , sec x = , cotg x = .
sen x cos x tg x
1.3. LÍMITES DE FUNCIONES 17
Ejemplo 1.12. f : R\{0} → R : x 7→ xsen x. Se tiene que lı́m f (x) = 0 (basta tomar δ = ε).
x→0
Comprobar
que ocurre lo mismo con la función
x si x ∈ Q,
g(x) =
0 si x 6∈ Q.
1
Ejemplo 1.13. lı́m = +∞.
x→0 |x|
1 1
Ejemplo 1.14. lı́m = lı́m = 0.
x→+∞ x x→−∞ x
18 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
A veces no podemos asegurar la existencia de lı́mite en torno a un punto, pero sı́ estudiar
los lı́mites laterales (por la derecha e izquierda respectivamente):
Ejemplo 1.15. La función parte entera E : R → R verifica lı́m E(x) = n pero lı́m E(x) =
x→n+ x→n−
n − 1.
Teorema 1.16. Dada f : S ⊂ R → R se cumple que lı́m f (x) existe y vale l ∈ R si y solo
x→x0
si existen los lı́mites laterales lı́m f (x) y lı́m f (x) y tienen el mismo valor.
x→x+
0 x→x−
0
El resultado, leı́do de forma negativa, dice que si los lı́mites laterales no coinciden, no
existe lı́mite de la función en ese punto.
Teorema 1.19. Sean f, g : S ⊂ R → R tales que existen l, l′ ∈ R, y lı́m f (x) = l, lı́m g(x) =
x→x0 x→x0
l′ . Entonces existen los siguientes lı́mites:
lı́m [f (x) ± g(x)] = l ± l′ ,
x→x0
lı́m f (x) · g(x) = l · l′ ,
x→x0
f (x) l
Si l′ 6= 0 lı́m = ′.
x→x0 g(x) l
Observación 1.20 (Indeterminaciones). Cuando los valores l y l′ no son reales, sino +∞
ó −∞, nos encontraremos con problemas. Se trata de expresiones que no tienen a priori
un valor concreto (por ello las llamaremos indeterminaciones), sino que hay que hallarlo
explı́citamente en cada caso. Expresiones indeterminadas que pueden aparecer son:
∞ 0
1∞ , 0 · ∞, ∞ − ∞, , , ∞0 , 00 .
∞ 0
Algunas que podremos resolver en este mismo tema usando las propiedades precedentes son
∞−∞ (por ejemplo sacando factor común o multiplicando por el conjugado) o ∞ ∞ (será simple
si se trata de funciones racionales). Un dominio total de las indeterminaciones requerirá he-
rramientas del próximo tema de derivación, como por ejemplo la Regla de L’Hôpital.
x0 ∈
6 Domf.
6 ∃ lı́m f (x).
x→x0
∃ lı́m f (x) 6= f (x0 ).
x→x0
c) Discontinuidad de salto infinito: cuando alguno de los lı́mites laterales (o ambos) valen
±∞.
1 1
Ejemplos: f (x) = , g(x) = .
x |x|
f (S) = {f (x) : x ∈ S}
Teorema 1.28.
• (continuidad implica acotación local): f : (a, b) → R, f continua en x0 ⇒ ∃δ > 0 : f
acotada en (x0 − δ, x0 + δ).
• Si a ∈Domf, y f es continua en a por la derecha, entonces ∃δ > 0 : f acotada en
[a, a + δ). (Resultado análogo para el extremo b).
• (continuidad en intervalo cerrado y acotado sı́ implica acotación) f continua en [a, b] ⇒
f acotada en [a, b].
Máximos y mı́nimos
Definición 1.29. Sea f : S ⊂ R → R. Se dice que f tiene un máximo absoluto en c ∈ S
(resp. mı́nimo) si f (x) ≤ f (c) para todo x ∈ S (resp. f (x) ≥ f (c)).
Se dice que tiene un máximo (resp. mı́nimo) relativo o local en c ∈ S cuando existe δ > 0
tal que f (x) ≤ f (c) (resp. f (x) ≥ f (c)) para todo x ∈ (c − δ, c + δ).
Teorema 1.30.
•[Weierstrass] Sea f : [a, b] → R continua. Entonces f alcanza máximo y mı́nimo abso-
lutos. (Nota: el resultado es falso si el intervalo de partida no es cerrado o no es acotado,
incluso aunque f sea acotada.)
• [Bolzano] f : [a, b] → R continua y con signo distinto en los extremos f (a) y f (b),
entonces ∃c ∈ (a, b) tal que f (c) = 0.
• [Darboux, valores intermedios] f : [a, b] → R continua. Entonces f alcanza todos los
valores comprendidos entre su máximo y su mı́nimo.
22 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
Probar que todo polinomio de grado impar tiene al menos una raı́z real, y que su imagen
es todo R
Probar que la ecuación x−senx = 1 tiene al menos una raı́z real.
Funciones monótonas
Definición 1.31. Sea f : S ⊂ R → R.
Teorema 1.32. Sea f : [a, b] → R una función creciente. Entonces para todo c ∈ (a, b) se
verifica:
∃ lı́m f (x) = f (c− ), ∃ lı́m f (x) = f (c+ ).
x→c− x→c+
Observación 1.33.
Para las funciones continuas y monótonas estrictas, es posible construir la función in-
versa respecto de la composición, y es también continua y estrictamente monótona.
Como ejemplo podemos considerar la función f (x) : R+ → R+ : x 7→ f (x) = xn con
n ∈ N.
Observación 1.35. Para que la derivada exista tiene que existir el lı́mite, es decir, deben
existir los lı́mites laterales y coincidir.
f (2 + h) − f (2) (2 + h)2 − 22 h2 + 4h
f ′ (2) = lı́m = lı́m = lı́m = lı́m (h + 4) = 4.
h→0 h h→0 h h→0 h h→0
|h| − |0| h
f+′ (0) = lı́m = lı́m =1
h→0+ h h→0 h+
pero
|h| − |0| −h
f−′ (0) = lı́m = lı́m = −1.
h
h→0− h→0 − h
Luego existen las derivadas laterales, pero los lı́mites no coinciden. Entonces, la función
valor absoluto no es derivable en a = 0.
h1/3 − 01/3 1
f ′ (0) = lı́m = lı́m 2/3 = +∞
h→0 h h→0 h
luego no se trata de un número real. En este caso, se dice que la función tiene derivada
+∞ en a = 0.
0 0.5 1 1.5 2
x
–1
− − − − es la función y = x2
⋄ ⋄ ⋄ ⋄ es la tangente en el punto (1, 1), y = 2x − 1
× × × × es la recta normal en el punto (1, 1), y = (3 − x)/2
Definición 1.39. Se define la recta de pendiente m que pasa por el punto (x0 , y0 ) como:
y − y0 = m (x − x0 )
Dos rectas de pendientes m y m,
e respectivamente, se dice que son perpendiculares cuando
o
forman un ángulo de 90 . Entonces, se puede comprobar que la relación entre sus pendientes
e = −1/m.
es m
Definición 1.40. Si f es derivable en a y f ′ (a) 6= 0, entonces la pendiente de la recta tangente
en el punto (a, f (a)) es f ′ (a), y la pendiente de la recta normal es − f ′1(a) .
1. f ± g es derivable en a, siendo:
(λ · f )′ (a) = λ · f ′ (a)
3. f · g es derivable en a, siendo:
f
4. Si g′ (a) 6= 0, es derivable en a, siendo:
g
′
f f ′ (a) · g(a) − f (a) · g′ (a)
(a) =
g (g(a))2
26 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
Potencia
(xn )′ = nxn−1 (f (x)n )′ = nf (x)n−1 f ′ (x)
Exponenciales
′
(ex )′ = ex ef (x) = ef (x) f ′ (x)
′
(ax )′ = ax · (ln a) af (x) = (ln a)af (x) f ′ (x)
Logarı́tmicas
1 1
(ln x)′ = , x > 0 (ln f (x))′ = f ′ (x)
x f (x)
1 1 1 1 ′
(loga (x))′ = (loga f (x))′ = f (x)
ln a x ln a f (x)
Trigonométricas
(senx)′ = cos x (senf (x))′ = f ′ (x) cos f (x)
(cos x)′ = −senx (cos f (x))′ = −f ′ (x) senf (x)
1
(tan x)′ = 1 + (tan x)2 = (tan f (x))′ = [1 + (tan f (x))2 ] f ′ (x)
(cos x)2
−1
(cotanx)′ = −(1 + (cotanx)2 ) = (cotanf (x))′ = − [1 + (cotanf (x))2 ] f ′ (x)
(senx)2
Inversas trigonométricas
1 f ′ (x)
(arcsenx)′ = √ , si |x| < 1 (arcsenf (x))′ = p
1 − x2 1 − f (x)2
−1 −f ′ (x)
(arccosx)′ = √ , si |x| < 1 (arc cos f (x))′ = p
1 − x2 1 − f (x)2
1 f ′ (x)
(arctanx)′ = (arctan f (x))′ =
1 + x2 1 + f (x)2
−1 −f ′ (x)
(arccotanx)′ = (arccotanf (x))′ =
1 + x2 1 + (f (x))2
1.6. APLICACIONES DE LAS DERIVADAS 27
y = (x3 + 2x + 3)4 .
Teorema 1.47. Sea f : S ⊂ R → R, derivable en a ∈ S con f ′ (a) > 0 (ó +∞) (respectiva-
mente, f ′ (a) < 0 (ó −∞)). Entonces, existe un intervalo (a−δ, a+δ) tal que ∀x ∈ (a−δ, a+δ),
x 6= a se tiene:
f (x) < f (a) si x < a (respectivamente, f (x) > f (a))
f (x) > f (a) si x > a (respectivamente, f (x) < f (a))
Demostración: Si f ′ (a) > 0, entonces por el Teorema anterior f serı́a localmente estric-
tamente creciente en un intervalo (a − δ, a + δ). Luego no tendrı́a ni máximo ni mı́nimo en
a.
Si f ′ (a) < 0, entonces por el Teorema anterior f serı́a localmente estrictamente decreciente
en un intervalo (a − δ, a + δ). Luego no tendrı́a ni máximo ni mı́nimo en a.
Luego, f ′ (a) = 0.
1
0.8
0.6
0.4
0.2
Se calculan las imágenes de estos puntos y en el (los) punto (puntos) con imagen mayor,
f alcanza el valor máximo absoluto. En el (los) punto (puntos) con imagen menor, f
alcanza el valor mı́nimo absoluto.
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0 1 2 3 4
x
Puede comprobarse que f es continua en [0, 4]. Estudiamos cada uno de los puntos:
Los puntos x ∈ (2, 4) no pueden tener derivada primera nula. Resolvemos la ecua-
ción 2 − 2x = 0 ⇒ x = 1 ∈ (0, 2). Luego calculamos f (1) = 1 .
Comparando las imágenes de los puntos calculados, obtenemos que el valor máximo
absoluto de f en [0, 4] es 2 y se alcanza en x = 4, y el valor mı́nimo absoluto de
f en [0, 4] es 0 y se alcanza en los puntos x = 0 y x = 2.
30 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
1.6
1.4
1.2
0.8
Teorema 1.54. Sea f : [a, b] → R continua en [a, b]. Supongamos que f es derivable en (a, b)
salvo quizás un punto c ∈ (a, b).
Observación 1.55. Este resultado se puede usar para determinar la existencia de extremos
relativos en puntos en los que la función no es derivable.
1.6. APLICACIONES DE LAS DERIVADAS 31
Observación 1.57.
f (x) g(x)
f (x) · g(x) = 1 o f (x) · g(x) = 1 .
g(x) f (x)
5. Si lı́m f (x) = ∞ = lı́m g(x), entonces se puede usar el Teorema para hallar
x→a,∞ x→a,∞
lı́m (f (x) − g(x)) = ”∞ − ∞”. Para ello, se escribe:
x→a,∞
1 1
g(x) − f (x)
f (x) − g(x) = 1 .
f (x)·g(x)
x3 − 3x2 + 4
1. lı́m
x→2 x2 − 4x + 4
x3 − 3x2 + 4 0 3x2 − 6x 6x − 6
lı́m 2 = “ ” = lı́m = lı́m =3
x→2 x − 4x + 4 0 x→2 2x − 4 x→2 2
π
2. lı́m x(arctgx − )
x→+∞ 2
π
π arctgx − 2
lı́m x(arctgx −
) = “∞ · 0” = lı́m 1
x→+∞ 2 x→+∞
x
1
“0” 2 −x2
= = lı́m 1+x1 = lı́m = −1
0 x→+∞ − 2 x→+∞ 1 + x2
x
f ′ (x) f (x)
Observación 1.59. De la no existencia de lı́m ′
no se implica nada sobre lı́m .
g (x) g(x)
–3 –2 –1 0 1 x 2 3
f es convexa en (−1, 2)
–3 –2 –1 0 1 x 2 3
–2
–4
f es cóncava en (−2, 1)
Definición 1.62. Una función derivable en un punto a se dice que es convexa (respectiva-
mente cóncava) en a si existe un entorno de dicho punto en el que la curva se mantiene por
encima (respectivamente, por debajo) de la recta tangente a ella en el punto x = a.
8
6
4
2
–3 –2 –1 0 1 x 2 3
–2
–4
–6
f es convexa en (−2, 2)
34 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
10
8
6
4
2
–3 –2 –1 0 1 x 2 3
–2
–4
f es cóncava en (−2, 2)
Definición 1.63. Decimos que f tiene un punto de inflexión en (a, f (a)) si f cambia en
x = a de cóncava a convexa o de convexa a cóncava.
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x
f pasa de cóncava a convexa en (1, 1)
1.6. APLICACIONES DE LAS DERIVADAS 35
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x
f pasa de convexa a cóncava en (1, 1)
Para saber si la curva corta a la ası́ntota horizontal o no, tenemos que resolver la
ecuación:
f (x) = c
f (x)
m = lı́m ∈R
x→±∞ x
los valores de x ∈ Dom(f ) en los que f ′ se anula (si f ′ (x) > 0 la función es
creciente, y si f ′ (x) < 0 la función es decreciente),
los puntos x ∈ Dom(f ) para los que la derivada no existe.
Recordemos que si x = k ∈
/ Dom(f ), entonces puede existir una ası́ntota vertical en
x = k.
8. Máximos y mı́nimos: Con las herramientas estudiadas se buscan los puntos en los
que se alcanzan los máximos y mı́nimos relativos de la función.
1.6. APLICACIONES DE LAS DERIVADAS 37
10. Puntos de inflexión: Son los puntos en los que la función pasa de cóncava a convexa
o de convexa a cóncava. Si f es 2 veces derivable en su dominio, entonces se encuentran
entre los puntos que verifican que f ′′ (x) = 0, PERO no todos los que verifican dicha
condición son puntos de inflexión.
38 TEMA 1. FUNCIONES, LÍMITES, CONTINUIDAD Y DERIVABILIDAD
Tema 2
Interpolación polinómica
2.1. Introducción
Teorema 2.1 (Unicidad del polinomio de interpolación). Si p(x) y q(x) son dos polinomios
de grado ≤ n tales que p(xi ) = q(xi ) para i = 0, 1, . . . , n con xi distintos entre si, entonces
p(x) = q(x) ∀x ∈ R.
39
40 TEMA 2. INTERPOLACIÓN POLINÓMICA
donde
x0 y0
y1 −y0
y01 = x1 −x0
y12 −y01
x1 y1 y012 = x2 −x0
y2 −y1 y123 −y012
y12 = x2 −x1 y0123 = x3 −x0 ···
y23 −y12
x2 y2 y123 = x3 −x1
y3 −y2
y23 = x3 −x2
x3 y3
.. .. .. .. ..
. . . . .
xi -2 -1 1 2
Ejemplo 2.3. Hallar el polinomio de grado ≤ 3 que interpola
yi -5 1 1 7
Comenzamos calculando los coeficientes:
xi yi yij yijk yijkl
−2 −5
1−(−5)
−1−(−2) =6
0−6
−1 1 1−(−2) = −2
1−1 2−(−2)
1−(−1) =0 2−(−2) =1
6−0
1 1 2−(−1) =2
7−1
2−1 =6
2 7
ti 0 2 4 6 8
yi 2.64 ×105 1.84×107 2.53×108 2.95×109 4.35×1010
Hallar el polinomio de interpolación que da una aproximación de la ecuación que sigue el
crecimiento celular.
42 TEMA 2. INTERPOLACIÓN POLINÓMICA
Tema 3
Propiedades:
Z Z
1. Si k ∈ R, entonces k f (x) dx = k f (x) dx.
Z Z Z
2. (f (x) ± g(x)) dx = f (x) dx ± g(x) dx
43
44 TEMA 3. LA INTEGRAL. INTEGRACIÓN NUMÉRICA
Tipo
Z trigonométricas inversas Z
dx f ′ (x)
= arctg x + C dx = arctg(f (x)) + C
1 + x2 1 + f (x)2
Z Z
dx f ′ (x)
√ = arcsen x + C p dx = arcsen (f (x)) + C
1 − x2 1 − f (x)2
1.
Z Z Z
5 5/2 5 1
dx = 3 2 dx = 2
q dx
2 + 3x2 1 + 2x 1 + ( 32 x)2
q
Z 3 r !
5 2 5 3
=√ q 2 dx = √ arctg x + C.
6 3 6 2
1+ 2x
2.
Z Z ex
ex 2 ex
√ dx = 2 q dx = arcsen + C.
4 − e2x 2
x
1 − ( e2 )2 2
46 TEMA 3. LA INTEGRAL. INTEGRACIÓN NUMÉRICA
= (x − 1) ex + C.
Z dx
u = arctgx ⇒ du = 1+x2
arctgx dx =
dv = dx ⇒ v = x
Z
x
= x arctgx − dx
1 + x2
1
= x arctgx − 2 ln |x2 + 1| + C.
Ejemplo 3.8.
Z
2x − 3
dx =
2x3 − x2 − x
dado que 2x3 − x2 − x = x (x − 1) (2x + 1)
Z
A B C
= + +
x x − 1 2x + 1
1 8
= 3 ln |x| − ln |x − 1| − ln |2x + 1| + C.
3 3
2x − 3 A B C
= + +
2x3− x2 − x x x − 1 2x + 1
A(x − 1)(2x + 1) + Bx(2x + 1) + Cx(x − 1)
=
x(x − 1)(2x + 1)
x2 (2A + 2B + C) + x(−A + B − C) − A
=
2x3 − x2 − x
A = 3
0 = 2A + 2B + C
1
2 = −A + B − C ⇒ B = −
3
−3 = −A C = − 16
3
También podemos dar valores convenientes a x para obtener un sistema de ecuaciones más
simple para A, B y C.
A1 A2 A3 Ak
+ 2
+ 3
+ ··· +
x − x0 (x − x0 ) (x − x0 ) (x − x0 )k
48 TEMA 3. LA INTEGRAL. INTEGRACIÓN NUMÉRICA
Ejemplo 3.9.
Z
2x − 3
dx =
x3 − 3x2 + 3x − 1
dado que x3 − 3x2 + 3x − 1 = (x − 1)3
Z
A B C
= + + dx
x − 1 (x − 1)2 (x − 1)3
Z
0 2 −1
= + + dx
x − 1 (x − 1)2 (x − 1)3
1 1 1
= −2 + +C
(x − 1) 2 (x − 1)2
donde se ha resuelto:
2x − 3 A B C
= + +
x3 − 3x2 + 3x − 1 x − 1 (x − 1)2 (x − 1)3
Ax2 + x(−2A + B) + (A − B + C)
=
(x − 1)3
Hay otras muchas combinaciones, como mezcla de raı́ces reales y complejas (simples y/o
múltiples). Nosotros sólo trataremos aquı́ el caso anterior, y el caso en que la raı́z compleja
1
es imaginaria pura, es decir, del tipo 2 , que ya sabemos es de tipo arcotangente.
a + x2
Consiste en hacer un cambio de variable que transforme la integral en otra que sepamos
calcular. No hay que olvidar, una vez resuelta, deshacer el cambio. Veamos algunos ejemplos:
Z
ex
√ dx = (ex = t ⇒ ex dx = dt)
4 − e2x
Z Z
dt dt
= √ q=
4 − t2
2 1 − ( 2t )2
x
= arcsen 2t + C = arcsen e2 + C.
3.3. LA INTEGRAL DEFINIDA 49
Z √
x
√ dx = (x = t6 ⇒ dx = 6 t5 dt)
3
x+1
Z
t8
= 6 dt (dividimos)
t2 + 1
Z Z
6 4 2 dt
= 6 (t − t + t − 1) dt + 6
1 + t2
t7 t5 t3
= 6 − + − t + 6 arctg(t) + C
7 5 3
7 5 1
!
x6 x6 x2 1
= 6 − + − x 6 + 6 arctg(x1/6 ) + C.
7 5 3
Por ejemplo,
Z Z Z
sen3 x t3 dt t3
dx = √ √ = dt
cosx 1 − t2 1 − t2 1 − t2
que se ha transformado en una integral de tipo racional.
También podemos intentar el cambio cosx = t o tgx = t.
Observación 3.10. Estos tres cambios no siempre funcionan, pero son fáciles de hacer.
El cambio que más habitualmente funciona es tg x2 = t, pero los cálculos son más
complicados.
2. x = tn
Entonces dx = ntn−1 dt. Ver ejemplo anterior.
Z b
f (x) dx = F (x)|ba = F (b) − F (a).
a
Z
Observemos que f (x) dx = F (x) + C, es decir, el valor de C no afecta a la aplicación
de la Regla de Barrow.
Z 2 2
2 x3 8 1 7
Ejemplo 3.12. x dx = = − = .
1 3 1 3 3 3
3.4. APLICACIONES DE LA INTEGRAL DEFINIDA 51
Z b Z b
2. Si k ∈ R, entonces k f (x) dx = k f (x) dx.
a a
Z b Z b Z b
3. (f (x) ± g(x)) dx = f (x) dx ± g(x) dx.
a a a
Z b
5. Si f (x) ≥ 0, ∀x ∈ [a, b], entonces f (x) dx ≥ 0.
a
Z b Z b
6. Si f (x) ≤ g(x) ∀x ∈ [a, b], entonces f (x) dx ≤ g(x) dx.
a a
Si la función tiene cambios de signo en [a, b], hay que separar los intervalos donde f (x)
tiene signo constante y aplicar lo anterior. Por ejemplo, si f (x) ≥ 0 en [a, c] y f (x) ≤ 0
en [c, b], entonces:
Z c Z b
A= f (x) dx − f (x) dx.
a c
En otro caso, hay que separar [a, b] en intervalos y se actúa como antes en cada intervalo.
Obsérves que todos los casos pueden escribirse de manera uniforme como
Z b
A= |f (x) − g(x)| dx.
a
Ejemplo 3.13. Calcular el área encerrada por f (x) = x, g(x) = x2 en el intervalo (0, 1) y
en el intervalo (0, 2).
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4
x
El área en el intervalo (0, 2), donde hay dos zonas diferenciadas, una en la que f está sobre
g y otra donde g está sobre f , es:
Z 2 Z 1 Z 2
2
A = |f (x) − g(x)| dx = (x − x ) dx + (x2 − x) dx
0 0 1
2
1 x3 x2 1 8 1 1
= + − = + −2− −
6 3 2 1 6 3 3 2
1 8 1 1 1 + 16 − 12 − 2 + 3
= + −2− + = = 1.
6 3 3 2 6
Ejemplo: Área del cı́rculo: La curva√ que define el contorno de un cı́rculo de centro
2 2 2
(0, 0) y radio r es x + y = r , luego y = r 2 − x2 .
3.4. APLICACIONES DE LA INTEGRAL DEFINIDA 53
1
0.8
0.6
y
0.4
0.2
Gracias a la simetrı́a de la figura, para calcular el área lo hacemos para x ∈ [0, r] y multipli-
camos por 4:
Z rp Z rr x 2
A = 4 2 2
r − x dx = 4 r 1− dx
0 0 r
( x
= sent
haciendo el cambio de variable r
dx = r cost
Z π/2
= 4r 2 cos2 t dt
0
1 + cos(2t)
usando la fórmula trigonométrica cos2 (t) =
2
Z π/2 π/2
1 + cos(2t) t sen(2t)
= 4r 2 dt = 4r 2 + = π r2.
2 2 4
0 0
Además, sabemos el tamaño de la población en el instante inicial, que sin pérdida de generali-
dad lo podemos suponer t = 0. Este valor es un dato conocido N0 y en términos matemáticos
54 TEMA 3. LA INTEGRAL. INTEGRACIÓN NUMÉRICA
de donde, Z t
N (t) − N0 = f (s)ds.
0
Z t
Esta expresión nos dice que el cambio neto de población entre 0 y t es la integral f (s)ds.
0
Distancia (m) 1 2 3 4 5
Concentración (g/m3 ) 589.3 602.7 618.5 667.2 641.2
Distancia (m) 6 7 8 9 10
Concentración (g/m3 ) 658.3 672.8 661.2 652.3 669.8
y cada parte tiene una longitud de 10−0 n que denotaremos por h. Por tanto, h = 10
n y de
aquı́ n1 = 10
1
h, que sustituyéndolo en (3.2) da
n
1 X
c̄ = c(xk )h.
10
k=1
Cuando n tiende a ser muy grande, matemáticamente decimos que n tiende a infinito, la suma
Xn Z 10
c(xk )h se parece mucho a c(x)dx. Por tanto,
k=1 0
Z 10
1
c̄ = c(x)dx,
10 0
56 TEMA 3. LA INTEGRAL. INTEGRACIÓN NUMÉRICA
es decir, la integral de c(x) en el intervalo [0, 10] dividida por la longitud de este intervalo. A
esto se le llama valor medio de c.
La concentración media entre a y b es
Z b
1
c̄ = c(x)dx.
b−a a
2
porque no se puede obtener de forma explı́cita una primitiva de e−x . Otras veces, no se
tiene una expresión de la función que se quiere integrar sino sque ólo se conocen valores de la
función en ciertos puntos.
En estas situaciones son necesarios métodos numéricos que proporcionen una aproximación
de la integral.
La idea que subyace en el método que explicaremos a continuación consiste en aproximar
el integrando f (x) por una función más sencilla, haciendo interpolación, de manera que sólo
sea necesario conocer los valores de f en determinados puntos. Además, la nueva función
(interpoladora) se integrará de una manera muy simple porque será un polinomio, y en nuestro
caso, un polinomio de grado 1. Por consiguiente, en este apartado deduciremos una fórmula
Z b
que nos da de manera aproximada el valor de f (x)dx.
a
En todo lo que sigue supondremos que el intervalo [a, b] se divide en n partes iguales, de modo
que la longitud de cada subintervalo es h = b−a n , y que f es una función continua en [a, b] de
la que conocemos sus valores en los puntos x0 , x1 , . . . , xn , que se han obtenido de dividir el
intervalo [a, b] en n partes, es decir, x0 = a, x1 = x0 + h, x2 = x1 + h,...,xn = b. Y conocemos
f (x0 ), . . . , f (xn ).
En cada subintervalo [xi , xi+1 ] vamos a aproximar f (x) por el polinomio de interpolación de
grado menor o igual que 1 en [xi , xi+1 ], es decir,
f (xi+1 ) − f (xi )
pi (x) = f (xi ) + (x − xi ).
h
3.5. INTEGRACIÓN NUMÉRICA 57
Z xi+1 Z xi+1
Entonces, f (x)dx se aproxima por pi (x)dx.
xi xi
Z xi+1 Z xi+1
f (xi+1 ) − f (xi ) f (xi+1 ) + f (xi )
f (x)dx ∼ pi (x)dx = f (xi )h + h= h.
xi xi 2 2
Ahora expresamos la integral en [a, b] de f (x) como suma de integrales en los subintervalos
[xi , xi+1 ] (por la propiedad que ya vimos de las integrales definidas) y sustituimos cada una
de estas integrales por su aproximación:
Z b X Z xi+1
n−1
f (x)dx = f (x)dx ∼
a i=0 xi
n−1
X f (xi+1 ) + f (xi )
∼ h=
2
i=0
h
[f (a) + 2f (x1 ) + · · · + 2f (xn−1 ) + f (b)].
=
2
Es decir, h/2 por la suma de f en los dos extremos a y b y la suma del doble de f en los
puntos intermedios x1 , · · · , xn−1 . A esta fórmula se la conoce como fórmula de los trapecios
Z b
porque, si f fuese positiva, f (x)dx representarı́a el área limitada por f entre a y b, y la
a
fórmula de los trapecios no es más que la suma de las áreas de todos los trapecios que se
forman uniendo por rectas los puntos (xi , f (xi )), como muestra la figura.
El error cometido al aproximar la integral por la fórmula de los trapecios, denotada por
Tn , viene dado por la estimación siguiente
Z b
′′ (b − a)3 b−a 2
f (x)dx − Tn ≤ máx |f (x)| 2
= máx |f ′′ (x)| h .
a x∈[a,b] 12n x∈[a,b] 12
La fórmula es exacta para polinomios de primer grado.
58 TEMA 3. LA INTEGRAL. INTEGRACIÓN NUMÉRICA
El error cometido por la fórmula generalizada de Simpson, denotada por Sn , es ahora del
orden de h4 Z b
IV ) (b − a)5
f (x)dx − S n ≤ máx |f (x)|
a x∈[a,b] 2880( n )4 4
y la fórmula es exacta hasta polinomios de grado tres.
Tema 4
Programación lineal
Mientras que para funciones reales de variable real la derivación ha permitido resolver el
problema de optimalidad en su conjunto, en este tema, la programación lineal resuelve proble-
mas de optimización en varias variables para funciones objetivos de un tipo muy particular:
funciones lineales.
Existen multitud de aplicaciones relativas a la programación lineal, y métodos de resolu-
ción mucho más complejos del único que aquı́ describimos, que será el método geométrico.
Ilustraremos con ejemplos el tipo de marco que se puede recoger y tratar a través de este
método.
Definición 4.1. Los problemas de óptimos para expresiones lineales donde las res-
tricciones son desigualdades dadas a partir de más expresiones lineales (inecuaciones)
conforman la PROGRAMACIÓN LINEAL.
Ejemplo 4.2. Un ejemplo de tal tipo de problemas es el siguiente:
59
60 TEMA 4. PROGRAMACIÓN LINEAL
En una granja se da una dieta “para engordar” con una composición mı́nima de 15 uni-
dades de una sustancia A y otras 15 de una sustancia B. En el mercado sólo se encuentran
dos clases de compuestos: el tipo X con una composición de una unidad de A y cinco de B, y
el tipo Y, con una composición de cinco unidades de A y una de B. El precio del tipo X es de
10 euros y el del tipo Y es de 30 euros. Se pregunta: ¿Qué cantidades se han de comprar de
cada tipo para cubrir las necesidades con un coste mı́nimo?
El planteamiento matemático es: Hallar x (latas del tipo X) e y (latas del tipo Y) que
resuelven el problema
mı́n(10x + 30y)
D
siendo
x ≥ 0, y ≥ 0,
D = (x, y) ∈ R2 x + 5y ≥ 15, .
5x + y ≥ 15
-Problema del transporte: organizar reparto de mercancı́as con coste mı́nimo de tiempo,
dinero o riesgo
Para atender el suministro diario de gas a tres ciudades C1 , C2 y C3 una empresa tiene
destinadas dos fábricas F1 y F2 que producen 20 y 30 m3 respectivamente. Las necesidades de
las tres ciudades son: 20, 18 y 12 m3 respectivamente. Si los costes de transporte por tonelada
de las industrias a las ciudades son, en cientos de euros, los indicados en la tabla adjunta,
planificar el reparto óptimo para que dicho coste sea mı́nimo.
F1 4 3 1
F2 2 2 1
C1 C2 C3
-Problema de la ruta más corta (o del viajante): ordenar etapas de un viaje con el propósi-
to de minimizar el recorrido
4.3. RESOLUCIÓN POR EL MÉTODO GEOMÉTRICO 61
Usaremos el método geométrico, que implica dominar los conceptos de función objetivo,
restricciones, región factible, rectas de nivel ası́ como la resolución de sistemas de
ecuaciones e inecuaciones lineales.
D = {(x, y) ∈ R2 | 0 ≤ x, 0 ≤ y, 3x + y ≤ 4, 2x + 3y ≤ 6}.
4.5
3.5
2.5
1.5
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4
Ahora marcamos la intersección de los semiplanos (región coloreada) que verifican todas las
desigualdades que definen D.
4.5
3.5
2.5
1.5
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4
son rectas, y todas son paralelas entre si cuando la constante cambia (dicha constante es el
valor de la función objetivo a lo largo de todos los puntos (x, y) de esa recta),
Dicha función, “trasladada paralelamente” sobre la región genera los valores posibles de la
constante. Ası́, los valores mayores y menores se obtienen en los extremos, por ejemplo, el
máximo saldrı́a de...
4.5
3.5
2.5
1.5
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4
Paso 1: calculamos los vértices Esto es, los puntos de la intersección dos a dos de las
“ecuaciones asociadas” d1 x + d2 y = d3 a las inecuaciones d1 x + d2 y < (>, ≤, ≥) d3 que definen
el dominio (ojo: asegurarse que están en la región factible).
En el caso de la región D del dibujo anterior se trata de los puntos (0, 0), (0, 2), (4/3, 0),
(6/7, 10/7).
E = {(x, y) ∈ R2 | 0 ≤ x, 0 ≤ y, 3x + y ≥ 4, 2x + 3y ≥ 6}.
el primero tiene solución mientras que el segundo no posee solución: f tiene mı́nimo sobre E
pero no máximo, de hecho veremos que sup f (x, y) = +∞.
E
Ahora se puede comprobar que, si bien lı́neas que minimizan el valor constante= x + y
tienen un “tope” pues van descendiendo y el último punto factible es el (6/7, 10/7), en sentido
ascendente (generando valores cada vez mayores constante= x + y) no tiene máximo finito:
5
4.5
3.5
2.5
1.5
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4
Existen puntos (x, y) ∈ E tan grandes como queramos, haciendo, como anunciamos, que
sup f (x, y) = +∞.
E
Tema 5
Estadı́stica descriptiva
5.1. Introducción
En un curso general de Matemática Aplicada suele haber, por necesidades de sus recepto-
res, un bloque de estadı́stica. La estadı́stica pretende extraer información relevante a partir de
una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces
existen relaciones entre los mismos, medidas caracterı́sticas que apuntan a cierta dirección, o
que señalan cuánto se ha alejado la muestra de un valor central.
El objetivo de éste y los siguientes temas es poder obtener este tipo de información de
tablas dadas.
65
66 TEMA 5. ESTADÍSTICA DESCRIPTIVA
Supongamos dada la siguiente tabla, donde las variables C1 , C2 , ..., Ck son posibles moda-
lidades.
Modalidades F. abs. F. relativas Porcentajes
C1 n1 f1 100f1
C2 n2 f2 100f2
.. .. .. .. (5.1)
. . . .
Ck nk fk 100fk
Total N 1 100 %
Se puede completar la tabla con las frecuencias acumuladas para facilitar posteriores cálcu-
los.
Ejemplo: Distribución del número de hijos en una muestra de 100 familias españolas:
xi ni Ni fi Fi pi
0 14 14 0′ 14 0′ 14 14 %
1 26 40 0′ 26 0′ 40 26 %
2 30 70 0′ 30 0′ 70 30 % (5.4)
3 16 86 0′ 16 0′ 86 16 %
≥4 14 100 0′ 14 1 14 %
Total 100 1 100 %
Los datos se agrupan en clases, que van a ser intervalos semiabiertos, [e0 , e1 ), [e1 , e2 ),
· · ·, [ek−1 , ek ). Se considera que todos los individuos de una misma clase tienen el valor que
señala la marca de clase, siendo
ei−1 + ei
ci = , i = 1, · · ·, k. (5.5)
2
Clases Marcas ni Ni fi Fi pi Pi
[e0 , e1 ) c1 n1 N1 f1 F1 p1 P1
[e1 , e2 ) c2 n2 N2 f2 F2 p2 P2
.. .. .. .. .. .. .. .. (5.6)
. . . . . . . .
[ek−1 , ek ) ck nk Nk fk Fk pk Pk
Total N 1 100 %
68 TEMA 5. ESTADÍSTICA DESCRIPTIVA
1
Tomado de la página web: http://www.me.gov.ve/SegundaEtapa/Glosario/matematica.htm
70 TEMA 5. ESTADÍSTICA DESCRIPTIVA
Variable discreta
Diagramas de barras. Cuando la variable es discreta y toma pocos valores, el gráfico
adecuado es el diagrama de barras o rectángulos. Se construye de la misma forma que para
los caracteres cualitativos pero ahora sobre el eje X se sitúan los valores de la variable.
Uniendo los extremos superiores de las barras o los puntos medios de los lados superiores
de los rectángulos se obtiene el polı́gono de frecuencias simples.
Ejemplo: Distribución del número de hijos en una muestra de 100 familias españolas:
xi ni fi
0 14 0′ 14
1 26 0′ 26
(5.9)
2 30 0′ 30
3 16 0′ 16
≥4 14 0′ 14
Los polı́gonos de frecuencias simples para ni y fi (para ser precisos, y dado que cualquier
columna proporcional es válida en estas representaciones, se aclara qué polı́gono de frecuencias
se está construyendo: absolutas, relativas o porcentuales) vienen dados simplemente por:
5.2. DISTRIBUCIONES ESTADÍSTICAS. REPRESENTACIONES GRÁFICAS 71
Variable continua
Histogramas. Como los datos usados en este caso proceden de una variable continua, se
mantiene el tamaño real de la base de cada modalidad para no generar gráficas equı́vocas.
Precisamente por ello serı́a igualmente tendencioso poner una altura proporcional a la fre-
cuencia absoluta o cualquier otra (un intervalo con ni grande puede deberse simplemente a
ser demasiado grande). De modo que sobre cada intervalo de clase se levanta un rectángulo
de área igual o proporcional a la frecuencia del correspondiente intervalo. Esto implica
que leer meramente las alturas en un histograma es incorrecto, la información está codificada
en las áreas.
Si las amplitudes son iguales, entonces las alturas se toman iguales a las frecuencias.
Amplitudes diferentes: En la clase [ei−1 , ei ), considerando área igual a la frecuencia absolu-
ta (también valdrı́a cualquier otra columna proporcional: la relativa o la porcentual), tenemos
hi = naii , donde hi es la altura del rectángulo correspondiente a esa clase, y ai la amplitud.
Ejemplo: Tabla, histograma y polı́gono de frecuencias acumuladas en las calificaciones
de 200 alumnos:
Notas ni pi hi
[0, 3) 48 24 % 8
[3, 5) 69 34′ 5 % 17′ 25
(5.10)
[5, 7) 55 27′ 5 % 13′ 75
[7, 9) 20 10 % 5
[9, 10) 8 4% 4
72 TEMA 5. ESTADÍSTICA DESCRIPTIVA
Uniendo los puntos medios de los lados superiores de los rectángulos se obtiene el polı́gono
de frecuencias simples enmarcado en el histograma: para ser precisos, y dado que
cualquier columna proporcional es válida en estas representaciones, se aclara qué polı́gono de
frecuencias se está construyendo (absolutas, relativas o porcentuales), en este caso el de los
porcentajes relativos.
Porcentaje de individuos cuyo peso es menor o igual que 69: como 69 ∈ [60, 80), se calcula
la recta que pasa por (60, 59) y (80, 91) y se sustituye la abscisa por 69:
91 − 59
y = 59 + (69 − 60) = 73′ 4 %. (5.12)
80 − 60
Media aritmética
Se suele representar por x̄, aunque también por µ e incluso abusando de la notación
probabilista EX (esperanza de la variable X). Es el valor de tendencia central de mayor
interés.
Caso discreto
Sea X una variable discreta que toma los valores x1 , x2 , · · ·, xk con frecuencias absolutas
n1 , n2 , · · ·, nk resp. La media aritmética de X viene dada por
k
P
xi ni k
X
i=1
x̄ = = xi fi . (5.13)
N
i=1
xi ni Ni Pi
2 3 3 15
4 6 9 45
5 5 14 70 (5.14)
6 3 17 85
8 1 18 90
10 2 20 100
2·3+4·6+5·5+6·3+8·1+10·2
La nota media es x̄ = 20 = 5′ 05.
Propiedades
k
P
1) La suma de todas las desviaciones a la media es cero: (xi − x̄)ni = 0.
i=1
Diámetro (zi ) −3 −2 −1 0 1 2 3
(5.16)
ni 10 15 19 21 14 13 8
Caso continuo
Caso discreto
Caso continuo
100
91
59
Pi
10
20 40 60 80 100
peso
5.3. MEDIDAS DE POSICIÓN Y DISPERSIÓN 77
Recuérdese que la recta que pasa por los puntos (x0 , y0 ) y (x1 , y1 ) viene dada, por ejemplo,
como y − y0 = xy11 −y
−x0 (x − x0 ).
0
En este caso la mediana está en el intervalo [40, 60). Es aquel x tal que
59 − 10
50 − 10 = (x − 40) ⇒ x = 41′ 6. (5.18)
60 − 40
Fı́sica 3 9 Biologı́a 3 6 9
(5.19)
ni 14 14 ni 5 6 7
Estudiaremos
el recorrido,
la desviación media,
la varianza,
la desviación tı́pica y
Recorrido
Desviación media
Dada una caracterı́stica de tendencia central C, los valores |xi − C| representan la des-
viación a C. Estas cantidades definen una variable estadı́stica que se usa como medida de
dispersión. En concreto, la desviación media es la media aritmética de las desviaciones a la
media:
Pk
|xi − x̄|ni
i=1
Dx̄ = . (5.21)
N
Problema: los valores absolutos no son muy adecuados para realizar cálculos y posteriores
estudios.
Varianza
Se define como la media aritmética de los cuadrados de las desviaciones a la media:
Pk
(xi − x̄)2 ni
s2X = i=1 . (5.22)
N
Si la varianza es nula, todos los valores de la variable coinciden con la media, es decir,
dispersión nula. Cuanto más alejadas estén las observaciones de la media, mayor será la va-
rianza. A veces también aparece (por ejemplo en muchas calculadoras) expresada como σn2 .
Teorema 5.1 (de König). la varianza es la diferencia entre la media de los cuadrados y el
cuadrado de la media, es decir,
k
P k
P
(xi − x̄)2 ni xi 2 ni
i=1 i=1
= − x̄2 (5.23)
N N
Problema: como todas las desviaciones están elevadas al cuadrado, la unidad de medida
de la varianza viene dada en cuadrados de las unidades de los datos originales.
Desviación tı́pica
Se define como la raı́z cuadrada positiva de la varianza:
1/2
Pk
2
(xi − x̄) ni
i=1
sX = . (5.24)
N
5.3. MEDIDAS DE POSICIÓN Y DISPERSIÓN 79
2) Si Y = X + c, entonces sY = sX .
Tipificación de la variable
En ocasiones interesa deducir el valor relativo de un dato respecto al grupo que pertenece,
usando para ello la media y desviación tı́pica del grupo.
Ejemplo. Se quiere asignar un puesto de trabajo entre dos candidatos. La plaza la consigue
el que obtenga mejor calificación en una prueba que ambos realizaron en sus ciudades de proce-
dencia. El candidato A obtuvo 55 puntos sobre 80, el candidato B 7 sobre 10 puntos. Son cono-
cidas las medias y las desviaciones tı́picas de ambas pruebas: x̄A = 45, sA = 12; x̄B = 6, sB = 2.
¿Quién consigue entonces el puesto de trabajo? O dicho más generalmente: ¿cómo com-
parar datos de dos muestras distintas asociadas a un mismo tipo de estudio? Se hace un
reescalamiento, denominado tipificación.
Se llama tipificación de la variable X, que toma los valores x1 , x2 , . . . , xk , a la trans-
formación
xi − x̄
zi = . (5.28)
sX
A la variable Z que toma los valores z1 , z2 , . . . , zk , se le llama variable tipificada.
Gracias a las propiedades de la media y desviación tı́pica, la variable tipificada tiene media
nula y desviación tı́pica uno (y ahora sı́ podemos compararlas).
Notamos ZA y ZB a dos nuevas variables estadı́sticas, las tipificaciones de las calificaciones
habidas en las respectivas ciudades. Ası́, las notas de ambos individuos “tipificadas” son:
xA − x̄A xB − x̄B
zA = = 0′ 83; zB = = 0′ 5. (5.29)
sA sB
Estos valores ahora sı́ son comparables, y elegimos el valor mayor, es decir, el candidato de la
ciudad A como el más apto.
Tema 6
Variables estadı́sticas
bidimensionales
6.1. Introducción
Los individuos de una población pueden ser clasificados atendiendo a dos caracteres si-
multáneamente. Por ejemplo, pulso y temperatura de los enfermos de un hospital, producción
y venta de una fábrica, etc.
El objetivo de este tema será mostrar algunos resultados sobre el estudio de la relación
entre dos caracterı́sticas dadas en el mismo problema y cómo diagnosticar posibles valores
esperados (cabe decir que al contrario que la interpolación dada en el primer bloque de la
asignatura, ahora se usarán técnicas de aproximación).
81
82 TEMA 6. VARIABLES ESTADÍSTICAS BIDIMENSIONALES
q
P p
P
ni· = nij es la frecuencia absoluta marginal de X, y n·j = nij es la frecuencia
j=1 i=1
absoluta marginal de Y.
Se verifica que
p
X q
X
ni· = N, n·j = N. (6.3)
i=1 j=1
X\Y 0 1 2 3 4 5 6 Total
0 2 0 4 3 1 0 0 10
1 3 0 9 0 0 3 0 15
2 0 6 0 6 0 0 1 13
(6.4)
3 1 4 0 0 2 1 0 8
4 0 0 2 0 1 0 0 3
5 0 0 0 1 0 0 0 1
Total 6 10 15 10 4 4 1 50
6.3. RELACIONES ENTRE LAS VARIABLES X E Y 83
xi yi ni
0 0 2
0 2 4
0 3 3
0 4 1
1 0 3
1 2 9
1 5 3
2 1 6
(6.5)
2 3 6
2 6 1
3 0 1
3 1 4
3 4 2
3 5 1
4 2 2
4 4 1
5 3 1
En la tabla de doble entrada se puede calcular, por ejemplo,
0 · 10 + 1 · 15 + 2 · 13 + 3 · 8 + 4 · 3 + 5 · 1
x̄ = = 1′ 64,
Pk 50
2
i=1 xi ni·
s2X = − x̄2 = 1′ 55. (6.6)
N
k
P k
P
(xi − x̄)(yi − ȳ)ni xi yi ni
i=1 i=1
sXY = = − x̄ȳ. (6.7)
N N
84 TEMA 6. VARIABLES ESTADÍSTICAS BIDIMENSIONALES
2- Curva de regresión. Buscamos una curva y = f (x) cuya gráfica se adapte lo más
posible a la nube de puntos, de manera que conocido el valor de una de las variables podamos
obtener un valor aproximado de la otra mediante esta curva. Ası́ podemos encontrar regresión
lineal, parabólica, exponencial, etc.
Vamos principalmente a analizar la regresión lineal, es decir, el caso de la recta que más
cerca pase de los puntos dados (esto se hace midiendo y minimizando la distancia, en
cierto sentido, de la recta a la nube de puntos; según qué se minimice se pueden obtener
distintas rectas).
2
4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9
0′ 53
y−5= (x − 7) ⇒ y = 0′ 57x + 1′ 01. (6.11)
0′ 93
2
4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9
Esta recta, que minimiza la distancia (en el sentido de mı́nimos cuadrados) de la nube
de puntos a ella más que cualquier otra recta, sirve para “aventurar” aproximaciones de
valores buscados estén o no en los datos iniciales.
Por ejemplo, la nota “más esperada” por esta vı́a en Quı́mica para un alumno con un 8
en Matemáticas será 0′ 57 · 8 + 1′ 01 = 5′ 57.
con lo que si hacemos el cambio de variables z = log y, entonces z = (log a)x + log c, es
decir, lo que tendremos que calcular es la recta de regresión para las variables (x, z) y
después deshacer el cambio (tomando exponenciales) para finalmente obtener los valores
de a y c.
Ejemplo. El ingreso de ventas, en billones de dólares, de una determinada marca de
ordenadores viene dada por la siguiente tabla, donde t representa años medidos desde
el año 2000:
t 0 2 4 7
(6.12)
y 3 4 11 25
Obtener la curva exponencial de regresión que mejor se ajuste a los datos anteriores.
Para ello, consideramos la tabla siguiente
t 0 2 4 7
(6.13)
z 0.4771 0.6020 1.0413 1.3979
donde z está representando el logaritmo de x (en este ejemplo se está usando el logaritmo
en base diez).
Calculando la recta de regresión lineal correspondiente a la tabla anterior, obtenemos
z = 0,13907x + 0,42765, con lo que entonces
y ası́ la curva de regresión exponencial que se ajusta a los datos dados es y = 2,677(1,3774)x .
Correlación nula si no existe ninguna relación entre las variables (variables incorreladas).
Correlación de tipo funcional cuando todos los puntos de la nube de puntos pertenecen
a la curva de regresión.
Supongamos que la regresión es lineal. Analizamos como ı́ndice de la correlación entre las
variables X e Y el coeficiente de correlación lineal de Pearson:
sXY
r= . (6.14)
sX sY
Se puede probar que −1 ≤ r ≤ 1. Además:
Si |r| = 1, ambas rectas de regresión son iguales y hay regresión de tipo funcional entre
las variables.
Probabilidad. Distribuciones
binomial y normal
7.1. Introducción
En este tema trataremos algunas cuestiones básicas sobre Probabilidad. Tanto la Pro-
babilidad como la Estadı́stica son dos campos de las Matemáticas que proporcionan útiles
herramientas para el estudio de las ciencias de la vida. Muchos fenómenos de la naturaleza no
son deterministas, es decir, conllevan una aleatoriedad. La teorı́a de la Probabilidad estudia
las leyes que modelan esa aleatoriedad mientras que la teorı́a estadı́stica analiza los datos con-
cretos obtenidos de los experimentos; ambas son las caras de una misma moneda que deben
conocerse para entender mejor la realidad que se estudia en su conjunto.
Los primeros investigadores de la probabilidad de sucesos, sobre todo aplicada a los juegos
de azar, fueron los franceses Pierre Fermat (1601-1665) y Blaise Pascal (1623-1662).
El nombre de azar proviene de los juegos de dados, donde aparecı́a pintada la flor de
azahar y estaba asociada a la buena suerte, significaba una buena partida. Incluso el nombre
de suceso aleatorio, es decir, suceso del cual es imposible predecir el resultado, proviene del
latı́n “aleas”que significa dado. Sin embargo, ya un siglo antes Galileo estudió problemas
sencillos como porqué es mejor apostar a sacar un 10 que a sacar un 9 en una tirada de tres
dados. Antes que Galileo también se dedicó al estudio de estos problemas Cardano, quien
incluso escribió un libro sobre los juegos de dados en el que llega a explicar cómo hacer
trampas para ganar.
La introducción de Pascal y Fermat en este tema vino de la amistad de Pascal con un
jugador profesional, conocido como Caballero de Meré, quien propuso a Pascal una serie de
problemas sobre distintas situaciones en las apuestas de dados. Pascal enviaba los problemas a
Fermat, con quien le unı́a una buena amistad y ası́ mantuvieron una continua correspondencia
sobre ideas y métodos. Pierre Simon Laplace (1749-1827) construyó la formulación definitiva
de la teorı́a general de la probabilidad. Laplace definió el cálculo de probabilidades como “el
sentido común expresado con números”.
Este tema consta de las siguientes secciones:
1. Probabilidad.
89
90 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL
7.2. Probabilidad
Llamamos experimento a cualquier proceso que genera un conjunto de datos. Un expe-
rimento se dice aleatorio cuando se puede repetir en las mismas condiciones, sus posibles
resultados son conocidos previamente y el resultado de cada prueba depende del azar. Un
experimento se dice determinista cuando al repetirlo en las mismas condiciones, produce
siempre el mismo resultado.
Son experimentos aleatorios
- -El número de hijos de una pareja, el sexo del mayor, su estatura o el número de años que
vivirá.
- -El número de veces que hay que lanzar una moneda hasta que salga cara.
El espacio muestral, que se denota por Ω, es el conjunto de todos los posibles resultados
de un experimento aleatorio. Cualquier subconjunto del espacio muestral se denomina suceso.
Se llama suceso elemental al constituido por un solo punto del espacio muestral.
Example En el lanzamiento del dado una vez, Ω{1, 2, 3, 4, 5, 6}. Un suceso elemental es,
por ejemplo, “que salga el 4”, es decir, A = {4}. Un suceso no elemental es “que salga un
número impar”, que se representará como B = {1, 3, 5}.
Un espacio muestral puede ser discreto (formado por puntos sueltos) o continuo. Los es-
pacios discretos pueden tener un número finito o infinito de valores. Algunos ejemplos,
- -Número de veces que hay que lanzar una moneda hasta que salga cara, Ω = {1, 2, ..., n, ...}.
- -Tiempo de espera de una persona en la parada del autobús, Ω = [0, 40] (si la frecuencia
del autobús es de 40 minutos).
Definición 7.1. Se llama probabilidad a una regla que asocia a cada suceso, A, del espacio de
sucesos, un número, que representamos por P (A) y llamamos probabilidad de A y que cumple
los siguientes axiomas:
2. P (Ω) = 1.
P (A ∪ B) = P (A) + P (B).
Definición 7.2. Se llama variable aleatoria a toda regla que asocia a cada elemento de un
espacio muestral, Ω, un número real.
se puede considerar la variable aleatoria Z que indique “el número de caras que salen”. Ası́,
por ejemplo,
Las variables aleatorias pueden ser discretas y continuas. A cada una de ellas y los ejemplos
más relevantes dedicamos las siguientes preguntas.
1. En cada prueba del experimento sólo son posibles dos resultados a los que se suele llamar
éxito y fracaso.
92 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL
3. La probabilidad del éxito es constante, esto es, no varı́a de una prueba a otra. Se
representa por p.
1. En gran número de situaciones hay una fuerte influencia a eliminar por igual a lo que se
desvı́an en análoga medida de la media, sea esta desviación por arriba o sea por debajo.
2. Se observa que muchos fenómenos son sumas de efectos parciales independientes, que
estos efectos parciales pueden estar sesgados, pero que la suma sı́ se ajusta a una dis-
tribución simétrica que va disminuyendo de forma regular al alejarse de la normal. Por
ejemplo, en el peso de las personas de una población, influye la componente genética, el
clima, la alimentación,..; algunas de estas influencias puede no distribuirse normalmente,
pero sı́ lo hace el peso. Este hecho fue justificado matemáticamente en un importan-
te teorema llamado Teorema Central del Lı́mite, que nos dice que si se suman un
número grande de variables aleatorias independientes, idénticamente distribuidas con
media y varianza finitas, entonces tras un cambio de variable adecuado, la distribución
de la variable resultante es aproximadamente, la normal.
7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCIÓN NORMAL 93
La distribucón continua más importante es la normal, porque es la que aparece más frecuen-
temente. Su funcón de densidad tiene esta forma
Definición 7.3. La función de densidad de una variable aleatoria, X, con distribución normal
de parámetros µ y σ, que denotaremos N (µ, σ) es
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) − ∞ < x < +∞.
σ 2π
Puede observarse que la función f (x) es una función de densidad, esto es,
Z +∞
1 1 x−µ 2
f (x) ≥ 0, √ e− 2 ( σ ) dx = 1,
σ 2π −∞
y que tiene además las siguientes propiedades:
2. El máximo está en x = µ.
Z b
1 1 x−µ 2
P (a ≤ X ≤ b) = F (b) − F (a) = √ e− 2 ( σ
)
dx,
σ 2π a
Existe una tabla que contiene los valores de estas integrales, de la que hablamos en la
Sección siguiente, para la normal N(0,1). Para el caso general de una variable normal X de
media µ y desviación tı́pica σ, se hace el cambio de variable
X −µ
Z= ,
σ
x−µ
F (x) = P (X ≤ x) = P (σZ + µ ≤ x) = P (Z ≤ ),
σ
1. P (Z ≤ 1,43)
2. P (Z ≤ −1,34)
3. P (1,18 ≤ Z ≤ 1,56)
96 TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL
4. P (−1,65 ≤ Z ≤ −1,24)
5. P (−0,18 ≤ Z ≤ 1,73)
6. P (Z ≤ k) = 0,75
7. P (Z ≤ k) = 0,35
Tema 8
97
98 TEMA 8. TEORÍA DE MUESTRAS Y DISEÑO DE EXPERIMENTOS
estrato.
Ejemplo: En una ciudad de sabe que el 60 % son mujeres y el 40 % hombres. Se quiere
realizar una encuesta sobre la intención de voto escogiendo una muestra de 1000 personas.
Para ello, previamente se divide la población en dos estratos: mujeres y hombres, y luego, se
extrae de cada estrato una muestra proporcional, es decir, en este caso, 600 mujeres y 400
hombres.
Entonces:
1.
36,9 − 37
P (X̄ ≤ 36,9) = P Z≤ = P (Z ≤ −1,2) = 1−P (Z ≤ 1,2) = 1−0,8849 = 0,115.
0,083
2.
36,5 − 36,9 37,5 − 36,9
P (36,5 ≤ X̄ ≤ 37,5) = P ( ≤Z ≤ ) = P (−4,82 ≤ Z ≤ 7,23) = 1.
0,083 0,083
1. Se elige una persona al azar. Hallar la probabilidad de que su CI esté entre 100 y 103.
100 − 100 103 − 100
P (100 ≤ X ≤ 103) = P ≤Z≤ = P (0 ≤ Z ≤ 0,27) = 0,1064.
11 11
100 TEMA 8. TEORÍA DE MUESTRAS Y DISEÑO DE EXPERIMENTOS
σ 11
µ = 100, √ = √ = 2,2.
n 25
Ejemplo: Se sabe que un nuevo fármaco ha curado al 85 % de los enfermos a los que se
les ha aplicado. Calcular la distribución en el muestreo de la proporción de enfermos curados
para muestras de tamaño 30, 100 y 1000 personas.
La proporción de enfermos curados es p = 85, ası́ que en todos los casos µ = 0,85.
Discutamos el valor de la desviación tı́pica y la distribución muestral según el valor n en cada
muestra:
q
0,85 0,15
1. n = 30. Entonces σ = 30 = 0,065, y la distribución muestral sigue la ley
N (0,85; 0, 065).
2. n = 100. En este caso, σ = 0,036, y la distribución muestral sigue la ley N (0,85; 0, 036).
3. n = 100. En este caso, σ = 0,011, y la distribución muestral sigue la ley N (0,85; 0, 011).
8.4. DISTRIBUCIÓN EN EL MUESTREO DE LA DIFERENCIA DE MEDIAS 101
36 − 31
P (X̄1 −X̄2 > 36) = P (Z̄1 −Z̄2 > ) = P (Z̄1 −Z̄2 > 0,58) = 1−P (Z̄1 −Z̄2 ≤ 0,58) = 1−0,719 = 0,281.
8,61
ambos grupos son seguidos durante igual periodo de tiempo (si el grupo de control consta
de individuos diagnosticados y tratados con anterioridad al estudio actual (controles
históricos) no son válidos),
partición al azar del grupo único en los dos grupos, lo que implica que el tratamiento
ha de estar controlado (a cada individuo de la muestra inicial se le debe poder asignar
un tratamiento u otro a voluntad del investigador).
8.5. ENSAYOS CLÍNICOS 103
Control del sesgo ocurrido por la aplicación de los tratamientos: tipos de ensayos
clı́nicos.
Para evitar que las diferencias obtenidas en el tratamiento se deban al “rito” y no al
tratamiento en sı́, a ambos grupos se le deben aplicar las mismas técnicas fı́sicas. En este
caso, el grupo de control pasa a llamarse grupo placebo, por aplicarse un tratamiento
placebo (ficticio). Esta técnica debe complementarse con la técnica de simple ciego en la
que el paciente no sabe si recibe el tratamiento efectivo o el placebo. También se puede usar la
técnica de doble ciego, en la que ni el paciente ni el investigador conocen qué enfermos son
tratados con uno u otro tratamiento. Existe también la técnica de triple ciego (en la que ni
el paciente, ni el investigador, ni el comité que monitoriza el estudio conocen el tratamiento),
pero es bastante complicada de aplicar.
Señalar también que, para evitar que la significación sea debida a distinta pericia en la
aplicación de los tratamiento, los dos tratamientos han de ser aplicados por el mismo equipo
y con un similar entrenamiento en ambos.
De ese modo, podemos distinguir los siguientes tipos de ensayo:
Control del sesgo ocurrido por la selección de los individuos: selección de las
muestras.
Los estudios clı́nicos han de ser:
104 TEMA 8. TEORÍA DE MUESTRAS Y DISEÑO DE EXPERIMENTOS
b) diseños cruzados (en muestras apareadas): la mitad de los individuos reciben los
tratamientos en un orden y la otra mitad en el orden contrario.
e) diseños secuenciales: los individuos van entrando uno a uno en la experiencia y con
cada entrada se realiza un test para decidir si se toma una decisión o un nuevo individuo.
Los diseños no secuenciales saben de antemano el tamaño del ensayo o se van incluyendo
alternativamente individuos en el ensayo hasta que alguna circunstancia ajena a la
efectividad de los tratamientos en los individuos ya tratados le aconseja detenerlo (coste,
tiempo,..).
Medida de la respuesta
Para determinar la eficacia relativa de los tratamientos a comparar es crucial decidir
qué tipo de resultado va a medirse. La medida de la respuesta al tratamiento puede ser un
suceso clı́nico (curación, muerte, mejorı́a manifiesta,...) o una medida indirecta (resultado
numérico de un test psicológico, cambio en la presión sanguı́nea, nivel de lı́pidos en suero,...),
y debe tener las siguientes caracterı́sticas deseables:
Tamaño de la muestra
Depende del diseño estadı́stico utilizado, del tipo de respuesta medida (cualitativa o cuanti-
tativa), de la distribución estadı́stica de la respuesta, de si se desea probar que los tratamientos
son distintos o si son iguales, de la razón de asignación, de si el test es de una cola o de dos, del
error α del test, de la mı́nima diferencia δ importante que se desea detectar entre los valores
de los parámetros que son objeto de test en las dos poblaciones,...
De Fase II: estudios en enfermos para evaluar la eficacia del producto y ampliar la
información sobre su seguridad y dosificación.
De Fase IV: estudios con medicamentos ya comercializados para valorar nuevos aspectos
de los mismos.
Bibliografı́a
[1] A. Martı́n Andrés y J. de D. Luna del Castillo. Bioestadı́stica para las Ciencias de la
Salud. Ed. Norma S. A., 1994.
107
108 BIBLIOGRAFÍA
Tema 9
Inferencia estadı́stica
109
110 TEMA 9. INFERENCIA ESTADÍSTICA
Estimaciones por intervalos: se persigue dar un intervalo de valores, alguno de los cuales
es el verdadero valor del parámetro desconocido, con una cierta seguridad de que la
afirmación sea verdadera.
El estimador se llama insesgado cuando su media coincide con el valor del parámetro
que se va a calcular y se llama sesgado en caso contrario.
El estimador se dice que es tanto más eficiente cuanto menor sea su varianza, y tanto
más no eficiente cuanto mayor sea su varianza.
mandar a hacer de nuevo el análisis. Muy diferente hubiese sido la situación si en sus informes
hubieran usado intervalos como: A1 (85 ± 15) mg/dl; A2 (75 ± 4) mg/dl y A3 (90 ± 20)
mg/dl. En este caso hay coincidencia entre los tres informes, A1 dice entre 70 y 100, A2 dice
entre 71 y 79 y A3 dice entre 70 y 110. Hay una zona donde los tres coinciden, cosa imposible
de ver si se hubieran usado estimadores puntuales.
Por su parte, en la industria farmacéutica, lo normal es trabajar con lı́mites superiores
e inferiores en las composiciones quı́micas de los medicamentos, tanto para el proceso pro-
ductivo, como para su posterior control de calidad. La idea es siempre informar o establecer
la probabilidad de que el verdadero valor caiga dentro del intervalo informado. Por tanto, la
forma más prudente de informar es utilizando intervalos.
Describimos entonces los siguientes conceptos asociados:
1. Intervalo de confianza: intervalo que contiene el valor del parámetro con una cierta
probabilidad.
5. Valores crı́ticos: Son los valores de la abscisa que limitan el intervalo de confianza.
En los dos primeros casos se llaman intervalos de un cola y en el tercer caso se denomina inter-
valo de dos colas. El coeficiente Zα toma distintos valores según se este calculando intervalos
de una o dos colas.
112 TEMA 9. INFERENCIA ESTADÍSTICA
En la siguiente tabla presentamos los valores crı́ticos, Zα o Zα/2 , para los porcentajes más
habituales en el caso de una y dos colas.
45 son asiduas usuarias del mismo. Hallar un intervalo de confianza al nivel del 99 % para la
proporción de usuarios del citado desodorante en una comarca muy poblada.
Supongamos que la población de partida sigue una distribución normal N (µ, σ) y que
queremos estimar el parámetro µ mediante un intervalo de dos colas con un nivel de confianza
1 − α. Para ello escogemos una muestra aleatoria
de tamaño
n y media muestral x̄. Entonces
σ
X̄ es una variable aleatoria que sigue una N µ, √ .
n
σ σ
IC = x̄ − Zα/2 · √ , x̄ + Zα/2 · √
n n
ŝ ŝ
IC = x̄ − Zα/2 · √ , x̄ + Zα/2 · √ ,
n n
n
siendo ŝ2 la cuasivarianza muestral. Recordemos que ŝ2 = s2 n−1 , siendo s2 la varianza
de la muestra.
2′ 2 2′ 2
10 − Zα/2 √ , 10 + Zα/2 √
50 50
En la figura siguiente vemos el intervalo de confianza que hemos calculado. Para este
intervalo calculamos el area que encierra la función de distribución de Gauss obteniendo un
área de 0.9480 lo cual es una buena aproximación, ya que querı́amos que el intervalo de
confianza fuera al 95 %. (Solución: (9’39, 10’60).)
114 TEMA 9. INFERENCIA ESTADÍSTICA
Aplicación: Se tomaron 200 muestras aleatorias de presión sistólica a niños cuyos padres
son hipertensos, obteniéndose una media de 107 mmHg y una desviación tı́pica de 7 mmHg.
Luego se tomaron 100 muestras de niños cuyos padres tiene la presión sanguı́nea normal, y
se obtuvo una media de 98 mmHg con una desviación tı́pica de 6 mmHg. Obtener los lı́mites
de confianza del 95 % a la diferencia de medias. (Solución (7’4755,10’5245)).
El error máximo E viene dado por el radio del intervalo de confianza en cada caso. Por
σ
ejemplo, en el caso de la media, es E = Zα/2 · √ . Por tanto, despejando obtenemos que el
n
tamaño mı́nimo de la muestra deber ser:
Zα/2 σ 2
n= .
E
116 TEMA 9. INFERENCIA ESTADÍSTICA
Tema 10
Contraste de hipótesis
117
118 TEMA 10. CONTRASTE DE HIPÓTESIS
el estadı́stico de contraste es
X − µ0
Z= √ ,
σ/ n
que sigue la ley N(0,1) si H0 es cierta. En esta fórmula, X es la media muestral.
p̂ − p0
Z=p ,
p0 q0 /n
H0 : µ1 = µ2 frente a H1 : µ1 6= µ2
10.1. CONTRASTE DE HIPÓTESIS 119
Para muestras pequeñas de tamaño n < 30, se puede incrementar la eficacia del test
reemplazando la distribución Normal para la determinación de las regiones de aceptación y
crı́tica por la llamada distribución t con n−1 grados de libertad, introducida por W.S. Gosset,
que usó una pluma de marca Student, lo que le dio nombre a la distribución.
Esta distribución tiene la misma forma que la Normal, simétrica respecto del origen,
acampanada, con media nula, pero más aplastada. Por ello, los valores bajo los que se encierra
una determinada área son mayores y las regiones de aceptación para un determinado nivel de
significación son mayores también.
Frente a esta hipótesis, se plantea la hipótesis alternativa que denotamos por H1 , que en
este caso va a ser
H1 ≡ µ 6= 4950.
El significado de esta alternativa supone admitir que la diferencia entre el valor del esti-
mador y el valor del parámetro no se debe a un error de muestreo, sino que la hipótesis nula
no es correcta. En otras palabras, si la hipótesis nula fuera correcta, se habrı́a producido un
suceso suficientemente improbable como para rechazar dicha hipótesis, lo cual supone admitir
que la muestra seleccionada pertenece a otra población con una media distinta de 4950.
II-Decisiones posibles
Fijadas las hipótesis nula y alternativa, al fabricante de baterı́as se le ofrecen las siguientes
opciones:
Situación Real
H0 es cierta H1 es cierta
Decisión del Acepta H0 Decisión correcta Error de tipo II
fabricante Rechaza H0 Error de tipo I Decisión correcta
III-Nivel de significación
El problema se centra ahora en averiguar cuándo se puede afirmar que el suceso obtener un
valor de la media muestral de 5025 siendo la media de la población µ = 4950 es suficientemente
improbable
10.1. CONTRASTE DE HIPÓTESIS 121
El área de cada cola es α/2 y unión de ambas regiones es lo que hemos llamado área de
rechazo, o región crı́tica.
Cuando el valor del estadı́stico de contraste se encuentre en la región crı́tica o área de
rechazo, entonces la decisión será rechazar la hipótesis nula. Para conocer si este valor está en
la región crı́tica o en la región de aceptación, seguimos el siguiente procedimiento:
122 TEMA 10. CONTRASTE DE HIPÓTESIS
1.- Determinamos parámetros: Aceptar la hipótesis H0 nos dirı́a que tenemos una muestra
de 100 baterı́as donde la media sigue una normal de media 4950 y desviación 350.
2.- Dado el nivel de significación, determinamos el nivel de confianza. En nuestro caso
95 %.
3.- Calculamos ahora la región de aceptación; en este caso obtenemos: (-1’96, 1’96).
4.- Sólo tenemos que comprobar ahora si el estadı́stico de contraste para la media está o no
en este intervalo, ya que el área de rechazo o la región crı́tica está limitada por estos valores.
En este ejemplo
5025 − 4950
Z= √ = 2′ 14
350/ 100
no pertenece al intervalo de confianza y en consecuencia la decisión adecuada es la de rechazar
la hipótesis nula.
El fabricante de baterı́as, a la vista del resultado, considerarı́a que ha tenido lugar un
suceso suficientemente improbable, por lo que se rechazarı́a la hipótesis nula, adoptando el
nuevo proceso de producción, lo que se expresa diciendo que el contraste es significativo al
nivel del 5 %
En el caso de que no conozcamos la desviación tı́pica, necesitamos tener los datos experi-
mentales para hacer una estimación de la desviación tı́pica y a partir de ahı́ procedemos como
en el caso anterior.
Consideremos la misma situación anterior pero en este caso de lo que disponemos es de
una muestra de 20 baterı́as elaboradas según el nuevo proceso de producción, que han sido
probadas, dando unos perı́odos de duración en horas de:
4917 4948 5082 5105 4865 5068 4935 5090 5045 5080
5136 5084 4909 4935 5120 4936 5014 5125 4933 5088
Con estos valores en primer lugar se calcula una estimación puntual para la nueva media
y una estimación puntual para la desviación tı́pica, y a partir de ahı́ podemos hacer todo el
proceso.
Aquı́ planteamos otro ejemplo: Un laboratorio farmacéutico ha elaborado un fármaco en
forma de comprimidos cuyo peso está distribuido normalmente con una desviación tı́pica de
0.12 mg. Se sabe que una dosis de comprimido cuyo peso media sea superior a 0.60 mg,
produce efectos muy perjudiciales. Por este motivo, el hospital comprueba el peso medio de
una partida de 150 comprimidos, que resulta ser de 0.64 mg. Hacer un contraste de hipótesis
con un nivel de significación del 0.05 para averiguar si es posible administrar la medicación al
enfermo sin riesgo.
En todos los casos, hay un modelo común de trabajo, que consiste en seleccionar dos
muestras, una formada por individuos de la población en los que se va a ensayar la nueva
experiencia, por lo que recibe el nombre de grupo experimental y otra segunda muestra a la
que se le aplica un método clásico y que se utiliza para contrastar los resultados, por lo que
se llama grupo de contraste.
Veamos el siguiente ejemplo:
Se tomaron 200 muestras aleatorias de presión sistólica a niños cuyos padres son hiper-
tensos, obteniéndose una media de 107 mmHg y una desviación tı́pica de 7 mmHg. Luego
se tomaron 100 muestras de niños cuyos padres tiene la presión sanguı́nea normal, y se ob-
tuvo una media de 98 mmHg con una desviación tı́pica de 6 mmHg. Obtener los lı́mites de
confianza del 95 % a la diferencia de medias. (Solución (7’4755,10’5245)).
La finalidad es este caso es comprobar si la diferencia entre los resultados de las medias
muestrales es un reflejo de una situación real en las poblaciones o se trata de una diferencia
debida al azar.
Los datos del ejemplo anterior son:
G. experimental G. de contraste
Media 107 98
Desviación 7 6
Tamaño Muestral 200 100
Queremos conocer si la diferencia entre las medias de ambas muestras es motivo suficiente
para afirmar que las medias de las respectivas poblaciones son también diferentes y, por
tanto, lo son las propias poblaciones, o bien, su dicha diferencia se debe únicamente al error
que introduce el azar al seleccionar cada muestra.
Nuestro interés se centra en discernir si la diferencia µ1 − µ2 entre las medias de las dos
poblaciones, que se suponen distribuidas normalmente, es igual a cero, o lo que es igual, si
µ1 = µ2 . Luego la hipótesis nula y la alternativa para un contraste bilateral o test pareados
son:
H 0 ≡ µ1 = µ2
H1 ≡ µ1 6= µ2
X1 − X2 107 − 98
Z=s =r = 11,57
σ12 σ22 49 36
+ +
n1 n2 200 100
124 TEMA 10. CONTRASTE DE HIPÓTESIS