Вы находитесь на странице: 1из 113

ECUACIONES LINEALES

Una ecuación es lineal, si las variables que aparecen en ella a lo más son de primer orden, si en ella no aparecen
productos entre estas variables y si tampoco aparecen funciones o recíprocos de las variables.

La forma más general de escribir una ecuación lineal con n variables es:
a1 x1 + a 2 x 2 + a 3 x 3 + ... + a n x n = b
dónde, ai son los coeficientes asociados a las variables (i = 1,2,..., n) .
b es el coeficiente independiente.
xi son las variables del sistema (i = 1,2,..., n) .

Todos los coeficientes que aparecen en la ecuación anterior son números reales, a los cuales les llamaremos
escalares.

Una solución de la ecuación lineal es un conjunto de n números reales α i , con i = 1,2,..., n , tales que satisfacen
la igualdad siguiente:
a1α 1 + a 2α 2 + a 3α 3 + ... + a nα n = b

Determinemos las soluciones para distintos tipos de ecuaciones lineales que se pueden presentar en la resolución
de problemas, estos casos son los siguientes.

CASO 1: Ecuación lineal con una incógnita ax = b .


b
Solución: a) x = con a ≠ 0 y b ∈ R ⇒ Solución única.
a

b) 0 ⋅ x = b con a = 0 y b ≠ 0 ⇒ No hay solución.

c) 0 ⋅ x = 0 con a = 0 y b = 0 ⇒ Soluciones infinitas.

EJEMPLO: Encontrar la solución para cada ecuación.

i) 2x − 5 − x = x + 3 ⇒ 0⋅ x = 8 ⇒ no tiene solución.

ii) 4x − 1 = x + 6 ⇒ 3x = 7 ⇒ tiene solución única.

iii) 4 + x − 3 = 2 x + 1 − x ⇒ 0⋅ x =0 ⇒ tiene soluciones infinitas.

CASO 2 : Ecuación lineal con dos incógnitas a1 x1 + a 2 x 2 = b

Solución: Escribimos una de las variables de la ecuación, en términos de la otra,


b ⎛ a2 ⎞
a1 x1 + a 2 x 2 = b ⇒ a1 x1 = b − a 2 x 2 ⇒ x1 = − ⎜ ⎟ x2 ,
a1 ⎜⎝ a1 ⎟⎠
entonces , x 2 será un parámetro libre que puede tomar cualquier valor real, esto es,
b ⎛ a2 ⎞
x 2 = α ∈ R y x1 = − ⎜ ⎟α
a1 ⎜⎝ a1 ⎟⎠
Por lo tanto, la ecuación tiene un número infinito de soluciones.

I-1
EJEMPLO: Resolver la ecuación lineal siguiente 3x − 12 y = −6 .

SOLUCIÓN: Tenemos que 3x − 12 y = −6 ⇒ 3x = −6 + 12 y ⇒ x = −2 + 4 y


donde y la podemos considerar como un parámetro libre, esto es,
y =α ∈R ,
x = −2 + 4α
La ecuación tiene un número infinito de soluciones. Para obtener soluciones particulares de la
ecuación tenemos:
si α = 3 ⇒ y = 3 y x = −2 + (4)(3) = 10 ,
si α = −1 ⇒ y = −1 y x = −2 + (4)(−1) = −6 ,
si α = 0 ⇒ y = 0 y x = −2 + (4)(0) = −2 .

CASO 3: Ecuación lineal con tres incógnitas a1 x1 + a 2 x 2 + a 3 x 3 = b

Solución: Escribimos una variable en términos de las dos restantes,


b a2 a
a1 x1 + a 2 x 2 + a 3 x 3 = b ⇒ a1 x1 = b − a 2 x 2 − a 3 x 3 ⇒ x1 =
− x 2 − 3 x3 ,
a1 a1 a1
x 2 y x3 son ahora los parámetros libres, que pueden tomar cualquier valor real, esto es,
x2 = α ∈ R ,
x3 = β ∈ R ,
b a2 a
x1 = − α− 3β
a1 a1 a1
La ecuación tiene un número infinito de soluciones.

OBSERVACION: Los casos para ecuaciones con un mayor número de variables, se resuelven de forma similar.
En todos los casos, podemos tomar a cualquier variable o variables como parámetros libres
y esto no afectará la solución de la ecuación lineal.
Para obtener soluciones particulares, solo le damos valores a los parámetros libres.

I-2
SISTEMAS DE ECUACIONES LINEALES

Un sistema de ecuaciones lineales es un conjunto finito de ecuaciones lineales, las cuales contienen a las mismas
variables o incógnitas. Un sistema de m ecuaciones lineales con n incógnitas o variables se representa de forma
general como sigue:
a11 x1 + a12 x 2 + a13 x 3 K + a1n x n = b1
a 21 x1 + a 22 x 2 + a 23 x 3 K + a 2 n x n = b2
a 31 x1 + a 32 x 2 + a 33 x 3 K + a 3n x n = b3
. . .
a m1 x1 + a m 2 x 2 + a m 3 x 3 K + a mn x n = b m
donde,
a ij son los coeficientes asociados a las variables, (i = 1,2,..., m) indica el número de ecuaciones.
( j = 1,2,..., n) indica el número de incognitas.
bi son los coeficientes independientes, (i = 1,2,..., m) .
x j son las variables del sistema, ( j = 1,2,..., n) .

Una solución del sistema de ecuaciones lineales, es un conjunto de n números reales α i , con i = 1,2,..., n , tales
que satisfacen simultáneamente todas las ecuaciones del sistema.

Al igual que para una sola ecuación lineal, en general, un sistema de ecuaciones lineales puede tener solución
única, un número infinito de soluciones o puede que no tenga solución, para saberlo, hacemos el mismo tipo de
análisis que en los casos 1), 2) o 3), según se presente el problema.

Analizaremos solo el caso de un sistema de dos ecuaciones con dos incógnitas y después daremos el algoritmo
general de solución para cualquier otro sistema

CASO 1: Sistema de dos ecuaciones lineales con dos incógnitas


a11 x1 + a12 x 2 = b1 (1)
a 21 x1 + a 22 x 2 = b2 (2)

Solución A) Escribimos una de las variables, de cualquier ecuación, en términos de la otra, y la sustituimos
en la ecuación restante, con esto obtenemos una ecuación lineal de una sola variable.

De la ecuación (1) tenemos:


b1 a
a11 x1 + a12 x 2 = b1 ⇒ x2 = − 11 x1 ,
a12 a12
esta la sustituimos en la ecuación (2), de forma que,
⎛b a ⎞ ⎛ a ⎞ a b
a 21 x1 + a 22 ⎜⎜ 1 − 11 x1 ⎟⎟ = b2 ⇒ ⎜⎜ a 21 − 11 ⎟⎟ x1 + 22 1 = b2
⎝ a12 a12 ⎠ ⎝ a12 ⎠ a12
⎛ a a − a11 a 22 ⎞ a b b a − a 22 b1
⇒ ⎜⎜ 21 12 ⎟⎟ x1 = b2 − 22 1 = 2 12
⎝ a12 ⎠ a12 a12
b2 a12 − a 22 b1
⇒ x1 =
a 21 a12 − a11 a 22

I-3
Ahora sustituyendo x1 en x 2 , tenemos,
b1 a11 ⎛ b2 a12 − a 22 b1 ⎞ 1 ⎛ b a a − b1 a11 a 22 ⎞
x2 = − ⎜⎜ ⎟⎟ ⇒ x 2 = ⎜⎜ b1 − 2 11 12 ⎟
a12 a12 ⎝ a 21 a12 − a11 a 22 ⎠ a12 ⎝ a 21 a12 − a11 a 22 ⎟⎠
1 ⎛ b1 a 21 a12 − b1 a11 a 22 − b2 a11 a12 + b1 a11 a 22 ⎞ 1 ⎛ b1 a 21 a12 − b2 a11 a12 ⎞
x2 = ⎜ ⎟⎟ = ⎜⎜ ⎟⎟
a12 ⎜⎝ a 21 a12 − a11 a 22 ⎠ a12 ⎝ a 21 a12 − a11 a 22 ⎠
1 ⎛ a12 (b1 a 21 − b2 a11 ) ⎞
x2 = ⎜⎜ ⎟⎟
a12 ⎝ a 21 a12 − a11 a 22 ⎠
b a − b2 a11
⇒ x 2 = 1 21
a 21 a12 − a11 a 22

Solución B) Eliminamos cualquiera de las dos variables del sistema mediante operaciones como por
ejemplo; multiplicar las ecuaciones por un escalar y sumar o restar ecuaciones.

Multiplicamos la ecuación (1) por a 21 y la ecuación (2) por a11 , para obtener
a 21 a11 x1 + a 21 a12 x 2 = a 21b1 (3)
a11 a 21 x1 + a11 a 22 x 2 = a11b2 (4)
Ahora restamos la ecuación (4) de la ecuación (3), y la ecuación resultante la sustituimos por
cualquiera de las dos anteriores, esto es
a 21 a11 x1 + a 21 a12 x 2 = a 21b1 (5)
(a 21 a12 − a11 a 22 )x 2 = a 21b1 − a11b2 (6)

donde la ecuación (6) solo tiene una variable, de la cual podemos determinar su solución de
forma directa, así que
a b − a11b2
x 2 = 21 1
a 21 a12 − a11 a 22

De la misma forma, multiplicamos la ecuación (1) por a 22 y la ecuación (2) por a12 ,
a 22 a11 x1 + a 22 a12 x 2 = a 22 b1 (7)
a12 a 21 x1 + a12 a 22 x 2 = a12 b2 (8)

Restamos la ecuación (8) de la ecuación (7), y la ecuación resultante la sustituimos por


cualquiera de las dos anteriores, esto es
a 22 a11 x1 + a 22 a12 x 2 = a 22 b1 (9)
(a 22 a11 − a12 a 21 )x1 = a 22 b1 − a12 b2 (10)

de la ecuación (10) podemos encontrar el valor de la segunda variable,


a b − a12 b2
x1 = 22 1
a 22 a11 − a12 a 21

OBSERVACIÓN: Cada nuevo sistema de ecuaciones lineales que se obtiene al aplicarle una o varias
operaciones o transformaciones (multiplicar las ecuaciones por un escalar y sumar
o restar ecuaciones o intercambiar ecuaciones), es equivalente, en el sentido de que
todos los sistemas tienen el mismo conjunto solución.

I-4
Las siguientes transformaciones u operaciones, al ser aplicadas a un sistema de ecuaciones lineales, no cambian
el conjunto solución de un sistema,

a) Cambiar el orden de las ecuaciones.


b) Sumar o restar ecuaciones.
c) Multiplicar una o varias ecuaciones por una constante, distinta de cero, y después sumarlas o restarlas.

Cada nuevo sistema de ecuaciones lineales obtenido de esta forma, es equivalente uno con otro.

Método de Eliminación de Variables o Incógnitas


Consiste en un algoritmo o procedimiento para obtener la solución de un sistema de ecuaciones lineales
arbitrario, en general, durante este proceso se eliminan variables de las ecuaciones que conforman el sistema, de
tal manera que al finalizar el método en cada ecuación nos queda una sola variable, con su valor correspondiente,
el cual será la solución del sistema.

Apliquemos el método al siguiente sistema de m ecuaciones lineales con n incógnitas,


a11 x1 + a12 x 2 + a13 x 3 K + a1n x n = b1
a 21 x1 + a 22 x 2 + a 23 x 3 K + a 2 n x n = b2
a 31 x1 + a 32 x 2 + a 33 x 3 K + a 3n x n = b3
. . .
a m1 x1 + a m 2 x 2 + a m 3 x 3 K + a mn x n = b m

1) Si en alguna ecuación, el coeficiente asociado a la primera variable x1 es igual a uno, entonces esa ecuación
será la primera. Si no sucede lo anterior, entonces dividimos alguna de las ecuaciones para obtener la primera
variable con coeficiente igual a uno.
2) Hacemos ceros los coeficientes de x1 de las ecuaciones restantes del sistema.
3) Igualamos a uno el coeficiente de la variable x 2 de la segunda ecuación del sistema obtenido en el inciso
anterior.
4) Hacemos ceros los coeficientes de x 2 de las ecuaciones restantes.
5) Repetir el proceso para las ecuaciones y variables restantes.

En adelante etiquetaremos a las ecuaciones como R1, R2, R3, etc., de manera que, (-1)R2 ± (5)R4 → R2,
significa que estamos multiplicando a la ecuación dos por menos uno y le estamos sumando/restando cinco veces
la ecuación cuatro, y la ecuación resultante de esta operación la sustituimos por la ecuación dos del sistema.

EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales,

5 x + 11y − 21z = −22 R1


x + 2 y − 4 z = −4 R2
3x − 2 y + 3z = 11 R3

SOLUCIÓN: R1 ↔ R2 x + 2 y − 4 z = −4 x + 2 y − 4 z = −4
5 x + 11y − 21z = −22 R2-(5)R1 → R2 0− y+ z = 2
3x − 2 y + 3z = 11 R3-(3)R1 → R3 0 + 8 y − 15z = −23

I-5
R1+(2)R2 → R1 x + 0 − 2z = 0 x + 0 − 2z = 0
0− y+ z=2 (-1)R2 → R2 0 + y − z = −2
R3+(8)R2 → R3 0 + 0 − 7 z = −7 R3/7 → R3 0 + 0 + z =1

R1+(2)R3 → R1 x+0+0=2 x=2


R2+R3 → R2 0 + y + 0 = −1 ⇒ y = −1 solución única
0 + 0 + z =1 z =1

EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales,

x + 2 y − 3z = 1 R1
2x + 5 y − 8z = 4 R2
3 x + 8 y − 13 z = 7 R3

SOLUCIÓN: R2-(2)R1 → R2 x + 2 y − 3z = 1 R3-(2)R2 → R3 x + 2 y − 3z = 1


R3-(3)R1 → R3 0 + y − 2z = 2 0 + y − 2z = 2
0 + 2 y − 4z = 4 0+0+0=0
R2 ⇒ y = 2 + 2z
R1 ⇒ x = 1 − 2 y + 3z ⇒ z es un parámetro libre,

z =α ∈R z = −1
y = 2 + 2α soluciones y = 2 + 2(−1) = 0 solución particular
x = 1 − 2(2 + 2α ) + 3α infinitas x = −3 − (−1) = −2
= −3 − α

EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales,

2a + 8b + 6c = 20 R1
4a + 2b − 2c = −2 R2
3a − b + c = 11 R3

SOLUCIÓN: R1/2 → R1 a + 4b + 3c = 10 R2-(2)R1 → R2 a + 4b + 3c = 10


R2/2 → R2 2 a + b − c = −1 R3-(3)R1 → R3 0 − 7b − 7c = −21
3a − b + c = 11 0 − 13b − 8c = −19

R2/(-7) → R2 a + 4b + 3c = 10 R1-(4)R2 → R1 a + 0 − c = −2
0+b+c=3 R3+(13)R2 → R3 0+b+c=3
0 + 0 + 5c = 20

R3/(5) → R3 a + 0 − c = −2 R1+R3 → R1 a+0+0=2


0+b+c=3 R2-R3 → R2 0 + b + 0 = −1
0+0+c=4 0+0+c=4
a=2
b = −1 solución única
c=4

I-6
EJEMPLO: Para el siguiente sistema de ecuaciones determine las condiciones sobre a, b, c para obtener,
Solución única
Sin solución
Soluciones infinitas
x + 2 y − 3z = a R1
2 x + 6 y − 11z = b R2
x − 2 y + 7z = c R3

SOLUCIÓN: R2-(2)R1 → R2 x + 2 y − 3z = a R3+(2)R2 → R3 x + 2 y − 3z = a


R3-R1 → R3 0 + 2 y − 5 z = b − 2a 0 + 2 y − 5 z = b − 2a
0 − 4 y + 10 z = c − a 0 + 0 + 0 = c + 2b − 5a

R3 ⇒ 0 = c + 2b − 5a No puede tener solución única


No tiene solución si: 5a − 2b − c ≠ 0
Tiene soluciones infinitas si:
5a − 2b − c = 0

EJEMPLO: Resuelva el siguiente sistema de ecuaciones,

x + 2 y − 3 z + 4t = 2 R1
2x + 5 y − 2z + t = 1 R2
5 x + 12 y − 7 z + 6t = 7 R3

SOLUCIÓN: R2-(2)R1 → R2 x + 2 y − 3z + 4t = 2 R1-(2)R2 → R1 x + 0 − 11z + 18t = 8


R3-(5)R1 → R3 0 + y + 4 z − 7t = −3 R3-(2)R2 → R3 0 + y + 4 z − 7t = −3
0 + 2 y + 8 z − 14t = −3 0+0+0+0=3

R3 ⇒ El sistema no tiene solución.

EJERCICIO: Resolver el siguiente sistema de ecuaciones lineales

x + 2 y + 2z = 2 R1
3x − 2 y − z = 5 R2
2 x − 5 y + 3z = −4 R3
x + 4 y + 6z = 0 R4

SOLUCIÓN: R1+R4 → R1 2x + 6 y + 8z = 2 R1/(2) → R1 x + 3y + 4z = 1


3x − 2 y − z = 5 3x − 2 y − z = 5
2 x − 5 y + 3z = −4 2 x − 5 y + 3z = −4

R2-(3)R1 → R2 x + 3y + 4z = 1 (11)R1+(3)R2 → R1
R3-(2)R1 → R3 0 − 11 y − 13 z = 2 11x + 0 + 5 z = 17
0 − 11 y − 5 z = −6 R3-R2 → R3 0 − 11 y − 13 z = 2
0 + 0 − 8z = 8

I-7
R3/(8) → R3 11x + 0 + 5 z = 17 R1+(5)R3 → R1 11x + 0 + 0 = 22
0 − 11 y − 13 z = 2 R2-(13)R3 → R2 0 − 11 y + 0 = −11
0 + 0 − z =1 0 + 0 − z =1
R1/(11) → R1 x+0+0 = 2 x=2
R2/(11) → R2 0 − y + 0 = −1 ⇒ y =1 Solución única
0 + 0 − z =1 z = −1

Sistemas de Ecuaciones Lineales Homogéneos

Un sistema de m ecuaciones lineales homogéneas y n variables, es aquel para el cual todos los coeficientes
independientes son iguales con cero, esto es, bi =0 para todo i. Entonces,

a11 x1 + a12 x 2 + a13 x 3 K + a1n x n = 0


a 21 x1 + a 22 x 2 + a 23 x 3 K + a 2 n x n = 0
a 31 x1 + a 32 x 2 + a 33 x 3 K + a 3n x n = 0
. . .
a m1 x1 + a m 2 x 2 + a m 3 x 3 K + a mn x n = 0

Todo sistema de ecuaciones lineales homogéneo siempre tiene solución. Estas pueden ser, la solución trivial,
esto es:
x1 = x 2 = K = x n = 0 , o bien x i = 0 para toda i

o bien un número infinito de soluciones, dadas en términos de parámetros libres. Si la solución del sistema
homogéneo es única, entonces la solución es la trivial. Si un sistema homogéneo tiene mas incógnitas que
ecuaciones, entonces tiene un número infinito de soluciones, incluyendo a la solución trivial.

EJEMPLO: Resolver el siguiente sistema de ecuaciones homogéneo,

x+ y−z =0 (R1)
2x + 4 y − z = 0 (R2)
3x + 2 y + 2 z = 0 (R3)

SOLUCIÓN: x+ y−z =0 x+ y−z =0


R2-(2)R1 → R2 0 + 2y + z = 0 R2 ↔ R3 0 − y + 5z = 0
R3-(3)R1 → R3 0 − y + 5z = 0 0 + 2y + z = 0

R1+R2 → R1 x + 0 + 4z = 0 x + 0 + 4z = 0
0 − y + 5z = 0 0 − y + 5z = 0
R3+(2)R2 → R3 0 + 0 + 11z = 0 R3/(11) → R3 0+0+ z=0

R1-(4)R3 → R1 x+0+0=0 x=0


R2-(5)R3 → R2 0− y+0 = 0 ⇒ y=0 solución única.
0+0+ z=0 z=0

I-8
EJERCICIO: Determinar la solución del siguiente sistema de ecuaciones lineales

x+ y− z=0 (R1)
2x − 3y + z = 0 (R2)
x − 4 y + 2z = 0 (R3)

SOLUCIÓN: x+ y− z=0 x+ y− z=0


R2-(2)R1 → R2 0 − 5 y + 3z = 0 0 − 5 y + 3z = 0
R3-R1 → R3 0 − 5 y + 3z = 0 R3-R2 → R3 0+0+0=0

⇒ x+ y− z=0 (3)R1+R2 → R1 3x − 2 y + 0 = 0
0 − 5 y + 3z = 0 0 − 5 y + 3z = 0

2
R1 ⇒ x= y
3
3
R2 ⇒ y= z ⇒ z es un parámetro libre
5

z =α ∈R
3
y= α soluciones infinitas.
5
2 ⎛3⎞ 2
x = ⎜ ⎟α = α
3 ⎝5⎠ 5

I-9
APLICACIONES DE LOS SISTEMAS DE ECUACIONES LINEALES

En esta sección analizaremos algunos problemas, cuya solución se obtiene planteando y resolviendo sistemas de
ecuaciones lineales y como veremos, estos pueden aparecer en cualquier área del conocimiento.

PROBLEMA 1: Cuatro socios de una empresa desean repartirse las ganancias obtenidas, cuyo valor haciende a
2
$4,680,000.00, de la siguiente manera: las partes de las ganancias se dividirán en partes
3
1
iguales entre los cuatro. De la otra parte, cada uno recibirá $60,000.00 cada año hasta que
3
cumplan 20 años en la empresa. Si entre cada socio se llevan 3 años de diferencia, dentro de la
empresa, determinar, ¿Cuánto dinero recibirá cada uno de los socios? ¿Cuántos años tiene cada
uno de ellos en la empresa?

SOLUCIÓN: Plantemos el problema como sigue, sea x1 , x 2 , x3 y x 4 el dinero que recibirá cada uno de los
socios, de mayor a menor edad dentro de la empresa, respectivamente; correspondiente a la
1
parte de las ganancias ($1,560,000.00), entonces tenemos que, x1 + x 2 + x 3 + x 4 = 1560000 .
3
Por otro lado, como el socio menor recibirá 3 veces mas la cantidad de $60,000.00 con respecto
al socio que le sigue de edad, entonces tenemos que, x 4 − x 3 = 3 ⋅ 60000 = 180000 , lo mismo
sucede con los demás, es decir, x 3 − x 2 = 180000 y x 2 − x1 = 180000 .

De esta forma encontramos el siguiente sistema de ecuaciones lineales,


x1 + x 2 + x 3 + x 4 = 1560000
x 4 − x 3 = 180000
x 3 − x 2 = 180000
x 2 − x1 = 180000
Al resolver tenemos la solución: x1 = 120000 , x 2 = 300000 , x 3 = 480000 y x 4 = 660000 .
2
Las partes de $4,680,000.00 son $3,120,000.00 que dividida entre cuatro son $780,000. Por
3
lo cual cada socio recibirá en total,
x1 = $120,000.00 + 780,000.00 = $900,000.00
x 2 = $300,000.00 + 780,000.00 = $1,080,000.00
x 3 = $480,000.00 + 780,000.00 = $1,260,000.00
x 4 = $660,000.00 + 780,000.00 = $1,440,000.00

Ahora, por ejemplo, el socio mayor recibirá x1 = $120,000.00 cuando cumpla 20 años en la
empresa, $60,000.00 por año, entonces x1 = 120000 = 2 ⋅ 60000 , significa que le faltan 2 años
para cumplir los 20 en la empresa, por lo tanto,

el socio 1 tiene 18 años en la empresa


el socio 2 tiene 15 años en la empresa
el socio 3 tiene 12 años en la empresa
el socio 4 tiene 9 años en la empresa

I-10
PROBLEMA 2: El nivel de contaminación ambiental medido durante cierto día, para las tres principales ciudades
de la República Mexicana, Ciudad de México, Monterrey y Guadalajara, fue en promedio de 18
puntos imecas. Para ese día en particular, se cuenta con los siguientes datos en las lecturas: en la
Ciudad de México la contaminación estuvo 4 puntos por encima del promedio de las otras dos
ciudades y en Monterrey la medición indicó 3 puntos menos que el promedio de las otras dos
cuidades. ¿Cuál fué el índice de contaminación en cada ciudad ese día?

SOLUCIÓN: Consideremos a las siguientes variables x , y y z , como los puntos o niveles de contaminación en
cada una de las tres ciudades, Cd. de México, Monterrey y Guadalajara, respectivamente.
x+ y+z
Si el promedio de las tres mediciones dio 18 puntos, entonces, = 18 .
3
Como en la Cd. De México fue mayor en 4 puntos respecto al promedio de las otras dos ciudades,
y+z
entonces, x = + 4.
2
Finalmente, en Monterrey fue 3 puntos menos que el promedio de las otras dos ciudades, quiere
x+z
decir que, y = −3.
2
Tenemos entonces el siguiente sistema de ecuaciones lineales,
x + y + z = 54
2x − y − z = 8
− x + 2 y − z = −6
De donde obtenemos la siguiente solución,
62
x= puntos de contaminación en la Cd. De México.
3
y = 16 puntos de contaminación en la ciudad de Monterrey.
52
z= puntos de contaminación en la ciudad de Guadalajara.
3

PROBLEMA 3: Determinar el polinomio de segundo grado, p ( x) = a 0 + a1 x + a 2 x 2 , cuya gráfica contiene a los


puntos (1,4) , (2,0) y (3,12) .

SOLUCIÓN: El polinomio lo podemos ver como una función y ( x) = p( x) , entonces para cada par ordenado
( x, y ) , tenemos un punto donde debemos evaluar la función x y un valor de la función y , esto
es,
para el punto (1,4) ⇒ a 0 + a1 (1) + a 2 (1) 2 = 4
para el punto (2,0) ⇒ a 0 + a1 (2) + a 2 (2) 2 = 0
para el punto (3,12) ⇒ a 0 + a1 (3) + a 2 (3) 2 = 12
de donde obtenemos el sistema de ecuaciones lineales,
a 0 + a1 + a 2 = 4
a 0 + 2a1 + 4a 2 = 0
a 0 + 3a1 + 9a 2 = 12
que tiene por solución los valores, a 0 = 24 , a1 = −28 y a 2 = 8 .
Por lo tanto el polinomio de segundo grado que pasa por lo puntos (1,4) , (2,0) y (3,12) , tiene la
forma, p ( x) = 24 − 28 x + 8 x 2 .

I-11
PROBLEMA 4: Sabemos de geometría que, un plano esta completamente definido si conocemos tres puntos que
estén contenidos en el. Determinar el plano que contiene a los siguientes puntos: (1,1,2) , (1,2,0)
y (2,1,5) .

SOLUCIÓN: La ecuación general de un plano esta dada por, ax + by + cz + d = 0 y un punto ( x, y, z ) sobre el


plano es aquel que satisface la igualdad.
Entonces, evaluamos cada uno de los puntos en la ecuación, para determinar los coeficientes del
Plano, esto es,
para el punto (1,1,2) ⇒ a + b + 2c + d = 0
para el punto (1,2,0) ⇒ a + 2b + d = 0
para el punto (2,1,5) ⇒ 2a + b + 5c + d = 0

Resolviendo el sistema para las constantes, tenemos que, c = − d , b = −2d y a = 3d , esto es,
un sistema con soluciones infinitas en términos de una variable, la cual podemos tomar como
parámetro libre, es decir, d = α ∈ R .
Para una solución particular, d = 1 , c = −1 , b = −2 y a = 3 .
Entonces un plano que contiene a los tres puntos (1,1,2) , (1,2,0) y (2,1,5) es paralelo al plano
dado por la ecuación, 3x − 2 y − z + 1 = 0 o a cualquier otro paralelo a el, obtenido con algún
valor de d = α .

PROBLEMA 5: Una armadora de automóviles fabrica tres modelos distintos, sedan, camioneta y compacto.
Para armar un sedan se necesitan 10 horas, mas otras 2 horas de prueba y 2 horas mas para
los acabados. La camioneta necesita se lleva 12 horas de ensamblado, 2.5 horas de prueba y
2 horas mas de detalles. Finalmente, el compacto utiliza 6 horas en el armado, 1.5 para las
pruebas y 1.5 horas para los terminados. Si la empresa armadora dispone de 1560 horas para
ensamblar los automóviles, 340 para probarlos y 320 para darles los acabados.
¿Cuántos automóviles puede fabricar al mes?

SOLUCIÓN: Consideremos como x1 , x 2 y x3 el número de unidades que puede producir la armadora en un


mes, cantidades que corresponden a los modelos sedan, camioneta y compacto, respectivamente.
El número total de horas necesarias para construir determinado número de automóviles esta dado
por, 10 x1 + 12 x 2 + 6 x 3 , si s e cuenta con 1560 horas al mes para ensamblarlos, obtenemos la
ecuación, 10 x1 + 12 x 2 + 6 x 3 = 1560 .
Para las horas de prueba también tenemos que, 2 x1 + 2.5 x 2 + 1.5 x 3 = 340 .
De la misma forma para los terminados encontramos, 2 x1 + 2 x 2 + 1.5 x 3 = 320
Por lo tanto, resolviendo el sistema de ecuaciones lineales,
10 x1 + 12 x 2 + 6 x 3 = 1560
2 x1 + 2.5 x 2 + 1.5 x 3 = 340
2 x1 + 2 x 2 + 1.5 x 3 = 320
determinamos el número de automóviles que puede producir la armadora, los cuales están dados
por,
tipo sedan x1 = 60 .
tipo camioneta x 2 = 40 .
tipo compacto x 3 = 80 .

I-12
ASPECTOS GEOMÉTRICOS DE LOS SISTEMAS DE ECUACIONES LINEALES

A continuación mencionaremos algunos aspectos geométricos importantes, en relación con los sistemas de
ecuaciones lineales.

Cuando hablamos de lineal, lo primero que nos viene a la mente es el concepto de línea o recta, recordamos que
la ecuación general que representa a este ente geométrico es:
ax + by + c = 0 o ax + by = c ,
(el signo de la constante c es irrelevante) la cual no es mas que una ecuación lineal con dos incógnitas o
variables, cuya solución son los pares ordenados ( x, y ) , que corresponden a todos los puntos del plano xy que
se encuentran sobre la recta.

Ahora, para una recta que paso por dos puntos, ( x1 , y1 ) y ( x 2 , y 2 ) , tenemos que su pendiente esta dada por;
y − y1
m= 2
x 2 − x1
de esta forma podemos escribir la ecuación de una recta como,
y = mx + b
donde m es su pendiente y b es la ordenada al origen (donde la recta cruza al eje y ).

Por otro lado, observamos que con respecto a la ecuación de la recta ax + by = c , tenemos que la pendiente se
a
puede escribir como m = − .
b

De lo anterior podemos hacer las siguientes afirmaciones:

a) Para rectas paralelas al eje x la pendiente es igual a cero.

b) Para rectas paralelas al eje y la pendiente tiene un valor infinito.

c) Dos rectas son paralelas si tienen la misma pendiente, m1 = m 2 .


1
d) Dos retas son perpendiculares si sus pendientes cumplen la siguiente relación, m1 =
m2

Consideremos los siguientes sistemas de 2 ecuaciones lineales con 2 incógnitas o variables, estos sistemas,
como lo mencionamos anteriormente, estarán representados geométricamente por dos rectas en el plano xy .

Al resolver cada uno de estos sistemas observaremos el significado geométrico que tiene dicha solución, en este
caso la solución será un par ordenado ( x, y ) , que corresponderá a un lugar geométrico (punto) sobre el plano
xy .

Tomemos como ejemplos los siguientes sistemas de ecuaciones lineales, donde cada uno de ellos nos reproduce
las distintas posibilidades que hay para la solución, a saber; solución única, un número infinito de soluciones y
sin solución.

1-13
a) Solución única, x − 3 y = −3 (1)
2x + y = 8 (2)

Al resolver el sistema encontramos que la solución es: x = 3 y y = 2 .


Ahora, grafiquemos las rectas que representan cada una de las ecuaciones lineales (1) y (2), el lugar
geométrico donde se intersectan las dos rectas, corresponde a la solución del sistema, (3,2) . En este
caso, el sistema tiene solución es única. (Figura A1).

Figura A1

b) Sin solución, x − 3 y = −3 (1)


2 x − 6 y = −12 (2)

Al resolver el sistema encontramos que: 0 = 6 el sistema no tiene solución.


Grafiquemos las rectas que representan cada una de las ecuaciones lineales (1) y (2), las rectas son paralelas
y cortan al eje y en distintos puntos, por lo cual no tienen ningún punto en común así que el sistema no tiene
solución. (Figura A2).

Figura A2.

1-14
b) Un número infinito de soluciones, − 2 x + y = −2 (1)
4x − 2 y = 4 (2)

Al resolver el sistema encontramos que: 0 x + 0 y = 0 , el sistema tiene un número infinito de soluciones


(las cuales satisfacen x = y / 2 + 1 ).
Tenemos que las rectas asociadas a las ecuaciones lineales (1) y (2), son paralelas y cortan al eje y en el
mismo punto, esto es, representan al mismo lugar geométrico (la misma recta), por lo cual tienen en
común un número infinito de puntos. (Figura A3).

Figura A3

Ahora consideremos una ecuación con tres incógnitas o variables, en este caso el lugar geométrico que
representa una ecuación de este tipo es, un plano, cuya ecuación general es de la forma,
ax + by + cz = d

Obviamente la visualización de estos lugares geométricos es un poco mas complicada, debido a que son
superficies en el espacio tridimensional, pero en general se siguen cumpliendo las mismas reglas para el tipo de
solución que presenten.

Por ejemplo, consideremos el siguiente sistema de 3 ecuaciones lineales con 3 incógnitas, escrito de la forma
general,
a11 x1 + a12 x 2 + a13 x 3 = b1 (1)
a21 x1 + a22 x2 + a23 x3 = b2 (2)
a31 x1 + a32 x2 + a33 x3 = b3 (3)
donde cada una de estas ecuaciones lineales, representa un plano en el espacio tridimensional, analicemos las
tres posibilidades para su solución,

a) Solución única. Tenemos una sola posibilidad.


En este caso, solamente puede ocurrir la situación de que los tres planos se intersectan en un solo punto del
espacio, ( x, y, z ) , que corresponde a la solución del sistema de ecuaciones lineales. (Figura A4).

1-15
Figura A4

b) Número infinito de soluciones. Aquí, pueden ocurrir dos casos;

- Cuando el lugar geométrico de intersección de los tres planos corresponde a una recta, entonces la solución
se escribe en términos de un parámetro libre. (Figura A5 (a))

- Cuando los tres planos son paralelos y corresponden al mismo lugar geométrico (son iguales), entonces la
intersección corresponde a un plano, el cual se describe con dos parámetros libres en la solución del sistema.
(Figura A5 (b)).

(a) (b)
Figuras A5

1-16
c) Sin solución. Existen tres posibilidades.

- Que los tres planos sean paralelos entre si, y que no tengan ningún punto en común. (Figura A6 (a)).
- Dos planos paralelos entre si, los cuales a su vez sean intersectados por el tercero. (Figura A6 (b)).
- Los tres planos se intersectan a pares, esto es, solo dos a la vez pero sin intersección común a los tres.
(Figura A6 (c))

(a) (b)

(c)

Figuras A6

1-17
MATRICES

Una matriz A de tamaño m × n es un arreglo rectangular de m ⋅ n números reales, dispuestos en m filas y en n


columnas. Esto es, una matriz en general tiene la forma siguiente,

⎛ a11 a12 a13 L a1n ⎞


⎜ ⎟
⎜ a 21 a 22 a 23 L a 2n ⎟
A = ⎜ a 31 a 32 a 33 L a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a m1 am2 a m3 L a mn ⎠
donde,
a ij son los coeficientes o elementos de la matriz (escalares o números reales).
i = 1,2,3,..., m indica el número de fila de la matriz.
j = 1,2,3,..., n indica el número de columna de la matriz.

A continuación damos la definición de algunas matrices importantes por su uso y características, es claro que
existen muchas más, que mas adelante usaremos.

* Si en una matriz A , tenemos que m = n (el número de filas es igual el número de columnas), entonces A es
una matriz cuadrada.
⎛ a11 a12 a13 L a1n ⎞
⎜ ⎟
⎜ a 21 a 22 a 23 L a 2 n ⎟
A = ⎜ a 31 a 32 a 33 L a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a n1 a n 2 a n 3 L a nn ⎠

* Si en una matriz A , tenemos que a ij = 0 para todo i, j (todos sus coeficientes son iguales a cero), entonces A
es la matriz cero, A = Ο .
⎛ 0 0 0 L 0⎞
⎜ ⎟
⎜ 0 0 0 L 0⎟
A = ⎜ 0 0 0 L 0⎟
⎜ ⎟
⎜M M M O M⎟
⎜ ⎟
⎝ 0 0 0 L 0⎠

⎧ = 1 si i = j
* Si A es una matriz cuadrada y los coeficientes cumplen que a ij ⎨ , entonces A es la matriz
⎩= 0 si i ≠ j
identidad.
⎛1 0 0 L 0⎞
⎜ ⎟
⎜ 0 1 0 L 0⎟
A = ⎜ 0 0 1 L 0⎟
⎜ ⎟
⎜M M M O M⎟
⎜ ⎟
⎝0 0 0 L 1⎠

I-18
⎧= cualquier valor si i = j
* Si A es una matriz cuadrada y los coeficientes son a ij ⎨ , entonces A es una matriz
⎩= 0 si i ≠ j
diagonal.
⎛ a11 0 0 L 0 ⎞
⎜ ⎟
⎜ 0 a 22 0 L 0 ⎟
A=⎜ 0 0 a 33 L 0 ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ 0 0 0 L a nn ⎠

* Si A es una matriz cuadrada, A es una matriz triangular superior si a ij = 0 para i > j , esto es, si todos los
coeficientes por debajo de la diagonal son iguales a cero.
⎛ a11 a12 a13 L a1n ⎞
⎜ ⎟
⎜ 0 a 22 a 23 L a 2n ⎟
A=⎜ 0 0 a 33 L a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ 0 0 0 L a nn ⎠

* Si A es una matriz cuadrada, A es una matriz triangular inferior si a ij = 0 para i < j , esto es, si todos los
coeficientes por arriba de la diagonal son igual a cero.
⎛ a11 0 0 L 0 ⎞
⎜ ⎟
⎜ a 21 a 22 0 L 0 ⎟
A = ⎜ a 31 a 32 a 33 L 0 ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a n1 a n 2 a n3 L a nn ⎠

* Una matriz columna tiene m filas y 1 columna.


⎛ a11 ⎞
⎜ ⎟
⎜ a 21 ⎟
A=⎜
M ⎟
⎜ ⎟
⎜a ⎟
⎝ m1 ⎠

* Una matriz renglón tiene 1 fila y n columnas.


A = (a11 a12 L a1n )

* Dos Matrices A y B son iguales, si tienen el mismo tamaño y además cumplen que a ij = bij para todo i, j .

Dada una matriz A podemos obtener matrices equivalentes a ella, mediante 3 operaciones básicas:

a) Intercambiando filas y/o columnas de la matriz.


b) Multiplicando una fila y/o una columna por una constante distinta de cero.
c) Sumando y/o restando de filas y/o columnas.

I-19
Álgebra de Matrices

Suma y Resta de Matrices


( ) ( )
Sean A = a ij y B = bij dos matrices del mismo tamaño m × n . La suma (resta) de A y B es una nueva matriz
( )
C = cij = A ± B de tamaño m × n cuyos elementos están dados por: cij = a ij ± bij ,

⎛ a11 a12 a13 L a1n ⎞ ⎛ b11 b12 b13 L b1n ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 a 23 L a2n ⎟ ⎜ b21 b22 b23 L b2 n ⎟
Si A ≡ (a ij ) ≡ ⎜ a 31 a 32 a 33 L a 3n ⎟ y B ≡ (bij ) ≡ ⎜ b31 b32 b33 L b3n ⎟ , entonces
⎜ ⎟ ⎜ ⎟
⎜ M M M O M ⎟ ⎜ M M M O M ⎟
⎜ ⎟ ⎜ ⎟
⎝ a m1 am2 a m3 L a mn ⎠ ⎝ bm1 bm 2 bm 3 L bmn ⎠

⎛ a11 ± b11 a12 ± b12 a13 ± b13 L a1n ± b1n ⎞


⎜ ⎟
⎜ a 21 ± b21 a 22 ± b22 a 23 ± b23 L a 2 n ± b2 n ⎟
C = A ± B ≡ (cij = a ij ± bij ) ≡ ⎜ a 31 ± b31 a 32 ± b32 a 33 ± b33 L a 3n ± b3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a m1 ± bm1 a m 2 ± bm 2 a m 3 ± bm 3 L a mn ± bmn ⎠

⎛2 3 −1⎞ ⎛−1 0 3 ⎞
⎜ ⎟ ⎜ ⎟
EJEMPLO: Consideremos las siguientes matrices A = ⎜ 0 1 − 2 ⎟ y B = ⎜ 5 − 2 − 2 ⎟ , obtener las
⎜1 1 −1⎟ ⎜ 0 1 ⎟⎠
⎝ ⎠ ⎝ 4

operaciones A + B y B − A .

SOLUCIÓN: Tenemos que


⎛2 3 −1⎞ ⎛−1 0 3 ⎞ ⎛ 2 − 1 3 + 0 − 1 + 3 ⎞ ⎛1 3 2 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
A + B = ⎜ 0 1 − 2⎟ + ⎜ 5 − 2 − 2⎟ = ⎜ 0 + 5 1 − 2 − 2 − 2⎟ = ⎜5 − 1 − 4⎟
⎜1 1 −1⎟ ⎜ 0 1 ⎟⎠ ⎜⎝ 1 + 0 1 + 4 − 1 + 1 ⎟⎠ ⎜⎝ 1 5 0 ⎟⎠
⎝ ⎠ ⎝ 4

⎛−1 0 3 ⎞ ⎛ 2 3 −1⎞ ⎛ −1 − 2 0 − 3 3 − (−1) ⎞ ⎛ − 3 − 3 4 ⎞


⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
B − A = ⎜ 5 − 2 − 2 ⎟ − ⎜ 0 1 − 2 ⎟ = ⎜ 5 − 0 − 2 − 1 − 2 − (−2) ⎟ = ⎜ 5 − 3 0 ⎟
⎜ 0 1 ⎟⎠ ⎜⎝ 1 1 − 1 ⎟⎠ ⎜⎝ 0 − 1 4 −1 1 − (−1) ⎟⎠ ⎜⎝ − 1 3 0 ⎟⎠
⎝ 4

Multiplicación por un Escalar


( )
Sea A = a ij una matriz de tamaño m × n y sea α un escalar (número real). El producto de A con α es una
( )
nueva matriz C = cij = α ⋅ A de tamaño m × n cuyos elementos son: cij = α ⋅ a ij ,

⎛ a11 a12 a13 L a1n ⎞


⎜ ⎟
⎜ a 21 a 22 a 23 L a2n ⎟
Si A ≡ (a ij ) ≡ ⎜ a 31 a 32 a 33 L a3n ⎟ y α es un escalar,
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a m1 am2 a m3 L a mn ⎠

I-20
entonces
⎛ α ⋅ a11 α ⋅ a12 α ⋅ a13 L α ⋅ a1n ⎞
⎜ ⎟
⎜ α ⋅ a 21 α ⋅ a 22 α ⋅ a 23 L α ⋅ a 2n ⎟
α ⋅ A ≡ (α ⋅ a ij ) ≡ ⎜ α ⋅ a 31 α ⋅ a 32 α ⋅ a 33 L α ⋅ a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ α ⋅ a m1 α ⋅ am2 α ⋅ a m3 L α ⋅ a mn ⎠

⎛ − 2 0 1 6⎞
EJEMPLO: Consideremos la matriz A = ⎜⎜ ⎟⎟ y el escalar α = −3 , obtener α ⋅ A .
⎝ − 1 − 4 1 0⎠
SOLUCIÓN: Sustituyendo tenemos
⎛ − 2 0 1 6 ⎞ ⎛ − 3(−2) − 3(0) − 3(1) − 3(6) ⎞ ⎛ 6 0 − 3 − 18 ⎞
α ⋅ A = ( −3) ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟
⎝ − 1 − 4 1 0 ⎠ ⎝ − 3(−1) − 3(−4) − 3(1) − 3(0) ⎠ ⎝ 3 12 − 3 0 ⎠

Propiedades
Sean A , B y C matrices del mismo tamaño y α un escalar, entonces:

a) A+ B= B+ A
b) A + ( B + C ) = ( A + B) + C = A + B + C
c) α ⋅ ( A ± B) = α ⋅ A ± α ⋅ B
d) A±Ο= A
e) 1⋅ A = A
f) 0⋅ A= Ο

Multiplicación entre Matrices


( ) ( )
Sea A = a ij una matriz de tamaño m × p . Sea B = bij una matriz de tamaño p × n . El producto de la matriz
( )
A con B es una nueva matriz C = c ij de tamaño m × n cuyos elementos están dados por el producto punto
siguiente: cij = a i ⋅ b j , donde: a i es la fila i de la matriz A y b j es la columna j de la matriz B ,

⎛ a11 a12 a13 L a1 p ⎞ ⎛ b11 b12 b13 L b1n ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 a 23 L a2 p ⎟ ⎜ b21 b22 b23 L b2 n ⎟
Si A ≡ (a ij ) ≡ ⎜⎜ a 31 a 32 a 33 L a 3 p y B ≡ (bij ) ≡ ⎜ b31

⎟ ⎜
b32 b33 L b3n ⎟ ,

⎜ M M M O M ⎟ ⎜ M M M O M ⎟
⎜ ⎟ ⎜ ⎟
⎝ a m1 am2 a m3 L a mp ⎠ ⎝ b p1 b p2 b p3 L b pn ⎠
entonces
⎛ c11 c12 c13 L c1n ⎞
⎜ ⎟
⎜ c 21 c 22 c 23 L c 2n ⎟
C ≡ (cij = a i ⋅ b j ) ≡ ⎜ c31 c32 c33 L c 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ c m1 cm2 c m3 L c mn ⎠

I-21
donde
c11 = a1 ⋅ b1 = a11 ⋅ b11 + a12 ⋅ b21 + a13 ⋅ b31 + L + a1 p ⋅ b p1
c12 = a1 ⋅ b2 = a11 ⋅ b12 + a12 ⋅ b22 + a13 ⋅ b32 + L + a1 p ⋅ b p 2
c 21 = a 2 ⋅ b1 = a 21 ⋅ b11 + a 22 ⋅ b21 + a 23 ⋅ b31 + L + a 2 p ⋅ b p1

p
c ij = a i ⋅ b j = a i1 ⋅ b1 j + a i 2 ⋅ b2 j + a i 3 ⋅ b3 j + L + a ip ⋅ b pj = ∑ a ik ⋅ bkj
k =1

c mn = a m ⋅ bn = a m1 ⋅ b1n + a m 2 ⋅ b2 n + a m3 ⋅ b3n + L + a mp ⋅ b pn

Observamos que para obtener el producto A ⋅ B , se debe de cumplir que el número de columnas de la matriz A
sea igual al número de filas de la matriz B .

⎛ 2 3 −1⎞ ⎛−1 0 1 2 ⎞
⎜ ⎟ ⎜ ⎟
EJEMPLO: Obtener el producto de matrices A⋅ B donde A = ⎜ 0 1 − 2 ⎟ y B = ⎜ 4 2 5 0 ⎟ .
⎜1 1 −1⎟ ⎜ 0 1 0 − 1⎟
⎝ ⎠ ⎝ ⎠
SOLUCIÓN: Tenemos que A es de tamaño 3× 3 y B es de tamaño 3× 4 , entonces el producto de ellas si
esta definido, resultando C = A ⋅ B la cual es una matriz de tamaño 3× 4 , dada por

⎛ c11 c12 c13 c14 ⎞


⎜ ⎟
C = A ⋅ B = ⎜ c 21 c 22 c 23 c 24 ⎟
⎜c c 34 ⎟⎠
⎝ 31 c 32 c 33
donde
c11 = (2,3,−1) ⋅ (− 1,4,0 ) = 10 c 21 = (0,1,−2 ) ⋅ (− 1,4,0 ) = 4 c 31 = (1,1,−1) ⋅ (− 1,4,0 ) = 3
c12 = (2,3,−1) ⋅ (0,2,1) = 5 c 22 = (0,1,−2 ) ⋅ (0,2,1) = 0 c 32 = (1,1,−1) ⋅ (0,2,1) = 1
c13 = (2,3,−1) ⋅ (1,5,0 ) = 17 c 23 = (0,1,−2 ) ⋅ (1,5,0 ) = 5 c 33 = (1,1,−1) ⋅ (1,5,0 ) = 6
c14 = (2,3,−1) ⋅ (2,0,−1) = 5 c 24 = (0,1,−2 ) ⋅ (2,0,−1) = 2 c 34 = (1,1,−1) ⋅ (2,0,−1) = 3

por lo tanto,
⎛10 5 17 5⎞
⎜ ⎟
C = A⋅ B = ⎜ 4 0 5 2⎟
⎜3 3 ⎟⎠
⎝ 1 6

⎛ 2 3 −1⎞ ⎛−1 0 1 2 ⎞
⎜ ⎟ ⎜ ⎟
EJEMPLO: Obtener el producto de matrices B ⋅ A donde A = ⎜ 0 1 − 2 ⎟ y B = ⎜ 4 2 5 0 ⎟ .
⎜1 1 −1⎟ ⎜ 0 1 0 − 1⎟
⎝ ⎠ ⎝ ⎠

SOLUCIÓN: Este producto no esta definido ya que, el número de columnas de la matriz B no es igual al
número de filas de la matriz A .

I-22
Propiedades
Sean A, B y C tres matrices, para las cuales están definidos los productos, y α un escalar, entonces

a) A⋅ B = B ⋅ A
b) A ⋅ ( B ⋅ C ) = ( A ⋅ B) ⋅ C = A ⋅ B ⋅ C
c) A ⋅ (B ± C) = A ⋅ B ± A ⋅ C
d) α ⋅ ( A ⋅ B) = (α ⋅ A) ⋅ B = A ⋅ (α ⋅ B)
c) A⋅Ο = Ο

I-23
REPRESENTACIÒN MATRICIAL DE UN SISTEMA DE ECUACIONES LINEALES.

Consideremos un sistema de m ecuaciones lineales con n incógnitas:

a11 x1 + a12 x 2 + a13 x 3 K + a1n x n = b1


a 21 x1 + a 22 x 2 + a 23 x 3 K + a 2 n x n = b 2
a 31 x1 + a 32 x 2 + a 33 x 3 K + a 3n x n = b3
. . .
a m1 x1 + a m 2 x 2 + a m 3 x 3 K + a mn x n = b m

Para obtener la representación matricial del sistema anterior, definimos las tres matrices siguientes:

⎛ a11 a12 L a1n ⎞


⎜ ⎟
⎜ a 21 a 22 L a 2n ⎟ ⎛ x1 ⎞ ⎛ b1 ⎞
⎜ ⎟ ⎜ ⎟
A = ⎜ a 31 a 32 L a 3n ⎟ ⎜x ⎟
X =⎜ 2⎟
⎜b ⎟
B=⎜ 2 ⎟
⎜ ⎟
⎜ M M O M ⎟ M M
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜x ⎟ ⎜b ⎟
⎝ a m1 a m2 L a mn ⎠ ⎝ n⎠ ⎝ m⎠

Matriz de coeficientes asociados a Matriz de incógnitas o variables Matriz de coeficientes


las variables de tamaño (m × n) de tamaño ( n × 1) independientes de tamaño (m × 1)

Por lo tanto, el sistema de ecuaciones lineales estará representado por la siguiente ecuación matricial,

A⋅ X = B

al sustituir las matrices que definimos anteriormente, explícitamente obtenemos,

⎛ a11 a12 L a1n ⎞


⎜ ⎟ ⎛ x1 ⎞ ⎛ b1 ⎞
⎜ a 21 a 22 L a2n ⎟ ⎜ ⎟ ⎜ ⎟
⎜a ⎜ x 2 ⎟ ⎜ b2 ⎟
a 32 L a 3n ⎟ ⋅ ⎜ ⎟ = ⎜ ⎟
⎜ 31 ⎟ M M
⎜ M M O M ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎜ ⎟ xn
a mn ⎠ ⎝ ⎠ ⎝ ⎠
bm
⎝ a m1 am2 L
donde,
⎛ a11 a12 L a1n ⎞ ⎛ a x + a12 x 2 + a13 x3 K + a1n x n ⎞
⎜ ⎟ ⎛ x1 ⎞ ⎜ 11 1 ⎟ ⎛ b1 ⎞
⎜ a 21 a 22 L a 2 n ⎟ ⎜ ⎟ ⎜ a 21 x1 + a 22 x 2 + a 23 x3 K + a 2 n x n ⎟ ⎜ ⎟
⎜a ⎜ x2 ⎟ ⎜ b2 ⎟
a 32 L a 3n ⎟ ⋅ ⎜ ⎟ = ⎜ a 31 x1 + a 32 x 2 + a 33 x3 K + a 3n x n ⎟ = ⎜ ⎟ ⇒ A⋅ X = B
⎜ 31 ⎟ M ⎜ ⎟ M
⎜ M M O M ⎟ ⎜⎜ ⎟⎟ ⎜ M ⎟ ⎜⎜ ⎟⎟
⎜ ⎟ xn ⎜ ⎟ bm
⎝ a m1 am2 L a mn ⎠ ⎝ ⎠ ⎝ a m1 x1 + a m 2 x 2 + a m 3 x3 K + a mn x n ⎠ ⎝ ⎠

ecuación que reproduce el sistema de ecuaciones lineales anterior.

I-24
La Matriz Aumentada

Definimos la matriz aumentada de un sistema de m ecuaciones lineales con n incógnitas como:

⎛ a11 a12 L a1n b1 ⎞


⎜ ⎟
⎜ a 21 a 22 L a 2n b2 ⎟
M =⎜ Matriz Aumentada de tamaño (m × (n + 1))
M M O M M ⎟
⎜ ⎟
⎜a a m 2 L a mn bm ⎟⎠
⎝ m1

M es una matriz que contiene a todos los coeficientes del sistema. Es la matriz A , con los coeficientes
asociados a las variables, con una columna extra que contiene a la matriz B , de coeficientes independientes.

Cada fila de la matriz corresponde a los coeficientes de una ecuación del sistema. Cada columna corresponde a
los coeficientes de las incógnitas, excepto la última columna que son los coeficientes independientes.

Esta matriz es la que se usa para resolver el sistema de ecuaciones lineales, al cual esta asociada. Para resolver el
sistema, transformamos a la matriz aumentada a una matriz escalonada (triangular superior), ésta transformación
la realizamos mediante las operaciones para obtener matrices equivalentes.

EJEMPLO: Resolver el siguiente sistema de ecuaciones usando la matriz aumentada.

x + 2y + z = 3
2 x + 5 y − z = −4
3x − 2 y − z = 5
La matriz aumentada asociada a este sistema esta dada por
⎛1 2 1 3 ⎞
⎜ ⎟
M = ⎜ 2 5 −1 − 4⎟
⎜ 3 − 2 −1 5 ⎟
⎝ ⎠
Esta se lleva a una forma escalonada reducida, esto es,

R2-(2)R1 → R2 ⎛1 2 1 3 ⎞ R1-(2)R2 → R1 ⎛1 0 7 23 ⎞
R3-(3)R1 → R3 ⎜ ⎟ R3+(8)R2 → R2 ⎜ ⎟
⎜ 0 1 − 3 − 10 ⎟ ⎜ 0 1 − 3 − 10 ⎟
⎜0 − 8 − 4 − 4 ⎟ ⎜ 0 0 − 28 − 84 ⎟
⎝ ⎠ ⎝ ⎠

R3/(28) → R3 ⎛ 1 0 7 23 ⎞ R1+(7)R3 → R1 ⎛1 0 0 2 ⎞
⎜ ⎟ R2-(3)R3 → R2 ⎜ ⎟
⎜ 0 1 − 3 − 10 ⎟ ⎜ 0 1 0 −1 ⎟
⎜ 0 0 −1 − 3 ⎟ ⎜ 0 0 − 1 − 3⎟
⎝ ⎠ ⎝ ⎠

z=3
⇒ y = −1 solución única.
x=2

I-25
EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales mediante la matriz aumentada,

x + y − 2 z + 4t = 5
2 x + 2 y − 3z + t = 3
3x + 3 y − 4 z − 2t = 1
Para este sistema tenemos,
⎛ 1 1 − 2 4 5⎞
⎜ ⎟
M = ⎜ 2 2 − 3 1 3⎟
⎜ 3 3 − 4 − 2 1⎟
⎝ ⎠

R2-(2)R1 → R2 ⎛1 1 − 2 4 5 ⎞ R1+(2)R2 → R1 ⎛ 1 1 0 − 10 − 9 ⎞
R3-(3)R1 → R3 ⎜ ⎟ R3-(2)R2 → R2 ⎜ ⎟
⎜0 0 1 −7 −7 ⎟ ⎜0 0 1 − 7 − 7⎟
⎜ 0 0 2 − 14 − 14 ⎟ ⎜0 0 0 0 0 ⎟
⎝ ⎠ ⎝ ⎠

R2 ⇒ z − 7t = −7 ⇒ z = − 7 + 7t ⇒ t es un parámetro libre,
R1 ⇒ x + y − 10t = −9 ⇒ x = −9 − y + 10t ⇒ y es un parámetro libre,

t =α ∈R
⇒ y = β ∈R
z = −7 + 7α soluciones infinitas.
x = −9 − β + 10α

EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales usando la matriz aumentada,

x1 + x 2 − 2 x 3 + 3x 4 = 4
2 x1 + 3x 2 + 3x 3 − x 4 = 3
5 x1 + 7 x 2 + 4 x 3 + x4 = 5
La matriz aumentada correspondiente es,
⎛1 1 −2 3 4⎞
⎜ ⎟
M = ⎜2 3 3 −1 3⎟
⎜5 7 4 1 5 ⎟⎠

R2-(2)R1 → R2 ⎛1 1 − 2 3 4 ⎞ R1-R2 → R1 ⎛ 1 0 − 9 − 3 10 ⎞
R3-(5)R1 → R3 ⎜ ⎟ R3-(2)R2 → R2 ⎜ ⎟
⎜0 1 7 −7 −5 ⎟ ⎜ 0 1 7 − 7 − 5⎟
⎜ 0 2 14 − 14 − 15 ⎟ ⎜0 0 0 0 − 5 ⎟⎠
⎝ ⎠ ⎝

R3 ⇒ 0 = −5 ⇒ El sistema no tiene solución.

I-26
DETERMINANTES

El determinante es una función, que a cada matriz cuadrada (que tiene el mismo número de filas que de
columnas), le asocia un escalar (número real). Este determinante esta asociado directamente con la
solución de un sistema de ecuaciones lineales, como veremos a continuación.

Veamos como el concepto de determinante esta relacionado con la solución de un sistema de


ecuaciones lineales, solo cuando este tiene el mismo número de ecuaciones que de incógnitas.

Determinante de un sistema de dos ecuaciones lineales con dos incógnitas

Consideremos el caso más simple, que desde luego se puede generalizar, de un sistema de 2 ecuaciones
lineales con 2 incógnitas,
a11 x1 + a12 x 2 = b1 (1)
a 21 x1 + a 22 x 2 = b 2 (2)
Resolvamos el sistema, usando el método de eliminación de variables, primero multiplicamos la ecuación (1) por
a 22 , y la ecuación (2) por a12 , entonces
a11 a 22 x1 + a12 a 22 x 2 = b1 a 22 (3)
a 21 a12 x1 + a 22 a12 x 2 = b 2 a12 (4)

Restamos la ecuación (4) de la ecuación (3) obteniendo,


(a11 a 22 − a 21 a12 )x1 = b1 a 22 − b2 a12
de donde
b a − b2 a12
x1 = 1 22
a11 a 22 − a 21 a12

Ahora multiplicamos la ecuación (1) por a 21 y la ecuación (2) por a11 , así
a11 a 21 x1 + a12 a 21 x 2 = b1 a 21 (5)
a 21 a11 x1 + a 22 a11 x 2 = b 2 a11 (6)

Restamos la ecuación (5) de la ecuación (6) de tal manera que


(a 22 a11 − a12 a 21 )x 2 = b2 a11 − b1 a 21
así tenemos que
b2 a11 − b1 a 21
x2 =
a11 a 22 − a 21 a12

Observamos que ambas incógnitas tienen el denominador en común. Definimos el determinante de un sistema de
dos ecuaciones con dos incógnitas como:

Determinate del Sistema = a11 a 22 − a 21 a12

Si el determinante del sistema es igual a cero, entonces el sistema no tiene solución, o bien tiene
soluciones infinitas. Si el determinante del sistema es distinto de cero, entonces el sistema tiene
solución única.

I-27
Ahora representemos al sistema de ecuaciones en su forma matricial, esto es, A ⋅ X = B , donde

⎛a a12 ⎞ ⎛x ⎞ ⎛b ⎞
A = ⎜⎜ 11 ⎟⎟ , X = ⎜⎜ 1 ⎟⎟ y B = ⎜⎜ 1 ⎟⎟
⎝ a 21 a 22 ⎠ ⎝ x2 ⎠ ⎝ b2 ⎠

Definimos el determinante de la matriz A como, la diferencia de los productos de las diagonales de la matriz,
esto es:
a a12
Det ( A) = A = 11 = a11 a 22 − a12 a 21
a 21 a 22

Por lo tanto, el determinante de la matriz A es igual al determinante del sistema de ecuaciones lineales.

Significado geométrico del determinante

Encontrar el área del paralelogramo formado por los puntos OACB cuyas coordenadas se muestran en la figura
siguiente,

El área de un paralelogramo esta definida como: Aparalelogramo = (base) (altura).

De nuestra figura tenemos que;


base = OA = a 2 + c 2
altura = OQ
donde OQ es perpendicular a BC . Determinemos entonces la magnitud del segmento OQ .

y2 − y1 (c + d ) − d c
Primero, la pendiente de BC la determinamos mediante, mBC = = =
x2 − x2 ( a + b ) − b a

I-28
de manera que la ecuación de la recta BC , esta dada por ,
y − y1 y−d c c bc
mBC = ⇒ = ⇒ y= x− +d
x − x1 x−b a a a
1 a
Como OQ es perpendicular a BC , entonces su pendiente es, mOQ = − =−
mBC c
por lo cual, la ecuación de la recta OQ es,
y − y1 y−0 a a
mOQ = ⇒ =− ⇒ y=− x
x − y2 x−0 c c

El punto de intersección de las dos rectas, OQ y BC , es Q = ( x, y ) , el cual es la solución del sistema siguiente
de dos ecuaciones con dos incógnitas
c bc
y= x− +d
a a
a
y=− x
c
resolviendo tenemos que,
⎛ a2 + c2 ⎞
c
x − + d = − x ⇒ ⎛⎜ + ⎞⎟ x = ⎛⎜ − d ⎞⎟ ⇒ ⎜
bc a c a bc ⎟ x = ⎛⎜ bc − ad ⎞⎟
a a c ⎝ a c ⎠ ⎝ a ⎠ ⎜ ac ⎟ ⎝ a ⎠
⎝ ⎠

de allí ,
ac(bc − ad ) c(bc − ad ) c(ad − bc ) c∆
x= = =− =−
a⎛⎜ a 2 + c 2 ⎞⎟ a2 + c2 a2 + c2 a2 + c2
⎝ ⎠

donde hemos definido el determinante como,


a b
∆= = ad − bc
c d
observamos que las dos columnas de este determinante, corresponden a las coordenadas de los puntos A y B,
respectivamente .

Luego para la otra incógnita,


a a⎛ c∆ ⎞ a∆
y = − x = − ⎜⎜ − ⎟=
c c ⎝ a 2 + c 2 ⎟⎠ a 2 + c 2

Así, el punto de intersección de ambas rectas o segmentos tiene como coordenadas,

⎛ c∆ a∆ ⎞
Q = ( x, y ) = ⎜⎜ − , ⎟

⎝ a2 + c2 a2 + c2 ⎠

La magnitud del segmento OQ o bien la distancia de O a Q (la altura del paralelogramo), esta dada por,

I-29
2 2
⎛ ⎞ ⎛ a∆ ⎞
2 2
c∆ c2 ∆ a2 ∆
altura = OQ = x + y = ⎜ − 22 2 ⎟ +⎜ ⎟ = +
⎜ a + c2



⎜ a2 + c2


⎠ (a 2
+ c2 ) (a
2 2
+ c2 )
2

2 2
∆ ∆ ∆
= (a 2
+c 2
)= =
(a 2
+ c2 )
2
(a 2
+ c2 ) a2 + c2

Por lo tanto,

Aparalelogramo = (base) (altura) = (a 2



+ c2 ⎜)
⎜ 2
∆ ⎞
⎟= ∆

⎝ a +c ⎠
2

a b
esto es, Aparalelogramo = ∆ = .
c d

Determinante de un sistema de dos ecuaciones con dos incógnitas

Consideremos ahora el caso de un sistema de 3 ecuaciones con 3 incógnitas,


a11 x1 + a12 x 2 + a13 x 3 = b1
a 21 x1 + a 22 x 2 + a 23 x 3 = b 2
a 31 x1 + a 32 x 2 + a 33 x 3 = b3

Al resolver el sistema vamos a encontrar que la solución esta dada por,

f 1 (coeficientes ) f 2 (coeficientes ) f 3 (coeficientes )


x1 = , x2 = y x3 =
det. del sistema det. del sistema det. del sistema

dónde ahora
det. del sistema = a11 a 22 a 33 + a12 a 23 a 31 + a13 a 21 a 32 − a13 a 22 a 31 − a12 a 21 a 33 − a11 a 32 a 23

las f i (coeficient es ) son expresiones que dependen de los coeficientes del sistema, como en el caso 2 × 2 ,
obviamente mas complicadas para este sistema de 3 × 3 .

La forma matricial del sistema de ecuaciones es, A ⋅ X = B , para este caso tenemos que

⎛ a11 a12 a13 ⎞ ⎛ x1 ⎞ ⎛ b1 ⎞


⎜ ⎟ ⎜ ⎟ ⎜ ⎟
A = ⎜ a 21 a 22 a 23 ⎟ , X = ⎜ x 2 ⎟ y B = ⎜ b2 ⎟
⎜a a 33 ⎟⎠ ⎜x ⎟ ⎜b ⎟
⎝ 31 a 32 ⎝ 3⎠ ⎝ 3⎠

El determinante de la matriz A esta dado por,

a11 a12 a13


det ( A ) = A = a 21 a 22 a 23 = a11 a 22 a 33 + a12 a 23 a 31 + a13 a 21 a 32 − a13 a 22 a 31 − a12 a 21 a 33 − a11 a 32 a 23
a 31 a 32 a 33

I-30
ó bien como
a11 a12 a13
a a 23 a a 23 a a 22
det ( A ) = A = a 21 a 22 a 23 = a11 22 − a12 21 + a13 21
a 32 a 33 a 31 a 33 a 31 a 32
a 31 a 32 a 33

este último, se conoce como desarrollo en cofactores, con respecto a la primera fila.

Menores y Cofactores

Consideremos una matriz cuadrada A de tamaño n × n , esto es,

⎛ a11 a12 a13 L a1n ⎞


⎜ ⎟
⎜ a 21 a 22 a 23 L a 2n ⎟
A = ⎜ a 31 a 32 a 33 L a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a n1 an2 a n3 L a nn ⎠

Definimos los Menores M ij de la matriz A , como las matrices de tamaño (n − 1) × (n − 1) que resultan de
eliminar la fila i y la columna j de la matriz A .

Los Cofactores Aij de la matriz cuadrada A, se definen como los siguientes determinantes
Aij = (−1) i + j M ij

EJEMPLO: Determine los menores M 24 , M 32 y M 44 y sus correspondientes cofactores, para la siguiente


matriz A ,
⎛ −1 0 1 2⎞
⎜ ⎟
⎜2 3 4 5⎟
A=⎜
−1 − 2 − 3 0⎟
⎜ ⎟
⎜4 ⎟
⎝ 2 7 6 ⎠

SOLUCIÓN: Los menores corresponden a las siguientes matrices de tamaño 3 × 3 ,

⎛ −1 0 1 ⎞ ⎛ −1 1 2⎞ ⎛ −1 0 1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
M 24 = ⎜ − 1 − 2 − 3⎟ , M 32 = ⎜ 2 4 5 ⎟ y M 44 = ⎜ 2 3 4 ⎟
⎜4 7 ⎟⎠ ⎜ 4 7 6⎟ ⎜ − 1 − 2 − 3⎟
⎝ 2 ⎝ ⎠ ⎝ ⎠

Ahora, los cofactores correspondientes son los siguientes determinantes,

−1 0 1
2+ 4
A24 = (−1) M 24 = (+1) − 1 − 2 − 3
4 2 7

I-31
−1 1 2
3+ 2
A32 = (−1) M 32 = (−1) 2 4 5
4 7 6
−1 0 1
4+ 4
A44 = (−1) M 44 = (+1) 2 3 4
−1 − 2 − 3

Consideremos nuevamente el determinante de una matriz A de tamaño (3 × 3) , esto es,

⎛ a11 a12 a13 ⎞


⎜ ⎟
A = ⎜ a 21 a 22 a 23 ⎟
⎜a a 33 ⎟⎠
⎝ 31 a 32
entonces
a11 a12 a13
a a 23 a a 23 a a 22
det ( A ) = A = a 21 a 22 a 23 = a11 22 − a12 21 + a13 21
a 32 a 33 a 31 a 33 a 31 a 32
a 31 a 32 a 33
el cual lo podemos reescribir como
a11 a12 a13
det ( A ) = A = a 21 a 22 ( ) (
a 23 = a11 (− 1) M 11 + a12 (− 1) M 12 + a13 (− 1) M 13
1+1 1+ 2 1+ 3
) ( )
a 31 a 32 a 33

= a11 A11 + a12 A12 + a13 A13

El cual es un desarrollo en cofactores respecto a la primera fila.

Para el caso general de una matriz cuadrada A de tamaño n × n , tenemos,


⎛ a11 a12 a13 L a1n ⎞
⎜ ⎟
⎜ a 21 a 22 a 23 L a 2 n ⎟
A = ⎜ a 31 a 32 a 33 L a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a n1 a n 2 a n 3 L a nn ⎠
el determinante de A está dado por:
a11 a12 a13 L a1n
a 21 a 22 a 23 L a 2n n
det ( A ) = A = a 31 a 32 a 33 L a 3n = a11 A11 + a12 A12 + a13 A13 + L + a1n A1n = ∑ a1k A1k
k =1
M M M O M
a n1 an2 a n3 L a nn

Esto se conoce como el determinante de una matriz por desarrollo en cofactores (con respecto a la primera fila).

I-32
EJEMPLO: Encontrar el determinante de la siguiente matriz desarrollando en cofactores con respecto a la
primera fila.
⎛− 2 0 1 2⎞
⎜ ⎟
⎜ 2 3 0 5⎟
A=⎜
−1 − 2 − 3 0⎟
⎜ ⎟
⎜ 0 7 6 ⎟⎠
⎝ 2
SOLUCIÓN: Tenemos, respecto a la primero fila que

3 0 5 2 0 5 2 3 5 2 3 0
1+1 1+ 2 1+ 3 1+ 4
A = (−2)(−1) − 2 − 3 0 + (0)(−1) − 1 − 3 0 + (1)(−1) − 1 − 2 0 + (2)(−1) − 1 − 2 − 3
2 7 6 0 7 6 0 2 6 0 2 7

⎛ −3 0 −2 −3 ⎞ ⎛ −2 0 −1 0 −1 − 2 ⎞ ⎛ −2 −3 −1 − 3 ⎞
A = (−2)⎜⎜ 3 +5 ⎟ + (1)⎜ 2
⎟ ⎜ −3 +5 ⎟ + (−2)⎜ 2
⎟ ⎜ −3 ⎟
⎝ 7 6 2 7 ⎠ ⎝ 2 6 0 6 0 2 ⎠ ⎝ 2 7 0 7 ⎟⎠

A = (−2)(− 94) + (1)(− 16) + (−2)(5) = 188 − 16 − 10 = 162

Propiedades de los Determinantes

Sea A una matriz cuadrada de tamaño n × n


⎛ a11 a12 L a1n ⎞
⎜ ⎟
⎜ a 21 a 22 L a 2n ⎟
A = ⎜ a 31 a 32 L a 3n ⎟
⎜ ⎟
⎜ M ⎟
⎜ ⎟
⎝ a n1 a n2 L a nn ⎠

* El determinante de A , se puede desarrollar en cofactores respecto a cualquier fila i , esto es,


n
det ( A) = A = a i1 Ai1 + a i 2 Ai 2 + L + a in Ain = ∑ a ik Aik , para i = 1, 2 ,3 ,..., n
k =1
* También podemos desarrollar en cofactores respecto a cualquier columna j , esto es,
n
det ( A) = A = a1 j A1 j + a 2 j A2 j + L + a nj Anj = ∑ a kj Akj , para j = 1, 2 , 3 ,..., n
k =1

EJEMPLO: Calcular el determinante de la siguiente matriz


⎛ −1 0 2 ⎞
⎜ ⎟
A = ⎜ 2 − 3 4⎟
⎜ 1 − 2 3⎟
⎝ ⎠

SOLUCIÓN: Desarrollando en cofactores respecto a la tercera fila

0 2 −1 2 −1 0
A = a 31 A31 + a 32 A32 + a 33 A33 = (1)( −1) 3+1 + ( −2)( −1) 3+ 2 + (3)( −1) 3+ 3 = −1
−3 4 2 4 2 −3

I-33
Ahora desarrollando en cofactores respecto a la segunda columna

2 4 −1 2 −1 2
A = a12 A12 + a 22 A22 + a 32 A32 = (0)( −1) 1+ 2 + ( −3)( −1) 2 + 2 + ( −2)( −1) 2 + 3 = −1
1 3 1 3 2 4

* Si en la matriz A hay dos filas o columnas iguales, el determinante es igual a cero.


EJEMPLO:
⎛−1 0 2 10 ⎞
⎜ ⎟
⎜ 8 −1 − 2 5 ⎟
A=⎜ ⇒ A =0
−1 0 2 10 ⎟
⎜ ⎟
⎜ 4 − 3 11 − 9 ⎟
⎝ ⎠

* Si en la matriz A una fila o una columna es múltiplo de otra, entonces el determinante es igual a cero.

EJEMPLO:
⎛ 2 1 − 11 − 3 ⎞
⎜ ⎟
⎜− 3 −1 − 2 3 ⎟
A=⎜ ⇒ A =0
−5 0 2 0 ⎟
⎜ ⎟
⎜ 4 −3 7 9 ⎟⎠

* Sean A y B dos matrices, cuyo producto esta definido, entonces: A⋅ B = A ⋅ B

* Si multiplicamos una fila o una columna de A por un escalar distinto de cero α , entonces el determinante de
A se multiplica por el escalar.

EJEMPLO: Consideremos la siguiente matriz,


⎛ −1 4 0 ⎞
⎜ ⎟
A = ⎜ 2 7 − 2⎟
⎜ 5 3 −1 ⎟
⎝ ⎠
entonces,
⎛ −1 4 0 ⎞ −1 4 0
⎜ ⎟
B=⎜ 2 7 −2 ⎟ ⇒ B =α ⋅ A =α ⋅ 2 7 −2
⎜ α ⋅ 5 α ⋅ 3 α ⋅ (−1) ⎟ 5 3 −1
⎝ ⎠

⎛ −1 β ⋅ 4 0 ⎞ −1 4 0
⎜ ⎟
C = ⎜ 2 β ⋅ 7 − 2⎟ ⇒ C = β ⋅ A = β ⋅ 2 7 −2
⎜ 5 β ⋅ 3 −1⎟ 5 3 −1
⎝ ⎠

I-34
* Sean A y B dos matrices iguales salvo en la i -ésima fila ó en la j -ésima columna. Si la matriz C es igual a
las matrices A y B salvo en su i -ésima fila ó en la j -ésima columna, la cual es la suma de A y B
respectivamente, entonces tenemos que:
C = A+B

EJEMPLO: Consideremos las siguientes matrices, las cuales son iguales excepto por la tercera fila,
donde la tercera fila de C es la suma de la tercera fila de A y B .

⎛ −1 4 0 ⎞ ⎛ −1 4 0 ⎞ ⎛ −1 4 0 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
A = ⎜ 2 7 − 2⎟ B = ⎜ 2 7 − 2⎟ y C = ⎜ 2 7 − 2⎟
⎜ 5 3 −1 ⎟ ⎜ −1 2 4 ⎟ ⎜4 5 3 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
entonces
−1 4 0 −1 4 0 −1 4 0
C = 2 7 −2 = 2 7 −2 + 2 7 −2 = A + B
4 5 3 5 3 −1 −1 2 4

* El determinante de una matriz triangular (superior o inferior) es igual al producto de los coeficientes
de la diagonal, esto es,
⎛ a11 a12 a13 L a1n ⎞
⎜ ⎟
⎜ 0 a 22 a 23 L a 2n ⎟
A=⎜ 0 0 a33 L a 3n ⎟ ⇒ A = a11 ⋅ a22 ⋅ a33 ⋅ L ⋅ ann
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ 0 0 0 0 a mn ⎠

* Si una matriz A tiene una fila o columna donde todos sus coeficientes son iguales a cero, entonces el
determinante de la matriz es igual a cero.

* Si en una matriz A se intercambian filas o columnas, entonces por cada intercambio el determinante se
multiplica por un signo negativo.

EJEMPLO: Consideremos la siguiente matriz


⎛ −1 4 0 ⎞
⎜ ⎟
A = ⎜ 2 7 − 2⎟
⎜ −1 2 4 ⎟
⎝ ⎠
entonces
−1 4 0 4 −1 0 2 −1 4
A = 2 7 − 2 = (−1) ⋅ 7 2 − 2 = ( −1) ⋅ (−1) ⋅ 7 2 − 2
−1 2 4 2 −1 4 4 −1 0

I-35
REGLA DE KRAMER

A continuación describimos el procedimiento para resolver un sistema de ecuaciones lineales, el cual consiste en
obtener la solución del sistema mediante un cociente de determinantes, este método es conocido como regla de
Kramer. Cabe señalar que de acuerdo a la definición de determinantes, esta regla solo puede aplicarse a sistemas
que tengan el mismo número de ecuaciones y de incógnitas.

Consideremos un sistema de 2 ecuaciones lineales con 2 incógnitas,

a11 x1 + a12 x 2 = b1
a 21 x1 + a 22 x 2 = b2

la representación matricial del sistema es A ⋅ X = B donde,

⎛a a12 ⎞ ⎛x ⎞ ⎛b ⎞
A = ⎜⎜ 11 ⎟, X = ⎜⎜ 1 ⎟⎟ y B = ⎜⎜ 1 ⎟⎟
⎝ a 21 a 22 ⎟⎠ ⎝ x2 ⎠ ⎝ b2 ⎠
entonces la solución es
a 22 b1 − a12 b2 a b − a12 b2
x1 = = 22 1
a11 a 22 − a12 a 21 A
y
a11b2 − a 21b1 a b − a 21b1
x2 = = 11 2
a11 a 22 − a12 a 21 A

tenemos que el determinante esta dad por


a11 a12
A= = a11 a 22 − a 21 a12
a 21 a 22

Definimos la matriz ∆ 1 sustituyendo la primer columna de A por los elementos de la matriz B , esto es

⎛b a12 ⎞
∆ 1 = ⎜⎜ 1 ⎟ ⇒ ∆ 1 = b1 a 22 − a12 b2
⎝ b2 a 22 ⎟⎠

Definimos la matriz ∆ 2 , sustituyendo la segunda columna de A por los elementos de la matriz B , esto es

⎛a b1 ⎞
∆ 2 = ⎜⎜ 11 ⎟ ⇒ ∆ 2 = b2 a11 − b1 a 21
⎝ a 21 b2 ⎟⎠

De esta manera podemos escribir la solución del sistema de ecuaciones como un cociente de determinantes, esto
es,
a b −a b ∆1
x1 = 22 1 12 2 =
A A
y
a b − a 21b1 ∆ 2
x 2 = 11 2 =
A A

I-36
Consideremos el caso general de un sistema de n ecuaciones lineales con n incógnitas.
a11 x1 + a12 x 2 + a13 x 3 K + a1n x n = b1
a 21 x1 + a 22 x 2 + a 23 x 3 K + a 2 n x n = b2
a 31 x1 + a 32 x 2 + a 33 x 3 K + a 3n x n = b3
. . .
a n1 x1 + a n 2 x 2 + a n 3 x 3 K + a nn x n = bn

Su representación matricial es, A ⋅ X = B donde


⎛ a11 a12 L a1n ⎞ ⎛ x1 ⎞ ⎛ b1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 L a 2 n ⎟ ⎜ x2 ⎟ ⎜ b2 ⎟
A=⎜ , X =⎜ ⎟ y B=⎜ ⎟
M M O M ⎟ M M
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜a a 2 n L a nn ⎟⎠ ⎜x ⎟ ⎜b ⎟
⎝ 1n ⎝ n⎠ ⎝ n⎠

∆j
Entonces la solución del sistema está dada por: x j =
A
donde ∆ i es la matriz que se obtiene al eliminar la j-esima columna de la matriz A y sustituirla por los
elementos de la matriz B , esto es,
⎛ a11 a12 L b1 L a1n ⎞
⎜ ⎟
⎜a a 22 L b2 L a 2n ⎟
∆ j = ⎜ 21
M M O M O M ⎟
⎜ ⎟
⎜a L a nn ⎟⎠
⎝ n1 a n 2 L bn

Así que la solución para cada incognita del sistema esta dada por,
∆1
x1 = ,
A
∆2
x2 = ,
A

∆n
xn = .
A

Un sistema tiene solución única si A ≠ 0 y si A = 0 entonces el sistema de ecuaciones o no tiene solución o


tiene soluciones infinitas.

Un sistema de ecuaciones lineales homogéneo tiene solución única (la solución trivial) si y solo si A ≠ 0 y tiene
soluciones infinitas si A = 0 .

EJEMPLO: Resuelva el siguiente sistema de ecuaciones lineales usando la regla de Kramer


2x + y − z = 3
x + y − z =1
x − 2 y − 3z = 4

I-37
SOLUCIÓN: Tenemos los siguientes determinantes

2 1 −1 3 1 −1 2 3 −1 2 1 3
A = 1 1 − 1 = −5 , ∆ 1 = 1 1 − 1 = −10 , ∆ 2 = 1 1 −1 = 5 , ∆3 = 1 1 1 = 0
1 −2 −3 4 −2 −3 1 4 −3 1 −2 4

entonces la solución esta dada por,


∆ 1 − 10 ∆2 5 ∆3 0
x1 = = = 2 , x2= = = −1 y x 3 = = =0
A −5 A −5 A −5

EJEMPLO: Resolver el sistema de ecuaciones lineales homogéneo usando determinantes,


x+ y−z =0
2x + 4 y − z = 0
3x + 2 y + 2 z = 0

SOLUCIÓN: Los determinantes están dadas por

1 1 −1 0 1 −1 1 0 −1 1 1 0
A = 2 4 − 1 = 17 , ∆1 = 0 4 −1 = 0 , ∆ 2 = 2 0 −1 = 0 y ∆ 3 = 2 4 0 = 0
3 2 2 0 2 2 3 0 2 3 2 0

Como los determinantes ∆ i = 0 , entonces tenemos la solución trivial,


0
x1 = x 2 = x 3 = =0
A

EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales


x + 2 y − 3z = 0
2x + 4 y − 2z = 2
3x + 6 y − 4 z = 3

SOLUCIÓN: Los determinantes son

1 2 −3 0 2 −3 1 0 −3 1 2 0
A = 2 4 − 2 = 0 , ∆1 = 2 4 − 2 = 4 , ∆ 2 = 2 2 − 2 = 2 , ∆ 3 = 2 4 2 = 0
3 6 −4 3 6 −4 3 3 −4 3 6 3

Debido a que el A = 0 , el sistema no tiene solución ya que ∆ 1 = 4 ≠ 0 , de donde tenemos que


∆ 4
x= 1
= lo cual no esta definido. .
A 0

I-38
EJEMPLO: Resolver el siguiente sistema de ecuaciones lineales usando la regla de Kramer,

2 x1 + x 2 + 5 x 3 + x 4 = 5
x1 + x 2 − 3 x 3 − 4 x 4 = −1
3 x1 + 6 x 2 − 2 x 3 + x 4 = 8
2 x1 + 2 x 2 + 2 x 3 − 3 x 4 = 2
SOLUCIÓN: Los determinantes a calcular son

2 1 5 1 5 1 5 1 2 5 5 1
1 1 −3 −4 −1 1 − 3 − 4 1 −1 − 3 − 4
A= = −120 , ∆1 = = −240 , ∆ 2 = = −24
3 6 −2 1 8 6 −2 1 3 8 −2 1
2 2 2 −3 2 2 2 −3 2 2 2 −3

2 1 5 1 2 1 5 5
1 1 −1 − 4 1 1 − 3 −1
∆3 = = 0 y ∆4 = = −96
3 6 8 1 3 6 −2 8
2 2 2 −3 2 2 2 2

de manera que la solución esta dada por

∆1 − 240 ∆2 − 24 1 ∆3 0 ∆4 − 96 4
x1 = = = 2 , x2 = = = , x3 = = = 0 y x4 = = =
A − 120 A − 120 5 A − 120 A − 120 5

I-39
INVERSA DE UNA MATRIZ

Recordemos que un sistema de n ecuaciones lineales con n incógnitas o variables,


a11 x1 + a12 x 2 + a13 x 3 K + a1n x n = b1
a 21 x1 + a 22 x 2 + a 23 x 3 K + a 2 n x n = b2
a 31 x1 + a 32 x 2 + a 33 x 3 K + a 3n x n = b3
. . .
a n1 x1 + a n 2 x 2 + a n 3 x 3 K + a nn x n = bn

tiene una representación matricial dada por,


A⋅ X = B
A es la matriz de coeficientes asociados a las variables, B es la matriz de coeficientes independientes y X es la
matriz de variables o incógnitas.

Multipliquemos la ecuación matricial anterior por A −1 , por la izquierda, como en general el producto de
matrices no es conmutativo tenemos que indicar el orden del producto, esto es,
A −1 ⋅ A ⋅ X = A −1 ⋅ B ⇒ I ⋅ X = A −1 ⋅ B
donde I es la matriz identidad, por lo tanto,
X = A −1 ⋅ B
esto quiere decir, que para determinar la solución o la matriz de variables del sistema de ecuaciones lineales,
tenemos que multiplicar la matriz inversa de A por la matriz de coeficientes independientes B , si el sistema no
es homogéneo.

Esta es la razón por la cual es necesario determinar la inversa de una matriz, en relación con la solución de un
sistema de ecuaciones lineales, obviamente existen mas aplicaciones para la matriz inversa. A continuación
daremos las condiciones necesarias que debe cumplir una matriz para que tenga inversa, y en caso de tenerla dar
un procedimiento para obtenerla.

La matriz identidad de tamaño n × n se define como:


⎧ = 1 si i = j
I = a ij ⎨
⎩= 0 si i ≠ j
esto es
⎛1 0 L 0⎞
⎜ ⎟
⎜ 0 1 L 0⎟
I =⎜
M M O M⎟
⎜ ⎟
⎜0 0 L 1⎟
⎝ ⎠

Cualquier matriz arbitraria A conmuta con la matriz identidad, esto es, A ⋅ I = I ⋅ A = A

Sean A y B dos matrices del mismo tamaño n × n . Si se cumple que A ⋅ B = B ⋅ A = I entonces a B se le llama
la inversa de A y se denota como B = A −1 . Si la matriz A tiene inversa entonces decimos que A es invertible.

Propiedades de la Matriz Inversa


a) Si A es invertible entonces ( A −1 ) −1 = A .
b) No toda matriz A tiene inversa.
c) Si A tiene inversa, entonces la inversa es única.

I-40
Mediante el siguiente ejemplo, determinaremos las condiciones necesarias para que una matriz sea invertible o
tenga inversa.

EJEMPLO: Determinar la matriz inversa de una matriz de tamaño 2 × 2 ,


⎛a a12 ⎞
A = ⎜⎜ 11 ⎟⎟
⎝ a 21 a 22 ⎠

SOLUCIÓN: Necesitamos encontrar una matriz B tal que A ⋅ B = B ⋅ A = I , donde B = A −1 , entonces sea

⎛x y⎞
A −1 = ⎜⎜ ⎟⎟ , tal que AA −1 = A −1 A = I
⎝ z w ⎠
⎛ a11 a12 ⎞⎛ x y ⎞ ⎛ 1 0 ⎞ ⎛ a x + a12 z a11 y + a12 w ⎞ ⎛ 1 0 ⎞
⇒ ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⇒ ⎜⎜ 11 ⎟⎟ = ⎜⎜ ⎟⎟
⎝ a 21 a 22 ⎠⎝ z w ⎠ ⎝ 0 1 ⎠ ⎝ a 21 x + a 22 z a 21 y + a 22 w ⎠ ⎝ 0 1 ⎠

dos matrices son iguales si, son del mismo tamaño y si son iguales coeficiente a coeficiente, lo cual
genera el siguiente sistema de ecuaciones lineales,
a11 x + a12 z = 1 (1)
a11 y + a12 w = 0 (2)
a 21 x + a 22 z = 0 (3)
a 21 y + a 22 w = 1 (4)

a 22
Resolviendo tenemos que, de la ecuación (3), x=− z,
a 21

⎛ a ⎞
sustituyendo en (1) obtenemos, a11 ⎜⎜ − 22 ⎟⎟ z + a12 z = 1
⎝ a 21 ⎠
⎛ − a11 a 22 + a12 a 21 ⎞ a 21 a
de donde ⎜⎜ ⎟⎟ z = 1 ⇒ z = = 21
⎝ a 21 ⎠ − a11 a 22 + a12 a 21 − A

a 22 ⎛ a 21 ⎞ a 22
sustituimos en x de tal forma que, x=− ⎜ ⎟=
a 21 ⎜− A ⎟ A
⎝ ⎠

a12
Ahora, de la ecuación (2), y=− w,
a11
⎛ a ⎞
Al sustituir en (4) nos da a 21 ⎜⎜ − 12 ⎟⎟ w + a 22 w = 1 ,
⎝ a11 ⎠
⎛ − a 21 a12 + a 22 a11 ⎞ a11 a
así que, ⎜⎜ ⎟⎟ w = 1 ⇒ w = = 11
⎝ a11 ⎠ − a 21 a12 + a 22 a11 A
⎛ a ⎞⎛ a ⎞ a
Sustituyendo en y obtenemos, y = ⎜⎜ − 12 ⎟⎟⎜ 11 ⎟ = − 12
⎜ ⎟
⎝ a11 ⎠⎝ A ⎠ A

I-41
Por lo tanto, tenemos que
⎛ a 22 − a12 ⎞
⎜ ⎟
⎛x y⎞ ⎜ A A ⎟ 1 ⎛⎜ a 22 − a12 ⎞
A −1 = ⎜⎜ ⎟⎟ = ⎜ ⎟ = A ⎜− a ⎟
⎝ z w ⎠ ⎜ − a 21 a11 ⎝ 21 a11 ⎟⎠
⎜ A ⎟⎟
⎝ A ⎠

Esto nos da una fórmula para obtener la inversa de una matriz de tamaño 2 × 2 , además de obtener
una condición para que la matriz A tenga inversa o sea invertible, la condición que debe cumplirse
es que A ≠ 0 .

EJEMPLO: Determinar la matriz inversa de la matriz A dada por,


⎛ −1 2⎞
A = ⎜⎜ ⎟⎟
⎝ 0 4⎠
−1 2
SOLUCIÓN: Primero verificamos si la matriz es invertible o no, A= = −4 ≠ 0 ⇒ A es invertible
0 4
así tenemos que
⎛ 1⎞ ⎛ 1⎞
1 ⎛ 4 − 2⎞ ⎜ −1 ⎟ ⎛ −1 2⎞ ⎜ −1 ⎟
2 ⎟ = ⎛⎜ 1 0 ⎞⎟ = I
A −1
= ⎜ ⎟=⎜ 2⎟ ⇒ A⋅ A −1
= ⎜⎜ ⎟⎟ ⋅ ⎜
− 4 ⎜⎝ 0 − 1 ⎟⎠ ⎜ 0 1⎟ ⎝ 0 4 ⎠ ⎜⎜ 0 1 ⎟ ⎜⎝ 0 1 ⎟⎠
⎜ ⎟ ⎟
⎝ 4⎠ ⎝ 4⎠

En el ejemplo anterior, y en general para cualquier matriz, observamos que el determinante juega un papel
importante el cálculo de la matriz inversa, por esta razón, la inversa de una matriz solo esta definida para
matrices cuadradas.

A continuación daremos el método general para determinar la inversa de una matriz de tamaño n × n , para lo
cual necesitamos de dos definiciones básicas para matrices.

Matriz Transpuesta

Sea A = (a ij ) una matriz de tamaño m × n . La matriz transpuesta de A es una matriz que denotaremos como
AT = (a ji ) , de tamaño n × m y que se obtiene al colocar las filas de A como columnas de A T , o bien, las
columnas de A como filas de la matriz A T . Esto es, si

⎛ a11 a12 L a1n ⎞ ⎛ a11 a 21 L a m1 ⎞


⎜ ⎟ ⎜ ⎟
⎜a a 22 L a 2n ⎟ ⎜ a12 a 22 L a m 2 ⎟
A = ( a ij ) = ⎜ 21 ⇒ A = (a ji ) = ⎜
T
M M O M ⎟ M M O M ⎟
⎜ ⎟ ⎜ ⎟
⎜a L a mn ⎟⎠ ⎜a ⎟
⎝ m1 a m2 ⎝ 1n a 2 n L a nm ⎠
de tamaño ( m × n) de tamaño ( n × m)

Podemos obtener la transpuesta de de cualquier matriz arbitraria.

I-42
EJEMPLO: Encontrar la transpuesta de la siguiente matriz
⎛ 5 0 − 1⎞
A = ⎜⎜ ⎟⎟
⎝2 3 4 ⎠

SOLUCIÓN: Invertimos las filas como columnas o las columnas como filas y tenemos que
⎛ 2 5⎞
⎜ ⎟
A = ⎜ 3 0⎟
T

⎜ − 1 4⎟
⎝ ⎠
Propiedades de la Matriz Transpuesta
a) (A )
T T
=A
b) ( A ⋅ B ) = B T ⋅ AT
T

c) ( A + B )T = A T + B T

Matriz Adjunta

Sea A = (a ij ) una matriz de tamaño n × n (cuadrada), entonces la matriz adjunta de A , denotada como
adj ( A) = ( A ji ) , es una matriz de tamaño m × n cuyos elementos ij son los cofactores A ji de la matriz A . Esto
es, si

⎛ a11 a12 L a1n ⎞ ⎛ A11 A21 L An1 ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 L a 2n ⎟ ⎜ A12 A22 L An 2 ⎟
A=⎜ ⇒ adj ( A) = ⎜
M M O M ⎟ M M O M ⎟
⎜ ⎟ ⎜ ⎟
⎜a L a mn ⎟⎠ ⎜A L Anm ⎟⎠
⎝ m1 a m2 ⎝ 1m A2 m
donde Aij = (−1) i + j M ij .

Podemos decir que la matriz adj ( A) = ( A ji ) es la matriz transpuesta de cofactores de la matriz A = (a ij ) .

EJEMPLO: Para la siguiente matriz determine su adjunta


⎛3 − 2 1 ⎞
⎜ ⎟
A = ⎜5 6 2 ⎟
⎜ 1 0 − 3⎟
⎝ ⎠
SOLUCIÓ: Determinamos los cofactores de la matriz A , esto es,

A11 = −18 , A12 = 17 , A13 = −6 , A21 = −6 , A22 = −10 ,


A23 = −2 , A31 = −10 , A32 = −1 , A33 = 28

Entonces la matriz adjunta de A es,


⎛ A11 A21 A31 ⎞ ⎛ − 18 − 6 − 10 ⎞
⎜ ⎟ ⎜ ⎟
adj ( A) = ⎜ A12 A22 A32 ⎟ = ⎜ 17 − 10 − 1 ⎟
⎜A A33 ⎟⎠ ⎜⎝ − 6 − 2 28 ⎟⎠
⎝ 13 A23

I-43
EJEMPLO: Para el ejemplo anterior, calcular producto de la matriz A por su adjunta, es decir, realizar la
operación A ⋅ adj ( A) .

SOLUCIÓN: Multiplicando ambas matrices tenemos

⎛ 3 − 2 1 ⎞ ⎛ − 18 − 6 − 10 ⎞ ⎛ − 94 0 0 ⎞ ⎛1 0 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
A ⋅ adj ( A) = ⎜ 5 6 2 ⎟ ⋅ ⎜ 17 − 10 − 1 ⎟ = ⎜ 0 − 94 0 ⎟ = −94⎜ 0 1 0 ⎟
⎜ 1 0 − 3 ⎟ ⎜ − 6 − 2 28 ⎟ ⎜ 0 − 94 ⎟⎠ ⎜0 0 1⎟
⎝ ⎠ ⎝ ⎠ ⎝ 0 ⎝ ⎠
es decir,
A ⋅ adj ( A) = −94 ⋅ I .

Además observamos que,


3 −2 1
A=5 6 2 = −94
1 0 −3

por lo tanto, podemos escribir el siguiente resultado: A ⋅ adj ( A) = A ⋅ I

El resultado del ejemplo anterior, se cumple para cualquier matriz arbitraria, siempre y cuando sea cuadrada, es
decir, es válido para matrices de tamaño (n × n) y cuyo determinante sea distinto de cero. También nos
proporciona un método para calcular la matriz inversa, esto es de la siguiente manera.

Consideremos la ecuación matricial obtenida anteriormente,


A ⋅ adj ( A) = A ⋅ I
multiplicamos por A −1 ambos lados de la igualdad, por la izquierda, esto es,
A −1 ⋅ A ⋅ adj ( A) = A −1 ⋅ A ⋅ I ,
obtenemos entonces que,
I ⋅ adj ( A) = A −1 ⋅ A ⋅ I = A ⋅ A −1 ⋅ I ⇒ adj ( A) = A ⋅ A −1

Como el determinante es una cantidad escalar entonces,


1
A −1 = adj ( A)
A

Esta relación es una fórmula para obtener la inversa de una matriz A , nuevamente la condición es que el
determinante de esta matriz sea distinto de cero para que sea invertible.

EJEMPLO: Determinar la inversa de la siguiente matriz


⎛ 6 2 8⎞
⎜ ⎟
A = ⎜ − 3 4 1⎟
⎜ 4 − 4 5⎟
⎝ ⎠

I-44
SOLUCIÓN: Primero calculamos el determinante para saber si es invertible o no,

6 2 8
A = − 3 4 1 = 150 ≠ 0 ⇒ A es invertible
4 −4 5
calculamos todos los cofactores de A , para construir la matriz adjunta, esto es,
A11 = 24 , A12 = 19 , A13 = −4 ,
A21 = −42 , A22 = −2 , A23 = 32 ,
A31 = −30 , A32 = −30 , A33 = 30
entonces
⎛ A11 A21 A31 ⎞ ⎛ 24 − 42 − 30 ⎞
⎜ ⎟ ⎜ ⎟
adj ( A) = ⎜ A12 A22 A32 ⎟ = ⎜ 19 − 2 − 30 ⎟
⎜A A33 ⎟⎠ ⎜⎝ − 4 32 30 ⎟⎠
⎝ 13 A23

Finalmente la matriz inversa es,


⎛ 24 − 42 − 30 ⎞
−1 1 1 ⎜ ⎟
A = adj ( A) = ⎜ 19 − 2 − 30 ⎟
150 ⎜
30 ⎟⎠
A
⎝ − 4 32

I-45
Método Alternativo para Encontrar la Matriz Inversa

Consideremos un sistema de n ecuaciones lineales con n incógnitas. Su representación matricial esta dada por
la ecuación
A⋅ X = B ⇒ A⋅ X = I ⋅ B (1)

donde A es una matriz de tamaño (n × n) la cual supongamos que se invertible. Ahora multiplicamos la

ecuación matricial por A −1 por ambos lados, por la izquierda, esto es


A −1 ⋅ A ⋅ X = A −1 ⋅ B ⇒ I ⋅ X = A −1 ⋅ B (2)

Comparando las ecuaciones (1) y (2), observamos que son iguales, solo están escritas de forma diferente, de
manera que para pasar de una a otra forma, la matriz identidad A se transforma en la matriz identidad I ,
mientras que la matriz identidad I se transforma en la matriz inversa de A .

Si en un arreglo de matrices dobles colocamos a las matrices I y A , y realizamos el procedimiento anterior con
el método de Gauss, obtendremos la matriz inversa de A . Esto es, tenemos que realizar la siguiente
transformación,
( I A) ⇒ ( A A −1 )
Si tenemos una matriz A de tamaño (n × n) , entonces para determinar la inversa tenemos que,

⎛ 1 0 K 0 a11 a12 K a1n ⎞


⎜ ⎟
⎜ 0 1 K 0 a 21 a 22 K a 2n ⎟
⇔ ⎜M M O M M O M ⎟⎟
( I A)
⎜ M
⎜0 0 K 1 a an2 K a nn ⎟⎠
⎝ n1

⇓ ⇓ ⇓
⎛ b11 b12 K b1n 1 0 K 0⎞
⎜ ⎟
⎜ b21 b22 K b2 n 0 1 K 0⎟
( A −1 I) ⇔ ⎜
⎜ M M O M M M O M ⎟⎟
⎜b bn 2 K bnn 0 0 K 1 ⎟⎠
⎝ n1

EJEMPLO: Determinar la inversa de la siguiente matriz usando Gauss


⎛ 1 0 2⎞
⎜ ⎟
A = ⎜ 2 −1 3⎟
⎜4 1 8⎟
⎝ ⎠
SOLUCIÓN: Construimos la matriz doble ( A I ) , y transformamos el lado derecho en la matriz identidad,

⎛ 1 0 2 1 0 0⎞ ⎛1 0 2 1 0 0⎞
⎜ ⎟ ⎜ ⎟
⎜ 2 −1 3 0 1 0⎟ ⎜ 0 −1 −1 − 2 1 0⎟
⎜ 4 1 8 0 0 1⎟ R2-(2)R1 → R2 ⎜0 1 0 − 4 0 1⎟
⎝ ⎠ R3-(4)R1 → R3 ⎝ ⎠

I-46
⎛1 0 2 1 0 0⎞ ⎛1 0 2 1 0 0⎞
⎜ ⎟ ⎜ ⎟
⎜0 1 0 − 4 0 1⎟ ⎜0 1 0 − 4 0 1⎟
R3 ↔ R2 ⎜ 0 −1 −1 − 2 1 0⎟ R2+R3 → R2 ⎜ 0 0 −1 − 6 1 1⎟
⎝ ⎠ ⎝ ⎠

R1+(2)R3 → R1 ⎛ 1 0 0 − 11 2 2 ⎞ ⎛ 1 0 0 − 11 2 2 ⎞
⎜ ⎟ ⎜ ⎟
⎜0 1 0 − 4 0 1⎟ ⎜0 1 0 − 4 0 1 ⎟
⎜ 0 0 −1 − 6 1 1 ⎟ ⎜ 0 0 1 6 − 1 − 1⎟
⎝ ⎠ (-1)R3 → R3 ⎝ ⎠

Por lo tanto, de la matriz doble ( I A −1 ) tenemos que la inversa de la matriz A es,

⎛ − 11 2 2 ⎞
−1
⎜ ⎟
A =⎜ −4 0 1 ⎟
⎜ 6 − 1 − 1⎟
⎝ ⎠

I-47
ESPACIOS VECTORIALES

En esta sección, trabajaremos con ciertos conjuntos de elementos, donde definiremos dos operaciones sobre
ellos, pero no de manera tradicional, es decir, sin usar ciertas reglas establecidas para realizar las operaciones,
sino, haciendo que los elementos del conjunto junto con las operaciones satisfagan un determinado número de
axiomas.

Un espacio vectorial V es un conjunto de elementos con dos operaciones definidas ⊕ y ⊗ , las cuales satisfacen
las siguientes propiedades:

Cerradura aditiva: Si u, v ∈ V , entonces (u ⊕ v) ∈ V

a) u ⊕ v = v ⊕ u para todo u, v ∈ V
b) u ⊕ (v ⊕ w) = (u ⊕ v) ⊕ w para todo u, v, w ∈ W
c) Existe 0 ∈ V tal que 0 ⊕ u = u ⊕ 0 = u para todo u ∈ V
d) Existe − u ∈ V tal que − u ⊕ u = 0 para todo u ∈ V

Cerradura multiplicativa: Si u ∈ V y α ∈ R entonces (α ⊗ u ) ∈ V

a) α ⊗ (u ⊕ v) = (α ⊗ u ) ⊕ (α ⊗ v) para todo u, v ∈ V y α ∈ R
b) (α + β ) ⊗ u = (α ⊗ u ) ⊕ ( β ⊗ u ) para todo u ∈ V y α , β ∈ R
c) α ⊗ ( β ⊗ u ) = (α ⋅ β ) ⊗ u para todo u ∈ V y α , β ∈ R
d) 1 ⊗ u = u para todo u ∈ V

A los elementos u, v, w,... de un espacio vectorial se les llama Vectores y a los números reales α , β ,... se le
llama escalares. La operación ⊕ se llama suma vectorial y la operación ⊗ se llama producto vectorial (producto
de un escalar por un vector).

EJEMPLOS: Los siguientes conjuntos de elementos forman espacios vectoriales, son los mas usuales,

* El conjunto de los números reales R con las operaciones de ⊕ y ⊗ definidas de la forma


“natural”, esto es, como común y normalmente las realizamos.

* El conjunto de vectores en R 2 , R 3 , K , R n con ⊕ y ⊗ definidas de la forma “natural”, esto es,


para R 3 , por ejemplo, tenemos que
( x1 , y1 , z1 ) + ( x 2 , y 2 , z 2 ) = ( x1 + x 2 , y1 + y 2 , z1 + z 2 ) y α ⋅ ( x, y, z ) = (α ⋅ x, α ⋅ y, α ⋅ z )

* El conjunto de las funciones reales continuas y derivables con las operaciones ⊕ y ⊗


“naturales”, esto es
( f + y )( x) = f ( x) + y ( x) y (α ⋅ f )( x) = α ⋅ f ( x)

* El conjunto de todas las matrices de tamaño m × n , ( M mn ) con las operaciones ⊕ y ⊗


“naturales”, así que
( )
A = a ij , B = bij ( ) ⇒ (
A + B = a ij + bij ) y α ⋅ A = (α ⋅ a ij )

* El producto cartesiano de dos espacios vectoriales, es un espacio vectorial.

II-48
Subespacios Vectorial

Sea V un espacio vectorial con las operaciones de ⊕ y ⊗ definidas. Sea W un subconjunto no vacío de V ,
esto es W ⊆ V . Si W es un espacio vectorial con respecto a las operaciones de ⊕ y ⊗ definidas en V ,
entonces W es un subespacio vectorial de V .

Si W es un subconjunto de un espacio vectorial V , con ⊕ y ⊗ definidas, entonces W es un subespacio


vectorial si satisface las dos condiciones de cerradura siguientes,

a) Si u, v ∈ W entonces u ⊕ v ∈ W . (cerradura aditiva)


b) Si u ∈ V y α ∈ R entonces α ⊗ u ∈ W . (cerradura multiplicativa)

Todo subespacio vectorial W de un espacio vectorial V , contiene al vector cero.

EJEMPLO: Los subconjuntos formados por el vector cero, {0} y V de un espacio vectorial, forman
subespacios vectoriales de V , respecto a las operaciones de suma y multiplicación por
un escalar definida en V .

EJEMPLO: Consideremos el conjunto de los números reales, R = {x | x es un número real} y sea


Ι = {x | x es un número irracional}, entones tenemos que Ι ⊂ R , Ι es un subconjunto de R
¿ Ι es un subespacio vectorial de R , con las operaciones ⊕ y ⊗ naturales ?

SOLUCIÓN: Comprobemos las dos condiciones de cerradura, esto es,


a) Sean x, y ∈ Ι ⇒ x + y ∈ Ι , sí es cerrado bajo suma
b) Consideremos 2 ∈ Ι ⇒ 2 ⋅ 2 = 2 ∉ Ι , no es cerrado bajo producto
Por lo tanto, Ι no es un subespacio vectorial

EJEMPLO: Sea el conjunto M nn = {conjunto de todas las matrices de tamaño n × n } y consideremos


el subconjunto T nn = {conjunto matrices triangulares superiores}, Tnn ⊂ M mn
¿ T nn es un subconjunto vectorial de M mn , con ⊕ y ⊗ definidas de forma natural?

SOLUCIÓN: Verifiquemos las condiciones de cerradura,


a) La suma de dos matrices triangulares es triangular, sí es cerrado bajo la suma.
b) El producto por un escalar da una matriz triangular, sí es cerrado bajo el producto.
Por lo tanto, T nn es un subespacio vectorial

EJEMPLO: Tomemos el siguiente subconjunto de matrices, D nn = {conjunto de matrices tales que D nn ≠ 0 },


donde D nn ⊂ M mn . ¿Es D nn un subespacio vectorial?

⎛1 0⎞ ⎛ −1 0 ⎞
SOLUCIÓN: a) Sean A = ⎜⎜ ⎟⎟ ≠ 0 y B = ⎜⎜ ⎟⎟ ≠ 0 tenemos que A, B ∈ D nn , mientras que la
⎝ 0 1⎠ ⎝ 0 − 1⎠
⎛ 0 0⎞
suma, A + B = ⎜⎜ ⎟⎟ = 0 , estos es, A + B ∉ D nn , no es cerrado bajo la suma.
⎝ 0 0⎠

II-49
b) Sea Ann ∈ D nn , esto es Ann ≠ 0 ahora si α = 0 tenemos que α ⋅ Ann = α n ⋅ Ann = 0 ,
entonces α ⋅ Ann ∉ D nn , no es cerrado bajo el producto.
Por lo tanto, D nn no es un subespacio vectorial.

EJEMPLO: Considere el siguiente conjunto W = {u | u es un número real positivo}, con las siguientes
operaciones, la suma definida por u ⊕ v = uv y el producto definido por α ⊗ u = αu .
¿Es W un subespacio vectorial?

SOLUCIÓN: Si u, v ∈ W ⇒ u ⊕ v = uv ∈ W , sí es cerrado bajo la suma.


a) Sea u ⊕ v = uv y v ⊕ u = vu ⇒ u ⊕ v = v ⊕ u
b) Sea u ⊕ (v ⊕ w) = u ⊕ (vw) = uvw y (u ⊕ v) ⊕ w = (uv) ⊕ w = uvw ⇒
u ⊕ (v ⊕ w) = (v ⊕ u ) ⊕ w
c) Existe 1 ∈ W tal que 1 ⊕ u = 1 ⋅ u = u
d) Existe 0 ∈ W tal que 0 ⊕ u = 0 ⋅ u = 0
Si u, v ∈ W y α ∈ R entonces α ⊗ u = αu ∈ W , sí es cerrado bajo el producto.
Por lo tanto, W es un subespacio vectorial.

EJEMPLOS: Otros subconjunto de elementos que formas subespacios vectoriales, con operaciones de
suma y producto por un escalar definidas de forma natural para sus elementos son,

* Todas las rectas que pasan por el origen de un sistema de coordenadas en R 2 o en R 3 ,


forman un subespacio vectorial de R 2 o en R 3 , respectivamente.

* Todos los planos que pasan por el origen de coordenadas en en R 3 , conforman un subespacio
vectorial de R 3 .

* El conjunto de todos los múltiplos de un vector fijo de un espacio vectorial V , forma un


subespacio vectorial de V .

* La intersección de dos subespacios vectoriales, también es un subespacio vectorial.

OBSERVACIÓN: En general, y la mayoría de las veces, es más usual trabajar con subespacios vectoriales
vectoriales que con los propios espacios vectoriales, ver algunos de los ejemplos anteriores, esto tiene como
ventaja que solo debemos verificar las condiciones de cerradura, aditiva y multiplicativa, para verificarse se trata
o no de un subespacio vectorial.

II-50
Cuando trabajamos con espacios o subespacios vectoriales, cado uno de estos conjuntos tiene ciertas
características bien definidas y propias de cada uno de ellos, además contienen un número infinito de vectores,
que, para cuestiones operativas resulta demasiado laborioso manejar toda el álgebra y todos los elementos del
conjunto.

Una herramienta que nos ayuda a caracterizar cualquier elemento de un espacio o subespacio vectorial, así como
las operaciones definidas en el, son las bases de estos conjunto. Para lo cual necesitamos definir conceptos como,
combinación lineal de vectores, dependencia e independencia lineal de vectores, vectores generadores.

Definamos entonces estos conceptos y veamos su forma operativa.

Combinación Lineal

Consideremos un conjunto de vectores S = {u1 , u 2 , u 3 ,..., u n } de un espacio vectorial V. Si un vector v ∈ V se


puede escribir en términos de los vectores de S, esto es,
v = α 1 u1 + α 2 u 2 + K + α n u n donde α i ∈ R
entonces decimos que el vector v es una Combinación Lineal de los vectores u1 , u 2 , u 3 ,..., u n , donde al menos
uno de los α i es distinto de cero.

EJEMPLO: Consideremos el espacio vectorial R 3 , sea el conjunto de vectores S = {v1 , v 2 , v 3 } donde


v1 = (1,2,1) , v 2 = (1,0,2) y v 3 = (1,1,0) .
Escribir el vector u = ( 2,1,5) como una combinación lineal de los vectores de S .

SOLUCIÓN: Escribimos u = α 1 ⋅ v1 + α 2 ⋅ v 2 + α 3 ⋅ v 3 , y determinamos los escalares α i , esto es,


( 2,1,5) = α 1 ⋅ (1,2,1) + α 2 ⋅ (1,0,2) + α 3 ⋅ (1,1,0) = (α 1 + α 2 + α 3 ,2α 1 + α 3 , α 1 + 2α 2 )
esta igualdad genera el siguiente sistema de ecuaciones lineales, igualamos componente a
componente,
2 = α1 + α 2 + α 3 α1 = 1
1 = 2α 1 + α 3 ⇒ α2 = 2
5 = α 1 + 2α 2 α 3 = −1
Esto significa que u = ( 2,1,5) , se puede expresar como combinación lineal de los vectores
v1 , v2 , v3 , es decir,
u = 1 ⋅ v1 + 2 ⋅ v 2 − 1 ⋅ v 3

EJEMPLO: Sea el espacio vectorial P3 , y el conjunto de vectores S = {v1 , v 2 } donde


v1 = 1 + x + x 3 y v 2 = − x − x 2 − x 3 .
Escribir el vector u = −1 + x 2 como combinación lineal de los vectores de S .

SOLUCIÓN: Escribimos al vector u = −1 + x 2 en términos de los vectores de S, esto es,


u = α 1 ⋅ v1 + α 2 ⋅ v 2
y determinamos si existen los escalares α i , esto es,
u = −1 + x 2 = α 1 (1 + x + x 3 ) + α 2 (− x − x 2 − x 3 ) = α 1 + (α 1 − α 2 ) x − α 2 x 2 + (α 1 − α 2 ) x 3

II-51
esto genera el siguiente sistema de ecuaciones lineales, aquí igualamos los coeficientes
que tengan potencias iguales,
− 1 = α1
α 1 = −1
0 = α1 − α 2 ⇒
α 2 = −1
1 = −α 2
Entonces u = −1 + x 2 , se puede expresar como combinación lineal de los vectores v1 y v 2 , de la
forma,
u = −1 ⋅ v1 − 1 ⋅ v 2

Consideremos un conjunto de vectores S = {v1 , v 2 ,..., v n } de un espacio vectorial V. Si todo vector de V se puede
escribir como combinación lineal del conjunto de vectores de S, entonces se dice que los vectores v1 , v2 ,..., vn
Generan al espacio vectorial V.

En ortras palabras, si todo vector u ∈ V se puede escribir como u = α 1 v1 + α 2 v 2 + K + α n v n , entonces se dice


que el conjunto S = {v1 , v 2 ,..., v n } es un Conjunto Generador del espacio vectorial V.

EJEMPLO: Los siguientes conjuntos de vectores son generadores para el espacio vectorial respectivo,

a) Los conjuntos S = {(1,0,0), (0,1,0), (0,0,1)} y T = {(1,2,−1), ( −1,1,−2), (1,1,1)} son generadores del
espacio vectorial R 3 .

{ } { }
b) S = 1, x, x 2 , x 3 y T = 1, x,2 x 2 ,3 − 3x + x 3 son conjuntos generadores del espacio vectorial
P3 (polinomios de grado ≤ 3).

c) Los siguientes conjuntos de matrices, generan al espacio vectorial M 22 (matrices de tamaño


⎧⎛ 1 0 ⎞ ⎛ 0 1 ⎞ ⎛ 0 0 ⎞ ⎛ 0 0 ⎞⎫ ⎧⎛ 1 0 ⎞ ⎛1 1 ⎞ ⎛ 2 1 ⎞ ⎛ 3 0 ⎞⎫
2 × 2 ), S = ⎨⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟⎬ y T = ⎨⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟⎬
⎩⎝ 0 0 ⎠ ⎝ 0 0 ⎠ ⎝ 1 0 ⎠ ⎝ 0 1 ⎠⎭ ⎩⎝ 0 0 ⎠ ⎝1 0 ⎠ ⎝ 0 0 ⎠ ⎝ − 1 1 ⎠⎭

Es claro que un espacio vectorial puede tener un número infinito de conjuntos generadores.

EJEMPLO: Consideremos el espacio vectorial P2 (polinomios de grado menor o igual a dos), y el


conjunto de vectores S = {v1 , v 2 , v 3 , v 4 } donde,
v1 = 2 x 2 + x + 2 , v 2 = x 2 − 2 x , v 3 = 5 x 2 − 5 x + 2 y v 4 = − x 2 − 3x − 2 .
¿Es u = x 2 + x + 2 combinación lineal de los vectores de S?

SOLUCIÓN: Escribimos al vector u como combinación de los vectores de S, esto es,


u = α 1 v1 + α 2 v 2 + α 3 v 3 + α 4 v 4
entonces,
x 2 + x + 2 = α 1 (2 x 2 + x + 2) + α 2 ( x 2 − 2 x) + α 3 (5 x 2 − 5 x + 2) + α 4 (− x 2 − 3x − 2)
= (2α 1 + α 2 + 5α 3 − α 4 ) x 2 + (α 1 − 2α 2 − 5α 3 − 3α 4 ) x + (2α 1 + 2α 3 − 2α 4 )

II-52
lo cual, al igualar coeficientes con potencias iguales, genera el siguiente sistema de ecuaciones,
1 = 2α 1 + α 2 + 5α 3 − α 4
1 = α 1 − 2α 2 − 5α 3 − 3α 4 El sistema no tiene solución
2 = 2α 1 + 2α 3 − 2α 4
Como los escalares α i no existen, por lo tanto, el vector u no se pude escribir como combinación
lineal de los vectores de v1 , v2 , v3 , v4 .
Entonces el conjunto S = {v1 , v 2 , v 3 , v 4 } no es conjunto generador de P2 .

Un conjunto generador de un espacio vectorial es un subespacio vectorial.

Dependencia e independencia lineal

Un conjunto de vectores S = {v1 , v 2 ,..., v n } de un espacio vectorial V es Linealmente Dependiente si existen


escalares (no todos ceros), tales que
α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n = 0

El conjunto de vectores S = {v1 , v 2 ,..., v n } es Linealmente Independiente si en la ecuación,


α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n = 0
todos los escalares son iguales a cero, es decir, α i = 0 para toda i.

Podemos observar que para verificar si un conjunto de vectores es linealmente independiente o dependiente,
siempre tenemos que construir la ecuación,
α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n = 0
esta relación vectorial genera un sistema de ecuaciones lineales homogéneo, donde las incógnitas son las α i ,
este sistema por ser homogéneo solo tiene dos posibles soluciones, estas son,

a) Solución única α i = 0 (la solución trivial), entonces los vectores son Linealmente Independientes
b) Soluciones infinitas, entonces los vectores son Linealmente Dependientes

Si un conjunto de vectores contiene al vector cero, entonces este conjunto es linealmente dependiente, ya que el
coeficiente de este vector, será distinto de cero.

Si en un conjunto de vectores, alguno de ellos se puede escribir como combinación lineal de los restantes, es
decir, si existen vectores múltiplos de otros, entonces el conjunto será linealmente dependiente.

EJEMPLO: Consideremos los siguientes vectores v1 , v 2 , v3 , v 4 del espacio vectorial R 4 donde,


v1 = (1,0,1,0) , v 2 = (0,1,−1,2) , v 3 = (0,2,2,1) y v 4 = (1,0,0,1) .
¿Estos vectores son linealmente dependientes o independientes?

SOLUCIÓN: Escribimos la ecuación vectorial


α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n = 0
sustituimos los vectores anteriores, esto es,
α 1 (1,0,1,0) + α 2 (0,1,−1,2) + α 3 (0,2,2,1) + α 4 (1,0,0,1) = (0,0,0,0)
como sabemos esta ecuación genera un sistema de ecuaciones lineales homogéneo,

II-53
α1 + α 4 = 0
α 2 + 2α 3 = 0
α 1 − α 2 + 2α 3 = 0
2α 1 + α 3 + α 4 = 0
Resolviendo por regla de Kramer tenemos que,

1 0 0 1 0 0 0 1
0 1 2 0 0 1 2 0
A= = 3 , ∆1 = = 0 , ∆2 = ∆3 = ∆4 = 0 (ya que es homogéneo)
0 −1 2 0 0 −1 2 0
0 2 1 1 0 2 1 1
entonces la solución es
∆1 ∆2 ∆3 ∆4
α1 = ,α 2 = ,α 3 = ,α 4 =
A A A A

⇒ α 1 = α 2 = α 3 = α 4 = 0 Solución única (trivial)

Por lo tanto, los vectores v1 , v 2 , v 3 , v 4 son linealmente independientes.

{ }
EJEMPLO: Mostrar que el conjunto S = 1, x, x 2 , x 3 de P3 es un conjunto de vectores linealmente
independiente

SOLUCIÓN: Escribimos la ecuación, α1 ⋅ 1 + α 2 ⋅ x + α 3 ⋅ x 2 + α 4 ⋅ x 3 = 0


Si α i = 0 ∀i ⇒ son linealmente independientes
Si α i ≠ 0 para algún i ⇒ son linealmente dependientes
La ecuación anterior debe ser válida para toda x ∈ R , así generamos las ecuaciones siguientes,
Para x = 0: α 1 ⋅1 = 0 ⇒ α 1 = 0
Para x = 1: α2 +α3 +α4 = 0
Para x = -1: − α 2 + α 3 − α 4 = 0
Para x = 2 : 2α 2 + 4α 3 − 8α 4 = 0
Resolviendo el sistema homogéneo anterior por regla de Kramer encontramos,
1 1 1
A = − 1 1 − 1 = 12 ≠ 0
2 4 8
⇒ Solución única: α 1 = α 2 = α 3 = α 4 = 0
Por lo tanto, los vectores 1, x, x 2 , x 3 son linealmente independientes.

II-54
Bases de Espacios Vectoriales

Un conjunto de vectores S = {v1 , v 2 ,..., v n }, es una base de un espacio vectorial V si cumple con las siguientes
propiedades:

a) Que el conjunto de vectores S genere al espacio vectorial V , esto es, que todo vector u ∈ V se pueda
escribir como combinación de los vectores de S , es decir, u = α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n

b) Que el conjunto de vectores S sea linealmente independiente, esto es, se tiene que satisfacer la condición de
que α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n = 0 con α i = 0 para toda i .

EJEMPLO: Los siguientes conjuntos forman bases en los espacios vectoriales correspondientes,

a) El conjunto de vectores {iˆ, ˆj , kˆ} en R 3 , es linealmente independiente y además generan


al espacio vectorial R 3 , por lo tanto, son una base de R 3 .

b) El conjunto de vectores {1, x, x 2 , x 3 } en P 3 , es generador de P 3 y también es linealmente


independiente, por lo tanto, forman una base de P 3 .

⎧⎛ 1 0 ⎞ ⎛ 0 1 ⎞ ⎛ 0 0 ⎞ ⎛ 0 0 ⎞⎫
c) Los vectores ⎨⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟, ⎜⎜ ⎟⎟⎬ generan al espacio vectorial M 22 y además
⎩⎝ 0 0 ⎠ ⎝ 0 0 ⎠ ⎝ 1 0 ⎠ ⎝ 0 1 ⎠⎭
son linealmente independientes, entonces forman una base de M 22 .

En todos los casos del ejemplo anterior, consideramos las bases canónicas de los espacios vectoriales R 3 , P 3 y
M 22 , respectivamente. Nuevamente tenemos que puede haber un número infinito de bases para un espacio
vectorial

Si el conjunto de vectores S = {v1 , v 2 ,..., v n } es una base de un espacio vectorial V , entonces todo vector u ∈ V
tiene una representación única en términos de los vectores de esa base. Esto es, si u ∈ V , entonces
u = α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n
donde los α i son escalares únicos, es decir, si se resuelve el sistema de ecuaciones lineales correspondiente, este
tendrá solución única.

Sea S = {v1 , v 2 ,..., v n } un conjunto de vectores en un espacio vectorial. Definimos el conjunto generado por S
como aquel que contiene a todos los vectores que son combinación lineal de v1 , v2 ,..., vn esto es,
W = gen( S ) = {u u = α 1v1 + α 2 v 2 + α 3 v3 + K + α n v n }

EJEMPLO: Consideremos los vectores v1 = (2,−1,4) y v 2 = ( 4,1,6) del espacio vectorial R 3 .


Determine el conjunto generado por los vectores v1 y v 2 .

SOLUCIÓN: Sea H = gen{v1 , v 2 } ≡ {u | u = α 1 v1 + α 2 v 2 } , si u = ( x, y , z ) ∈ H entonces, escribimos al


vector u = ( x, y , z ) en términos de los vectores v1 y v 2 , esto es,

II-55
u = ( x, y , z ) = α 1 v1 + α 2 v 2 = α 1 ( 2,−1,4) + α 2 ( 4,1,6)
= ( 2α 1 + 4α 2 ,−α 1 + α 2 ,4α 1 + 6α 2 )

esta ecuación genera el siguiente sistema de ecuaciones lineales


x = 2α 1 + 4α 2
y = −α 1 + α 2
z = 4α 1 + 6α 2
Resolviendo el sistema tenemos que,
⎛ 2 4 x⎞ ⎛0 0 x / 6 − 2y / 3 ⎞
⎜ ⎟ ⎜ ⎟
⎜ −1 1 y ⎟ ⇒ ⎜0 1 x/6+ y /3 ⎟
⎜ 4 6 z⎟ ⎜ 0 0 − 5x / 3 + 2 y / 3 + z ⎟
⎝ ⎠ ⎝ ⎠
− 5x 2 y
donde R3 ⇒ + + z = 0 ⇒ − 5 x + 2 y + 3z = 0
3 3
la ecuación corresponde a un plano que pasa por el origen.
Por lo tanto, v1 y v 2 generan al plano H que pasa por el origen.

EJEMPLO: Consideremos los siguientes conjuntos de vectores de R 3 , S = {(1,1,−1), ( 2,3,−1), (3,1,−5)} y


T = {(1,−1,−3), (3,−2,−8), ( 2,1,−3)} . Si V = gen( S ) y W = gen(T ) , mostrar que V = W .

SOLUCIÓN: Colocamos los vectores de ambos conjuntos como las filas de una matriz y esta matriz la
Llevamos a su forma escalonada reducida. Tenemos entonces que,
Para los vectores del conjunto S ,
⎛ 1 1 − 1⎞ ⎛1 1 −1⎞ ⎛1 0 − 2⎞
⎜ ⎟ R2 → R2 − 2 R1 ⎜ ⎟ R1 → R1 − R2 ⎜ ⎟
A = ⎜ 2 3 − 1⎟ ⎜0 1 1 ⎟ ⎜0 1 1 ⎟
⎜ 3 1 − 5 ⎟ R3 → R3 − 3R1 ⎜ 0 − 2 − 2 ⎟ R 3 → R3 + 2 R 2 ⎜ ⎟
⎝ ⎠ ⎝ ⎠ ⎝0 0 0 ⎠
Para los vectores del conjunto T ,
⎛ 1 − 1 − 3⎞ ⎛ 1 − 1 − 3⎞ ⎛1 0 − 2⎞
⎜ ⎟ R2 → R2 − 3R1 ⎜ ⎟ R1 → R1 + R2 ⎜ ⎟
B = ⎜ 3 − 2 − 8⎟ ⎜0 1 1 ⎟ ⎜0 1 1 ⎟
⎜ 2 1 − 3 ⎟ R3 → R3 − 2 R1 ⎜0 3 3 ⎟⎠
R3 → R3 − 3R2 ⎜ ⎟
⎝ ⎠ ⎝ ⎝0 0 0 ⎠
Observamos que las matrices reducidas son exactamente las misma, esto quiere decir que los
conjuntos S y T general el mismo subespacio vectorial de R 3 , es decir, V = W .

Procedimiento para construir bases de espacios vectoriales.

Sea S = {v1 , v 2 , K , v n } un conjunto de vectores generador del espacio vectorial W , si los vectores v1 , v 2 , K , v n
son linealmente independientes, esto es, si
α 1 v1 + α 2 v 2 + K + α v v n = 0 con α i = 0 para toda i ,
entonces S = {v1 , v 2 , K , v n } es base de W .

Si resulta que α i ≠ 0 para algún i , entonces significa que los vectores v1 , v 2 , K , v n son linealmente
dependientes, esto quiere decir que existe algún v i que es combinación lineal de las restantes, por lo cual
formamos un nuevo conjunto S1 con los vectores restantes, quitando al vector v i .

II-56
Si los vectores del conjunto S1 , son linealmente independientes entonces S1 es una base de W , si estos vectores
son linealmente dependientes entonces existe algún v i que es combinación lineal de las restantes, formamos un
conjunto S 2 , con los vectores restantes. Si los vectores de S 2 son linealmente independientes entonces S 2 es
una base de W .

El procedimiento continúa hasta obtener un conjunto donde solo obtengamos vectores linealmente
independientes y este, será una base de W .

EJEMPLO: Considere el conjunto de vectores S = {v1 ,v 2 , v 3 , v 4 , v 5 } en R 4 , donde v1 = (1,2,−2,1) ,


v 2 = (− 3,0,−4,5) , v 3 = (2,1,1,−1) , v 4 = (− 3,3,−9,6 ) y v 5 = (9,3,7,−6 ) .
Obtener una base para el conjunto generado por S .

SOLUCIÓN: Necesitamos una base para


W = gen( S ) = {u u = α 1v1 + α 2 v 2 + α 3 v3 + α 4 v 4 + α 5 v5 }.
Para obtenerla, solo tenemos que determinar los vectores linealmente independientes
del conjunto S = {v1 ,v 2 , v 3 , v 4 , v 5 } .
El Procedimiento es el siguiente, consideremos la ecuación,
α 1 v1 + α 2 v 2 + α 3 v 3 + α 4 v 4 + α 5 v 5 = 0
esto es,
α 1 (1,2,−2,1) + α 2 (− 3,0,−4,5) + α 3 (2,1,1,−1) + α 4 (− 3,3,−9,6 ) + α 5 (9,3,7,−6 ) = (0,0,0,0 )
o bien
(α 1 − 3α 2 + 2α 3 − 3α 4 + 9α 5 ,2α 1 + α 3 + 3α 4 + 3α 5 ,−2α 1 − 4α 2 + α 3 − 9α 4 + 7α 5 ,
α 1 + 5α 2 − α 3 + 6α 4 − 6α 5 ) = (0,0,0,0 )

esta ecuación como siempre, nos conduce a un sistema de ecuaciones lineales homogéneo
α 1 − 3α 2 + 2α 3 − 3α 4 + 9α 5 = 0
2α 1 + α 3 + 3α 4 + 3α 5 = 0
− 2α 1 − 4α 2 + α 3 − 9α 4 + 7α 5 = 0
α 1 + 5α 2 − α 3 + 6α 4 − 6α 5 = 0

Para resolver el sistema anterior, construimos la matriz aumentada y la llevamos a su forma


escalonada reducida, esto es,
⎛ 1 −3 2 −3 9 0⎞ ⎛1 0 1/ 2 3 / 2 3 / 2 0⎞
⎜ ⎟ ⎜ ⎟
⎜ 2 0 1 3 3 0⎟ ⎜ 0 1 −1 / 2 3 / 2 − 5 / 2 0⎟
⎜− 2 ⎟ ⇒ ⎜
⎜ −4 1 −9 7 0⎟ ⎜0 0 0 0 0 0 ⎟⎟
⎜ 1 5 −1 6 −6 ⎟
0⎠ ⎜ 0 ⎟⎠
⎝ ⎝0 0 0 0 0
v1 v2 v3 v4 v5 v1 v2 v3 v4 v5

Consideramos solo las columnas que contienen "unos" principales, y estas nos dan los
vectores que son linealmente independientes del conjunto.

Para este caso, corresponde a las columnas uno y dos, de manera que los vectores linealmente
independientes son {v1 , v 2 } , así que estos forman una base para W = gen( S ) .

II-57
OBSERVACIÓN: Es claro que los vectores linealmente independientes que se obtengan de este proceso,
depende del orden en el que se coloquen en la matriz, pero siempre se obtendrá el mismo número.

EJEMPLO: Consideremos el siguiente sistema de ecuaciones lineales homogéneo,


x + y + 2w = 0
− 2 x − 2 y + z − 5w = 0
x + y − z + 3w = 0
4 x + 4 y − z + 9w = 0
Determine una base para el espacio solución del sistema anterior.

SOLUCIÓN: Primero resolvemos el sistema, usaremos la matriz aumentada la cual transformamos a su


forma escalonada reducida, esto es,
⎛ 1 1 0 2 0⎞ ⎛ 1 1 0 2 0⎞
⎜ ⎟ ⎜ ⎟
⎜− 2 − 2 1 − 5 0⎟ ⎜ 0 0 1 −1 0⎟
⎜ 1 1 − 1 3 0 ⎟ ⇒ ⎜ 0 0 0 0 0 ⎟⎟
⎜ ⎟ ⎜
⎜ 4 4 −1 9 0 ⎟⎠ ⎜ 0 0 0 0 0 ⎟⎠
⎝ ⎝
de donde
R2 ⇒ z − w = 0 ⇒ z = w =α ∈R
R1 ⇒ x + y + 2 w = 0 ⇒ x = − y − 2 w = − β − 2α , β ∈ R
entonces, el sistema tiene soluciones infinitas, parametrizadas por los escalares α , β ∈ R , las
cuales están dadas por:
x = − β − 2α , y = β , z = α y w = α ,
dónde α y β son parámetros libres.
En forma matricial tenemos que A ⋅ X = Ο , es decir la solución es el vector

⎛ x ⎞ ⎛ − β − 2α ⎞ ⎛ − 1⎞ ⎛ − 2⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜y⎟ ⎜ β ⎟ ⎜1⎟ ⎜ 0 ⎟
X =⎜ ⎟=⎜ ⎟ = β⎜ ⎟ +α⎜ ⎟
z α 0 1
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ w⎟ ⎜ α ⎟ ⎜0⎟ ⎜ 1 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠

⎧⎛ − 1⎞ ⎛ − 2 ⎞⎫
⎪⎜ ⎟ ⎜ ⎟⎪
⎪⎜ 1 ⎟ ⎜ 0 ⎟⎪
Esto quiere decir que los vectores ⎨⎜ ⎟, ⎜ ⎟⎬ generan a todas las soluciones del sistema,
⎪⎜ 0 ⎟ ⎜ 1 ⎟⎪
⎪⎜⎝ 0 ⎟⎠ ⎜⎝ 1 ⎟⎠⎪
⎩ ⎭
además son linealmente independientes, por lo tanto, son una base del conjunto solución del
sistema de ecuaciones lineales homogéneo.

Si el conjunto de vectores S = {v1 , v 2 , K , v n } es una base de un espacio vectorial V , entonces cualquier


conjunto de vectores que sean múltiplos de esta base, también forman una base de V . Esto es, el conjunto
S = {c1 v1 , c 2 v 2 , K , c n v n } con c i ≠ 0 también es una base de V .

Un espacio vectorial puede tener un número infinito de bases.

II-58
Dimensión de un espacio vectorial

Si S = {v1 , v 2 , K , v n } es un conjunto de vectores linealmente independiente y T = {u1 , u 2 , K , u m } es base de un


espacio vectorial V , entonces n ≤ m , en otras palabras, el número máximo de vectores linealmente
independientes en un espacio vectorial, es igual a número de vectores que tiene una base de ese espacio.

Si S = {v1 , v 2 , K , v n } es una base de un espacio vectorial V y T = {u1 , u 2 , K , u m } es otra base distinta del
mismo espacio vectorial, entonces n = m , es decir, toda base de un espacio vectorial tiene el mismo número de
vectores.

Por lo tanto, si todo base de un espacio vectorial tiene el mismo numero de vectores, entonces la dimensión de
un espacio vectorial V se define como, el número de vectores que tiene alguna base de V .

EJEMPLO: Tenemos la dimensión de algunos espacios vectoriales

a) La dimensión de R es igual a 1, Dim (R ) = 1


b) La dimensión de ( )
R 3 es igual a 3, Dim R 3 = 3
c) La dimensión de P2 es igual a 3, Dim (P2 ) = 3
d) La dimensión de M 22 es igual a 4, Dim (M 22 ) = 4
e) La dimensión de M 32 es igual a 6, Dim (M 32 ) = 6

Si S = {v1 , v 2 , K , v n } es un conjunto de vectores linealmente independiente en un espacio vectorial V , entonces


existe una base de V que contiene al conjunto S . Es decir, de un conjunto de vectores linealmente
independiente se puede obtener una base del espacio vectorial.

EJEMPLO: Sean v1 = (1,0,1,0) y v 2 = ( −1,1,−1,0) dos vectores linealmente independientes de R 4 .


Construir una base de R 4 que contenga a los vectores v1 y v 2 .

SOLUCIÓN: Una base de R 4 debe contener 4 vectores, consideremos la base canónica de R 4 ,


estos vectores son, e1 = (1,0,0,0) , e 2 = (0,1,0,0) , e3 = (0,0,1,0) y e 4 = (0,0,0,1)

Formamos el conjunto de vectores {v1 , v 2 , e1 , e 2 , e3 , e 4 } , este conjunto es un generador de R 4


pero no es linealmente independiente.

Eliminamos los vectores linealmente dependientes de ese conjunto, usando los unos principales,
esto es, colocamos los vectores como columnas en una matriz y esta la llevamos a su forma
escalonada reducida,

⎛1 −1 1 0 0 0⎞ ⎛1 0 0 1 1 0⎞
⎜ ⎟ ⎜ ⎟
⎜0 1 0 1 0 0⎟ ⎜0 1 0 1 0 0⎟
⎜1 ⇒
−1 0 0 1 0⎟ ⎜0 0 1 0 −1 0⎟
⎜ ⎟ ⎜ ⎟
⎜0 0 0 0 0 1 ⎟⎠ ⎜0 0 0 0 0 1 ⎟⎠
⎝ ⎝
v1 v2 e1 e2 e3 e4 v1 v2 e1 e2 e3 e4

II-59
Por lo tanto, el conjunto de vectores {v1 , v 2 , e1 , e 4 } es linealmente independiente
y generan a R 4 , por lo tanto es una base para el espacio vectorial R 4 .

Consideremos un espacio vectorial V de dimensión n y un conjunto de n vectores S = {v1 , v 2 , K , v n } de V ,


tenemos entonces que;
1) Si S = {v1 , v 2 , K , v n } es linealmente independiente ⇒ S = {v1 , v 2 , K , v n } es una base.
2) Si S = {v1 , v 2 , K , v n } genera a V ⇒ S = {v1 , v 2 , K , v n } es una base.

EJEMPLO: Determinar una base para el plano cuya ecuación es, 2 x − y − z = 0 .

SOLUCIÓN: Resolvemos la ecuación 2 x − y − z = 0 , es una ecuación con tres incógnitas, despejamos


Una de ellas para obtener la solución,
y z
x= +
2 2
entonces si y = α ∈ R y z = β ∈ R , donde α y β son parámetros libres.
La solución se puede expresar como el vector
⎛ α β⎞
⎜x = + ⎟ ⎛1 / 2 ⎞ ⎛1 / 2 ⎞
⎜ 2 2⎟ ⎜ ⎟ ⎜ ⎟
X =⎜ α ⎟ = α⎜ 1 ⎟ + β⎜ 0 ⎟
⎜ β ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟
⎜ ⎟ ⎝ ⎠ ⎝ ⎠
⎝ ⎠
⎧⎛1 / 2 ⎞ ⎛1 / 2 ⎞⎫
⎪⎜ ⎟⎜ ⎟⎪
Los vectores ⎨⎜ 1 ⎟, ⎜ 0 ⎟⎬ generan al plano y son linealmente independientes,
⎪⎜ 0 ⎟ ⎜ 1 ⎟⎪
⎩⎝ ⎠⎝ ⎠⎭
por lo tanto son una base que genera al plano..

II-60
CAMBIO DE BASE

En la sección anterior describimos las propiedades que debe tener un conjunto de vectores, para que pueda ser
una base de un espacio vectorial dado. Como lo mencionamos anteriormente, un espacio vectorial puede tener un
número infinito de bases. Entonces ahora, nos enfocaremos a determinar la relación que existe entre las bases de
un espacio vectorial dado.

Sea el conjunto de vectores S = {v1 , v 2 ,..., v n } una base del espacio vectorial V . Entonces todo vector u ∈ V se
puede escribir en términos de los vectores de la base S , esto es,
u = α 1 v1 + α 2 v 2 + α 3 v 3 + K + α n v n
Definamos el siguiente vector columna, como,
⎛ α1 ⎞
⎜ ⎟
α
[u ]S = ⎜⎜ 2 ⎟⎟ ≡ vector de coordenadas de u en términos de la base de S .
M
⎜ ⎟
⎜α ⎟
⎝ n⎠
Esta representación es única y corresponde a los coeficientes del desarrollo del vector u en términos de la base
S = {v1 , v 2 ,..., v n }.

Sea T = {w1 , w2 ,..., wn } otra base del espacio vectorial V , entonces el vector u ∈ V tiene otra representación
distinta en términos de esta nueva base, esto es,
u = β 1 w1 + β 2 w 2 + β 3 w3 + K + β n w n
donde ahora
⎛ β1 ⎞
⎜ ⎟
β
[u ]T = ⎜⎜ 2 ⎟⎟ ≡ vector de coordenadas de u en términos de la base de T.
M
⎜ ⎟
⎜β ⎟
⎝ n⎠

EJEMPLO: Si u = (−1,2,−6,2) es un vector arbitrario de R 4 , determinar [u ]S donde S = {v1 , v 2 , v 3 , v 4 }


es una base de R 4 con, v1 = (1,1,0,0) , v 2 = ( 2,0,1,0) , v 3 = (0,1,2,−1) y v 4 = (0,1,−1,0) .

SOLUCIÓN: Escribimos al vector u = (−1,2,−6,2) como combinación lineal de la base S, es decir,


⎛ α1 ⎞
⎜ ⎟
⎜α ⎟
u = α 1 v1 + α 2 v 2 + α 3 v 3 + α 4 v 4 ⇒ [u ]S =⎜ 2⎟
α
⎜ 3⎟
⎜α ⎟
⎝ 4⎠
De manera que tenemos que resolver el sistema

α 1 + 2α 2 = −1 α1 = 5
α1 + α 3 + α 4 = 2 α = −3
resolviendo encontramos que la solución es, 2
α 2 + 2α 3 − α 4 = −6 α 3 = −2
−α3 = 2 α 4 = −1

II-61
⎛ 5 ⎞
⎜ ⎟
⎜ − 3⎟
Por lo tanto, el vector u en términos de la base S está dado por [u]S = ⎜ ⎟
−2
⎜ ⎟
⎜ −1⎟
⎝ ⎠

EJEMPLO: Consideramos la base canónica de R 4 , esto es, C = {e1 , e 2 , e3 , e 4 } donde e1 = (1,0,0,0) ,


e 2 = (0,1,0,0) , e3 = (0,0,1,0) y e 4 = (0,0,0,1) . Determinar [u ]C para el vector u = (1,2,−6,2) .

SOLUCIÓN: Necesitamos resolver la ecuación


u = β 1 e1 + β 2 e 2 + β 3 e 3 + β 4 e 4
para determinar los coeficientes β 1 , β 2 , β 3 y β 4 , entonces
( −1,2,−6,2) = β 1 (1,0,0,0) + β 2 (0,1,0,0) + β 3 (0,0,1,0) + β 4 (0,0,0,1) = (β 1 , β 2 , β 3 , β 4 )
por lo tanto tenemos que
⎛ β1 ⎞ ⎛ − 1 ⎞
⎜ ⎟ ⎜ ⎟
β
[u ]C = ⎜⎜ 2 ⎟⎟ = ⎜⎜ ⎟⎟
2
β −6
⎜ 3⎟ ⎜ ⎟
⎜β ⎟ ⎜ 2 ⎟
⎝ 4⎠ ⎝ ⎠

Cuando se usa la base canónica, los coeficientes del desarrollo son las componentes del vector.

Procedimiento para obtener el cambio de base de un vector

Cuando escribimos un vector en términos de dos bases distintas, sus representaciones son también distintas y
únicas, determinaremos entonces la relación que guardan ambas representaciones.

Sean S = {v1 , v 2 ,..., v n } y T = {w1 , w2 ,..., wn } dos bases de un espacio vectorial V .

Escribimos al vector u ∈ V en términos de la base T , esto es,


⎛ α1 ⎞
⎜ ⎟
⎜α ⎟
u = α 1 w1 + α 2 w2 + α 3 w3 + K + α n wn ⇒ [u ]T =⎜ 2⎟
M
⎜ ⎟
⎜α ⎟
⎝ n⎠
Ahora escribimos el vector u en términos de la base S:

[u ]S = [α1 w1 + α 2 w2 + α 3 w3 + K + α n wn ]S
= [α 1 w1 ]S + [α 2 w2 ]S + ... + [α n wn ]S = α 1 [w1 ]S + α 2 [w2 ]S + ... + α n [wn ]S

Los términos [wi ]S , significan que debemos escribimos los vectores de la base T en términos de la base S ,
es
w1 = a11 v1 + a 21 v 2 + ... + a n1 v n
w2 = a12 v1 + a 22 v 2 + ... + a n 2 v n

wn = a1n v1 + a 2 n v 2 + ... + a nn v n

II-62
Entonces tenemos que
⎛ a11 ⎞ ⎛ a12 ⎞ ⎛ a1n ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 ⎟ ⎜ a 22 ⎟ ⎜ a 2n ⎟
[w1 ]S = ⎜ ⎟ , [w2 ]S = ⎜ , ... , [wn ]S = ⎜
M M ⎟ M ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜a ⎟ ⎜a ⎟ ⎜a ⎟
⎝ n1 ⎠ ⎝ n2 ⎠ ⎝ nn ⎠

Sustituimos los vectores [wi ]S en la ecuación [u ]S = α 1 [w1 ]S + α 2 [w2 ]S + ... + α n [wn ]S , esto es

⎛ a11 ⎞ ⎛ a12 ⎞ ⎛ a1n ⎞ ⎛ α 1 a11 + α 2 a12 + ... + α n a1n ⎞ ⎛ a11 a12 L a1n ⎞⎛ α 1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟
⎜ a 21 ⎟ ⎜ a 22 ⎟ ⎜ a 2 n ⎟ ⎜ α 1 a 21 + α 2 a 22 + ... + α n a 2 n ⎟ ⎜ a 21 a 22 L a 2 n ⎟⎜ α 1 ⎟
[u ]S = α 1 ⎜ ⎟ + α 2 ⎜ ⎟ + K + α n ⎜ ⎟ = ⎜ ⎟=⎜ M
M M M M M O M ⎟⎜ M ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟
⎜a ⎟
⎝ n1 ⎠
⎜a ⎟
⎝ n2 ⎠
⎜ a ⎟ ⎜ α a + α a + ... + α a ⎟ ⎜ a
⎝ nn ⎠ ⎝ 1 n1 2 n2 n nn ⎠ ⎝ n1 a n2 L a nn ⎟⎠⎜⎝ α 1 ⎟⎠
de donde observamos que
⎛ a11 a12 L a1n ⎞⎛ α 1 ⎞ ⎛ a11 a12 L a1n ⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 L a 2 n ⎟⎜ α 1 ⎟ ⎜ a 21 a 22 L a 2 n ⎟
[u ]S = ⎜ = [u ]T
M M O M ⎟⎜ M ⎟ ⎜ M M O M ⎟
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜a ⎟⎜ ⎟ ⎜ ⎟
⎝ n1 a n 2 L a nn ⎠⎝ α 1 ⎠ ⎝ a n1 a n 2 L a nn ⎠

Esta ecuación relaciona al vector escrito en términos de la base T, ([u ]T ) con el vector escrito en términos de la
base S, ([u ]S ) , esta relación se hace mediante una matriz que definiremos como, Matriz de Cambio de Base o
Matriz de transición, dada por,
⎛ a11 a12 L a1n ⎞
⎜ ⎟
⎜ a 21 a 22 L a 2 n ⎟
PT → S ≡ ⎜ ≡ matriz de cambio de base ( de la base T a la base S)
M M O M ⎟
⎜ ⎟
⎜a ⎟
⎝ n1 a n 2 L a nn ⎠

La matriz de transición de de la base S a la base T se obtiene realizando un proceso semejante al anterior o


simplemente como,
QS →T = P −1T → S ≡ matriz de cambio de base ( de la base S a la base T).

Utilizando esta matrices de cambio de base tenemos las siguientes relaciones,


[u ]S = PT → S [u ]T
[u ]T = Q S →T [u ]S

EJEMPLO: Determinar las matrices de cambio de base PT → S y Q S →T , para las siguientes bases de R 3 ,
sean S = {v1 , v 2 , v 3 } y T = {w1 , w2 , w3 } dos bases del espacio vectorial R 3 con,
v1 = ( 2,0,1) , v 2 = (1,2,0) , v 3 = (1,1,1) , w1 = (6,3,3) , w2 = ( 4,−1,3) y v 3 = (5,5,2) .

SOLUCIÓN: Primero determinemos la matriz PT → S , expresamos los vectores de T en términos de los vectores
de S, esto es,

II-63
w1 = a11 v1 + a 21 v 2 + a 31 v 3 (1)

w2 = a12 v1 + a 22 v 2 + a 32 v 3 (2)
w3 = a13 v1 + a 23 v 2 + a 33 v 3 (3)
donde deseamos determinar
⎛ a11 ⎞ ⎛ a12 ⎞ ⎛ a13 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
[w1 ]S = ⎜ a 21 ⎟ , [w2 ]S = ⎜ a 22 ⎟ y [w3 ]S = ⎜ a 23 ⎟
⎜a ⎟ ⎜a ⎟ ⎜a ⎟
⎝ 31 ⎠ ⎝ 32 ⎠ ⎝ 33 ⎠
de tal manera que
⎛ a11 a12 a13 ⎞
⎜ ⎟
PT → S = ([w1 ]S [w2 ]S [w3 ]S ) = ⎜ a 21 a 22 a 23 ⎟
⎜a a 33 ⎟⎠
⎝ 31 a 32

Así que tenemos que resolver los sistemas de ecuaciones lineales que se generan, (1), (2) y (3).

MÉTODO A) Para el sistema (1) tenemos,


(6,3,3) = a11 ( 2,0,1) + a 21 (1,2,0) + a 31 (1,1,1) = ( 2a11 + a 21 + a 31 ,2a 21 + a 31 , a11 + a 31 )
entonces
w1 v1 v2 v3
6 = 2a11 + a 21 + a 31 ⎛ 6 2 1 1⎞ ⎛ a11 1 0 0 ⎞ ⎛ a11 = 2 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
3 = 2a 21 + a 31 ⇒ ⎜ 3 0 2 1⎟ ⇒ ⎜ a12 0 1 0 ⎟ ⇒ [w1 ]S = ⎜ a12 = 1 ⎟
3 = a11 + a 31 ⎜ 3 1 0 1⎟ ⎜a ⎟ ⎜a =1 ⎟
⎝ ⎠ ⎝ 13 0 0 1 ⎠ ⎝ 13 ⎠

Para el sistema (2) ahora,


( 4,−1,3) = a12 ( 2,0,1) + a 22 (1,2,0) + a 32 (1,1,1) = ( 2a12 + a 22 + a 32 ,2a 22 + a 32 , a12 + a 32 )
de donde
w2 v1 v2 v3
4 = 2a12 + a 22 + a 32 ⎛ 4 2 1 1⎞ ⎛ a12 1 0 0 ⎞ ⎛ a12 = 2 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
− 1 = 2a 22 + a 32 ⇒ ⎜ − 1 0 2 1⎟ ⇒ ⎜ a 22 0 1 0 ⎟ ⇒ [w2 ]S = ⎜ a 22 = −1⎟
3 = a12 + a 32 ⎜ 1 1 0 1⎟ ⎜a ⎟ ⎜a =1 ⎟
⎝ ⎠ ⎝ 32 0 0 1 ⎠ ⎝ 32 ⎠

Finalmente para el sistema (3),


(5,5,2) = a13 ( 2,0,1) + a 23 (1,2,0) + a 33 (1,1,1) = ( 2a13 + a 23 + a 33 ,2a 23 + a 33 , a13 + a 33 )
con
w3 v1 v2 v3
5 = 2a13 + a 23 + a 33 ⎛ 5 2 1 1⎞ ⎛ a13 1 0 0 ⎞ ⎛ a13 = 1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
5 = 2a 23 + a 33 ⇒ ⎜ 5 0 2 1⎟ ⇒ ⎜ a 23 0 1 0 ⎟ ⇒ [w3 ]S = ⎜ a 23 = 2 ⎟
2 = a13 + a 33 ⎜ 2 1 0 1⎟ ⎜a ⎟ ⎜a =1 ⎟
⎝ ⎠ ⎝ 33 0 0 1 ⎠ ⎝ 33 ⎠

Por lo tanto la matriz de transición PT → S esta dada por


⎛ a11 a12 a13 ⎞ ⎛ 2 2 1 ⎞
⎜ ⎟ ⎜ ⎟
PT → S = ⎜ a 21 a 22 a 23 ⎟ = ⎜ 1 − 1 2 ⎟
⎜a a 33 ⎟⎠ ⎜⎝ 1 1 1 ⎟⎠
⎝ 31 a 32

II-64
MÉTODO B) Otra manera de resolver de manera simultanea los tres sistemas de ecuaciones lineales es,
construyendo una matriz doble que contenga a los vectores de ambas bases y transformar
a una de las matrices a la matriz identidad, esto es,

⎛2 1 1 6 5⎞
4 ⎛1 0 0 2 1⎞2
⎜ ⎟ ⎜ ⎟
(v1 v2 v 3 w1 w2 w3 ) ≡ ⎜ 0 2 1 3 −1 5⎟ ⇒ ⎜ 0 1 0 1 −1 2⎟ ⇒ (I PT → S )
⎜1 0 1 3 3 2 ⎟⎠ ⎜0 0 1 1 1 1 ⎟⎠
⎝ ⎝

Para determinar la metro de cambio de base Q S →T tenemos que hacer un desarrollo similar al
anterior, es decir, resolver ahora los siguientes sistemas de ecuaciones,
v1 = b11 w1 + b21 w2 + b31 w3
v 2 = b12 w1 + b22 w2 + b32 w3
v 3 = b13 w1 + b23 w2 + b33 w3
donde ahora
⎛ b11 b12 b13 ⎞
⎜ ⎟
Q S →T = ([v1 ]T [v 2 ]T [v 3 ]T ) = ⎜ b21 b22 b23 ⎟
⎜b ⎟
⎝ 31 b32 b33 ⎠

Usando la matriz doble, definida anteriormente, tenemos

⎛2 1 1 6 45⎞ ⎛ 3 / 2 1/ 2 − 5 / 2 1 0 0⎞
⎜ ⎟ ⎜ ⎟
(v1 v2 v3 w1 w2 w3 ) ≡ ⎜ 0 2 1 3 − 1 5 ⎟ ⇒ ⎜ −1 / 2 −1 / 2 3 / 2 0 1 0 ⎟ ⇒ (Q S →T I)
⎜1 0 1 3 3 2 ⎟⎠ ⎜ −1 0 2 0 0 1 ⎟⎠
⎝ ⎝

Por lo tanto la matriz de transición Q S →T esta dada por


⎛ b11 b12 b13 ⎞ ⎛ 3 / 2 1 / 2 − 5 / 2 ⎞
⎜ ⎟ ⎜ ⎟
Q S →T = ⎜ b21 b22 b23 ⎟ = ⎜ − 1 / 2 − 1 / 2 3 / 2 ⎟
⎜b ⎟ ⎜ 2 ⎟⎠
⎝ 31 b32 b33 ⎠ ⎝ − 1 0

Además se debe de cumplir que QS →T = P −1T → S

Vemos que es mas práctico usar la representación matricial de los sistemas de ecuación es lineales, por lo cual a
continuación daremos una forma de escribir un polinomio mediante una notación matricial.

Consideremos un polinomio de grado n, esto es


P ( x) = a 0 + a1 x + a 2 x 2 + ... + a n −1 x n −1 + a n x n
este tiene una representación como un vector columna, la cual esta dada de la forma siguiente,
⎛ an ⎞
⎜ ⎟
⎜ a n −1 ⎟
P( x) = ⎜ M ⎟
⎜ ⎟
⎜ a1 ⎟
⎜ ⎟
⎝ a0 ⎠

II-65
EJEMPLO: Sean P( x) = x 3 − 2 x + 1 y Q( x) = − x 2 + 2 x − 3 dos polinomio, escribirlos como vectores columna.

SOLUCIÓN: Tenemos que


⎛ 1 ⎞
⎜ ⎟ ⎛ −1⎞
⎜ 0 ⎟ ⎜ ⎟
P (x) = ⎜ ⎟ y Q( x) = ⎜ 2 ⎟
−2 ⎜ − 3⎟
⎜ ⎟ ⎝ ⎠
⎜ 1 ⎟
⎝ ⎠

EJEMPLO: Consideremos las siguientes bases del espacio vectorial P1 , S = {v1, v2} y T ={w1, w2} con,
v1 = x , v 2 = x − 3 , w1 = x − 1 y w 2 = x + 1
Determinar las matrices de cambio de base PT → S y Q S →T .
Escribir al polinomio u = 5 x + 1 en términos de la base T, esto es, encontrar [u ]T y mediante PT → S
determinar [u ]S .

SOLUCIÓN: Construimos la matriz doble con los elementos de ambas bases

(v1 v 2 w1 w2 ) ≡ ⎛⎜⎜ 10 −13 −11 11⎞⎟⎟


⎝ ⎠

⎛1 0 2/3 4/3 ⎞ ⎛2 / 3 4 / 3 ⎞
Para PT → S tenemos que ⎜⎜ ⎟ por lo tanto PT → S = ⎜
⎜ 1 / 3 − 1 / 3 ⎟⎟
⎝0 1 1 / 3 − 1 / 3 ⎟⎠ ⎝ ⎠

⎛1 / 2 2 1 0⎞ ⎛1 / 2 2 ⎞
Para Q S →T ahora es ⎜⎜ ⎟ entonces tenemos que Q S →T = ⎜
⎟ ⎜1 / 2 − 1⎟⎟
⎝1 / 2 − 1 0 1⎠ ⎝ ⎠

Ahora determinemos [u ]T , esto es, escribimos al vector u en términos de los vectores de la base T,
⎛ α1 ⎞
u = α 1 v1 + α 2 v 2 donde [u ]T = ⎜⎜ ⎟⎟
⎝α 2 ⎠
sustituyendo
5 x + 1 = α 1 (x − 1) + α 2 (x + 1) = (α 1 + α 2 )x + (− α 1 + α 2 )
de donde obtenemos el sistema de ecuaciones
α1 + α 2 = 5 α1 = 2

− α1 + α 2 = 1 α2 = 3
entonces
⎛ 2⎞
[u ]T
= ⎜⎜ ⎟⎟
⎝ 3⎠
Para encontrar [u ]S usamos la matriz de cambio de base PT → S , que transforma un vector
en términos de la base T, a un vector en términos de la base S, esto es,

⎛ 2 / 3 4 / 3 ⎞⎛ 2 ⎞ ⎛ 16 / 3 ⎞
[u ]S = PT → S [u ]T = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟
⎝ 1 / 3 − 1 / 3 ⎠⎝ 3 ⎠ ⎝ − 1 / 3 ⎠

II-66
BASES ORTONORMALES

Entre todos los conjuntos de vectores que forman bases de un espacio vectorial, existen algunos que tienen
ciertas propiedades o características muy particulares, ya sea por sus aplicaciones o por simplificar algunas
cuestiones algebraicas. Estas bases son conocidas como bases ortonormales y a continuación analizaremos sus
aspectos mas importantes.

En particula,r solo trataremos bases ortonormales de vectores en el espacio vectorial R n y todos los subespacios
que pueden obtenerse de el, esto es, en R 2 , R 3 , R 4 , etc.

Un conjunto de vectores S = {v1 , v 2 ,..., v n } de el espacio vectorial R n , es un conjunto ortogonal si los vectores
satisfacen la siguiente condición:
v i ⋅ v j = 0 para i ≠ j
en otras palabras, si los vectores son perpendiculares entre si. La operación vi ⋅ v j es el producto punto o escalar
común que conocemos de análisis vectorial, esto es,
u ⋅ v = (x1 , x 2 ,..., x n ) ⋅ ( y1 , y 2 ,..., y n ) = x1 y1 + x 2 y 2 + ... + x n y n

El conjunto de vectores S = {v1 , v 2 ,..., v n } será un conjunto ortonormal de vectores si se cumple las condiciones
siguientes,
v i ⋅ v j = 0 para i ≠ j
vi ⋅ v j = 1 para i = j
es decir, si los vectores son perpendiculares y cada uno de ellos tiene longitud unitaria, vi = 1 , para toda i .

EJEMPLO: El conjunto de vectores canónicos de R 3 , es un conjunto de vectores ortonormal. Tenemos que,


iˆ ⋅ ˆj = (1,0,0) ⋅ (0,1,0) = 0
iˆ ⋅ kˆ = (1,0,0) ⋅ (0,0,1) = 0
ˆj ⋅ kˆ = (0,1,0) ⋅ (0,0,1) = 0
y además
iˆ ⋅ iˆ = (1,0,0) ⋅ (1,0,0) = 1
ˆj ⋅ ˆj = (0,1,0) ⋅ (0,1,0) = 1
kˆ ⋅ kˆ = (0,0,1) ⋅ (0,0,1) = 1

Todo conjunto ortogonal de de vectores S = {v1 , v 2 ,..., v n }, se puede transformar en un conjunto ortonormal,
únicamente tenemos que normalizar los vectores del conjunto S . Recordemos que normalizar un vector,
significa hacerlo de longitud unitaria, esto se realiza, dividiendo al vector entre su norma (longitud).

EJEMPLO: Consideremos los vectores u1 = (1,0,2) , u 2 = ( −2,0,1) y u 3 = (0,1,0) del espacio vectorial R 3 .
Determinar un conjunto ortonormal a partir de ellos.
SOLUCIÓN: Tenemos que
u1 ⋅ u 2 = (1,0,2) ⋅ (−2,0,1) = 0
u1 ⋅ u 3 = (1,0,2) ⋅ (0,1,0) = 0
u 2 ⋅ u 3 = (−2,0,1) ⋅ (0,1,0) = 0
por lo tanto {u1 , u 2 , u 3 } es un conjunto ortogonal de vectores en R 3 .

II-67
Ahora normalizamos los vectores, esto es,
u (1,0,2) ⎛ 1 2 ⎞
w1 = 1 = = ⎜⎜ ,0, ⎟⎟
u1 1 +0 +2
2 2 2
⎝ 5 5⎠
u2 (−2,0,1) ⎛−2 1 ⎞
w2 = = = ⎜⎜ ,0, ⎟⎟
u2 (−2) + 0 + 1
2 2 2
⎝ 5 5⎠
u3
= (0,1,0)
(0,1,0)
w3 = =
u3 0 + 12 + 0 2
2

esto nuevo conjunto de vectores satisface las condiciones,


⎛ 1 2 ⎞ ⎛−2 1 ⎞
w1 ⋅ w2 = ⎜⎜ ,0, ⎟⎟ ⋅ ⎜⎜ ,0, ⎟⎟ = 0
⎝ 5 5⎠ ⎝ 5 5⎠
⎛ 1 2 ⎞
w1 ⋅ w3 = ⎜⎜ ,0, ⎟⎟ ⋅ (0,1,0) = 0
⎝ 5 5⎠
⎛−2 1 ⎞
w2 ⋅ w3 = ⎜⎜ ,0, ⎟⎟ ⋅ (0,1,0) = 0
⎝ 5 5⎠
y
⎛ 1 2 ⎞ ⎛ 1 2 ⎞
w1 ⋅ w1 = ⎜⎜ ,0, ⎟⎟ ⋅ ⎜⎜ ,0, ⎟⎟ = 1
⎝ 5 5⎠ ⎝ 5 5⎠
⎛−2 1 ⎞ ⎛−2 1 ⎞
w2 ⋅ w2 = ⎜⎜ ,0, ⎟⎟ ⋅ ⎜⎜ ,0, ⎟⎟ = 1
⎝ 5 5⎠ ⎝ 5 5⎠
w3 ⋅ w3 = (0,1,0) ⋅ (0,1,0) = 1
Por lo tanto, el conjunto de vectores {w1 , w2 , w3 } es un conjunto ortonormal en R 3 .

Si S = {v1 , v 2 ,..., v n } es un conjunto ortonormal de vectores, entonces los vectores de S son linealmente
independientes. Para mostrar esto, consideremos la siguiente ecuación,
α 1 v1 + α 2 v 2 + K + α n v n = 0
multiplicamos la ecuación anterior por el vector v1, con lo cual obtenemos:
α 1 (v1 ⋅ v1 ) + α 2 (v 2 ⋅ v1 ) + K + α n (v n ⋅ v1 ) = 0
como los vectores vi son ortonormales entonces v i ⋅ v j = 0 para i ≠ j y vi ⋅ v j = 1 para i = j , así tenemos
que,
α 1 (v1 ⋅ v1 ) + α 2 (v 2 ⋅ v1 ) + K + α n (v n ⋅ v1 ) = α 1 (v1 ⋅ v1 ) = α 1 ⋅1 = 0
por lo tanto α 1 = 0 .

Realizamos este mismo procedimiento para cada uno de los vectores v i ∈ S , esto es, ahora multiplicamos la
ecuación por cada uno de los vectores vi, esto es,
α 1 (v1 ⋅ v i ) + α 2 (v 2 ⋅ v i ) + K + α i (v i ⋅ v i ) + K + α n (v n ⋅ v i ) = 0
por condiciones de ortonormalidad el único término que contribuye es,
α i (v i ⋅ v i ) = α i ⋅ 1 = 0
esto implica que α i = 0 para toda i = 1,2,..., n .

Por lo tanto, el conjunto de vectores {v1 , v 2 , K , v n } es linealmente independiente.

II-68
Si S = {v1 , v 2 ,..., v n } es un conjunto ortonormal de n vectores en el espacio vectorial R n , cuya dimensión es n,
entonces S es una base ortonormal de V. Esto se justifica por que, el número máximo de vectores linealmente
independientes en un espacio vectorial es igual a la dimensión del espacio vectorial.

Sea S = {v1 , v 2 ,..., v n } una base ortonormal de un espacio vectorial V, entonces todo vector u ∈ V lo podemos
escribir en términos de esta base, esto es,
u = α 1 ⋅ v1 + α 2 ⋅ v 2 + K + α n ⋅ v n
donde como ya sabemos
⎛ α1 ⎞
⎜ ⎟
α
[u ]S = ⎜⎜ 2 ⎟⎟
M
⎜ ⎟
⎜α ⎟
⎝ n⎠
multiplicamos la ecuación vectorial anterior por vi, entonces tenemos,
u ⋅ v i = α 1 ( v1 ⋅ v i ) + α 2 ( v 2 ⋅ v i ) + K + α i ( v i ⋅ v i ) + K + α n ( v n ⋅ v i )
como los vectores son ortonormales entonces
u ⋅ v i = α i (v i ⋅ v i ) = α i ⋅1 = α i

En otras palabras, para obtener los coeficientes del desarrollo de un vector en términos de los vectores de una
base, solo necesitamos multiplicar al vector que deseamos desarrollar por cada uno de los vectores de la base, y
cada producto será igual aun coeficiente.

EJEMPLO: Sea S = {v1 , v 2 , v 3 } una base ortonormal del espacio vectorial R 3 , donde los vectores están dados
⎛ 2 2 1⎞ ⎛2 1 2⎞ ⎛1 2 2⎞
por, v1 = ⎜ ,− , ⎟ , v 2 = ⎜ , ,− ⎟ y v3 = ⎜ , , ⎟ .
⎝ 3 3 3⎠ ⎝3 3 3⎠ ⎝3 3 3⎠
Si u = (3,4,5) es un vector arbitrario de R , determinar [u ]S .
3

SOLUCIÓN: Nos piden escribir al vector u en términos de la base S, es decir, tenemos que resolver la ecuación
u = α 1 ⋅ v1 + α 2 ⋅ v 2 + α 3 ⋅ v 3
de esta forma podemos encontrar,
⎛ α1 ⎞
⎜ ⎟
[u ]S = ⎜α 2 ⎟
⎜α ⎟
⎝ 3⎠
Para determinar los coeficientes α i , podemos resolver el sistema de ecuaciones lineales
correspondiente, esto es,
2 2 1
3 = α1 + α 2 + α 3
3 3 3
2 1 2
4 = − α1 + α 2 + α 3
3 3 3
1 2 2
5 = α1 − α 2 + α 3
3 3 3
Pero como los vectores v1 , v2 , v3 son ortonormales, entonces tenemos que los coeficientes
están dados por α i = u ⋅ v i , de donde

II-69
⎛ 2 2 1⎞
α 1 = u ⋅ v1 = (3,4,5) ⋅ ⎜ ,− , ⎟ = 1
⎝ 3 3 3⎠
⎛2 1 2⎞
α 2 = u ⋅ v 2 = (3,4,5) ⋅ ⎜ , ,− ⎟ = 0
⎝3 3 3⎠
⎛1 2 2⎞
α 3 = u ⋅ v 3 = (3,4,5) ⋅ ⎜ ,− , ⎟ = 7
⎝3 3 3⎠
Por lo tanto
⎛ α1 ⎞ ⎛ 1 ⎞
⎜ ⎟ ⎜ ⎟
[u ]S = ⎜α 2 ⎟ = ⎜ 0 ⎟
⎜α ⎟ ⎜ 7 ⎟
⎝ 3⎠ ⎝ ⎠

Si S = {v1 , v 2 ,..., v n } es una base arbitraria del espacio vectorial R n , entonces esta base se puede convertir en una
base ortonormal del espacio vectorial R n .

A continuación describiremos el proceso para convertir una base arbitraria de vectores en una base ortonormal
de vectores para el espacio vectorial R n , este procedimiento es importante ya que se han mostrado algunas
ventajas y utilidades de trabajar con bases ortonormales en lugar de usar cualquier otra base.

Proceso de Ortonormalización de Gram – Schmidt

El procedimiento general consiste, en construir conjuntos de vectores ortogonales en el espacio vectorial R n , a


partir de ciertos vectores dados.

Consideremos un subespacio vectorial W del espacio vectorial R n , W ⊆ R n , el cual tiene una base conocida
cuyos vectores forman el conjunto S = {u1 , u 2 ,..., u n }, entonces existe una base ortonormal T = {v1 , v 2 ,..., v n }
para el subespacio W .

Determinemos esta base ortonormal. Elegimos un vector arbitrario del conjunto S = {u1 , u 2 ,..., u n }, por lo
general siempre se elige al primer vector, esto es, sea
w1 = u1
entonces tenemos que u1 y u 2 generan un subespacio W1 de W , esto es,
W1 = gen{u1 , u 2 } = gen{w1 , u 2 } ⊆ W
buscamos un vector w2 en W1 que sea ortogonal a w1 , este debe ser de la forma
w2 = c1 w1 + c 2 u 2
determinamos el valor de los coeficientes c1 y c 2 de tal manera que w1 ⋅ w2 = 0 , por ser vectores ortogonales,
w1 ⋅ w2 = w1 ⋅ (c1 w1 + c 2 u 2 ) = c1 ( w1 ⋅ w1 ) + c 2 ( w1 ⋅ u 2 ) = 0
de donde
w ⋅u w ⋅u
c1 = −c 2 1 2 , si c 2 = 1 ⇒ c1 = − 1 2
w1 ⋅ w1 w1 ⋅ w1
entonces escribimos al vector w2 como,
w ⋅u
w2 = − 1 2 w1 + u 2
w1 ⋅ w1

II-70
tenemos así que {w1 , w2 } es un conjunto ortogonal de W1 .

Ahora buscamos un vector w3 en W 2 = gen{w1 , w2 , u 3 } ⊆ W que sea perpendicular a w1 y w2 , entonces


w3 = d 1 w1 + d 2 w2 + d 3 u 3
nuevamente determinamos los coeficientes d 1 , d 2 y d 3 de tal forma que, w1 ⋅ w3 = 0 y w2 ⋅ w3 = 0 , así que
w1 ⋅ w3 = w1 ⋅ ( d 1 w1 + d 2 w2 + d 3 u 3 ) = d 1 ( w1 ⋅ w1 ) + d 2 ( w1 ⋅ w2 ) + d 3 ( w1 ⋅ u 3 ) = 0
w2 ⋅ w3 = w2 ⋅ ( d 1 w1 + d 2 w2 + d 3 u 3 ) = d 1 ( w2 ⋅ w1 ) + d 2 ( w2 ⋅ w2 ) + d 3 ( w2 ⋅ u 3 ) = 0
como w1 y w2 son ortogonales entonces w1 ⋅ w2 = 0 , lo cual reduce las ecuaciones a
w1 ⋅ w3 = w1 ⋅ ( d 1 w1 + d 2 w2 + d 3 u 3 ) = d 1 ( w1 ⋅ w1 ) + d 3 ( w1 ⋅ u 3 ) = 0
w2 ⋅ w3 = w2 ⋅ ( d 1 w1 + d 2 w2 + d 3 u 3 ) = d 2 ( w2 ⋅ w2 ) + d 3 ( w2 ⋅ u 3 ) = 0
de esta manera, los coefientes son
w ⋅u w ⋅u w ⋅u w ⋅u
d1 = −d 3 1 3 , d 2 = − d 3 2 3 , si d 3 = 1 ⇒ d1 = − 1 3 y d 2 = − 2 3
w1 ⋅ w1 w2 ⋅ w2 w1 ⋅ w1 w2 ⋅ w2
escribimos al vector w3 como,
w ⋅u w ⋅u
w3 = − 2 3 w2 − 1 3 w1 + u 3
w2 ⋅ w2 w1 ⋅ w1
por lo tanto, el conjunto de vectores {w1 , w2 , w3 } es ortogonal en W2 .

El siguiente vector w4 en W3 = gen{w1 , w2 , w3 , u 4 } ⊆ W ortogonal a los vectores w1 , w2 y w3 esta dado por,


w ⋅u w ⋅u w ⋅u
w4 = − 3 4 w3 − 2 4 w2 − 1 4 w1 + u 4
w3 ⋅ w3 w2 ⋅ w 2 w1 ⋅ w1

El procedimiento termina hasta usar el último vector del conjunto S = {u1 , u 2 ,..., u n }, con lo cual obtendremos
una base ortogonal T ′ = {w1 , w2 , w3 ,..., wn } del subespacio W .

Si ahora normalizamos los vectores de esta base, es decir, sean


w
vi = 1 para i = 1,2,3,..., n .
wi
Entonces el conjunto de vectores T = {v1 , v 2 ,..., v n } será una base ortonormal del subespacio vectorial W , donde
vi ⋅ v j = 0 para i ≠ j
vi ⋅ v j = 1 para i = j

En resumen tenemos que, dada una base arbitraria S = {u1 , u 2 ,..., u n } de un espacio vectorial V ⊆ R n , el proceso
de ortonormalización consiste en obtener los siguientes vectores,
w1 = u1
w ⋅u
w2 = u 2 − 1 2 w1
w1 ⋅ w1
w ⋅u w ⋅u
w3 = u 3 − 1 3 w1 − 2 3 w2
w1 ⋅ w1 w2 ⋅ w2
w ⋅u w ⋅u w ⋅u
w4 = u 4 − 1 4 w1 − 2 4 w2 − 3 4 w3
w1 ⋅ w1 w2 ⋅ w2 w3 ⋅ w3

II-71
w1 ⋅ u n w ⋅u w ⋅u
wn = u n − w1 − 2 n w2 − K − n −1 n wn −1
w1 ⋅ w1 w2 ⋅ w2 wn −1 ⋅ wn −1
donde el conjunto de vectores {w1 , w2 , w3 ,..., wn } es ortogonal, entonces si los normalizamos
w
vi = i para i = 1,2,3,..., n .
wi
Obtendremos una base ortonormal del espacio vectorial V , dada por el conjunto de vectores
{v1 , v 2 ,..., v n }

EJEMPLO: Si los vectores {u1 , u 2 , u 3 } forman un una base del espacio vectorial R 3 , donde u1 = (1,−1,1) ,
u 2 = (−2,3 − 1) y u 3 = (1,2,−4) , determinar a partir de ellos una base ortonormal para R 3 .

SOLUCIÓN: Aplicamos el proceso de Gram-Schmidt para ortonormalizar los vectores de la base, esto es,
Sea
w1 = u1 = (1,−1,1)
luego
w ⋅u (1,−1,1) ⋅ (−2,3,−1) −6
w2 = u 2 − 1 2 w1 = (−2,3,−1) − (1,−1,1) = (−2,3,−1) − (1,−1,1)
w1 ⋅ w1 (1,−1,1) ⋅ (1,−1,1) 3
= (−2,3,−1) − (−2,2,−2) = (0,1,1)
ahora
w1 ⋅ u 3 w ⋅u (1,−1,1) ⋅ (1,2,−4) (0,1,1) ⋅ (1,2,−4)
w3 = u 3 − w1 − 2 3 w2 = (1,2,−4) − (1,−1,1) − (0,1,1)
w1 ⋅ w1 w2 ⋅ w2 (1,−1,1) ⋅ (1,−1,1) (0,1,1) ⋅ (0,1,1)
−5 −2 ⎛8 4 4⎞
= (1,2,−4) − (1,−1,1) − (0,1,1) = (1,2,−4) + (5 / 3,−5 / 3,5 / 3) + (0,1,1) = ⎜ , ,− ⎟
3 2 ⎝3 3 3⎠
tenemos que el conjunto de vectores {w1 , w2 , w3 } es ortogonal, por lo que normalizamos cada
uno de estos vectores, es decir,
w
v1 = 1 =
1
(1,−1,1) = ⎛⎜⎜ 1 , − 1 , 1 ⎞⎟⎟
w1 3 ⎝ 3 3 3⎠

v2 =
w2
=
1
(0,1,1) = ⎛⎜⎜ 0, 1 , 1 ⎞⎟⎟
w2 2 ⎝ 2 2⎠
w3 3 ⎛8 4 − 4⎞ ⎛ 2 1 1 ⎞
v3 = = ⎜ , , ⎟ = ⎜⎜ , ,− ⎟⎟
w3 32 ⎝ 3 3 3 ⎠ ⎝ 6 6 6⎠

Por lo tanto, el conjunto de vectores {v1 , v 2 , v 3 } es una base ortonormal para el espacio vectorial
R3 .

II-72
TRANSFORMACIONES LINEALES

Generalizaremos el concepto de función junto con todas sus propiedades, esto es, para una función que esta
definida para los números reales, f : R → R tenemos que, f : x → f (x ) , esto es

R R

Dominio x f (x ) Imagen

Para una Transformación tenemos que, T : V → W , donde ahora V y W son espacios vectoriales arbitrarios,
esto es, T : u → T (u ) = v , donde u es un vector de V y v es un vector W , de esta forma tenemos que

V W

u T (u ) = v

EJEMPLO: Consideremos los siguientes ejemplos de transformaciones

a) T : R → R definida como f ( x ) =
ln x
(cualquier función es una transformación)
x 2 sen(2 x )

b) T : R 3 → R definida como u = x 2 + x 2 + x 2 (la norma de un vector)


1 2 3

c) T : M →M definida como A = AT (la transpuesta de una matriz)


mn nm

d) T : M → R 3 definida como det( A) = A (el determinante de una matriz)


nn

Condiciones de Linealidad

Consideremos una transformación T : V → W , donde a cada vector u ∈ V le asigna un único vector w ∈ W de


tal manera que w = T (u ) . Decimos que la transformación T es Lineal si esta satisface las siguientes
condiciones:

i) Si u, v ∈ V entonces . T (u + v) = T (u ) + T (v) .
ii) Si u ∈ V y α ∈ R entonces T (αu ) = αT (u ) .

Las cuales se pueden escribir en una sola condición, de la forma : T (αu + βv) = αT (u ) + βT (v )

Para la transformación lineal T : V → W tenemos que, al vector w = T (u ) se le llama imagen de u , al conjunto


de todas las imágenes de los vectores de V se le llama rango de la transformación.

Si en una transformación lineal T : R n → R m tenemos que m = n , entonces a la transformación se le conoce


como operador lineal en R n .

III-73
EJEMPLO: Consideremos la siguiente transformación T : R 3 → R 2 definida como T ( x, y, z ) = ( x, y ) . Verificar
si esta transformación es lineal o no lo es.

SOLUCIÓN: Debemos comprobar si esta transformación satisface las condiciones de linealidad, para esto,
consideremos los siguientes dos vectores u1 , u 2 ∈ V y el escalar α ∈ R , donde,
u1 = ( x1 , y1 , z1 ) y u 2 = ( x 2 , y 2 , z 2 ) ,

i) Tenemos por una parte que,


T (u1 ) = T ( x1 , y1 , z1 ) = ( x1 , y1 ) y T (u 2 ) = T ( x 2 , y 2 , z 2 ) = ( x 2 , y 2 )
entonces;
T (u1 ) + T (u 2 ) = ( x1 , y1 ) + ( x 2 , y 2 ) = ( x1 + x 2 , y1 + y 2 )
Por otra lado,
T (u1 + u 2 ) = T [( x1 , y1 , z1 ) + ( x 2 , y 2 , z 2 )] = T ( x1 + x 2 , y1 + y 2 , z1 + z 2 ) = ( x1 + x 2 , y1 + y 2 )
Entonces podemos ver que,
T (u1 + u 2 ) = T (v1 ) + T (v 2 )

ii) Tenemos ahora que,


αT (u1 ) = αT ( x1 , y1 , z1 ) = α ( x1 , y1 ) = (αx1 , αy1 )
Por otro lado,
T (αu1 ) = T [α ( x1 , y1 , z1 )] = T (αx1 , αy1 , αz1 ) = (αx1 , αy1 )
De esta manera se observa que,
T (αu1 ) = αT (u1 )

Así, la transformación satisface las dos condiciones de linealidad, por lo tanto,


T ( x, y , z ) = ( x , y )
es una transformación lineal.

Geométricamente tenemos lo siguiente, consideremos un vector u = ( x, y, z ) en R 3


y apliquemos la transformación T ( x, y, z ) = ( x, y ) , así gráficamente

u = ( x, y , z )

T (u ) = T ( x, y, z ) = ( x, y )
x

T ( x, y, z ) = ( x, y ) es una transformación lineal, llamada transformación de proyección, proyecta


un vector en R 3 sobre el plano x − y

III-74
EJEMPLO: Consideremos la transformación T : P1 → P2 definida por T ( P( x)) = xP( x) + x 2 . Determine si la
transformada es lineal o no.

SOLUCIÓN: Consideremos dos vectores u1 = P ( x ) y u 2 = Q ( x ) tales que u1 , u 2 ∈ P1 , además sea α ∈ R un


escalar, entonces

i) Tenemos que,
T (u1 ) = T ( P ( x)) = xP( x) + x 2 y T (u 2 ) = T (Q( x)) = xQ( x) + x 2
de donde
T (u1 ) + T (u 2 ) = xP( x) + xQ( x) + 2 x 2 = x( P ( x) + Q( x)) + 2 x 2
por otro lado,
T (u1 + u 2 ) = T ( P ( x) + Q( x)) = x( P( x) + Q( x)) + x 2
Podemos observar que,
T (u1 + u 2 ) ≠ T (u1 ) + T (u 2 )

ii) En este caso,


αT ( P( x)) = α ( xP( x) + x 2 ) = αxP( x) + αx 2
y luego
T (αP( x)) = x(αP( x)) + x 2 = αxP( x) + x 2
de donde
T [αP( x)] ≠ αT ( P ( x))
Por lo tanto, la transformación T ( P ( x)) = xP( x) + x 2 no es lineal.

EJEMPLO: Consideremos la transformación T : M nn → R definida por T ( A) = A , (el determinante de una


matriz). Mostrar si la transformación es lineal o no.

SOLUCIÓN: Consideremos dos matrices A, B ∈ M nn y un escalar α ∈ R , así

i) Tenemos,
T ( A) + T ( B) = A + B y T ( A + B) = A + B
pero sabemos que en general
A+ B ≠ A + B
esto implica que,
T ( A) + T ( B ) ≠ T ( A + B) .

ii) Para este caso,


αT ( A) = α A y T (αA) = αA = α n A
entonces
αT ( A) ≠ T (αA)

Por lo tanto la transformación T ( A) = A no es lineal.

III-75
EJEMPLO: Sea la transformación T : P1 → P2 definida como T (ax + b) = x( ax + b) . Diga si la transformada
es lineal o no lo es.

SOLUCIÓN: Consideremos dos vectores u1 = ax + b y u 2 = cx + d tales que u1 , u 2 ∈ P1 , además sea α ∈ R


un escalar, entonces

i) Tenemos que,
T (u1 ) = T (ax + b) = x(ax + b) = ax 2 + bx y T (u 2 ) = T (cx + d ) = x(cx + d ) = cx 2 + dx
al sumar obtenemos,
T (u1 ) + T (u 2 ) = (ax 2 + bx) + (cx 2 + dx) = (a + c) x 2 + (b + d ) x
por otra parte,
T (u1 + u 2 ) = T (( ax + b) + (cx + d )) = T (( a + c ) x + (b + d )) = x (( a + c ) x + (b + d ))
= (a + c) x 2 + (b + d ) x
Observamos que,
T (u1 + u 2 ) = T (u1 ) + T (u 2 )

ii) Aquí tenemos


αT (u1 ) = αT (ax + b) = α ( x(ax + b)) = α (ax 2 + bx) = αax 2 + αbx
y además
T (α (ax + b)) = T (αax + αb) = x(αax + αb) = αax 2 + αbx
de donde
T [αP( x)] = αT ( P( x))

Por lo tanto, la transformación T (ax + b) = x( ax + b) si es lineal.

EJEMPLO: Consideremos la transformación T : M mn → M nm definida como T ( A) = A T (la transpuesta de una


matriz). Mostrar si la transformación es lineal o no.

SOLUCIÓN: Consideremos dos matrices A, B ∈ M mn y un escalar α ∈ R , así


i) Tenemos que
T ( A + B ) = ( A + B ) T = A T + B T = T ( A) + T ( B )
entonces
T ( A) + T ( B) = T ( A + B) .

ii) Ahora
T (αA) = (αA) T = αA T = αT ( A)
por lo cual
αT ( A) ≠ T (αA)

Por lo tanto la transformación T ( A) = A T si es lineal.

III-76
Podemos expresar la condición de linealidad para una transformación de manera general, como sigue,

Si T : V → W es una transformación lineal, entonces satisface la siguiente ecuación,


T (α 1 v1 + α 1 v1 + ... + α n v n ) = α 1T (v1 ) + α 2 T (v 2 ) + ... + α 2 T (v 2 )
para todo conjunto de vectores {v1 , v 2 ,..., v n } del espacio vectorial V y todo escalar α 1 , α 2 ,..., α n ∈ R .

En el siguiente ejemplo, observaremos algunas propiedades que se manifiestan al transformar vectores que
pertenecen a una base de un espacio vectorial.

EJEMPLO: Consideremos la transformación lineal T : R 3 → R 2 tal que, T (1,0,0) = (2,−1) , T (0,1,0) = (3,1) y
T (0,0,1) = (−1,2) . En base a lo anterior, determinar T (−3,4,2) .

SOLUCIÓN: Observamos que el conjunto de vectores que estamos transformando {(1,0,0), (0,1,0), (0,0,1)} es
la base (canónica) de R 3 , así, cualquier vector puede escribirse como combinación lineal de
este conjunto, en este caso tenemos
(−3,4,2) = α 1 (1,0,0) + α 2 (0,1,0) + α 3 (0,0,1) = −3(1,0,0) + 4(0,1,0) + 2(0,0,1)
entonces al obtener la transformación del vector
T ( −3,4,2) = T (− 3(1,0,0) + 4(0,1,0) + 2(0,0,1) ) = −3T (1,0,0) + 4T (0,1,0) + 2T (0,0,1)
= −3(2,−1) + 4(3,1) + 2(−1,2) = (−6,3) + (12,4) + (−2,4) = (4,11)
Por lo tanto,
T (−3,4,2) = (4,11) .

En el ejemplo anterior notemos dos cosas importantes,

- Solo cuando sabemos que la transformación es lineal, podemos llevar a cabo la factorización, esto es, pasar de
una transformación de una suma a una suma de transformaciones.

- Es importante conocer como se transforma una base del espacio vectorial, para poder saber como se transforma
cualquier vector arbitrario.

Sea T : V → W una transformación lineal y sea el conjunto de vectores S = {v1 , v 2 ,..., v n } una base del espacio
vectorial V . Si u ∈ V es un vector arbitrario, entonces T (u ) esta completamente determinado por el conjunto
de vectores {T (v1 ), T (v 2 ),..., T (v n )} en el espacio vectorial W .

EJEMPLO: Consideremos la siguiente transformación lineal T : P1 → P2 , para la cual, T ( x + 1) = x 2 − 1 y


T ( x − 1) = x 2 + x , en base a esto, determinar
a) T (7 x + 3)
b) T ( ax + b)

SOLUCIÓN: a) Tenemos que {x + 1, x − 1} es una base de P1 , entonces podemos expresar cualquier vector en
términos de ella, así
7 x + 3 = α1 ( x + 1) + α 2 ( x − 1) = α1 x + α1 + α 2 x − α 2 = (α1 + α 2 ) x + (α1 − α 2 )

III-77
la ecuación anterior genera el sistema de ecuaciones lineales
7 = α1 + α 2 α1 = 5
⇒ 10 = 2α1 ⇒ ⇒ 7 x + 3 = 5( x + 1) + 2( x − 1)
3 = α1 − α 2 α2 = 2
entonces transformamos
T (7 x + 3) = T (5( x + 1) + 2( x − 1)) = 5T ( x + 1) + 2T ( x − 1)
= 5( x 2 − 1) + 2( x 2 + x) = 5 x 2 − 5 + 2 x 2 + 2 x
por lo tanto,
T (7 x + 3) = 7 x 2 + 2 x − 5

b) Ahora escribimos un vector arbitrario ax + b en términos de la base


ax + b = α1 ( x + 1) + α 2 ( x − 1) = α1 x + α1 + α 2 x − α 2 = (α1 + α 2 ) x + (α1 − α 2 )
ecuación que genera el sistema de ecuaciones lineales
a+b
a = α1 + α 2 α1 =
⇒ a + b = 2α1 ⇒
2 ⇒ ax + b = ⎜
⎛a+b⎞ ⎛a−b⎞
⎟( x + 1) + ⎜ ⎟( x − 1)
b = α1 − α 2 a−b ⎝ 2 ⎠ ⎝ 2 ⎠
α2 =
2
transformamos
⎛⎛ a + b ⎞ ⎛a−b⎞ ⎞ ⎛a+b⎞ ⎛ a −b⎞
T ( ax + b) = T ⎜ ⎜⎜ ⎟⎟( x + 1) + ⎜⎜ ⎟⎟( x − 1) ⎟ = ⎜ ⎟T ( x + 1) + ⎜ ⎟T ( x − 1)
⎝⎝ 2 ⎠ ⎝ 2 ⎠ ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠
⎛a+b⎞ 2 ⎛ a −b⎞ 2 2 ⎛ a −b⎞ ⎛a+b⎞
=⎜ ⎟( x − 1) + ⎜ ⎟( x + x) = ax + ⎜ ⎟x − ⎜ ⎟
⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠
por lo tanto,
⎛ a−b⎞ ⎛ a+b⎞
T (ax + b) = ax 2 + ⎜ ⎟x − ⎜ ⎟
⎝ 2 ⎠ ⎝ 2 ⎠
Con esta relación podemos transformar cualquier vector de P1 , por ejemplo,
⎛5⎞ ⎛1⎞
T (2 x − 3) = 2 x 2 + ⎜ ⎟ x − ⎜ ⎟ , T (2 x) = 2 x 2 + x − 1 , etc.
⎝2⎠ ⎝2⎠

EJEMPLO: Consideremos la siguiente transformación lineal T : R 2 → R 3 tal que, T (1,0) = (1,−1,0) y


T (0,1) = (0,1,1) . Determinar la transformación, esto es, encontrar T ( x, y ) .

SOLUCIÓN: Conocemos como se transforma la base canónica de R 2 , entonces podemos saber como se
transforma cualquier vector arbitrario de R 2 , en general tenemos,
( x, y ) = α1 (1,0) + α 2 (0,1) = (α1 , α 2 ) ⇒ x = α1 y y = α 2
⇒ ( x, y ) = x(1,0) + y (0,1)
así obtenemos la transformación
T ( x, y ) = T ( x(1,0) + y (0,1)) = xT (1,0) + yT (0,1)
= x(1,−1,0) + y (0,1,1) = ( x,− x,0) + (0, y, y )
= ( x, − x + y , y )
Por lo tanto, la transformación que nos piden esta definida como,
T ( x, y ) = ( x , − x + y , y )

III-78
EJEMPLO: Consideremos la transformación lineal T : R 2 → R 2 para la cual, T (1,0) = (1,−1) y T (1,1) = (1,0) .
Encontrar la transformación T (x, y ) .
SOLUCIÓN: Observamos que los vectores {(1,0), (1,1)} son una base de R 2 , entonces podemos saber como se
transforma cualquier vector arbitrario de R 2 , en general tenemos,
( x, y ) = α1 (1,0) + α 2 (1,1) = (α1 + α 2 , α 2 ) ⇒ x = α1 + α 2 y y = α 2 ⇒ α1 = x − y
entonces
( x, y ) = ( x − y )(1,0) + y (1,1)
así obtenemos la transformación
T ( x, y ) = T (( x − y )(1,0) + y (1,1)) = ( x − y )T (1,0) + yT (1,1)
= x(1,−1) + y (1,0) = ( x,− x) + ( y,0) = ( x + y,− x)
Por lo tanto, la transformación que nos piden esta definida como,
T (x, y ) = ( x + y,− x)

Transformaciones Lineales Uno a Uno

Una transformación lineal T : V → W es una transformación uno a uno si para todos los vectores v1 , v 2 ∈ V
tales que v1 ≠ v 2 entonces tenemos que T (v1 ) ≠ T (v 2 ) , o bien, si v1 = v 2 , entonces T (v1 ) = T (v 2 )

EJEMPLO: Considere una transformación lineal T : R 2 → R 2 definida por T (x, y ) = ( x + y, x − y ) .


Verifiquemos si esta transformación es uno a uno o no.

SOLUCIÓN: Consideremos dos vectores arbitrarios de R 2 , digamos v1 = ( x1 , y1 ) y v 2 = ( x 2 , y 2 ) .


Ahora aplicamos la transformación a ellos, esto es,
T (v1 ) = T ( x1 , y1 ) = ( x1 + y1 , x1 − y1 )
y
T (v 2 ) = T ( x 2 , y 2 ) = ( x 2 + y 2 , x 2 − y 2 )
Supongamos que
T (v1 ) = T (v 2 ) ⇒ T ( x1 , y1 ) = T ( x 2 , y 2 ) ⇒ ( x1 + y1 , x1 − y1 ) = ( x 2 + y 2 , x 2 − y 2 )
La última igualdad genera el siguiente sistema de ecuaciones lineales
x1 + y1 = x 2 + y 2 x1 = x 2
⇒ 2 x1 = 2 x 2 ⇒ ⇒ v1 = v 2
x1 + y1 = x 2 + y 2 y1 = y 2
Finalmente tenemos que si,
T (v1 ) = T (v 2 ) ⇒ v1 = v 2 ,
por lo tanto, de acuerdo a la definición, T es una transformación lineal uno a uno.

EJEMPLO: Consideremos la transformación lineal de proyección T : R 3 → R 2 definida por T ( x, y, z ) = ( x, y ) .


Es esta transformación uno a uno.

SOLUCIÓN: Tomemos nuevamente dos vectores arbitrarios del espacio vectorial R 3 , tales que v1 ≠ v 2 , esto es
v1 = ( x1 , y1 , z1 ) y v1 = ( x1 , y1 , z 2 ) , (son distintos en la tercera componente).
Ahora, transformemos estos dos vectores,
T (v1 ) = T ( x1 , y1 , z1 ) = ( x1 , y1 ) y T (v 2 ) = T ( x1 , y1 , z 2 ) = ( x1 , y1 ) ,

III-79
entonces observamos que
T (v1 ) = T (v 2 ) .
Para esta transformación lineal tenemos que si v1 ≠ v 2 entonces T (v1 ) = T (v 2 ) ,
Por lo tanto, T no es uno a uno.
Observación: de hecho, existe un número infinito de vectores en R 3 , todos ellos distintos, que se
transforman de la misma forma, esto es, que su transformación es igual.

Núcleo o Kernel de una Transformación Lineal

Sea T : V → W una transformación lineal, el núcleo o kernel de la transformación, denotado por ker(T ) , es un
subconjunto del espacio vectorial V , ker(T ) ⊆ V , que contiene a todos los vectores cuya transformación es
igual a 0 (cero). En otras palabras,
u ∈ ker(T ) si y solo si T (u ) = 0 .

El núcleo o kernel de una transformación lineal es un subespacio vectorial del espacio vectorial V .

Una transformación lineal T : V → W es uno a uno si y solo si ker(T ) = {0} , es decir, si el único vector en el
kernel es el vector cero.

Como el único vector en el Kernel es el cero, entonces la transformación T : V → W es uno a uno si y solo si
Dim(ker(T )) = 0 .

EJEMPLO: Para la transformación de proyección T : R 3 → R 2 dada por T ( x, y, z ) = ( x, y ) , determinar su


núcleo o kernel.

SOLUCIÓN: Sabemos que le kernel contiene a todos los vectores que se transforman en cero, entonces
necesitamos encontrar vectores tales que
x=0
T ( x, y, z ) = ( x, y ) = (0,0) ⇒ y = 0
z =α ∈R
esto es,
ker(T ) = {(0,0,1), (0,0,−4), (0,0, π ), (0,0,23),...}
= {(0,0,α ) α ∈ R}

Así, el kernel de la transformación de proyección contiene un número infinito de vectores, para los
cuales podemos encontrar una base factorizando los vectores que están en el kernel, esto es,
(0,0, α ) = α (0,0,1) .
Observamos que todos los vectores del kernel son combinación lineal del vector (0,0,1) , es decir,
este vector genera a todo el kernel o núcleo, entonces
Base del ker(T ) = {(0,0,1)} ⇒ Dim(ker(T )) = 1
Por lo tanto, la transformación no es uno a uno, como ya lo sabíamos de la definición.

EJEMPLO: Consideremos la transformación lineal T : R 2 → R 2 definida como T ( x, y ) = ( x + y, y − y ) .


Determinar el Kernel o núcleo de la transformación.

III-80
SOLUCIÓN: Tenemos que encontrar a todos los vectores que se transforman en cero, así que
T ( x, y ) = ( x + y, y − y ) = (0,0)
de donde
x+ y =0 x=0
⇒ 2x = 0 ⇒
x− y =0 y=0
tenemos solución única (solución trivial), quiere decir que solo hay un vector que se transforma
en cero,
ker(T ) = {(0,0)} ⇒ Dim(ker(T )) = 0
Por lo tanto, la transformación es uno a uno.

EJEMPLO: Consideremos la transformación lineal T : R 4 → R 2 definida por T ( x, y, z, w) = ( x + y, z + w) .


Determinar la dimensión del ker(T ) .

SOLUCIÓN: Como sabemos, para determinar el conjunto que forma el kernel, igualamos la transformación
a cero, esto es
T ( x, y, z, w) = ( x + y, z + w) = (0,0)
entonces
x = −α
x+ y =0 x = −y y =α ∈R
⇒ ⇒
z+w=0 z = −w z = −β
w = β ∈R
así,
ker(T ) = {(−α , α ,− β , β ) α , β ∈ R}
Obtenemos una base para este subespacio vectorial, factorizando el vector en términos de los
parámetros libres, esto es
(−α ,α ,− β , β ) = α (−1,1,0,0) + β (0,0,−1,1)
de donde la base del ker(T ) es el conunto
{(−1,1,0,0), (0,0,−1,1)} ⇒ Dim(ker(T )) = 2
Por lo tanto, la transformación lineal no es uno a uno.

EJEMPLO: Si T : R n → R m es una transformación lineal definida como, T ( X ) = AX , donde A es una matriz


de tamaño m × n , entonces el núcleo o kernel de la transformación lineal es igual al espacio solución
del sistema de ecuaciones lineales homogéneo dado por, AX = 0 .

Imagen de Transformaciones Lineales

Sea T : V → W una transformación lineal. La imagen de la transformación, denotada por Im(T ) es un


subconjunto de W , Im(T ) ⊆ W , que contiene a todos los vectores que son imágenes de vectores de V bajo la
transformación T .

Un vector v ∈ W pertenece a la imagen de la transformación, v ∈ Im(T ) , si existe un vector u ∈ V , tal que


T (u ) = v .

La imagen de una transformación lineal Im(T ) es un subespacio vectorial del espacio vectorial W .

III-81
Transformaciones Lineales Sobre

Una transformación lineal T : V → W es sobre si y solo si Im(T ) = W o de forma equivalente si


Dim(Im(T )) = Dim(W ) .

EJEMPLO : Consideremos la transformación de proyección T : R 3 → R 2 definida como T ( x, y, z ) = ( x, y ) .


Verificar si esta es una transformación sobre o no lo es.

SOLUCIÓN: a) Mediante la definición tenemos que, para todo vector ( x1 , y1 ) que pertenece a R 2 existe un
vector ( x1 , y1 , z ) en R 3 tal que T ( x1 , y1 , z ) = ( x1 , y1 ) , por lo tanto, la transformación es sobre.

b) Usando la dimensión de la imagen tenemos que, si T ( x, y, z ) = ( x, y ) entonces ( x, y ) ∈ Im(T ) ,


solo necesitamos una base para este conjunto, la cual obtenemos factorizando al vector, esto es,
( x, y ) = x(1,0) + y (0,1)
así una base de la Im(T ) , esta dada por el conjunto de vectores, {(1,0), (0,1)}.
Por lo tanto, Dim(Im(T )) = 2 = Dim( R 2 ) . Por lo cual la transformación es sobre.

Para toda transformación lineal T : V → W se satisface que: Dim(T ) + Dim(Im(T )) = Dim(V )

Un resultado particular de la relación anterior es el siguiente, si T : V → W es una transformación lineal y


además Dim(V ) = Dim(W ) entonces tenemos que,

a) Si T es una transformación uno a uno entonces T es sobre.


b) Si T es una Transformación sobre entonces T es uno a uno.

EJEMPLO: Consideremos la transformación lineal T : R 2 → R 3 definida como T ( x, y ) = ( x, x + y, y ) .


Determinar el kernel y la imagen de la transformación..

SOLUCIÓN: Para el obtener el kernel igualamos la transformación con cero, esto es,
x=0
x=0
T ( x, y ) = ( x, x + y, y ) = (0,0,0) ⇒ x + y = 0 ⇒
y=0
y=0
Como la solución es la trivial, esto significa que solo hay un vector que se transforma en cero, así
ker(T ) = {(0,0)} ⇒ Dim(ker(T )) = 0
Por lo tanto, la transformación es uno a uno.

Para la imagen tenemos buscar una base para los vectores ( x, x + y, y ) , factorizando encontramos
( x, x + y, y ) = x(1,1,0) + y (0,1,1)
de manera que la base de Im(T ) es el conjunto = {(1,1,0), (0,1,1)}, esto es,
Dim(Im(T )) = 2 ≠ Dim( R 3 )
por lo tanto, la transformación no es sobre.
También se cumple que Dim(ker(T )) + Dim(Im(T )) = Dim( R 2 ) .

III-82
EJEMPLO: Consideremos la transformación lineal T : P2 → P1 definida como,
T (ax 2 + bx + c) = (a + 2b) x + (b + c) .
Determinar el kernel y la imagen de la transformación.

SOLUCIÓN: Para el obtener el kernel igualamos la transformación con cero,


T (ax 2 + bx + c) = (a + 2b) x + (b + c) = 0 x + 0
de donde obtenemos que,
a = 2α
a + 2b = 0
⇒ a − 2c = 0 ⇒ b = −α
b+c = 0
c =α ∈R
Esto significa que el kernel de la transformación consta de un número infinito de vectores,
ker(T ) = ⎧⎨2αx 2 − αx + α α ∈ R ⎫⎬
⎩ ⎭
determinamos una base para todos estos polinomios, factorizando en términos del parámetro libre,
2αx 2 − αx + α = α (2 x 2 − x + 1)
{ }
así una base del Ker (T ) es el polinomio 2 x 2 − x + 1 , entonces
Dim(ker(T )) = 1 .
Por lo tanto, la transformación no es uno a uno.

Para la imagen tenemos buscar una base para los polinomios de la forma (a + 2b) x + (b + c) ,
Factorizando tenemos
(a + 2b) x + (b + c) = ax + 2bx + b + c = ax + b(2 x + 1) + c
así, los polinomios de la imagen son combinación lineal de los vectores {x,2 x + 1,1} de los cuales
solo los vectores {x,1} son linealmente independientes, esto es, la base de Im(T ) es el conjunto de
vectores {x,1} , de manera que
Dim (Im(T )) = 2 = Dim ( P1 ) ,
por lo tanto, la transformación lineal es sobre.

Nuevamente observamos que se satisface la relación


Dim (Im(T )) + Dim ( Ker (T )) = Dim ( P2 ) .

EJEMPLO: Sea T : R 4 → R 3 una transformación lineal definida como T ( x, y, z, w) = ( x + y, y − z, z − w) .


Determinar el kernel y la imagen de la transformación..

SOLUCIÓN: El kernel lo obtenemos igualamos la transformación con cero, esto es,


T ( x, y, z, w) = ( x + y, y − z , z − w) = (0,0,0)
igualando obtenemos,
x = −α
x+ y =0
y =α
y−z =0 ⇒
z =α
z−w=0
w=α ∈R
Tenemos soluciones infinitas, esto significa que el Ker (T ) = {(−α , α , α , α ) α ∈ R} , de manera que
una base para este conjunto se obtiene factorizando al vector en términos del parámetro libre,
(−α ,α ,α ,α ) = α (−1,1,1,1)

III-83
así, una base del ker(T ) es el conjunto {− 1,1,1,1} lo que implica que,
Dim(ker(T )) = 1
Por lo tanto, la transformación no es uno a uno.

Para la imagen tenemos buscar una base para los vectores ( x + y, y − z, z − w) , la cual se obtiene
Factorizando, es decir,
( x + y, y − z, z − w) = x(1,0,0) + y (1,1,0) + z (0,−1,1) + w(0,0,1)
entonces los vectores de la imagen son generados por el conjunto {(1,0,0), (1,1,0), (0,−1,1), (0,0,1)} ,
de los cuales solo tres de ellos son linealmente independientes, esto es, una base de la Im(T ) es el
conjunto {(1,0,0), (1,1,0), (0,−1,1)} entonces
Dim(Im(T )) = 3 = Dim( R 3 ) ,
por lo tanto, la transformación es sobre.
También se cumple que, Dim(ker(T )) + Dim(Im(T )) = Dim( R 4 )

III-84
REPRESENTACIÓN MATRICIAL DE UNA TRANSFORMACIÓN LINEAL

Consideremos una transformación lineal T : V → W , además sean B1 = {v1 , v 2 ,..., v n } y B 2 = {w1 , w 2 ,..., w m }
bases de los espacios vectoriales V y W respectivamente, por lo tanto, V es de dimensión n y W de
dimensión m . Entonces existe una matriz única AT de tamaño m × n tal que cumple con la siguiente propiedad,
para todo vector u ∈ V ,
[T (u )]B = AT [u ]B . 2 1

AT se llama Matriz Asociada a la Transformación Lineal T ó Matriz que representa a la transformación lineal
T , con respecto a las bases B1 y B2 , las columnas de esta matriz son los coeficientes de los vectores [T (v1 ) ]B , 2

[T (v 2 )]B 2
,…, [T (v n )]B .
2

En otras palabras, los coeficientes de la matriz asociada a la transformación lineal, se obtienen transformando los
vectores de la base B1 , T (v j ) , y estos los escribimos en términos de los vectores de la base B2 , esto es,
T (v1 ) = a11 w1 + a 21 w2 + a 31 w3 + L + a m1 wm
T (v 2 ) = a12 w1 + a 22 w2 + a 32 w3 + L + a m 2 wm
T (v 3 ) = a13 w1 + a 23 w2 + a 33 w3 + L + a m3 wm
M
T (v n ) = a1n w1 + a 2 n w2 + a 3n w3 + L + a mn wm

entonces tenemos que resolver los sistemas de ecuaciones lineales anteriores, n sistemas con m incógnitas, para
encontrar todos los coeficientes, así tenemos que

⎛ a11 ⎞ ⎛ a12 ⎞ ⎛ a13 ⎞ ⎛ a1n ⎞


⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 ⎟ ⎜ a 22 ⎟ ⎜ a 23 ⎟ ⎜ a2n ⎟
[T (v1 )]B = ⎜ a 31 ⎟ , [T (v 2 )]B = ⎜ a 32 ⎟ , [T (v 3 )]B = ⎜ a 33 ⎟ , . . . , [T (v n )]B = ⎜ a 3n ⎟
2 ⎜ ⎟ 2 ⎜ ⎟ 2 ⎜ ⎟ 2 ⎜ ⎟
⎜ M ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜ M ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ a m1 ⎠ ⎝ am2 ⎠ ⎝ a m3 ⎠ ⎝ a mn ⎠

Por lo tanto, la matriz asociada a la transformación, respecto de las bases B1 y B2 , será aquella que tiene como
[
columnas los vectores T (v j ) B , esto es, ] 2

⎛ a11 a12 a13 L a1n ⎞


⎜ ⎟
⎜ a 21 a 22 a 23 L a 2n ⎟
AT = ⎜ a 31 a 32 a 33 L a 3n ⎟
⎜ ⎟
⎜ M M M O M ⎟
⎜ ⎟
⎝ a m1 am2 a m3 L a mn ⎠

Otra manera de determinar la matriz asociada a la transformación lineal, AT , es la siguiente, construimos una
matriz doble, en un lado de esta matriz, colocamos a los vectores de la base B2 y en la otra a los vectores
T (v j ) , esto es,
(w1 w2 L wm T (v1 ) T (v 2 ) L T (v n ) )

III-85
luego la matriz del lado izquierdo, la base B2 , la transformamos para obtener la matriz identidad y la matriz
resultante del lado derecho, al aplicarle las mismas operaciones, será la matriz asociada a la transformación
lineal, es decir obtendremos,
(I AT )
Es un proceso análogo al realizado para obtener la matriz de cambio de base, lo único que se hace con este
método es resolver de manera simultánea los sistemas de ecuaciones lineales resultantes.

EJEMPLO: Consideremos la siguiente transformación lineal T : R 3 → R 2 definida por


⎛ x⎞
⎜ ⎟ ⎛ x + y⎞
T ⎜ y ⎟ = ⎜⎜ ⎟⎟ .
⎜ z⎟ ⎝ y − z⎠
⎝ ⎠
Determinar la representación matricial de T respecto a las bases B1 = {v1 , v 2 , v 3 } de R 3 y
B 2 = {w1 , w2 } de R 2 , donde, v1 = (1,0,1) , v 2 = (0,1,1) , v 3 = (1,1,1) , w1 = (1,2 ) y w 2 = (− 1,1) .

SOLUCIÓN: Primero, transformar los vectores de la base B1 , esto es,


T (v1 ) = T (1,0,1) = (1,−1)
T (v 2 ) = T (0,1,1) = (1,0)
T (v 3 ) = T (1,1,1) = (2,0)

Ahora escribimos estos vectores T (v j ) , en términos de la base B2 , es decir,


T (v1 ) = (1,−1) = a11 w1 + a 21 w 2 = a11 (1,2) + a 21 ( −1,1) = ( a11 − a 21 ,2a11 + a 21 )

1 = a11 − a 21 a11 = 0 ⎛a ⎞ ⎛ 0 ⎞
⇒ ⇒ ⇒ [T (v1 )]B = ⎜⎜ 11 ⎟⎟ = ⎜⎜ ⎟⎟
− 1 = 2a11 + a 21 a 21 = −1 2
⎝ a 21 ⎠ ⎝ − 1⎠
luego
T (v 2 ) = (1,0) = a12 w1 + a 22 w 2 = a12 (1,2) + a 22 ( −1,1) = ( a12 − a 22 ,2a12 + a 22 )

1 = a12 − a 22 a12 = 1 / 3 ⎛ a ⎞ ⎛ 1/ 3 ⎞
⇒ ⇒ ⇒ [T (v 2 )]B = ⎜⎜ 12 ⎟⎟ = ⎜⎜ ⎟⎟
0 = 2a12 + a 22 a 22 = −2 / 3 2
⎝ a 22 ⎠ ⎝ − 2 / 3 ⎠
finalmente
T (v 3 ) = ( 2,0) = a13 w1 + a 23 w 2 = a13 (1,2) + a 23 ( −1,1) = ( a13 − a 23 ,2a13 + a 23 )
2 = a13 − a 23 a13 = 2 / 3 ⎛ a13 ⎞ ⎛ 2 / 3 ⎞
⇒ ⇒ ⇒ [T (v 3 )]B = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟
0 = 2a13 + a 23 a 21 = −4 / 3 ⎝ a 23 ⎠ ⎝ − 4 / 3 ⎠
2

Por lo tanto, la matriz asociada a la transformación respecto de las bases B1 y B2 , será aquella
[ ]
cuyas columnas son los coeficientes de los vectores T (v j ) B , es decir,
2

⎛a a12 a13 ⎞ ⎛ 0 1/ 3 2/3 ⎞


AT = ⎜⎜ 11 ⎟⎟ = ⎜⎜ ⎟
⎝ a 21 a 22 a 23 ⎠ ⎝ − 1 − 2 / 3 − 4 / 3 ⎟⎠

III-86
Para el ejemplo anterior, usemos ahora el método de la matriz doble, tenemos que

(w1 w2 T (v1 ) T (v2 ) T (v3 )) = ⎛⎜⎜ 1 − 1 1 1 2 ⎞⎟⎟


⎝ 2 1 −1 0 0⎠
ahora transformemos el lado izquierdo de la matriz en la matriz identidad
⎛ 1 −1 1 1 2 ⎞ ⎛ 1 −1 1 1 2 ⎞
R 2 −2 R1 → R 2 ⎜⎜ ⎟
⎟ R3 / 3 → R3 ⎜⎜ ⎟

⎝ 0 3 − 3 − 2 − 4⎠ ⎝ 0 1 − 1 − 2 / 3 − 4 / 3⎠

⎛1 0 0 2/3 ⎞
⎜ 0 1 − 1 − 2 / 3 − 4 / 3 ⎟ = (I AT )
1/ 3
R1 + R 2 → R1 ⎜ ⎟
⎝ ⎠
⎛0 1/ 3 2/3 ⎞
Por lo tanto, la matriz asociada a la transformación lineal es, AT = ⎜⎜ ⎟⎟
⎝ − 1 − 2 / 3 − 4 / 3⎠

Ahora bien, la matriz que acabamos de encontrar tiene la propiedad de que


[T (u )]B = AT [u ]B , 2 1

para cualquier vector u ∈ R , por ejemplo, sea u = ( −2,4,−1) ,


3

Tenemos que
T (u ) = T (−2,4,−1) = (2,5)
entonces T en términos de la base B2 es,
T (u ) = ( 2,5) = α 1 w1 + α 2 w 2 = α 1 (1,2) + α 2 ( −1,1) = (α 1 − α 2 ,2α 1 + α 2 )
2 = α1 − α 2 α1 = 7 / 3
⇒ ⇒
5 = 2α 1 + α 2 α 2 = 1/ 3
de donde obtenemos que,
⎛ 7 / 3⎞
[T (u )]B = ⎜⎜ ⎟⎟
⎝1/ 3 ⎠
2

Por otro lado, u en función de la base B1 ,


u = ( −2,4,−1) = β 1 v1 + β 2 v 2 + β 3 v 3 = β 1 (1,0,1) + β 2 (0,1,1) + β 3 (1,1,1)
= ( β 1 + β 3 , β 2 + β 3 , β1 + β 2 + β 3 )

− 2 = β1 + β 3 β1 = −5
⇒ 4 = β2 + β3 ⇒ β2 =1
− 1 = β1 + β 2 + β 3 β3 = 3
resultando
⎛ − 5⎞
⎜ ⎟
[u ]B =⎜ 1 ⎟
⎜ 3 ⎟
1

⎝ ⎠
de donde
⎛ − 5⎞
⎛0 1/ 3 2 / 3 ⎞⎜ ⎟ ⎛ 7 / 3 ⎞
( AT )[u ]B = ⎜⎜ ⎟⎟⎜ 1 ⎟ = ⎜⎜ ⎟⎟
⎝ − 1 − 2 / 3 − 4 / 3 ⎠⎜ 3 ⎟ ⎝ 1 / 3 ⎠
1

⎝ ⎠
Por lo tanto,
[T (u )]B
2
= AT [u ]B 1

III-87
EJEMPLO: Sea T : P1 → P2 una transformación lineal definida como T ( p ( x ) ) = xp ( x) , determinar la matriz
asociada a la transformación respecto a las bases canónicas de P1 y de P2 .

{
SOLUCIÓN: Tenemos que las bases canónicas para P1 y P2 son B1 = {x,1} y B = x 2 , x,1 , respectivamente.
2
}
Obtenemos entonces la matriz, transformamos los vectores de B1 , y los escribimos en términos de
la base B2 , así
a11 = 1 ⎛1⎞
⎜ ⎟
T ( x) = x ⋅ x = x = a11 ( x ) + a 21 ( x) + a 31 (1) ⇒ a 21 = 0 ⇒ [T ( x)]B = ⎜ 0 ⎟
2 2

⎜ 0⎟
2

a31 = 0 ⎝ ⎠

a12 = 0 ⎛ 0⎞
⎜ ⎟
T (1) = x ⋅1 = x = a12 ( x ) + a 22 ( x) + a 32 (1)
2
⇒ a 22 = 2 ⇒ [T ( x)]B = ⎜1⎟
⎜ 0⎟
2

a 32 = 0 ⎝ ⎠

De este modo, la matriz de la transformación es,


⎛1 0⎞
⎜ ⎟
AT = ⎜ 0 1 ⎟
⎜ 0 0⎟
⎝ ⎠
Transformemos el vector u = −2 x + 4 , esto es,
T (u ) = T (−2 x + 4) = x(−2 x + 4) = −2 x 2 + 4 x

Ahora usemos la matriz AT , entonces,


⎛ 1 0⎞ ⎛ − 2⎞
⎜ ⎟⎛ − 2 ⎞ ⎜ ⎟
T (u ) = AT ⋅ u = ⎜ 0 1 ⎟⎜⎜ ⎟⎟ = ⎜ 4 ⎟ ⇒ T (u ) = −2 x 2 + 4 x
⎜ 0 0 ⎟⎝ 4 ⎠ ⎜ 0 ⎟
⎝ ⎠ ⎝ ⎠

EJEMPLO: Consideremos la transformación lineal T : R 3 → R 2 definida por,


⎛ x⎞
⎛1 1 1 ⎞⎜ ⎟
T ( x, y, z ) = ⎜⎜ ⎟⎟⎜ y ⎟ .
⎝1 2 3 ⎠⎜ z ⎟
⎝ ⎠
Determinar la matriz asociada a esta transformación lineal, respecto a las base siguientes,
B1 = {v1 , v 2 , v 3 } y B 2 = {w1 , w2 }, donde,
v1 = (1,1,0) , v 2 = (0,1,0) , v 3 = (0,0,1) , w1 = (1,2) y w2 = (1,3) .

SOLUCIÓN: Obtengamos la matriz de la transformación usando la matriz doble, en un lado colocamos a los
vectores de la base B2 como columnas y en el otro los vectores T (v j ) también como columnas,
tenemos que,
⎛ x⎞ T (1,1,0) = (2,3)
⎛1 1 1 ⎞⎜ ⎟ ⎛ x + y + z ⎞
T ( x, y, z ) = ⎜⎜ ⎟⎟⎜ y ⎟ = ⎜⎜ ⎟⎟ ⇒ T (0,1,0) = (1,2)
⎝1 2 3 ⎠⎜ z ⎟ ⎝ x + 2 y + 3 z ⎠ T (0,0,1) = (1,3)
⎝ ⎠

III-88
entonces
⎛ 1 1 2 1 1⎞ ⎛ 1 0 3 1 0⎞
(w1 w2 T (v1 ) T (v 2 ) T (v3 ) ) = ⎜⎜ ⎟ ⇒
⎟ ⎜ 0 1 − 1 0 1 ⎟ = (I AT )
⎜ ⎟
⎝ 2 3 3 2 3⎠ ⎝ ⎠
Por lo tanto,
⎛ 3 1 0⎞
AT = ⎜⎜ ⎟⎟
⎝ −1 0 1 ⎠

EJEMPLO: Determinar la matriz asociada a la transformación lineal T : R 2 → R 2 , que rota un vector sobre
sobre el plano x − y , alrededor del origen.

SOLUCIÓN: Consideremos la siguiente figura, en la cual rotamos un ángulo θ al vector de coordenadas


( x, y ) , las coordenadas las podemos escribir como,
x = r cos α
y = r sin α

Ahora, las coordenadas del vector rotado un ángulo θ , son ( x' , y ' ) , que están dadas por,
x' = r cos(α + θ ) = r cos α cos θ − r sin α sin θ = x cos θ − y sin θ
y = r sin(α + θ ) = r cos α sin θ + r sin α cos θ = x sin θ + y cos θ
donde usamos las anteriores coordenadas del vector.
Por lo tanto, tenemos la transformación T : R 2 → R 2 dada por,
⎛ x ⎞ ⎛ x ' ⎞ ⎛ x cos θ − y sin θ ⎞
T ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟
⎝ y ⎠ ⎝ y ' ⎠ ⎝ x sin θ + y cos θ ⎠
Si definimos la siguiente matriz,
⎛ cos θ − sin θ ⎞
Aθ = ⎜⎜ ⎟⎟
⎝ sin θ cos θ ⎠
esta tiene la propiedad de que,
⎛ x ⎞ ⎛ cos θ − sin θ ⎞⎛ x ⎞ ⎛ x cos θ − y sin θ ⎞ ⎛ x' ⎞
Aθ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟
⎝ y ⎠ ⎝ sin θ cos θ ⎠⎝ y ⎠ ⎝ x sin θ + y cos θ ⎠ ⎝ y ' ⎠
Aθ es la matriz de rotación, rota un vector un ángulo θ en sentido contrario a las manecillas
del reloj, sobre el plano x − y y alrededor del origen.

III-89
EJEMPLO: Podemos generalizar el ejemplo anterior para el caso de espacio vectorial R 3 . Tenemos las
siguientes matrices, asociadas a las transformaciones lineales T : R 3 → R 3 las cuales rotan
vectores un ángulo θ en el espacio, alrededor de los ejes correspondientes.

⎛ cos θ − sin θ 0⎞
⎜ ⎟
Aθ = ⎜ sin θ cos θ 0 ⎟ rota un vector alrededor el eje z .
⎜ 0 1 ⎟⎠
⎝ 0

⎛ cos θ 0 − sin θ ⎞
⎜ ⎟
Aθ = ⎜ 0 1 0 ⎟ rota un vector alrededor el eje y .
⎜ sin θ 0 cos θ ⎟⎠

III-90
VALORES Y VECTORES PROPIOS O CARACTERÍSTICOS

Consideremos una transformación lineal T : R n → R n , para transformar un vector X ∈ R n tenemos que,


T(X ) = MT ⋅ X = A ⋅ X
donde M T = A es una matriz de tamaño n × n que representa a la transformación lineal T . Un problema de
gran relevancia, por sus aplicaciones en muchas áreas de trabajo, es determinar un vector X ∈ R n , si es que
existe, tal que sea paralelo al vector A ⋅ X , en otras palabras se tiene que resolver la siguiente ecuación matricial,
A⋅ X = λ ⋅ X
que como veremos más adelante, se reduce a resolver un sistema de ecuaciones lineales. A continuación
analizaremos este problema, sus casos particulares y algunas aplicaciones.

Sea A una matriz de tamaño n × n (cuadrada), el número real (escalar) λ es un valor propio o valor
característico de la matriz A , si existe un vector X ∈ R n , distinto de cero, tal que satisface la siguiente ecuación
matricial
A⋅ X = λ ⋅ X
a los vectores X que cumplen esta relación se les llama vectores propios o vectores característicos de la matriz
A , asociados al valor propio λ .

En forma matricial tenemos que si, A∈ M nn y X ∈ R n entonces


⎛ a11 a12 L a1n ⎞⎛ x1 ⎞ ⎛ x1 ⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 L a 2 n ⎟⎜ x 2 ⎟ ⎜ x2 ⎟
A⋅ X = λ ⋅ X ⇒ ⎜ ⎟⎜ ⎟ = λ⎜ ⎟
M M O M M M
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜a ⎟⎜ ⎟ ⎜ ⎟
⎝ n1 a n 2 L a nn ⎠⎝ x n ⎠ ⎝ xn ⎠
ecuación matricial que genera el siguiente sistema de ecuaciones lineales,
a11 x1 + a12 x 2 + L + a1n x n = λx1
a 21 x1 + a 22 x 2 + L + a 2 n x n = λx 2
M
a n1 x1 + a n 2 x 2 + L + a nn x n = λx n

Podemos observar que el vector X = 0 (vector cero) satisface la ecuación matricial anterior, pero este vector no
puede ser un vector propio de una matriz A , sin embargo, λ = 0 si puede ser un valor propio para una matriz
A.

EJEMPLO: Determinar los valores propios o característicos de la matriz identidad de tamaño n × n

SOLUCIÓN: Para este caso tenemos que A = I n es la matriz identidad, entonces


⎛ 1 0 L 0 ⎞⎛ x1 ⎞ ⎛ x1 ⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ 0 1 L 0 ⎟⎜ x 2 ⎟ ⎜ x2 ⎟
In ⋅ X = λ ⋅ X ⇒ ⎜ ⎟⎜ ⎟ = λ⎜ ⎟
M M O M M M
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ 0 0 L 1 ⎟⎜ x ⎟ ⎜x ⎟
⎝ ⎠⎝ n ⎠ ⎝ n⎠
realizando el producto observamos que

IV-91
⎛ x1 ⎞ ⎛ x1 ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ x2 ⎟ ⎜ x2 ⎟ ⎜ x2 ⎟
⎜ M ⎟ = λ⎜ M ⎟ = 1 ⋅ ⎜ M ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜x ⎟ ⎜x ⎟
⎝ n⎠ ⎝ n⎠ ⎝ n⎠
por lo tanto, podemos escribir la ecuación matricial como,
In ⋅ X =1⋅ X
de donde observamos que λ = 1 es el único valor propio o característico de la matriz identidad
I n y también podemos ver de esta misma ecuación que, cualquier vector X ∈ R n es un vector
propio o característico de la matriz identidad.

EJEMPLO: Determinar los valores y vectores propios de la siguiente matriz de tamaño 2 × 2


⎛ 1 1⎞
A = ⎜⎜ ⎟⎟
⎝ − 2 4⎠
SOLUCIÓN: El problema consiste en encontrar las escalares λ ∈ R y los vectores X ∈ R 2 , tales que cumplan
la ecuación matricial A ⋅ X = λ ⋅ X , sea
⎛x ⎞ ⎛ 1 1 ⎞⎛ x1 ⎞ ⎛x ⎞
X = ⎜⎜ 1 ⎟⎟ ⇒ ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = λ ⎜⎜ 1 ⎟⎟
⎝ x2 ⎠ ⎝ − 2 4 ⎠⎝ x 2 ⎠ ⎝ x2 ⎠
de manera que
x1 + x 2 = λx1 x1 (1 − λ ) + x 2 = 0

− 2 x1 + 4 x 2 = λx 2 − 2 x1 + x 2 (4 − λ ) = 0
tenemos un sistema de dos ecuaciones con tres incógnitas: x1 , x 2 y λ .
Como el sistema es homogéno, puede tener las siguientes dos posibilidades para la solución,
⎛ 0⎞
a) solución única (solución trivial x1 = x 2 = 0 ), entonces X = ⎜⎜ ⎟⎟ , pero sabemos que el vector
⎝ 0⎠
cero no es un vector propio, así que esta posibilidad no es válida.

b) soluciones infinitas (vectores propios distintos de cero), esta si es válida.

Entonces para que el sistema homogéneo tenga soluciones infinitas, su determinante debe ser igual
a cero, esto es,
1− λ 1
=0
−2 4−λ
es decir,
(1 − λ )(4 − λ ) + 2 = 6 − 5λ + λ2 = (λ − 3)(λ − 2) = 0
así, los valores propios de la matriz A son: λ1 = 3 y λ 2 = 2 .
Ahora, sustituimos cada uno de estos valores en la ecuación homogénea y tenemos que,
Para λ1 = 3
x1 (1 − λ1 ) + x 2 = 0 − 2 x1 + x 2 = 0
⇒ ⇒ 2 x1 = x 2 = α ∈ R
− 2 x1 + x 2 (4 − λ1 ) = 0 − 2 x1 + x 2 = 0
por lo tanto, los vectores propios de la matriz A asociados al valor propio λ1 = 3 son,
⎛ x ⎞ ⎛α / 2 ⎞ ⎛1 / 2 ⎞
X 1 = ⎜⎜ 1 ⎟⎟ = ⎜⎜ ⎟⎟ = α ⎜⎜ ⎟⎟
⎝ x2 ⎠ ⎝ α ⎠ ⎝ 1 ⎠

IV-92
Para λ 2 = 2
x1 (1 − λ 2 ) + x 2 = 0 − x1 + x 2 = 0
⇒ ⇒ x1 = x 2 = α ∈ R
− 2 x1 + x 2 (4 − λ 2 ) = 0 − 2 x1 + 2 x 2 = 0
por lo tanto, los vectores propios de la matriz A asociados al valor propio λ 2 = 2 son,
⎛ x ⎞ ⎛α ⎞ ⎛1⎞
X 2 = ⎜⎜ 1 ⎟⎟ = ⎜⎜ ⎟⎟ = α ⎜⎜ ⎟⎟
⎝ x2 ⎠ ⎝α ⎠ ⎝1⎠

Visualicemos geométricamente el problema, sean x1 y x 2 los ejes de coordenadas, graficamos un


vector propio para cada valor de λ1 y λ 2 , digamos para α = 1 , entonces
⎛1 / 2 ⎞ ⎛1⎞
X 1 = ⎜⎜ ⎟⎟ , X 2 = ⎜⎜ ⎟⎟ ,
⎝ 1 ⎠ ⎝1⎠
y también graficamos los vectores
⎛ 1 1 ⎞⎛1 / 2 ⎞ ⎛ 3 / 2 ⎞ ⎛1 / 2 ⎞
AX 1 = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = 3⎜⎜ ⎟⎟ = 3 X 1
⎝ − 2 4 ⎠⎝ 1 ⎠ ⎝ 3 ⎠ ⎝ 1 ⎠
y
⎛ 1 1 ⎞⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞
AX 2 = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = 2⎜⎜ ⎟⎟ = 2 X 2
⎝ − 2 4 ⎠⎝ 1 ⎠ ⎝ 2 ⎠ ⎝ 1 ⎠
de manera que,

Observamos en la gráfica las siguientes características generales de la ecuación A ⋅ X = λ ⋅ X ,

a) Los vectores X y AX son paralelos entre si, y tienen la misma dirección o direcciones
opuestas, dependiendo del signo de los valores propios de la matriz A .

b) El vector AX tiene magnitud igual a λ -veces el vector X .

IV-93
Polinomio Característico y Ecuación Característica

Del ejemplo anterior, podemos deducir el método general para encontrar los valores y vectores propios o
característicos de una matriz arbitraria, a continuación se muestra.

Sea A = ( a ij ) una matriz de tamaño n × n (cuadrada), el determinante definido como,


f (λ ) = det( A − λ ⋅ I n ) = A − λ ⋅ I n
se llama polinomio característico de la matriz A . De manera explicita tenemos que si
⎛ a11 a12 L a1n ⎞ ⎛1 0 L 0⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 L a 2 n ⎟ ⎜ 0 1 L 0⎟
A(a ij ) = ⎜ y In = ⎜
M M O M ⎟ M M O M⎟
⎜ ⎟ ⎜ ⎟
⎜a ⎟ ⎜0 0 L 1⎟
⎝ n1 a n 2 L a nn ⎠ ⎝ ⎠
entonces,
a11 − λ a12 L a1n
a 21 a 22 − λ L a 2n
f (λ ) = A − λ ⋅ I n =
M M O M
a n1 an2 L a nn − λ

Por otro lado, si el polinomio característico anterior lo igualamos con cero, entonces a la ecuación
f (λ ) = A − λ ⋅ I n = 0
se le llama ecuación característica de la matriz A y las raíces de esta ecuación son los valores propios
(λ1 , λ 2 , K , λ n ) , de la matriz A . Si la matriz A es de tamaño n × n , entonces debe tener n valores propios o
característicos. Solo nos concretaremos a trabajar con matrices que tengan valores propios reales y enteros.

Finalmente, los vectores propios o característicos, X i , de la matriz A , se obtienen sustituyendo cada uno
valores propios λi (i = 1,2,3, K , n) , obtenidos anteriormente, en la ecuación homogénea,
( A − λi ⋅ I n ) X i = 0
donde explícitamente tenemos que si,
⎛ a11 a12 L a1n ⎞ ⎛1 0 L 0⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 L a 2 n ⎟ ⎜ 0 1 L 0⎟ ⎜ x2 ⎟
A(a ij ) = ⎜ ⎟ , In = ⎜ ⎟ y Xi = ⎜ ⎟
M M O M M M O M M
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜a ⎟ ⎜0 0 L 1⎟ ⎜x ⎟
⎝ n1 a n 2 L a nn ⎠ ⎝ ⎠ ⎝ n⎠
entonces
(a11 − λi ) x1 + a12 x 2 + L + a1n x n = 0 ⎛ a11 − λ a12 L a1n 0⎞
⎜ ⎟
a 21 x1 + (a 22 − λi ) x 2 + L + a 2 n x n = 0 ⎜ a 21 a 22 − λ L a2n 0⎟
( A − λi ⋅ I n ) X i = 0 ⇒ ⇒ ⎜ M
M ⎜ M O M M ⎟⎟
a n1 x1 + a n 2 x 2 + L + (a nn − λi ) x n = 0 ⎜ a an2 L a nn − λ 0 ⎟⎠
⎝ n1

La última implicación es la matriz aumentada del sistema. Cada sistema homogéneo que se obtiene para un valor
propio específico λi , tiene un número infinito de soluciones, ya que el determinante del sistema es igual a cero
para ese valor particular de λi . Así tenemos que, cada valor propio λi tiene asociado un número infinito de
vectores propios y cualquiera de ellos es un vector propio de la matriz A .

IV-94
EJEMPLO: Para la siguiente matriz, determine sus valores y vectores propios,
⎛ 1 2 − 1⎞
⎜ ⎟
A = ⎜1 0 1⎟
⎜4 − 4 5 ⎟
⎝ ⎠

SOLUCIÓN: Construimos el polinomio característico de la matriz A ,


1− λ 2 −1
f (λ ) = A − λ ⋅ I = 1 −λ 1 = λ3 − 6λ2 + 11λ − 6
4 −4 5−λ
Ahora, las raíces de esta ésta ecuación, son los valores propios de la matriz A , esto es,
λ3 − 6λ 2 + 11λ − 6 = 0 ⇒ (λ − 1)(λ − 3)(λ − 2)
entonces, λ1 = 1 , λ 2 = 3 y λ3 = 2 son los valores propios.

Calculamos los vectores propios, sustituyendo los valores propios en la ecuación homogénea,
( A − λi ⋅ I n ) X i = 0
Así, para λ1 = 1 , tenemos
⎛ 0 2 − 1 0⎞ ⎛ 0 2 − 1 0⎞
⎜ ⎟ ⎜ ⎟
( A − λ1 I ) X 1 = 0 ⇒ ⎜ 1 − 1 1 0 ⎟ ( R3 − (4) R 2 → R3) ⎜1 − 1 1 0⎟
⎜ 4 − 4 4 0⎟ ⎜0 0 0 0 ⎟⎠
⎝ ⎠ ⎝
⎛ 0 2 − 1 0⎞
⎜ ⎟ x = − x2
( R 2 + R1 → R 2) ⎜ 1 1 0 0 ⎟ ⇒ 1
⎜ 0 0 0 0⎟ 2 x 2 = x3 = α ∈ R
⎝ ⎠
⎛ x1 ⎞ ⎛ − α / 2 ⎞ ⎛ − 1/ 2⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ X 1 = ⎜ x2 ⎟ = ⎜ α / 2 ⎟ = α ⎜ 1 / 2 ⎟
⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ1 = 1 .

Para λ 2 = 3 ,
⎛ − 2 2 − 1 0⎞ ⎛ − 2 2 − 1 0⎞
⎜ ⎟ ⎜ ⎟
( A − λ2 I ) X 2 = 0 ⇒ ⎜ 1 − 3 1 0 ⎟ ( R3 + (2) R1 → R3) ⎜ 1 − 3 1 0⎟
⎜ 4 − 4 2 0⎟ ⎜ 0 0 0 0 ⎟⎠
⎝ ⎠ ⎝
⎛ − 2 2 − 1 0⎞ ⎛− 4 0 − 1 0⎞
⎜ ⎟ ⎜ ⎟
( R 2 + R1 → R 2) ⎜ − 1 − 1 0 0 ⎟ ( R1 + ( 2) R 2 → R1) ⎜ − 1 − 1 0 0⎟
⎜ 0 0 0 0 ⎟⎠ ⎜ 0 0 0 0 ⎟⎠
⎝ ⎝
x = − x2
⇒ 1
4 x1 = − x3 = −α ∈ R
⎛ x1 ⎞ ⎛ − α / 4 ⎞ ⎛ − 1/ 4⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ X 2 = ⎜ x2 ⎟ = ⎜ α / 4 ⎟ = α ⎜ 1 / 4 ⎟
⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
Vectores propios de A , asociados al valor propio λ 2 = 3 .

IV-95
Finalmente para λ3 = 2 ,
⎛ − 1 2 − 1 0⎞ ⎛ − 1 2 − 1 0⎞
⎜ ⎟ ⎜ ⎟
( A − 1 ⋅ λ3 ) X 3 = 0 ⇒ ⎜ 1 − 2 1 0 ⎟ ( R 2 + R1 → R 2) ⎜ 0 0 0 0⎟
⎜ 4 − 4 3 0⎟ ⎜ 4 − 4 3 0⎟
⎝ ⎠ ⎝ ⎠
⎛ − 1 2 − 1 0⎞ ⎛ − 1 − 2 0 0⎞
⎜ ⎟ ⎜ ⎟
( R3 + (4) R1 → R3) ⎜ 0 0 0 0 ⎟ ( R1 − R3 → R1) ⎜ 0 0 0 0⎟
⎜ 0 4 − 1 0⎟ ⎜0 4 − 1 0 ⎟⎠
⎝ ⎠ ⎝
⎛ x1 ⎞ ⎛ − α / 2 ⎞ ⎛ − 1/ 2⎞
4 x 2 = x3 = α ∈ R ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ ⇒ X 3 = ⎜ x2 ⎟ = ⎜ α / 4 ⎟ = α ⎜ 1 / 4 ⎟
x1 = −2 x 2 ⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
Vectores propios de A , asociados al valor propio λ3 = 2 .

Diagonalización de Matrices

Una matriz B es similar a una matriz A , si existe una matriz invertible P tal que B = P −1 AP , decimos que A
y B son matrices similares.

Una matriz A de tamaño n × n es diagonalizable si y solo si tiene n vectores propios linealmente


independientes. En este caso, la matriz A será similar a una matriz diagonal D = P −1 AP , cuyos elementos son
los valores propios de la matriz A .

Por otra parte, la matriz P es aquella matriz de tamaño n × n , cuyas columnas son los n vectores propios
linealmente independientes de la matriz A . En el orden en el que coloquemos estos vectores propios en la matriz
P , en ese orden aparecerán los valores propios en la matriz diagonal D .

EJEMPLO: Diagonalizemos la matriz de tamaño 2 × 2 del ejemplo anterior


⎛ 1 1⎞
A = ⎜⎜ ⎟⎟
⎝ − 2 4⎠
SOLUCIÓN: Tenemos que los valores propios de la matriz A son,
⎛ x ⎞ ⎛α / 2 ⎞ ⎛1 / 2 ⎞
λ1 = 3 con vectores propios asociados X 1 = ⎜⎜ 1 ⎟⎟ = ⎜⎜ ⎟⎟ = α ⎜⎜ ⎟⎟
⎝ x2 ⎠ ⎝ α ⎠ ⎝ 1 ⎠
⎛ x ⎞ ⎛α ⎞ ⎛1⎞
λ 2 = 2 con vectores propios asociados X 2 = ⎜⎜ 1 ⎟⎟ = ⎜⎜ ⎟⎟ = α ⎜⎜ ⎟⎟
⎝ x2 ⎠ ⎝α ⎠ ⎝1⎠
Ahora verificamos que estos vectores propios sean linealmente independientes, tomamos un
valor de α cualesquiera, esto es,
⎛1⎞
para α = 2 X 1 = ⎜⎜ ⎟⎟
⎝ 2⎠
y
⎛ 1⎞
para α = 1 X 2 = ⎜⎜ ⎟⎟ ,
⎝ 1⎠
entonces

IV-96
1 1
= 1 − 2 = −1 ≠ 0 ⇒ X 1 y X 2 son linealmente independientes.
2 1
De manera que la matriz A es diagonalizable, para lo cual construimos la matriz P , cuyas
columnas son los vectores propios X 1 y X 2 , esto es,
⎛ 1 1⎞ ⎛−1 1 ⎞
P = ( X 1 X 2 ) = ⎜⎜ ⎟⎟ ⇒ P −1 = ⎜⎜ ⎟⎟
⎝ 2 1⎠ ⎝ 2 − 1⎠
entonces
⎛ − 1 1 ⎞⎛ 1 1 ⎞⎛ 1 1⎞ ⎛ 3 0 ⎞ ⎛ λ1 0⎞
D = P −1 AP = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟
⎝ 2 − 1⎠⎝ − 2 4 ⎠⎝ 2 1⎠ ⎝ 0 2 ⎠ ⎝ 0 λ 2 ⎟⎠

Si cambiamos el orden de las columnas de P , tenemos


⎛1 1 ⎞ ⎛ 2 − 1⎞
P = ( X 2 X 1 ) = ⎜⎜ ⎟⎟ ⇒ P −1 = ⎜⎜ ⎟⎟
⎝1 2 ⎠ ⎝−1 1 ⎠
de donde
⎛ 2 − 1⎞⎛ 1 1 ⎞⎛1 1 ⎞ ⎛ 2 0 ⎞ ⎛ λ 2 0⎞
D = P −1 AP = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟
⎝ − 1 1 ⎠⎝ − 2 4 ⎠⎝1 2 ⎠ ⎝ 0 3 ⎠ ⎝ 0 λ1 ⎟⎠

De igual manera se puede usar cualquier vector propio de todo el conjunto infinito de vectores
obtenido, es decir, para cualquier valor de α .

EJEMPLO: Ahora, diagonalizemos también la matriz de 3 × 3 del ejemplo anterior,


⎛ 1 2 − 1⎞
⎜ ⎟
A = ⎜1 0 1⎟
⎜4 − 4 5 ⎟
⎝ ⎠

SOLUCIÓN: Tenemos entonces que,


⎛ x1 ⎞ ⎛ − α / 2 ⎞ ⎛ − 1/ 2⎞ ⎛ − 1⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
Para λ1 = 1 ⇒ X 1 = ⎜ x 2 ⎟ = ⎜ α / 2 ⎟ = α ⎜ 1 / 2 ⎟ si α = 2 ⇒ X 1 = ⎜ 1 ⎟
⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟ ⎜ 2⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
⎛ x1 ⎞ ⎛ − α / 4 ⎞ ⎛ − 1/ 4⎞ ⎛ − 1⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
Para λ 2 = 3 ⇒ X 2 = ⎜ x 2 ⎟ = ⎜ α / 4 ⎟ = α ⎜ 1 / 4 ⎟ si α = 4 ⇒ X 2 = ⎜ 1 ⎟
⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟ ⎜ 4⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
⎛ x1 ⎞ ⎛ − α / 2 ⎞ ⎛ − 1/ 2⎞ ⎛ − 2⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
Para λ3 = 2 ⇒ X 3 = ⎜ x 2 ⎟ = ⎜ α / 4 ⎟ = α ⎜ 1 / 4 ⎟ si α = 4 ⇒ X 3 = ⎜ 1 ⎟
⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟ ⎜ 4 ⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
verificamos que los vectores propios sean linealmente independientes,

−1 −1 − 2
2 1 1 ≠0 ⇒ X 1 , X 2 y X 3 son linealmente independientes.
2 4 4

IV-97
⎛ − 1 − 1 − 2⎞ ⎛ 0 − 2 / 3 1/ 6⎞
⎜ ⎟ ⎜ ⎟
Entonces P = ( X 1 X 2 X 3 ) = ⎜ 2 1 1 ⎟ ⇒ P = ⎜ 1 − 1 / 3 1 / 3 ⎟
−1

⎜ 2 4 ⎟⎠ ⎜1 1 / 2 ⎟⎠
⎝ 4 ⎝ 0

Donde estas matrices también verifican la igualdad


⎛ λ1 0 0⎞
−1
⎜ ⎟
D = P AP = ⎜ 0 λ 2 0⎟
⎜0 0 λ3 ⎟⎠

Una matriz A es diagonalizable si todas las raíces o valores propios de su polinomio característico tienen
valores reales y son distintas. Si estas raíces son todas reales pero no todas son distintas, entonces la matriz A
puede o no puede ser diagonalizable.

Multiplicidad de Raíces

Sea A una matriz cuadrada, el valor propio λ j es de multiplicidad m , si la matriz tiene m valores propios o
característicos iguales a λ j .

⎛ 1 1⎞
EJEMPLO: Sea A = ⎜⎜ ⎟⎟ , para esta matriz su polinomio característico esta dado por,
⎝ 0 1⎠
1− λ 1
f (λ ) = = (1 − λ )(1 − λ )
0 1− λ
cuyas raíces o valores propio son,
f (λ ) = (1 − λ )(1 − λ ) = 0 ⇒ λ1 = λ 2 = 1
Entonces la matriz A tiene el valor propio λ = 1 de multiplicidad m = 2 .

Si las raíces del polinomio característico de una matriz cuadrada A son todas reales, entonces la matriz A se
puede diagonalizar si y solo si para cada valor propio λ j de multiplicidad m , podemos determinar m vectores
propios linealmente independientes. Esto es, si el espacio solución del sistema de ecuaciones lineales
( A − λ j I ) X j = 0 tiene dimensión m .

Si λ j es un valor propio de la matriz A , y es de multiplicidad m , entonces a lo más existen m vectores propios


linealmente independientes asociados al valor propio λ j . El conjunto de todos los vectores propios de A ,
asociados al valor propio λ j junto con el vector cero, forman un subespacio vectorial de R n , llamado espacio
propio asociado a λ j .

EJEMPLO: Diagonalizar, si es posible, la siguiente matriz,


⎛ 0 0 0⎞
⎜ ⎟
A = ⎜ 0 1 0⎟
⎜1 0 1⎟
⎝ ⎠

IV-98
SOLUCIÓN: Determinemos primero los valores propios asociados a la matriz,

la ecuación característica es,


−λ 0 0
f (λ ) = 0 1 − λ 0 = λ (1 − λ )(1 − λ ) = 0
1 0 1− λ
cuyas raíces son, λ1 = 0 , λ 2 = λ3 = 1 , es decir, el valor propio λ = 1 es de multiplicidad m = 2 .

Determinemos ahora los vectores propios asociados a estos valores propio, resolviendo los
sistemas sistemas de ecuaciones lineales respectivos.

Para λ1 = 0 tenemos,
⎛ 0 0 0 ⎞⎛ x1 ⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎛ 0⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ x2 = 0
( A − 0 I ) X 1 = 0 ⇒ ⎜ 0 1 0 ⎟⎜ x 2 ⎟ = ⎜ 0 ⎟ ⇒ ⎜ x 2 ⎟ = ⎜ 0 ⎟ ⇒
⎜ 1 0 1 ⎟⎜ x ⎟ ⎜ 0 ⎟ ⎜ x + x ⎟ ⎜ 0⎟ x1 = − x3 = α ∈ R
⎝ ⎠⎝ 3 ⎠ ⎝ ⎠ ⎝ 1 3⎠ ⎝ ⎠
de manera que los vectores propios son de la forma,
⎛−α ⎞ ⎛ − 1⎞
⎜ ⎟ ⎜ ⎟
X1 = ⎜ 0 ⎟ = α⎜ 0 ⎟
⎜ α ⎟ ⎜1⎟
⎝ ⎠ ⎝ ⎠
Para λ 2 = λ3 = 1 tenemos,
⎛ − 1 0 0 ⎞⎛ x1 ⎞ ⎛ 0 ⎞ ⎛ − x1 ⎞ ⎛ 0 ⎞ x1 = 0
⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
( A − 1I ) X 2,3 = 0 ⇒ ⎜ 0 0 0 ⎟⎜ x 2 ⎟ = ⎜ 0 ⎟ ⇒ ⎜ 0 ⎟ = ⎜ 0 ⎟ ⇒ x2 = α ∈ R
⎜ 1 0 0 ⎟⎜ x ⎟ ⎜ 0 ⎟ ⎜ x ⎟ ⎜ 0⎟ x3 = β ∈ R
⎝ ⎠⎝ 3 ⎠ ⎝ ⎠ ⎝ 1 ⎠ ⎝ ⎠
de manera que los vectores propios son de la forma,
⎛0⎞ ⎛ 0⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
X 2, 3 = ⎜ α ⎟ = α ⎜ 1 ⎟ + β ⎜ 0 ⎟
⎜β ⎟ ⎜ 0⎟ ⎜1⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
El valor propio λ = 1 de multiplicidad m = 2 genera dos vectores propios.

Tenemos además que los vectores


⎧⎛ − 1⎞ ⎛ 0 ⎞ ⎛ 0 ⎞⎫
⎪⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎪
⎨⎜ 0 ⎟, ⎜ 1 ⎟, ⎜ 0 ⎟⎬
⎪⎜ 1 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟⎪
⎩⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎭
son linealmente independientes, por lo tanto, la matriz A si es diagonalizable, donde
⎛ − 1 0 0⎞
⎜ ⎟
P = ⎜ 0 1 0⎟
⎜ 1 0 1⎟
⎝ ⎠
matriz que satisface la relación
⎛ λ1 0 0 ⎞ ⎛ 0 0 0⎞
−1
⎜ ⎟ ⎜ ⎟
D = P AP = ⎜ 0 λ2 0 ⎟ = ⎜ 0 1 0⎟
⎜0 λ3 ⎟⎠ ⎜⎝ 0 0 1 ⎟⎠
⎝ 0

IV-99
EJEMPLO: Determinar si la siguiente matriz es diagonalizable o no lo es,
⎛1 0 3 ⎞
⎜ ⎟
A = ⎜ 1 −1 2 ⎟
⎜ − 1 1 − 2⎟
⎝ ⎠
SOLUCIÓN: Determinamos los valores propios asociados a la matriz, mediante la ecuación característica,
1− λ 0 3
f (λ ) = 1 −1− λ 2 = − λ 3 − 2λ 2 = − λ ( 2 + λ ) = 0
−1 1 −2−λ
cuyas raíces son, λ1 = λ 2 = 0 , λ3 = −2 , donde, el valor propio λ = 0 es de multiplicidad m = 2 .

Determinemos ahora los vectores propios asociados a estos valores propio, resolviendo los
sistemas sistemas de ecuaciones lineales respectivos.

Para λ1 = λ 2 = 0 tenemos,
⎛1 0 3 ⎞⎛ x1 ⎞ ⎛ 0 ⎞ ⎛ x1 + 3x3 ⎞ ⎛ 0⎞ x1 = −3 x3
⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
( A − 0 I ) X 1, 2 = 0 ⇒ ⎜ 1 − 1 2 ⎟⎜ x 2 ⎟ = ⎜ 0 ⎟ ⇒ ⎜ x1 − x 2 + 2 x3 ⎟ = ⎜ 0 ⎟ ⇒ x 2 = − x3
⎜ − 1 1 − 2 ⎟⎜ x ⎟ ⎜ 0 ⎟ ⎜ − x + x − 2x ⎟ ⎜ 0⎟ x3 = α ∈ R
⎝ ⎠⎝ 3 ⎠ ⎝ ⎠ ⎝ 1 2 3⎠ ⎝ ⎠
de manera que los vectores propios son de la forma,
⎛ − 3α ⎞ ⎛ − 3⎞
⎜ ⎟ ⎜ ⎟
X 1, 2 = ⎜ − α ⎟ = α ⎜ − 1 ⎟
⎜ α ⎟ ⎜ 1 ⎟
⎝ ⎠ ⎝ ⎠
Observamos que el valor propio λ = 0 es de multiplicidad m = 2 y solo genera un vectores
propios

Para λ3 = −2 tenemos,
⎛ 3 0 3 ⎞⎛ x1 ⎞ ⎛ 0 ⎞ ⎛ 3x1 + 3x3 ⎞ ⎛ 0 ⎞ x1 = − x3
⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
( A − ( −2) I ) X 3 = 0 ⇒ ⎜ 1 1 2 ⎟⎜ x 2 ⎟ = ⎜ 0 ⎟ ⇒ ⎜ x1 + x 2 + 2 x3 ⎟ = ⎜ 0 ⎟ ⇒ x 2 = − x3
⎜ − 1 1 0 ⎟⎜ x ⎟ ⎜ 0 ⎟ ⎜ − x + x ⎟ ⎜ 0⎟ x3 = α ∈ R
⎝ ⎠⎝ 3 ⎠ ⎝ ⎠ ⎝ 1 2 ⎠ ⎝ ⎠
de manera que los vectores propios son de la forma,
⎛−α ⎞ ⎛ − 1⎞
⎜ ⎟ ⎜ ⎟
X 3 = ⎜ − α ⎟ = α ⎜ − 1⎟
⎜ α ⎟ ⎜1⎟
⎝ ⎠ ⎝ ⎠

Como solo tenemos dos vectores linealmente independientes


⎧⎛ − 3 ⎞ ⎛ − 1⎞⎫
⎪⎜ ⎟ ⎜ ⎟⎪
⎨⎜ − 1 ⎟, ⎜ − 1⎟⎬
⎪⎜ 1 ⎟ ⎜ 1 ⎟⎪
⎩⎝ ⎠ ⎝ ⎠⎭
entonces la matriz A , no es diagonalizable.

IV-100
Diagonalización de Matrices Simétricas

Analizaremos ahora el proceso de diagonalización para matrices que son simétricas, recordando que una matriz
simétrica es aquella cuyos coeficientes satisfacen la relación (a ij ) = (a ji ) , en otras palabras, una matriz es
simétrica si esta es igual a su transpuesta, A = AT .

EJEMPLOS: Estas son algunas matrices simétricas,


⎛ −1 7 −2 0⎞
⎛−1 0 4 ⎞ ⎜ ⎟
⎛ − 1 − 3⎞ ⎜ ⎟ ⎜ 7 0 3 4⎟
A = ⎜⎜ ⎟⎟ = A , B = ⎜ 0 − 2 − 7 ⎟ = B , C = ⎜
T T
= C T , etc.
⎝− 3 0 ⎠ ⎜ 4 −7 3 ⎟ −2 3 − 5 10 ⎟
⎝ ⎠ ⎜ ⎟
⎜ 0 4 10 2 ⎟⎠

Observemos que le concepto de matriz simétrica solo es válido para matrices cuadradas.

El procedimiento para diagonalizar matrices simétricas es, esencialmente el mismo que desarrollamos en la
sección anterior, esto es, calculamos los valores propios de la matriz, encontramos los vectores propios asociados
a los valores propios, con estos vectores construimos la matriz P que diagonaliza la matriz A .

La diferencia, es que aparecen ciertas propiedades importantes en los elementos que participan en la
diagonalización de una matriz simétrica A , como son, vectores propios ortogonales, la matriz P que
diagonaliza a la matriz A cumple que su inversa es igual a su traspuesta, etc. Analizaremos estas y otras
características más.

Una matriz P de tamaño n × n es ortogonal si y solo si sus columnas (o filas), forman un conjunto ortonormal de
vectores en el espacio vectorial R n .

EJEMPLO: La siguiente matriz, es una matriz ortogonal,


⎛ 1 2 ⎞
⎜− 0 ⎟
⎜ 5 5⎟
P=⎜ 0 1 0 ⎟
⎜ 2 1 ⎟
⎜ 5 0 5 ⎟⎠

esta matriz cumple con la propiedad de que sus columnas son vectores ortogonales, esto es,
⎛ 1 2 ⎞
⎛ 1 2 ⎞ ⎛ 1 2 ⎞ ⎜⎜ − ,0, ⎟⎟ ⋅ (0,1,0) = 0
⎜⎜ − ,0, ⎟⎟ ⋅ ⎜⎜ − ,0, ⎟⎟ = 1 ⎝ 5 5⎠
⎝ 5 5⎠ ⎝ 5 5⎠
⎛ 1 2 ⎞ ⎛ 2 1 ⎞
(0,1,0) ⋅ (0,1,0) = 1 y ⎜⎜ − ,0, ⎟⎟ ⋅ ⎜⎜ ,0, ⎟⎟ = 0
⎝ 5 5⎠ ⎝ 5 5⎠
⎛ 2 1 ⎞ ⎛ 2 1 ⎞
⎜⎜ ,0, ⎟⎟ ⋅ ⎜⎜ ,0, ⎟⎟ = 1 ⎛ 2 1 ⎞
⎝ 5 5⎠ ⎝ 5 5⎠ (0,1,0) ⋅ ⎜⎜ ,0, ⎟⎟ = 0
⎝ 5 5⎠
es fácil observar que esta misma característica la satisfacen las filas de la matriz P .

Otra propiedad importante de una matriz ortogonal, es que su determinante siempre tiene el valor de ± 1 , esto es,
si P es una matriz simétrica entonces det( P ) = P = ±1 .

IV-101
EJEMPLO: Para la matriz del ejemplo anterior, calcular su determinante.

SOLUCIÓN: Tenemos que como P es ortogonal, entonces


1 2
− 0
5 5 ⎡⎛ 1 ⎞⎛ 1 ⎞ ⎛ 2 ⎞⎛ 2 ⎞⎤ 1 4 5
det( P ) = P = 0 1 0 = 1⎢⎜⎜ − ⎟⎟⎜⎜ ⎟⎟ − ⎜⎜ ⎟⎟⎜⎜ ⎟⎟⎥ = − − = − = 1 .
2
0
1 ⎣⎝ 5 ⎠⎝ 5 ⎠ ⎝ 5 ⎠⎝ 5 ⎠⎦ 5 5 5
5 5

Otro importante observación que podemos obtener de una matriz ortogonal es que, su inversa es igual a su
transpuesta, esto es, si P es una matriz ortogonal entonces P −1 = P T .

EJEMPLO: Considere la siguiente matriz ortogonal P , verificar la propiedad P −1 = P T .


⎛ 1 1 ⎞
⎜ 0 0 ⎟
⎜ 2 2 ⎟
⎜ 1 1 ⎟
⎜− 2 0
2
0 ⎟
P=⎜ ⎟
⎜ 0 1 1 ⎟
0
⎜ 2 2⎟
⎜ 1 1 ⎟
⎜ 0 − 0 ⎟
⎝ 2 2⎠
SOLUCIÓN: Obtengamos la inversa de P , es decir su transpuesta
⎛ 1 1 ⎞
⎜ − 0 0 ⎟
⎜ 2 2 ⎟
⎜ 1 1 ⎟
⎜ 0 0 −
−1
P = P =⎜T 2 2 ⎟⎟
⎜ 1 1
0 0 ⎟
⎜ 2 2 ⎟
⎜ 1 1 ⎟
⎜ 0 0 ⎟
⎝ 2 2 ⎠
entonces se debe verificar que P −1 P = P T P = I , de esta forma

⎛ 1 1 ⎞ ⎛ 1 1 ⎞
⎜ 0 0 ⎟ ⎜ − 0 0 ⎟
⎜ 2 2 ⎟ ⎜ 2 2 ⎟
⎜ 1 1 ⎟ ⎜ 1 1 ⎟ ⎛⎜ 1 0 0 0⎞

⎜− 2 0
2
0 ⎟ ⎜ 0 0
2

2 ⎟⎟ = ⎜ 0 1 0 0⎟
PP T = ⎜ ⎟⋅⎜ ⎜ =I
⎜ 0 1 1 ⎟ ⎜ 1 1
0 ⎟ ⎜0 0 1 0⎟
0 0 ⎟
⎜ 2 2⎟ ⎜ 2 2 ⎟ ⎜0 0 0 1 ⎟⎠
⎜ ⎝
1 1 ⎟ ⎜ 1 1 ⎟
⎜ 0 − 0 ⎟ ⎜ 0 0 ⎟
⎝ 2 2⎠ ⎝ 2 2 ⎠

La importancia de mencionar algunas propiedades de la matriz ortogonal, es que el proceso para diagonalizar
una matriz simétrica esta en función de esta matriz ortogonal, procedimiento que se conoce como
diagonalización ortogonal.

IV-102
Decimos que una matriz simétrica A de tamaño n × n es diagonalizable ortogonalmente, si existe una matriz
ortogonal P tal que satisface la siguiente relación matricial,
P −1 AP = P T AP = D
donde D es una matriz diagonal, cuyos elementos son los valores propios de la matriz A .

EJEMPLO: Diagonalizar ortogonalmente la siguiente matriz simétrica,


⎛ 0 0 − 2⎞
⎜ ⎟
A=⎜ 0 −2 0 ⎟
⎜− 2 0 3 ⎟⎠

SOLUCIÓN: Determinamos su ecuación característica para encontrar sus valores propios, entonces
−λ 0 −2
f (λ ) = ( A − λI ) = 0 − 2 − λ 0 = λ3 − λ 2 − 10λ − 8 = (λ + 2)(λ − 4)(λ + 1) = 0
−2 0 3−λ
cuyas raíces son los valores propios de la matriz A , estos son, λ1 = −2 , λ 2 = 4 y λ3 = −1 .
Determinemos ahora los vectores propios asociados a cada valor propio, sustituyendo los
valores propios en la ecuación homogénea, ( A − λ i ⋅ I n ) X i = 0

Para λ1 = −2 , tenemos
⎛ 2 0 − 2 0⎞ ⎛ − 2 0 − 2 0⎞
⎜ ⎟ ⎜ ⎟
( A − λ1 I ) X 1 = 0 ⇒ ⎜ 0 0 0 0 ⎟ ( R3 + R1 → R3) ⎜ 0 0 0 0⎟
⎜ − 2 0 5 0⎟ ⎜ 0 0 3 0⎟
⎝ ⎠ ⎝ ⎠
x1 = − x3 ⎛ x1 ⎞ ⎛ 0 ⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ x2 = α ∈ R ⇒ X 1 = ⎜ x2 ⎟ = ⎜α ⎟ = α ⎜ 1 ⎟
x3 = 0 ⎜x ⎟ ⎜0⎟ ⎜ 0⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ1 = −2 .

Para λ 2 = 4 , tenemos
⎛ − 4 0 − 2 0⎞ ⎛ − 4 0 − 2 0⎞
⎜ ⎟ ⎜ ⎟
( A − λ2 I ) X 2 = 0 ⇒ ⎜ 0 − 6 0 0 ⎟ (2 R3 − R1 → R3) ⎜ 0 − 6 0 0⎟
⎜ − 2 0 − 1 0⎟ ⎜ 0 0 0 0 ⎟⎠
⎝ ⎠ ⎝
x3 = −2 x1 ⎛ x1 ⎞ ⎛ α ⎞ ⎛ 1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ x2 = 0 ⇒ X 2 = ⎜ x2 ⎟ = ⎜ 0 ⎟ = α ⎜ 0 ⎟
x1 = α ∈ R ⎜ x ⎟ ⎜ − 2α ⎟ ⎜ − 2⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ 2 = 4 .

Para λ3 = −1 , tenemos
⎛ 1 0 − 2 0⎞ ⎛1 0 − 2 0⎞
⎜ ⎟ ⎜ ⎟
( A − λ3 I ) X 3 = 0 ⇒ ⎜ 0 − 1 0 0⎟ ( R3 + 2 R1 → R3) ⎜ 0 − 1 0 0 ⎟
⎜− 2 0 4 0 ⎟⎠ ⎜0 0 0 0 ⎟⎠
⎝ ⎝

IV-103
x1 = 2 x3 ⎛ x1 ⎞ ⎛ − 2α ⎞ ⎛ − 2⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ x2 = 0 ⇒ X 3 = ⎜ x2 ⎟ = ⎜ 0 ⎟ = α ⎜ 0 ⎟
x3 = α ∈ R ⎜x ⎟ ⎜ α ⎟ ⎜ 1 ⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ3 = −1 .

⎧⎛ 0 ⎞ ⎛ 1 ⎞ ⎛ − 2 ⎞⎫
⎪⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎪
El conjunto de vectores propios ⎨⎜ 1 ⎟, ⎜ 0 ⎟, ⎜ 0 ⎟⎬ es un conjunto ortogonal, entonces los
⎪⎜ 0 ⎟ ⎜ − 2 ⎟ ⎜ 1 ⎟⎪
⎩⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎭
normalizamos para obtener la matriz ortogonal, esto es,
⎛ 1 ⎞ ⎛ 2 ⎞
⎛ 0⎞ ⎛ 1 ⎞ ⎜ 5 ⎟ ⎛ − 2⎞ ⎜ − 5 ⎟
X ⎜ ⎟ X 1 ⎜ ⎟ ⎜ ⎟ X3 1 ⎜ ⎟ ⎜ ⎟
v1 = 1 = ⎜ 1 ⎟ , v1 = 2 = ⎜ 0 ⎟ = ⎜ 0 ⎟ y v1 = = ⎜ 0 ⎟=⎜ 0 ⎟
X1 ⎜ ⎟ X2 5⎜ ⎟ ⎜ 2 ⎟ X3 5⎜ ⎟ ⎜ 1 ⎟
⎝ 0⎠ ⎝ − 2⎠ ⎜ − ⎟ ⎝ 1 ⎠ ⎜ ⎟
⎝ 5 ⎠ ⎝ 5 ⎠
donde ahora los vectores v1 , v 2 y v3 son ortonormales, es decir, satisfacen las relaciones
⎧0 → i ≠ j
vi ⋅ v j = ⎨
⎩1 → i = j

Entonces la matriz ortogonal que diagonaliza a la matriz A , es


⎛ ⎞
⎛ 1 2 ⎞ ⎜ ⎟
⎜0 − ⎟ ⎜ 0 1 0 ⎟
⎜ 5 5⎟
−1 ⎜ 1 2 ⎟
P = ⎜1 0 0 ⎟ ⇒ P = P =⎜ T
0 − ⎟
⎜ 2 1 ⎟ ⎜ 5 5⎟
⎜0 − 5 ⎟
5 ⎠ ⎜− 2 1 ⎟
⎝ ⎜ 0 ⎟
⎝ 5 5 ⎠
de donde, tenemos que
⎛ ⎞
⎜ ⎟ ⎛ 1 2 ⎞
⎜ 0 1 0 ⎟⎛ 0 0 − 2 ⎞⎜ 0 − ⎟
⎜ 1 2 ⎟⎜ ⎟⎜ 5 5⎟
P −1 AP = P T AP = ⎜ 0 − ⎟⎜ 0 − 2 0 ⎟⎜ 1 0 0 ⎟
3 ⎟⎠⎜⎜ 0
⎜ 5 5 ⎟⎜ 2 1 ⎟
1 ⎟⎝ − 2 0 −
⎜− 2 0
⎜ ⎟ ⎝ 5 5 ⎟⎠
⎝ 5 5 ⎠

⎛ − 2 0 0 ⎞ ⎛ λ1 0 ⎞
0
⎜ ⎟ ⎜ ⎟
=⎜ 0 4 0 ⎟=⎜ 0 λ2 ⎟=D
0
⎜ 0 0 − 1⎟ ⎜ 0 λ3 ⎟⎠
⎝ ⎠ ⎝ 0

Por lo tanto, la matriz simétrica A es diagonalizable ortogonalmente.

IV-104
Tenemos algunas propiedades para la diagonalización de matrices simétricas,

a) Si en una matriz simétrica A , todos sus valores propios son distintos, entonces la matriz es
diagonalizable.

b) Si A es una matriz simétrica, entonces los vectores propios correspondientes a valores propios distintos
son ortogonales.

c) Toda matriz simétrica A siempre es diagonalizable por medio de una matriz ortogonal, es decir, A es
diagonalizable ortogonalmente.

A continuación presentaremos, con algunos ejemplos, casos particulares que se pueden presentar al realizar el
proceso de diagonalización de una matriz simétrica, estos casos se producen cuando existe una raíz o valor
propio con alguna multiplicidad.

Tenemos el caso cuando, la ecuación característica tiene raíces o valores propios λ j de multiplicidad m , que
generan m vectores propios ortogonales.

EJEMPLO: Considere la siguiente matriz simétrica, diagonalizarla ortogonalmente,


⎛1 2 0 0⎞
⎜ ⎟
⎜ 2 1 0 0⎟
A=⎜
0 0 1 2⎟
⎜ ⎟
⎜0 0 2 1⎟
⎝ ⎠
SOLUCIÓN: La ecuación característica de esta matriz esta dada por
1− λ 2 0 0
2 1− λ 0 0
f (λ ) = ( A − λ I ) = = (λ + 1) 2 (λ − 3) 2 = 0
0 0 1− λ 2
0 0 2 1− λ
cuyas raíces son los valores propios de la matriz A , estos son, λ1, 2 = −1 y λ3, 4 = 3 . Ambos
valores propios tienen multiplicidad igual a dos.
Determinemos ahora los vectores propios asociados a cada valor propio, sustituyendo los
valores propios en la ecuación homogénea, ( A − λ i ⋅ I n ) X i = 0
Para λ1, 2 = −1 , tenemos
⎛2 2 0 0 0⎞
⎜ ⎟
⎜2 2 0 0 0⎟ x1 = − x 2 = α ∈ R
( A − λ1, 2 I ) X 1, 2 = 0 ⇒ ⎜0 ⇒
⎜ 0 2 2 0 ⎟⎟ x3 = − x 4 = β ∈ R
⎜0 0 2 2 0 ⎟⎠

⎛ x1 ⎞ ⎛ α ⎞ ⎛1⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ x2 ⎟ ⎜ − α ⎟ ⎜ − 1⎟ ⎜ 0⎟
⇒ X 1, 2 = ⎜ ⎟ = ⎜ ⎟ = α⎜ ⎟ + β⎜ ⎟
x β 0 1
⎜ 3⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ x ⎟ ⎜− β ⎟ ⎜ 0⎟ ⎜ − 1⎟
⎝ 4⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ1, 2 = −1 .

IV-105
Para λ3, 4 = 3 , tenemos
⎛− 2 2 0 0 0⎞
⎜ ⎟
⎜ 2 −2 0 0 0⎟ x1 = x 2 = α ∈ R
( A − λ3, 4 I ) X 3, 4 = 0 ⇒ ⎜ 0 ⇒
⎜ 0 − 2 2 0 ⎟⎟ x3 = x 4 = β ∈ R
⎜ 0 0 2 − 2 0 ⎟⎠

⎛ x1 ⎞ ⎛ α ⎞ ⎛1⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ x2 ⎟ ⎜α ⎟ ⎜1⎟ ⎜ 0⎟
⇒ X 3, 4 = ⎜ ⎟ = ⎜ ⎟ = α ⎜ ⎟ + β ⎜ ⎟
x β 0 1
⎜ 3⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜β ⎟ ⎜ 0⎟ ⎜1⎟
⎝ 4⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ3, 4 = 3 .

Las dos raíces son de multiplicidad dos, pero cada una de ellas genera dos vectores ortogonales,
por lo tanto, la matriz A es diagonalizable ortogonalmente.

Cuando la ecuación característica genera raíces o valores propios λ j de multiplicidad m , y no se obtienen m


vectores propios ortogonales.

EJEMPLO: Considere la siguiente matriz simétrica, diagonalizarla ortogonalmente,


⎛ 0 3 3⎞
⎜ ⎟
A = ⎜ 3 0 3⎟
⎜ 3 3 0⎟
⎝ ⎠
SOLUCIÓN: La ecuación característica de esta matriz esta dada por
−λ 3 3
f (λ ) = ( A − λI ) = 3 − λ 3 = (λ − 6)(λ + 3) 2 = 0
3 3 −λ
cuyas raíces son los valores propios de la matriz A , estos son, λ1 = 6 y λ2,3 = −3 .
Tenemos que el valor propio λ = −3 tienen multiplicidad igual a dos.
Determinemos ahora los vectores propios asociados a cada valor propio, sustituyendo los
valores propios en la ecuación homogénea, ( A − λ i ⋅ I n ) X i = 0

Para λ1 = 6 , tenemos
⎛− 6 3 3 0⎞ x1 = x 2
⎜ ⎟
( A − λ1 I ) X 1 = 0 ⇒ ⎜ 3 − 6 3 0⎟ ⇒ x 2 = x3
⎜ 3 3 − 6 0 ⎟⎠
⎝ x3 = α ∈ R
⎛ x1 ⎞ ⎛ α ⎞ ⎛ 1⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ X 1 = ⎜ x 2 ⎟ = ⎜ α ⎟ = α ⎜ 1⎟
⎜ x ⎟ ⎜α ⎟ ⎜ 1⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ1 = 6 .

IV-106
Para λ 2,3 = −3 , tenemos
⎛3 3 3 0⎞ x1 = − x 2 − x3
⎜ ⎟
( A − λ 2,3 I ) X 2,3 = 0 ⇒ ⎜3 3 3 0⎟ ⇒ x2 = α ∈ R
⎜3 3 3 0⎟
⎝ ⎠ x3 = β ∈ R
⎛ x1 ⎞ ⎛ − α − β ⎞ ⎛ − 1⎞ ⎛ − 1⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⇒ X 2,3 = ⎜ x 2 ⎟ = ⎜ α ⎟ = α ⎜ 1 ⎟ + β ⎜ 0 ⎟
⎜x ⎟ ⎜ β ⎟ ⎜ 0⎟ ⎜1⎟
⎝ 3⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
son los vectores propios de A , asociados al valor propio λ2,3 = −3 .

Observamos lo siguiente, los vectores propios asociados a λ1 = 6 son ortogonales con los
vectores propios asociados a λ 2,3 = −3 , esto es,
(1,1,1) ⋅ (−1,1,0) = 0 y (1,1,1) ⋅ (−1,0,1) = 0
pero los vectores asociados solamente a λ 2,3 = −3 no son ortogonales entre si,
(−1,1,0) ⋅ (−1,0,1) = 1
En este caso, se aplica el proceso de ortogonalización de Gram-Schmidt a estos dos
vectores, los generados por el valor propio λ 2,3 = −3 , resultando ahora,
(−1,1,0) y (−1 / 2,−1 / 2,1) ,
que junto con el vector
(1,1,1) ,
tenemos los tres vectores ortogonales.

Por lo tanto la matriz A es diagonalizable ortogonalmente.

IV-107
FORMAS CUADRÁTICAS Y SECCIONES CÓNICAS

En esta sección, aplicaremos la diagonalización de matrices ortogonales para obtener información a cerca de las
gráficas de ecuaciones cuadráticas, también veremos como estas forma cuadráticas nos sirven para describir
secciones cónicas tales como; círculos, elipses, hipérbolas, etc., en el plano R 2 (recordemos que una sección
cónica se obtiene intersectando un cono con un plano). Estos conceptos pueden ser generalizados de tal manera
que se puedan aplicar para obtener superficies cuadráticas en el espacio tridimensional R 3 .

Consideremos las siguientes ecuaciones cuadráticas, cuya forma mas general es,
ax 2 + by 2 + cxy + dx + ey + f = 0
ax 2 + by 2 + cz 2 + dxy + exz + fyz + gx + hy + kz + l = 0
a este tipo de ecuaciones se les llama formas cuadráticas, de dos y tres variables respectivamente. Son de gran
importancia por su aplicación en muchas áreas del conocimiento.

En nuestro caso, estudiaremos este tipo de ecuaciones por que tienen la propiedad o característica de que, ellas
tienen una representación matricial, mas específicamente, se pueden representar como un producto de matrices.
Consideraremos solamente los términos cuadráticos en la ecuación.

EJEMPLO: Obtener la representación matricial de la forma cuadrática siguiente,


3x 2 + 7 y 2 − 2 xy = 0
SOLUCIÓN: Tenemos que esta forma cuadrática se puede expresar como,
3 − 1⎞⎛ x ⎞
(x y )⎛⎜⎜ ⎛ x⎞
⎟⎟⎜⎜ ⎟⎟ = (3 x − y − x + 7 y )⎜⎜ ⎟⎟ = 3 x 2 − xy − xy + 7 y 2 = 3 x 2 + 7 y 2 − 2 xy = 0
⎝ − 1 7 ⎠⎝ y ⎠ ⎝ y⎠
o bien, otra forma alternativa
3 − 2 ⎞⎛ x ⎞
(x y )⎛⎜⎜ ⎛ x⎞
⎟⎟⎜⎜ ⎟⎟ = (3 x − 2 x + 7 y )⎜⎜ ⎟⎟ = 3 x 2 + 7 y 2 − 2 xy = 0
⎝ 0 7 ⎠⎝ y ⎠ ⎝ y⎠

En el ejemplo anterior observamos dos maneras distintas de representar matricialmente a una forma cuadrática,
pero una de esas representaciones tiene la particularidad de contener una matriz simétrica. Esta representación, a
través de una matriz simétrica es la que en adelante consideraremos, debido a sus propiedades o características
particulares que analizamos en la sección anterior.

Entonces tenemos que, una forma cuadrática de n variables es una trasformación g ( X ) : R n → R definida
como,
g ( X ) = X T AX
donde A es una matriz simétrica de tamaño n × n asociada a la forma cuadrática y X ∈ R n , esto es,
⎛ x1 ⎞
⎜ ⎟
⎜ x2 ⎟
X = ⎜ ⎟ ⇒ X T = ( x1 x 2 L x n ) , con x1 , x 2 ,..., x n las variables de la ecuación cuadrática.
M
⎜ ⎟
⎜x ⎟
⎝ n⎠

Una de las razones principales de que preferimos la matriz simétrica en una forma cuadrática, es que esta matriz
se puede diagonalizar ortogonalmente. En general toda forma cuadrática de n variables tiene luna
representación matricial la cual contiene una matriz simétrica.

IV-108
Para las formas cuadráticas de dos y tres variables, tenemos que en general su representación matricial, solo de
los términos cuadráticos, estará dada por,
⎛ c⎞
⎜a ⎟
g ( X ) = ax 2 + by 2 + cxy = (x y )⎜ 2 ⎟⎛⎜ x ⎞⎟
⎜ c b ⎟⎜⎝ y ⎟⎠
⎜ ⎟
⎝2 ⎠
y
⎛ d e⎞
⎜a ⎟
⎜ 2 2 ⎟⎛ x ⎞
f ⎟⎜ ⎟
g ( X ) = ax + by + cz + dxy + exz + fyz = ( x y z )⎜
2 2 2 d
⎜2
b ⎜ y⎟ .
2 ⎟⎜ ⎟
⎜e f ⎟⎝ z ⎠
⎜ c⎟
⎝2 2 ⎠

En general, a una ecuación cuadrática de dos variables g ( x, y ) = ax 2 + by 2 + cxy , que no contenga términos no
cuadráticos o lineales, se le puede asociar una sección cónica, y si el término cruzado es cero, c = 0 , entonces la
ecuación g ( x, y ) = ax 2 + by 2 = 1 , representa en general una elipse o una hipérbola.

La representación geométrica de una forma cuadrática de dos variables sin términos cruzados, cxy = 0 , en
general es una elipse o una hipérbola en su forma canónica, esto es, con sus ejes principales sobre los
ejes coordenados x y y . (Figuras XII-1).

x2 y2 x2 y2
Elipse: + =1 Hipérbola: − =1
a2 b2 a2 b2
Figuras XII-1

Para este caso, la matriz asociada a la forma cuadrática es una matriz diagonal,
⎛ a 0⎞
g (x, y ) = ax 2 + by 2 = ⎜⎜ ⎟⎟
⎝0 b⎠

IV-109
Finalmente, dentro de este caso de dos variables, sin términos cruzado, tenemos la forma cuadrática donde
a = b = 1 ,esto es, g (x, y ) = x 2 + y 2 = r 2 la cual corresponde a la sección cónica de un círculo con centro
en el origen (Figura XII-2).

Figura XII-2. Círculo: x 2 + y 2 = r 2

Si la forma cuadrática tiene un término cruzado, esto es, de la forma g (x, y ) = ax 2 + by 2 + cxy , entonces los ejes
de la sección cónica correspondiente no concuerdan con los ejes coordenados, incluso la elipse o hipérbola
puede estar girada cierto ángulo respecto a los ejes de coordenadas.

Por otra parte, la matriz asociada para este caso no será una matriz diagonal, pero mediante un cambio de
coordenadas, diagonalización de la matriz, podemos obtener nuevas variables en donde la forma cuadrática este
en forma canónica, es decir no contenga términos cruzados o mezclados, simplificando con esto su
representación geométrica.

Veamos la manera de hacer este cambio de variable para obtener formas cuadráticas sin términos cruzado, o
equivalentemente, para diagonalizar su matriz asociada, recordando que esta matriz siempre es simétrica.

Consideremos una forma cuadrática general dada por la ecuación matricial, g ( X ) = X T AX , cuyas variables son
x1 , x 2 ,…, x n . Necesitamos hacer un cambio de variable de tal forma que la nueva forma cuadrática no contenga
términos mezclados o cruzado, es decir, que la matriz asociada A se diagonal, sean y1 , y 2 ,…, y n las nuevas
variables que cumplen con esta condición.

Supongamos que el cambio de coordenadas lo podemos realizar mediante una matriz ortogonal P , esto es,
⎛ x1 ⎞ ⎛ y1 ⎞
⎜ ⎟ ⎜ ⎟
⎜ x2 ⎟ ⎜ y2 ⎟
X = P ⋅ Y donde X = ⎜ ⎟ , Y = ⎜ ⎟
M M
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜y ⎟
⎝ n⎠ ⎝ n⎠
entonces para la ecuación cuadrática tenemos,
( )
g ( X ) = X T ⋅ A ⋅ X = (PY ) A(PY ) = Y T P T AP Y = Y T DY
T

donde
D = P T AP = P −1 AP
es una matriz diagonal.

IV-110
En otras palabras, para eliminar los términos cruzados en una forma cuadrática g ( X ) = X T AX , tenemos que
diagonalizar ortogonalmente la matriz simétrica asociada a la forma cuadrática A . La matriz ortogonal P , la
cual esta formada por los vectores propios de la matriz A , será la que usaremos para obtener las nuevas
coordenadas donde la sección cónica correspondiente esta en forma canónica. Además la matriz P es la que
diagonaliza a la matriz A .

Observamos que la nueva forma cuadrática h(Y ) , obtenida al eliminar los términos cruzados de la forma
cuadrática g ( X ) esta dada por, h(Y ) = Y T DY .

De esta forma tenemos las siguientes definiciones:

a) Si A y B son dos matrices de tamaño n × n , decimos que B es congruente con A si ambas matrices
cumplen que,
B = P T AP
b) Dos formas cuadráticas g ( X ) y h(Y ) , con matrices simétricas asociadas A y B , respectivamente, son
equivalentes si A y B son congruentes.

Dos formas cuadráticas son equivalentes en el sentido geométrico, de que representan a la misma sección cónica,
salvo que por algún desplazamiento y por alguna rotación de una con respecto de la otra. Recordando que la
forma cuadrática que ya no contiene términos cruzados es mucho más fácil de visualizar geométricamente, que
es la idea principal de eso.

Teorema de los Ejes Principales

Cualquier forma cuadrática en n variables g ( X ) = X T AX es equivalente, mediante una matriz ortogonal P , a


una forma cuadrática de la forma
h( X ' ) = λ1 x1′ + λ 2 x ′2 + ... + λ n x n′
2 2 2

donde λ1 , λ 2 ,…, λ n son los valores propios asociados a la matriz A .

Se dice que se realiza una diagonalización ortogonal de una forma cuadrática, ya que se hace un cambio de
variables mediante una transformación ortogonal X = PX ′ , P es ortogonal. Este tipo de transformaciones
conserva las longitudes y las direcciones de cualquier vector transformado, por lo tanto, las secciones cónicas y
superficies, también se conservan mediante una transformación de este tipo.

EJEMPLO: Obtener una forma cuadrática equivalente a g ( X ) e identificar la sección cónica , si


g ( X ) = g ( x, y ) = 2 x 2 + 2 y 2 + 2 xy

SOLUCIÓN: Representemos matricialmente esta ecuación cuadrática, esto es,


⎛ 2 1 ⎞⎛ x ⎞
g ( X ) = g ( x, y ) = 2 x 2 + 2 y 2 + 2 xy = (x y )⎜⎜ ⎟⎟⎜⎜ ⎟⎟
⎝ 1 2 ⎠⎝ y ⎠
Entonces la matriz asociada a esta forma cuadrática es,
⎛2 1⎞
A = ⎜⎜ ⎟⎟
⎝1 2⎠

IV-111
la cual tenemos que diagonalizar ortogonalmente, de manera que los valores propios se
obtienen de las raíces de la ecuación característica,
2−λ 1
f (λ ) = A − λ I = = (2 − λ ) 2 − 1 = (λ − 3)(λ − 1) = 0
1 2−λ
las cuales son: λ1 = 3 y λ 2 = 1 .
Los vectores característicos son,

Para λ1 = 3 ,
⎛ − 1 1 0⎞ ⎛ x ⎞ ⎛α ⎞ ⎛ 1⎞
( A − λ1 I )X 1 = 0 ⇒ ⎜⎜ ⎟ ⇒ x = y = α ∈ R ⇒ X1 = ⎜ ⎟ = ⎜ ⎟ = α⎜ ⎟
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 1⎟
⎝ 1 − 1 0⎠ ⎝ y ⎠ ⎝α ⎠ ⎝ ⎠

Para λ 2 = 1 ,
⎛1 1 0 ⎞ ⎛ x⎞ ⎛−α ⎞ ⎛ − 1⎞
( A − λ 2 I )X 2 = 0 ⇒ ⎜⎜ ⎟
⎟ ⇒ x = − y = α ∈ R ⇒ X 2 = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = α ⎜⎜ ⎟⎟
⎝1 1 0 ⎠ ⎝ y⎠ ⎝ α ⎠ ⎝ 1⎠

Los vectores propios son ortogonales, ahora los normalizamos,


⎛ 1 ⎞ ⎛ 1 ⎞
⎜ ⎟ ⎜− ⎟
u1 = ⎜ 2 ⎟ y u 2 = ⎜ 2⎟
⎜ 1 ⎟ ⎜ 1 ⎟
⎜ ⎟ ⎜ ⎟
⎝ 2⎠ ⎝ 2 ⎠

finalmente con ellos construimos la matriz P que diagonaliza a la matriz A , esto es,
⎛ 1 1 ⎞
⎜ − ⎟
P= ⎜ 2 2 ⎟
⎜ 1 1 ⎟
⎜ ⎟
⎝ 2 2 ⎠
la cual, como sabemos tiene la propiedad de que,

⎛ 1 1 ⎞ ⎛ 1 1 ⎞
⎜ ⎟ 1 2 ⎜ − ⎟
D = P T AP = ⎜ 2

2 ⎟⎜ ⎞
⎟⎜ 2 2 ⎟ = ⎛⎜ 3 0 ⎞⎟ = ⎛⎜ λ1 0⎞
⎟.
⎜ 1 1 ⎟⎜⎝ 2 1 ⎟⎠⎜ 1 1 ⎟ ⎜⎝ 0 1 ⎟⎠ ⎜⎝ 0 λ 2 ⎟⎠
⎜− ⎟ ⎜ ⎟
⎝ 2 2⎠ ⎝ 2 2 ⎠

Esto significa que las matrices A y D son congruentes ya que D = P T AP , entonces


obtenemos la forma cuadrática equivalente a mediante,

⎛ 3 0 ⎞⎛ x ' ⎞ ⎛ x' ⎞
h( X ′) = h( x' y ' ) = X ′ T DX ′ = ( x ' y ')⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = (3 x' y ')⎜⎜ ⎟⎟ = 3 x' 2 + y ' 2
⎝ 0 1 ⎠⎝ y ' ⎠ ⎝ y'⎠

la cual, como era de esperar, ya no contiene términos cruzados.

Donde g ( X ) = g ( x, y ) es equivalente a h( X ′) = h( x ' , y ' ) .

IV-112
Ahora identifiquemos la cónica

g ( X ) = g ( x, y ) = 2 x 2 + 2 y 2 + 2 xy = 1 ó h( X ′) = h(x' y ') = 3 x ' 2 + y ' 2 = 1

Podemos observar fácilmente, de la segunda forma cuadrática, que se trata de una elipse, con
el diámetro mayor sobre el eje y .

IV-113

Вам также может понравиться