Вы находитесь на странице: 1из 519

Carlos Ivorra Castillo

ALGEBRA
Mathematics, rightly viewed, possesses not only
truth, but supreme beauty a beauty cold and aus-
tere, like that of sculpture.
Bertrand Russell
Indice General

Preambulo ix

Introduccion xiii

Captulo I: El lenguaje de la teora de conjuntos 1


1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Los axiomas de la teora de conjuntos . . . . . . . . . . . . . . . 3
1.3 Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Los numeros naturales . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Relaciones de orden . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.6 Conjuntos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.7 Productos cartesianos . . . . . . . . . . . . . . . . . . . . . . . . 39
1.8 Relaciones de equivalencia . . . . . . . . . . . . . . . . . . . . . . 42

Captulo II: Anillos 45


2.1 Leyes de composicion interna . . . . . . . . . . . . . . . . . . . . 45
2.2 Los numeros enteros . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.3 Conceptos basicos sobre anillos . . . . . . . . . . . . . . . . . . . 57
2.4 Cuerpos de cocientes. Numeros racionales . . . . . . . . . . . . . 65
2.5 Anillos de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.6 Apendice: Sumas y productos finitos . . . . . . . . . . . . . . . . 81

Captulo III: Aritmetica en dominios ntegros 87


3.1 Ideales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.2 Divisibilidad en dominios ntegros . . . . . . . . . . . . . . . . . . 93
3.3 Ideales y divisibilidad . . . . . . . . . . . . . . . . . . . . . . . . 97
3.4 Divisibilidad en Z . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.5 Divisibilidad en anillos de polinomios . . . . . . . . . . . . . . . . 103
3.6 Congruencias y anillos cociente . . . . . . . . . . . . . . . . . . . 111
3.7 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Captulo IV: Algunas aplicaciones 133


4.1 Numeros perfectos . . . . . . . . . . . . . . . . . . . . . . . . . . 133
4.2 Primos de Fermat . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.3 Ternas pitagoricas . . . . . . . . . . . . . . . . . . . . . . . . . . 140

v
vi INDICE GENERAL

4.4 Sumas de cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . 142


4.5 El Ultimo Teorema de Fermat . . . . . . . . . . . . . . . . . . . . 146

Captulo V: Modulos y espacios vectoriales 155


5.1 Modulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.2 Suma de modulos . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.3 Modulos libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5.4 Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
5.5 Modulos finitamente generados sobre DIPs . . . . . . . . . . . . . 180
5.6 Apendice: Espacios vectoriales de dimension infinita . . . . . . . 193

Captulo VI: Grupos 195


6.1 Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6.2 Grupos de permutaciones . . . . . . . . . . . . . . . . . . . . . . 204
6.3 Subgrupos normales . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.4 Producto de grupos . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.5 Grupos cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
6.6 Las unidades de Z/nZ. . . . . . . . . . . . . . . . . . . . . . . . . 224
6.7 Grupos alternados . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6.8 p-grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
6.9 Los teoremas de Sylow . . . . . . . . . . . . . . . . . . . . . . . . 231

Captulo VII: Extensiones de cuerpos 235


7.1 Extensiones algebraicas . . . . . . . . . . . . . . . . . . . . . . . 235
7.2 Extensiones normales . . . . . . . . . . . . . . . . . . . . . . . . . 245
7.3 Extensiones separables . . . . . . . . . . . . . . . . . . . . . . . . 248
7.4 Normas y trazas . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
7.5 La teora de Galois . . . . . . . . . . . . . . . . . . . . . . . . . . 259
7.6 Cuerpos algebraicamente cerrados . . . . . . . . . . . . . . . . . 264
7.7 Cuerpos formalmente reales . . . . . . . . . . . . . . . . . . . . . 269
7.8 Extensiones ciclotomicas . . . . . . . . . . . . . . . . . . . . . . . 277

Captulo VIII: Algebra lineal 283


8.1 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
8.2 Clasificacion de homomorfismos de modulos . . . . . . . . . . . . 295
8.3 Clasificacion de endomorfismos . . . . . . . . . . . . . . . . . . . 302
8.4 Formas bilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
8.5 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321

Captulo IX: Resolucion de ecuaciones por radicales 327


9.1 Polinomios simetricos . . . . . . . . . . . . . . . . . . . . . . . . 327
9.2 La resultante de dos polinomios . . . . . . . . . . . . . . . . . . . 331
9.3 El grupo de Galois de un polinomio . . . . . . . . . . . . . . . . . 335
9.4 Ecuaciones cubicas . . . . . . . . . . . . . . . . . . . . . . . . . . 341
9.5 Ecuaciones cuarticas . . . . . . . . . . . . . . . . . . . . . . . . . 347
9.6 Grupos resolubles . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
9.7 Extensiones radicales . . . . . . . . . . . . . . . . . . . . . . . . . 358
INDICE GENERAL vii

9.8 Apendice: La trascendencia de e y . . . . . . . . . . . . . . . . 366

Captulo X: Enteros algebraicos 375


10.1 La forma bilineal asociada a la traza . . . . . . . . . . . . . . . . 375
10.2 Anillos de enteros algebraicos . . . . . . . . . . . . . . . . . . . . 377
10.3 Divisibilidad en anillos de enteros . . . . . . . . . . . . . . . . . . 388
10.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400

Captulo XI: Factorizacion ideal 407


11.1 Dominios de Dedekind . . . . . . . . . . . . . . . . . . . . . . . . 408
11.2 El grupo de clases . . . . . . . . . . . . . . . . . . . . . . . . . . 421
11.3 El teorema de Kummer . . . . . . . . . . . . . . . . . . . . . . . 423

Captulo XII: Factorizacion en cuerpos cuadraticos 431


12.1 Los primos cuadraticos . . . . . . . . . . . . . . . . . . . . . . . . 431
12.2 La finitud del grupo de clases . . . . . . . . . . . . . . . . . . . . 434
12.3 Calculo del numero de clases . . . . . . . . . . . . . . . . . . . . 437
12.4 Los teoremas de Euler . . . . . . . . . . . . . . . . . . . . . . . . 450
12.5 La ley de reciprocidad cuadratica . . . . . . . . . . . . . . . . . . 453
12.6 El smbolo de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . 459

Captulo XIII: Complementos sobre cuerpos 465


13.1 Cuerpos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
13.2 El teorema de la base normal . . . . . . . . . . . . . . . . . . . . 472
13.3 Extensiones inseparables . . . . . . . . . . . . . . . . . . . . . . . 474
13.4 Extensiones trascendentes . . . . . . . . . . . . . . . . . . . . . . 477

Apendice A: El axioma de eleccion 485

Apendice B: Conjuntos infinitos 491

Bibliografa 499

Indice de Materias 500


Preambulo

Este libro es una version extendida de mi libro original del mismo ttulo.
Ademas de haber anadido bastante material nuevo, otra diferencia sustancial
respecto de la version anterior es que ahora las nuevas versiones de los libros
Algebra [Al], Geometra [G] y Analisis matematico [An] estan concebidas para
ser ledas simultaneamente, mientras que las anteriores podan leerse sucesiva-
mente en el orden indicado. Esto ha hecho que parte del material original haya
pasado de un libro a otro en las versiones nuevas.
Mas concretamente, si los captulos de los tres libros se leen de arriba hacia
abajo y de izquierda a derecha segun la disposicion de la tabla de la pagina
siguiente, cada uno solo requiere el conocimiento de los captulos precedentes,
salvo por unas pocas excepciones indicadas despues de la tabla. Consideramos
que este orden es mucho mas natural en la medida en que imita lo que sera el
estudio simultaneo de tres asignaturas y se aprovecha dicha simultaneidad para
enfatizar las relaciones entre ellas.
El libro [An] es el unico que no cubre todos los contenidos de la version
anterior, sino que los ultimos captulos de dicha version seran tratados en nuevas
versiones de mi serie de libros, empezando por el de Geometra diferencial.
El primer captulo de [Al] es una introduccion a la teora de conjuntos, cuyos
aspectos mas tecnicos (los relacionados con el axioma de eleccion y la teora de
cardinales infinitos) se han relegado a dos apendices. La teora descrita es la
teora de Zermelo, que resulta mas que suficiente para formalizar los contenidos
de los tres libros. El unico inconveniente es que se queda corta para desarro-
llar plenamente la teora de cardinales infinitos, pero hemos preferido reducirla
a lo imprescindible, aun al precio de no poder enunciar con total precision al-
gunos resultados sobre rango y dimension de modulos y espacios vectoriales
de dimension infinita que, aunque resulta natural presentarlos al tratar estos
conceptos, no son realmente necesarios en ningun momento.
Los contenidos de [Al I] (y sus apendices) sirven de base a los tres libros.
A su vez, los captulos [G II] y [An I] se apoyan en las estructuras algebraicas
introducidas en [Al II]. En estos dos captulos se presentan dos construcciones
alternativas de los numeros reales, mediante secciones de Dedekind en [G II] y
mediante sucesiones de Cauchy en [An I]. Por otra parte, el captulo [An II] se
apoya en la geometra analtica expuesta en [G IV].

ix
x Preambulo

Algebra Geometra Analisis


Al I
Preliminares
Al II GI
Anillos Geometra absoluta
Al III G II An I
Aritmetica Geometra arquimediana Numeros reales
Al IV G III
Aplicaciones Geometra eucldea
Al V G IV An II
Modulos Geometra analtica Topologa
Al VI GV An III
Grupos Complejos y cuaternios Compacidad, . . .
Al VII G VI An IV
Cuerpos Regla y compas Calculo una variable
Al VIII G VII An V
Algebra lineal Biyecciones afines Calculo varias variables
Al IX G VIII An VI
Ecuaciones Geometra afn Variedades
Al X G IX An VII
Enteros algebraicos Geometra proyectiva Ecuaciones diferenciales
Al XI GX An VIII
Enteros cuadraticos Conicas Medida I
Al XII G XI An IX
Factorizacion ideal Geometra parabolica Medida II
Al XIII G XII An Ap A
Complementos Geometra hiperbolica Complecion de un e.m.
Al Ap A G XIII An Ap B
Ax. de eleccion Geometra elptica Fracciones continuas
Al Ap B An Ap C
Conjuntos infinitos Dinamica clasica

Las unicas dependencias que no respetan el orden indicado en la tabla pre-


cecente son las siguientes:

La seccion [G 7.7] usa la medida de Jordan definida en [An 9.1], pero dicha
seccion puede leerse antes de [G 7.7], pues no requiere nada intermedio.

El captulo [An VII] usa en un ejemplo las conicas definidas en la seccion


[G 10.1], pero esta seccion (no ya el resto del captulo) puede leerse tras
[G IV] y resulta incluso recomendable hacerlo, como ilustracion de las
posibilidades de la geometra analtica.

Las lneas horizontales en la tabla separan bloques tematicos. El segundo


bloque de [Al], despues del captulo de preliminares conjuntistas al que ya hemos
hecho referencia, contiene una presentacion de la aritmetica basica desde el
punto de vista del algebra abstracta, junto con aplicaciones que conectan este
xi

enfoque abstracto con resultados clasicos. En el tercer bloque se introducen


nuevas estructuras abstractas con resultados que se aplican principalmente a
la geometra (en [G]) y a la aritmetica en el cuarto bloque, que contiene una
introduccion a la teora algebraica de numeros. El libro termina con un captulo
en el que se recopilan algunos resultados que no han sido necesarios en los
captulos precedentes pero que son relevantes de cara a estudios mas avanzados.
El primer bloque de [G] contiene un tratamiento axiomatico de la geometra
eucldea, el segundo desarrolla los elementos basicos de la geometra analtica,
el tercero esta dedicado a la geometra proyectiva y el cuarto a las geometras
no eucldeas.
Por ultimo, [An] esta dividido en tres bloques, dedicados respectivamente
a la topologa, al calculo diferencial y al calculo integral. El libro termina
con tres apendices, el primero de los cuales es una prolongacion tecnica del
captulo [An I] con material que no es necesario para los captulos posteriores,
el segundo expone la teora de las fracciones continuas, en la que se combinan
aspectos aritmeticos con aspectos topologicos y, por ultimo, hemos considerado
oportuno incluir un resumen de la dinamica clasica que puede servir al lector
para asimilar mejor las numerosas aplicaciones a la fsica presentadas en el libro.
En realidad, todos los conceptos fsicos involucrados se van explicando en los
propios ejemplos a medida que van siendo necesarios, pero tal vez el lector no
familiarizado con la fsica prefiera una exposicion concentrada en unas pocas
paginas que le sirva de referencia.
Introduccion

Aunque en muchas culturas de la antiguedad es posible encontrar conoci-


mientos matematicos no triviales, las primeras teoras matematicas sofisticadas,
con muchos aspectos en comun con las matematicas tal y como las entendemos
hoy en da, las encontramos en la cultura griega clasica. Las matematicas grie-
gas eran esencialmente aritmetica (el estudio de los numeros) y geometra (el
estudio de las formas geometricas). No eran para ellos disciplinas independien-
tes, pues la concepcion griega de la aritmetica era esencialmente geometrica:
las operaciones entre numeros las conceban geometricamente como relaciones
entre longitudes, areas y volumenes. Sin embargo, con el tiempo esta relacion se
invirtio, pues durante la Edad Media la aritmetica evoluciono para convertirse
en Algebra, y posteriormente los matematicos fueron constatando de forma pau-
latina que gran parte de la geometra griega poda entenderse como una forma
de algebra (geometra analtica), y el resto como algebra combinada con analisis
matematico (geometra diferencial).
En que consiste esta evolucion de la aritmetica hacia el algebra? En reali-
dad no hay una frontera definida entre la aritmetica y la llamada algebra
elemental, pero la idea basica es que el algebra opera con numeros indeter-
minados. Obviamente los griegos ya razonaban con numeros indeterminados,
pero el algebra incluye un lenguaje adecuado para tal fin y una serie de tecnicas
generales expresables en dicho lenguaje. Por ejemplo, los griegos ya saban re-
solver lo que en el lenguaje algebraico moderno se llaman ecuaciones de segundo
grado, pero las expresiones

2 b b2 4ac
ax + bx + c = 0 y x=
2a
son expresiones algebraicas modernas, al igual que las tecnicas que permiten
pasar de la primera expresion a la segunda. De hecho, la palabra algebra
procede de las palabras al-yarabi que aparecen en el ttulo del tratado Al-
kitab al-mukhtas.ar f h.isab al-yarabi wal-muqabala (compendio de calculo por
reintegracion y sustitucion) del matematico persa Muhammad ibn Musa al-
Jwarizmi, escrito hacia el ano 820 d.C., y que contiene tecnicas sistematicas
para resolver ecuaciones de primer y segundo grado.
Bastan los elementos del algebra elemental para algebrizar la geometra,
de modo que los puntos del plano o del espacio pueden identificarse con pares o
ternas de numeros, y las rectas, los planos y las curvas se identifican a su vez con

xiii
xiv Introduccion

ecuaciones o sistemas de ecuaciones que caracterizan sus puntos. Esto permite


reducir problemas geometricos a problemas puramente algebraicos, consistentes
en analizar si determinados sistemas de ecuaciones tienen o no solucion, etc.
Pero el paso que convirtio al algebra en lo que actualmente se entiende como
tal, lo que mas especficamente se conoce como algebra abstracta, consistio
en pasar de operar con cantidades indeterminadas a estudiar operaciones inde-
terminadas, es decir, a estudiar expresiones algebraicas como xy 5 + x en las que
no solo x e y son indeterminadas, sino tambien las operaciones + y que se
realizan entre ellas.
En efecto, el algebra abstracta estudia las llamadas estructuras algebraicas,
que consisten en conjuntos cuyos elementos pueden ser de cualquier naturaleza
(no necesariamente numeros) en los que hay definidas unas operaciones indeter-
minadas a las que solo se les exige que cumplan ciertas propiedades basicas que
definen cada tipo de estructura (grupos, anillos, cuerpos, espacios vectoriales,
modulos etc.) Comprender cabalmente el algebra abstracta requiere compren-
der, entre otras cosas, que este proceso de abstraccion no es gratuito ni arbi-
trario, sino que, por el contrario, pensar en terminos de estructuras abstractas
es la llave hacia una comprension mucho mas profunda de muchos resultados
concretos de la aritmetica, la geometra y de muchas otras ramas de la ma-
tematica, muy distantes de estas. Algunos argumentos que en terminos del
algebra elemental pueden ser muy laboriosos y difciles de recordar pueden sus-
tituirse por otros conceptualmente muy simples en los que intervienen de forma
esencial conceptos abstractos. En otros casos, tratar de encontrar un argumento
elemental es sencillamente descabellado, y entonces las tecnicas abstractas re-
sultan imprescindibles.
Un ejemplo famoso que ilustra este hecho es el llamado Ultimo Teorema
de Fermat, que es la afirmacion segun la cual la ecuacion xn + y n = z n , para
cualquier numero natural n > 2, no admite soluciones enteras en las que los
tres numeros x, y, z sean no nulos. Nadie conoce una demostracion elemental
de este hecho, y la unica prueba conocida requiere un uso del algebra abstracta
que supera con creces a los contenidos de este libro. Aqu probaremos algunos
casos particulares de este teorema (para determinados valores de n) junto con
otros ejemplos y aplicaciones mas elementales que, no obstante, permitan al
lector percibir los nexos existentes entre las estructuras algebraicas abstractas
y las situaciones concretas, tanto algebraicas como geometricas, que justifican
su interes y su utilidad, si bien el amplio espectro de aplicaciones del algebra
abstracta trasciende tambien con creces la pequena muestra que daremos aqu.
Puesto que el algebra abstracta trata con conjuntos abstractos, el rigor ma-
tematico aconseja dedicar un primer captulo y as lo hemos hecho a la
teora de conjuntos, en el que introducimos los elementos y conceptos basicos
del lenguaje conjuntista sobre el cual se pueden fundamentar todas las ramas
de la matematica.
Captulo I

El lenguaje de la teora de
conjuntos

Es habitual distinguir distintas ramas o especialidades dentro de la ma-


tematica segun sus objetos de estudio respectivos, como el algebra, la geometra,
la topologa, el analisis matematico, etc. Ninguna de ellas puede considerarse
aislada y claramente delimitada de las restantes, sino que todas tienen multiples
conexiones e interrelaciones. En principio, la teora de conjuntos es una mas de
estas ramas, la que tiene por objeto el estudio de los conjuntos en general.
Sin embargo, el lenguaje que los matematicos han desarrollado para el estudio
de los conjuntos en general ha resultado ser el mas adecuado para expresar con
claridad y precision los conceptos y resultados de todas las demas ramas de la
matematica, y los hechos mas elementales de la teora de conjuntos han resul-
tado ser el punto de partida idoneo para todas ellas. Es por ello que dedicamos
este primer captulo a introducir el lenguaje, los conceptos y los resultados mas
elementales de la teora de conjuntos, a modo de base sobre la cual presenta-
remos en los captulos siguientes los resultados algebraicos que constituyen el
autentico objeto de este volumen.

1.1 Conjuntos
Toda la matematica puede construirse a partir de dos conceptos fundamen-
tales: el concepto de conjunto y el de pertenencia. Cuando decimos que son
conceptos fundamentales (o primitivos) queremos decir que no es posible dar
definiciones operativas de estos conceptos, es decir, definiciones a partir de las
cuales podamos deducir logicamente sus propiedades, como sucede con cual-
quier concepto matematico que no sea uno de estos dos. Si intentamos dar
una definicion de conjunto, lo maximo que podemos decir es que un con-
junto es una coleccion de objetos, y esto no es operativo porque conjunto y
coleccion son sinonimos, con lo que realmente no hemos definido nada. Aun
as, con esta definicion obtenemos una idea informal de lo que pretendemos

1
2 Captulo 1. El lenguaje de la teora de conjuntos

que sea un conjunto en el sentido tecnico especfico que tiene esta palabra en
matematicas, idea que podemos terminar de perfilar con algunos ejemplos:

Ejemplos Si escribimos A = {a, b, c}, entenderemos que A es un conjunto que


tiene tres1 elementos a, b, c. Para expresar que a es uno de los elementos del
conjunto A escribiremos2 a A, y leeremos el elemento a pertenece al conjunto
A. Por el contrario, si d es un elemento distinto de a, b y c, escribiremos
d / A para indicar que el elemento d no pertenece al conjunto A. Con esto
hemos introducido el segundo (y ultimo) concepto fundamental de la teora de
conjuntos, la relacion de pertenencia.
Hay que precisar que, aunque hayamos definido un conjunto como una
coleccion de elementos, no hay que entender de ah que todo conjunto deba
tener al menos un elemento. Al contrario, vamos a admitir la existencia de un
conjunto vaco, que representaremos por , determinado por la propiedad de
no tener elementos. Podemos pensar que un conjunto es como una bolsa, que
es susceptible de contener elementos, pero que nada impide que este vaca.
Es muy importante tener presente que el concepto matematico de conjunto
permite que unos conjuntos sean a su vez elementos de otros conjuntos. Por
ejemplo, el conjunto B = {a, {b, c}} no debe ser confundido con el conjunto
A anterior. Si suponemos que a, b, c son distintos entre s, entonces A es un
conjunto con tres elementos, mientras que B es un conjunto con dos elementos,
uno de ellos es a, que es comun a A y a B, y el otro es el conjunto {b, c}, de
modo que
{b, c} B, {b, c}
/ A.
Esto podra llevarnos a concluir que en el lenguaje de la teora de conjuntos
hay dos clases de objetos: los elementos puros como a, b, c, que no son conjuntos,
sino objetos susceptibles de pertenecer a conjuntos, y los conjuntos como A y B,
formados por tales elementos o por otros conjuntos. El lector puede pensar que
esto es as si lo prefiere, pero la realidad es que los unicos conjuntos que vamos
a necesitar en todo momento son los conjuntos puros, es decir, los conjuntos
cuyos elementos son todos conjuntos, formados a su vez por conjuntos, todos
ellos formados a su vez por conjuntos, y as sucesivamente. No hay ningun
inconveniente tecnico en suponer que existen elementos puros, pero lo cierto
es que en ningun momento nos van a hacer falta para nada, por lo que es mas
practico restringir el significado tecnico de la palabra conjunto en matematicas
para entender que significa conjunto puro.
Tanto si el lector prefiere pensar que existen elementos puros y, por lo
tanto, conjuntos mixtos que los incluyen en su composicion como si prefiere
adoptar el convenio usual de trabajar unicamente con conjuntos puros, el hecho
es que todos los conceptos matematicos que vamos a definir en este libro (o en
1 En realidad, dicha notacion no presupone que, por ejemplo, tenga que ser a 6= b. Si se

diera este caso, A tendra dos elementos, o uno solo si a = b = c.


2 El signo es una deformacion de la letra griega y fue introducido como abreviatura de

la palabra griega (esta), de modo que a A es una abreviatura de a esta en A.


1.2. Los axiomas de la teora de conjuntos 3

cualquier otro libro que no entre en cuestiones muy especficas de la teora de


conjuntos) seran conjuntos puros.
Esto no significa que una expresion como A = {a, b, c} sea inaceptable por
contener elementos puros, sino que meramente estamos adoptando el conve-
nio de que si consideramos un conjunto de este tipo, sus elementos a, b y c
seran a su vez otros conjuntos, cuya composicion puede que sea irrelevante para
las consideraciones que queramos hacer, por lo que tal vez nunca lleguemos a
precisarla, pero eso no significa que a no tenga a su vez sus elementos, digamos
a = {x, y}, donde x e y seran nuevos conjuntos cuya composicion podramos
investigar a su vez, etc.
Los ejemplos precedentes pretenden precisar el sentido que los matematicos
dan a las palabras conjunto y pertenencia, pero fundamentar una teora ma-
tematica en una definicion circular de conjunto y en unos ejemplos aclaratorios
dista mucho del canon de rigor que se exige en la matematica formal. La forma
valida de precisar operativamente el significado de las palabras conjunto y
pertenencia no es a traves de unas definiciones necesariamente insatisfacto-
rias ni a traves de unos ejemplos, sino a traves de unos axiomas que constituyan
las afirmaciones basicas que aceptaremos que cumplen los conjuntos, de las
cuales se pueden deducir todas las demas. Dedicaremos la seccion siguiente a
presentar los axiomas basicos de la teora de conjuntos.

1.2 Los axiomas de la teora de conjuntos


La idea de conjunto como coleccion de objetos esta contenida en el si-
guiente axioma fundamental:

Axioma de extensionalidad Dos conjuntos son iguales si y solo si tienen


los mismos elementos.
En terminos practicos, si tenemos dos conjuntos A y B y podemos demostrar
que, bajo el supuesto de que un x cumple x A necesariamente x B y
viceversa, entonces este axioma nos permite concluir que A = B.
Mas conceptualmente, lo que dice el axioma de extensionalidad es que si dos
conjuntos A y B se diferencian en algo, necesariamente tiene que ser en sus
elementos. Los conjuntos no tienen ningun otro rasgo distintivo aparte de sus
elementos. Esta concepcion de los conjuntos puede no ser la mas adecuada en
otros contextos. Por ejemplo, uno podra considerar que un equipo de futbol
es algo distinto de un equipo de beisbol, incluso si ambos estan formados por
los mismos jugadores. Lo que dice el axioma de extensionalidad es que en el
sentido matematico de conjunto esto no es admisible. No hay conjuntos de
futbol o de beisbol, ni conjuntos rojos o verdes. Las unicas propiedades de
los conjuntos son las determinadas por quienes son sus elementos.
A menudo es conveniente descomponer el contenido del axioma de extensio-
nalidad en dos partes a traves del concepto de inclusion:
4 Captulo 1. El lenguaje de la teora de conjuntos

Definicion 1.1 Diremos que un conjunto A es un subconjunto de un conjunto B


o que A esta contenido, o incluido, en B, y lo representaremos por A B, si
todo elemento de A es tambien un elemento de B.

En estos terminos, el axioma de extensionalidad afirma que una igualdad de


conjuntos equivale a una doble inclusion: A = B si y solo si A B y B A.
A veces es util visualizar los conjun-
tos mediante los llamados diagramas de
Venn. La figura muestra la represen-
tacion de tres conjuntos A, B, C, donde
hay que entender que los elementos de A A
estan representados por los puntos ence- C
rrados por la curva que tiene la A junto B
a ella. Vemos entonces que A B, pero
no A 6= B, pues hay elementos de B que
no estan dentro de A.
Para indicar que se da una inclusion A B, pero que esta es estricta, es
decir, que todo elemento de A pertenece tambien a B, pero existen elementos
de B que no estan en A (tal y como les sucede a los conjuntos de la figura),
usaremos la notacion A B.
Esto equivale a que A B y A 6= B, o tambien a que A B y B 6 A. La
ultima notacion es la que emplearemos para indicar que B no es un subconjunto
de A. As, por ejemplo, la figura muestra que B 6 C y C 6 B.

Notemos que otras propiedades obvias de la inclusion de conjuntos son las


siguientes: A A (todo conjunto es un subconjunto de s mismo) y que si
A B y B C entonces A C (si todo elemento de A esta en B y todo
elemento de B esta en C es evidente que todo elemento de A esta en C).

En este punto debemos senalar que la nocion de conjunto que estamos ma-
nejando es tan general y abstracta que resulta peligroso hacer afirmaciones ge-
nerales a la ligera sobre lo que podemos esperar que cumplan los conjuntos. Por
ejemplo, en contextos no matematicos, podemos hablar del conjunto de todos
los planetas del sistema solar, del conjunto de los dedos de mi mano, etc., y
podemos sentirnos tentados de extrapolar de ah un principio general:

Axioma de comprension Dada cualquier propiedad3 P , existe un conjunto


cuyos elementos son exactamente los conjuntos que cumplen la propiedad P .
3 Quiza el lector eche en falta un concepto preciso de propiedad. Ciertamente, es ne-

cesario especificar que entendemos por propiedad para que un axioma como este pueda
tenerse por preciso y riguroso, pero una determinacion del concepto de propiedad requiere
tecnicismos relacionados con la logica matematica, y no vamos a entrar en ello aqu. Baste
saber que es posible dar una definicion totalmente satisfactoria del concepto de propiedad
y que, en la practica, la idea subyacente es que una propiedad es cualquier propiedad valga
la circularidad que, como decimos, es evitable definible con precision en terminos de los
conceptos primitivos de conjunto y pertenencia o a partir de cualesquiera otros previamente
definidos a partir de ellos, como el de inclusion.
1.2. Los axiomas de la teora de conjuntos 5

Notemos que, para cada propiedad P , solo puede haber un conjunto cuyos
elementos sean precisamente los conjuntos que cumplen la propiedad P , pues
si hubiera dos, tendran exactamente los mismos elementos (los conjuntos con
la propiedad P ), luego el axioma de extensionalidad implicara que ambos son
en realidad el mismo conjunto. Por lo tanto, si aceptamos el axioma de com-
prension, para cada propiedad P podemos representar mediante {x | P x} (lease
el conjunto de todos los x que cumplen P x) el (unico) conjunto de todos los
conjuntos que tienen la propiedad P .
Por desgracia, no podemos admitir el axioma de comprension, ya que resulta
ser contradictorio. En efecto, basta considerar la propiedad P x x / x, que
nos dara el conjunto
R = {x | x / x},
es decir, el conjunto de todos los conjuntos que no son elementos de s mismos.
Este conjunto resulta ser contradictorio, ya que llegamos a un absurdo tanto
si suponemos que R R como si suponemos que R / R. En el primer caso, por
ser un elemento de R debe cumplir la propiedad P que lo define, es decir, debe
cumplir R / R, que es justo lo contrario de lo que habamos supuesto. Si, por
el contrario, suponemos que R / R, entonces R tiene la propiedad P que define
a R, luego debera cumplir R R, y de nuevo tenemos una contradiccion.
Esto se conoce como paradoja de Russell, y nos permite concluir que el
axioma de comprension afirma la existencia de conjuntos que no pueden existir,
y por ello debemos descartarlo.
A los matematicos les llevo un tiempo encontrar la manera de hablar riguro-
samente de conjuntos sin poder postular que las propiedades definen conjuntos,
y la solucion mas simple la obtuvo Ernst Zermelo, que se dio cuenta de que no
hay inconveniente en aceptar que las propiedades definen subconjuntos. Con-
cretamente, Zermelo propuso el axioma siguiente:

Axioma de especificacion Dado un conjunto A y una propiedad P , existe


un conjunto cuyos elementos son los elementos de A que cumplen P .
Nuevamente, solo puede existir un conjunto con los elementos de A que
cumplen P , pues si hubiera dos, ambos tendran los mismos elementos (los
elementos de A que cumplen P ), y por el axioma de extensionalidad seran el
mismo. Por lo tanto, aceptando el axioma de especificacion, dado cualquier
conjunto A y cualquier propiedad P , podemos representar mediante
{x A | P x}
al (unico) subconjunto de A formado por los conjuntos que cumplen P .
Notemos que no llegamos a nada absurdo aunque apliquemos este axioma
a la propiedad P x x / x. No hay ningun inconveniente en considerar el
conjunto
R = {x A | x
/ x} A
cuyos elementos son los elementos de A que no se pertenecen a s mismos.
6 Captulo 1. El lenguaje de la teora de conjuntos

Lo que podemos probar ahora es que R / A, pues si R A, tendramos


la misma contradiccion de antes tanto si R R como si R / R. Y una vez
determinado que R / A, podemos asegurar, mas concretamente, que R
/ R, ya
que si fuera R R A entonces, en particular, tendramos que R A, y ya
hemos visto que eso es imposible.4
Aceptando el axioma de especificacion nos encontramos con que x / x no es
la unica propiedad que da lugar a contradicciones si intentamos aplicar el axioma
de comprension. Lo mismo le sucede a la propiedad P x x = x. En efecto, si
pudieramos aplicar el axioma de comprension a esta propiedad, tendramos el
conjunto
V = {x | x = x},
es decir, el conjunto de todos los conjuntos que son iguales a s mismos, y como
eso sucede siempre, V sera simplemente el conjunto de todos los conjuntos.
Pero si existiera tal conjunto, entonces podramos definir, por el axioma de
especificacion, el conjunto

R = {x V | x
/ x},

y de nuevo tenemos una contradiccion, la condicion x V se cumple siempre y


podemos suprimirla, lo que nos da que R = {x | x / x} es el conjunto paradojico
de Russell.
En suma, el axioma de especificacion implica que no existe ningun conjunto
universal V que contenga a todos los conjuntos. Notemos que no hay ninguna
contradiccion en ello. El problema con el axioma de comprension es que afirma
que existen conjuntos que no pueden existir. En cambio, el axioma de especifi-
cacion no afirma que exista el conjunto de todos los conjuntos, y no hay ninguna
contradiccion en que hayamos concluido que, de hecho, no existe.
Este es un buen punto para reflexionar sobre la zona gris de la figura de la
pagina 4. Podemos considerar que el rectangulo representa la totalidad de los
conjuntos, pero hay que entender que dicha totalidad es un abismo inabarca-
ble. Los conjuntos nos permiten parcelar cualquier zona de tamano moderado
dentro de esa totalidad, pero fuera de cada conjunto queda siempre un abismo
inconmensurable e imparcelable.
Notemos que el axioma de especificacion solo nos permite definir subcon-
juntos de un conjunto dado, y no es posible construir todos los conjuntos que
necesitan los matematicos yendo siempre hacia abajo, sino que necesitamos
otros axiomas que nos permitan, a partir de un conjunto, construir otros ma-
yores, que no sean subconjuntos suyos. Hay tres axiomas que cumplen esta
funcion:
4 Tal vez el lector se pregunte si es posible que un conjunto se pertenezca a s mismo. La

respuesta es que la pregunta es irrelevante: en ningun momento vamos a considerar conjuntos


que se pertenezcan a s mismos, de modo que da igual suponer que no existen o suponer que
existen y no tenerlos en cuenta para nada. Si optamos por lo mas simple, que es suponer que
no existen, entonces R = {x A | x / x} es simplemente R = A, y la conclusion a la que
hemos llegado es a que A / A.
1.2. Los axiomas de la teora de conjuntos 7

Axioma del par Dados dos conjuntos A y B, existe otro conjunto C cuyos
elementos son exactamente A y B.

Axioma de la union Dado un conjunto A, existe otro conjunto B cuyos


elementos son exactamente los que pertenecen a alguno de los elementos de A.

Axioma de partes Dado un conjunto A, existe otro conjunto cuyos elementos


son exactamente todos los subconjuntos de A.
Observemos que, en los tres casos, el conjunto cuya existencia se afirma es
unico, por el axioma de extensionalidad, ya que dos conjuntos en las condiciones
indicadas tendran los mismos elementos. Por lo tanto podemos darles nombre:
El conjunto cuyos unicos elementos son dos conjuntos dados A y B lo repre-
sentaremos por {A, B} y lo llamaremos par desordenado de A y B.
El conjunto cuyos elementos son todos los elementos
S de alguno de los ele-
mentos de un conjunto dado A lo representaremos por A y lo llamaremos gran
union de A.
El conjunto cuyos elementos son todos los subconjuntos de un conjunto dado
A lo representaremos por PA y lo llamaremos conjunto de las partes de A.
Por ejemplo, si un conjunto X constaS de los tres conjuntos A, B y C re-
presentados en la pagina 4, entonces X se corresponde con la region de color
blanco de la figura, es decir, la region que incluye tanto los puntos de A, como
los de B como los de C.
Es importante que en el axioma del par no exigimos que los dos conjuntos A
y B sean distintos. En caso de que sean el mismo, escribiremos {A} = {A, A},
que es el conjunto cuyo unico elemento es A.
Con estos axiomas ya podemos introducir algunas construcciones conjuntis-
tas basicas:

Dados dos conjuntos A y B, definimos su union como el conjunto


S
A B = {A, B},

cuyos elementos son los elementos que estan ya sea en A o en B. Mas


precisamente, x A B es equivalente a que se cumpla x A o x B.

Dados dos conjuntos A y B, definimos su interseccion como el conjunto

A B = {x A | x B},

que resulta de aplicar el axioma de especificacion al conjunto A y la pro-


piedad P x x B. As, los elementos de A B son los que estan a la
vez en A y en B. Por lo tanto, x A B es equivalente a que se cumpla
x A y x B.
8 Captulo 1. El lenguaje de la teora de conjuntos

Dados dos conjuntos A y B, definimos su complemento como el conjunto

A \ B = {x A | x
/ B},

de modo que x A \ B es equivalente a x A y x


/ B.

Dado cualquier conjunto A, definimos el conjunto vaco como

= {x A | x 6= x},

que obviamente es un conjunto sin elementos y no depende del conjunto


A a partir del cual lo calculamos, pues dos conjuntos sin elementos tienen
los mismos elementos (ninguno), y por el axioma de extensionalidad son
el mismo conjunto.

La figura siguiente muestra la representacion (en gris oscuro) de la union,


la interseccion y el complemento de dos conjuntos A y B, as como la no
representacion del conjunto vaco.

AB AB

B B
A A

A\B

B
A

Es importante tener presente que, para todo conjunto X, se cumple la re-


lacion X, es decir, el conjunto vaco es un subconjunto de cualquier con-
junto. Esto es pura logica: en general, para que suceda A 6 B es necesario
que exista un elemento de A que no sea elemento de B, luego, para que pudiera
suceder 6 X, tendra que existir un elemento x tal que x / X, pero
como no tiene elementos, esto es imposible.
Se dice que dos conjuntos A y B son disjuntos si A B = , es decir, si no
tienen elementos en comun. Por ejemplo, en la figura de la pagina 4 se tiene
que A y C son disjuntos, mientras que B y C no lo son.
Es posible demostrar muchas propiedades elementales sobre uniones, inter-
secciones y complementos. Veamos una muestra:
1.2. Los axiomas de la teora de conjuntos 9

Teorema 1.2 (Leyes de De Morgan) Si A, B son dos subconjuntos de un


conjunto X, entonces

X \ (A B) = (X \ A) (X \ B), X \ (A B) = (X \ A) (X \ B).

Demostracion: Veamos la primera igualdad (la segunda se demuestra


analogamente). Para probar una igualdad de conjuntos demostramos la doble
inclusion. Para probar tomamos un x X \ (AB). Esto significa que x X
yx / A B. Como la union contiene los elementos que estan ya sea en A como
en B, para que x / A B tiene que suceder que x
/Ayx / B. Entonces, como
xX yx / A, resulta que x X \ A, e igualmente x X \ B. Por definicion
de interseccion x (X \ A) (X \ B).
Ahora probamos la inclusion opuesta: tomamos x (X \ A) (X \ B). Esto
significa que x X \ A y x X \ B. De la primera parte deducimos que x X
yx / A, y de la segunda ademas que x / B. Como x /Ayx / B, podemos
concluir que x / A B, luego x X \ (A B).
S
Hemos definido la gran union X como la union de todos los conjuntos que
forman parte de X. Igualmente podemos definir una gran interseccion:

Teorema 1.3 Si X 6= , existe un unico conjunto Y cuyos elementos son los


que pertenecen a todos los elementos de X.

Demostracion: Como X no es el conjunto vaco, existe un A X. Ahora


consideramos la propiedad P x x pertenece a todos los elementos de X, que
es una propiedad a la que podemos aplicar el axioma de especificacion, para
formar el conjunto
Y = {x A | P x}.
El conjunto Y cumple lo pedido, pues si x pertenece a todos los elementos de
X, entonces cumple P x y, en particular, x A, luego x Y . Recprocamente,
si x Y entonces cumple P x, luego x pertenece a todos los subconjuntos de X.
El conjunto Y es unico por el axioma de extensionalidad, ya que dos conjuntos
que cumplieran lo requerido tendran los mismos elementos (los que pertenecen
a todos los elementos de X), luego seran el mismo conjunto.
Al conjunto dado por el teorema
T anterior lo llamaremos gran interseccion
de X y lo representaremos
T por X. Es importante tener en cuenta que la gran
interseccion no esta definida. El lector familiarizado con las sutilezas de la
logica puede plantearse quien debera ser dicha interseccion en caso de existir.
El sexto y ultimo axioma que vamos a considerar en esta seccion (y el
penultimo que vamos a necesitar) es el siguiente:

Axioma de infinitud Existe un conjunto X con la propiedad de que X


y, siempre que x X, se cumple tambien que {x} X.
Vamos a analizar el contenido de este axioma. Para ello llamaremos con-
juntos inductivos a los conjuntos X que cumplen lo que afirma el axioma de
10 Captulo 1. El lenguaje de la teora de conjuntos

infinitud. A diferencia de lo que suceda con los demas axiomas sobre existencia
de conjuntos, no podemos concluir por el axioma de extensionalidad que exista
un unico conjunto inductivo, pero podemos demostrar lo siguiente:
Teorema 1.4 Existe un unico conjunto inductivo X con la propiedad de que
esta contenido en cualquier otro conjunto inductivo.
Demostracion: Sea X0 un conjunto inductivo cualquiera. Sabemos que
existe por el axioma de infinitud. Sea I = {A PX0 | A es inductivo}, que es
un conjunto bien definido por el axioma de especificacion. Sus elementos son
todos los subconjuntos inductivos de X0 . En particular IT6= , pues X0 I.
Esto nos permite formar la gran interseccion X = I. Vamos a probar
que el conjunto X cumple lo requerido. En primer lugar probamos que X es
inductivo. Para ello, en primer lugar debemos ver que X. Por definicion
de gran interseccion, esto equivale a que pertenece a todos los elementos de
I, y eso es cierto, porque los elementos de I son conjuntos inductivos, y por
definicion todos tienen a por elemento.
En segundo lugar tomamos x X y tenemos que probar que {x} X. Para
ello tenemos que probar que {x} pertenece a todos los elementos de I. Tomemos
uno cualquiera, digamos A I. Como x X, sabemos que x pertenece a todos
los elementos de I, y en particular x A. Como A I, resulta que A es
inductivo, luego por definicion de conjunto inductivo, si x A, tambien tiene
que cumplirse que {x} A. Con esto hemos probado que {x} esta en cualquier
elemento de I prefijado, luego {x} X.
Ahora consideramos cualquier conjunto inductivo Y y tenemos que probar
que X Y . Para ello empezamos demostrando que X0 Y es un conjunto
inductivo. En efecto, como X0 e Y son ambos inductivos, tenemos que X0
y Y , luego X0 Y . Por otra parte, si x X0 Y , tenemos que x X0
y x Y , y al ser ambos inductivos {x} X0 y {x} Y , luego {x} X0 Y .
As pues, hemos probado que X0 Y es inductivo y claramente X0 Y X0 ,
luego X0 Y PX0 . Esto equivale a que X0 Y I, pues es un subconjunto
inductivo de X0 . Por ultimo, si x X, entonces x esta en todos los elementos
de I, luego x X0 Y luego x Y . Esto prueba que X Y .

Definicion 1.5 Llamaremos conjunto de los numeros naturales al menor con-


junto inductivo (en el sentido del teorema anterior) y lo representaremos por N.
Observemos que N, por definicion de conjunto inductivo. Cuando pen-
semos en el conjunto vaco como numero natural lo representaremos por 0 y lo
llamaremos cero, si bien tecnicamente 0 y son dos nombres alternativos para
el mismo conjunto.
Si n N, por definicion de conjunto inductivo tenemos que {n} N. Cuando
pensemos en {n} como numero natural escribiremos Sn en lugar de {n}, y
diremos que Sn es el siguiente de n.
Al siguiente de 0 lo llamaremos uno y lo representaremos por 1 = S0 = {},
al siguiente de 1 lo llamaremos dos y lo representaremos por
2 = S1 = {1} = {{}},
1.2. Los axiomas de la teora de conjuntos 11

igualmente definimos el tres, el cuatro, el cinco, el seis, el siete, el ocho y el


nueve como:
3 = S2 = {{{}}} 7 = S6 = {{{{{{{}}}}}}}
4 = S3 = {{{{}}}} 8 = S7 = {{{{{{{{}}}}}}}}
5 = S4 = {{{{{}}}}} 9 = S8 = {{{{{{{{{}}}}}}}}}.
6 = S5 = {{{{{{}}}}}}
Es claro que 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 son numeros naturales. En general:
Teorema 1.6 (Axiomas de Peano) El conjunto N de los numeros naturales
cumple las propiedades siguientes:
1. 0 N (el cero es un numero natural).
2. Si n N, entonces Sn N (el siguiente de un numero natural es un
numero natural).
3. 0 no es el siguiente de ningun numero natural.
4. Si m, n N cumplen Sm = Sn, entonces m = n (si dos numeros naturales
tienen el mismo siguiente, es que son el mismo).
5. Si A N tiene la propiedad de que 0 A y siempre que n A tambien
Sn A, entonces A = N (principio de induccion).
Demostracion: 1) El cero es un numero natural porque N es un conjunto
inductivo y 0 = N por definicion de conjunto inductivo.
2) Si n N, entonces Sn = {n} N, tambien por definicion de conjunto
inductivo.
3) No puede suceder que 0 = Sn, porque entonces = {n}, cuando el
conjunto de la derecha no es vaco, ya que contiene a n.
4) Si Sm = Sn, esto es lo mismo que {m} = {n}, y entonces m {m} = {n},
luego m = n.
5) La hipotesis es que A es un conjunto inductivo, y entonces N A porque
N es el menor conjunto inductivo (esta contenido en cualquier otro, segun el
teorema 1.4). Como por hipotesis A N, tenemos que A = N.

Observaciones Ahora podemos entender plenamente el axioma de infinitud:


hemos elegido una operacion conjuntista, concretamente x 7 {x}, que cuando
la vamos aplicando sucesivamente al conjunto va produciendo conjuntos dis-
tintos de los precedentes: , {}, {{}}, {{{}}}, . . . y hemos postulado que
existe un conjunto que contiene a todos los conjuntos que se obtienen de este
modo. Obviamente dicho conjunto no es unico, pues puede contener elementos
extra no deseados, pero siempre podemos quedarnos con el menor de todos
ellos, N, que es el menor conjunto que puede obtenerse a partir de 0 = apli-
cando la operacion siguiente, sin ningun anadido. A los conjuntos que vamos
obteniendo al aplicar la operacion siguiente los llamamos numeros naturales
0, 1, 2, 3, . . .
12 Captulo 1. El lenguaje de la teora de conjuntos

Abusando un poco del lenguaje, podemos expresar que N es el menor con-


junto inductivo mediante N = {0, 1, 2, 3, . . .}, donde los puntos suspensivos indi-
can que los elementos de N son unicamente los que resultan de calcular siguientes
y mas siguientes, pero la version formal de este hecho es el teorema anterior.
A partir de aqu, el hecho de que hayamos definido concretamente el numero
tres como 3 = {{{}}} se vuelve completamente irrelevante. Lo unico que
importa de los numeros naturales es que cumplen los axiomas de Peano. Que
conjuntos hemos seleccionado concretamente para que esto suceda no tiene im-
portancia. Ninguno de los resultados que vamos a demostrar sobre los numeros
naturales dependeran de cuales sean concretamente los elementos del 3 o del 7.
Aqu tenemos un primer ejemplo de un concepto matematico (el de los
numeros naturales) que nadie concibe como conjuntos, sino mas bien como ele-
mentos puros, pero esto no contradice que tecnicamente podamos definir los
numeros naturales de modo que sean conjuntos (y de hecho conjuntos puros).
Podramos haber elegido otra operacion siguiente. Por ejemplo, si hubie-
ramos elegido x 7 x {x} entonces los numeros naturales hubieran sido
0 = , 1 = {0}, 2 = {0, 1}, 3 = {0, 1, 2}, 4 = {0, 1, 2, 3}, ...
Esta alternativa es mucho mas conveniente para quien pretenda adentrarse en
la teora de conjuntos, pero para nuestros fines es irrelevante una u otra opcion
y la que hemos elegido simplifica la demostracion de los axiomas de Peano. Mas
adelante volveremos sobre la comparacion de conjuntos de numeros naturales
obtenidos a partir de elecciones diferentes de la funcion siguiente o incluso
del 0 (que tampoco es obligatorio que sea el conjunto vaco).
Conviene destacar el significado del quinto axioma de Peano, el principio
de induccion. Para ello consideramos cualquier propiedad P y lo aplicamos al
conjunto A = {n N | P n}. Su traduccion a este caso es la siguiente:

Principio de induccion Si probamos que 0 tiene la propiedad P y, bajo la


hipotesis de que n N cumple la propiedad P (hipotesis de induccion), podemos
demostrar que Sn tambien cumple la propiedad P , entonces podemos asegurar
que todo numero natural cumple la propiedad P .
Veamos un ejemplo sencillo de demostracion por induccion:
Teorema 1.7 Todo numero natural distinto de 0 es el siguiente de otro numero
natural.
Demostracion: Tomamos como propiedad P la propiedad P n si n 6= 0
entonces n es el siguiente de otro numero natural. Y vamos a probar por
induccion que la cumplen todos los numeros naturales. Se cumple P 0, pues no
se da el caso de que 0 6= 0. Si suponemos por hipotesis de induccion que se
cumple P n, entonces se cumple P Sn, simplemente porque Sn es el siguiente de
un numero natural. Por lo tanto todos los numeros tienen la propiedad P .
Para extraer mas consecuencias de los axiomas de Peano necesitamos algunos
conceptos conjuntistas adicionales.
1.3. Funciones 13

1.3 Funciones
El concepto de funcion es una de las piezas fundamentales del vocabulario
conjuntista. Para introducirlo necesitamos otros conceptos previos.
Tenemos definidos los pares desordenados {a, b}, y es claro que de una igual-
dad {a, b} = {c, d} no podemos concluir necesariamente que a = c y b = d, pues
{a, b} = {b, a}, y perfectamente podra suceder que a = d y b = c.
Esto hace conveniente definir el par ordenado con primera componente a y
segunda componente b como (a, b) = {{a}, {a, b}}. Entonces:
Teorema 1.8 Si a, b, c, d son conjuntos cualesquiera, entonces
(a, b) = (c, d) si y solo si a = c y b = d.
Demostracion: Es inmediato que si a = c y b = d entonces (a, b) = (c, d).
Vamos a probar la implicacion opuesta. Para ello suponemos primero que a = b.
Entonces, por definicion de par ordenado, (a, b) = {{a}, {a, a}} = {{a}} y
(c, d) = {{c}, {c, d}} = {{a}}. Esto obliga a que {c} = {c, d} = {a}, de donde
se sigue claramente que c = d = a = b.
Llegamos a la misma conclusion si c = d, por lo que podemos suponer que
a 6= b y c 6= d. Tenemos que {{a}, {a, b}} = {{c}, {c, d}}. Entonces, como
{a} {{c}, {c, d}}, tiene que ser {a} = {c} o bien {a} = {c, d}, pero el segundo
caso es imposible, porque entonces c = a = d. Por lo tanto, {a} = {c} y esto
implica que a = c.
Igualmente, {a, b} {{c}, {c, d}}, y no puede ser {a, b} = {c}, porque en-
tonces a = c = b, luego tiene que ser {a, b} = {c, d}, luego b {c, d}, luego b = c
o bien b = d, pero no puede ser b = c = a, luego b = d, como haba que probar.

Observemos ahora que si a A y b B, entonces a, b A B, luego


{a}, {a, b} A B, luego {a}, {a, b} P(A B), luego
(a, b) = {{a}, {a, b}} P(A B),
luego (a, b) PP(A B). Esto nos permite probar:
Teorema 1.9 Dados dos conjuntos A y B, existe un unico conjunto cuyos ele-
mentos son todos los pares ordenados (a, b) con a A y b B.
Demostracion: Basta aplicar el axioma de especificacion a la propiedad
P x x es un par ordenado de la forma x = (a, b), con a A y b B y definir
X = {x PP(A B) | P x}.
As, todo elemento de X es un par ordenado en las condiciones requeridas,
y si x = (a, b) es cualquiera de dichos pares, justo antes del enunciado de
este teorema hemos probado que x PP(A B) y ademas P x, luego x X.
La unicidad es por el axioma de extensionalidad, ya que dos conjuntos que
cumplieran lo requerido tendran los mismos elementos (los pares ordenados
con primera componente en A y segunda componente en B), luego seran el
mismo conjunto.
14 Captulo 1. El lenguaje de la teora de conjuntos

Llamaremos producto cartesiano de los conjuntos A y B al conjunto dado


por el teorema anterior, y que representaremos por A B. As, si a A y
b B, tenemos que (a, b) A B, y todos los elementos de A B son de esta
forma.
A partir de este punto podemos olvidarnos de que los pares ordenados (a, b)
son conjuntos. Nunca mas necesitaremos pensar en ellos como conjuntos, sino
que lo unico que importa es que determinan el orden de sus componentes y que
pueden recolectarse en los productos cartesianos.

Definicion 1.10 Diremos que un conjunto f es una aplicacion o funcion de


un conjunto A en un conjunto B (y lo representaremos por f : A B) si
f A B y para cada a A existe un unico b B tal que (a, b) f . Dicho
b recibe el nombre de imagen de a por f y se representa por f (a). Tambien se
dice que a es una antiimagen de b por f .

Diremos que f es inyectiva si cuando x, y A cumplen f (x) = f (y), entonces


x = y (elementos distintos tienen imagenes distintas).
Diremos que f es suprayectiva si para todo b B existe un a A tal que
f (a) = b (todo elemento de B tiene al menos una antiimagen en A).
Diremos que f es biyectiva si es inyectiva y suprayectiva.

Ejemplos Sea5 A = {0, 1, 2} y B = {0, 1, 2, 3, 4} y sea

f = {(0, 3), (1, 0), (2, 3)}.

Entonces f es una aplicacion f : A B. Ciertamente es un subconjunto


de A B (sus elementos son pares con primera componente 0, 1 o 2 y segunda
componente 0, 1, 2, 3 o 4) y cada elemento de A tiene una unica imagen por f
en B, a saber, f (0) = 3, f (1) = 0, f (2) = 3. Podemos representar f mediante
un diagrama de flechas, as:

A 0 f
0 B
1

1
2


2 3
4

Vemos que f no es inyectiva, porque hay dos elementos distintos de A (e 0


y el 2) que tienen la misma imagen en B: se cumple f (0) = f (2), pero 0 6= 2.
Tambien vemos f no es suprayectiva, porque hay varios elementos en B que no
tienen antiimagen en A (el 1, el 2 y el 4).
5 Por definicion {0, 1, 2} = {0} {1} {2} es el conjunto cuyos elementos son 0, 1 y 2, y

analogamente con {0, 1, 2, 3, 4}.


1.3. Funciones 15

La figura siguiente muestra una aplicacion inyectiva g : A B y otra


suprayectiva de h : B A:

A g 0
B B 0 PP h A
1
0 PP 0
1 PP PP

1 PP q
P
2
2

PP

1

3 3



q
P
2
2
4 4

Vemos que, en efecto, la aplicacion g no asigna una misma imagen a dos


elementos distintos, por lo que es inyectiva, pero no suprayectiva, ya que hay
elementos sin antiimagen. En cambio, la de la derecha no es inyectiva, pues
h(0) = h(4) y tambien h(1) = h(2), pero s que es suprayectiva, ya que todo
elemento de B tiene al menos una antiimagen.
La figura siguiente muestra una aplicacion biyectiva entre dos conjuntos A
y C:

k
A 0 0 C

1 2

2 4

Notemos que este es el aspecto tpico de una aplicacion biyectiva entre dos
conjuntos: cada elemento de A tiene una unica imagen en C y cada elemento
de C tiene una unica antiimagen en A (una porque la aplicacion es suprayec-
tiva y unica porque es inyectiva). De esta suerte, los elementos de A quedan
emparejados con los elementos de C sin que falte ni sobre ninguno.
En la practica, para definir una aplicacion f : A B basta especificar
(una vez dados A y B) cual es la imagen f (a) B de cada elemento a A.
Por ejemplo, podemos definir S : N N sin mas que especificar que
si n N, entonces S(n) = {n}. Toda definicion hecha de este modo puede
traducirse a una aplicacion del axioma de especificacion. Concretamente, en
este caso sera

S = {x N N | existe un n N tal que x = (n, S(n))}.

Igualmente, para probar que dos aplicaciones f : A B y g : A C


son iguales (como conjuntos) no usaremos normalmente una doble inclusion que
nos obligue a recordar que f y g son conjuntos de pares ordenados. Eso es
equivalente a probar (teniendo en cuenta que estamos suponiendo de antemano
que f y g tienen el mismo dominio A) que para todo a A se cumple que
f (a) = g(a). En otras palabras:
16 Captulo 1. El lenguaje de la teora de conjuntos

Dos aplicaciones son iguales si y solo si tienen el mismo dominio y


asignan la misma imagen a cada elemento de dicho dominio.

En efecto, si se cumple esto podemos probar que f = g por doble inclusion:


si x f , entonces x es un par ordenado x = (a, f (a)), pero como f (a) = g(a),
de hecho x = (a, g(a)) g. Esto prueba que f g e igualmente se prueba que
g f.
Introducimos ahora algunos conceptos adicionales sobre una aplicacion cual-
quiera f : A B (los ejemplos que las acompanan hacen referencia a las
funciones g y h correspondientes a los graficos de la pagina precedente):

1. El conjunto A sobre el que esta definida f se llama dominio de f y lo


representaremos por Df .
2. Si X A, definimos f [X] = {b B | existe x X tal que f (x) = b}.
As, f [X] es el conjunto de las imagenes de los elementos de X.
Por ejemplo, h[{1, 2, 3}] = {1, 2}.
3. En particular f [A] es el conjunto de todas las imagenes de los elementos
de A y se denomina rango o imagen de f . Lo representaremos por Rf o
por Im f . Notemos que f es suprayectiva si y solo si f [A] = B.
Por ejemplo, Rg = {0, 2, 3}.
4. Si Y B, definimos f 1 [Y ] = {a A | f (a) Y }. Se trata del conjunto
de todas las antiimagenes de los elementos de Y . (Es habitual escribir
f 1 [b] = f 1 [{b}] para hacer referencia al conjunto de las antiimagenes
de b B.)
5. Si X A definimos f |X : X B como la aplicacion que coincide con f
sobre los elementos de X, es decir, su dominio es X y , para cada x X,
se define f |X (x) = f (x).
6. Si f es inyectiva y C = f [A], definimos f 1 : C A como la unica
aplicacion que a cada elemento de C le asigna su unica antiimagen por
f , es decir, si c C, entonces f 1 (c) es el unico elemento a A tal que
f (a) = c. As f (a) = b es equivalente a f 1 (b) = a, pero para que esto
tenga sentido es necesario que f sea inyectiva, pues si b tuviera varias
antiimagenes, no estara bien definido f 1 (b).
7. En particular, si f : A B biyectiva, tambien f 1 : B A biyectiva.

Si A B, la aplicacion i : A B dada por i(a) = a se llama inclusion


de A en B. Si, mas concretamente, A = B, la inclusion i : A A se llama
aplicacion identidad en A.
Si f : A B, g : C D y f [A] C, podemos definir la composicion
f g : A D como la aplicacion dada por (f g)(a) = g(f (a)), es decir, la
aplicacion que se calcula pasando de a A a f (a) f [A] C y luego de f (a)
a g(f (a)) D.
1.3. Funciones 17

Por ejemplo, si g y h son las aplicaciones de las figuras de la pagina anterior,


se cumple que g h es la identidad en A, pues (g h)(0) = h(g(0)) = h(3) = 0,
e igualmente se comprueba que (g h)(1) = 1 y (g h)(2) = 2.
Los conceptos que acabamos de introducir satisfacen numerosas relaciones
de interes que conviene conocer. Veamos algunas de ellas:

1. Si f : A B, g : B C y h : C D, entonces (f g) h = f (g h).
En efecto, los dos miembros de la igualdad son aplicaciones A D y,
para cada a A, se cumple que

((f g)h)(a) = h((f g)(a)) = h(g(f (a))) = (gh)(f (a)) = (f (gh))(a).

Por lo tanto, en esta situacion podemos escribir f g h sin necesidad


de poner parentesis. Se trata de la aplicacion que actua primero como f ,
luego aplica g y luego h.

2. Si f : A B es biyectiva, entonces f f 1 = iA es la identidad en A y


f 1 f = iB es la identidad en B.
En efecto, si a A y f (a) = b, entonces f 1 (b) = a, luego

(f f 1 )(a) = f 1 (f (a)) = f 1 (b) = a = iA (a),

e igualmente se comprueba que (f 1 f )(b) = b = iB (b), para todo b B.

3. Si f : A B e iA , iB son las identidades en A y en B, respectivamente,


entonces iA f = f = f iB .

4. Si f : A B y X, Y B, entonces

f 1 [X Y ] = f 1 [X] f 1 [Y ], f 1 [X Y ] = f 1 [X] f 1 [Y ],

f 1 [X \ Y ] = f 1 [X] \ f 1 [Y ].

Comprobamos la primera como ejemplo: si a f 1 [X Y ], entonces


f (a) X Y , luego f (a) X o bien f (a) Y , luego a f 1 [X] o bien
a f 1 [Y ], luego a f 1 [X] f 1 [Y ]. Esto nos da la inclusion , la
inclusion se demuestra analogamente.

5. Si f : A B y g : B A y f g = iA es la identidad en A, entonces
f es inyectiva y g es suprayectiva.
En efecto, para ver que f es inyectiva tomamos x, y A y suponemos que
f (x) = f (y). Entonces g(f (x)) = g(f (y)), luego (f g)(x) = (f g)(y),
luego x = y.
Para ver que g es suprayectiva tomamos a A y observamos que se cumple
g(f (a)) = a, luego f (a) B es una antiimagen de a por g.
18 Captulo 1. El lenguaje de la teora de conjuntos

Ejercicio: Sea f : A B y sean X, Y A. Estudiar si se cumplen las igualdades

f [X Y ] = f [X] f [Y ], f [X Y ] = f [X] f [Y ], f [X \ Y ] = f [X] \ f [Y ].

Por ultimo observamos que si f : A B, por definicion f A B, luego


f P(A B). Por lo tanto, podemos usar el axioma de especificacion y definir

B A = {f P(A B) | f : A B},

que es el conjunto de todas las aplicaciones de A en B, ya que la restriccion


f P(A B) no elimina a ninguna de ellas.

1.4 Los numeros naturales


Para definir los numeros naturales hemos elegido arbitrariamente un con-
junto como 0 (concretamente ) y una operacion conjuntista adecuada como
siguiente (concretamente x 7 {x}). Veamos ahora que hay muchas otras
elecciones posibles. En lugar de la version del axioma de infinitud que hemos
adoptado, podramos haber tomado esta variante mas abstracta:

Axioma de infinitud (variante) Existe un conjunto X con una aplicacion


S : X X inyectiva y no suprayectiva.
Observemos que la version anterior del axioma implica esta, ya que la apli-
cacion sucesor S : N N es inyectiva y no suprayectiva (eso es precisamente
lo que afirman los axiomas de Peano 3 y 4). Ahora vamos a ver que esta version
abstracta es suficiente para construir un conjunto de numeros naturales.
Sea S : X X una aplicacion inyectiva y no suprayectiva, tal y como
postula el axioma. Entonces podemos elegir un elemento 0 X que no tiene
antiimagen. Diremos que A X es inductivo si 0 A y cuando n A entonces
tambien S(n) A. Sea I =T{A PX | A es inductivo}. Observemos que I 6= ,
ya que X I. Sea N = I. Exactamente igual que en la demostracion del
teorema 1.4 podemos probar que N es inductivo. En particular, si n N , se
cumple que S(n) N , por lo que podemos restringir S|N : N N . Vamos a
llamar S a esta restriccion. Entonces:

Teorema 1.11 (Axiomas de Peano) Existe un conjunto N , una aplicacion


S : N N y un elemento 0 de modo que se cumplen las propiedades siguientes:
1. 0 N
2. Si n N , entonces S(n) N .
3. No existe ningun n N tal que S(n) = 0.
4. Si m, n N y S(m) = S(n), entonces m = n.
5. Si A N tiene la propiedad de que 0 A y siempre que n A tambien
S(n) A, entonces A = N .
1.4. Los numeros naturales 19

Demostracion: Las propiedades 1) y 2) se cumplen porque N es inductivo,


la propiedad 3) porque hemos elegido 0 sin antiimagen por S, la propiedad 4)
porque S es inyectiva y la 5) porque lo que afirma es que A N X es
inductivo, luego A I, luego N A, ya que los elementos de N estan en todos
los elementos de I.
Podemos definir igualmente 1 = S(0), 2 = S(1), etc. As tenemos la misma
situacion que antes, salvo que ahora no hemos precisado cuales son concreta-
mente los elementos de N ni quien es concretamente el cero ni en que consiste
concretamente el paso al siguiente numero natural. Conviene recoger esto en
una definicion:

Definicion 1.12 Un sistema de Peano es una terna6 (N, S, 0) que cumple las
cinco propiedades del teorema anterior.

Vemos entonces que el axioma de infinitud que hemos dado en esta seccion
es equivalente a la existencia de una terna de Peano (pues hemos probado que
existe una a partir del axioma y, recprocamente, la funcion S de una terna de
Peano es una aplicacion inyectiva y no suprayectiva). El axioma de infinitud
dado en la seccion 1.2 implica la existencia de un sistema de Peano en el que,
concretamente, 0 = y S(n) = {n}, pero esto es anecdotico.
Para poner de manifiesto que lo unico que importa realmente de los numeros
naturales es que forman un sistema de Peano ahora vamos a trabajar con uno
cualquiera de ellos. Empezamos demostrando la propiedad mas importante de
los numeros naturales junto con el principio de induccion:

Teorema 1.13 (Principio de recursion) Sea (N, S, 0) un sistema de Peano,


sea g : A A una aplicacion arbitraria y sea a A. Entonces existe una
unica aplicacion f : N A tal que f (0) = a y para todo n N se cumple que
f (S(n)) = g(f (n)).

La ultima propiedad se expresa a menudo diciendo que el diagrama siguiente


es conmutativo:
g
AO /A
O
f f

N /N
S

Decir que un diagrama de este tipo es conmutativo quiere decir que si vamos
de un punto a otro por dos caminos diferentes el resultado es el mismo, en este
caso f g = S f , que es justo lo que afirma el teorema.
En la practica, el principio de recursion afirma que para definir una apli-
cacion f : N A no es necesario definir explcitamente f (0), f (1), f (2), etc.,
sino que basta definir f (0) como un cierto a A y explicar como se calcula
f (S(n)) supuesto que ya hayamos calculado f (n), es decir, dar una funcion
6 En general podemos definir una terna como (a, b, c) = ((a, b), c).
20 Captulo 1. El lenguaje de la teora de conjuntos

g que determine f (S(n)) a partir de f (n). Esto determina completamente la


funcion f , que vendra dada por:
f (0) = a, f (1) = f (S(0)) = g(a), f (2) = f (S(1)) = g(g(a)),
f (3) = g(g(g(a))), f (4) = g(g(g(g(a)))), ...
Cuando definimos una funcion de este modo se dice que la estamos definiendo
por recurrencia, o que la definicion es recursiva.
Antes de ver ejemplos y aplicaciones vamos a demostrar el teorema:
Demostracion: Diremos que h : X A es una aproximacion si:
1. X N , 0 X y siempre que n X y n 6= 0 existe un m X tal que
n = S(m)
2. h(0) = a y siempre que n X y S(n) X, entonces h(S(n)) = g(h(n)).
As, las aproximaciones son funciones que cumplen lo que requiere el teorema
salvo que no tienen por que estar definidas en todo N .
Veamos en primer lugar que si h : X A y h : X A son aproxima-
ciones y n X X , entonces h(n) = h (n).
Lo probamos por induccion sobre n. Concretamente, consideramos la pro-
piedad P n dada por: si n X X , entonces h(n) = h (n), y vamos a comprobar
que la cumplen todos los elementos de N .
Se cumple para 0, porque por definicion de aproximacion 0 X X y
h(0) = a = h (0).
Supongamos, como hipotesis de induccion, que si n X X , entonces
h(n) = h (n) y vamos a probar que lo mismo vale para S(n). Para ello supone-
mos que S(n) X X . Entonces, por definicion de aproximacion, n X X
(aqu usamos el cuarto axioma de Peano, que dice que n es el unico anterior
de S(n)). Entonces, por hipotesis de induccion h(n) = h (n), y por definicion
de aproximacion h(S(n)) = g(h(n)) = g(h (n)) = h (S(n)). Esto termina la
prueba.
Ahora probamos que para todo n N existe una aproximacion h con n en
su dominio. Lo probamos nuevamente por induccion sobre n. Es inmediato que
la aplicacion h : {0} A dada por h(0) = a es una aproximacion, y tiene a 0
en su dominio, luego el resultado es cierto para 0.
Supongamos, por hipotesis de induccion que h : X A es una aproxi-
macion tal que n X. Si S(n) X, entonces h cumple lo requerido para S(n).
En caso contrario es facil ver que h : X {S(n)} A definida como h sobre
los elementos de X y como h (S(n)) = g(h(n)) es una aproximacion con S(n)
en su dominio.
Ahora ya podemos definir f : N A como sigue: para cada n N ,
sabemos que existe una aproximacion h : X A con n en su dominio y que,
si tomamos dos cualesquiera, el valor de h(n) va a ser el mismo para ambas.
Por lo tanto podemos definir f (n) = h(n).
1.4. Los numeros naturales 21

Esto hace que, en particular, f (0) = a, porque todas las aproximaciones


asignan a 0 la imagen a. Por otra parte, si n N y h : X A es una
aproximacion tal que S(n) X, entonces por definicion de aproximacion n X,
luego por definicion de f tenemos que f (n) = h(n) y f (S(n)) = h(S(n)), y por
definicion de aproximacion

f (S(n)) = h(S(n)) = g(h(n)) = g(f (n)).

Por lo tanto, f cumple lo pedido, y solo falta probar que solo hay una f
que cumpla esta propiedad. Para ello tenemos que probar que si f : N A
y f : N A cumplen las condiciones del enunciado, entonces f = f , para
lo cual a su vez basta probar que si n N entonces f (n) = f (n). Esto lo
probamos por induccion. Para n = 0 se cumple, pues f (0) = a = f (0). Si
suponemos como hipotesis de induccion que f (n) = f (n), entonces

f (S(n)) = g(f (n)) = g(f (n)) = f (S(n)).

esto termina la prueba de la unicidad de f .


Como primera aplicacion demostramos la equivalencia entre todos los siste-
mas de Peano:

Teorema 1.14 Si (N, S, 0) y (N , S , 0 ) son dos sistemas de Peano, entonces


existe f : N N biyectiva tal que f (0) = 0 y que hace conmutativo el
diagrama siguiente:
f
NO / N
O
S S

N / N
f

Observemos que esto significa que f (1) = f (S(0)) = S (f (0)) = S (0 ) = 1 ,


f (2) = f (S(1)) = S (f (1)) = S (1 ) = 2 y, en general, que f transforma el
0 de un sistema en el 0 del otro, el 1 de un sistema en el 1 del otro, y as
sucesivamente. En definitiva, f es como un diccionario que traduce cero
por zero, uno por one, dos por two y as sucesivamente, poniendo en
evidencia que los dos sistemas de Peano no son mas que dos ristras de nombres
alternativos para los numeros naturales, de modo que es lo mismo partir de
dos, calcular el siguiente tres y luego traducir three que partir de dos,
traducir two y luego calcular el siguiente three.
Demostracion: Aplicamos el teorema de recursion a 0 N y a la funcion
S : N N . La conclusion es que existe una funcion f : N N tal que

f (0) = 0 y para todo n N se cumple que f (S(n)) = S (f (n)), que es la


condicion de conmutatividad para el diagrama. Solo falta probar que f es
biyectiva.
Para ello invertimos los papeles y definimos f : N N mediante el teo-
rema de recursion aplicado al segundo sistema de Peano, de modo que f (0 ) = 0
y para todo n N se cumple que f (S (n )) = S(f (n )).
22 Captulo 1. El lenguaje de la teora de conjuntos

Ahora demostramos por induccion que f (f (n)) = n para todo n N .


Para n = 0 tenemos que f (f (0)) = f (0 ) = 0. Si vale para n, entonces
f (f (S(n))) = f (S (f (n))) = S(f (f (n))) = S(n).
Esto prueba que f f es la identidad en N , y la propiedad 5 de la pagina 17
nos da que f es inyectiva. Pero invirtiendo los papeles obtenemos tambien que
f f es la identidad, luego f es suprayectiva, y concluimos que es biyectiva.

A partir de aqu fijamos un sistema de Peano cualquiera (N, S, 0), que puede
ser el que hemos construido concretamente en la seccion 1.2 u otro cualquiera,
y llamaremos numeros naturales a los elementos de N.
Vamos a aplicar el teorema de recursion tomando como a un numero natural
m N y como g la aplicacion siguiente S : N N. El teorema nos da que
existe una unica fm : N N tal que fm (0) = m y fm (S(n)) = S(fm (n)).
Sin embargo, en lugar de usar la notacion habitual para aplicaciones, es decir,
fm (n), vamos a usar una notacion especfica, y escribiremos m + n = fm (n).
Con esta notacion, las propiedades que determinan por recurrencia la funcion
fm se escriben as:

m + 0 = m, m + S(n) = S(m + n).

En particular, observamos que m + 1 = m + S(0) = S(m + 0) = S(m), por lo


que a partir de ahora ya no volveremos a escribir S(n) para referirnos al siguiente
de un numero natural, sino que usaremos la notacion m + 1. Puesto que esta
sera la notacion que emplearemos en lo sucesivo, conviene reescribir en estos
terminos los resultados que hemos enunciado hasta ahora con la notacion S:

Principio de induccion Si probamos que 0 tiene la propiedad P y bajo la


hipotesis de que n N cumple la propiedad P (hipotesis de induccion) podemos
demostrar que n + 1 tambien cumple la propiedad P , entonces podemos asegurar
que todo numero natural cumple la propiedad P .

Principio de recursion Si g : A A es una aplicacion arbitraria y a A,


existe una unica aplicacion f : N A tal que f (0) = a y para todo n N se
cumple que f (n + 1) = g(f (n))

Suma de numeros naturales La suma de dos numeros naturales m y n esta


unvocamente determinada por las propiedades siguientes:

m + 0 = m, m + (n + 1) = (m + n) + 1.

Esta definicion se corresponde con la suma que el lector conoce sin duda
desde sus primeros anos. Por ejemplo:

2 + 3 = 2 + (2 + 1) = (2 + 2) + 1 = (2 + (1 + 1)) + 1 = ((2 + 1) + 1) + 1

= (3 + 1) + 1 = 4 + 1 = 5.
1.4. Los numeros naturales 23

Producto de numeros naturales El producto de dos numeros naturales


esta unvocamente determinado por las propiedades
m 0 = 0, m(n + 1) = m n + m.
Observemos que la definicion de producto se basa en el teorema de recursion
tomando a = 0 y como g : N N la aplicacion dada por g(n) = n + m.
Esto nos define una funcion gm , pero en lugar de gm (n) escribimos m n, o
simplemente mn. Como en el caso de la suma, este producto es el producto
de toda la vida. No obstante, antes de hacer cuentas con el es conveniente
demostrar las propiedades basicas de estas operaciones:
1. (m + n) + r = m + (n + r).
Por induccion7 sobre r. Para r = 0 se reduce a m + n = m + n. Si vale
para r, entonces
(m + n) + (r + 1) = ((m + n) + r) + 1 = (m + (n + r)) + 1
= m + ((n + r) + 1) = m + (n + (r + 1)),
donde hemos aplicado la definicion de suma, la hipotesis de induccion, y
dos veces mas la definicion de suma.
Esta propiedad nos permite escribir expresiones m + n + r sin necesidad
de intercalar parentesis. As, por ejemplo,
3 + 3 = 3 + 2 + 1 = 3 + 1 + 1 + 1 = 3 + 1 + 1 = 5 + 1 = 6.

2. m + n = n + m.
Para probar esto demostramos antes algunos casos particulares. En primer
lugar demostramos que 0 + n = n por induccion sobre n (notemos que
n + 0 = n se cumple por la definicion de suma). Para n = 0 es 0 + 0 = 0,
Si vale para n, entonces
0 + (n + 1) = (0 + n) + 1 = n + 1.

En segundo lugar demostramos que 1 + n = n + 1, tambien por induccion


sobre n. Para n = 0 es 1 + 0 = 1 = 0 + 1, la primera igualdad por
la definicion de suma y la segunda porque ya hemos visto que sumar 1
equivale a pasar al siguiente. Si vale para n, entonces
1 + (n + 1) = (1 + n) + 1 = (n + 1) + 1.

Ahora probamos el caso general por induccion sobre n. Para n = 0 es


m + 0 = m = 0 + m. Si vale para n, entonces
m + (n + 1) = (m + n) + 1 = (n + m) + 1 = n + (m + 1)
= n + (1 + m) = (n + 1) + m,
donde hemos usado las propiedades precedentes.
7 Porinduccion sobre r significa que vamos a aplicar el principio de induccion a la pro-
piedad P r (m + n) + r = m + (n + r), considerando m y n fijos.
24 Captulo 1. El lenguaje de la teora de conjuntos

3. (m + n)r = mr + nr.
Por induccion sobre r. Para r = 0 es (m + n)0 = 0 = 0 + 0 = m 0 + n 0.
Si vale para r entonces

(m + n)(r + 1) = (m + n)r + m + n = mr + nr + m + n

= mr + m + nr + r = m(r + 1) + n(r + 1).

4. m(n + r) = mn + mr.
Por induccion sobre r. Para r = 0 es mn = mn. Si vale para n, entonces

m(n + (r + 1)) = m((n + r) + 1) = m(n + r) + m

= mn + mr + m = mn + m(r + 1).

5. (mn)r = m(nr).
Por induccion sobre r. Para r = 0 es (mn)0 = 0 = m(0) = m(n0). Si vale
para r, entonces

(mn)(r + 1) = (mn)r + mn = m(nr) + mn = m(nr + n) = m(n(r + 1)),

donde hemos usado la propiedad anterior.


Como en el caso de la suma, esta propiedad hace innecesarios los parentesis
entre los terminos de una multiplicacion.
6. n 1 = n.
n 1 = n(0 + 1) = n 0 + n = 0 + n = n.
7. mn = nm.
Demostramos antes algunos casos particulares. En primer lugar vemos
que 0 n = 0. Para n = 0 es 0 0 = 0. Si vale para n, entonces

0 (n + 1) = 0 n + 0 = 0 + 0 = 0.

En segundo lugar 1 n = n. Para n = 0 es 1 0 = 0. Si vale para n,


entonces 1(n + 1) = 1 n + 1 1 = n + 1. Ahora probamos el caso general,
por induccion sobre n. Para n = 0 es m0 = 0 = 0m. Si vale para n,
entonces

m(n + 1) = mn + m = nm + m = nm + 1 m = (n + 1)m,

donde hemos usado la propiedad 3.


8. Si m + r = n + r, entonces m = n.
Por induccion sobre r. Para r = 0 tenemos m+0 = n+0, luego ciertamente
m = n. Si vale para r y tenemos m + (r + 1) = n + (r + 1), esto es lo
mismo que (m + r) + 1 = (n + r) + 1, o tambien S(m + r) = S(n + r), luego
por el cuarto axioma de Peano m + r = n + r, luego m = n por hipotesis
de induccion.
1.4. Los numeros naturales 25

9. Si m + n = 0, entonces m = n = 0.
En efecto, si fuera n 6= 0, entonces n = r + 1 para cierto r (teorema 1.7),
y entonces m + n = (m + r) + 1 6= 0, pues el 0 no es el siguiente de ningun
numero natural.
10. Si mn = 0, entonces m = 0 o bien n = 0.
En caso contrario, m = m + 1, n = n + 1, luego, al igual que antes,
mn = (m + 1)(n + 1) = (m + 1)n + m + 1 6= 0.

Ahora ya es facil operar con numeros naturales. Por ejemplo,


3 2 = 3(1 + 1) = 3 + 3 = 6.
Una nueva aplicacion del teorema de recursion nos permite introducir las
potencias:

Exponenciacion de numeros naturales La exponenciacion de dos numeros


naturales esta unvocamente determinada por las propiedades siguientes:
m0 = 1, mn+1 = mn m.
Dejamos como ejercicio demostrar sus propiedades:
1. Si n 6= 0, entonces 0n = 0 (pero 00 = 1, por definicion).
2. 1n = 1.
3. mn+r = mn mr .
4. (mn )r = mnr .
5. (mn)r = mr nr .
6. Si m < n y 1 < r, entonces mr < nr .
7. Si m n, entonces mr nr .
El ultimo concepto basico de la aritmetica de los numeros naturales es la
relacion de orden:

Ordenacion de los numeros naturales Diremos que un numero natural


m es menor o igual que otro n, y lo representaremos por m n, si existe un
r N tal que m + r = n. Observemos que en tal caso dicho r es unico por
la propiedad 8 precedente, por lo que podemos llamarlo resta de n y m, y lo
representaremos por n m.
Notemos que m m, porque m + 0 = m. Escribiremos m < n para indicar
que m n y m 6= n.
Por ejemplo, como 2 + 3 = 5, se cumple que 2 < 5 y que 5 2 = 3.
Veamos ahora las propiedades correspondientes:
26 Captulo 1. El lenguaje de la teora de conjuntos

1. Para todo natural n se cumple que 0 n.


En efecto, 0 + n = n.
2. Si m y n son numeros naturales, entonces m n o bien n m.
Por induccion sobre n, si n = 0 se cumple n = 0 m. Si vale para n,
tenemos que m n o bien n m. Si se da el primer caso, existe un r tal
que m + r = n, luego m + r + 1 = n + 1, luego m n + 1, como haba que
probar.
Supongamos ahora que n m y sea r tal que n+r = m. Si r = 0 entonces
n = m, luego n + 1 = m + 1, luego m n + 1, como haba que probar.
Si r 6= 0, existe un r tal que r = r + 1, luego n + r + 1 = m, luego
n + 1 m.
3. Si m n y n m, entonces m = n.
Tenemos que m + r = n y n + r = m, luego m + r + r = m = m + 0,
luego r + r = 0, luego r = r = 0, luego m = n.
4. Si m n y n r, entonces m r.
Tenemos que m + u = n y n + v = r, luego m + u + v = r, luego m r.
5. Se cumple m n si y solo si m + r n + r.
En efecto, m n equivale a que exista un u tal que m + u = n, lo cual
equivale a que m + r + u = n + r, lo cual equivale a que m + r n + r.
6. Si r 6= 0 y mr = nr, entonces m = n.
En efecto, no perdemos generalidad si suponemos m n, de modo que
n = m + u, luego nr = mr + ur, luego mr + 0 = mr + ur, luego ur = 0,
luego u = 0, luego m = n.
7. Si r 6= 0, entonces m n si y solo si mr nr.
Si m n, existe un u tal que m + u = n, luego mr + ur = nr, luego
mr nr. Recprocamente, si mr nr, entonces o bien m n, como
queremos probar, o bien n m, en cuyo caso nr mr por la parte ya
probada, luego nr = mr por 3, luego n = m por 6, luego m n.
Notemos que, trivialmente, n < S(n), luego la ordenacion que acabamos
de introducir se corresponde con la que resulta al ir generando los numeros
naturales a partir del 0 mediante la operacion siguiente, es decir:
0 < 1 < 2 < 3 < 4 <
La relacion de orden en N permite dar un significado preciso a algunas ex-
presiones con puntos suspensivos. Por ejemplo, para cada n N podemos
definir
In = {1, . . . , n}, In = {0, . . . , n 1}
y esto hay que entenderlo como que In = {m N | 1 m n} (con lo que en
particular I0 = ) e igualmente In = {m N | m < n}, que son definiciones
validas por especificacion.
1.5. Relaciones de orden 27

1.5 Relaciones de orden


Acabamos de definir una ordenacion de los numeros naturales (que no es
sino la ordenacion usual que el lector conoca sin duda de antemano). Sin
embargo, el conjunto de los numeros naturales no es el unico conjunto que
vamos a manejar en el que es posible considerar una relacion de orden, y por
ello es conveniente desarrollar una teora general o, mas bien, un lenguaje
general sobre conjuntos ordenados para estar en condiciones de aplicar los
mismos hechos generales a distintos casos particulares sin necesidad de redefinir
los conceptos y repetir las demostraciones en cada caso. Para ello necesitamos
en primer lugar una teora general sobre relaciones.

Definicion 1.15 Una relacion R en un conjunto A es un subconjunto del pro-


ducto cartesiano R A A.

En la practica, en lugar de escribir (a, b) R, escribiremos a R b y diremos


que a esta relacionado con b (respecto de la relacion R).

Observaciones Como en el caso de las funciones, en la practica podemos


olvidar que las relaciones son tecnicamente conjuntos de pares ordenados. As,
para definir una relacion R en un conjunto A basta especificar que a R b si y
solo si a y b cumplen una determinada propiedad P ab. Esto equivale a definir
R como el conjunto
R = {(a, b) A A | P ab}.
Por ejemplo, si R es una relacion en un conjunto A, podemos definir su
relacion inversa como la relacion R1 dada por

a R1 b si y solo si b R a.

Tecnicamente, R1 se define por el axioma de especificacion, como el conjunto

R1 = {x A A | existen a, b A tales que x = (a, b) y (b, a) R},

pero la primera forma de definir esta o cualquier otra relacion es mas practica.
Otro ejemplo: en la seccion anterior hemos definido la ordenacion de los
numeros naturales como una propiedad m n que pueden tener o no dos
numeros naturales dados. Ahora podemos considerar el conjunto

{(m, n) N N | m n}

y, si llamamos a este conjunto, tenemos que m n en el sentido de la


seccion anterior si y solo si se cumple esto mismo en el sentido que acabamos de
introducir, es decir, en el sentido de que el par (m, n) pertenece al conjunto .

Veamos algunos conceptos del lenguaje de las relaciones.


28 Captulo 1. El lenguaje de la teora de conjuntos

Definicion 1.16 Una relacion R en un conjunto A es:

Reflexiva si para todo a A se cumple que a R a.

Irreflexiva si para ningun a A se cumple que a R a.

Simetrica si cuando a, b A cumplen a R b tambien cumplen b R a.

Antisimetrica si cuando a, b A cumplen a R b y b R a entonces a = b.

Asimetrica si no existen a, b A que cumplan a R b y b R a.

Transitiva si cuando a, b, c A cumplen a R b y b R c entonces a R c.

Conexa si cuando a, b A, o bien se cumple a R b o bien b R a.

Una relacion en un conjunto A es una relacion de orden parcial si es


reflexiva, antisimetrica y transitiva. Si ademas es conexa, se dice que es una
relacion de orden total.
Una relacion < en un conjunto A es una relacion de orden parcial estricto
si es irreflexiva, asimetrica y transitiva. Si ademas cuando a, b A se cumple
a < b o b < a o a = b se dice que es una relacion de orden total estricto.
Un conjunto parcialmente (resp. totalmente) ordenado es una par (A, ),
donde es una relacion de orden parcial (resp. total) en A.

Observaciones En la seccion anterior hemos demostrado que la relacion


definida all sobre el conjunto N de los numeros naturales es una relacion de
orden total, y es facil ver que la relacion < definida como m < n si m n y
m 6= n es una relacion de orden total estricto.
En realidad esto es un caso particular de un hecho general: siempre que
en un conjunto A tenemos definida una relacion de orden (total o parcial) no
estricto , la relacion dada por a < b si y solo si a b y a 6= b es una relacion de
orden estricto (total o parcial segun lo sea la relacion dada) y, recprocamente,
si < es cualquier relacion de orden estricto en un conjunto A, la relacion dada
por a b si y solo si a < b o a = b es una relacion de orden no estricto, de
modo que una y otra se determinan mutuamente. Por lo tanto, es indiferente
hablar de relaciones de orden estricto o no estricto en un conjunto: siempre
que tenemos definida una, podemos dar por hecho que tenemos definida de este
modo una del otro tipo.
Al hablar de conjuntos ordenados es frecuente omitir la relacion de orden,
y decir, por ejemplo que A es un conjunto ordenado, de modo que hay que
entender que (A, ) es un conjunto ordenado con cierta relacion de orden que
no se menciona, ya sea porque es una relacion arbitraria denotada por , ya
porque sea una relacion especfica que se deduce del contexto. Por ejemplo,
siempre que hablemos de N como conjunto ordenado se entendera que hablamos
del par (N, ), donde es la relacion definida en la seccion precedente.
1.5. Relaciones de orden 29

El hecho de emplear el signo para referirnos tanto a una relacion de orden


arbitraria como a relaciones de orden concretas definidas en ciertos conjuntos
(de momento solo tenemos definida la de N) no da lugar a confusion porque rara
vez se consideran varias relaciones de orden definidas sobre un mismo conjunto,
por lo que el significado de se deduce en cada contexto de los elementos sobre
los que actua. Solo en caso de considerar varias relaciones de orden sobre un
mismo conjunto sera necesario distinguir unas de otras con signos como , ,
E, etc.
En general, si X es un conjunto parcialmente ordenado, ademas de la re-
lacion sobrentendida, tenemos la relacion estricta asociada <, y las relaciones
inversas de ambas, que representaremos siempre por y > respectivamente.
As, por ejemplo, 5 3 es lo mismo que 3 5.
Ampliamos ahora nuestro vocabulario sobre un conjunto parcialmente orde-
nado A:
1. Si X A, consideraremos a X como conjunto ordenado con la restriccion8
a X de la relacion de orden de A.
2. Si X A y m X, diremos que m es el mnimo de X si para todo x X
se cumple que m x. Notemos que si X tiene mnimo, este es unico, pues
si m y m son dos mnimos, entonces ambos estan en X y deben cumplir
m m y m m, luego m = m . Por ello podemos representarlo por
mn X (aunque recordemos que, en general, puede no existir).
3. Si X A y M X, diremos que M es el maximo de X si para todo
x X se cumple que x M . Al igual que sucede con los mnimos, si X
tiene maximo este es unico, y podemos representarlo por max X.
4. Si X A y c A, diremos que c es una cota inferior de X si para
todo x X se cumple que c x. La diferencia con el mnimo es que
no exigimos que c X, y esto hace que un mismo conjunto pueda tener
muchas cotas inferiores distintas (o ninguna).
5. Si X A y C A, diremos que C es una cota superior de X si para todo
x X se cumple x C.
Por ejemplo, si X = {3, 5, 6}, tenemos que, respecto al orden usual de N, los
numeros 0, 1, 2, 3 son cotas inferiores de X y 3 = mn X, mientras que cualquier
numero n 6 es una cota superior, y 6 = max X.
Tambien es claro que 0 = mn N, mientras que N no tiene maximo elemento,
ya que si M N fuera el maximo, debera cumplir M + 1 M , lo cual es falso.
Observemos que si un conjunto tiene maximo entonces este es el mnimo del
conjunto de sus cotas superiores, e igualmente el mnimo (si existe) es el maximo
del conjunto de sus cotas inferiores.
8 Tecnicamente, la restriccion es = (X X), de modo que, si x, y X, entonces
X A
x X y es equivalente a x A y, pero X solo esta definida para elementos de X.
30 Captulo 1. El lenguaje de la teora de conjuntos

La ordenacion de los numeros naturales tiene una propiedad notable:

Teorema 1.17 (Principio de buena ordenacion) Todo subconjunto no va-


co de N tiene un mnimo elemento.

Demostracion: Sea X N un conjunto no vaco, de modo que existe un


cierto m X. Consideremos la propiedad P c c es una cota inferior de X.
Claramente se cumple P 0, y m + 1 no tiene la propiedad P , pues no es cierto
que m + 1 m. Si fuera cierto que cuando c cumple la propiedad P tambien
la cumple c + 1, el principio de induccion nos dara que todo numero natural
cumple la propiedad P , y hemos visto que eso es falso. Por lo tanto, tiene que
existir un c N que cumpla P c, pero de modo que c + 1 no cumpla P . En otras
palabras, c es una cota inferior de X, pero c + 1 no lo es. Lo segundo significa
que existe un n X tal que n < c + 1, y lo primero implica que c n < c + 1.
De aqu se sigue9 que c = n, luego c X es el mnimo de X.
Por ejemplo, es facil probar que n + 1 = mn{m N | m > n}, es decir, que
el siguiente de un numero natural n es el mnimo numero natural mayor que n.
En general, el principio de buena ordenacion hace que si tenemos que existe
un numero natural que cumple una propiedad P , podamos considerar el mnimo
numero natural que cumple la propiedad P , es decir, el mnimo del conjunto no
vaco {n N | P n}, con lo que tenemos un numero que, ademas de cumplir P ,
cumple que ningun natural menor cumple P . Veamos un ejemplo de este tipo
de argumentacion:

Teorema 1.18 (Division eucldea) Dados dos numeros naturales D y d, con


d 6= 0, existen unos unicos c y r tales que D = dc + r y r < d.

Demostracion: Como d 6= 0, tenemos que 1 d, luego D dD. As pues,


D es un numero natural x que cumple D dx, luego podemos tomar el mnimo
numero natural x que cumple D dx.
Si D = dx, entonces basta tomar c = x y r = 0. Si, por el contrario, D < dx
entonces necesariamente x 6= 0, luego podemos considerar c = x 1 < x. Por
la minimalidad de x tiene que ser dc < D < d(c + 1) = dc + d. Sea r = D dc,
de modo que dc + r < dc + d, luego r < d.
Con esto tenemos probado que existen c y r que cumplen lo pedido. Ahora
tenemos que ver que son unicos. Si c1 , c2 , r1 , r2 cumplieran lo requerido y
c1 6= c2 , podemos suponer que c1 < c2 . Entonces

D = dc1 + r1 < dc1 + d = d(c1 + 1) dc2 dc2 + r2 = D,

contradiccion. Por lo tanto, c1 = c2 , y entonces D = dc1 + r1 = dc1 + r2 , luego


r1 = r2 .
En las condiciones del teorema anterior, se dice que c y r son, respectiva-
mente, el cociente y el resto de la division eucldea del dividendo D entre el
divisor d.
9 Tenemos que c+r = n y n+s = c+1, con s 6= 0, luego s = s +1, luego c+r+s +1 = c+1,

luego r + s = 0, luego r = 0, luego c = n.


1.5. Relaciones de orden 31

El proceso de tomar el menor numero natural que cumple una propiedad


puede usarse en una forma fuerte de razonamiento por reduccion al absurdo
conocida como demostracion por contraejemplo mnimo. Esto significa que si
queremos probar que todo numero natural cumple una propiedad P , podemos
suponer, por reduccion al absurdo que existe un numero natural que no cumple
P , y entonces tomar el mnimo numero natural n que no cumple P . As, para
llegar a un absurdo no solo contamos con que n no cumple P , sino tambien con
que todos los numeros menores que n cumplen P .
A su vez, la demostracion por contraejemplo minimal es equivalente a una
version fuerte del principio de induccion. En principio, en una demostracion por
induccion suponemos que el anterior de un numero cumple una propiedad P y
demostramos que dicho numero cumple P . Ahora vamos a ver que, si queremos,
podemos suponer como hipotesis de induccion que, no solo el inmediato anterior
del numero cumple P , sino que todos los numeros menores la cumplen:

Teorema 1.19 (Principio de induccion fuerte) Sea A N tal que, para


todo numero natural n, si todo m < n cumple que m A, tambien n A.
Entonces A = N.

Si aplicamos esto a un conjunto de la forma A = {n N | P n}, vemos que si


suponemos como hipotesis de induccion que todos los numeros menores que uno
dado n tienen la propiedad P y llegamos a que n tambien tiene la propiedad P ,
podemos concluir que todo numero natural n tiene la propiedad P .
Demostracion: Si no es cierto que A = N, como A N, tiene que existir
un n N que no este en A. Podemos tomar entonces un contraejemplo mnimo,
es decir, el mnimo numero natural n que no esta en A. Dicho numero tiene la
propiedad de que todos los menores que el s que estan en A, luego la hipotesis
del teorema nos dice que n tiene que estar en A, y eso es una contradiccion.

Observemos que con esta formulacion no hace falta exigir una demostracion
aparte de P 0, porque es trivialmente cierto que todo numero natural menor
que 0 cumple la propiedad P , y estamos suponiendo que bajo este caso trivial
de la hipotesis de induccion podemos demostrar P 0. Esto no quita para que,
en la practica, al suponer que todo numero natural menor que n cumple P ,
pueda ser conveniente tratar por separado los casos n = 0 (donde la hipotesis
de induccion no aporta nada) y n 6= 0.
Existe un principio de recursion fuerte analogo al principio de induccion
fuerte. Segun el principio de recursion, para definir una funcion f : N A
por recurrencia basta especificar f (0) y como puede calcularse f (n + 1) a partir
de f (n), es decir, basta imponer una relacion de la forma f (n+1) = g(f (n)) que
exprese f (n + 1) como una funcion dada de f (n). Ahora vamos a probar que,
si queremos, podemos definir f (n) como funcion de todos los valores previos
f (0), . . . , f (n 1) o, en otras palabras, que para definir f (n) podemos suponer
que f ya esta definida sobre los numeros anteriores a n.
32 Captulo 1. El lenguaje de la teora de conjuntos

Enunciar esto con precision requiere algunas definiciones previas. Recorde-


mos que hemos definido In = {0, . . . , n 1} (en particular I0 = ). Vamos
a llamar A al conjunto10 de todas las aplicaciones h : In A, para algun
n N. Si f : N A, para cada n N definimos fn = f |In A , as fn es la
restriccion de f a los numeros naturales menores que n. En particular f0 = .

Principio de recursion fuerte Si A es un conjunto y g : A A, existe


una unica aplicacion f : N A tal que para todo n N se cumple que
f (n) = g(fn ).
Notemos que esto expresa lo que hemos indicado: que podemos definir f (n)
como una cierta funcion de fn , es decir, definir f suponiendo que f ya esta
definida sobre los numeros menores que n.
Demostracion: Diremos que h es una aproximacion si existe un n N tal
que h : In A y para todo m n se cumple que h(m) = g(h|Im ). Veamos

que si m n y h : Im A, h : In A son dos aproximaciones, entonces
h |Im
= h, es decir, que ambas coinciden sobre la parte comun de su dominio.


En efecto, si no es as, existe un i Im tal que h(i) 6= h (i). Podemos tomar
el mnimo numero natural en el que esto sucede, y entonces h|Ii = h |Ii , luego
h(i) = g(h|Ii ) = g(h |Ii ) = h (i), por definicion de aproximacion, contradiccion.

Ahora veamos que para cada m N existe una aproximacion h : Im A.

Lo probamos por induccion sobre m. Para m = 0 es I0 = y basta tomar

h = . Si vale para m y tenemos una aproximacion h : Im A, definimos

h : Im+1 A como la aplicacion que sobre Im coincide con h y ademas
h (m) = g(h). Es claro que h es una aproximacion, pues si n Im

se cumple

que h (n) = h(n) = g(h|In ) = g(h |In ), y para n = m tenemos tambien que
h (m) = g(h) = g(h |Im
).

Ahora basta definir f : N A como f (n) = h(n), donde h es cualquier


aproximacion que tenga a n en su dominio. Hemos probado que no importa cual
elijamos, pues todas coinciden en la parte comun de sus dominios. En particular
fn = h|In , luego se cumple que f (n) = h(n) = g(h|In ) = g(fn ), como queramos
probar.
La unicidad de f se debe a que si existiera otra f : N A que cumpliera lo
mismo y f 6= f , entonces existira un n N tal que f (n) 6= f (n), y podramos
tomar el menor numero natural que cumple esto, en cuyo caso fn = fn , luego
f (n) = g(fn ) = g(fn ) = f (n), contradiccion.
En la practica nunca hay necesidad de explicitar cual es exactamente la
funcion g que estamos considerando al aplicar el principio de recursion fuerte.
La idea es que podemos definir f (n) con cualquier criterio que involucre la
10 Notemos que A es un conjunto, pues si h : I A, entonces h I A N A,
n n
luego h P(N A), luego podemos definir por especificacion
A = {h P(N A) | existe un n N tal que h : In

A}.
1.6. Conjuntos finitos 33

restriccion fn . Cualquier criterio explcito que asigne un elemento de A a una


funcion fn que se supone definida podra plasmarse en una funcion g adecuada.
En particular, puesto que en la definicion de f (n + 1) podemos hacer referencia

a fn+1 , tambien podemos hacer referencia al dominio de fn+1 , que es In+1 ,o
bien al maximo del dominio de fn+1 , que es n. Esto nos da un principio de
recursion intermedio entre el que acabamos de demostrar y el que tenamos ya
probado:

Para definir una funcion f : N A podemos definir f (0) y luego


definir f (n + 1) en funcion de f (n) y de n.

Veamos un ejemplo de esta situacion:

Definicion 1.20 Definimos la funcion factorial N N, en la que la imagen


de un numero natural n se representa por n!, como la dada por las condiciones

0! = 1, (n + 1)! = n! (n + 1).

De este modo

0! = 1, 1! = 1, 2! = 1 2, 3! = 1 2 3, 4! = 1 2 3 4, ...

y en general resumiremos la definicion recurrente de n! mediante la expresion


con puntos suspensivos: n! = 1 2 n, con el convenio adicional de que 0! = 1.
Tecnicamente, esta definicion no se ajusta a las condiciones de la version
original del principio de recursion, porque no se define (n + 1)! como funcion
unicamente de n!, sino de n! y de n, pero, por lo que acabamos de explicar, la
existencia y unicidad de la funcion factorial s que esta justificada por la version
fuerte del principio de recursion.

1.6 Conjuntos finitos


Ya hemos observado que N es un conjunto infinito, pero no hemos introducido
ninguna definicion formal que nos permita distinguir entre conjuntos finitos e
infinitos. Ahora estamos en condiciones de hacerlo. Para ello conviene introducir
un concepto general:

Definicion 1.21 Diremos que dos conjuntos X e Y son equipotentes y lo re-


presentaremos por X Y , si existe una aplicacion f : X Y biyectiva.

Por ejemplo, los conjuntos A = {0, 1, 2} y C = {0, 2, 4} son equipotentes,


pues en la pagina 15 se muestra una biyeccion k : A C. Recordemos que
las biyecciones emparejan los elementos de un conjunto con los de otro, de
modo que cuando entre dos conjuntos se puede establecer una biyeccion esto
se traduce en lo que normalmente expresamos diciendo que tienen el mismo
numero de elementos (en el ejemplo, A y C tienen ambos tres elementos). Esa
es la idea que vamos a explotar aqu. Antes demostramos unas propiedades
elementales:
34 Captulo 1. El lenguaje de la teora de conjuntos

Teorema 1.22 Se cumple:11

1. X X.

2. Si X Y , entonces Y X.

3. Si X Y e Y Z, entonces X Z.

Demostracion: 1) La identidad iX : X X es una aplicacion biyectiva


que prueba que todo conjunto es equipotente a s mismo.
2) Si X Y , existe f : X Y biyectiva, y es claro entonces que la
aplicacion inversa f 1 : Y X es biyectiva, luego Y X.
3) Por hipotesis existen f : X Y y g : Y Z biyectivas, y es facil
comprobar entonces que f g : X Z es biyectiva.
La existencia de una aplicacion inyectiva f : A B se traduce en que
los objetos de A pueden emparejarse uno a uno con los de B, aunque pueden
sobrar objetos en B (que no sobren equivale a que f sea suprayectiva y, por
consiguiente, biyectiva). Por lo tanto, el teorema siguiente es intuitivamente
obvio, aunque una prueba formal requiere distinguir algunos casos:

Teorema 1.23 Para todo par de numeros naturales m y n, existe una apli-
cacion inyectiva f : Im In si y solo si m n.

Demostracion: Recordemos que In = {1, . . . , n}. Si m n, es claro que


Im In , por lo que la inclusion i : Im In es una aplicacion inyectiva.
Falta probar que si m > n no puede existir f : Im In inyectiva. De
no ser as, podemos tomar el menor numero natural m para el que existe una
aplicacion f : Im In inyectiva con n < m.
El conjunto In tiene que contener las imagenes por f de los elementos de
Im , luego In 6= , luego n 6= 0. A su vez esto implica que m 6= 0. Digamos que
m = m + 1 y que n = n + 1.
Si n no tiene antiimagen por f , entonces f |Im : Im In inyectiva, y
n < m , con lo que m < m cumple la misma propiedad que m, cuando se
supona que m era el mnimo que la cumpla, contradiccion.
Supongamos pues que existe un a Im tal que f (a) = n. Si a = m, sigue
siendo cierto que f |Im : Im In es inyectiva, pues al quitar m del dominio
de la aplicacion, ya no necesitamos a n en la imagen, y tenemos la misma
contradiccion.
11 Quiza el lector piense que la equipotencia puede considerarse una relacion en el sentido

de la seccion anterior, es decir, que podamos considerar que la relacion es el conjunto


E = {(X, Y ) | X Y }. Sin embargo, no existe tal conjunto E. La razon es que, siS existiera,
todo Sconjunto
S X cumplira que (X, X) = {{X}, S {X,
S X}} E, luego {X} E, luego
X E, luego podramos definir V = {X E | X = X}, y sera el conjunto de
todos los conjuntos, que ya sabemos que lleva a una contradiccion. Esta es una de las pocas
ocasiones en las que rozaremos el abismo.
1.6. Conjuntos finitos 35

Supongamos, por ultimo, que a < m. En- Im In


tonces f (m) = b In , con b 6= n, pues si m
f n

fuera b = n sera f (m) = f (a), luego m = a.

Por lo tanto b In . Esto nos permite definir
g : Im In como la aplicacion que coin- a
- - - - - - - - -
-

-- b
g
cide con f salvo que f (a) = b, que sigue siendo
inyectiva y nos lleva a la misma contradiccion.
En particular, si Im In , tenemos aplicaciones biyectivas (luego inyectivas)
de uno en otro y viceversa, luego el teorema anterior nos da que m = n. Esto
justifica la definicion siguiente:

Definicion 1.24 Un conjunto X es finito si existe un n N tal que X In .


En tal caso n es unico y recibe el nombre de cardinal de X. Lo representaremos
por |X|. Los conjuntos que no son finitos se llaman infinitos.

El calculo del cardinal de un conjunto es lo que normalmente se llama con-


tar. Por ejemplo, un conjunto A = {a, b, c}, donde a, b y c son distintos dos
a dos cumple |A| = 3, porque podemos definir f : I3 A biyectiva mediante
f (1) = a, f (2) = b, f (3) = c.
De este modo, por la propia definicion vemos que |In | = n. En particular
|| = 0 y, de hecho, es el unico conjunto de cardinal 0.
El resultado fundamental sobre cardinales es el siguiente:

Teorema 1.25 Dos conjuntos finitos son equipotentes si y solo si tienen el


mismo cardinal. Todo conjunto equipotente a un conjunto finito es finito.

Demostracion: Si X es un conjunto finito y X Y , entonces existe un


n tal que In X Y , luego In Y , luego Y es finito y |Y | = |X| = n. Si
|X| = |Y | = n, entonces X In Y , luego X Y .
Otro hecho basico es el siguiente:

Teorema 1.26 Si X es un conjunto finito e Y X, entonces Y es finito,


|Y | |X| y se da la igualdad |Y | = |X| si y solo si Y = X.

Demostracion: Sea X un conjunto finito y supongamos que existe un


x X. Sea n = |X| y sea f : In X biyectiva. Notemos que n 6= 0, pues
estamos suponiendo que X 6= . Por lo tanto n = n + 1.
Podemos suponer que f (n) = x, pues si la antiimagen de x es un m < n,
podemos considerar la aplicacion g : In X que coincide con f salvo que
g(n) = f (m) y g(m) = f (n). Es facil ver que g sigue siendo biyectiva, pero as
se restringe a una biyeccion In X \ {x}. Por lo tanto, X \ {x} es finito y
|X \ {x}| = |X| 1.
Pasemos ya a probar el enunciado, por induccion sobre |X|. Si |X| = 0
entonces X = , luego necesariamente Y = y |X| = |Y | = 0.
36 Captulo 1. El lenguaje de la teora de conjuntos

Si vale para conjuntos de cardinal n y |X| = n + 1, distinguimos dos casos:


si Y = X entonces trivialmente Y es finito y tiene el mismo cardinal que X. En
caso contrario existe un x X \ Y , con lo que Y X \ {x}, que segun hemos
probado es un conjunto finito de cardinal n. Por la hipotesis de induccion Y es
finito y |Y | |X \ {x}| = n < n + 1 = |X|.
Por ejemplo, ahora podemos probar:

Teorema 1.27 N es infinito.

Demostracion: Si N fuera finito, tendra un cardinal n N, pero eso


es imposible, porque In+1 N y, segun el teorema anterior, se cumplira que
n + 1 = |In+1 | |N| = n, contradiccion.
Para probar que un conjunto X tiene cardinal menor o igual que otro con-
junto Y no hace falta que X Y , sino que basta con que exista una aplicacion
inyectiva de X en Y . Mas en general:

Teorema 1.28 Sea X 6= un conjunto arbitrario e Y un conjunto finito. Las


afirmaciones siguientes son equivalentes:12
1. X es finito y |X| |Y |.
2. Existe una aplicacion f : X Y inyectiva.
3. Existe una aplicacion g : Y X suprayectiva.

Demostracion: 1 2. Sea |X| = n, |Y | = m. Basta componer una


biyeccion X In con la inclusion In Im con una biyeccion Im Y . El
resultado es una aplicacion f : X Y inyectiva.
2 1. Tenemos que f [X] Y , luego f [X] es finito y |f [X]| |Y |. Ademas
f : X f [X] biyectiva, luego X es finito y |X| = |f [X]| |Y |.
2 3. Fijemos x0 X y definimos g : Y X mediante
 1
f (y) si y f [X],
g(y) =
x0 si y Y \ f [X].

Es inmediato comprobar que g es suprayectiva, pues cada x X tiene a f (x)


por antiimagen.
3 2. Sea |Y | = n y fijemos una aplicacion h : In Y biyectiva.
Entonces g = h g : In X es suprayectiva. Sea f : X In la aplicacion
dada por f (x) = mn g 1 [x]. Es facil ver que es inyectiva, al igual que lo es
f = f h : X Y .
Otro resultado notable sobre aplicaciones entre conjuntos finitos es el si-
guiente:
12 El hecho de que la negacion de 1 implique la negacion de 2 se conoce como principio

del palomar, pues se ilustra con este ejemplo: si en un palomar hay mas palomos que nidos,
tiene que haber al menos un nido con mas de un palomo (porque la aplicacion que a cada
palomo le asigna su nido no puede ser inyectiva).
1.6. Conjuntos finitos 37

Teorema 1.29 Sea f : X Y una aplicacion entre dos conjuntos finitos del
mismo cardinal. Entonces f es inyectiva si y solo si f es suprayectiva si y solo
si f es biyectiva.

Demostracion: Si f es inyectiva, entonces f : X f [X] biyectiva, luego


|f [X]| = |X| = |Y |, luego f [X] = Y por 1.26, luego f es suprayectiva.
Si f es suprayectiva pero no inyectiva, existen x, x X distintos tales que
f (x) = f (x ), pero entonces f |X\{x} : X \ {x} Y sigue siendo suprayectiva,
luego |Y | |X \ {x}| < |X| = |Y |, contradiccion.
Hemos definido la suma de numeros naturales mediante una relacion recu-
rrente que la caracteriza. Ahora podemos demostrar que la suma se corresponde
con la idea que todos tenemos de ella: m + n es el numero de cosas que tenemos
cuando juntamos m cosas a otras n cosas.

Teorema 1.30 Si X e Y son conjuntos finitos disjuntos, entonces X Y es


finito, y |X Y | = |X| + |Y |.

Demostracion: Sean f : Im X, g : In Y biyectivas. Entonces


podemos definir h : Im+n X Y mediante

f (u) si 1 u m,
h(u) =
g(u m) si m + 1 u m + n.

Notemos que si m+1 u m+n, entonces 1 um n, luego um In . Es


facil ver que h es biyectiva, luego X Y es finito y |X Y | = m + n = |X| + |Y |.

Ahora probamos un resultado mas general:

Teorema 1.31 Si X e Y son conjuntos finitos, entonces

|X Y | = |X| + |Y | |X Y |.

Demostracion: Basta tener en cuenta que X Y = X (Y \ (X Y )),


donde X e Y \ (X Y ) son disjuntos. Por el teorema anterior

|X Y | = |X| + |Y \ (X Y )|.

Por otra parte Y = (X Y ) (Y \ (X Y )) y los dos conjuntos son disjuntos,


luego nuevamente por el teorema anterior

|Y | = |X Y | + |Y \ (X Y )|.

Por lo tanto |Y \ (X Y )| = |Y | |X Y |, luego sustituyendo en la primera


ecuacion obtenemos la formula del enunciado.
Ahora interpretamos el producto:

Teorema 1.32 Si X e Y son conjuntos finitos, entonces X Y es finito y


|X Y | = |X||Y |.
38 Captulo 1. El lenguaje de la teora de conjuntos

Demostracion: Lo probamos por induccion sobre |Y |. Si |Y | = 0 entonces


Y = , y es claro que X Y = , luego es finito y |X Y | = 0 = |X||Y |.
Si vale cuando |Y | = n y suponemos que |Y | = n + 1, tomamos y Y , de
modo que |Y \ {y}| = n, y por hipotesis de induccion X (Y \ {y}) es finito y
|X (Y \ {y})| = |X| n. Ahora basta observar que

X Y = (X (Y \ {y}) (X {y}),

que la union es disjunta y que X {y} X (a traves de la biyeccion (x, y) 7 x),


luego X {y} es finito y |X {y}| = |X|. Por el teorema 1.30 concluimos que
X Y es finito y que

|X Y | = |X| n + |X| = |X|(n + 1) = |X||Y |.

Vamos a contar algunos conjuntos mas. Observemos que si f : A B


entonces f A B, luego f P(A B). Por lo tanto, si definimos, por
especificacion,
B A = {f P(A B) | f : A B},
entonces B A es el conjunto de todas las aplicaciones de A en B. El que se
represente con esa notacion se debe al teorema siguiente:

Teorema 1.33 Si A y B son conjuntos finitos, entonces B A es un conjunto


finito y |B A | = |B||A| .

Demostracion: Por induccion sobre |A|. Si |A| = 0, entonces A = , y


tecnicamente existe una aplicacion de A en B, porque : B es cierto,
si nos ajustamos a la definicion de aplicacion. Por lo tanto B A = {} y es un
conjunto finito de cardinal |B A | = 1 = |B|0 = |B||A| .
Supongamos que el resultado es cierto cuando |A| = n y supongamos que
|A| = n + 1. Sea a A y sea A = A \ {a}, que es un conjunto finito de

cardinal n. Por hipotesis de induccion B A es finito y |B A | = |B|n .

Definimos f : B A B A B mediante f (g) = (g|A , g(a)). Es facil ver

que f es biyectiva. Por lo tanto B A B A B, y el teorema anterior nos da
A
que B es finito y |B | = |B ||B| = |B| |B| = |B|n+1 = |B||A| .
A A n

Teorema 1.34 Si X es un conjunto finito, PX es finito y |PX| = 2|X| .

Demostracion: Basta observar que f : {0, 1}X PX definida por


f (g) = g 1 [1] es biyectiva, y luego aplicar el teorema anterior.
Terminamos con otra propiedad importante de los conjuntos finitos:

Teorema 1.35 Si A es un conjunto finito no vaco y es cualquier relacion


de orden total sobre A, entonces A tiene maximo y mnimo elemento.
1.7. Productos cartesianos 39

Demostracion: Sea |A| = n > 0 y sea f : A In biyectiva. Supon-


gamos que A no tiene maximo elemento (para el caso del mnimo se razona
analogamente). Eso significa que, para todo x A, existe un y A tal que
x < y. De entre todos los y que cumplen esto, podemos elegir aquel para el que
f (y) es mnimo. Esto nos da un criterio para definir una aplicacion g : A A
con la propiedad de que x < g(x), para todo x A. Podemos aplicar el principio
de recursion, que nos da una aplicacion h : N A tal que h(0) es cualquier
elemento prefijado de A y h(n + 1) = g(h(n)).
Observemos que si m < n, entonces h(m) < h(n). En efecto, lo razonamos
por induccion sobre n. Si n = 0 no se cumple m < 0, luego la implicacion
se cumple trivialmente. Si vale para n y suponemos que m < n + 1, entonces
m n. Si m = n entonces h(m) < g(h(m)) = h(m + 1) = h(n + 1), como haba
que probar, y si m < n entonces por hipotesis de induccion

h(m) < h(n) < g(h(n)) = h(n + 1)

y concluimos igualmente. Pero esto significa que h es inyectiva, con lo que


podemos afirmar que N es finito, y as tenemos una contradiccion.
En particular, si A N no es vaco y consideramos en A el orden usual de
los numeros naturales, sabemos que A tiene mnimo elemento, y ahora podemos
afirmar que tiene maximo si y solo si es finito, pues si es finito tiene maximo
por el teorema anterior, y si tiene maximo m, entonces A Im {0}, luego es
finito.

1.7 Productos cartesianos


Hemos definido los conceptos de par ordenado y de producto cartesiano de
dos conjuntos, pero conviene dar una definicion alternativa que se generalice
facilmente a familias de mas de dos conjuntos. Para ello conviene introducir
antes algunos convenios de notacion muy habituales:
A veces, en lugar de expresar mediante X : I A que X es una aplicacion
de un conjunto I en otro conjunto A, escribiremos {Xi }iI , y escribiremos Xi
en lugar de X(i).
Cuando empleamos esta notacion tenemos que distinguir entre {Xi }iI , que
es una aplicacion, y {Xi | i I} = X[I], que es el conjunto formado por todos
los conjuntos Xi , es decir, la imagen de la aplicacion.
En el caso particular en que I = In es frecuente usar notaciones alternativas,
como {Xi }ni=1 o (Xi )ni=1 o incluso, con puntos suspensivos: (X1 , . . . , Xn ). Los
objetos de esta forma se llaman n-tuplas de conjuntos13 . En definitiva, lo que
estamos diciendo es que el objeto representado por (X1 , . . . , Xn ) o por {Xi }ni=1
no es mas que una aplicacion con dominio In y rango en un conjunto que no
especificamos, que a cada numero i le asigna una imagen X(i) = Xi .
13 para n = 2 son pares, para n = 3 son ternas, para n = 4 son cuadruplas, para n = 5

quntuplas y, en general, n-tuplas.


40 Captulo 1. El lenguaje de la teora de conjuntos

Por ejemplo, la quntupla x = (4, 5, 5, 2, 0) es una aplicacion x : I5 N tal


que x1 = 4, x2 = 5, x3 = 5, x4 = 2, x5 = 0. Tecnicamente es el conjunto

x = {(1, 4), (2, 5), (3, 5), (4, 2), (5, 0)},

pero no ganamos nada representandolo as.


Volviendo al caso general, a menudo se dice que {Xi }iI es una familia14
(indexada) de conjuntos. Recordemos que X : I B, para cierto conjunto B.
Entonces definimos el producto cartesiano de {Xi }iI como el conjunto
Q S
Xi = {x ( B)I | para cada i I se cumple x(i) Xi }.
iI
Q
Con la notacion que estamos introduciendo, los elementos x Xi son de
iI
la forma x = {xi }iI = (xi )iI , es decir, familias de conjuntos (que son como
n-tuplas generalizadas, no necesariamente finitas) tales que xi Xi .
En el caso particular en que todos los conjuntos Xi coinciden con un mismo
conjunto X, entonces el producto cartesiano coincide con el conjunto que ya
hemos definido como X I , es decir, el conjunto de todas las aplicaciones de I
en X. Sin embargo, con la notacion que estamos introduciendo, cada x X I
lo representaremos de la forma x = (xi )iI .
En el caso de una familia {Xi }ni=1 (es decir, cuando I = In ), representaremos
tambien el producto cartesiano con las notaciones alternativas
Qn
Xi = X1 Xn ,
i=1

y sus elementos son las n-tuplas (x1 , . . . , xn ) tales que xi Xi .


En el caso de los productos con I = In y con todos los factores iguales a un
mismo conjunto X, escribiremos
n veces
n
Q z }| {
n
X = X = X X,
i=1

cuyos elementos son n-tuplas (x1 , . . . , xn ) con cada xi X.


De este modo, ahora tenemos dos interpretaciones posibles de (3, 5) N N.
Podemos considerar que N N es el producto cartesiano definido originalmente,
en cuyo caso (3, 5) = {{3}, {3, 5}}, o bien que es el que acabamos de definir,
14 Tambien es frecuente llamar familias (no indexadas) de conjuntos a cualquier conjunto

cuyos elementos sean conjuntos. Segun los convenios que estamos adoptando todos los con-
juntos estan formados por conjuntos, por lo que la diferencia entre un conjunto y una familia
de conjuntos es puramente psicologica: al decir familia de conjuntos estamos indicando que
nos interesa ver a sus elementos como conjuntos. Por ejemplo, nadie llama a N familia de
conjuntos, porque, aunque los numeros naturales son conjuntos, eso es algo que en la practica
se olvida, mientras que PN s se considera una familia de conjuntos, porque sus elementos,
no solo son conjuntos, sino que ademas se conciben como tales.
1.7. Productos cartesianos 41

en cuyo caso (3, 5) = {(1, 3), (2, 5)}. Sin embargo, resulta totalmente irrele-
vante si nos referimos a uno o a otro, pues la naturaleza conjuntista del par
(3, 5) no tiene importancia. Lo unico que importa es que (3, 5) es un conjunto
que determina unvocamente una primera componente 3 y una segunda com-
ponente 5. Podemos adoptar el convenio de que, a partir de ahora, todos los
productos cartesianos que consideremos lo son en el nuevo sentido que acabamos
de introducir, pero eso no tiene ninguna traduccion sensible en la practica.
Notemos que A1 es casi lo mismo que A, pero no exactamente. Esta formado
por todas las aplicaciones de {1} en A, luego A1 = {{(1, a)} | a A}. As la
aplicacion A A1 dada por a 7 (1, a) es biyectiva y hace que todo lo que
digamos para A tenga una traduccion obvia a A1 y viceversa.
Q
En general, cada producto cartesiano Xi tiene asociadas las proyecciones,
Q iI
que son las aplicaciones pi : Xi Xi dadas por pi (x) = xi . Claramente son
suprayectivas. iI

Terminamos esta seccion con algunos resultados de combinatoria15:


Si {Xi }iI es una familia de conjuntos, podemos definir
S S T T
Xi = {Xi | i I}, Xi = {Xi | i I}
iI iI

(la segunda definicion requiere que I 6= ). Cuando I = In usaremos tambien


las notaciones alternativas
n
S n
T
Xi = X1 Xn , Xi = X1 Xn .
i=1 i=1

Teorema 1.36 Toda union finita de conjuntos finitos es finita.

Demostracion: Por induccion sobre el numero de conjuntos que unimos.


Si tenemos una familia {Xi }1i=1 , entonces la union es X1 que es finito por
hipotesis. Si vale para uniones de n conjuntos, entonces
n+1
S n
S
Xi = Xi Xn+1 ,
i=1 i=1

que es una union de dos conjuntos finitos, el primero por hipotesis de induccion
y el segundo por hipotesis. Por lo tanto, es finita.
Similarmente se prueba que todo producto cartesiano de un numero finito
de conjuntos finitos es finito.

Definicion 1.37 Si A es un conjunto, llamaremos A AA al conjunto de


todas las aplicaciones f : A A biyectivas.

Ya hemos probado que si A es un conjunto finito con |A| = n, entonces


|AA | = nn . Ahora vamos a calcular el cardinal de A .
15 Se llama combinatoria al calculo de cardinales de conjuntos finitos.
42 Captulo 1. El lenguaje de la teora de conjuntos

Teorema 1.38 Si A es un conjunto finito y |A| = n, entonces |A | = n!

Demostracion: Si f : A B es biyectiva, podemos definir una apli-


cacion F : A B biyectiva mediante F (x) = f 1 x f , por lo que
|A | = |B |. Esto hace que no perdamos generalidad si suponemos A = In .
Escribiremos n en lugar de In .
Notemos que n es el conjunto de todas las n-tuplas (m1 , . . . , mn ) cuyas
componentes son distintas dos a dos.
Ahora observamos que podemos definir H : n+1 In+1 n como la
aplicacion que a cada n+1-tupla (m1 , . . . , mn+1 ) con mi = n + 1 le asigna el par
formado por i como primera componente y la n-tupla que resulta de suprimir mi
en (m1 , . . . , mn+1 ). Una comprobacion rutinaria muestra que H es biyectiva,
luego |n+1 | = |In+1 n | = (n + 1)|n |.
Ahora basta razonar que |n | = n! por induccion. Si n = 0 entonces, por
las sutilezas de la logica, es 0 = {}, luego |0 | = 1 = 0! Si se cumple para n,
entonces |n+1 | = |n |(n + 1) = n!(n + 1) = (n + 1)!

1.8 Relaciones de equivalencia


Terminamos este captulo introduciendo otro concepto conjuntista basico,
que hasta ahora no hemos necesitado, pero que aparecera constantemente en
los temas siguientes.

Definicion 1.39 Una relacion de equivalencia en un conjunto A es una relacion


R en A que es reflexiva, simetrica y transitiva.

Recordemos que, explcitamente esto significa que todo a A cumple a R a,


si a R b entonces tambien b R a y si a R b y b R c entonces a R c.

Ejemplo Consideremos X = {1, 2, 3}, A = PX y R la relacion en A dada por

U RV si y solo si |U | = |V |.

Es inmediato que se trata de una relacion de equivalencia, pues todo conjunto


tiene el mismo cardinal que el mismo, si U tiene el mismo cardinal que V
entonces V tiene el mismo cardinal que U , y si U tiene el mismo cardinal que V
y V tiene el mismo cardinal que W entonces U tiene el mismo cardinal que W .
El diagrama siguiente nos permite formarnos una imagen de la relacion:

{1} {1, 2}

{2} {1, 3} {1, 2, 3}

{3} {2, 3}
1.8. Relaciones de equivalencia 43

Cada flecha a b indica que a R b. El hecho de que la relacion sea reflexiva


se traduce en que cada elemento tiene una flecha en forma de rizo, el hecho de
que sea simetrica se traduce en que todas las flechas son dobles , y el hecho
de que sea transitiva se traduce en que los ocho elementos de A se agrupan en
bloques totalmente conectados. Esos bloques son las clases de equivalencia que
vamos a definir a continuacion.

Definicion 1.40 Sea R una relacion de equivalencia en un conjunto A. Para


cada a A la clase de equivalencia de a es el conjunto

[a]R = {x A | x R a}

de todos los elementos de A relacionados con a. El conjunto de todas las clases


de equivalencia16 de A respecto de R se llama conjunto cociente y se representa
por A/R. La aplicacion p : A A/R dada por p(a) = [a]R se llama proyeccion
canonica y claramente es suprayectiva.

As, en el ejemplo precedente vemos que hay cuatro clases de equivalencia,


por lo que el cociente A/R tiene cuatro elementos, uno correspondiente a cada
cardinal posible de un subconjunto de X. Tambien podemos constatar en el los
hechos generales que recoge el teorema siguiente:

Teorema 1.41 Sea R una relacion de equivalencia en un conjunto A.


1. Si a A, entonces a [a]R .
2. Si a, b A, entonces a R b si y solo si [a]R = [b]R .
3. Si a, b A, entonces no a R b si y solo si [a]R [b]R = .
Por lo tanto, A/R es una particion de A, es decir, una familia de subcon-
juntos de A no vacos y disjuntos dos a dos cuya union es A.

Demostracion: 1) es inmediato, porque a R a.


2) Si a R b, probamos la igualdad de sus clases por doble inclusion: si se
cumple x [a]R , entonces x R a, luego x R b por transitividad, luego a [b]R .
La otra inclusion se prueba igual, teniendo en cuenta que b R a por simetra.
Recprocamente, si [a]R = [b]R , entonces a [a]R = [b]R , luego a R b.
3) Si [a]R [b]R 6= , existe x [a]R [b]R , luego x R a y x R b, luego por
simetra y transitividad a R b. Recprocamente, si a R b, entonces a [a]R [b]R ,
luego [a]R [b]R 6= .
La notacion [a]R que hemos introducido para las clases de equivalencia es
generica, pero a menudo introduciremos notacion especfica para cada relacion
que consideremos.
16 Notemos que dicho conjunto se puede definir por especificacion, pues se trata de
A/R = {X PA | existe un a A tal que X = [a]R }.
44 Captulo 1. El lenguaje de la teora de conjuntos

La idea subyacente al concepto de clases de equivalencia y conjunto cociente


es que formalizan un proceso de abstraccion: si en un conjunto de bolas de
colores consideramos la relacion de equivalencia ser del mismo color, cada
clase de equivalencia contendra a las bolas de un mismo color, y el conjunto
cociente tendra un elemento por cada color que puedan tener las bolas, igual
que en el ejemplo anterior el cociente tena un elemento por cada cardinal posible
que pueden tener los conjuntos considerados.
Captulo II

Anillos

Sin duda el lector estara familiarizado con numerosas propiedades y reglas


de operacion que involucran sumas, productos, cocientes, desigualdades, valores
absolutos, etc. A lo largo de este libro nos vamos a encontrar diversos contextos
en los que unas mismas reglas de operacion son validas, y para no tener que
justificarlas individualmente en cada caso, es util axiomatizarlas, es decir, fijar
como axiomas unas propiedades basicas de modo que, si comprobamos que
son aplicables en un contexto dado, automaticamente son validas tambien las
numerosas consecuencias derivables de dichos axiomas. Esto lleva al concepto
de anillo o mas en general, al de estructura algebraica, que es un conjunto
dotado de ciertas funciones y/o relaciones que satisfacen ciertos axiomas. En
el captulo anterior ya nos hemos encontrado con una de ellas, la de conjunto
ordenado, que hemos definido como un par (A, ) formado por un conjunto
A y una relacion de orden en A. En este captulo introduciremos algunas mas
(esencialmente las relacionadas con la estructura de anillo), aunque mas adelante
tendremos ocasion de introducir y estudiar otras mas.

2.1 Leyes de composicion interna


El primer paso en la direccion que nos acabamos de marcar es dar una
definicion general de operacion en un conjunto, que generalice a la suma y
el producto de numeros naturales, que son las unicas operaciones que hemos
introducido hasta ahora.

Definicion 2.1 Una ley de composicion interna o una operacion interna en un


conjunto A es una aplicacion : A A A. En la practica, en lugar de
escribir ((a, b)) para representar la imagen del par (a, b) por la aplicacion ,
usaremos la notacion a b.

En definitiva, una ley de composicion interna en un conjunto A es cualquier


criterio que nos permita operar dos cualesquiera de sus elementos a y b para
obtener un nuevo elemento a b de A.

45
46 Captulo 2. Anillos

Al final de la seccion 1.4 hemos introducido la suma y el producto de numeros


naturales. Tecnicamente, hemos definido la suma m + n como fm (n), donde
fm : N N es una funcion definida por recurrencia en terminos de m. Ahora
podemos definir + como la aplicacion que a cada par (m, n) N N le asigna
esta suma m+n, y as + pasa a tener un significado autonomo, concretamente
el de una ley de composicion interna en N. Lo mismo se aplica al producto.
Veamos algunas definiciones generales. Fijemos un conjunto A con una ley
de composicion interna .

1. Se dice que es asociativa si cumple

(a b) c = a (b c),

para todos los elementos a, b, c A.

2. Se dice que es conmutativa si cumple ab = ba para todos los elementos


a, b A.

3. Un elemento neutro para es un elemento e A tal que a e = e a = a,


para todo a A.
Observemos que una operacion no puede tener mas de un elemento
neutro, pues si tiene dos, digamos e y e , de la definicion se sigue que
e = e e = e .

4. Si A tiene elemento neutro e, un elemento opuesto para un a A es un


b A tal que a b = b a = e.

De todas las propiedades que puede tener una ley de composicion interna, la
asociativa va a ser para nosotros irrenunciable, es decir, no vamos a estudiar
ninguna operacion que no la posea. Esto nos lleva a introducir una de las
estructuras algebraicas mas elementales:

Definicion 2.2 Un semigrupo es un par (A, ), donde A es un conjunto y es


una ley de composicion interna en A que cumple la propiedad asociativa. Si
ademas cumple la propiedad conmutativa diremos que (A, ) es un semigrupo
conmutativo.

As, estudiar los semigrupos es estudiar las propiedades disponibles siempre


que contemos con una ley asociativa, sea esta cual sea.
Por ejemplo, una propiedad elemental es que si (A, ) es un semigrupo con
elemento neutro e y a A tiene inverso, entonces dicho inverso es unico. En
efecto, si tiene dos inversos b y b , se cumple que

b = b e = b (a b ) = (b a) b = e b = b .

Vamos a introducir dos convenios habituales de notacion para las leyes de


composicion interna:
2.1. Leyes de composicion interna 47

Notacion multiplicativa Usaremos para representar cualquier ley de com-


posicion interna asociativa en un conjunto dado A. En tal caso, si la operacion
tiene elemento neutro, lo representaremos por 1, y si un a A tiene elemento
opuesto, lo representaremos por a1 y lo llamaremos tambien elemento inverso.

Notacion aditiva Usaremos + para representar cualquier ley de composicion


interna asociativa y conmutativa en un conjunto dado A. En tal caso, si la
operacion tiene elemento neutro, lo representaremos por 0, y si un a A tiene
elemento opuesto, lo representaremos por a y lo llamaremos tambien elemento
simetrico. Tambien adoptaremos el convenio de escribir ab en lugar de a+(b).
Hay que entender que la notacion multiplicativa la aplicaremos tanto para
leyes conmutativas como no conmutativas, mientras que la notacion aditiva solo
la usaremos para leyes conmutativas.
Otro convenio habitual es el de omitir las leyes de composicion (u otras rela-
ciones o funciones asociadas) al nombrar una estructura algebraica, tal y como
ya hemos establecido para el caso de los conjuntos ordenados. As, hablaremos
de un semigrupo A en lugar de escribir (A, ) o (A, +), dejando al contexto si
usamos la notacion aditiva o multiplicativa. En otras palabras, cuando decimos
que A es un semigrupo, hay que entender que en realidad nos estamos refiriendo
a un par (A, +) o (A, ).
Veamos otro ejemplo en el que difieren las notaciones multiplicativa y aditiva:
para cada a A en un semigrupo con elemento neutro y cada n N podemos
definir an (si la notacion es multiplicativa) o na (si es aditiva) mediante las
relaciones recurrentes:

a0 = 1, an+1 = an a, 0 a = 0, (n + 1)a = na + a.

Notemos que no hemos definido dos operaciones, sino una sola, escrita con
dos notaciones distintas. Dejamos como ejercicio demostrar por induccion sus
propiedades basicas que expresamos con notacion multiplicativa y tradu-
cirlas a notacion aditiva.

am+n = am an , (am )n = amn , (ab)n = an bn .

La tercera solo es valida si ab = ba (de donde, por induccion, se prueba como


paso previo que bn a = abn ).
Tambien conviene observar que al particularizar estas definiciones a los se-
migrupos (N, +) y (N, ) obtenemos las definiciones usuales de producto y expo-
nenciacion de numeros naturales.
Una potencia an es el resultado de multiplicar a por s mismo n veces. Ahora
vamos a definir el producto de n elementos de un semigrupo, no necesariamente
iguales entre s.
48 Captulo 2. Anillos

Definicion 2.3 Sea (A, ) un semigrupo con elemento neutro y sea {ai }ni=0 una
sucesion de elementos de A. Definimos por recurrencia,1
Q Q Q
ai = 1, ai = ( ai ) aj ,
i<0 i<j+1 i<j

para j n, de modo que en particular tenemos definido el producto finito de


los elementos dados:
n
Q Q
a0 an = ai = ai .
i=0 i<n+1

Esta es la notacion que usaremos cuando empleemos la notacion multiplica-


tiva
P en el semigrupo. Si usamos notacion aditiva usaremos el signo de sumatorio
, es decir, la definicion anterior se traduce a

P P j
P
ai = 0, ai = ai + aj ,
i<0 i<j+1 i<j

n
P P
y en particular a1 + + an = ai = ai .
i=0 i<n+1

Hemos definido productos y sumas finitas con ndices que empiezan en 0,


pero podemos partir de cualquier numero natural si definimos:
n
Q nm
Q
ai = am+i , para m n,
i=m i=0

y analogamente con notacion aditiva.


Las sumas y productos finitos definidos de este modo satisfacen una serie de
propiedades obvias, como que se pueden partir por cualquier punto 0 i n:

a0 an = (a0 ai )(ai+1 an ).

Desde un punto de vista tecnico, estas obviedades se traducen en una serie


de tediosos argumentos rutinarios por induccion que el lector puede consultar
en el apendice al final de este captulo si esta interesado en ellos.
Veamos una aplicacion de las sumas finitas:

Teorema 2.4 Si k > 1 es un numero natural, para cada m N no nulo existe


una unica sucesion {ci }ni=0 de numeros menores que k tal que cn 6= 0 y
n
P
m= ci k i .
i=0
1 Tecnicamente estamos aplicando el teorema de recursion de este modo: definimos una

funcion f : N A mediante f (i) = ai si i n y f (i) = 1 en otro caso. A su vez, definimos


g : N A mediante g(0) = 1 y g(j + 1) = g(j) f (j), de modo que g(j + 1) se define como
n
Q
funcion de g(j) y de j. Finalmente, ai = g(n + 1).
i=0
2.1. Leyes de composicion interna 49

Demostracion: Observemos en primer lugar que m < k m . En efecto, para


m = 0, 1 es inmediato, y si vale para m 1, entonces

m + 1 m + m = 2m < k k m = k m+1 .

Por lo tanto, hay un mnimo n m tal que m < k n . No puede ser n = 0,
pues entonces sera m = 0, luego n = n + 1 y se cumple k n m < k n+1 .
Observemos que la unicidad de n implica la de n, es decir, hemos probado que
para todo natural m > 0 existe un unico natural n tal que k n m < k n+1 .
Llamaremos o(m) a este unico n.
Si dividimos m = k n c + m , con m < k n , tiene que ser c < k, ya que si
fuera c k, tendramos m k n k = k n+1 . Ademas c > 0, o de lo contrario
m = m < k n . As pues, todo numero natural m > 0 puede expresarse en la
forma
m = ck n + m , 0 < c < k, m < k n m.
Observemos que esta expresion es unica, pues necesariamente n = o(m) (ya
que m < (k 1)k n + k n = kk n = k n+1 ) y entonces c y m estan unvocamente
determinados como cociente y resto de la division eucldea. Vamos a probar
que todo natural m no nulo admite una descomposicion como la que indica el
enunciado con n = o(m).
Razonamos por induccion sobre m. Supuesto cierto para todo m < m,
consideramos la expresion m = ck n + m . Si m = 0 entonces m = ck n ya tiene
la forma deseada. En caso contrario, por hipotesis de induccion

n
P
m = ci k i ,
i=0

donde n = o(m ) < n (porque m < k n ) y, definiendo ci = 0 para n < i < n y


cn = c, tenemos que
n
P n1
P n
P
m= ci k i + ci k i + cn k n = ci k i .
i=0 i=n +1 i=0

Para probar la unicidad observamos que


n
P
kn ci k i < k n+1 .
i=0

En efecto, la primera desigualdad se sigue de que cn 6= 0 separando el ultimo


sumando, y la segunda se prueba por induccion sobre n. Si vale para n, entonces
n+1
P n
P
ci k i = ci k i + cn+1 k n+1 < k n+1 + (k 1)k n+1 = k n+2 .
i=0 i=0

Por lo tanto, razonando por induccion sobre m, si tenemos dos descomposi-


ciones
n
P n
P
m= ci k i = ci k i
i=0 i=0
50 Captulo 2. Anillos

en las condiciones del enunciado, necesariamente n = n = o(n), con lo que, por


la unicidad de la descomposicion

n1
P n1
P
cn k n + ci k i = cn k n + ci k i
i=0 i=0

(notemos que hemos probado que los segundos sumandos son < k n ), tenemos
que cn = cn y
n1
P n1
P i
ci k i = ci k .
i=0 i=0

Llamamos n y n a los maximos naturales tales que cn 6= 0 y cn 6= 0, respecti-


vamente, de modo que

n
P n
P
ci k i = ci k i .
i=0 i=0

Por hipotesis de induccion n = n y ci = ci para todo i < n, lo que implica que


las dos sucesiones {ci }in y {ci }in son iguales.

Definicion 2.5 La sucesion {ci }in dada por el teorema anterior se llama re-
presentacion en base k del numero m. Es habitual usar la notacion
n
P
cn c0(k) = ci k i .
i=0

Por ejemplo, 232(5) = 252 +35+2. Observemos que, en general, k = 1k+0,


por lo que la representacion de k en base k es k = 10(k) .

Sin mas razon de peso que el hecho de que el numero de dedos que tenemos
en las manos, cuando no se especifica la base se entiende que es k = 9 + 1, de
modo que la notacion usual para este valor de k es k = 10. As pues, convenimos
en que
n
P
cn c0 = ci 10i .
i=0

De este modo, todo numero natural tiene un nombre canonico en terminos de


las diez cifras 0, . . . , 9, aunque la eleccion del numero 10 es puramente arbitraria.
En principio, la menor base admisible es k = 2, de modo que, por ejemplo,
10 = 23 + 2 = 1010(2). Por lo tanto, todo numero natural admite un nombre
canonico en terminos unicamente de las cifras 0 y 1.

Con este resultado tenemos ya justificados todos los resultados de la aritme-


tica elemental (la que conocen los ninos), salvo que no vamos a describir aqu
los algoritmos sobradamente conocidos para sumar, restar, multiplicar y dividir
numeros naturales a traves de sus desarrollos decimales.
2.2. Los numeros enteros 51

2.2 Los numeros enteros


Los numeros naturales y su aritmetica tienen una interpretacion geometrica
intuitiva. Podemos visualizarlos como puntos equidistantes en una recta:

0 1 2 3 4 5 6 7 8 9 10
De este modo la relacion de orden m < n se interpreta como m esta a la
izquierda de n, sumar 2 + 3 se interpreta como situarse en el punto asignado
al 2 y desplazarse 3 lugares hacia la derecha, mientras que restar 5 3 consiste
en situarse sobre el 5 y desplazarse tres lugares hacia la izquierda. El hecho de
que no se pueda restar 5 7 se interpreta como que no podemos desplazarnos 7
lugares a la izquierda del 5 sin salirnos de los puntos asignados a los numeros
naturales.
Ahora vamos a introducir los numeros enteros, que extienden a los numeros
naturales de modo que la figura anterior se completa hasta:

5 4 3 2 1 0 1 2 3 4 5
Sumar dos numeros enteros se interpreta como partir del punto asignado al
primero y desplazarse tantos lugares como indica el segundo hacia la derecha si
este es positivo o hacia la izquierda si es negativo. Este paso de los numeros
naturales a los enteros tiene interes por muchas razones. Senalamos algunas:

Desde un punto de vista puramente algebraico, obtenemos una estructura


mas rica. Concretamente, todo numero entero tiene un opuesto para la
suma, cosa que no le sucede a ningun numero natural, salvo el 0.

Esto tiene a su vez consecuencias aritmeticas. Por ejemplo, si tratamos


unicamente con numeros naturales y tenemos una igualdad a + b = c + d,
no podemos pasar a a c = d b a menos que tengamos la garanta de que
a c y d b, lo cual no tiene por que suceder a priori y puede obligarnos
a descomponer el razonamiento en varios casos. En cambio, si trabajamos
con numeros enteros un paso as siempre es valido.

Por otra parte, aunque es todava un ejemplo muy elemental, es un primer


paso hacia la conceptualizacion abstracta de la aritmetica. Para alguien
que solo conozca los numeros naturales, la suma y la resta son dos opera-
ciones distintas, consistentes en moverse en sentidos opuestos, en anadir
en un caso y en sustraer en otro. Sin embargo, para quien concibe a los
numeros naturales como una parte de los numeros enteros, una resta mn
es lo mismo que la suma m+(n). Los numeros enteros permiten concebir
como una misma cosa lo que parecan ser dos cosas bastante diferentes.

Por ultimo, de cara a las aplicaciones geometricas, se trata de un paso


mas en el camino que nos llevara a asignar un numero a cada punto de
una recta, lo cual a su vez permite traducir a terminos algebraicos los
problemas geometricos.
52 Captulo 2. Anillos

Aunque sin duda el lector tendra un concepto claro de los numeros enteros
y su aritmetica, ahora debemos concretar tecnicamente esa idea en terminos de
conjuntos, es decir, hemos de definir los numeros enteros como unos conjuntos
adecuados, al igual que hemos hecho con los numeros naturales. Una forma
rapida de hacerlo sera definir, por ejemplo, los enteros no negativos como los
de la forma (0, n), con n N, y los enteros negativos como los de la forma (1, n),
con n N no nulo. En estos terminos el entero 5 sera el par (0, 5), mientras
que 5 sera el par (1, 5). Sin embargo, aunque rapido, no es un criterio muy
practico, porque para definir la suma de numeros enteros en estos terminos y
demostrar sus propiedades basicas tendramos que distinguir tediosamente casos
y mas casos. Hay una forma mucho mas elegante de construir un conjunto que
podamos tomar razonablemente como el conjunto de los numeros enteros.
La idea es que cada numero entero puede expresarse como resta de dos
numeros naturales. Por ejemplo, 5 = 7 2 y 5 = 2 7. En general, cada par
(m, n) N N determina el numero enero m n (que aun no tenemos definido),
pero podemos pensar de definir el numero entero m n precisamente como el
par (m, n). Entonces el conjunto de los numeros enteros sera tecnicamente
N N, aunque al final nos olvidaramos de ello.
Sin embargo, esto no es viable literalmente, porque pares como (2, 7) y
(10, 15) deben ser el mismo numero entero 5, y dos cosas distintas no pueden
ser la misma cosa. Este problema ontologico se resuelve mediante un procedi-
miento que nos aparecera de forma recurrente en muchos contextos: cuando
queremos definir un objeto como abstraccion de una propiedad comun de
varios de ellos en este caso queremos abstraer de cada par (m, n) la resta
que determina definimos la relacion de equivalencia que relaciona a dos obje-
tos si y solo si deberan representar al mismo objeto y formamos el conjunto
cociente.
En nuestro caso, si nos preguntamos cuando dos pares (a, b) y (c, d) de
numeros naturales deberan dar lugar a la misma resta a b = c d, la
respuesta es cuando a + d = b + c. Lo importante es que esta ultima condicion
es una igualdad entre numeros naturales que, al contrario que a b = c d, no
involucra ningun concepto que no tengamos ya definido. En conclusion:
Definicion 2.6 Definimos en N N la relacion de equivalencia dada por
(a, b) R (c, d) si y solo si a + d = b + c.
Llamaremos conjunto de los numeros enteros al cociente Z = (N N)/R. La Z
es por el aleman Zahl (numero).
La comprobacion de que la relacion R es de equivalencia no ofrece nin-
guna dificultad. Por ejemplo, la transitividad se debe a que si (a, b) R (c, d) y
(c, d) R (e, f ), entonces
a + d = b + c, c + f = d + e,
luego sumando miembro a miembro a + d + c + f = b + c + d + e y, simplificando,
a + f = b + e, luego (a, b) R (e, f ).
2.2. Los numeros enteros 53

De momento representaremos por [a, b] la clase de equivalencia de par (a, b),


si bien enseguida encontraremos una notacion mas conveniente. En principio,
como caso particular de 1.41, sabemos que [a, b] = [c, d] si y solo si a + d = b + c.
Si n N, definimos

+n = [n, 0] Z, n = [0, n] Z

Llamaremos numeros enteros positivos y negativos, respectivamente, a los ele-


mentos de los conjuntos

Z+ = {+n | n N, n > 0}, Z = {n | n N, n > 0},

y aparte definimos 0 = [0, 0] Z.


Se cumple entonces que Z = Z {0} Z+ y los tres conjuntos son disjuntos
dos a dos. En efecto:
Todo numero entero es de la forma [m, n], con m, n N. Si m < n
entonces [m, n] = [0, n m] Z , si m = n entonces [m, n] = [0, 0] y si
m > n entonces [m, n] = [m n, 0] Z+ .
Si [m, n] Z+ Z entonces [m, n] = [r, 0] = [0, s], para ciertos r, s > 0,
pero entonces r + s = 0, lo cual solo es posible si r = s = 0, contradiccion.
Igualmente, si [m, 0] = [0, 0] es que m = 0, luego ningun numero de Z+ es
igual a 0, e igualmente con Z .
En otras palabras, todo numero entero es positivo, negativo o cero, y no
puede ser dos cosas a la vez. Por consiguiente, Z consta exactamente de los
elementos
0, +1, 1, +2, 2, +3, 3, . . .
y es importante que en esta enumeracion no aparecen terminos repetidos, es
decir, que solo puede suceder que +n = +m o que n = m si m = n (por
ejemplo, +n = +m equivale a [n, 0] = [m, 0], y a su vez a n = m).

Ordenacion de los numeros enteros Definimos en Z la relacion dada por2

[a, b] [c, d] si y solo si a + d b + c.

No es inmediato que esto sea una definicion valida. En general, cuando


definimos una relacion o una funcion sobre las clases de equivalencia de un
conjunto cociente, es necesario comprobar que la definicion no depende de la
eleccion de los representantes de las clases. Concretamente, si [a, b] = [a , b ]
y [c, d] = [c , d ], sera incoherente que usando la primera representacion ob-
tuvieramos que [a, b] [c, d], mientras que usando la segunda obtuvieramos
[a , b ] 6 [c , d ].
2 La idea detras de esta definicion es que pretendemos que las clases [a, b] y [c, d] representen

a las restas a b y c d, respectivamente, y a b c d equivale a a + d b + d, de modo


que esta ultima relacion no involucra las restas a b y c d que no tenemos definidas.
54 Captulo 2. Anillos

Pero esto no sucede: tenemos que a + b = b + a y c + d = d + c . Si ademas


a+d b+c, entonces, sumando todo, a+d+b+a +c+d b+c+a+b +d+c ,
y simplificando, a + d b + c .
Es facil comprobar que se trata de una relacion de orden total:
[a, b] [a, b], pues a + b a + b.
Si [a, b] [c, d] y [c, d] [a, b], entonces a + d b + c y c + b d + a, luego
a + d = b + c, luego [a, b] = [c, d].
Si [a, b] [c, d] y [c, d] [e, f ], entonces a + d b + c y c + f d + e.
Sumando ambas desigualdades y simplificando, queda a + f b + e, luego
[a, b] [e, f ].
Si m n, entonces +m +n y n m, pues lo primero equivale a que
[m, 0] [n, 0], es decir, a que m n, y lo segundo a que [0, n] [0, m] ,
es decir, tambien a que m n.
Para todo m, n N no nulos se cumple que m 0 +n, pues lo primero
equivale a que [0, m] [0, 0], y a su vez a que 0 m, e igualmente con la
segunda desigualdad.
Teniendo en cuenta que todo numero entero es 0 o de la forma n, con
n > 0, los dos ultimos puntos implican que la relacion de orden es total y que
con esta ordenacion

< 5 < 4 < 3 < 2 < 1 < 0 < +1 < +2 < +3 < +4 < +5 <

En particular, el conjunto Z+ de los enteros positivos es el formado por los


enteros mayores que 0, mientras que los enteros negativos Z son los enteros
menores que 0.

Suma y producto de numeros enteros Definimos ahora una suma y un


producto3 en Z:

[a, b] + [c, d] = [a + c, b + d], [a, b][c, d] = [ac + bd, ad + bc].

De nuevo hay que justificar que estas operaciones estan bien definidas en el
sentido de que no dependen de la eleccion de los representantes, es decir, que si
[a, b] = [a , b ] y [c, d] = [c , d ], entonces [a + c, b + d] = [a + c , b + d ] y tambien
[ac + bd, ad + bc] = [a c + b d , a d + b c ].
Dejamos como ejercicio el caso de la suma y comprobamos el producto.
Tenemos que a + b = b + a y que c + d = d + c , y queremos probar que

ac + bd + a d + b c = ad + bc + a c + b d .
3 Si pensamos que [a, b] y [c, d] pretenden representar las restas (que aun no tenemos defini-

das) ab y cd, el producto se define teniendo en cuenta que (ab)(cd) = ac+bd(bc+ad),


y la definicion adecuada de la suma se deduce analogamente.
2.2. Los numeros enteros 55

Esto equivale a

ac + bd + a d + b (c + d) = (a + b )d + bc + a c + b d ,

ac + bd + a d + b c + b d = a d + bd + bc + a c + b d ,
(a + b )c + a d = a (c + d) + bc,
a c + bc + a d = a c + a d + bc.
Por lo tanto, se da la igualdad requerida.
Veamos las propiedades de estas operaciones (en todas ellas se entiende que
m, n, r, etc. son numeros enteros cualesquiera):

1. (m + n) + r = m + (n + r).
En efecto, ([a, b]+[c, d])+[e, f ] = [a+c+e, b+d+f ] = [a, b]+([c, d]+[e, f ]),
donde hemos usado la asociatividad de la suma de numeros naturales.

2. m + n = n + m.
[a, b] + [c, d] = [a + c, b + d] = [c + a, d + c] = [c, d] + [a, b].

3. m + 0 = m.
[a, b] + [0, 0] = [a, b]

4. Todo numero entero tiene un opuesto para la suma, pues

[a, b] + [b, a] = [a + b, a + b] = 0.

Mas precisamente, si n N tenemos que +n + (n) = 0, luego el opuesto


de +n es n y viceversa.

5. (mn)r = m(nr).
Hay que comprobar que ([a, b][c, d])[e, f ] = [a, b]([c, d][e, f ]). Basta aplicar
rutinariamente la definicion del producto a ambos miembros hasta com-
probar que la expresion resultante es la misma (usando las propiedades de
la suma y el producto de los numeros naturales).

6. mn = nm.
La comprobacion es analoga a la de la propiedad anterior.

7. m(+1) = m.
La definicion de producto da que [a, b][1, 0] = [a, b].

8. m(n + r) = mn + mr.
La comprobacion es analoga a la de 5.

9. Si mn = 0, entonces m = 0 o n = 0.
56 Captulo 2. Anillos

10. Si m n, entonces m + r n + r.
Suponemos que [a, b] [c, d], luego a + d b + c, y queremos probar que
[a + b] + [e, f ] [c + d] + [e, f ], es decir, que [a + e, b + f ] [c + e, d + f ] o,
equivalentemente, que a + e + d + f b + f + c + e, lo cual es claramente
cierto.

11. Si m 0 y n 0, entonces mn 0.
Sabemos que los enteros no negativos son los de la forma +m, +n, con
m y n naturales, y entonces (+m)(+n) = +(mn) 0. En efecto, por la
propia definicion, [m, 0][n, 0] = [mn, 0].

Podramos demostrar muchas propiedades mas, pero estas son las unicas
que necesitamos demostrar antes de olvidarnos de que hemos construido los
numeros enteros como clases de equivalencia de pares de numeros naturales.
En efecto, para prescindir completamente de ese tecnicismo solo nos falta una
observacion:
Consideremos la aplicacion i : N {0} Z+ dada por i(n) = +n (notemos
que +0 = 0). Ya hemos probado que es biyectiva, y que m < n equivale a
i(m) < i(n). Ahora podemos observar ademas que

i(m + n) = i(m) + i(n), i(mn) = i(m)i(n).

Mas explcitamente, que +(m + n) = +m + (+n) y que +(mn) = (+m)(+n).


Esto significa que la aplicacion i es un diccionario que hace corresponder
cualquier afirmacion aritmetica sobre los numeros naturales 0, 1, 2, 3, . . . con la
afirmacion correspondiente sobre los enteros no negativos 0, +1, +2, +3, . . . de
modo que 3 < 5 es equivalente a +3 < +5, y 2 + 5 = 7 es equivalente a que
+2 + (+5) = +7, y 2 3 = 6 es equivalente a que (+2)(+3) = +6. As, todo lo
que sabemos sobre numeros naturales sigue siendo cierto si los sustituimos por
los enteros no negativos4 y, por consiguiente, a partir de ahora podemos olvi-
darnos de los conjuntos que hasta ahora tomabamos como numeros naturales
y pasar a considerar que los numeros naturales son los enteros no negativos.
Esto nos permite afirmar que

N = {0} Z+ Z,

de modo que la suma y el producto de numeros naturales son las restricciones


a N N de las operaciones correspondientes en Z. En particular, ya no es
necesario emplear la notacion +1, +2, +3, etc., que usabamos para distinguir a
los numeros enteros positivos de los numeros naturales correspondientes, sino
que podemos eliminar el signo + y llamar 1, 2, 3, etc. a los enteros positivos, que
a partir de ahora son tambien los numeros naturales.
4 Mas precisamente, es facil ver que {0} Z+ es un sistema de Peano tomando como

operacion siguiente la funcion S(n) = n+(+1), por lo que es un conjunto de numeros naturales
tan valido como cualquier otro.
2.3. Conceptos basicos sobre anillos 57

Ademas, a partir de ahora ya nunca necesitaremos recordar que los numeros


enteros son clases de equivalencia de pares de los antiguos numeros naturales,
sino que nos bastara saber que Z esta formado por los numeros naturales y sus
opuestos (junto con que se cumplen las propiedades que hemos demostrado).
No obstante, recordamos por ultima vez la construccion de Z para explicitar
la idea subyacente que la ha dirigido en todo momento, es decir, que la clase
[m, n] pretenda representar la resta no definida m n. Ahora podemos afirmar
(sin hacer referencia a restas no definidas) que

[m, n] = [m, 0] + [0, n] = +m + (n) = m n,

donde m y n son numeros naturales antiguos en la primera expresion y


numeros naturales nuevos enteros no negativos en la ultima.

2.3 Conceptos basicos sobre anillos


Las reglas que sin duda domina el lector sobre manipulacion de expresiones
que involucran sumas, productos, desigualdades, etc. sobre numeros enteros
son aplicables en muchos otros contextos que nos van a ir apareciendo en lo
sucesivo, pero para justificar que algunas propiedades que sabemos validas para
los numeros enteros son aplicables en otros contextos es necesario saber que
propiedades basicas deben cumplirse en tales contextos alternativos para que la
extrapolacion este justificada. Eso nos lleva a la estructura algebraica de anillo
y a otras relacionadas con ella:

Definicion 2.7 Un anillo es una terna (A, +, ) en la que A es un conjunto


y +, son dos leyes internas en A, de modo que se cumplan las propiedades
siguientes:
1. (a + b) + c = a + (b + c) para todos los a, b, c de A.
2. a + b = b + a para todos los a, b de A.
3. Existe un elemento 0 en A tal que a + 0 = a para todo a de A.
4. Para todo a de A existe un a en A tal que a + (a) = 0.
5. (ab)c = a(bc) para todos los a, b, c de A.
6. a(b + c) = ab + ac
(a + b)c = ac + bc para todos los a, b, c de A.

En otros terminos, un anillo es una combinacion de dos semigrupos (A, +) y


(A, ), el primero tiene que ser conmutativo y con elemento neutro 0 (que, segun
sabemos, es unico) y ademas todo elemento a tiene que tener un opuesto a,
que tambien es unico. Al segundo semigrupo no le pedimos en principio que sea
conmutativo ni que tenga elemento neutro, pero s que satisfaga la propiedad 6,
que se conoce como propiedad distributiva del producto respecto de la suma.
58 Captulo 2. Anillos

Como es habitual, usaremos los signos + y para referirnos a las operaciones


de un anillo arbitrario, a las que llamaremos suma y producto, de modo que
estos signos tendran una interpretacion distinta segun el contexto. Del mismo
modo, cuando digamos que A es un anillo, querremos decir que hablamos de
una terna (A, +, ), para ciertas operaciones no indicadas explcitamente.
Si el producto de un anillo cumple la propiedad conmutativa diremos que
el anillo es conmutativo. Si tiene elemento neutro (que sera unico, lo repre-
sentaremos por 1 y lo llamaremos la identidad de A) diremos que el anillo es
unitario.
Las propiedades que hemos demostrado en la seccion precedente demuestran
que (Z, +, ) es un anillo, al que en lo sucesivo, segun lo indicado, nos referiremos
simplemente como Z.
El teorema siguiente contiene unas cuantas propiedades sencillas de los ani-
llos. Todas ellas se cumplen en particular en el caso de Z, pero aun mas im-
portante es saber que podremos usarlas al trabajar con cualquier conjunto del
que sepamos que tiene estructura de anillo, por muy abstracta que pueda ser la
naturaleza de sus elementos y de sus operaciones.

Teorema 2.8 Sea A un anillo y a, b, c elementos de A.

1. Si a + b = a + c entonces b = c.

2. Si a + a = a entonces a = 0.

3. (a) = a.

4. 0 a = a 0 = 0.

5. (a)b = a(b) = (ab).

6. (a)(b) = ab.

7. (a + b) = a b.

Demostracion:

1. a + b = a + c a + a + b = a + a + c 0 + b = 0 + c b = c.

2. a + a = a a + a = a + 0 a = 0.

3. a + a = 0 = a + ((a)) a = (a).

4. 0 a = (0 + 0)a = 0 a + 0 a 0 a = 0.

5. (a)b + ab = (a + a)b = 0b = 0 (a)b = (ab).

6. (a)(b) = (a(b)) = ((ab)) = ab.

7. (a b) + (a + b) = a a + b b = 0 (a b) = (a + b).
2.3. Conceptos basicos sobre anillos 59

De la construccion de los numeros enteros hemos obtenido que los hay de


dos clases: positivos, como +5, y negativos, como 5. Ya hemos justificado que
podamos suprimir el + del +5 al identificarlo con el numero natural 5, y ahora
vemos que el del 5 puede entenderse como la notacion general que expresa
que 5 es el simetrico de 5, del mismo modo que tenemos que 5 = (5).
Si aplicamos en particular las propiedades 5 y 6 a numeros naturales a y b
obtenemos las conocidas reglas de los signos para Z:
negativo positivo = negativo, negativo negativo = positivo
a las que hay que anadir, por supuesto, que positivo positivo = positivo, que
no expresa sino que el producto de numeros naturales es un numero natural.
Con estas propiedades tambien quedan justificadas las reglas de los signos
para la suma. Por ejemplo:
5 9 = (5 + 9) = (9 5) = 4.
En general, ahora es facil justificar que para restar dos numeros naturales se
resta el mayor menos el menor y se pone el signo del mayor.
Las propiedades que hemos demostrado sobre Z en la seccion anterior van
bastante mas alla de lo que exige la definicion de anillo conmutativo y unitario,
lo cual significa que no todas las propiedades de Z son extrapolables a cualquier
anillo. A continuacion vamos a ir introduciendo algunas definiciones generales
correspondientes a propiedades que se cumplen en Z.
Empezamos por un hecho basico, y es que en Z se cumple que 1 6= 0, mientras
que la definicion de anillo unitario no excluye la posibilidad de que 1 = 0. Ahora
bien, este caso es muy particular, pues si un anillo A cumple esta propiedad,
entonces todo a A cumple a = a 1 = a 0 = 0. En suma, la igualdad 1 = 0
solo puede darse si A = {0}.
Los anillos que mas nos van a interesar son los que llamaremos dominios,
que son los anillos conmutativos y unitarios en los que 1 6= 0.
Claramente, Z es un dominio.
Notemos, por otra parte, que en cualquier anillo se cumple a 0 = 0 a = 0,
pero no es cierto en general que si ab = 0 uno de los factores tenga que ser nulo,
propiedad que si se cumple en Z, segun hemos visto.
Definicion 2.9 Un elemento a de un dominio A es un divisor de cero si es no
nulo y existe un b en A no nulo tal que ab = 0. Un dominio ntegro es un
dominio sin divisores de cero.
Tenemos, pues, que Z es un dominio ntegro.
Una propiedad muy importante de los dominios ntegros es que en ellos
podemos simplificar elementos no nulos de las igualdades, es decir, si en un
dominio ntegro tenemos que ab = ac y a 6= 0, entonces b = c, pues a(b c) = 0,
luego b c = 0.
Ejercicio: Dotar a Z Z de una estructura de dominio que no sea ntegro.
60 Captulo 2. Anillos

Definicion 2.10 Un anillo ordenado es una cuadrupla (A, +, , ) de manera


que (A, +, ) es un dominio, (A, ) es un conjunto totalmente ordenado y se
cumplen las dos propiedades de compatibilidad siguientes:
1. Si a b, entonces a + c b + c, para todos los a, b, c A.
2. Si a 0 y b 0 entonces ab 0.
Los elementos no nulos de cualquier anillo ordenado pueden dividirse en
positivos y negativos segun que sean mayores o menores que 0. Representa-
remos por A+ y A al conjunto de los elementos positivos y negativos de A,
respectivamente.
En la seccion anterior hemos demostrado que Z es un anillo ordenado. Vea-
mos las propiedades que se deducen de este hecho (y que, por lo tanto, son
validas en cualquier anillo ordenado):
Teorema 2.11 Sea A un anillo ordenado. En las propiedades siguientes se
entiende que a, b, etc. son elementos de A:
1. Si a b y c d, entonces a + c b + d.
2. Si a < b y c d, entonces a + c < b + d.
3. a b si y solo si b a 0.
4. Si a b, entonces b a.
5. a 0 si y solo si a 0.
6. Si a b y c 0, entonces ac bc.
7. Si a b y c 0, entonces bc ac.
8. a2 0.
9. 1 > 0
Demostracion: 1) Claramente a + c b + c b + d.
2) Si a < b no puede ser a + c = b + c, pues esto implica a = b, luego
a + c < b + d b + d.
3) a b si y solo si 0 = a a b a.
4) Por la propiedad anterior, ambas afirmaciones equivalen a b a 0.
5) Es un caso particular de la propiedad precedente.
6) Tenemos que b a 0, luego (b a)c 0, luego bc ac 0,luego ac bc.
7) Tenemos que c 0 y por la propiedad anterior ac bc, luego
bc ac.
8) Si a 0 entonces a2 0 por la propiedad 2) de compatibilidad. Si a 0,
entonces a 0, luego a2 = (a)2 0.
9) Basta tener en cuenta que 1 = 12 .
2.3. Conceptos basicos sobre anillos 61

En particular, la propiedad 1 implica que si b 0 entonces a a+b y esto se


generaliza facilmente a sumas finitas: si a1 , . . . , an son elementos no negativos
de A, entonces ai a1 + + an . En particular, si una suma de elementos
no negativos es 0, necesariamente todos los sumandos son 0. Equivalentemente,
una suma finita de terminos positivos es positiva.
Si A es un dominio ntegro y a A es no nulo, entonces a2 6= 0, luego
la propiedad 8 puede refinarse a a2 > 0. Teniendo en cuenta la observacion
precedente, si a1 , . . . , an son elementos de A cualesquiera y a21 + + a2n = 0,
necesariamente a1 = = an = 0.
Definicion 2.12 Si A es un anillo ordenado, definimos las aplicaciones valor
absoluto | | : A A y signo sig : A {1, 0, 1} mediante
(
 1 si a > 0,
a si a 0,
|a| = sig(a) = 0 si a = 0,
a si a < 0,
1 si a < 0.
Observemos que la imagen del valor absoluto esta, mas concretamente, en
el conjunto de los elementos no negativos de A. En particular, para Z tenemos
que | | : Z N.
En general, cada elemento de a puede reconstruirse a partir de su signo y su
valor absoluto mediante la relacion a = sig(a)|a|.
Teorema 2.13 Sea A un anillo ordenado. Entonces
1. |a| = 0 si y solo si a = 0.
2. | 1| = 1.
3. |a| = | a|.
4. |a| b si y solo si b a b.
5. |a + b| |a| + |b|.
6. ||a| |b|| |a b|.
7. |ab| = |a||b|.
Demostracion: Las tres primeras propiedades son inmediatas por la defi-
nicion de valor absoluto.
4) Si |a| b y a 0, entonces a b y b a 0 a b. Si a 0
entonces tenemos a b, luego b a 0 a b.
Recprocamente, si b a b, entonces multiplicando por 1 queda que
b a b, luego, sea a 0 o a 0, se cumple que |a| b.
5) Como |a| |a|, por el apartado anterior |a| a |a|, e igualmente
|b| b |b|. Sumando las desigualdades:
(|a| + |b|) a + b |a| + |b|,
luego |a + b| |a| + |b|.
62 Captulo 2. Anillos

6) |a| = |a b + b| |a b| + |b|, luego |a| |b| |a b|. Igualmente


|b| |a| |b a| = |a b|, luego

|a b| |a| |b| |a b|,

luego ||a| |b|| |a b|.


7) Es claro que |a||b| = ab, y e positivo, luego es |ab|.
Vamos a definir operaciones entre numeros enteros y los elementos de un
anillo.

Definicion 2.14 Sea A un anillo, a un elemento de A y n un numero entero.


Definimos el elemento na como5
n veces

a + + a si n > 0
na = 0 si n=0

n veces
(a) + + (a) si n < 0
n veces
Si n > 0 definimos tambien an = a a. Si A es unitario a0 = 1, y si a es
n veces
una unidad y n < 0, entonces an = a1 a1 .

Es pura rutina comprobar los hechos siguientes.

Teorema 2.15 Sea A un anillo unitario y a, b elementos de A (que supondre-


mos inversibles cuando proceda). Sean m y n numeros enteros. Se cumple:
1. m(a + b) = ma + mb.

2. (m + n)a = ma + na.
3. (m)a = (ma) = m(a).

4. m(na) = (mn)a.
5. Si ab = ba entonces (ab)m = am bm .
6. am+n = am an .

7. (am )n = amn .
8. am = (a1 )m = (am )1 .

Ademas si A = Z, ma es lo mismo en el sentido de la definicion anterior que


en el sentido del producto usual en Z.

Para terminar de exponer las propiedades basicas de Z probamos que es


posible dividir eucldeamente numeros enteros:
5 En general, estas definiciones con puntos suspensivos se traducen facilmente en defini-

ciones recurrentes.
2.3. Conceptos basicos sobre anillos 63

Teorema 2.16 Sean D y d numeros enteros con d no nulo. Entonces existen


unos unicos enteros c y r tales que D = dc + r y 0 r < |d|.

Demostracion: Consideremos los numeros naturales |D| y |d|. Sabemos


que existen naturales c y r tales que |D| = |d|c + r, con 0 r < |d|.
Si r = 0 entonces cambiando el signo de c si es preciso tenemos D = dc + 0.
Supongamos r > 0.
Si D 0 y d > 0 entonces D = dc + r, como queramos.
Si D 0 y d < 0 entonces sirve D = d(c) + r.
Si D < 0 y d > 0 entonces D = d(c 1) + (d r).
Si D < 0 y d < 0 entonces D = d(c + 1) + (d r).
Si tuvieramos dos expresiones distintas D = dc + r = dc + r , entonces sea
c = c si d > 0 y c = c si d < 0. Igualmente definimos c . As dc = |d|c,
dc = |d| c . Supongamos que c < c . Entonces

D = dc + r = |d|c + r < |d|c + |d| = |d|(c + 1) |d|c = dc dc + r = D,

y esto es una contradiccion. Por lo tanto ha de ser c = c y de aqu que


dc + r = dc + r , luego r = r .
Esta propiedad de los numeros enteros confiere propiedades muy importantes
al anillo Z y es poseda tambien por otros anillos de interes. Por ello conviene
tratarla en general:

Definicion 2.17 Un dominio eucldeo es un dominio ntegro A tal que existe


una funcion : A \ {0} N que cumpla lo siguiente:
1. Si a, b son elementos de A no nulos (a) (ab).
2. Si D y d son elementos de A con d 6= 0 entonces existen c y r en A de
manera que D = dc + r con r = 0 o bien (r) < (d).
La funcion se llama norma eucldea.

Es obvio que Z es un dominio eucldeo con la norma dada por (a) = |a|.
Ahora bien, observemos que el cociente y el resto no son unicos. Por ejemplo,
para dividir 8 entre 3 podemos hacer 8 = 3 2 + 2 o bien 8 = 3 3 1. En ambos
casos |r| < |d|.

Definicion 2.18 Un elemento a de un dominio A es una unidad6 si existe un


elemento b en A tal que ab = 1, es decir, si tiene inverso para el producto.

En tal caso sabemos que el inverso de a es unico y, de acuerdo con la notacion


multiplicativa, lo representaremos por a1 .
Si a es una unidad, entonces a1 es obviamente una unidad, y (a1 )1 = a.
Si a y b son unidades, entonces ab es una unidad, y (ab)1 = a1 b1 .
6 Es importante recordar que la palabra unidad en un dominio no se refiere necesariamente

al 1, sino a cualquier elemento con inverso. La palabra para referirse al 1 es identidad.


64 Captulo 2. Anillos

Obviamente 1 es una unidad y 11 = 1. En cambio 0 no puede ser una


unidad. Una unidad no puede ser divisor de cero, pues si a es una unidad y
ab = 0, entonces b = 1b = a1 ab = a1 0 = 0.
En todo anillo, 1 es tambien una unidad, pues (1)(1) = 1. Las unidades
de Z son exactamente 1 y 1.
En efecto, si m, n Z cumplen mn = 1, entonces |m||n| = 1 y, como |n| 6= 0
(y es un numero natural) se cumple 1 |n|, luego |m| |m||n| = 1, luego
|m| = 1, luego m = 1.
Un cuerpo es un dominio en el que todo elemento no nulo es una unidad. En
particular todo cuerpo es un dominio ntegro.
De momento no tenemos ningun ejemplo de cuerpo. Dedicaremos la seccion
siguiente a extender Z hasta el cuerpo de los numeros racionales, pero antes
terminamos esta con algunos hechos sobre cuerpos que nos serviran de gua
para dicho fin.
Sea K un cuerpo y a, b dos elementos de K con b 6= 0. La fraccion determi-
nada por a y b es a/b = ab1 . a y b se llaman, respectivamente, numerador y
denominador de la fraccion a/b.
Veamos las propiedades basicas de las fracciones. La mayora de ellas son
consecuencia inmediata de la definicion. En todas ellas se presupone la hipotesis
de que los elementos que aparecen como denominadores son no nulos.
a 1  a 1 b
1. = a, = b1 , = .
1 b b a
a c
2. = si y solo si ad = bc
b d
La igualdad de fracciones es ab1 = cd1 , y esto equivale a la igualdad
que resulta de multiplicar por bd 6= 0, que es ad = bc.
a ac
3. Si c 6= 0, entonces = .
b bc
a ca
4. c = .
b b
a c ad + bc
5. + = .
b d bd
a c ad bc 1 1 1 ad + bc
+ = + = ad + bc = (ad + bc) = .
b d bd bd bd bd bd bd
ac ac
6. = .
bd bd
a/b ad
7. = .
c/d bc
Terminamos con una ultima observacion sobre los cuerpos, y es que trivial-
mente son dominios eucldeos tomando como norma la aplicacion constante 1.
En efecto, la division eucldea puede realizarse siempre con resto 0, es decir,
D = d(D/d) + 0.
2.4. Cuerpos de cocientes. Numeros racionales 65

2.4 Cuerpos de cocientes. Numeros racionales


Hemos visto que Z dista mucho de ser un cuerpo, pues sus unicas unidades
son 1. Por lo tanto, una fraccion como 4/5 no tiene sentido en Z. Ahora
vamos a construir el cuerpo Q de los numeros racionales, que contiene a Z y
justifica el uso de fracciones de numeros enteros.
En realidad, vamos a dar una construccion general que nos proporciona un
cuerpo K a partir de cualquier dominio ntegro A. La idea es que K este formado
por todas las fracciones de elementos de A. Si llamamos A = A \ {0}, cada
fraccion esta determinada por un par (a, b) A A , pero no podemos definir
las fracciones como los elementos de este producto cartesiano porque distintos
pares pueden determinar la misma fraccion.
La situacion es analoga a la que nos encontramos en su momento a la hora
de construir Z a partir de N: debemos definir una relacion de equivalencia en el
conjunto de pares de modo que dos de ellos esten relacionados si y solo si deben
definir la misma fraccion, y tomar como fracciones las clases de equivalencia. Los
resultados sobre fracciones que hemos visto en la seccion precedente nos indican
cuales son las definiciones adecuadas, tanto de la relacion de equivalencia como
de las operaciones en el cociente:

Definicion 2.19 Sea A un dominio ntegro y A = A \ {0}. Sea R la relacion


en el conjunto A A dada por (a, b) R (c, d) si y solo si ad = bc.

Es facil ver que es una relacion de equivalencia. Veamos por ejemplo la


transitividad: si (a, b) R (c, d) y (c, d) R (e, f ), tenemos que ad = bc y que cf =
de, luego adcf = bcde. Como dc 6= 0 y A es un dominio ntegro, se puede
simplificar, y resulta af = be, luego (a, b) R (e, f ).
a
Representaremos por la clase de equivalencia del par (a, b) y llamaremos
b
K = (A A )/R al conjunto cociente. Por las propiedades basicas de las clases
de equivalencia sabemos que
a c
= si y solo si ad = bc.
b d
Definimos en K la suma y el producto dadas por
a c ad + bc ac ac
+ = , = .
b d bd bd bd
Notemos que, como estamos exigiendo que A sea un dominio ntegro, el
hecho de que b, d 6= 0 implica que bd 6= 0. Si no fuera as estas definiciones
no seran correctas. No obstante, todava falta algo por comprobar para dar
por validas estas definiciones, y es que, como siempre que definimos relaciones
o funciones sobre clases de equivalencia, hay que comprobar que la definicion
no depende de la eleccion de los representantes. Por ejemplo, para el caso de la
suma, si a/b = a /b y c/d = c /d , tiene que cumplirse que
ad + bc a d + b c
= .
bd b d
66 Captulo 2. Anillos

Esto es equivalente a que (ad + bc)b d = (a d + b c )bd. En efecto, teniendo en


cuenta que ab = ba y que cd = dc , vemos que
(ad + bc)b d = ab dd + bb cd = ba dd + bb dc = (a d + b c )bd.
Ahora es pura rutina comprobar que K cumple todos los axiomas de cuerpo
con estas definiciones. El cuerpo K as construido se llama cuerpo de cocientes
de A. Los elementos neutros de K son 0 = 0/1 y 1 = 1/1, el simetrico de
una fraccion es (a/b) = (a)/b, y el inverso es (a/b)1 = b/a. Aqu hay que
observar que si a/b 6= 0/1, entonces a 6= 0.
Con esto no hemos terminado la construccion del cuerpo de cocientes, pues
nos falta llegar a que podemos ver a A como un subconjunto de K. Esta afir-
macion requiere varias precisiones, y para plantear exactamente lo que queremos
demostrar conviene introducir algunos conceptos.

Homomorfismos de anillos Es claro que lo que interesa de un anillo no es


en absoluto la naturaleza conjuntista de sus elementos, sino el modo en que los
relacionan las leyes internas. Por ejemplo, si A = {a, b} es cualquier conjunto
con dos elementos, es facil convertirlo en un anillo (cuerpo, de hecho) con las
leyes dadas por
a + a = b + b = a, a + b = b + a = b,
aa = ab = ba = a, bb = b.
Con estas operaciones, a = 0 y b = 1 (es decir, a es el neutro de la suma y b
el del producto) y en estos terminos las operaciones son
0 + 0 = 1 + 1 = 0, 0 + 1 = 1 + 0 = 1,
0 0 = 0 1 = 1 0 = 0, 1 1 = 1.
Si hacemos lo mismo con otro conjunto A = {a , b } obtenemos un anillo
distinto conjuntistamente, pero el mismo anillo algebraicamente. La forma de
plasmar esta relacion es el concepto de homomorfismo de anillos que definimos
a continuacion.
Definicion 2.20 Sean A y B dos anillos. Una aplicacion f : A B es un
homomorfismo de anillos si cumple f (a + b) = f (a) + f (b), f (ab) = f (a)f (b)
para todos los elementos a y b de A.
Una consecuencia inmediata es que f (0) = f (0 + 0) = f (0) + f (0), luego
f (0) = 0, y que f (a) + f (a) = f (a a) = f (0) = 0, luego f (a) = f (a).
Tambien es claro que si m es un numero entero f (ma) = mf (a).
Sin embargo, hay que tener presente que, aunque A y B sean unitarios, no
tiene por que ocurrir f (1) = 1. Por ejemplo la aplicacion que vale constante-
mente 0 es un homomorfismo (el unico) que cumple f (1) = 0.
Suponiendo f (1) 6= 0, una condicion suficiente para que f (1) = 1 es que B
sea un dominio ntegro, pues entonces f (1)f (1) = f (1 1) = f (1) = f (1)1, luego
f (1) = 1.
2.4. Cuerpos de cocientes. Numeros racionales 67

Otra condicion que garantiza que f (1) = 1 es que f : A B sea suprayec-


tiva, pues entonces tiene que existir un a A tal que f (a) = 1 y as
f (1) = f (1)1 = f (1)f (a) = f (1 a) = f (a) = 1.
Cuando f (1) = 1 y a A es inversible, se cumple que f (a1 ) es inversible y
f (a1 ) = f (a)1 .
Mas en general, se cumple que f (an ) = f (a)n para todo n Z. Si a no es
inversible, esto se cumple de todos modos para todo n N.
Es inmediato comprobar que la composicion de homomorfismos es un homo-
morfismo.
Un isomorfismo de anillos es un homomorfismo biyectivo. Notemos que
si f : A B es un isomorfismo, entonces f 1 : B Atambien es un
isomorfismo, pues f f 1 (a) + f 1 (b) = f f 1 (a) + f f 1 (b) = a + b, luego
f 1 (a + b) = f 1 (a) + f 1 (b), e igualmente ocurre con el producto.
Dos anillos A y B son isomorfos (abreviadamente, A = B) si existe un
isomorfismo f : A B. Cuando dos anillos son isomorfos son algebraicamente
indistinguibles, es decir, uno es conmutativo si y solo si lo es el otro, etc. Por lo
tanto podemos considerarlos como el mismo anillo (aunque conjuntistamente
sean distintos).
Un anillo A es un subanillo de un anillo B si A B y las operaciones de A
son las mismas que las de B. Por ejemplo, {2n | n Z} es un subanillo de Z
(no unitario, por cierto). En general, si f : A B es un homomorfismo, es
facil ver que f [A] es un subanillo de B.
Ejercicio: Considerando Z Z y Z {0}, probar que la identidad de un subanillo
puede ser distinta de la del anillo. Probar que esto es imposible si los anillos son
dominios ntegros.
Un monomorfismo de anillos es un homomorfismo inyectivo. Si f : A B
es un monomorfismo es claro que f : A f [A] es un isomorfismo, o sea, A
es isomorfo a un subanillo de B, luego podemos identificar A con su imagen y
considerar que A es un subanillo de B.
Este es el caso de un dominio ntegro y su cuerpo de cocientes:
Teorema 2.21 Sea A un dominio ntegro y K su cuerpo de cocientes.
1. La aplicacion : A K dada por (a) = a/1 es un monomorfismo de
anillos.
2. Si K es un cuerpo y : A K es un monomorfismo de anillos, existe
un unico monomorfismo de cuerpos : K K que hace conmutativo
el diagrama siguiente:

A / K
O



K
68 Captulo 2. Anillos

Demostracion: 1) es inmediato. Para probar 2) basta definir la aplica-


cion mediante (a/b) = (a)(b)1 . En general, siempre que definamos una
funcion sobre fracciones, tenemos que comprobar que la definicion no depende
de la representacion que usamos, pues esta no es unica. En este caso se trata
de probar que si a/b = a /b entonces (a)(b)1 = (a )(b )1 , ahora bien,
sabemos que ab = b a y, como es un homomorfismo, (a)(b ) = (b )(a),
de donde se sigue la relacion requerida.
Es facil probar que es un monomorfismo y trivialmente hace conmutativo
el diagrama, pues ((a)) = (a/1) = (a).
Lo que afirma la parte 1) del teorema anterior es que podemos considerar
a A como un subanillo de su cuerpo de cocientes sin mas que identificar cada
elemento a con a/1, es decir, considerando que dividir entre 1 es no hacer nada.
La parte 2) afirma en particular que si un cuerpo K contiene a A, entonces
tambien contiene una copia isomorfa de K, a saber, el conjunto {ab1 | a, b A}.
En otras palabras, si ya tenemos a A contenido en un cuerpo K no necesitamos
salirnos de K para construir el cuerpo de cocientes de A. Basta tomar todas las
fracciones posibles con elementos de A y el resultado sera un cuerpo isomorfo
al cuerpo de cocientes de A.

Definicion 2.22 Llamaremos cuerpo de los numeros racionales Q al cuerpo de


cocientes de Z. Los elementos de Q son las fracciones a/b con a, b en Z, b 6= 0.

En lo sucesivo, los numeros racionales de la forma n/1, donde n Z, los re-


presentaremos simplemente por n. As, a partir de ahora nos olvidaremos de
que habamos definido los numeros enteros como clases de equivalencia de pares
de numeros naturales y pasaremos a considerar que, por ejemplo, el numero
entero 5 es el numero racional 5/1. Hemos probado que con esto estamos cam-
biando el Z antiguo por otro anillo isomorfo, por lo que todos los resultados
que conocamos sobre el antiguo Z siguen siendo validos para el nuevo, con
la diferencia de que ahora podemos afirmar que N Z Q.
En general, si D es un dominio ntegro ordenado, toda fraccion de K puede
expresarse en la forma a/b con b > 0. En efecto, si b < 0 la podemos transformar
en a/b = (a)/(b), y ahora b > 0.

Teorema 2.23 Si A es un dominio ntegro ordenado, entonces su cuerpo de


cocientes K es un cuerpo ordenado con la relacion dada por
a c
si y solo si ad bc,
b d
donde las fracciones se toman con denominadores positivos.

Demostracion: Hay que comprobar que la relacion esta bien definida, es


decir, que si a/b = a /b y c/d = c /d (con denominadores positivos) y ad bc,
entonces tambien a d b c . En efecto, sabemos que ab = a b y cd = c d.
Como b , d > 0, tenemos que

ad bc ab d d bb d c a bdd bb dc a d b c .
2.4. Cuerpos de cocientes. Numeros racionales 69

Es claro que se trata de una relacion de orden total. Veamos como ejemplo
la prueba de la transitividad: si a/b c/d e/f (con denominadores positivos)
tenemos que ad bc y cf de. Por lo tanto adf bcf bde, luego af be,
luego a/b e/f .
En cuanto a las propiedades de compatibilidad, veamos por ejemplo la de la
suma: Suponemos que a/b c/d y queremos probar que a/b + e/f c/d + e/f .
Equivalentemente, suponemos que ad bc y queremos probar que

af + be cf + de
,
bf df

que a su vez equivale a af df + bedf cf df + debf , o tambien a adf 2 cdf 2 ,


pero esto es cierto porque ad cd y f 2 0.

Observemos que, segun la relacion de orden dada por el teorema anterior,


a/1 b/1 si y solo si a b, es decir, que al identificar a A con un subanillo
de K, la relacion de orden en A no es sino la restriccion de la de K.

En particular esto se aplica a Q, que resulta ser un cuerpo ordenado, por


lo que tenemos definidos los conceptos de valor absoluto y signo de un numero
racional, y cumplen las propiedades que hemos demostrado en general.

Otra caracterstica general valida para todo cuerpo ordenado K es que si u,


v K, con u < v, existe un w K tal que u < w < v. Esto se expresa diciendo
que los cuerpos ordenados son densos en s mismos.

En efecto, podemos definir 2 = 1 + 1 K, que claramente cumple 2 > 0, y


u+v
entonces basta tomar w = . Es inmediato comprobar que u < w < v.
2
Notemos que Z no cumple esto, sino que entre dos numeros enteros con-
secutivos no hay ningun otro numero entero. Para que el argumento anterior
funcione hace falta que 2 tenga inverso, cosa que no sucede en Z.

Los numeros racionales tienen tambien su representacion geometrica como


puntos de una recta. Por ejemplo, para representar 7/5 = 1 + 2/5 dividimos en
cinco partes cada intervalo entre dos numeros enteros consecutivos y tomamos,
desde 0, 7 de dichos intervalos.


1 0 1 7/5 2 3 4
Notemos que si quisieramos senalar en la recta todos los puntos correspon-
dientes a numeros racionales, por muy finos que trazaramos los puntos, en la
practica llenaramos toda la recta. Por ejemplo, para representar todas las
fracciones con denominador 1 000 000 tendramos que poner un millon de puntos
entre cada dos numeros enteros consecutivos. Sin embargo, el hecho de que los
puntos con numeros racionales asignados esten por todas partes, no resuelve
el problema teorico de si quedan todava puntos de la recta sin asignar o no.
Volveremos sobre esto mas adelante.
70 Captulo 2. Anillos

Numeros combinatorios Los cuerpos de cocientes nos permiten salirnos


temporalmente de un anillo en nuestros calculos aunque despues volvamos a el.
Veamos un ejemplo.

Sean n, n1 , . . . , nk numeros naturales tales que n = n1 + . . . + nk . Definimos


el numero combinatorio
 
n n!
=
n1 nk n1 ! nk !

Si 0 m n abreviaremos
   
n n n!
= =
m m nm m! (n m)!
 
5
Por ejemplo, = 10. Vamos a demostrar las propiedades principales de los
3
numeros combinatorios.

Teorema 2.24 Sean m n numeros naturales.


   
n n
1. = .
m nm
     
n n n
2. = = 1, = n.
0 n 1
     
n n n+1
3. Si m < n, + = .
m m+1 m+1

4. Los numeros combinatorios son numeros naturales.

Demostracion: 3) Hay que probar que

n! n! (n + 1)!
+ = .
m! (n m)! (m + 1)! (n m 1)! (m + 1)! (n m)!

Ahora bien,
 
n! n!
+ (m + 1)! (n m)!
m! (n m)! (m + 1)! (n m 1)!

n! (m + 1) m! (n m)! n! (m + 1)! (n m)(n m 1)!


= +
m! (n m)! (m + 1)! (n m 1)!

= n! (m + 1) + n! (n m) = m n! + n! + n n! m n! = (n + 1) n! = (n + 1)!
2.4. Cuerpos de cocientes. Numeros racionales 71

n

4) Una simple induccion nos da que m es un numero natural, pues cada
numero combinatorio con n + 1 es suma de dos con n, por el apartado 3).
Para el caso general basta usar que
    
n n nk+1 n
= .
n1 . . . nk nk+1 n1 . . . nk nk+1

La forma mas facil de calcular los numeros combinatorios es disponerlos en


forma de triangulo, de modo que cada uno es la suma de los dos que hay sobre
el. El triangulo as construido se suele llamar triangulo de Tartaglia.

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
Triangulo de Tartaglia
Los numeros combinatorios tienen una interpretacion combinatoria:

Teorema
 2.25 Si A es un conjunto de cardinal n y m n, entonces A tiene
n
m subconjuntos de cardinal m.

Demostracion: Por induccion sobre n. Si n = 0 entonces A = y tiene


un unico subconjunto de cardinal 0, y ciertamente 00 = 1.
Supongamos que es cierto para conjuntos de cardinal n y supongamos que
|A| = n + 1. Es inmediato que A tiene un unico subconjunto de cardinal 0,
y n+10 = 1. Consideremos ahora los subconjuntos de cardinal m + 1. Fi-
jado a X, el conjunto X de todos los subconjuntos de A de cardinal m + 1
puede dividirse en dos subconjuntos disjuntos, el subconjunto Y formado por
los subconjuntos que contienen a a y el subconjunto Z formado por los que no lo
contienen. Claramente, hay tantos subconjuntos de X con m + 1 elementos que
contienen a a como subconjuntos
 tiene A \ {a} con m elementos. Por hipotesis

n n
de induccion, |Y | = m . Por otra parte, tambien es claro que |Z| = m+1 . Por
consiguiente:
     
n n n+1
|X| = |Y | + |Z| = + = .
m m+1 m+1

La utilidad principal de estos numeros sera para nosotros el hecho siguiente:

Teorema 2.26 (Binomio de Newton) Sea A dominio, n un numero natural


y a, b dos elementos de A. Entonces
n  
X n m nm
(a + b)n = a b .
m=0
m
72 Captulo 2. Anillos

Demostracion: Por induccion sobre n. Para n = 0 es inmediato.


n  
n+1 n
X n m nm
(a + b) = (a + b) (a + b) = a b (a + b)
m=0
m

n   n  
X n m+1 nm X n m nm+1
= a b + a b
m=0
m m=0
m

n+1   n  
X n m n+1m
X n m n+1m
= a b + a b
m=1
m1 m=0
m
   
n 0 n+1 n n+1 0
= a b + a b
0 n
n   n  
X n X n m n+1m
+ am bn+1m + a b
m=1
m 1 m=1
m
   
n 0 n+1 n + 1 n+1 0
= a b + a b
0 n+1
n    
X n n
+ + am bn+1m
m=1
m 1 m

    n  
n 0 n+1 n + 1 n+1 0 X n + 1 m n+1m
= a b + a b + a b
0 n+1 m=1
m

n+1  
X n + 1 m n+1m
= a b .
m=0
m

Pn n

Una consecuencia inmediata es que m=0 m = (1 + 1)n = 2n .

De forma similar se demuestra en general:

Teorema 2.27 Sea A un anillo conmutativo y unitario,n un numero natural y


a1 , . . . , ak elementos de A. Entonces se cumple:
X  n

(a1 + + ak ) = n
an1 ank k ,
n1 ,...,nk
n1 nk 1

donde la suma se extiende sobre todos los numeros naturales n1 , . . . , nk tales


que n1 + + nk = n.
2.5. Anillos de polinomios 73

2.5 Anillos de polinomios


Si x e y son numeros enteros, xy + x y x2 2y son otros numeros enteros.
Su suma es x2 + xy + x 2y y su producto

(xy + x)(x2 2y) = x2 (xy + x) 2y(xy + x) = x3 y + x3 2xy 2 2xy.

Al trabajar con numeros enteros surgen facilmente relaciones de este estilo


y a menudo resulta muy util poder tratarlas como objetos y no como meros
terminos que relacionan numeros concretos. Ahora vamos a presentar una cons-
truccion general que permite anadir a cada anillo unitario A un conjunto de
elementos indeterminados, como aqu son x e y, de modo que obtengamos un
nuevo anillo con elementos como x3 y+x3 2xy 2 2xy. A estos objetos los llama-
remos polinomios. Un polinomio no es nada mas que esto, pero la construccion
formal resulta un tanto tecnica.

Definicion 2.28 Sea S un conjunto. Llamemos M el conjunto de las aplica-


ciones u : S N tales que el conjunto {i S | u(i) 6= 0} es finito.

Por ejemplo, si S = {x, y, z} y una funcion u M cumple u(x) = 3, u(y) = 1,


u(z) = 7, nuestra intencion es que u represente al monomio puro x3 yz 7 .

Si u, v son funciones de M llamaremos u + v a la funcion dada por

(u + v)(i) = u(i) + v(i).

Claramente u + v esta en M .
Notemos que la suma u + v representa al producto de los monomios repre-
sentados por u y por v. Si m N y u M llamaremos mu a la funcion dada
por (mu)(i) = m u(i) . Tambien es claro que mu esta en M . Es claro que mu
representa a la potencia msima del monomio representado por u. Llamaremos
0 a la funcion de M que toma constantemente el valor 0.

Si x S llamaremos x M a la funcion que toma el valor 1 en x y vale 0


en cualquier otro punto. Claramente, x representa al monomio x.

Notemos que si u M y x1 , . . . , xn son los puntos donde u no se anula,


entonces u puede expresarse como u = u(x1 )x1 + + u(xn )xn . Si pensamos
en el primer ejemplo, esto se interpreta como que el monomio u es el producto
del monomio x elevado a 3, por el monomio y, por el monomio z elevado a 7.

Un polinomio arbitrario, como x3 y + x3 2xy 2 2xy, es una suma de mono-


mios no necesariamente puros, sino multiplicados por coeficientes en un anillo
dado. Esto nos lleva a la definicion siguiente:

Si A es un anillo unitario, llamaremos conjunto de los polinomios con indeter-


minadas en S sobre A al conjunto A[S] formado por las funciones f : M A
tales que el conjunto {u M | f (u) 6= 0} es finito.
74 Captulo 2. Anillos

As, si f A[S] y u M , el elemento f (u) se interpreta como el coeficiente


del monomio u en f . Con estas ideas el lector puede convencerse de que la
definicion logica de las operaciones en A[S] es la siguiente:
P
(f + g)(u) = f (u) + g(u), (f g)(u) = f (v)g(w).
v+w=u

Notemos que el sumatorio que define el producto es finito.

Teorema 2.29 Sea A un anillo unitario y S un conjunto. Entonces A[S] es


un anillo unitario. Si A es conmutativo, A[S] tambien lo es.

Demostracion: Es facil ver que para todos los polinomios f , g, h A[S],


se cumple (f + g) + h = f + (g + h) y f + g = g + f .
La aplicacion 0 : M A que toma constantemente el valor 0 es el elemento
neutro de A[S] y si f A[S], la funcion dada por (f )(u) = f (u) es el
simetrico de f . Si f , g, h A[S] y u M se cumple
 P P P
(f g)h (u) = f (s)g(t)h(w) = f (s)g(t)h(w)
v+w=u s+t=v w+s+t=u
P P 
= f (s)g(t)h(w) = f (gh) (u),
s+v=u t+w=v

luego (f g)h = f (gh).


 P 
f (g + h) (u) = f (v) g(w) + h(w)
v+w=u
P P
= f (v)g(w) + f (v)h(w) = (f g)(u) + (f h)(u),
v+w=u v+w=u

luego f (g + h) = f g + f h, e igualmente (f + g)h = f h + gh.


Sea 1 la aplicacion que vale 1 sobre 0 M y vale 0 en otro caso. Entonces
(f 1)(u) = f (u), luego f 1 = f . Igualmente 1f = f .
Si A es conmutativo
P P
(f g)(u) = f (v)g(w) = g(w)f (v) = (gf )(u),
v+w=u v+w=u

luego f g = gf , es decir, A[S] es conmutativo.


Los teoremas siguientes prueban que los polinomios son lo que esperamos
que sean. El primer paso es sumergir A en A[S]. El teorema siguiente es una
comprobacion rutinaria.

Teorema 2.30 Sea A un anillo unitario y S un conjunto. Para cada a A sea


fa el polinomio que cumple fa (0) = a y que toma el valor 0 en cualquier otro
caso. Sea : A A[S] la aplicacion dada por (a) = fa . Entonces es un
monomorfismo de anillos y si A es unitario (1) = 1.
2.5. Anillos de polinomios 75

Definicion 2.31 En lo sucesivo, si A es un anillo unitario, S un conjunto y


a A, escribiremos a en lugar de (a) y A en lugar de [A]. De este modo A es
un subanillo de A[S]. Para cada x S llamaremos x al polinomio que cumple
x(x ) = 1 y que toma el valor 0 en cualquier otro caso. La aplicacion que a cada
x le asigna x es biyectiva, luego podemos identificar x con x y as considerar
que S A[S]. A los elementos de S los llamaremos indeterminadas.

El teorema siguiente recoge el comportamiento de los polinomios construidos


a partir de las indeterminadas mediante productos. Inmediatamente despues
probaremos que todo polinomio puede construirse a partir de las indeterminadas
mediante sumas y productos.

Teorema 2.32 Sea A un anillo unitario y S un conjunto.


1. Si k N, a A y x S, entonces el polinomio axk toma el valor a sobre
kx y 0 en otro caso.
2. Si k1 , . . . , kn N, a A y x1 , . . . , xn son indeterminadas distintas, en-
tonces el polinomio axk11 xknn toma el valor a sobre k1 x1 + + kn xn
y 0 en otro caso.
3. Si x, y S, entonces xy = yx.
4. Si a A y x S, entonces ax = xa.

Demostracion:
1. Por induccion sobre k. Para k =  0 es inmediato. Supuesto cierto para k,
entonces (axk+1 )(u) = (axk )x (u) = (axk )(v)x(w) = 0 salvo si v = kx
y w = x , es decir, salvo si u = (k + 1)x , en cuyo caso da a.
2. Por induccion sobre n. Para n = 1 es el caso anterior. Supuesto cierto
kn+1 kn+1
para n tenemos que (axk11 xn+1 )(u) = (axk1 kn
1 xn )(v)(xn+1 )(w) = 0
salvo que v = k1 x1 + + kn xn y w = kn+1 xn+1 , es decir, salvo si
u = k1 x1 + + kn+1 xn+1 , en cuyo caso vale a.
3. es inmediato por 2, pues ambos polinomios son la misma funcion.
4. Basta notar que el caso 1 se prueba igual con a por la derecha.

Como consecuencia inmediata tenemos:

Teorema 2.33 Sea A un anillo unitario y S un conjunto. El polinomio


m
P
ai x1ki1 xknin ,
i=1

donde a1 , . . . , am A, x1 , . . . , xn son indeterminadas distintas y las ntuplas


de naturales (ki1 , . . . , kin ) son todas distintas, vale ai sobre ki1 x1 + + kin xn
y vale 0 en cualquier otro caso.
76 Captulo 2. Anillos

Como los polinomios de esta forma cubren todas las aplicaciones posibles de
M en A (con un numero finito de imagenes no nulas) hemos demostrado:

Teorema 2.34 Sea A un anillo unitario y S un conjunto. Todo polinomio no


nulo de A[S] se expresa en la forma descrita en el teorema anterior para ciertas
indeterminadas, ciertos elementos de A y ciertas ntuplas de naturales. La
expresion es unica (salvo el orden) si exigimos que todos los ai sean no nulos y
que cada indeterminada tenga exponente no nulo en al menos un sumando.
Definicion 2.35 En la expresion de 2.33, los elementos ai se llaman coeficientes
del polinomio. Concretamente ai es el coeficiente del termino en xk1i1 xknin .
Se entiende que si un termino no aparece en la expresion, su coeficiente es 0
(siempre puede anadirse multiplicado por 0).
Un polinomio con un unico coeficiente no nulo (o sea, un polinomio de la
forma a xk11 . . . xknn ) es un monomio de grado k1 + + kn y coeficiente a. Por
lo tanto, todo polinomio se expresa siempre como suma de monomios. A veces
se les llama binomios, trinomios, etc. segun el numero de monomios que los
compongan. El grado de un polinomio no nulo p de p es el mayor de los grados
de sus monomios con coeficiente no nulo y lo representaremos por grad p.
El coeficiente del termino del monomio cuyos exponentes son todos nulos se
llama termino independiente, es decir, el termino independiente de f es f (0).
Un polinomio cuyo unico coeficiente no nulo sea a lo sumo el termino indepen-
diente es un polinomio constante. Los polinomios constantes son exactamente
los elementos de A, segun la identificacion que hemos realizado.

Tenemos definidos anillos de polinomios con cualquier cantidad de indeter-


minadas, posiblemente infinitas. Cuando S = {x1 , . . . , xn } es finito, en lugar de
A[S] se escribe tambien A[x1 , . . . , xn ].
Por ejemplo, un elemento de Z[x, y, z] es 3x5 y 2 z 2 + 8x2 z 6z 2 + 5. El
termino independiente es 5, el coeficiente del monomio en x2 z es 8 (en el cual
la indeterminada y tiene exponente 0), el coeficiente del monomio en x5 es 0.
Cuando solo hay una indeterminada la expresion de un polinomio es mas
m
P
sencilla. Cada polinomio no nulo de A[x] es de la forma ai xi , y la expresion
i=0
es unica si exigimos que am 6= 0.
El coeficiente del monomio de mayor grado de p se llama coeficiente director
del polinomio p. Un polinomio de A[x] es monico si su coeficiente director es 1.
La suma y el producto de polinomios con una indeterminada es mas simple:
m
P m
P m
P
ai xi + bi xi = (ai + bi )xi ,
i=0 i=0 i=0
m  n
 m+n
 X 
P i P i P
ai x bi x = ai bj xk .
i=0 i=0 k=0 i+j=k

Por ejemplo, un elemento de Z[x] es 2x + 5x2 11x + 6. Se trata de un


5

polinomio de grado 5 con coeficiente director igual a 2.


2.5. Anillos de polinomios 77

En la practica escribiremos p = p(x1 , . . . , xn ) para indicar que las indeter-


minadas x1 , . . . , xn son las unicas (a lo sumo) que aparecen en el polinomio p
con exponentes no nulos.

Evaluacion de polinomios La evaluacion de polinomios es un concepto muy


sencillo: si p(x) = 2x2 4x, pretendemos que p(3) sea 2 32 4 3 = 6. No
obstante vamos a definir las evaluaciones en un contexto mas general que nos
sera util despues.

Definicion 2.36 Sean A y B dos anillos conmutativos y unitarios, : A B


un homomorfismo,
Pm S un conjunto y v : S B cualquier aplicacion. Para cada
polinomio p = i=1 ai xk1i1 . . . xknin A[S] definimos
m
P
p(v) = (ai ) v(x1 )ki1 . . . v(xn )kin B.
i=1

La conmutatividad de B y la unicidad de la expresion hacen que p(v) este


bien definido, pues dos expresiones de p difieren solo en el orden de las indeter-
minadas y en la presencia de monomios con coeficiente 0, o de indeterminadas
con exponente 0, pero en cualquier caso se obtiene el mismo elemento de B.
Tenemos, por tanto, una aplicacion : A[S] B dada por (p) = p(v).
En definitiva (p) se calcula reemplazando los coeficientes de p por su imagen
por y las indeterminadas por sus imagenes por v.
En la practica, si p = p(x1 , . . . , xn ) escribiremos p(b1 , . . . , bn ) para indicar
el polinomio que resulta de evaluar cada indeterminada xi con el elemento bi .
Notar que aunque S pueda ser infinito, p(v) solo depende de la forma en
que v actua sobre las indeterminadas que aparecen en p, que son siempre un
numero finito. Cuando sea simplemente la identidad en A no lo escribiremos,
y expresaremos la evaluacion mediante p(b1 , . . . , bn ).

Teorema 2.37 Sean A y B dos anillos conmutativos y unitarios, : A B


un homomorfismo tal que (1) = 1, S un conjunto y v : S B cualquier
aplicacion. Entonces la evaluacion : A[S] B es el unico homomorfismo
que coincide con sobre A y con v sobre S.

Demostracion: Sean p, q A[S], digamos


m
P m
P
p= ai xk1i1 . . . xknin , q= bi x1ki1 . . . xknin .
i=1 i=1

Observemos que no hay problema en suponer que los exponentes de los mono-
mios son los mismos, pues podemos anadir monomios con coeficiente 0 hasta
igualar ambas expresiones.
m  m
P ki1 kin P
(p + q) = (ai + bi ) x1 . . . xn = (ai + bi )v(x1 )ki1 . . . v(xn )kin
i=1 i=1
78 Captulo 2. Anillos

m
P  m
P
= (ai ) + (bi ) v(x1 )ki1 . . . v(xn )kin = (ai )v(x1 )ki1 . . . v(xn )kin
i=1 i=1

m
P
+ (bi )v(x1 )ki1 . . . v(xn )kin = (p) + (q).
i=1

Para probar que conserva productos usaremos el hecho ya probado de que


conserva las sumas.
!
Pm
ki1 +kj1 kin +kjn
(pq) = ai bj x1 . . . xn
i,j=1
m
P k +kj1
= (ai bj x1i1 . . . xnkin +kjn )
i,j=1
m
P
= (ai bj ) v(x1 )ki1 +kj1 . . . v(xn )kin +kjn
i,j=1
m
P
= (ai )(bj ) v(x1 )ki1 +kj1 . . . v(xn )kin +kjn
i,j=1
m  !
P m
P
ki1 kin kj1 kjn
= (ai ) v(x1 ) . . . v(xn ) (bj ) v(x1 ) . . . v(xn )
i=1 j=1

= (p)(q).

La unicidad es evidente.
De este teorema se deducen varios casos particulares de interes.

Teorema 2.38 Sean A y B anillos conmutativos y unitarios y : A B un


homomorfismo tal que (1) = 1. Sea S un conjunto. Entonces existe un unico
homomorfismo : A[S] B[S] que coincide con en A y deja invariantes a
las indeterminadas. Ademas es inyectivo, suprayectivo o biyectivo si lo es.

Demostracion: El homomorfismo no es sino el construido en el teorema


anterior tomando como v la identidad en S. Concretamente
m  m
P ki1 P
kin
ai x1 . . . xn = (ai ) x1ki1 . . . xknin .
i=1 i=1

Todo lo pedido es obvio.


Esto significa en particular que si A es un subanillo de B podemos considerar
A[S] como un subanillo de B[S]. As por ejemplo, Z[S] Q[S].

Teorema 2.39 Sea A un anillo conmutativo y unitario. Sea S un conjunto


y supongamos que S = X Y con X e Y disjuntos. Sea B el conjunto de
los polinomios de A[S] tales que todos sus monomios con coeficientes no nulos
tengan tan solo indeterminadas de X con exponentes no nulos. Entonces B es
un subanillo de A[S] isomorfo a A[X] y A[S] es isomorfo a A[X][Y ].
2.5. Anillos de polinomios 79

Demostracion: Sea : A[X] A[S] el homomorfismo construido en 2.37


con la identidad en A y la identidad en X. Es claro que B es la imagen de y
que es un monomorfismo.
Ahora sea : A[X][Y ] A[S] el homomorfismo construido en 2.37 a partir
de y de la identidad en Y . Es inmediato probar que se trata de un isomorfismo
de anillos.
Por ejemplo, el polinomio 3x5 y 2 z 2 + 8x2 z 6z 2 + 5 de Z[x, y, z] puede ser
identificado con (3x5 y 2 6)z 2 + (8x2 )z + 5 Z[x, y][z], donde ahora 3x5 y 2 6
es el coeficiente de z 2 .
Si lo queremos en Z[z][x, y] sera: 3z 2 (x5 y 2 ) + (8z)x2 + (6z 2 + 5), donde
ahora 6z 2 + 5 es el termino independiente.
Por otra parte si S T podemos considerar A[S] A[T ].

Propiedades algebraicas Las principales propiedades algebraicas de los ani-


llos de polinomios se deducen de consideraciones sobre los grados. Es obvio que
el grado de la suma de dos polinomios f y g de A[x] es menor o igual que el
maximo de los grados de f y g. Sera igual a dicho maximo si sus grados son
distintos, pero si coinciden se pueden cancelar los coeficientes directores y el
grado de la suma disminuye:

(3x5 2x2 + 5x + 2) + (3x5 + x3 x2 + 1) = x3 3x2 + 5x + 3.

El grado del producto es a lo sumo la suma de los grados. Normalmente se


da la igualdad. Las unicas excepciones se dan si uno de los factores es nulo, o
si alguno de los coeficientes directores es un divisor de cero.

Teorema 2.40 Sea A un anillo unitario y p, q dos polinomios no nulos de A[x]


tales que al menos el coeficiente director de uno de ellos no sea un divisor de
cero. Entonces pq 6= 0, grad(pq) = grad(p) + grad(q) y el coeficiente director
del producto es el producto de los coeficientes directores.
m
P n
P
Demostracion: Sean p = ai xi , q = bi xi , con am 6= 0 6= bn . Enton-
i=0 i=0
m+n
P P 
ces pq = ai bj xk y el coeficiente de xm+n es exactamente am bn 6= 0,
k=0 i+j=k
puesto que uno de ellos no es divisor de cero. Por lo tanto am bn es el coeficiente
director de pq y el grado es m + n.

Teorema 2.41 Sea A un dominio ntegro y S un conjunto cualquiera. Entonces


A[S] es un dominio ntegro.

Demostracion: El teorema anterior nos da que si A es un dominio ntegro


entonces A[x] tambien lo es. Aplicandolo un numero finito de veces obtenemos
que si A es un dominio ntegro y S es finito, entonces A[S] tambien lo es. Si S
es arbitrario y f , g son dos polinomios no nulos de A[S], entonces los monomios
con coeficientes no nulos de f y g contienen un numero finito de indeterminadas
80 Captulo 2. Anillos

con exponente no nulo, luego f y g estan en un subanillo A[X] con X finito,


luego A[X] es un dominio ntegro, luego f g 6= 0. Por tanto A[S] es un dominio
ntegro.

Teorema 2.42 Sea A un dominio ntegro y S un conjunto. Entonces las uni-


dades de A[S] son las mismas que las de A.

Demostracion: Veamoslo primero para A[x]. Si p A[x] es una unidad,


entonces existe otro polinomio no nulo q tal que pq = 1. Por 2.40 tenemos que
grad p + grad q = grad 1 = 0, luego ha de ser grad p = grad q = 0, es decir, p y
q estan en A, luego p es una unidad en A.
De aqu se sigue el resultado para A[S] con S finito y, por el mismo argumento
que en el teorema anterior, vale para todo S.

Fracciones algebraicas En particular vemos que A[S] no es un cuerpo aun-


que A lo sea. Como s es un dominio ntegro, podemos definir su cuerpo de
fracciones.

Definicion 2.43 Sea A un dominio ntegro y S un conjunto. Llamaremos


cuerpo de las fracciones algebraicas o funciones racionales sobre A con inde-
terminadas en S al cuerpo de cocientes de A[S]. Lo representaremos por A(S).

x4 x3 y
As, por ejemplo, un elemento de Z(x, y) es x3 4xy 2 +4 .

Ejercicio: Probar que Z(S) = Q(S).

Quiza este es un buen momento para empezar a entender la utilidad del


lenguaje algebraico que hemos empezado a introducir en este captulo: el he-
cho de que Z[x] sea un anillo (y mas concretamente un dominio ntegro) nos
permite tratar formalmente a sus elementos con las mismas reglas basicas que
a los numeros enteros. El hecho de que conozcamos la construccion general del
cuerpo de cocientes de un dominio ntegro justifica que hablemos de fracciones
de polinomios exactamente igual que de fracciones de enteros, y estos ejemplos
son solo una mnima parte de los que nos vamos a encontrar.

Division de polinomios Debemos ocuparnos ahora de la posibilidad de di-


vidir polinomios. Esta es una caracterstica importantsima de los anillos con
una indeterminada.

Teorema 2.44 Sea A un anillo unitario, D y d dos polinomios no nulos de A[x]


tales que el coeficiente director de d sea una unidad en A. Entonces existen unos
unicos polinomios c y r en A[x] tales que D = dc+r con r = 0 o de grado menor
estrictamente que el grado de d (tambien podemos exigir que D = cd + r, pero
si A no es conmutativo los polinomios que cumplan esto no tienen por que ser
los mismos).
2.6. Apendice: Sumas y productos finitos 81

Demostracion: Si grad D < grad d basta tomar c = 0 y r = D. Suponga-


mos que grad d grad D.
Pn m
P
Sea D = ai xi , d = bi xi , con an 6= 0 6= bm y m n. Ademas estamos
i=0 i=0
suponiendo que bm es una unidad de A. Veamos el teorema por induccion
sobre n.
Si n = 0, entonces tambien m = 0, es decir, D = a0 , d = b0 , luego basta
tomar c = (b0 )1 a0 y r = 0. Supongamoslo cierto para polinomios de grado
menor que n.
m
P
Consideremos db1m an x
nm
= bi b1
m an x
i+nm
. El monomio de mayor
i=0
grado es bm (bm )1 an xm+nm = an xn , luego se trata de un polinomio de grado n
con coeficiente director an .
Consecuentemente el polinomio D d(bm )1 an xnm tiene grado menor
que n, luego por hipotesis de induccion existen polinomios c y r de manera
que D db1m an x
nm
= dc + r con grad r < grad d. Sea c = b1m an x
nm
+ c .
As D = dc + r como se peda.
Veamos ahora la unicidad. Supongamos que D = dc + r = dc + r . Entonces
d(cc ) = r r. Si cc 6= 0, como el coeficiente director de d es una unidad, por
el teorema 2.40. resulta que grad(r r) = grad(d(cc )) = grad d+grad(cc ),
pero grad(r r) < grad d grad d + grad(c c ), contradiccion. Concluimos
entonces que c = c , luego tambien r = r .
El lector que sepa dividir numeros naturales puede adaptar su metodo para
dividir tambien polinomios. No hay ninguna diferencia esencial.
Es importante que para poder dividir polinomios el divisor debe tener coefi-
ciente director unitario. En particular podemos dividir siempre entre polinomios
monicos. Cuando A es un cuerpo todos los coeficientes son unidades, luego se
pueden dividir polinomios cualesquiera. Como en este caso el grado del pro-
ducto es la suma de los grados, tenemos todas las condiciones exigidas en la
definicion de dominio eucldeo, es decir:

Teorema 2.45 Si K es un cuerpo, entonces el anillo de polinomios K[x] es un


dominio eucldeo.

Sin embargo esto es falso si K no es un cuerpo. Por ejemplo Z[x] no es un


dominio eucldeo. Tampoco es cierto en anillos de polinomios con mas de una
indeterminada. Por ejemplo Q[x, y] no es un dominio eucldeo. Estos hechos los
probaremos en el captulo siguiente. Es interesante notar que en estos momentos
no tenemos idea de como puede probarse la no existencia de una norma eucldea.

2.6 Apendice: Sumas y productos finitos


Presentamos en este apendice las propiedades basicas que justifican las ope-
raciones con sumas y productos finitos de elementos de un semigrupo A con
elemento neutro. En realidad podramos prescindir del elemento neutro, pero
82 Captulo 2. Anillos

as se simplifica la exposicion. Recordemos la definicion 2.3 de producto finito:


dada una sucesion {ai }ni=1 de elementos de A, definimos
Q Q Q
ai = 1, ai = ( ai ) aj ,
i<0 i<j+1 i<j

para j n, de modo que en particular tenemos definido el producto finito de


los elementos dados:
n
Q Q
a0 an = ai = ai .
i=0 i<n+1

A su vez, definiendo
n
Q nm
Q
ai = am+i , para m n
i=m i=0

se cumple la relacion recurrente


u v+1
 v

Q Q Q
ai = au , ai = ai av+1 ,
i=u i=u i=u

v
Q
para u v < n. Esto puede resumirse con la notacion ai = au av .
i=u

El teorema siguiente afirma que un producto puede partirse en bloques:

a1 an = (a1 an1 )(an1 +1 an2 ) (anm1 +1 an ).

Teorema 2.46 (Propiedad asociativa generalizada) Sea A un semigrupo


con elemento neutro, sea {ai }ni=1 una sucesion de elementos de A, y sea {nj }m
j=0
una sucesion de numeros naturales 0 = n0 < n1 < < nm = n. Entonces
n
Q m
Q nj
Q
ai = ai .
i=1 j=1 i=nj1 +1

Demostracion: Observemos que el primer producto del miembro derecho


nj
 Q m
es el definido a partir de la sucesion ai j=1 .
i=nj1 +1
En primer lugar demostramos que, para todo si 1 u n nk , se cumple
la igualdad
nkQ+u n
Qk nkQ
+u
ai = ai ai .
i=1 i=1 i=nk +1

Razonamos por induccion sobre u. Para u = 0 no hay nada que probar y


para u = 1 es claramente cierta. Si vale para u 1, entonces
n +u  !
nk +u+1
Q k
Q nk
Q nkQ+u
ai = ai ank +u+1 = ai ai ank +u+1
i=1 i=1 i=1 i=nk +1

n
Qk nk +u+1
Q
= ai ai .
i=1 i=nk +1
2.6. Apendice: Sumas y productos finitos 83

En particular, si aplicamos esto a u = nk+1 nk obtenemos que


nQ
k+1 nk
Q nQ
k+1
ai = ai ai .
i=1 i=1 i=nk +1

Ahora probamos por induccion sobre k que si 1 k m, entonces


nk
Q k
Q nj
Q
ai = ai .
i=1 j=1 i=nj1 +1

Para k = 0 la igualdad se reduce a 1 = 1. Supuesto cierto para k, si k + 1 m


tenemos que
!
nQk+1 nk
Q nQ
k+1 Qk nj
Q nQ
k+1 k+1
Q nj
Q
ai = ai ai = ai ai = ai .
i=1 i=1 i=nk +1 j=1 i=nj1 +1 i=nk +1 j=1 i=nj1 +1

Aplicando esto a k = m obtenemos la igualdad del enunciado.


A partir de este punto vamos a suponer que el semigrupo es conmutativo y,
pasamos a emplear notacion aditiva por ilustrar tambien el uso de esta notacion,
si bien podramos mantener tambien la notacion multiplicativa.

Teorema 2.47 (Propiedad conmutativa generalizada) Sea A un semigru-

po conmutativo y con elemento neutro. Sea {ai }ni=1 una sucesion de elemen-
tos de A y sea : In In biyectiva. Entonces
n
P n
P
ai = a(i) .
i=1 i=1

Demostracion: Lo probamos por induccion sobre n. Si n = 0 por de-


finicion ambos miembros son 0. Si vale para n, consideramos una sucesion
{ai }n+1
i=1 en A y una biyeccion : In+1 In+1 . Pongamos que (k) = n + 1.
Por la propiedad asociativa generalizada,
n+1
P k1
P n+1
P k1
P n+1
P
a(i) = a(i) + an+1 + a(i) = a(i) + a(i) + an+1
i=1 i=1 i=k+1 i=1 i=k+1

k1
P n
P
= a(i) + a(i+1) + an+1 .
i=1 i=k

La ultima igualdad se debe a que, por definicion,


n+1
P nk
P n
P
a(i) = a(k+i+1) = a(i+1) .
i=k+1 i=0 i=k

Sea : In In dada por



(i) si i < k,
(i) =
(i + 1) si i k.
84 Captulo 2. Anillos

Entonces:
n+1
P k1
P n
P n
P
a(i) = a (i) + a (i) + an+1 = a (i) + an+1
i=1 i=1 i=k i=1

n
P n+1
P
= ai + an+1 = ai .
i=1 i=1

donde hemos usado la propiedad asociativa generalizada y la hipotesis de in-


duccion.
Este teorema afirma que una suma finita no depende del orden de los su-
mandos. Para hacer esto mas explcito vamos a considerar una sucesion {ai }iI ,
donde I es un conjunto finito cualquiera, no necesariamente de la forma In .
Sea n = |I| y sean f : In I, g : In I dos biyecciones. Entonces
= f 1 g : In In es tambien una biyeccion y cumple que

a(f (i)) = ag(f 1 (f (i))) = ag(i) .


n
P n
P n
P
Por el teorema anterior, af (i) = a(f (i)) = ag(i) . Esto justifica la
i=1 i=1 i=1
definicion siguiente:

Definicion 2.48 Sea A un semigrupo cuya operacion sea conmutativa y tenga


elemento neutro. Sea I un conjunto finito no vaco, sean {ai }iI elementos de
A. Definimos
P Pn
ai = af (i) ,
iI i=1

donde n = |I| y f : In I es cualquier biyeccion.

Hemos demostrado que la suma as definida es la misma sea P cual sea la


biyeccion f empleada para calcularla. Convenimos ademas en que Ai = 0.
i

El teorema siguiente sobre cambio del conjunto de ndices es inmediato:

Teorema 2.49 Sea A un semigrupo conmutativo con elemento neutro, con-


sideremos una biyeccion h : I J entre conjuntos finitos y sean {aj }jJ
elementos de A. Entonces P P
ah(i) = aj .
iI jJ

Demostracion: Si los conjuntos son vacos la igualdad se reduce a 0 = 0.


En caso contrario tomamos n = |I| y f : In I biyectiva y observamos que
si aplicamos la definicion de suma finita con f para el miembro izquierdo y
f h : In J para el miembro derecho, obtenemos en ambos casos la misma
suma finita.
Ahora podemos expresar la propiedad asociativa generalizada bajo hipotesis
mas generales que en la version precedente:
2.6. Apendice: Sumas y productos finitos 85

Teorema 2.50 (Propiedad asociativa generalizada) Sea A un semigrupo


conmutativo con elemento neutro, sea {Ij }m
j=1 una familia de conjuntos finitos
m
S
disjuntos dos a dos, sea I = Ij y sean {ai }iI elementos de A. Entonces,
j=1

P m P
P
ai = ai .
iI j=1 iIi

Demostracion: Sea kj = |Ij | y sea fj : Ikj Ij biyectiva. Definimos


por recurrencia:

n0 = 0, nj+1 = nj + kj+1 , para 0 j < m.

Sea fj : {i N | nj1 + 1 i nj } Ij dada por fj (i) = fn (i nj1 ),


claramente biyectiva. Como los conjuntos Ij son disjuntos, las funciones fj
determinan una funcion f : Inm I biyectiva. Entonces

P n
Pm m
P nj
P P kj
m P m P
P
ai = af (i) = afj (i) = afj (i) = ai .
iI i=1 j=1 i=nj1 j=1 i=1 j=1 iIi

Todas las propiedades elementales de las sumas y productos finitos pueden


demostrarse ya facilmente, bien a partir de las propiedades que hemos demos-
trado, bien mediante inducciones sencillas.
Por ejemplo, consideremos la propiedad de intercambio de sumatorios:
n P
P m m P
P n
aij = aij .
i=1 j=1 j=1 i=1
n
S
Para probarla basta considerar In Im = {i} Im y aplicar el teorema an-
terior: i=1

P n
P P n P
P n P
P m
aij = aij = aij = aij ,
(i,j)In Im i=1 (i,j){i}Im i=1 jIm i=1 j=1

e igualmente
P m P
P n
aij = aij ,
(j,i)Im In j=1 i=1

y los dos miembros izquierdos son iguales por el teorema 2.49, considerando la
biyeccion f : In Im Im In dada por f (i, j) = (j, i).
Captulo III

Aritmetica en dominios
ntegros

En el captulo anterior hemos presentado la aritmetica elemental de los


numeros enteros, es decir, hemos definido la suma y el producto y hemos visto
que podemos dividir numeros enteros, sea para obtener numeros racionales, sea
mediante la division eucldea, para obtener un cociente y un resto enteros. Ahora
vamos a ascender un nivel introduciendo los conceptos de la aritmetica clasica:
multiplos, divisores, primos, etc. Todo esto podra hacerse mediante tecnicas
elementales que no involucraran mas que los conceptos que ya conocemos sobre
numeros enteros (incluso podramos trabajar exclusivamente con numeros natu-
rales), pero aqu vamos a adoptar un punto de vista eminentemente algebraico,
y formularemos los resultados en terminos que los hagan validos para una clase
muy amplia de anillos, de modo que todos los resultados sobre divisibilidad,
primos, etc. que demostremos para Z seran automaticamente aplicables a otros
contextos en los que se cumplan unos requisitos mnimos.

3.1 Ideales
En el analisis algebraico de la aritmetica es fundamental el concepto de ideal.
Este concepto surgio relativamente tarde en el estudio de los numeros debido
en gran parte a que para el caso de los numeros enteros se vuelve trivial y, por
lo tanto prescindible, e incluso invisible, en el sentido de que a nadie se le
ocurrira definir el concepto de ideal para formular con ellos una serie de hechos
que se enuncian con total naturalidad sin hacer referencia a ellos. Sin embargo,
sucede que cuando las propiedades aritmeticas de Z se expresan en terminos
de ideales, entonces son directamente generalizables a otros contextos, mientras
que las formulaciones clasicas que no involucran ideales no lo permiten, de modo
que quien piensa en terminos de ideales puede ver que dos contextos diferentes
son esencialmente analogos cuando a quien solo piense en terminos de numeros
o, mas en general, de elementos de un anillo puede no ver relacion entre ellos.

87
88 Captulo 3. Aritmetica en dominios ntegros

Definicion 3.1 Un ideal en un dominio1 A es un conjunto I A que cumpla


las propiedades siguientes:

1. 0 I,

2. si a, b I, entonces a + b I,

3. si a A y b I entonces ab I.

Notemos que la propiedad 3. nos da en particular que si b I entonces


b = (1)b I, y combinando esto con 2. resulta que si a, b I, entonces
tambien a b = a b I.
Si a A, se llama ideal principal generado por a al ideal

aA = Aa = {ab | b A}.

El conjunto aA es lo que habitualmente se llama el conjunto de los multiplos


de a en A. Es inmediato comprobar que es realmente un ideal de A. Lo que
expresan los axiomas de la definicion de ideal es que el 0 siempre es multiplo
de a, que la suma de dos multiplos de a es tambien multiplo de a y que todo
multiplo de un multiplo de a es tambien un multiplo de a.
Del mismo modo que podemos ver el concepto de dominio como una se-
leccion de propiedades basicas que satisfacen los numeros enteros y que abs-
traemos para aplicarlas a otros objetos que pueden ser muy distintos de los
numeros enteros, el concepto de ideal surgio como una seleccion de las pro-
piedades basicas que cumplen los conjuntos de multiplos, con la idea de que
pueden ser aplicables a otros subconjuntos de un anillo que no sean realmente
conjuntos de multiplos.
Todo anillo tiene al menos dos ideales, a saber, {0} y el propio A. Se les llama
ideales impropios. El ideal {0} es el ideal trivial y se representa simplemente
por 0. Notemos que ambos son principales, pues 0 = 0A y A = 1A.
Un poco mas en general, un hecho simple, pero importante, sobre ideales es
que si un ideal I de un dominio A contiene una unidad, entonces I = A.
En efecto, si u I es una unidad, por definicion de ideal se cumple que
1 = u1 u I y si a A, entonces a = a 1 I. As pues, todo elemento de A
esta en I.
Por lo tanto, los unicos ideales de un cuerpo son los impropios, pues si un
ideal de un cuerpo posee un elemento no nulo, este sera una unidad, y el ideal
sera el cuerpo completo.
As pues, el concepto de ideal se vuelve trivial cuando se aplica a los cuerpos,
y lo mismo sucede en una amplia clase de anillos, en un sentido menos radical
que recoge la definicion siguiente:
1 La definicion es valida para anillos unitarios arbitrarios sin mas que anadir que tambien

ba I en la propiedad 3.
3.1. Ideales 89

Un dominio de ideales principales (DIP) es un dominio ntegro en el que


todo ideal es principal.
La observacion precedente muestra que todo cuerpo es trivialmente DIP,
pero se cumple algo mucho mas general:

Teorema 3.2 Todo dominio eucldeo es un dominio de ideales principales.

Demostracion: Sea A un dominio eucldeo y sea : A \ {0} N su norma


eucldea. Sea I 6= 0 un ideal de A (si I = 0 ya es principal). Sea a I tal que
(a) sea el mnimo del conjunto {(b) | b I, b 6= 0}.
Si b I, entonces b = ac + r, con r = 0 o bien (r) < (a). Como a I,
por la definicion de ideal ac I, y a su vez b ac I, es decir, r I. Como
(a) es mnimo, no puede ser (r) < (a), luego r = 0, es decir, b = ac aA.
Hemos probado que I aA. Como a I, la otra inclusion es consecuencia
de la definicion de ideal. Por tanto I = aA es un ideal principal.
En particular tenemos que Z es un DIP, es decir, los unicos ideales de Z son
los de la forma nZ, para n Z. Tambien son DIP los anillos de polinomios
K[x], donde K es un cuerpo.
Esto es lo que hace que el concepto de ideal sea superfluo al estudiar la
aritmetica de Z o de anillos como K[x]. Cada ideal I de un DIP es de la
forma I = aA, para cierto a A, y todo lo que se diga en terminos de I
puede decirse igualmente en terminos de a, sin necesidad de mencionar ideales
para nada. Sin embargo, vamos a ver las propiedades aritmeticas expresadas
en terminos de ideales son mas generales que las expresadas en terminos de
elementos reales del anillo, pues siguen siendo validas en contextos en los que
no existe la correspondencia entre (elementos) ideales y elementos reales que
se da en los DIP.
Terminamos esta seccion introduciendo algunos conceptos convenientes para
tratar con ideales en anillos que no sean DIP.

Definicion 3.3 Es inmediato que la interseccion de una familia (no vaca) de


ideales de un anillo A sigue siendo un ideal de A. Por lo tanto si X A, existe
un mnimo ideal de A que contiene a X, a saber, la interseccion de la familia
de todos los ideales de A que contienen a X (existe al menos uno, el propio A).
Lo llamaremos ideal generado por X y lo representaremos por (X). Tambien se
dice que el conjunto X es un generador del ideal (X).

As, para todo subconjunto X de A tenemos que (X) es un ideal de A,


X (X) y si I es un ideal de A tal que X I, entonces (X) I. Otro hecho
obvio es que si X Y A, entonces X (Y ), luego (X) (Y ).
Cuando el conjunto X es finito, X = {x1 , . . . , xn }, el ideal generado por X
se representa por (x1 , . . . , xn ). Entonces se dice que el ideal esta finitamente
generado.
El teorema siguiente nos da la forma de los elementos de un ideal a partir
de sus generadores.
90 Captulo 3. Aritmetica en dominios ntegros

Teorema 3.4 Sea A un dominio y X A. Entonces

(X) = {a1 x1 + + an xn | n N, ai A, xi X}

En particular si x A, entonces (x) = aA = {ax | a A}.

Demostracion: Se comprueba sin dificultad que el conjunto de la derecha


es un ideal de A y claramente contiene a X, luego

(X) {a1 x1 + + an xn | n N, ai A, xi X}.

Por otra parte (X) ha de contener a los elementos de la forma ax, con x
en X, y por ser un subanillo a las sumas de estos elementos, luego se da la
igualdad.
Pn Pn 
Si X tiene un solo elemento x, las sumas ai x = ai x estan en el
i=1 i=1
conjunto {ax | a A}, luego (X) {ax | a A}. La otra inclusion es obvia.

As pues, los ideales principales son los ideales generados por un unico ele-
mento del anillo.2
El teorema siguiente nos proporciona ejemplos de dominios que no son DIP:

Teorema 3.5 Sea A un dominio ntegro. Entonces A[x] es DIP si y solo si A


es un cuerpo.

Demostracion: Si A es un cuerpo sabemos que A[x] es un dominio eucl-


deo, luego es un DIP. Recprocamente, si A[x] es DIP, sea a A un elemento
no nulo y veamos que es una unidad en A. Para ello consideramos el ideal (x, a)
de A[x]. Como ha de ser un ideal principal existe un polinomio p A[x] tal que
(x, a) = (p), luego a = pq para cierto q A[x], pero entonces grad p + grad q =
grad a = 0, luego grad p = 0 y por tanto p A. Por otra parte tambien
x = pr, para cierto r A[x], pero entonces el coeficiente director de x, que es 1,
es el producto de p por el coeficiente director de r, luego p es una unidad y
(p) = A[x].
Entonces 1 (p) = (x, a), luego 1 = ux + va, para ciertos polinomios
u, v A[x]. Sin embargo el termino independiente de ux es 0 y el de va es ba,
donde b es el termino independiente de v. Resulta, pues, que 1 = ba, con lo que
a es una unidad en A.
En particular Z[x] no es DIP, ni en particular eucldeo.
 Lo mismo
 vale para
A[S] cuando S tiene mas de un elemento (pues A[S] = A S \{x} [x] y A[S \{x}]
no es un cuerpo).
Ejercicio: Probar que (x, 2) no es un ideal principal de Z[x], y que (x, y) no es un
ideal principal de Q[x, y].
2 Pero esto no contradice que un mismo ideal principal pueda tener varios generadores. Por

ejemplo, en Z es claro que (3) = (3). El ideal admite dos generadores, pero solo es necesario
uno para generarlo.
3.1. Ideales 91

Esto responde a un problema que habamos dejado planteado al final del


captulo anterior: como Z[x] no es DIP, podemos asegurar que no es un dominio
eucldeo. As pues, no es posible dividir en general polinomios con coeficientes
enteros en los terminos del teorema 2.44, de modo que la restriccion all impuesta
de que el coeficiente director del divisor sea una unidad no puede eliminarse.
Tampoco es un dominio eucldeo Q[x, y], por la misma razon.
Sin embargo, estos anillos, como Z[x] o Q[x, y], aunque no son DIP, cumplen
una propiedad mas debil de interes:
Definicion 3.6 Un dominio ntegro A es un anillo noetheriano si todo ideal de
A es finitamente generado.
Evidentemente, todo DIP es un anillo noetheriano.
Teorema 3.7 Sea A un dominio ntegro. Son equivalentes:
1. A es un anillo noetheriano.
2. Para toda cadena ascendente de ideales de A
I0 I1 I2 I3 . . .
existe un numero natural n tal que In = Im para todo m n.
3. Toda familia no vaca de ideales de A tiene un maximal3 para la inclusion.
Demostracion: Si I0 I1 I2 SI3 . . . es una cadena ascendente de

ideales de A, es facil ver que la union i=0 Ii es tambien un ideal de A. Si A
es noetheriano ha de tener un generador finito X. Cada elemento de X esta
en uno de los ideales Ii , y como X es finito y los ideales S forman una cadena,
existira un natural n tal que X In , pero entonces i=0 Ii = (X) In , lo que
implica que Ii = In para todo i n. Por tanto 1) implica 2).
Si una familia no vaca de ideales de A no tuviera maximal, se podra extraer4
una cadena ascendente de ideales que contradijera 2), luego 2) implica 3).
Si A tuviera un ideal I que no admitiera un generador finito, entonces, dado
cualquier elemento a0 de I, se cumple que (a0 ) 6= I, luego existe un elemento
a1 I \ (a0 ), luego (a0 ) (a0 , a1 ) 6= I, y de esta forma podemos conseguir5 una
cadena de ideales (a0 ) (a0 , a1 ) (a0 , a1 , a2 ) . . . sin que ninguno de ellos
sea maximal. Por lo tanto 3) implica 1).
3 En general, en un conjunto parcialmente ordenado X, un elemento maximal m es un

elemento tal que no existe otro x X tal que m < x. Aqu estamos considerando a la
inclusion como un orden parcial en la familia de los ideales de A, y si F es una familia de
ideales de A, un ideal I F es maximal para la inclusion ni no existe otro J F tal que
I J.
4 Este es el primer uso que hacemos del axioma de eleccion, pero en la version debil del

Principio de elecciones dependientes (A.3). En efecto, lo aplicamos tomando como A una


familia de ideales F y como R la relacion dada por I R J si y solo si I J. La hipotesis de que
F no tiene maximal equivale a la hipotesis que requiere el Principio de elecciones dependientes,
que a su vez nos da la cadena ascendente requerida.
5 Tecnicamente aqu se aplica tambien el principio de elecciones dependientes. Ahora el

conjunto A es la familia de las funciones s : In I tales que s(i + 1) I \ (s(0), . . . , s(i))

para cada i < n, y la relacion R es la inclusion estricta.


92 Captulo 3. Aritmetica en dominios ntegros

Hemos visto que, aunque Z o Q sean DIP, eso no implica que Z[x] o Q[x, y]
lo sean. En cambio, eso no pasa con la propiedad de Noether:
Teorema 3.8 (Teorema de Hilbert) Si A es un anillo noetheriano entonces
A[x1 , . . . , xn ] tambien lo es.
Demostracion: Basta probar que si A es noetheriano tambien lo es A[x],
pues esto implica que lo es A[x1 ], luego tambien A[x1 ][x2 ] = A[x1 , x2 ], y as
llegamos hasta A[x1 , . . . , xn ].
Sea I un ideal de A[x]. Sea Ii el conjunto de los coeficientes directores de
los polinomios de I de grado i (mas el 0).
Es claro que Ii es un ideal de A, as como que I0 I1 I2 I3 (para
ver que un elemento de Ii esta en Ii+1 basta multiplicar por x el polinomio que
justifica que esta en Ii ). Como A es noetheriano, los ideales Ii son iguales a
partir de un Ir .
Sea Ii = (bi1 , . . . , bin ) para i = 0, . . . , r (no es restriccion suponer que el
numero de generadores es el mismo para todos los ideales, pues siempre podemos
anadir generadores redundantes). Podemos suponer tambien que los bij 6= 0.
Sea pij un polinomio en I de grado i cuyo coeficiente de grado i sea bij .
Vamos a probar que I = (pij | i = 0, . . . , r, j = 1, . . . , n). Claramente este ideal
esta contenido en I.
Sea f I un polinomio de grado d. Veremos que esta en el ideal generado
por los pij por induccion sobre d. El coeficiente director de f esta en Id . Si
d > r notamos que los coeficientes directores de xdr pr1 , . . . , xdr prn son los
numeros br1 , . . . , brn , que generan Id = Ir . Por consiguiente, existen elementos
c1 , . . . , cn en A tales que el coeficiente director de f es de la forma
c1 xdr pr1 + + cn xdr prn .
Por consiguiente, el polinomio f c1 xdr pr1 cn xdr prn tiene grado
menor que d (ya que los terminos de mayor grado se cancelan) y esta en I, luego
por hipotesis de induccion f esta en el ideal generado por los pij .
Si d r obtenemos un polinomio f c1 pd1 cn pdn de grado menor
que d y contenido en I, con lo que se concluye igualmente.
Terminamos esta seccion observando que entre los ideales de un anillo se
puede definir una suma y un producto como sigue:
Definicion 3.9 Sea A un anillo y sean S1 , . . . , Sn subconjuntos de A. Llama-
remos
S1 + + Sn = {s1 + + sn | si Si para i = 1, . . . , n},
nPm o
S1 Sn = si1 sin | m N y sij Sj para j = 1, . . . , n .
i=1

Es pura rutina comprobar que la suma y el producto de ideales de A vuelve


a ser un ideal de A. Ademas son operaciones asociativas, conmutativas y distri-
butivas, es decir, P (Q + R) = P Q + P R. De la definicion de ideal se sigue que
P Q P Q.
3.2. Divisibilidad en dominios ntegros 93

3.2 Divisibilidad en dominios ntegros


Es bien conocido que todo numero natural (mayor que 1) se descompone
de forma unica salvo el orden en producto de numeros primos. Por ejemplo, la
descomposicion de 360 es
360 = 23 32 5.
Demostraremos este hecho en la seccion siguiente, mientras que en esta intro-
duciremos todos los conceptos necesarios para enunciar el teorema con precision
y con un cierto grado de generalidad. Empezamos con los conceptos de multiplo
y divisor, que ya hemos introducido de pasada al discutir la definicion de ideal:

Definicion 3.10 Sea A un dominio ntegro y a, b dos elementos de A. Diremos


que a divide a b, o que a es un divisor de b, o que b es un multiplo de a, o que b
es divisible entre a (y lo representaremos a | b) si existe un elemento c de A tal
que b = ac.

Por ejemplo en Z tenemos que 3 divide a 15, pero no a 16.


Existen algunos casos triviales de divisibilidad que conviene tener presentes:

0 no divide a ningun elemento de A salvo a s mismo.

Todo elemento de a divide6 a 0.

Si u A es una unidad, entonces divide a todo a A, pues a = u(u1 a).

Si u A es una unidad, sus unicos divisores son las demas unidades de a,


pues si a | u, entonces existe un b en A tal que u = ab, luego 1 = abu1 ,
luego a es una unidad.

Es obvio que a | a y que si a | b y b | c entonces a | c. Esto significa que


la divisibilidad es una relacion reflexiva y transitiva. De hecho esta cerca de
determinar una relacion de orden parcial, pero en realidad no es antisimetrica.
Por el contrario, el fallo de la antisimetra da lugar a un concepto no trivial:
Diremos que dos elementos a y b de A son asociados si a | b y b | a.
Por ejemplo, en Z tenemos que 3 y 3 son asociados. En general:
Dos elementos no nulos a, b de un dominio A son asociados si y solo si existe
una unidad u A tal que a = ub.
En efecto, si a y b son asociados, entonces a = ub y b = va, para ciertos u y
v del anillo A. Por lo tanto a = uva, de donde uv = 1, luego u y v son unidades.
El recproco es trivial, teniendo en cuenta que a = ub equivale a b = u1 a.
6 Lingusticamente, existe una contradiccion aparente entre el hecho de que A, por ser un

dominio ntegro, no tiene divisores de 0 y que todos los elementos de A dividen a 0. Lo que
sucede es que todos los elementos de A dividen a 0 trivialmente, es decir, con cociente 0,
mientras que un divisor de 0 es, por definicion, un elemento que divide a 0 no trivialmente,
con cociente no nulo.
94 Captulo 3. Aritmetica en dominios ntegros

Es claro que la asociacion en un dominio ntegro A es una relacion de equi-


valencia. Si A tiene un numero finito de unidades, u1 , . . . , un , entonces los
asociados de un a A no nulos seran au1 , . . . , aun (entre los que esta ya el
propio a, ya que una de las unidades sera la identidad). As pues, las clases de
equivalencia para la relacion de asociacion son la formada solo por el 0 y las
restantes, que tendran n elementos cada una. Como en Z hay dos unidades, 1,
los asociados no nulos en Z se agrupan por parejas: 1, 2, 3, etc.
El concepto de asociacion es importante por el motivo siguiente: si queremos
enunciar un teorema de descomposicion unica en factores primos valido para Z,
nos vemos obligados a relajar la condicion de unicidad, ya que, por ejemplo,
360 = 2 2 2 3 3 5 = (2) 2 3 (3) 5.

Aqu tenemos dos descomposiciones en factores primos que no se diferencian


unicamente en el orden de los factores. Si quisieramos enunciar el teorema para
numeros enteros podramos decir que la descomposicion es unica salvo signos,
pero si queremos un enunciado valido para anillos mas generales la formula
correcta es salvo unidades o salvo asociados.
En efecto, la propia definicion de asociado implica que dos elementos aso-
ciados tienen los mismos multiplos y divisores, por lo que si un primo aparece
en una descomposicion en factores, esta se puede modificar para que aparezca
en su lugar cualquiera de sus asociados, tal y como hemos hecho con la factori-
zacion del 360, en la que hemos cambiado un 2 por un 2 a cambio de cambiar
tambien un 3 por un 3.
Hay que tener la misma precaucion al definir el concepto de primo, pues
cuando trabajamos con numeros naturales podemos decir que 5 es primo porque
sus unicos divisores son 1 y 5, pero si trabajamos con numeros enteros resulta
que 5 tiene cuatro divisores: 1 y 5.
En general, en cualquier dominio ntegro A, tenemos que todo elemento
a A tiene por divisores a las unidades de A y a sus propios asociados (entre
los que figura el mismo). A estos divisores los llamaremos divisores impropios
de a. Cualquier otro divisor es un divisor propio.
Por ejemplo, los divisores impropios de 4 en Z son 1, 1, 4 y 4. Sus
divisores propios son 2 y 2. En este sentido podemos decir que 5 solo tiene
(en Z) los divisores impropios.
Con estas precauciones, ya podemos dar una definicion razonable de ele-
mento irreducible en un anillo:
Un elemento a de un dominio ntegro A es irreducible en A si es no nulo, no
es una unidad y no admite ninguna descomposicion a = bc con b y c elementos
de A, salvo que uno de ellos sea una unidad (y, por lo tanto, el otro es un
asociado de a).
Equivalentemente, un elemento (no nulo ni unidad) es irreducible si sus
unicos divisores son los impropios. Es obvio que un elemento es irreducible si y
solo si lo es cualquiera de sus asociados.
3.2. Divisibilidad en dominios ntegros 95

En este sentido podemos decir que 5 (al igual que 5) es irreducible en Z.


Es importante que decimos irreducible y no primo, la definicion de primo
la daremos un poco mas adelante y, aunque ambas seran equivalentes en Z,
en otros anillos no lo seran, por lo que el lector debe acostumbrarse a que
no tener divisores propios es la definicion de elemento irreducible y no la de
elemento primo. Observemos que dicha definicion excluye tambien al cero y a
las unidades, de modo que 1 y 1 no son irreducibles en Z, por definicion.
Los elementos no nulos ni unitarios que no son irreducibles se dicen redu-
cibles. As pues, 1 y 1 no son ni reducibles ni irreducibles, sino que en todo
dominio ntegro tenemos el 0, las unidades, los elementos irreducibles y los re-
ducibles.
Ahora ya podemos introducir la nocion fundamental que estabamos persi-
guiendo:
Un dominio ntegro A es un dominio de factorizacion unica (DFU) si todo
elemento a de A no nulo y que no sea una unidad se descompone como pro-
ducto de elementos irreducibles a = c1 cn y la descomposicion es unica salvo
ordenacion o cambio por asociados (es decir, si a = c1 cn = d1 dm son dos
descomposiciones de a en elementos irreducibles, entonces m = n y, ordenando
los factores adecuadamente, cada ci es asociado a di ).
En la seccion siguiente demostraremos que Z es un DFU en este sentido. El
resto de esta seccion lo dedicaremos introducir algunos conceptos mas relacio-
nados con las descomposiciones en irreducibles.
Si A es un DFU y a es un elemento no nulo ni unitario, para cada elemento
irreducible p de A llamaremos exponente de p en a al numero de veces que p o
sus asociados aparecen en cualquier descomposicion de a en factores irreducibles
(puede ser igual a 0). Lo denotaremos por vp (a).
Por ejemplo, teniendo en cuenta la descomposicion de 360 en factores irre-
ducibles que hemos mostrado antes, se cumple que

v2 (360) = 3, v3 (360) = 2, v5 (360) = 1, vp (360) = 0 para p 7.

En general, en una descomposicion de un a A apareceran vp (a) factores


asociados a p, es decir, factores de la forma up donde u es una unidad. Si
multiplicamos todas las unidades que as aparecen, resulta que a admite una
descomposicion en la forma

a = u pn1 1 pnnm ,

donde los pi son irreducibles distintos, ni = vpi (a) y u es una unidad.


La presencia de u es necesaria, pues, por ejemplo, la unica forma de factorizar
en Z el 25 de este modo es 25 = (1)52 . Lo importante es que cada p aparece
siempre con exponente vp (a) en virtud de la unicidad de la factorizacion.
Ademas el exponente de un irreducible en un elemento a es por definicion el
mismo que el de sus asociados, y el exponente de un irreducible en un elemento a
96 Captulo 3. Aritmetica en dominios ntegros

es el mismo que en los asociados de a (pues una factorizacion de un asociado de


a se obtiene multiplicando una factorizacion de a por una unidad, sin cambiar
los irreducibles).
La factorizacion en irreducibles de un producto puede obtenerse como el
producto de las factorizaciones de los factores, de donde se sigue la relacion

vp (ab) = vp (a) + vp (b).

Podemos definir vp (a) = 0 para todo irreducible p cuando a es una unidad, y


as la relacion anterior es valida tambien si a o b es una unidad.
Notemos que un irreducible p divide a un elemento a si y solo si vp (a) 6= 0.
En efecto, si vp (a) 6= 0 eso significa que p aparece en una factorizacion de a,
luego p | a. Por otra parte si p | a, entonces a = pb para cierto elemento b, luego
vp (a) = vp (p) + vp (b) = 1 + vp (b) 6= 0.
Si a | b, ha de cumplirse que vp (a) vp (b) para todo irreducible p de A. La
condicion es tambien suficiente, pues si se cumple esto, entonces b se obtiene
como producto de a por el producto de todos los irreducibles p que dividen a b
elevados al exponente vp (b) vp (a) (y una unidad adecuada).
Dos elementos a y b son asociados si y solo si vp (a) = vp (b) para todo
irreducible p de A.
Como consecuencia de estos hechos tenemos que en un DFU, si p es irredu-
cible y p | ab, entonces p | a o p | b.
En efecto, estamos suponiendo que 0 6= vp (a) + vp (b), luego una de los dos
exponentes ha de ser no nulo.
Este hecho resulta ser muy importante en la teora de la divisibilidad, hasta
el punto de que conviene introducir un nuevo concepto para comprenderlo ade-
cuadamente:
Si A es un dominio ntegro, diremos que un elemento p de A es primo si es
no nulo, no es una unidad y cuando p | ab entonces p | a o p | b, para todos los
elementos a y b de A.
Ya hemos probado la mitad del siguiente teorema fundamental:

Teorema 3.11 Sea A un dominio ntegro


1. Todo primo de A es irreducible.
2. Si A es DFU, un elemento de A es primo si y solo si es irreducible

Demostracion: Efectivamente, si p es primo y se descompone como p = ab,


entonces p | a o p | b, pero como a | p y b | p, lo que tenemos es que p es asociado
con a o con b, lo que implica que el otro es una unidad. La segunda afirmacion
ya esta probada.
As pues, una vez sabemos que un dominio ntegro es DFU, ya podemos
hablar de descomposiciones en factores primos en lugar de descomposiciones en
3.3. Ideales y divisibilidad 97

factores irreducibles, pues ambos conceptos coinciden. Pero hay que recordar
que en ausencia de factorizacion unica primo es un concepto mas fuerte que
irreducible.

3.3 Ideales y divisibilidad


Aunque todava no estamos en condiciones de comprender enteramente por
que, lo cierto es que los ideales proporcionan el lenguaje idoneo para expresar
los hechos mas relevantes de la divisibilidad en un anillo. Como ya sabemos,
si a es un elemento de un dominio ntegro A, entonces el ideal (a) = Aa es
precisamente el conjunto de todos los multiplos de a.
Es claro que a | b equivale a (b) (a), de donde se sigue que a y b son
asociados si y solo si (a) = (b), es decir, si y solo si generan el mismo ideal.

Hemos de pensar que dos elementos asociados son una misma cosa a efectos
de divisibilidad (ambos tienen los mismos multiplos y divisores). Ahora vemos
que a cada familia de elementos asociados de un dominio ntegro le corresponde
un unico ideal principal. En particular el 0 se corresponde con el ideal 0 = (0)
y las unidades de A se corresponden todas ellas con el ideal A = (1).

El lector que quiera comprender adecuadamente la teora de la divisibilidad


debe esforzarse por llegar a entender que los ideales principales representan
mejor que los elementos mismos del anillo los posibles divisores de un elemento
dado. Quiza en esta direccion le ayude conocer un debil esbozo informal del
modo en que el concepto de ideal era concebido cuando aparecio en la teora:

Consideremos las dos afirmaciones siguientes relativas a Z. Por una parte


2 | 6 y por otra 2 | 6. A efectos de divisibilidad ambas son equivalentes, puesto
que 2 y 2 son asociados. Podemos resumirlas en una sola si consideramos que
es el ideal (2) = (2) el que divide a 6, y escribimos en consecuencia (2) | 6.
Podemos pensar que los divisores de los elementos de un dominio ntegro no
son otros elementos del anillo, sino sus ideales. As, podemos definir (a) | b
como a | b, lo cual no depende del generador elegido para el ideal, pues dos
cualesquiera son asociados. Notemos que esto equivale a que b (a), luego si I
es un ideal principal tenemos (por definicion) que I | b b I.
Lo que hace de esto una idea brillante es que en realidad no tenemos por
que exigir a I que sea principal, con lo que cualquier ideal I puede dividir a un
elemento en este sentido.
En un DIP cada divisor ideal se corresponde con una familia de diviso-
res reales asociados (sus generadores), pero hay anillos no DIP en los que se
puede hablar coherentemente de divisores ideales en este sentido sin que esten
asociados a divisores reales, es decir, sin que sean principales. Tales divisores
ideales resultan esenciales para formular una teora de divisibilidad razonable
(y util) en dichos anillos. De hecho, los ideales en el sentido moderno fueron
introducidos por Dedekind a finales del siglo XIX para formalizar esta idea de
divisor ideal que no se corresponde con ningun divisor real.
98 Captulo 3. Aritmetica en dominios ntegros

Mas en general, podemos extender la relacion de divisibilidad de modo que


los ideales puedan dividirse entre s. Podemos pensar que un ideal I divide a un
ideal J si J I (comparar con a | b (b) (a)). De momento no entraremos
en la teora de divisores ideales, sino que nos limitaremos a desarrollar la teora
de divisibilidad en dominios ntegros mostrando su conexion con los ideales del
anillo. El lector debe tener presente que esta conexion se volvera esencial en
captulos posteriores, por lo que debe acostumbrarse a pensar e interpretar las
cosas en terminos de ideales en la medida de lo posible.
Como primer ejemplo del paso a terminos de ideales, veamos el equivalente
del concepto de elemento primo:

Definicion 3.12 Un ideal P de un anillo A es primo si P 6= A y para todo par


de ideales I, J de A tales que IJ P , se cumple que I P o J P .

Si tenemos in mente la equivalencia I | J J I vemos que la definicion


de ideal primo es paralela a la de elemento primo. La condicion P 6= A se
corresponde con la exigencia de que los primos no sean unidades. Hay, no
obstante, una discrepancia debida principalmente a motivos historicos, y es que,
si bien hemos exigido que el elemento 0 no sea considerado primo, s admitimos
que el ideal 0 sea considerado primo. He aqu una caracterizacion practica del
concepto de ideal primo.

Teorema 3.13 Si A es un dominio ntegro, un ideal P de A es primo si y solo


si P 6= A y para todo par de elementos a, b de A, si ab P entonces a P o
b P.

Demostracion: Si P es primo y ab P , entonces (a)(b) (ab) P , de


donde resulta que (a) P o (b) P , o sea, a P o b P .
Recprocamente, si IJ P , pero I no esta contenido en P , entonces existe
un a I \ P . Ahora, si b J tenemos que ab IJ P , luego a P o b P ,
y ha de ser b P , es decir, J P .
Ahora es inmediato que en un dominio ntegro A se cumple que un elemento
no nulo a es primo si y solo si el ideal (a) es un ideal primo. No obstante
recordamos que el ideal trivial (0) es primo, aunque el elemento 0 no lo es por
definicion. Si un elemento es irreducible cuando no tiene divisores propios, el
concepto analogo para ideales es el siguiente:

Definicion 3.14 Un ideal M de un anillo A es un ideal maximal si M 6= A y


si I es un ideal de A tal que M I A, entonces M = I o I = A.

Como en el caso de ideales primos, estamos admitiendo la posibilidad de que


el ideal 0 sea maximal (si bien no tiene por que serlo necesariamente).
Al contrario de lo que ocurre con el concepto de primo, no es cierto que un
elemento a de un dominio ntegro A sea irreducible si y solo si el ideal (a) es
maximal. La situacion es un poco mas delicada. Concretamente a es irreducible
3.3. Ideales y divisibilidad 99

si y solo si (a) es maximal entre los ideales principales, es decir, si (a) 6= A y


cuando (a) (b) A, entonces (a) = (b) o (b) = A.
En efecto, si a es irreducible y (a) (b) A, entonces b | a, luego o bien
b es una unidad (y entonces (b) = A) o bien b es asociado de a (con lo que
(b) = (a)). El recproco es igual. Por lo tanto tenemos:

Teorema 3.15 Sea A un dominio ntegro y a 6= 0 un elemento de A.

1. a es primo si y solo si (a) es primo.

2. a es irreducible si y solo si (a) es maximal entre los ideales principales


de A.

3. Si A es DIP, entonces a es irreducible si y solo si (a) es maximal.

La tercera afirmacion es inmediata, pues en un DIP los ideales maximales


coinciden con los ideales maximales entre los ideales principales.
Hemos visto que todo elemento primo de un anillo es irreducible. Entre
ideales podemos demostrar justo la implicacion contraria:

Teorema 3.16 En un dominio, todo ideal maximal es primo.

Demostracion: Si M es un ideal maximal en A y ab M , pero a, b


/ M,
tendramos que M M + (a) A, luego la maximalidad de M implica que
M + (a) = A. Por lo tanto 1 = m + xa para cierto m M y cierto x A. As
pues b = mb + xab M , con lo que tenemos una contradiccion.
Ahora estamos en condiciones de probar dos hechos clave.

Teorema 3.17 En un DIP los ideales maximales coinciden con los ideales pri-
mos no triviales y los elementos irreducibles coinciden con los elementos primos.

Demostracion: Si A es un DIP y (a) es un ideal primo no trivial, su-


pongamos que (b) es un ideal tal que (a) (b) A. Entonces a = bc para
cierto c A. Como (a) es primo se ha de cumplir o bien b (a) (en cuyo
caso (a) = (b)) o bien c (a), en cuyo caso c = da para cierto d A, y as
a = bc = bda, luego (dado que a 6= 0), bd = 1, o sea, b es una unidad y por lo
tanto (b) = A.
La segunda afirmacion se sigue de la primera y de 3.15
Con esto podemos probar el resultado principal de esta seccion. Diremos
que un dominio ntegro A tiene la propiedad de factorizacion si todo elemento
de A no nulo ni unidad se descompone en producto de irreducibles.

Teorema 3.18 Todo anillo noetheriano A tiene la propiedad de factorizacion.


Si ademas todo elemento irreducible de A es primo, entonces A es DFU. En
particular todo DIP es DFU.
100 Captulo 3. Aritmetica en dominios ntegros

Demostracion: Sea A un anillo noetheriano. Llamemos S al conjunto de


los elementos de A no nulos ni unidades pero que no admitan una descomposicion
en irreducibles. Hemos de probar que S es vaco.
Si existe un elemento a en S, entonces a no es unidad, luego (a) 6= A. Si
a fuera irreducible entonces el mismo sera una descomposicion en irreducibles,
luego no lo es. Podemos factorizar a = bc donde ni b ni c es una unidad (ni 0). Si
ninguno estuviera en S entonces se descompondran en producto de irreducibles,
y a tambien. Por tanto al menos uno de los dos esta en S. Digamos que b S.
Como b | a se cumple que (a) (b). La inclusion es estricta, pues si (a) = (b)
entonces a y b seran asociados, es decir, a = bu para cierta unidad u, pero
entonces bu = bc, luego c = u sera una unidad, cuando no lo es.
En definitiva hemos probado que para cada a S existe un b S tal que
(a) (b). Repitiendo este proceso obtendramos una sucesion creciente de
ideales (ao ) (a1 ) (a2 ) en contradiccion con el teorema 3.7. Por lo
tanto S ha de ser vaco y as todo elemento no nulo ni unitario de A admite una
descomposicion en irreducibles.
Supongamos que los irreducibles coinciden con los primos y que tenemos
dos descomposiciones en irreducibles de un mismo elemento a = c1 cn =
d1 dm . Podemos suponer que m n.
Como dm es primo, ha de dividir a uno de los factores de c1 cn y como
estos son irreducibles, de hecho ha de ser asociado a uno de ellos. Pongamos
que dm es asociado a cn . Entonces cn = um dm para cierta unidad um .
Simplificando dm obtenemos que c1 cn1 um = d1 dm1 . Repitiendo el
proceso con dm1 (y teniendo en cuenta que un irreducible no puede dividir
a una unidad), llegamos tras m pasos a que c1 cnm u1 um = 1, lo que
obliga a que n = m, pues ningun irreducible puede dividir a 1. Ademas hemos
obtenido que cada ci es asociado a di , luego la descomposicion es unica.
Con esto tenemos probada la factorizacion unica de Z y de los anillos K[x]
donde K es un cuerpo. Para el caso de Z es posible dar argumentos directos
mas elementales basados en el buen orden de N. Por ejemplo, para encontrar
un factor irreducible de un numero entero basta tomar el menor natural que lo
divide. Lo mismo ocurre con K[x] considerando el grado de los polinomios.
Para terminar probamos un resultado general sobre existencia de ideales
maximales. Notemos que para anillos noetherianos se cumple trivialmente sin
necesidad del axioma de eleccion:
Teorema 3.19 (AE) Todo anillo unitario A en el que 1 6= 0 tiene un ideal
maximal. Mas aun, todo ideal I 6= A esta contenido en un ideal maximal de A.
Demostracion: Dado un anillo unitario A, basta aplicar el lema de Zorn a
la familia de ideales de A distintos de A y que contienen a I, considerada como
conjunto parcialmente ordenado por la inclusion. Si C es una S familia de tales
ideales totalmente ordenada por la inclusion, es facil ver que C es un ideal de
A que contiene a I, y es distinto de A porque no puede contener a 1 (es en este
punto donde se requiere que A sea unitario). El lema de Zorn nos da entonces
un ideal maximal de A que contiene a I.
3.4. Divisibilidad en Z 101

3.4 Divisibilidad en Z
En Z podemos afinar la unicidad de la descomposicion en factores primos
exigiendo que estos sean positivos, es decir, numeros naturales. As, la descom-
posicion en primos del numero 60 es 60 = 2 2 3 5, y no consideraremos otras
como 2 2 (3) (5). Si no se indica lo contrario, cuando hablemos de primos
en Z nos referiremos a naturales primos.
El problema mas elemental que surge a raz de todo esto es encontrar un
metodo para obtener las factorizaciones en primos de numeros cualesquiera.
En particular sera conveniente hallar un metodo para reconocer los numeros
primos. El metodo mas simple para hallar todos los primos hasta un numero
dado es la llamada criba de Eratostenes, que consiste en escribir una lista con
los primeros n naturales, tachar el 1, que no es primo por definicion, despues
tachar todos los multiplos de 2 (salvo el propio 2), dejar el menor numero que
queda (el 3) y tachar sus multiplos, dejar el menor numero que queda (el 5) y
tachar sus multiplos, etc. Los numeros que sobrevivan seran los primos menores
que n. He aqu la lista de los primos menores que 100, que hacen un total de 25:

2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41,


43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97.
Para descomponer un numero en factores primos podemos ir probando a
dividirlo por los primos menores que el hasta hallar uno que lo divida e ir
repitiendo la operacion con los cocientes que vayamos obteniendo. Notemos que
si queremos factorizar un numero n y m cumple que n m2 , entonces, si n no
es primo, el menor primo que divide a n ha de ser menor que m. Por ejemplo,
el menor primo que divida a un numero menor que 100 ha de ser menor que 10,
luego si un numero menor que 100 no es divisible entre 2, 3, 5 o 7, entonces es
primo.
En cualquier caso, siempre es posible distinguir los numeros primos de los
compuestos y hallar la factorizacion de cualquier numero en un numero finito
de pasos. Mas adelante encontraremos tecnicas para abordar este problema con
mas elegancia.
Una cuestion importante es si el numero de primos es finito o infinito. La
respuesta es que es infinito. Para probarlo observemos que en general un primo
p no puede dividir al mismo tiempo a un numero n y a n + 1, pues entonces
dividira a su diferencia, que es 1. De hecho, en Z, si p divide a n, el proximo
numero al que divide es n + p. Sabiendo esto demostramos:

Teorema 3.20 (Euclides) En Z hay infinitos numeros primos.

Demostracion: Dado un numero n, consideremos n! Se cumple que todo


numero menor o igual que n divide a n!, luego ningun numero menor o igual
que n divide a n! + 1. En consecuencia un divisor primo de n! + 1 ha de ser
mayor que n. Por lo tanto por encima de cada numero n hay siempre un numero
primo. Esto implica que hay infinitos primos.
102 Captulo 3. Aritmetica en dominios ntegros

Definicion 3.21 Sea A un dominio ntegro y X un subconjunto de A. Diremos


que un elemento d de A es un maximo comun divisor (mcd) de los elementos
de X si d divide a los elementos de X y cualquier elemento de A que cumpla lo
mismo es un divisor de d.
Diremos que un elemento m de A es un mnimo comun multiplo (mcm) de
los elementos de X si es multiplo de todos los elementos de X y todo elemento
de A que cumpla lo mismo es un multiplo de m.
Es obvio que m es un mcd o un mcm de X si y solo si lo es cualquiera de
sus asociados, es decir, estos conceptos son unicos salvo unidades. Por supuesto
el mcd o el mcm de un conjunto dado no tiene por que existir. No obstante,
cualquier subconjunto finito de un DFU tiene mcd y mcm. El lector puede
entretenerse probando que las siguientes recetas nos dan un mcd y un mcm
de cualquier subconjunto finito X de un DFU:
Un mcd de X esta formado por el producto de los primos que dividen
a todos los elementos de X elevados al mnimo exponente con el que
aparecen en alguno de los elementos de X.
Un mcm de X esta formado por el producto de todos los primos que
dividen a algun elemento de X elevados al mayor exponente con el
que aparecen en los elementos de X.
Por ejemplo, dados los numeros
22 3 75 , 2 5 7, 34 52 7,
su mcd es 7 y el mcm es 22 34 52 75 .
Escribiremos mcd(a1 , . . . , an ) y mcm(a1 , . . . , an ) para representar el mcd y el
mcm de los elementos a1 , . . . , an . A veces el mcd lo representaremos simplemente
por (a1 , . . . , an ).
En Z el mcd es unico si lo exigimos positivo. Si no se indica lo contrario
siempre lo supondremos as.
Hay que prestar un poco de atencion al cero: por definicion todo elemento
de un anillo divide a 0, de donde se sigue facilmente que el mcd de un conjunto
de elementos que contenga a 0 es el mismo que el del conjunto que resulte de
eliminarlo. Por otra parte si un conjunto de elementos contiene una unidad, su
mcd es 1.
Los elementos de un conjunto son primos entre s si su mcd es 1, es decir,
si no tienen divisores primos comunes. No hay que confundir esto con que sean
primos entre s dos a dos, que es mas fuerte. Si dividimos los elementos de un
conjunto por su mcd obtenemos un conjunto de elementos primos entre s, pues
si d es el mcd y p es un primo que dividiera al conjunto resultante, entonces dp
dividira al conjunto original, luego dp | d y p sera una unidad.
En particular, A es un DFU, K es su cuerpo de cocientes y a, b A son
no nulos, podemos expresarlos como a = da y b = db , donde (a , b ) = 1 y
entonces a/b = a /b , por lo que toda fraccion de K se puede elegir irreducible,
en el sentido de que el numerador y el denominador sean primos entre s.
3.5. Divisibilidad en anillos de polinomios 103

En el caso concreto de Z y Q concluimos que cada numero racional admite


una unica representacion como fraccion irreducible con denominador positivo.
En Z, nada nos impide considerar un ideal como (6, 9), con dos generadores,
pero sabemos que Z es DIP, luego dicho ideal tiene que ser principal, luego
tiene que poder expresarse en terminos de un unico generador. Concretamente,
sucede que (6, 9) = (3), y el teorema siguiente lo prueba en un contexto general:
Teorema 3.22 (Relacion de Bezout) Sea A un DIP, sean a1 , . . . , an ele-
mentos de A y sea d un mcd de a1 , . . . , an . Entonces (d) = (a1 ) + + (an ),
luego existen ciertos r1 , . . . , rn A de manera que d = r1 a1 + + rn an .
Demostracion: Sea (d) = (a1 ) + + (an ) (por definicion). Vamos a ver
que d es un mcd de a1 , . . . , an .
Como cada ai esta en (d), ciertamente d | ai . Si s divide a todos los ai ,
entonces (ai ) (s), luego (d) = (a1 ) + + (an ) (s), luego s | d.
Observemos que si d es cualquier otro mcd de los elementos dados, entonces

(d ) = (d), luego la relacion de Bezout es valida para cualquiera de ellos.
Este resultado se aplica especialmente a pares de elementos primos entre s:
si m y n son primos entre s, existen r y s tales que rm + sn = 1.
Terminamos esta seccion con un resultado que, segun veremos mas adelante,
tiene una consecuencia muy importante en la teora de anillos.
 
p
Teorema 3.23 Sea p un numero primo y 0 < m < p. Entonces p | .
m
p
 p

Demostraci on: Si m = 1, entonces m = p, luego efectivamente p | m .
p
Si p | m y m + 1 < p, entonces
   
p p! pm p! pm p
= = = .
m+1 (m + 1)! (p m 1)! m + 1 m! (p m)! m+1 m
p

As pues, p | (p m) m , y como (m + 1, p) = 1, la divisibilidad se conserva al
p
dividir entre m + 1, es decir, p | m+1 .

3.5 Divisibilidad en anillos de polinomios


El estudio de la divisibilidad no es tan sencillo si pasamos a los anillos de
polinomios A[x]. Tomemos unos cuantos polinomios y multipliquemoslos:
(x2 + 3x 5)(x 1)(2x3 + 3) = 2x6 + 4x5 16x4 + 13x3 + 6x2 24x + 15.
Como encontrar los factores a partir del producto? De hecho ni siquiera sa-
bemos si los factores que hemos tomado son irreducibles o no7 . El problema
es que, a diferencia del caso numerico, hay infinitos divisores posibles para un
polinomio dado.
7 Es costumbre hablar de numeros primos pero de polinomios irreducibles, aunque en prin-

cipio son terminos equivalentes.


104 Captulo 3. Aritmetica en dominios ntegros

Por otra parte, tenemos planteado otro problema mas importante. Sabemos
que A[x] es un DFU cuando A es un cuerpo, pero en otro caso A[x] no es DIP.
Sigue siendo A[x] un DFU a pesar de ello cuando A es DFU? Es Z[x] DFU?,
Es Q[x, y] DFU? Vamos a probar que s, y para ello necesitamos un trabajo
previo.
Si D es un DFU y K es su cuerpo de cocientes, vamos a probar que D[x] es
un DFU apoyandonos en que K[x] lo es. La situacion tpica con la que tenemos
que encontrarnos es la siguiente: El polinomio 6x2 24 factoriza en Z[x] como
6x2 24 = 6(x2 4) = 2 3 (x 2) (x + 2).
Vemos que tiene 4 divisores primos. Sin embargo, en Q[x] solo tiene dos,
pues los primeros factores pasan a ser unidades. Conviene dar la definicion
siguiente:
Definicion 3.24 Sea D un DFU y sea c : D[x] PD la aplicacion que a cada
polinomio f D[x] le asigna el ideal generado por un mcd de sus coeficientes no
nulos (no importa cual, pues dos cualesquiera son asociados, luego generan el
mismo ideal). Convenimos ademas en que c(0) = 0. A c(f ) se le llama contenido
del polinomio f .
Diremos que un polinomio f es primitivo si c(f ) = (1), o sea, si sus coefi-
cientes son primos entre s. En particular, todo polinomio monico es primitivo.
Por ejemplo, el contenido del polinomio 6x2 24 Z[x] es (6), mientras que
el polinomio x2 4 es primitivo. En general es inmediato que si f D[x] y f 6= 0,
entonces f (x) = c g(x) donde c D es un generador de c(f ) y g(x) D[x] es
un polinomio primitivo. As, para probar que todo polinomio f (x) D[x] se
descompone en irreducibles basta probar que podemos factorizar por una parte
polinomios constantes y por otra polinomios primitivos.
La factorizacion de las constantes es obvia, puesto que estamos suponiendo
que D es un DFU. Notemos que todo a D es irreducible en D si y solo si lo
es en D[x]. (Una descomposicion de a en factores no unitarios de D[x] tendra
que constar de polinomios de grado 0, luego seran factores no unitarios de D,
y el recproco es obvio.)
Para probar que todo polinomio primitivo p(x) D[x] se descompone en
irreducibles observamos que los polinomios primitivos no son divisibles entre
constantes no unitarias, ya que una constante que divida a p(x) divide tambien
a su contenido.
As, si p(x) (no unitario) no pudiera descomponerse en irreducibles en D[x],
en particular no sera irreducible, luego se descompondra en dos factores, diga-
mos p(x) = p1 (x)q1 (x), donde ninguno de los dos es una unidad, luego ambos
tienen grado menor que el grado de p(x). Al menos uno de los dos no podra
descomponerse en irreducibles (digamos que p1 (x)), luego p1 (x) no es irreducible
y factoriza como p1 (x) = p2 (x)q2 (x), donde ambos factores son no constantes,
pues dividen a p(x), luego el grado de p2 (x) es menor que el de p1 (x). De este
modo obtenemos una sucesion de polinomios p(x), p1 (x), p2 (x), . . . cuyos grados
son estrictamente decrecientes, lo cual es absurdo.
3.5. Divisibilidad en anillos de polinomios 105

Con esto tenemos demostrado que todo polinomio de D[x] no nulo ni unitario
se descompone en producto de irreducibles. La parte delicada es demostrar la
unicidad de la descomposicion. La idea es usar la factorizacion unica en D para
probar la unicidad de los factores irreducibles constantes y la unicidad en K[x]
para probar la unicidad de los factores irreducibles no constantes. Necesitamos
dos resultados sobre c(f ).
Teorema 3.25 Sea D un DFU.
1. Si a D y f D[x], entonces c(af ) = (a)c(f ).
2. Si f , g D[x], entonces c(f g) = c(f )c(g).
Demostracion: 1) Si c(f ) = (c), es inmediato que ac es un mcd de los
coeficientes de af , luego c(af ) = (ac) = (a)(c).
2) Sea f = cf f1 y g = cg g1 con c(f ) = (cf ), c(g) = (cg ) y f1 , g1 primitivos.
Entonces, por la propiedad precedente,
c(f g) = c (cf f1 cg g1 ) = c(f )c(g)c(f1 g1 ),
n
P m
P
luego basta probar que f1 g1 es una primitivo. Sean f1 = ai xi , g1 = bi xi ,
i=0 i=0
m+n
P P 
con an 6= 0 6= bm . Entonces f1 g1 = ai bj xk .
k=0 i+j=k

Si f1 g1 no fuera una primitivo, existira


P un irreducible p D que dividira a
todos sus coeficientes, es decir p | ai bj , para cada k entre 0 y n + m.
i+j=k
Como f1 es primitivo, p no divide a todos los ai , luego existe un mnimo
ndice s tal que p | ai para i < s y p as (en particular as 6= 0).
Igualmente existe un mnimo t tal que p | bj para j < t y p bt (luego bt 6= 0).
P
Ahora, tomando k = s + t, resulta que p divide a ai bj y tambien divide
i+j=k
a todos los sumandos salvo quiza a as bt , de donde divide a la diferencia, o
sea, a as bt . Como p es primo divide a uno de los factores, lo que nos da una
contradiccion.
As, si un polinomio f (x) D[x] no nulo ni unitario admite una descompo-
sicion en irreducibles de D[x] de la forma d1 dr p1 (x) ps (x), donde los di
son los factores constantes, entonces cada pi (x) es primitivo, pues en caso con-
trario sera divisible entre un polinomio constante irreducible. Por consiguiente
c(f ) = (d1 dr ).
Ahora, la factorizacion unica en D garantiza que si f admite dos descom-
posiciones en irreducibles, los factores de grado 0 son los mismos salvo orden
y asociacion, pues ambos constituyen descomposiciones en irreducibles de un
generador de c(f ) en D.
Para demostrar la unicidad del resto de la descomposicion necesitamos dos
resultados:
106 Captulo 3. Aritmetica en dominios ntegros

Teorema 3.26 Sea D un DFU, sea K su cuerpo de cocientes y sean f , g


polinomios primitivos en D[x]. Entonces f y g son asociados en D[x] si y
solo si lo son en K[x].

Demostracion: Si f y g son asociados en K[x] entonces f = gu para


cierta unidad u de K[x]. Por el teorema 2.42, sabemos que u es un polinomio
constante, es decir, esta en K. Por lo tanto u = r/s para ciertos r, s D no
nulos. Entonces sf = rg. Como c(f ) = c(g) = (1), tenemos que

(s) = (s) c(f ) = c(sf ) = c(rg) = (r) c(g) = (r),

luego r = sv para cierta unidad v D. En consecuencia sf = rg = svg, luego


f = vg, lo que prueba que f y g son asociados en D[x]. El recproco es obvio.

El teorema siguiente tiene gran interes en s mismo:

Teorema 3.27 (Criterio de irreducibilidad de Gauss) Sea D un DFU,


sea K su cuerpo de cocientes y f D[x] un polinomio primitivo no constante.
Entonces f es irreducible en D[x] si y solo si lo es en K[x].

Demostracion: Supongamos que f es irreducible en D[x] pero f = gh


donde g, h K[x] no son unidades. Entonces grad g 1, grad h 1. Sean
Pn a Pm c
i i i i
g= x, h= x,
b
i=0 i d
i=0 i

para ciertos ai , bi , ci , di D con bi =


6 0 6= di . Llamemos b = b0 bn y, para
cada i, sea bi = b/bi D.
Pn
Consideremos el polinomio g1 = ai bi xi D[x]. Podemos descomponer
i=0
g1 = ag2 , siendo c(g1 ) = (a) y g2 D[x] un polinomio primitivo. Claramente
1 a
g = g1 = g2 , luego grad g = grad g2 .
b b
c
Del mismo modo se llega a que h = h2 , donde c, d D y h2 D[x] es
d
primitivo y grad h = grad h2 . Ahora
ac
f = gh = g 2 h2 ,
bd
con lo que f y g2 h2 son dos polinomios primitivos en D[x] asociados en K[x].
Por el teorema anterior son asociados en D[x], luego existe una unidad u D
tal que f = ug2 h2 , y as f es reducible en D[x], contradiccion.
Si f es irreducible en K[x] y f = gh con g, h D[x], entonces g o h es una
unidad en K[x], por ejemplo g, lo que significa que g K, pero como esta en
D[x], en realidad g esta en D. Entonces (1) = c(f ) = (g)c(h), luego g es una
unidad en D, luego en D[x]. Esto prueba que f es irreducible en D[x].
Finalmente podemos probar:
3.5. Divisibilidad en anillos de polinomios 107

Teorema 3.28 (Gauss) Si D es un DFU y S un conjunto, entonces D[S] es


un DFU.

Demostracion: Veamos primeramente que D[x] es DFU. Sea f D[x] no


nulo ni unidad. Hemos visto que f admite una descomposicion en polinomios
irreducibles en D[x]
f = d1 dr p1 (x) ps (x),
donde los di son los factores de grado 0 y los pi (x) son necesariamente primitivos.
Tambien sabemos que los di son unicos salvo orden y asociacion.
Por otra parte, si K es el cuerpo de cocientes de D, tenemos que los pi (x)
son irreducibles en K[x] y d1 dr es una unidad en K[x]. As, si f admite dos
factorizaciones en D[x], los correspondientes pi (x) han de ser los mismos salvo
orden y asociacion en K[x], pero tambien sabemos que la asociacion en K[x]
coincide con la asociacion en D[x] para polinomios primitivos de D[x]. Esto
prueba la unicidad de la descomposicion y nos da que D[x] es un DFU.
Aplicando este resultado un numero finito de veces obtenemos que D[S] es
un DFU cuando el conjunto S es finito. El caso general se reduce al finito
del modo usual (dos factorizaciones en irreducibles en D[S] seran tambien dos
factorizaciones en irreducibles en un D[S0 ], con S0 finito).
Tenemos as demostrados dos resultados que, sin ser excesivamente comple-
jos, no son triviales en absoluto y representan un papel relevante en la teora que
estamos desarrollando. Con las tecnicas que hemos necesitado para llegar a ellos
podemos probar facilmente un criterio util de irreducibilidad de polinomios:

Teorema 3.29 (Criterio de irreducibilidad de Eisenstein) Sea D un


Pn
DFU, sea K su cuerpo de cocientes, f = ai xi D[x] un polinomio no
i=0
constante con an 6= 0 y p D un primo. Supongamos que p | ai para todo
i = 0, . . . , n 1, as como que p an y p2 a0 . Entonces f es irreducible en
K[x] y, si es primitivo, en D[x].

Demostracion: Sea f = cf f1 donde f1 D[x] es primitivo. Basta probar


que f1 es irreducible en K[x], pues cf es una unidad en K, luego f tambien sera
irreducible. El resto del teorema es consecuencia del criterio de Gauss.
Tambien por el criterio de Gauss, basta probar que f1 es irreducible en D[x].
Notemos que p no divide a cf (porque no divide a an ).
Cada coeficiente de f es el producto de cf por el correspondiente coeficiente
de f1 , luego f1 sigue cumpliendo las hipotesis del teorema. Por no cambiar de
notacion podemos suponer que f = f1 (pero ahora f es primitivo).
Pr Ps
Supongamos que f = gh, donde g = bi xi y h = cj xj . Ninguno
i=0 j=0
de los dos puede ser constante o de lo contrario f no sera primitivo. Como
c(g)c(h) = c(f ) = (1), tanto g como h son primitivos.
Tenemos que p | a0 = b0 c0 , luego p divide a uno de los factores. Pongamos
por caso que p | b0 . Como p2 a0 no puede ser que p divida tambien a c0 .
108 Captulo 3. Aritmetica en dominios ntegros

Como g es primitivo, p no puede dividir a todos los bi . Tomemos el menor


natural k tal que p | bi para
P i < k y p bk . As 1 k r < n.
El coeficiente ak = bi cj es divisible entre p y por otra parte p divide a
i+j=k
todos los sumandos salvo quiza a bk c0 , luego divide a la diferencia, que es justo
bk c0 . Sin embargo p bk y p c0 , contradiccion.

Ejercicio: Probar que en Q[x] hay polinomios irreducibles de grado arbitrariamente


grande.
Aunque los polinomios a los que podemos aplicar el criterio de Eisenstein
han de cumplir unas propiedades muy particulares, en realidad este criterio es
util en mas ocasiones de las que en principio se podra pensar. Ello se debe al
resultado siguiente:

Teorema 3.30 Sea A un dominio. Sea a una unidad de A y b cualquier ele-


mento de A. La aplicacion f : A[x] A[x] dada por f p(x) = p(ax + b) es
un isomorfismo de anillos, luego en particular un polinomio p(x) es irreducible
en A[x] si y solo si p(ax + b) lo es.

Demostracion: Claramente f es un homomorfismo porque no es sino la


evaluacion en ax + b. Es biyectivo porque tiene por inverso a la evaluacion en
a1 x a1 b.
Por ejemplo, para probar que el polinomio p(x) = 8x3 6x 1 es irreducible
en Z[x], basta ver que lo es en Q[x], pero por el teorema anterior basta ver que
lo es el polinomio p( 12 x + 12 ) = x3 3x 3, que es irreducible en Q[x] por el
criterio de Eisenstein.
La busqueda de factores irreducibles de grado 1 de un polinomio equivale a
la busqueda de sus races, tal y como explicamos a continuacion.

Definicion 3.31 Sea A un dominio y f (x) un polinomio en A[x]. Podemos


considerar a f como una funcion f : A A. En efecto, para cada elemento
a A tenemos definida la evaluacion f (a) A. Diremos que a es una raz del
polinomio f si f (a) = 0.

La relacion basica entre la divisibilidad y la existencia de races se sigue del


siguiente teorema elemental:

Teorema 3.32 (Teorema del resto) Sea A un anillo conmutativo y unitario,


f (x) A[x] y c A. Entonces existe un unico polinomio q(x) A[x] tal que
f (x) = q(x)(x c) + f (c).

Demostracion: Si f = 0 basta tomar q = 0. En otro caso el resultado


se sigue del teorema 2.44, que nos da dos polinomios q(x) y r(x) de manera
que f (x) = q(x)(x c) + r(x) con el grado de r menor que el de x c, o
sea, r es de grado cero, luego constante. Sustituyendo x por c resulta que
f (c) = q(c)(c c) + r, o sea, r = f (c).
Como consecuencia
3.5. Divisibilidad en anillos de polinomios 109

Teorema 3.33 Sea A un dominio ntegro. Sea f (x) A[x] y c A. Entonces


c es una raz de f (x) si y solo si (x c) | f (x).
Demostracion: Si c es una raz de f (x) entonces f (c) = 0, luego el teorema
anterior se reduce a que existe un polinomio q(x) tal que f (x) = q(x)(x c),
luego (x c) | f (x).
Si (x c) | f (x) entonces f (x) = q(x)(x c) para cierto polinomio q(x). Por
lo tanto f (c) = q(c)(c c) = 0, es decir, c es una raz de f (x).
De aqu que un polinomio irreducible de grado mayor que 1 no puede tener
races. Por otro lado un polinomio de grado 1, ax + b siempre tiene una raz en
un cuerpo, a saber, b/a. As obtenemos lo siguiente:
Si K es un cuerpo, un polinomio de grado 2 o 3 es irreducible en K[x] si y
solo si no tiene races en K.
En efecto, si se pudiera descomponer en producto de irreducibles, al menos
uno de sus factores irreducibles tendra grado 1, luego tendra una raz en K.
Para polinomios de grado mayor que 3 la no existencia de races ya no implica
la irreducibilidad. Por ejemplo, el polinomio (x2 + 1)2 es reducible en Q[x] y no
tiene races en Q.
El teorema anterior implica un hecho muy importante sobre las races de un
polinomio en un dominio ntegro:
Teorema 3.34 Sea A un dominio ntegro y sea f (x) A[x] un polinomio de
grado n. Entonces f (x) tiene a lo sumo n races en A.
Demostracion: Sean c1 , . . . , cm races distintas de f (x) en A. Por el
teorema anterior tenemos que (x c1 ) | f (x), es decir, f (x) = (x c1 )f1 (x).
Como c2 es raz de f tenemos que 0 = f (c2 ) = (c2 c1 )f1 (c2 ) y como
las races son distintas c2 c1 6= 0. Como A es un dominio ntegro ha de
ser f1 (c2 ) = 0, luego por el teorema anterior f1 (x) = (x c2 )f2 (x), de donde
f (x) = (x c1 )(x c2 )f2 (x).
Repitiendo esto m veces tenemos que (x c1 ) (x cm ) | f (x), por lo que
el grado de (x c1 ) (x cm ), que es m, ha de ser menor o igual que el grado
de f (x), que es n.
Sin embargo el numero de races de un polinomio no tiene por que igualar
a su grado. Por ejemplo, x2 + 1 no tiene races en Q[x], pues el cuadrado de un
numero racional no puede ser negativo. Por otro lado (x 1)2 tiene grado 2 y
una unica raz.
Ejercicio: Probar que las races enteras de un polinomio de Z[x] dividen a su termino
independiente.
Hay un analogo al criterio de Gauss, pero referente a la existencia de races
en lugar de la irreducibilidad. La prueba es mucho mas sencilla:
Teorema 3.35 Sea D un DFU y K su cuerpo de cocientes. Sea p(x) un po-
linomio monico no constante con coeficientes en D. Si c es una raz de p(x)
en K, entonces c D.
110 Captulo 3. Aritmetica en dominios ntegros

Demostracion: Sea c = a/b, con a, b D. Si c / D entonces b a, luego


Pn
existe un primo p D tal que vp (a) < vp (b). Sea p(x) = di xi , donde dn = 1.
i=0
Entonces
n n1
a a a
n
+ dn1 n1 + + d1 + d0 = 0.
b b b
Multiplicando por bn queda:
an = dn1 ban1 d1 bn1 a d0 bn .
Ahora bien, el exponente de p en el miembro izquierdo es exactamente
nvp (a), mientras que en el miembro derecho es estrictamente mayor que nvp (a),
con lo que tenemos una contradiccion.

Ejemplo Si A es un anillo y n N es un numero natural n 2, una raz


n-sima de a es otro elemento b A tal que bn = a. Si aplicamos el teorema
anterior al polinomio xn a vemos que si A es un DFU, entonces a A tiene
raz n-sima en el cuerpo de cocientes K si y solo si la tiene en A.
Por ejemplo, es inmediato que 2 no tiene raz cuadrada en Z, por lo que
podemos afirmar que tampoco la tiene en Q. Esto es significativo porque hay
razones geometricas por las que debera haber un punto en cada recta asociado
a una raz cuadrada de 2, y, en general, de cualquier numero positivo, lo que
podemos concluir que la representacion geometrica de los numeros racionales
no abarca todos los puntos de una recta.

Ejemplo Terminaremos con una aplicacion mas sofisticada del criterio de Ei-
senstein: Consideremos el polinomio xn 1 Z[x]. Evidentemente no es irre-
ducible, porque tiene la raz x = 1. Eso significa que es divisible entre x 1.
No es difcil llegar a que
xn 1 = (x 1)(xn1 + xn2 + + x + 1).
Vamos a probar que si p es un numero natural primo, entonces el polinomio
p(x) = xp1 +xp2 + +x+1 es irreducible en Z[x] (o en Q[x]). Por el teorema
3.30 basta probar que p(x + 1) es irreducible en Z[x]. Aplicamos la evaluacion
en x + 1 a la igualdad anterior y obtenemos
(x + 1)p 1 = (x + 1 1)p(x + 1) = xp(x + 1).
Por tanto
p   p  
X p k X p k
xp(x + 1) = x 1= x ,
k k
k=0 k=1
p
P 
p k1
y en consecuencia p(x + 1) = k x .
k=1
Por el teorema 3.23 tenemos que p divide a todos los coeficientes de p(x + 1)
salvo al correspondiente a xp1 , que es 1. Ademas p2 no divide al termino
independiente, que es p. Por el criterio de Eisenstein, p(x + 1) es irreducible,
luego p(x) tambien.
3.6. Congruencias y anillos cociente 111

3.6 Congruencias y anillos cociente


Las congruencias son una herramienta muy potente en el estudio de los
numeros enteros. La solucion de muchos problemas de muy diversa ndole, as
como algunas propiedades generales sobre los anillos, encuentran su expresion
mas natural en terminos de congruencias. Los anillos cociente proporcionan una
vision alternativa mas conceptual de la nocion de congruencia.
Definicion 3.36 Consideremos un dominio A y un ideal I. Diremos que dos
elementos a y b de A son congruentes modulo I, abreviado a b (mod I), si
a b I.
Teniendo en cuenta que 0 I, que el opuesto de un elemento de I esta en I y
que la suma de elementos de I esta en I, se sigue facilmente que la congruencia
modulo I es una relacion de equivalencia en A.
Diremos que dos elementos de A son congruentes modulo un tercero si lo
son modulo el ideal que este genera. Explcitamente:
a b (mod m) si y solo si m | a b.
En el caso de un DIP, como es Z, podemos hablar de congruencias en estos
terminos sin perder generalidad y sin mencionar para nada ideales, pero es bueno
saber que, en el fondo, lo que hay es un ideal.
En el caso concreto de Z podemos dividir a = nc + r, con 0 r < n,
y resulta que a r (mod n). As, todo numero entero es congruente con un
numero natural menor que n, exactamente con su resto al dividirlo entre n.
Por otra parte dos numeros naturales distintos menores que n no pueden ser
congruentes entre s, ya que su diferencia en el orden adecuado es un numero
natural no nulo menor que n, luego no puede ser un multiplo de n. Vamos a
expresar adecuadamente lo que hemos obtenido:
Si I es un ideal de un anillo A, llamaremos A/I al conjunto cociente originado
por la relacion de congruencia modulo I.
Lo que acabamos de probar es que el conjunto Z/nZ tiene exactamente n
elementos. Por ejemplo Z/5Z esta formado por las clases siguientes:
{ ... 20, 15, 10, 5, 0, 5, 10, 15, 20, ... }
{ ... 19, 14, 9, 4, 1, 6, 11, 16, 21, ... }
{ ... 18, 13, 8, 3, 2, 7, 12, 17, 22, ... }
{ ... 17, 12, 7, 2, 3, 8, 13, 18, 23, ... }
{ ... 16, 11, 6, 1, 4, 9, 14, 19, 24, ... }
La primera clase la forman los multiplos de 5, la segunda los numeros que al
ser divididos entre 5 dan resto 1, etc. Si llamamos [a] a la clase de equivalencia

de a tenemos por ejemplo que [4] = [1] y que Z/5Z = [0], [1], [2], [3], [4] .
En general, en un anillo A, los elementos congruentes con un cierto a modulo
un ideal I son los b que cumplen b a I, es decir, los elementos de la forma
a + i para un cierto i I. Por lo tanto [a] = a + I = {a + i | i I}.
112 Captulo 3. Aritmetica en dominios ntegros

El interes de todo esto radica en el hecho siguiente:

Teorema 3.37 Sea A un dominio e I un ideal de A. Si a, a , b, b son elemen-


tos de A que cumplen [a] = [a ] y [b] = [b ], entonces tambien [a + b] = [a + b ]
y [ab] = [a b ]. El conjunto A/I se convierte en un dominio con las operaciones
definidas mediante [a] + [b] = [a + b], [a][b] = [ab]. Al anillo A/I se le llama
anillo cociente de A modulo el ideal I.

Demostracion: Tenemos que a a I y que b b I, de donde

(a + b) (a + b ) = (a a ) + (b b ) I,

ab a b = ab a b + a b a b = (a a )b + a (b b ) I,
por las propiedades de los ideales. Esto nos garantiza que las operaciones defi-
nidas mediante [a] + [b] = [a + b] y [a][b] = [ab] no dependen de la eleccion de a
y b en cada una de las clases. El resto del teorema es inmediato. Por ejemplo
la asociatividad de la suma se cumple porque

([a] + [b]) + [c] = [a + b] + [c] = [a + b + c] = [a] + [b + c] = [a] + ([b] + [c]).

De esta forma nos hemos encontrado con una familia de anillos finitos. Estos
anillos resultan utilsimos para determinar si un numero dado divide o no a otro.
En efecto, se cumple que m | n si y solo si [n] = 0 modulo m, y esto es facil de
calcular. Por ejemplo, tomando clases modulo 7:

[234] = [2][10][10] + [3][10] + [4] = [2][3][3] + [3][3] + [4]


= [6][3] + [2] + [4] = [1][3] + [6] = [3]

Esto prueba que el resto de 234 entre 7 es 3, y por tanto no es multiplo


de 7. Hemos hecho muchas operaciones, pero todas muy sencillas. Con numeros
pequenos no siempre es mas rapido, pero con numeros grandes es muy practico.
En algunos casos, las congruencias proporcionan criterios generales de di-
visibilidad en terminos de las expresiones decimales de los numeros naturales.
Recordemos que el desarrollo decimal de un numero n es de la forma
k
P
n= ci 10i ,
i=0

con 0 ci 9.

Un numero natural es multiplo de 2 si y solo si termina en 0, 2, 4, 6 u 8.


En efecto, al tomar clases modulo 2 en el desarrollo decimal de n, como
[10] = [0], queda
k
P k
P
[n] = [ci ][10]i = [ci ][0]i = [c0 ].
i=0 i=0
3.6. Congruencias y anillos cociente 113

Por lo tanto [n] = [0] si y solo si [c0 ] = [0], es decir, si y solo si la ultima
cifra es una de las cinco cifras pares.
Con lo que a simple vista sabemos que 6 278 es par mientras que 29 953
es impar.
Un numero natural es multiplo de 3 si y solo si la suma de sus cifras lo
es.
Al tomar clases modulo 3 sucede que [10] = [1] luego
k
P k
P k
P n
P
[n] = [ci ][10]i = [ci ][1]i = [ci ] = [ ci ].
i=0 i=0 i=0 i=0

Por lo tanto el resto de n modulo 3 es 0 si y solo si lo es el de la suma de


sus cifras.
As, para saber si 3 725 es multiplo de 3 sumamos 3 + 7 + 2 + 5 = 17 y
repetimos la operacion: 1+7 = 8. Como 8 no es multiplo de 3, concluimos
que 3 725 tampoco lo es. De hecho al dividirlo entre 3 su resto es el mismo
que el de 8, o sea, 2.
Un numero natural n es multiplo de 4 si y solo si el numero formado por
sus dos ultimas cifras es multiplo de 4.
En este caso [10] = [2], luego [10]2 = [0] y todas las potencias posteriores
se anulan tambien. Consecuentemente,
k
P
[n] = [ci ][10]i = [c1 ][10] + [c0 ] = [c1 10 + c0 ],
i=0

y el numero c1 10 + c0 es el numero formado por las dos ultimas cifras


de n.
Por ejemplo, el ano 2 494 no sera bisiesto, ya que, modulo 4,

[2 494] = [94] = [9][2] + [4] = [1][2] + [0] = [2].

Un numero natural es multiplo de 5 si y solo si acaba en 0 o en 5.


Ahora [10] = [0] y el calculo es el mismo que el de los multiplos de 2. La
conclusion es que n es multiplo de 5 si y solo si su ultima cifra lo es, y
esto sucede cuando es 0 o 5.

No hay un criterio sencillo para la divisibilidad entre 6, 7, 8, aunque en el


caso del 6 podemos afirmar trivialmente que un numero es multiplo de 6 si y
solo si lo es de 2 y de 3, con lo que podemos combinar los dos criterios que
hemos visto. Para 9 tenemos que [10] = [1], y el criterio es el mismo que para
el 3. Para 10 es [10] = [0], y se concluye que los multiplos de 10 son los que
terminan en 0.
Ejercicio: Encontrar un criterio para la divisibilidad entre 11. Notese que en este
caso [10] = [1].
114 Captulo 3. Aritmetica en dominios ntegros

Si el lector no esta familiarizado con las congruencias, un ejercicio altamente


recomendable es que trate de anticiparse a los resultados generales que vamos a
exponer experimentando con casos particulares. Por ejemplo, he aqu las tablas
de sumar y multiplicar en Z/6Z:

+ 0 1 2 3 4 5 0 1 2 3 4 5
0 0 1 2 3 4 5 0 0 0 0 0 0 0
1 1 2 3 4 5 0 1 0 1 2 3 4 5
2 2 3 4 5 0 1 2 0 2 4 0 2 4
3 3 4 5 0 1 2 3 0 3 0 3 0 3
4 4 5 0 1 2 3 4 0 4 2 0 4 2
5 5 0 1 2 3 4 5 0 5 4 3 2 1

El lector debera construirse tablas analogas para otros modulos, como m-


nimo las de n = 5 y, a ser posible, las de los modulos menores, y si puede utilizar
algun lenguaje de programacion, tambien las de otros mayores, hasta 10, por
ejemplo. En realidad, si lo intenta se dara cuenta inmediatamente que las tablas
de la suma son siempre monotonas y predecibles, con lo que puede limitarse, si
lo prefiere, a construir las tablas del producto.
Por ejemplo, en la tabla anterior se ve que Z/6Z no es un dominio ntegro,
sino que tiene divisores de 0. Por ejemplo, [2][3] = [0]. En cambio, si calcula
la tabla de Z/5Z vera que no tiene divisores de 0. Mas aun, podra comprobar
que el 1 aparece en todas las filas distintas de la del 0, lo que se traduce en que
todo elemento no nulo tiene inverso, luego Z/5Z es un cuerpo.
El lector experimentador puede obtener empricamente los primeros valores
de n para los cuales Z/nZ s es dominio ntegro: 2, 3, 5, 7, 11, . . . A estos hay
que anadir el 0 porque el correspondiente anillo cociente es isomorfo a Z, y no
vale el 1 porque en la definicion de dominio exigimos que 0 6= 1, mientras que
Z/1Z solo tiene un elemento.
Si analizamos la razon por la que un anillo Z/nZ no es ntegro vemos que en
cada caso la explicacion es siempre la misma: en Z/4Z la clase [2] es un divisor
de 0 porque 2 2 = 4. En Z/6Z las clases [2] y [3] son divisores de 0 porque
2 3 = 6, etc. En general, las factorizaciones de n dan lugar a divisores de cero.8
Concluimos que un anillo Z/nZ no puede ser ntegro a menos que n sea primo.
El lector puede tratar de probar directamente que Z/pZ es ntegro si p es
primo. Nosotros vamos a dar una prueba general. Notemos que en un anillo
cociente A/I se cumple 0 = [0] = 0 + I = I, luego [a] = 0 si y solo si a I.

Teorema 3.38 Sea A un dominio y P un ideal de A. Entonces A/P es un


dominio ntegro si y solo si P es un ideal primo.

Demostracion: Si P es primo entonces P 6= A, luego 1 / P , luego en


A/P se cumple que [1] 6= [0]. As pues, A/P es un dominio. Si [a], [b] son dos
8 Pero no es el unico caso exactamente. Por ejemplo, modulo 6, tenemos que [3][4] = [0],

pero es que 3 4 contiene la factorizacion 6 = 3 2.


3.6. Congruencias y anillos cociente 115

elementos de A/P tales que [a][b] = 0, entonces [ab] = [0], es decir, ab P .


Como P es primo, a P o b P , luego se cumple que [a] = 0 o [b] = 0, es
decir, A/P es un dominio ntegro.
Recprocamente, si A/P es un dominio ntegro, ha de ser [1] 6= [0], luego
1/ P y en consecuencia P 6= A. Si a, b son elementos de A tales que ab P ,
entonces [a][b] = [ab] = 0, y como A/P es ntegro [a] = 0 o [b] = 0, es decir,
a P o b P , luego P es primo.
Queda as justificado que los anillos Z/pZ son dominios ntegros cuando p es
un primo. El lector que tenga a mano sus tablas podra conjeturar una respuesta
a la siguiente pregunta: De entre los Z/pZ, cuales son cuerpos?
La respuesta es que todos lo son. De nuevo el lector es invitado a justificar
este hecho. Ha de probar que en un anillo Z/pZ con p primo todo elemento es
una unidad. Por ejemplo, en Z/5Z vemos que [2]1 = [3], pues [2][3] = [6] = [1].
El lector emprendedor debera recordar la relacion de Bezout (3.22). De nuevo,
aqu vamos a ver una prueba general:

Teorema 3.39 Sea A un dominio y sea M un ideal de A. Entonces A/M es


un cuerpo si y solo si M es un ideal maximal.

Demostracion: Si M es maximal entonces es primo, luego A/M es un


dominio ntegro. Veamos que si [a] 6= [0] entonces [a] es una unidad en A/M .
Como a / M tenemos que M + (a) 6= M , luego por la maximalidad de M ha
de ser M + (a) = A. En particular 1 M + (a), luego 1 se puede expresar de la
forma 1 = m + ba, para cierto m M y cierto b A. Tomando clases resulta
que [1] = [m] + [b][a] = [b][a], luego [a] es en efecto una unidad.
Si A/M es cuerpo entonces M es un ideal primo, y en particular M 6= A.
Consideremos un ideal N de A tal que M N A. Sea a un elemento de N
que no este en M . As [a] 6= 0, luego existe un b A tal que [a][b] = [1], es decir,
[ab 1] = [0], luego ab 1 M N y como a N , tambien ab N , luego
1 N y por tanto N = A. Esto prueba que M es un ideal maximal.
Como en Z los ideales maximales coinciden con los primos, resulta que los
anillos Z/pZ son cuerpos. Hay otra razon por la cual los anillos Z/nZ que son
dominios ntegros son tambien cuerpos, y es que son finitos:

Teorema 3.40 Todo dominio ntegro finito es un cuerpo.

Demostracion: Sea A un dominio ntegro finito. Hay que probar que todo
elemento no nulo u de A es una unidad. Si A = {0, u1, . . . , un }, entonces los
elementos uu1 , . . . , uun son todos distintos y no nulos, luego se da la igualdad de
conjuntos {u1 , . . . , un } = {uu1, . . . , uun } y por lo tanto: u1 un = uu1 uun ,
es decir, u1 un = un (u1 un ). Como u1 un no es 0, podemos cancelarlo,
lo que nos da un = 1, o sea u un1 = 1, luego u es una unidad.
Hay una variante de este argumento que, segun veremos, tiene muchas con-
secuencias interesantes:
116 Captulo 3. Aritmetica en dominios ntegros

Teorema 3.41 Sea A un dominio con un numero finito n de unidades y sea u


una unidad de A. Entonces un = 1.

Demostracion: Sean u1 , . . . , un las unidades de A. Entonces los elementos


uu1 , . . . , uun son todos distintos, pues si uui = uuj , como u es una unidad, se
cumple ui = uj . Ademas el producto de unidades es una unidad, luego en
realidad {u1 , . . . , un } = {uu1 , . . . , uun } y en particular los productos coinciden:
u1 un = uu1 uun , es decir, u1 un = un (u1 un ), y como u1 un es
una unidad, podemos cancelarlo, lo que nos da un = 1.
En particular, el cuerpo Z/pZ tiene p 1 unidades, luego si [a] Z/pZ
cumple [a] 6= [0], entonces [a]p1 = [1], luego [a]p = [a] (y esto ultimo vale
incluso si [a] = [0]). Esta es una de las formas en las que se suele enunciar el
teorema de Fermat:

Teorema 3.42 (Teorema de Fermat) Para todo primo p y todo numero en-
tero a, se cumple que ap a (mod p).

Homomorfismos y cocientes Ya hemos visto que la existencia de un mono-


morfismo de anillos f : A B se interpreta como que A puede ser considerado
como un subanillo de B. Ahora veremos que si f es un epimorfismo entonces B
puede ser considerado un cociente de A.

Definicion 3.43 Si f : A B es un homomorfismo de anillos, llamaremos


nucleo de f al conjunto N(f ) = {a A | f (a) = 0}.

No ofrece ninguna dificultad probar que N(f ) es un ideal de A. Una propie-


dad util es la siguiente:

Teorema 3.44 Si f : A B es un homomorfismo de anillos, se cumple que


f es monomorfismo si y solo si N(f ) = 0.

Demostracion: Una implicacion es evidente, y para ver la otra suponga-


mos que N(f ) = 0 y que f (a) = f (b). Entonces f (b a) = 0, y en consecuencia
b a N(f ) = 0, es decir, b = a.
Por ejemplo, si f : K A es un homomorfismo de un cuerpo K en un
anillo A, o bien f es constante igual a 0 o bien es un monomorfismo, porque el
nucleo de f tiene que ser un ideal de K, y solo hay dos opciones: que sea K, en
cuyo caso f es nulo, o bien que sea 0, en cuyo caso f es un monomorfismo.
Notemos ahora que si A es un anillo e I es un ideal de A, entonces la
aplicacion p : A A/I dada por p(a) = [a] es un epimorfismo, llamado
epimorfismo canonico. Claramente N(p) = I.
El proximo teorema nos dice que todo epimorfismo es esencialmente de este
tipo:
3.6. Congruencias y anillos cociente 117

Teorema 3.45 (Teorema de isomorfa) Sea f : A B un homomorfismo 


de anillos. Entonces la aplicacion f : A/ N(f ) f [A] dada por f [a] = f (a)
es un isomorfismo de anillos que hace conmutativo el diagrama siguiente:
f
A /B
;

p

 f
A/ N(f )

Demostracion: La aplicacion esta bien definida, pues si [a] = [b], entonces


a b N(f ), con lo que f (a b) = 0, o sea, f (a) = f (b).
Es inmediato  comprobar que se trata de un homomorfismo y es inyectivo
porque si f [a] = f([b]), entonces f (a) = f (b), f (a b) = 0, a b N(f ),
luego [a] = [b]. La conmutatividad del diagrama es inmediata.
Notemos que, en las condiciones del teorema anterior, si f es un epimorfismo,
entonces f es un isomorfismo entre B y A/ N(f ) de modo que si sustituimos
cada elemento de B por su equivalente en el cociente, entonces f se corresponde
con la proyeccion canonica.

La caracterstica de un anillo Con ayuda de los conceptos precedentes


vamos a profundizar un poco en la estructura de los anillos. Observemos que si
A es un dominio, entonces tenemos definidos los elementos
1, 2 1 = 1 + 1, 3 1 = 1 + 1 + 1, ... n 1, ...
Aqu hay que entender que en la expresion n 1 el numero n es un numero
natural, mientras que el 1 es la identidad de A. El resultado no es un numero
natural, sino un elemento de A. Por ejemplo, si hacemos el calculo en Z/6Z
obtenemos que
6 1 = 1 + 1 + 1 + 1 + 1 + 1 = 0,
cosa que no debera sorprender al lector.
Definicion 3.46 Llamaremos caracterstica de un dominio A (car A) al mnimo
numero natural no nulo n tal que n1 = 0, o bien car A = 0 si no existe tal n.
En otras palabras, la caracterstica de un dominio es el mnimo numero de
veces que hay que sumar 1 consigo mismo para obtener 0, o bien 0 si esto es
imposible.
Claramente Z y Q son anillos de caracterstica 0, mientras que Z/nZ tiene
caracterstica n.
Notemos que si A B son dominios ntegros, entonces la identidad en A es la
misma que la identidad en B (pues la identidad en A cumple 1 = 1 1, y el unico
elemento no nulo que cumple esto en B es la identidad), luego car A = car B.
Otro hecho notable es que la caracterstica de un dominio ntegro ha de ser
o bien 0 o bien un numero primo, pues si car A = mn, donde m y n no son 1,
entonces m1 6= 0 6= n1, pero (m1)(n1) = (mn)1 = 0, luego A no es ntegro.
118 Captulo 3. Aritmetica en dominios ntegros

Fijemos ahora un anillo unitario A y consideremos la aplicacion f : Z A


dada por f (n) = n1, que claramente es un homomorfismo.
Si A tiene caracterstica 0, entonces f (n) 6= 0 para todo n > 0, luego tambien
para todo n 6= 0. Por lo tanto, el nucleo de f es el ideal 0 y f es un monomorfismo
o, equivalentemente, un isomorfismo entre Z y f [Z], de modo que f [Z] es un
anillo indistinguible de Z a efectos algebraicos.
Por consiguiente, en la practica podemos identificar cada n Z con n1 A y
considerar as que Z A. En otras palabras, si A es un anillo de caracterstica 0
y escribimos 3 A, nos referimos al elemento 3 = 1 + 1 + 1 A, e igualmente
3 = 1 1 1 A. El hecho de que f sea un monomorfismo se traduce en
que en A se cumple 2 + 3 = 5, 3 4 = 12 o 5 6= 18 porque todo esto es cierto
en Z.
Supongamos ahora que A tiene caracterstica m > 0 y vamos a probar que
el nucleo de f es mZ. En principio sabemos que f (m) = 0, luego dicho nucleo
es un ideal no nulo de Z, que sera de la forma rZ, para cierto r > 0 tal que
r | m. En particular 0 < r m, pero, como r 1 = 0 y m es el menor natural no
nulo que cumple esto, tiene que ser r = m, luego el nucleo es ciertamente mZ.
El teorema de isomorfa nos da entonces un monomorfismo f : Z/mZ A,
dado por f([n]) = n 1. Nuevamente, esto nos legitima a identificar a Z/mZ con
un subanillo de A, el formado tambien por las sumas de unos, con la diferencia
de que ahora dicho anillo de sumas de unos no es isomorfo a Z, sino a Z/mZ.
En resumen:

Si A es un dominio de caracterstica 0, entonces tiene como subanillo a Z


(identificado con el anillo formado por las sumas de unos y menos unos).

Si K es un cuerpo de caracterstica 0, entonces, por el teorema 2.21 tene-


mos que K no solo contiene a Z, sino tambien a su cuerpo de cocientes Q.

Si A es un dominio de caracterstica n > 0, entonces tiene como subanillo


a Z/nZ (identificado con el anillo formado por las sumas de unos de A).

Si A es un dominio ntegro (en particular un cuerpo) de caracterstica


p > 0 entonces p es primo y contiene como subcuerpo a Z/pZ.

Mas precisamente, si K es un cuerpo de caracterstica 0, podemos considerar


que, por ejemplo, 5/3 K sin mas que entender que nos referimos al elemento.

1+1+1+1+1
.
1+1+1
As pues, los anillos Z y Z/nZ son los menores en sus respectivas carac-
tersticas, pues estan contenidos en cualquier dominio de la misma caracterstica.
Mas precisamente, si K es un cuerpo y k K es un subcuerpo, el cuerpo
formado a partir del 1 mediante sumas, restas y cocientes, que es isomorfo a Q o
a un cuerpo de restos Z/pZ, esta contenido en k (porque 1 k y al sumar, restar
3.6. Congruencias y anillos cociente 119

o dividir unos no nos salimos de k). As pues, se trata del menor subcuerpo
de K, en cuanto a que esta contenido en todos sus subcuerpos. Dicho cuerpo
mnimo se llama el cuerpo primo de K.
Veamos un par de teoremas que muestran por que la caracterstica de un
anillo es un dato a tener en cuenta.

Teorema 3.47 Sea A un dominio de caracterstica prima p. Entonces para


todos los elementos a y b de A se cumple (a b)p = ap bp .

Demostracion: Usamos el teorema 3.23:


p
P  k pk p1
P 
p p
(a + b)p = k a b = ap + b p + k ak bpk = ap + bp .
k=0 k=1

Si p es impar (ab)p = ap +(b)p = ap bp . Si p = 2 entonces b+b = 2b = 0,


luego b = b y el resultado vale.
n n n
Obviamente de aqu se sigue que, mas en general, (a b)p = ap bp .

Teorema 3.48 Sea K un cuerpo con car K 6= 2 y sea p(x) = ax2 +bx+c K[x]
con a 6= 0. El polinomio p(x) tiene una raz en K si y solo si existe
un K
de manera que 2 = b2 4ac. En tal caso, si llamamos = b2 4ac, las
races de p(x) son

b b2 4ac
.
2a

Demostracion: Supongamos que K cumple a 2 + b + c = 0. Multi-


plicando por 4a tenemos que (2a)2 + 2(2ab) + 4ac = 0, de donde (2a + b)2 =
2
b 4ac y por lo tanto 2a + b = b2 4ac. Como car K 6= 2, 2a 6= 0 y as

b b2 4ac
= .
2a

Si existe b2 4ac K, es facil ver que los elementos definidos por la
formula anterior son races de p(x).
Veamos algunas observaciones mas:

Todo anillo de caracterstica 0 es infinito (porque contiene a Z).

Sin embargo, un anillo de caracterstica no nula puede ser infinito. Por


ejemplo, el cuerpo de fracciones algebraicas (Z/nZ)(x).

Todo anillo ordenado tiene caracterstica 0, pues una simple induccion


demuestra que n 1 > 0 para todo n > 0.
En particular vemos que en un anillo finito no es posible definir ninguna
relacion de orden que cumpla los axiomas de anillo ordenado.
120 Captulo 3. Aritmetica en dominios ntegros

Podra pensarse que, por el contrario, todos los anillos de caracterstica 0


pueden ordenarse, pero no es as. Por ejemplo, si un cuerpo K, de carac-
terstica 0, contiene un elemento i K tal que i2 = 1, entonces no puede
ser dotado de una relacion de orden que lo convierta en un cuerpo ordenado,
porque tendra que ser i2 = 1 < 0 y, por otra parte, los cuadrados tienen que
ser positivos en un cuerpo ordenado. En el apartado siguiente probamos que
existe un cuerpo as.

Cocientes de anillos de polinomios Veamos una ultima aplicacion de los


anillos cociente:

Teorema 3.49 Sea k un cuerpo y p(x) k[x] no constante. Entonces existe


un cuerpo K que contiene a k en donde p(x) tiene una raz.

Demostracion: Tomando un factor irreducible, podemos suponer que p(x)


es irreducible (pues toda  raz de un factor de p(x) es tambien raz de p(x)).
Entonces el ideal p(x)  es maximal en k[x] (teorema 3.15), luego el anillo
cociente K = k[x]/ p(x) es un cuerpo.
La proyeccion canonica p : k[x] K se restringe a un homomorfismo
j : k K dado por j(a) = [a]. Como es no nulo (pues j(1) = 1), tiene que
ser un monomorfismo de cuerpos, a traves del cual podemos identificar a k con
su imagen, es decir, a cada a k con la clase [a] K.
Por otra parte, llamamos = [x] K. La clave del argumento es que,
al haber tomado el cociente respecto del ideal (p(x)), en K se cumple que
Pn
[p(x)] = 0. Mas explcitamente, si p(x) = ai xi , entonces
i=0
n
P n
P
i
0 = [p(x)] = [ai ][x] = ai i = p(),
i=0 i=0

donde hemos usado la identificacion [ai ] = ai . As pues, es una raz de p(x)


en K.

Definicion 3.50 Si k es un cuerpo y p(x) k[x] es un polinomio irreducible,


llamaremos k[] al cuerpo construido en la demostracion del teorema anterior,
es decir, k[] = k[x]/(p(x)) y = [x], de modo que es una raz de p(x) en
k[].

La estructura de este cuerpo es facil de describir. En principio, sus elementos


m
P
son de la forma [q(x)], donde q(x) k[x]. Si q(x) = bi xi , entonces
i=0
m
P m
P
i i
[q(x)] = [bi ][x] = bi = q(),
i=0 i=0

de modo que k[] = {q() | q(x) k[x]}. Esto significa que todo elemento
de k[] se obtiene sumando y multiplicando potencias de y elementos de k.
Pero podemos precisar mas. Si p(x) tiene grado n, dado cualquier q(x) k[x]
3.6. Congruencias y anillos cociente 121

n1
P
podemos dividir q(x) = p(x)c(x) + r(x), donde r(x) = ci xi , y entonces,
i=0
como p() = 0, queda que q() = r(), luego

k[] = {cn1 n1 + + c1 + c0 | c0 , . . . , cn1 k}.

As pues, todo elemento de k[] se expresa como suma de las n potencias conse-
cutivas 1, , . . . , n1 multiplicadas por elementos de k. Mas aun, cada elemento
de k[] admite una unica expresion de esta forma, es decir, si

cn1 n1 + + c1 + c0 = cn1 n1 + + c1 + c0 ,

entonces ci = ci para todo i. En efecto, tenemos que

(cn1 cn1 )n1 + + (c1 c1 ) + c0 .c0 = 0.


n1
P
Si llamamos t(x) = (ci ci )xi , entonces t() = 0, lo cual, haciendo = [x] y
i=0
eliminando la identificacion de k con su imagen en k[], equivale a que [t(x)] = 0,
es decir, a que p(x) | t(x), pero la unica forma en que un polinomio de grado n
puede dividir a otro de grado a lo sumo n 1 es que el segundo sea 0. Por lo
tanto t(x) = 0, lo cual significa que ci = ci para todo i, como queramos probar.

Ejemplo El polinomio x2 + 1 no tiene races en Q, luego es irreducible en


Q[x], luego podemos formar el cuerpo Q[i], que contiene una raz i de dicho
polinomio, es decir, un elemento que cumple i2 = 1. Tenemos as un cuerpo
de caracterstica 0 que no puede ser dotado de estructura de cuerpo ordenado.

El teorema chino del resto Vamos a mostrar distintos grados de abstrac-


cion de un teorema que aparecio enunciado por primera vez en un tratado del
matematico chino Sun Tzu, del que se sabe que vivio entre los siglos IV y V d.C.
Su enunciado mas elemental afirma que un sistema de congruencias lineales

x a1 (mod m1 ), ... , x an (mod mn )

tiene solucion siempre que los modulos m1 , . . . , mn son primos entre s dos a dos.
Mas aun, las soluciones x del sistema forman una misma clase de congruencia
modulo m = m1 mn .
En terminos mas modernos, este mismo enunciado puede expresarse as:

Teorema 3.51 (Teorema chino del resto) Si m1 , . . . , mn son numeros en-


teros primos entre s dos a dos y m = m1 mn , se tiene el isomorfismo de
anillos
Z/mZ = (Z/m1 Z) (Z/mn Z)
dado por [a] 7 ([a], . . . , [a]).
122 Captulo 3. Aritmetica en dominios ntegros

Demostracion: Es claro que la aplicacion f (a) = ([a], . . . , [a]) define un


homomorfismo de anillos de Z en el producto de los anillos cociente (considerado
como anillo con las operaciones definidas coordenada a coordenada), y su nucleo
es mZ, pues obviamente f (m) = 0 y, si f (a) = 0, entonces cada mi divide a
a y, como son primos entre s, esto implica que m | a, luego a mZ. Por
consiguiente, el teorema de isomorfa nos da un monomorfismo de Z/mZ en el
producto de anillos, y ahora basta observar que ambos anillos tienen el mismo
numero de elementos, luego una aplicacion inyectiva entre ellos tiene que ser
biyectiva.
La demostracion anterior es muy simple, porque prueba la inyectividad, que
es trivial, y automaticamente obtiene la suprayectividad, que es la parte no tri-
vial. Sin embargo, as no tenemos ninguna informacion sobre como encontrar
un entero a que resuelva el sistema de congruencias para unos ai dados. Va-
mos a dar una prueba alternativa que s nos indica como obtener antiimagenes
explcitamente y que ademas sirve en un contexto mas general:
Teorema 3.52 (Teorema chino del resto) Si D es un DIP, m1 , . . . , mn son
elementos de D primos entre s dos a dos y m = a1 an , se tiene el isomorfismo
de anillos
D/(m) = D/(a1 ) D/(an )
dado por [a] 7 ([a], . . . , [a]).
Demostracion: El mismo argumento del teorema anterior prueba que la
aplicacion indicada es un monomorfismo de anillos. Falta probar que es supra-
yectivo. Llamemos mi = m/ai D. Es claro que ai y mi son primos entre s,
luego por la relacion de Bezout existen ri , si D tales que ri ai + si mi = 1. Si
llamamos ei = si mi , tenemos que
ei 1 (mod ai ), ei 0 (mod aj ), para j 6= i.
Ahora, dados u1 , . . . , un D, es claro que la clase de a = u1 e1 + + un en
modulo m es una antiimagen de ([u1 ], . . . , [un ]).
La hipotesis de que el anillo considerado es DIP la hemos usado al usar la
relacion de Bezout. Vamos a probar que dicha hipotesis es necesaria:
Teorema 3.53 Si D es un dominio de factorizacion unica, las afirmaciones
siguientes son equivalentes:
1. D es un dominio de ideales principales.
2. Los ideales primos no triviales de D son maximales.
3. Si a1 , . . . , an son elementos de D primos entre s dos a dos y m = a1 an ,
se tiene el isomorfismo de anillos
D/(m) = D/(a1 ) D/(an )
dado por [a] 7 ([a], . . . , [a]).
4. Si a1 , . . . , an son elementos de D y d es su maximo comun divisor, existen
r1 , . . . , rn D tales que d = r1 a1 + + rn an .
3.6. Congruencias y anillos cociente 123

Demostracion: 1) 2) es el teorema 3.17.


2) 3) Es claro que el homomorfismo descrito en el enunciado es un mo-
nomorfismo. El problema es ver que es suprayectivo. Dividimos la prueba en
varios pasos:
i) Si es primo en D, entonces las unidades de D/( r ) son las clases de
los elementos primos con .
Lo probamos por induccion sobre r. Para r = 1 es trivial, pues el ideal ()
es primo, luego por hipotesis es maximal, luego D/() es un cuerpo.
Si vale para r y (, ) = 1, por hipotesis de induccion existe 0 D de
manera que 0 1 (mod r ), es decir, 0 1 = r . Sea D y = 0 + r .
Veamos que eligiendo adecuadamente se cumple que 1 (mod r+1 ).
Tenemos que 1 = 0 1+ r = r ( +), luego 1 (mod r+1 )
si y solo si (mod ). Ahora bien, por el caso r = 1 resulta que es
una unidad modulo , luego existe un que cumple la congruencia.
El recproco es obvio: si 1 (mod r+1 ) entonces + r+1 = 1, con
lo que claramente .
ii) Se cumple 3) bajo la hipotesis de que ai = iri , donde los i son primos
no asociados dos a dos.
Llamemos mi = m/ai , de modo que mi es primo con ai , luego, por i),
sabemos que mi es una unidad en D/(ai ), es decir, que existe un si D tal que
ei = si mi 1 (mod ai ), y obviamente ei 0 (mod aj ), para j 6= i. Entonces,
dados u1 , . . . , un D, es claro que u = u1 e1 + + un en es una antiimagen de
([u1 ], . . . , [un ]) por el homomorfismo del enunciado.
Por consiguiente, [u] es una unidad de D/(m) si y solo si ([u], . . . , [u]) es una
unidad en el producto, lo que equivale a que [u] sea una unidad en cada cociente
D/(iri ) y hemos probado que esto equivale a que u sea primo con cada i , lo
que equivale a que u sea primo con m.
iii) Si m D no es nulo ni unitario, las unidades de D/(m) son las clases
de los elementos primos con m.
Podemos descomponer m = 1r1 nrn , donde es una unidad y los i son
primos no asociados dos a dos. Como (m) = (m1 ) y los primos con m son
los mismos que los primos con m1 , podemos suponer que = 1. Llamamos
ai = iri y por ii) tenemos el isomorfismo del enunciado.
Por lo tanto, si u D, la clase [u] es una unidad en D/(m) si y solo si
([u], . . . , [u]) es una unidad en el producto, lo cual equivale a que cada clase [u]
sea una unidad en D/(ai ), y por i) esto equivale a que u sea primo con cada i ,
lo que a su vez equivale a que u sea primo con m.
Por ultimo, usando iii) en lugar de i), la prueba de ii) vale en general,
sin suponer que cada ai es una potencia de primo (notemos que no se pierde
generalidad si suponemos que cada ai no es nulo ni unitario), lo que nos da 3).
3) 4) Razonamos por induccion sobre n. Consideramos primero el primer
caso no trivial, que es n = 2. Sea a1 = db1 , a2 = db2 , de modo que b1 y b2 son
124 Captulo 3. Aritmetica en dominios ntegros

primos entre s. Por 3) existe un u D tal que u 1 (mod b1 ), u 0 (mod b2 ).


Explcitamente, u = 1 + b1 c1 = b2 c2 , luego

d = d(b1 c1 + b2 c2 ) = c1 a1 + c2 a2 ,

como haba que probar. Si vale para n, sea d = mcd(a1 , . . . , an ), de modo que
d = mcd(d , an+1 ). Por hipotesis de induccion y por el caso n = 2 ya probado,
tenemos que
d = r1 a1 + rn an , d = rd + san+1 ,
de donde d = rr1 a1 + rrn an + san+1 .
4) 1) Notemos que 4) equivale a que (a1 , . . . , an ) = (d). Sea I un ideal
propio de D y tomemos I no nulo. Factoricemos = 1 n como
producto de primos. Si es cualquier primo e I () entonces | luego
= i para algun i.
Definimos e() = mn e (), donde recorre los elementos no nulos de I y

e () es el exponente de en . Acabamos de probar que si e() > 0 entonces
= i para un i, es decir, que e() = 0 para todos los primos excepto quiza
algunos de los i .
Por la propia definicion de e() tenemos que para cada i existe un i I
e( ) e( )
de modo que ei (i ) = e(i ). Sea = 1 1 n n . Obviamente se cumple
que I (). Ademas = mcd(, 1 , . . . , n ), pues ciertamente divide a
, 1 , . . . , n (porque estan en I) y si es un divisor comun de todos ellos
entonces los divisores primos de seran algunos de los i (porque | ) y
ei () ei (i ) = e(i ), luego | .
Por 4) tenemos que () = (, 1 , . . . , n ) I, luego I = ().
As pues, el teorema chino del resto, al igual que la relacion de Bezout o
la maximalidad de los ideales primos son caractersticas que determinan a los
dominios de ideales principales entre los dominios de factorizacion unica. Apa-
rentemente, pues, no es posible demostrar el teorema chino del resto en dominios
de factorizacion unica que no sean DIPs, pero sucede que si reformulamos el teo-
rema en terminos de ideales, entonces es valido en cualquier dominio ntegro:

Teorema 3.54 (Teorema chino del resto) Sea D un dominio ntegro y


sean a1 , . . . , an ideales de D tales que ai +aj = D para i 6= j. Si 1 , . . . , n D,
existe un x D tal que x i (mod ai ) para i = 1, . . . , n.

Demostracion: Para n = 2 tenemos que a1 +a2 = 1, para ciertos elementos


ai ai , y basta tomar x = 2 a1 + 1 a2 .
En el caso general, para cada i 2 elegimos ai a1 , bi ai tales que
ai + bi = 1. Entonces
n
Q n
Q
1= (ai + bi ) a1 + ai = D.
i=2 i=2

Por el caso ya probado existe un elemento y1 D tal que y1 1 (mod a1 ),


y1 0 (mod ai ) para i 2. Similarmente podemos definir elementos yi D
3.7. Ejemplos 125

que cumplan
yi 1 (mod ai ), yi 0 (mod aj ) para j 6= i.
Basta tomar x = 1 y1 + + n yn .

3.7 Ejemplos
Terminamos este captulo con algunos ejemplos que ilustren los concep-
tos que hemos introducido. Empezamos desarrollando el ultimo ejemplo de
la seccion precedente.

Los enteros de Gauss Consideremos el cuerpo Q(i), cuyos elementos, segun


hemos visto, se expresan de forma unica como a + bi, con a, b Q, y donde
i2 = 1. Esto determina completamente la suma y el producto:
a + bi + c + di = a + c + (b + d)i, (a + bi)(c + di) = ac bd + (ad + bc)i.
Llamaremos conjugado de un elemento a + bi Q(i) al elemento dado por
a + bi = a bi. Una simple comprobacion muestra que la conjugacion z 7 z
es un isomorfismo Q(i) Q(i). Claramente es biyectiva y solo hay que com-
probar que z1 + z2 = z1 + z2 y z1 z2 = z1 z2 , lo cual se sigue trivialmente de las
expresiones precedentes para la suma y el producto en Q(i).
A su vez podemos definir la norma N : Q(i) Q mediante N(z) = z z
o, explcitamente, N(a + bi) = (a + bi)(a bi) = a2 + b2 . Esta norma es
multiplicativa, en el sentido de que N(z1 z2 ) = N(z1 ) N(z2 ).
En efecto, N(z1 z2 ) = z1 z2 z1 z2 = z1 z1 z2 z2 = N(z1 ) N(z2 ).
Dentro de Q(i) podemos considerar el anillo de los enteros de Gauss:
Z[i] = {a + bi | a, b Z}.
Es inmediato comprobar que la suma, el producto y el opuesto de un entero de
Gauss vuelve a ser un entero de Gauss, por lo que realmente Z[i] es un subanillo
de Q(i), y de hecho un dominio ntegro. Ademas, la norma se restringe a una
aplicacion N : Z[i] N, que obviamente sigue siendo multiplicativa.
Vamos a probar que Z[i] es un dominio eucldeo con dicha norma.
Obviamente cumple la propiedad 1 de la definicion 2.17. Sean , dos
enteros de Gauss, con 6= 0. Entonces / = a + bi Q[i]. Sean m y n
enteros9 tales que |a m| 1/2, |b n| 1/2. Llamemos = m + ni Z[i] y
r = . As = + r, con
2 2 N()
N(r) = N() = N( ) N() = ((am) +(bn) ) N() < N().
2
9 Siempre existen tales enteros, pues dado un numero racional a = u/v, podemos dividir

u = vc + r, con 0 r < v, y entonces u/v = c + r/v, con 0 r/v < 1. En suma, a < c < a + 1.
Si c a > 1/2, consideramos c = c 1, y entonces c < a y a c < 1/2. En cualquier caso,
hemos encontrado un m Z (sea m = c o m = c ) tal que |a m| 1/2.
126 Captulo 3. Aritmetica en dominios ntegros

As pues, resulta que Z[i] es tambien un DIP y un DFU. Vamos a calcular sus
unidades. Para ello observamos que si u Z[i] es una unidad, entonces existe
un v Z[i] tal que uv = 1, luego N (u)N (v) = N (1) = 1 y como son numeros
naturales, esto solo es posible si N (u) = 1. Recprocamente, si un entero de
Gauss cumple N (u) = 1 es que es una unidad, pues tenemos que uu = 1, y
u Z[i].
Ahora bien, los enteros de Gauss a + bi de norma 1 son los que cumplen
a2 + b2 = 1, y es claro que esto solo sucede si (a, b) = (1, 0), (0, 1) o, lo que
es lo mismo, si u = 1, i. Por lo tanto Z[i] tiene cuatro unidades, frente a las
dos que tiene Z.

Por consiguiente, en Z[i] los asociados no nulos aparecen en grupos de cuatro


y no en parejas, como en Z. Los asociados de 3, por ejemplo, son 3, 3, 3i, 3i.
De aqu podemos extraer una leccion interesante, y es que ser primo es
relativo. Por ejemplo,
2 = (1 + i)(1 i),
y ninguno de los factores es una unidad, luego 2 es primo en Z, pero no en Z[i].
De hecho, la descomposicion anterior es la descomposicion en factores primos
de 2, ya que N (1 + i) = 2, y esto hace que sea irreducible, pues si pudieramos
descomponer 1 + i = uv, tendramos que 2 = N (1 + i) = N (u)N (v), y como son
numeros naturales, necesariamente una de las dos normas es 2 y la otra es 1,
luego uno de los factores es una unidad. Lo mismo vale para el segundo factor.
Mas aun, los dos factores primos de 2 no son realmente distintos, en el sentido
de que son asociados, pues 1 i = i(1 + i). Por lo tanto, la descomposicion
de 2 se expresa mas claramente como 2 = i(1 + i)2 .
Ejercicio: Comprobar que 5 = (2 + i)(2 i) es una factorizacion de 5 en dos primos
de Gauss no asociados. Comprobar que no hay enteros de Gauss de norma 3 y deducir
que 3 es primo en Z[i].

Enteros ciclotomicos de orden 3 Consideramos un ejemplo similar al ante-


rior, pero partiendo del polinomio x2 + x + 1, que es irreducible en Q[x], porque
no tiene races o, mas en general, porque as lo hemos visto en el ultimo ejemplo
de la seccion 3.5. Podemos considerar el cuerpo Q[], donde es una raz del
polinomio dado, es decir, cumple que 2 + + 1 = 0. Sus elementos son de la
forma a + b, con a, b Q. La suma y el producto vienen dados por

a + b + c + d = a + c + (b + d), (a + b)(c + d) = ac bd + (ad + bc bd).

En efecto,

(a + b)(c + d) = ac + (ad + bc) + bd 2 = ac + (ad + bc) + bd(1 )

= ac bd + (ad + bc bd).
3.7. Ejemplos 127

A menudo es preferible pensar que los elementos de Q() son de la forma


a + b + c 2 entendiendo que la expresion no es unica, sino que, como se da la
relacion 1 + + 2 = 0, se cumple que

a + b + c 2 = a + r + (b + r) + (c + r) 2

para cualquier r Q, es decir, podemos transformar cualquier elemento de Q()


sumando un mismo numero racional a todas sus coordenadas sin que se altere
su valor.
En este caso definimos la conjugacion10 mediante

a + b = a + b 2 = a b b.

Es facil ver que conserva sumas y productos. Por ejemplo, para el producto
tenemos que

(a + b)(c + d) = ac bd + (ad + bc bd) = ac bd + (ad + bc bd) 2 ,

a + b c + d = (a + b 2 )(c + d 2 ) = ac + (ad + bc) 2 + bd,


y ambas expresiones son iguales porque la primera se transforma en la segunda
sumando bd a todas las coordenadas.
Como antes definimos la norma N : Q() Q mediante N(z) = z z, lo que
explcitamente es
2 2 2 2 2 2
N(a + b) = (a + b)(a + b ) = a + b + ab + ab = a ab + b .

Como la conjugacion es conmutativa, la norma tambien lo es, es decir, se


cumple que N(z1 z2 ) = N(z1 ) N(z2 ).
Definimos el anillo de los enteros ciclotomicos de orden 3 como

Z[] = {a + b | a, b Z}.

Como en el caso de los enteros de Gauss es inmediato que se trata de un subani-


llo de Q(), en particular es un dominio ntegro, y la norma se restringe a
una aplicacion N : Z[] N. En efecto, notemos que si ab 0 entonces
trivialmente a2 ab + b2 0, y si ab < 0 entonces

a2 ab + b2 > a2 2ab + b2 = (a b)2 0.

Tambien sucede que Z[] es un dominio eucldeo con la norma que estamos
considerando. La primera condicion se cumple trivialmente y, en cuanto a la
segunda, si , Z[] con 6= 0, consideramos el cociente / = a+b Q[]
10 El lector puede preguntarse por que en Q(i) hemos definido a + bi = a bi y ahora no

definimos a + b = a b. En realidad la definicion de conjugacion sigue el mismo criterio


en ambos casos: en el primer caso las races de x2 + 1 son i y i y la conjugacion intercambia
una con otra. Ahora las races de x2 + x + 1 son y 2 , y la conjugacion tambien intercambia
una por otra.
128 Captulo 3. Aritmetica en dominios ntegros

y tomamos m, n Z tales que |a m| 1/2, |b n| 1/2. Sea = m + n y


r = , con lo que

N(r) = N( ) = N( ) N() = N(a m + (b n)) N(),

y
2 2
N(a m + (b n)) = |(a m) (a m)(b n) + (b n) |
3
(a m)2 + |a m||b n| + (b n)2 ,
4
luego en definitiva = + r con N(r) < N().
As pues, Z[] es tambien DIP y DFU. Exactamente el mismo razonamiento
empleado para Z[i] nos da que las unidades son los elementos de norma 1, es
decir, los a + b que cumplen la ecuacion a2 + b2 ab = 1.
Para resolverla observamos que no pueden ser a < 0 y b > 0 o viceversa, pues
entonces el miembro izquierdo suma al menos 3. Por lo tanto, o bien a 0 y
b 0, o bien a 0 y b 0. Escribiendo la ecuacion en la forma (a b)2 + ab = 1
concluimos facilmente que hay seis soluciones, correspondientes a

1, , (1 + ) = 2 .

As pues, hemos encontrado un DFU con seis unidades, en el que los asocia-
dos no nulos se agrupan, por tanto, de seis en seis.
Es facil ver que no hay enteros ciclotomicos de norma 2, pues para que se
cumpla a2 + b2 ab = 2, como antes tienen que ser a 0 y b 0 o bien a 0 y
b 0, y ahora la ecuacion (a b)2 + ab = 2 resulta imposible, pues si el primer
sumando es 0 queda a2 = 2, que es imposible, y si es 1 fuerza a que el segundo
tambien sea 1, pero entonces a = b = 1 y el primer sumando sera 0.
Esto se traduce en que 2 es primo, pues si factorizara como 2 = , entonces
N() N() = N(2) = 4, pero, como ninguna norma puede ser 2, uno de los
factores tendra norma 1, luego sera una unidad y la factorizacion es trivial.
Por otra parte N(1) = 3, lo que nos da la factorizacion 3 = (1)(1 2),
que es una descomposicion en factores primos, pues ambos factores tienen
norma 3, luego si cualquiera de ellos se descompone en producto de dos en-
teros ciclotomicos, uno de los factores tiene que tener norma 1, luego es una
unidad.
Ademas, los dos factores son asociados, pues 1 2 = 2 (1 ), luego la
descomposicion de 3 en factores primos es 3 = 2 (1 )2 .

Un ejemplo de dominio
 sin
factorizacion unica Consideramos finalmente
el cuerpo Q 5 , donde 5 es una raz del polinomio x2 + 5. Copiando
literalmente los argumentos para el caso de Z[i], podemos definir el anillo
 
Z 5 = {a + b 5 | a, b Z}
3.7. Ejemplos 129
 
con la norma N : Z 5 N dada por
2 2
N(a + b 5) = (a + b 5)(a b 5) = a + 5b .

Nuevamente, las unidades son los elementos de norma 1, que en este caso
son simplemente 1, como en Z. Pero lo que no es posible es imitar la prueba
de que Z[i] es un dominio eucldeo, porque Z 5 ni siquiera es DFU. Para
probarlo basta observar que

3 7 = 21 = (4 + 5 )(4 5 ).

Se trata de dos descomposiciones en irreducibles, pues las normas de los cuatro


factores son, respectivamente, 9, 49, 21 y 21. Si alguno de ellos no fuera irreduci-
ble, se descompondra en producto de elementos de norma 3 o 7, pero no existen
elementos de estas normas, pues es facil ver que las ecuaciones a2 + 5b2 = 3 y
a2 + 5b2 = 7 no tienen soluciones enteras.
Ademas son dos descomposiciones distintas, ya que los unicos asociados de
3 
son 3, y ninguno de ellos aparece en la segunda factorizacion. Por lo tanto,
Z 5 no es DFU. Mas aun, cualquiera de los factores es un ejemplo de

irreducible que no es primo, pues por ejemplo, 3 | (4 + 5 )(4 5 ), pero 3
no divide a ninguno de los factores. Si lo hiciera sera

3(u + v 5) = 3u + 3v 5 = 4 5,

y por la unicidad de la expresion 3v | 1, lo cual es imposible.


 
Ejercicio: Definir y estudiar el anillo Z 2 . Probar que es un dominio eucldeo.

Descomposicion en fracciones simples Terminamos con un ejemplo mu-


cho mas elemental que los anteriores, pero que ilustra el uso de la factorizacion
unica en los anillos de polinomios. Se trata de una descomposicion que se usa
principalmente a la hora de calcular integrales de cocientes de polinomios con
coeficientes reales:

Teorema 3.55 Si k es un cuerpo, toda funcion racional z k(x) se descom-


pone de forma unica como
ri
n X
X fij
z=f+
i=1 j=1 pji

donde f, fij , pi k[x], los polinomios pi son monicos, irreducibles, distintos dos
a dos, y fij es nulo o tiene grado menor que pi (pero firi 6= 0).

Demostracion: Sea z = u/v, con u, v k[x]. Podemos suponer que u y


v son primos entre s y que v es monico. Si v = 1 tenemos la descomposicion
con f = u. En caso contrario consideremos un factor primo p1 de v, de modo
130 Captulo 3. Aritmetica en dominios ntegros

que v = pr11 v y p1 no divide a v. Podemos suponer que tanto p1 como v son


monicos. Vamos a probar que
1 r
u u X f1j
= + ,
v v j=1 pj1

donde u y v son primos entre s y los polinomios f1j tienen grado menor que
el grado de p1 . Si obtenemos esta descomposicion, podemos aplicar el mismo
resultado a u/v y as sucesivamente hasta que el denominador acabe siendo 1 (lo
cual ocurrira necesariamente tras un numero finito de pasos, porque a cada paso
le quitamos un factor primo). Con esto habremos llegado a una descomposicion
de z como la que aparece en el enunciado.
Como p1 y v son primos entre s, por la relacion de Bezout existen polinomios
c, d tales que cv + dp1 = 1. Esta igualdad implica en particular que p1 no divide
a c, y tampoco divide a u porque u y v son primos entre s. Por lo tanto, en la
division uc = gp1 + f1,r1 , el resto f1,r1 no puede ser nulo, y tiene grado menor
que el de p1 . As pues,

u du gv + du u1
= uc + p1 = p1 + f1,r1 = p1 + f1,r1 ,
v v v v
donde u1 y v son primos entre s. Aplicamos el mismo razonamiento a u1 /v
para obtener la descomposicion
u  u2  u2 2
= p1 + f1,r1 1 p1 + f1,r1 = p + f1,r1 1 p1 + f1,r1 ,
v v v
donde u2 y v son primos entre s (aunque ahora f1,r1 1 s puede ser 0, lo que
sucedera si p1 divide a u1 ). Repetimos el proceso hasta obtener:
1r
u u X
= pr11 + f1j pr11 j ,
v v j=1

donde cada f1j es nulo o tiene grado menor que el de p1 y u = ur es primo con
v. Dividiendo entre pr11 obtenemos
1 r
u u X f1j
z= = + ,
v v j=1 pj1

que es la descomposicion que buscabamos.


Ahora vamos a probar la unicidad. Supongamos que una misma fraccion
z k(x) admite dos descomposiciones en factores simples. Pongamos que una
de las descomposiciones tiene m fracciones (sin contar el polinomio inicial) y
la otra n, con m n. Razonamos por induccion sobre n. Si n = 0 tenemos
simplemente dos polinomios, que trivialmente han de ser el mismo, pues ambos
han de coincidir con z.
3.7. Ejemplos 131

Consideremos una descomposicion cualquiera:


ri
n X
X fij
z=f+
i=1 j=1 pji

Al sumar todas las fracciones correspondientes a pi , el denominador comun es


pri i , y el numerador es una suma en la que todos los sumandos son multiplos de
pi menos uno (fi,ri 6= 0), luego tenemos que
n
X hi
z=f+ ri ,
p
i=1 i

donde pi no divide a hi . Al efectuar la suma (incluyendo a f ), con denominador


comun pr11 prnn , el numerador es una suma de n + 1 terminos, todos los cuales
son multiplos de pi menos uno, a saber, pr11 hi prnn , luego el numerador no
es multiplo de pi . As pues, concluimos que, si z = u/v con u y v primos entre s
y v monico, necesariamente v = pr11 prnn y que u no es divisible entre ninguno
de los pi .
Con esto hemos probado que, en cualquier descomposicion de z en fracciones
simples, los polinomios pi son necesariamente los factores irreducibles de v, y
los ri son los exponentes con que aparecen en v.
Consideremos de nuevo las dos descomposiciones que estamos suponiendo
que tiene z. Pongamos que una contiene el sumando f1r1 /pr11 y la otra g1r1 /pr11 .
Segun hemos visto,
u = f1,r1 pr22 prnn + multiplos de p1 = g1,r1 pr22 prnn + multiplos de p1 ,
luego p1 divide a f1,r1 g1,r1 , lo cual solo es posible si f1,r1 = g1,r1 , ya que
ambos tienen grado menor que p1 .
Esto significa que podemos cancelar el sumando f1,r1 /pr11 de ambas descom-
posiciones, y as llegamos a otra fraccion que admite dos descomposiciones en
factores simples de longitudes m 1 y n 1. Por hipotesis de induccion, am-
bas tienen que ser iguales, luego las dos descomposiciones de partida tambien
coinciden.

Ejemplo Vamos a calcula la descomposicion en fracciones simples de


x3
.
(x 1)(x 2)2
Sabemos que tiene que ser de la forma
x3 A B C
= + + .
(x 1)(x 2)2 x 1 x 2 (x 2)2
Para calcular A multiplicamos por x 1 y evaluamos en 1:
x3 B(x 1) C(x 1)
2
= A+ + ,
(x 2) x2 (x 2)2
132 Captulo 3. Aritmetica en dominios ntegros

luego 2 = A. Si multiplicamos por (x 2)2 obtenemos C:

x3 A(x 2)2 B(x 2)2


= + + C,
x1 x1 x2
de donde 1 = C. Ahora que conocemos A y B, dando, por ejemplo, a x el
valor x = 3 obtenemos B:
0 = 1 + B 1,
luego B = 2. En definitiva:
x3 2 2 1
= + .
(x 1)(x 2)2 x 1 x 2 (x 2)2
Captulo IV

Algunas aplicaciones

En este captulo estudiaremos algunos problemas clasicos de la teora de


numeros que ilustren la relacion entre la teora general de anillos que hemos
estudiado y los problemas concretos sobre numeros enteros, a la vez que mo-
tiven las tecnicas y conceptos algebraicos mas avanzados que introduciremos
en los temas siguientes. Comenzamos con dos problemas que se remontan a la
matematica griega.

4.1 Numeros perfectos


Los numeros se han relacionado desde siempre con el esoterismo y la adivi-
nacion. As, el numero 7 se ha considerado un numero de buena suerte, mientras
el 13 era considerado nefasto. Un concepto que tiene su origen en esta clase de
teoras es el de numero perfecto. Un numero es perfecto si es la suma de sus
divisores distintos de el mismo (siempre considerando numeros naturales). Por
ejemplo, los divisores de 6 son 1, 2 y 3 y se cumple que 6 = 1 + 2 + 3. El numero
6 es perfecto. Otro ejemplo de numero perfecto es el 28 = 1 + 2 + 4 + 7 + 14.

Definamos la funcion (n) igual a la suma de los divisores de n. En estos


terminos un numero n es perfecto si y solo si (n) = 2n (pues tambien sumamos
el propio n).
Una funcion f de numeros naturales es multiplicativa si cuando (m, n) = 1
cumple f (mn) = f (m)f (n). Las funciones multiplicativas aparecen frecuen-
temente en teora de numeros, y de hecho acabamos de encontrarnos con una.
Para probarlo hemos de tener en cuenta que si (m, n) = 1, entonces cada divisor
de mn se expresa de forma unica como el producto de un divisor de m y un
divisor de n. En efecto, si a | mn, descomponemos el numero a en un producto,
el primero de cuyos factores contenga a los factores primos de a que dividen a
m y el segundo a los que dividen a n. Por lo tanto
P P P P P   P 
(mn) = d= uv = u v = u (n) = (m)(n).
d|mn u|m v|n u|m v|n u|m

133
134 Captulo 4. Algunas aplicaciones

Por otra parte, si p es un primo es facil calcular (pn ) = 1 + p + + pn .


Teniendo en cuenta la identidad (1 + x + x2 + + xn )(x 1) = xn+1 1, resulta
que
pn+1 1
(pn ) =
p1
As podemos calcular facilmente la funcion . Por ejemplo,
23 1 53 1
(100) = (22 )(52 ) = = 7 31 = 217.
21 51
Euclides recoge en sus Elementos el hecho de que si el numero 1+2+ +2n =
n+1
2 1 es primo, entonces el numero 2n (2n+1 1) es perfecto.
En efecto, como para los primos p se cumple que (p) = p + 1, en nuestro
caso tenemos que (2n+1 1) = 2n+1 , y como es multiplicativa,
 
2n (2n+1 1) = (2n )(2n+1 1) = (2n+1 1) 2n+1 = 2 2n (2n+1 1) .

Descartes afirmo (y la primera prueba conocida se debe a Euler) que un


numero par es perfecto si y solo si es de la forma indicada por Euclides.
Para verlo tomemos un numero par, que lo podremos expresar en la forma
2n m, donde n > 0 y m es un numero impar. Si es perfecto, (2n m) = 2n+1 m.
Como es multiplicativa

(2n+1 1)(m) = 2n+1 m. (4.1)

Como 2n+1 1 es impar, el exponente de 2 en (m) ha de ser n + 1, es decir,


(m) = 2n+1 a para cierto numero natural a. Sustituyendo en (4.1) obtenemos
(2n+1 1)2n+1 a = 2n+1 m, luego

(2n+1 1)a = m. (4.2)

Por lo tanto (m) = 2n+1 a = m + a. Ahora bien, si a > 1 resulta que 1,


a y m son divisores distintos de m, luego (m) debe ser al menos 1 + a + m,
contradiccion. Concluimos que a = 1 y que (m) = m + 1, lo que solo es posible
si m no tiene mas divisores que 1 y m, es decir, si m es primo.
Sustituyendo a = 1 en (4.2) queda que m = 2n+1 1, luego el numero
original era 2n (2n+1 1) con 2n+1 1 primo, o sea, de la forma establecida
por Euclides. Con un leve cambio de ndice podemos enunciar as lo que hemos
probado:
Un numero par es perfecto si y solo si es de la forma 2n1 (2n 1) y 2n 1
es primo.
Respecto a los numeros perfectos impares no se conoce ninguno, pero nadie
ha demostrado que no existan. Es un problema abierto.
Ejercicio: Estudiar la funcion d(n) = numero de divisores de n.
Ahora pasamos a ocuparnos del problema de determinar para que valores de
n se cumple que el numero 2n 1 es primo. El lector emprico ya debera haber
4.1. Numeros perfectos 135

empezado a recopilar datos. He aqu lo que puede obtenerse sin esforzarse uno
mucho:
n 2 3 4 5 6 7 8 9 10 11?
2n 1 3 7 15 31 63 127 255 511 1023 2 047?
La tabla muestra los primeros valores de 2n 1. Es facil ver que para n = 2,
3, 5 y 7 obtenemos primos (el 127 es primo porque no es divisible por primos
menores que 12). Tampoco cuesta ver que los numeros restantes no lo son.
Todos son multiplos de 3 salvo el 511, que es divisible entre 7. El numero
correspondiente a 11 esta entre interrogantes porque ya no es facil decidir si es
primo. Habra que tratar de dividirlo entre todos los primos menores que 45 y
hay un total de 14. Dejemos eso para luego y centremonos en los casos claros.
Vemos que 2n 1 no siempre es primo. Conjetura algo el lector sobre en que
casos lo es? No hay que forzar mucho la imaginacion para sospechar que 2n 1
es primo exactamente cuando n lo es.
Tratemos de probar que 2n 1 no es primo si n es compuesto. Para buscar
un posible divisor a 2n 1 observemos los divisores que hemos encontrado en
nuestros ejemplos:
n 2 3 22 5 23 7 23 32 25
n
2 1 3 7 35 31 32 7 127 3 5 17 7 73 3 11 31
Si al lector no le basta esto para conjeturar que divisores podemos encontrar
en el numero 2n 1 cuando n no es primo, he aqu una pista mas. La factori-
zacion siguiente no ha sido hallada por tanteo: 214 1 = 16 383 = 3 43 127.
Es facil encontrar el factor 3, pero como se encuentran los factores 43 y 127 en
el cociente 5.461?
La mayor pista esta en el 127. El 127 es el primo correspondiente a n = 7 y
7 es uno de los factores de 14. El otro factor es 2 y su primo correspondiente el
3, que tambien divide a 214 1. Tambien es claro el caso n = 10, cuyos factores
son 2 y 5 y en 210 1 aparecen los primos correspondientes, 3 y 31. Vemos que
tambien aparecen otros primos, como el 11 en 210 1 o el 5 y el 17 en 28 1,
pero eso no importa. La conjetura es que si d | n entonces 2d 1 | 2n 1, y
la prueba es trivial si usamos congruencias: tomando clases modulo 2d 1 se
cumple que [2]d = [1], luego si n = dm
m
[2n 1] = [2]d [1] = [1]m [1] = [0],
lo que prueba que en efecto 2d 1 | 2n 1.
Con esto ya tenemos que para que 2n 1 sea primo el numero n ha de ser
primo. Los numeros de la forma 2p 1 con p primo se llaman numeros de
Mersenne. La cuestion es si todos los numeros de Mersenne son primos. Antes
hemos probado que los primos de Mersenne estan en correspondencia con los
numeros pares perfectos. He aqu los numeros perfectos que hemos encontrado:
p 2 3 5 7
2p 1 3 7 31 127
2p1 (2p 1) 6 28 496 8 128
136 Captulo 4. Algunas aplicaciones

Segun nuestras conjeturas el numero 211 1 debera ser primo. El lector


animoso puede tratar de dividirlo entre los 14 primos menores que 45. Aqu
vamos a estudiar el problema pensando mas para trabajar menos. Es evidente
que 211 1 = 2.047 no es multiplo de 2, 3 o 5. Vamos a ver si puede ser
multiplo de 7. No solo vamos a probar que no lo es, sino que vamos a encontrar
razones por las que no puede serlo, con lo que podremos descartar muchos
mas primos aparte del 7. El numero 211 1 sera multiplo de 7 si y solo si al
tomar clases modulo 7 se cumple que [2]11 = [1]. Las potencias de 2 modulo 7
pueden calcularse recurrentemente [2]n+1 = [2]n [2], lo que nos permite reducir
las potencias al tiempo que las calculamos: [2]2 = [4], [2]3 = [4][2] = [8] = [1],
[2]4 = [1][2] = [2], etc. As vamos obteniendo lo siguiente:

n 0 1 2 3 4 5 6 ...
[2]n [1] [2] [4] [1] [2] [4] [1] . . .

Vemos que el [1] se alcanza cclicamente en los multiplos de 3, luego no es


necesario llegar hasta el 11: como 11 no es multiplo de 3, 211 1 no puede ser
multiplo de 7.
Por lo tanto la razon por la que 211 1 no es multiplo de 7 es que 11 no es
multiplo de 3. De donde ha salido ese 3? Es obvio que al calcular potencias de
un elemento dado no nulo de Z/pZ, como es [2], tarde o temprano obtendremos
un valor repetido, pues solo hay un numero finito de valores posibles, o sea, dado
a en Z/pZ, existen numeros naturales 0 < m < n tales que am = an = am anm ,
luego anm = 1. En resumen, ha de haber un natural no nulo d tal que ad = 1.
Si tomamos el d menor posible es obvio que el 1 se alcanzara exactamente en
los multiplos de d, que es lo que nos hemos encontrado.
En resumen, dado un primo p existe un numero d tal que 2n 1 es divisible
entre p si y solo si d | n. El lector puede calcular los valores de d para dis-
tintos primos. No es inmediato, pero tampoco excesivamente laborioso. Como
siempre, el lector perezoso tiene a continuacion una tabla:

p 3 5 7 11 13 17 19
d 2 4 3 10 12 8 18

Encuentra el lector alguna relacion entre p y d? Fermat encontro una al


estudiar el problema: d | p 1. Esto es esencialmente el teorema de Fermat
que hemos probado en el captulo anterior. En efecto, hemos demostrado que
2p1 1 (mod p), y como 2n vale 1 en los multiplos de d, ha de ser d | p 1.
Tenemos que para que 211 1 sea divisible entre p es necesario que el d
correspondiente a p divida a 11, pero como d no puede ser 1 (esto es evidente),
ha de ser d = 11, y por el teorema de Fermat 11 | p 1. En resumen, para que
un primo p pueda dividir a 211 1 es necesario que sea de la forma p = 11m + 1.
Buscamos ahora los numeros de la forma 11m + 1 menores que 45. Podemos
ahorrarnos los valores impares de m porque dan numeros pares, que no pueden
ser primos. Resulta que solo hay un valor posible: 11 2 + 1 = 23. Acabamos
de probar que si 211 1 no es primo, entonces es divisible entre 23.
4.2. Primos de Fermat 137

Ahora calculamos modulo 23:


[2]5 = [32] = [9],
[2]10 = [9]2 = [9][3][3] = [27][3] = [4][3] = [12],
[2]11 = [24] = [1].

Luego resulta que, despues de todo, 211 1 no es primo. Concretamente factoriza


como 23 89.
En realidad hoy en da no se sabe si hay un numero finito o infinito de primos
de Mersenne. De todos modos los primos de Mersenne no terminan en el 27 1.
Vamos a probar con el siguiente candidato: 213 1 = 8.191. As veremos la
potencia de la tecnica que hemos desarrollado.
2
En primer lugar 213 1 < 214 = 27 = 1282 , luego nos basta buscar
posibles divisores primos menores que 128.
Supongamos que p | 213 1. Entonces modulo p se cumple que [2]13 = [1].
Si d es el menor natural no nulo tal que [2]d = [1] se cumple que d | 13, y por
el teorema de Fermat 13 | p 1. As pues p = 13n + 1. Mas aun, como n ha de
ser par necesariamente, p = 26n + 1.
Los valores de 26n + 1 menores que 128 son 27, 53, 79, 105. Solo hay dos
primos, lo que significa que si 213 1 no es primo entonces es divisible entre 53
o 79. Es facil ver que no es el caso. Tomamos clases modulo 53:

[2]6 = [64] = [11], [2]12 = [11]2 = [121] = [15], [2]13 = [30] 6= [1].

Y ahora modulo 79:


[2]6 = [64] = [15],
[2]12 = [15]2 = [15][5][3] = [75][3] = [4][3] = [12],
[2]13 = [24] 6= [1].

Con ayuda de ordenadores se ha podido ampliar la lista de primos de Mer-


senne. Los 15 primeros corresponden a los valores de p dados en la tabla 4.1.

Tabla 4.1: Primos p tales que 2p 1 es un primo de Mersenne

p 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1 279, . . .

Ejercicio: Probar que n 1 | nk 1, con lo que si k > 1 el numero nk 1 no puede


ser primo salvo si n = 2.

4.2 Primos de Fermat


En la seccion anterior hemos visto que un primo de Mersenne es un primo
de la forma 2n 1, lo cual obliga a que el exponente sea primo. Similarmente,
se define un primo de Fermat como un primo de la forma 2n + 1.
138 Captulo 4. Algunas aplicaciones

La tabla siguiente muestra que en este caso el exponente no necesita ser


primo:

n 1 2 3 4 5 6 7 8 9 10
2n + 1 3 5 9 17 33 65 129 257 513 1 025

Por el contrario, resultan primos los numeros correspondientes a los valores


n = 1, 2, 4, 8, . . . Fermat conjeturo basandose en esto que los primos que hoy
n
llevan su nombre son exactamente los numeros de la forma 22 + 1.
Ciertamente todo primo de Fermat es de esta forma: sea p = 2n +1 un primo
de Fermat. Segun hemos observado en la seccion anterior, existe un natural d
tal que p | 2k 1 si y solo si d | k, y hemos visto que d | p 1 = 2n , luego d
tiene que ser una potencia de 2.
u
Mas precisamente, si n = 2u v, con v impar, entonces 22 v 1 (mod p),
u+1
luego 22 v 1 (mod p). As, d | 2u+1 v y es potencia de 2, luego de hecho
e e1
d | 2u+1 . Sea, pues e u + 1 tal que [2]2 = [1] pero [2]2 6= 1. Como el
e1 e1
2
cuadrado de esta clase es [1], ha de ser [2] = [1] y as 2 + 1 | 22
n
+ 1.
e1
Puesto que 2e1 n, necesariamente 2n + 1 = 22 + 1 y n = 2e1 .
n
Queda por ver si todo numero de la forma 22 + 1 es primo. Volvamos a la
tabla y ampliemosla:

n 0 1 2 3 4 5
n
22 + 1 3 5 17 257 65 537 4 294 967 297

Ahora chocamos nuevamente con un problema computacional. No es facil


decidir si los numeros que aparecen son primos o no. De hecho el lector ha acep-
tado en la tabla anterior que el numero 257 es primo, lo que supone probar que
no es divisible entre primos menores o iguales que 13. Las tecnicas que hemos
empleado en la seccion anterior para estudiar la primalidad de los numeros de
Mersenne se pueden adaptar facilmente para estudiar los numeros de Fermat.
No obstante, conviene refinarlas ligeramente probando una version mas fuerte
del teorema de Fermat para las potencias de 2:

p1 p2 1
Teorema 4.1 Si p es un primo impar, entonces 2 2 (1) 8 (mod p).

Demostracion: Sea s = (p 1)/2. Entonces


Q Q Q Q
s! = 2k (2k + 1) = (1)2k 2k (1)2k+1 (2k 1)
1ks/2 0k s1
2
1ks/2 0k s1
2

Q Q Q
(1)n 2k (p 2k 1) (mod p)
1ns 1ks/2 0k s1
2

Ahora observamos que si 0 2k + 1 s, entonces s = p s < p 2k 1 p.


Notemos que la desigualdad estricta se debe a que para que fuera una igualdad s
4.2. Primos de Fermat 139

tendra que ser par, pero entonces 2k + 1 < s, luego p s < p 2k 1. As


pues, el ultimo producto recorre todos los numeros pares s < 2k p, luego
P
n Q Q
s! (1) 1ns
2k 2k (1)s(s+1)/2 2s s! (mod p)
1ks/2 s/2<ks

Claramente, s! 6= 0 en Z/pZ, luego podemos simplificarlo, y queda que


(1)s(s+1)/2 2s 1 (mod p),
2
lo cual equivale a que 2s (1)s(s+1)/2 = (1)(p 1)/8
(mod p).
En particular, si un primo p cumple p 1 (mod 8), no solo sabemos que
2p1 1 (mod p), que es lo que afirma el teorema de Fermat, sino algo ligera-
mente mas fuerte, a saber, que 2(p1)/2 1 (mod p). Vamos a sacarle partido
a este hecho:
Vamos a estudiar si el numero 65 537 es o no primo. Sabemos que se trata de
4
22 + 1. Supongamos que es divisible entre un primo p. Entonces, modulo p se
4 5
cumple que [2]2 = [1], y elevando al cuadrado [2]2 = [1]. Consecuentemente
el natural d que cumple 2k 1 (mod p) si y solo si d | k (que ya hemos visto
que es potencia de 2) tiene que ser d = 25 .
Por otra parte d | p 1, o sea, 25 | p 1 y por tanto p ha de ser de la
forma p = 32k + 1. Mas aun, como p 1 (mod 8), el teorema anterior nos da
que 2(p1)/2 1 (mod p), por lo que podemos afirmar, mas precisamente, que
25 = d | (p 1)/2, luego p = 64k + 1.
4 3
La raz cuadrada de 22 + 1 es apenas mayor que 22 = 256, luego si nuestro
numero no es primo tiene un divisor primo p < 256. Los primeros valores de la
sucesion 64k + 1 son:
65, 129, 193, 225, 257, . . .
y el unico primo en ella menor que 256 es 193. Por lo tanto, 65 537 sera primo
si y solo si no es divisible entre 193. Comprobar que esto es cierto no supone
ninguna dificultad, luego, en efecto, 65 537 es primo.
El siguiente posible primo de Fermat es muchsimo mayor. Si aplicamos el
5
mismo razonamiento concluimos que si 22 + 1 no es primo, entonces tiene un
divisor primo de la forma p = 128k + 1 y p < 65 536. Esto nos deja todava un
gran numero de candidatos. Los diez primeros son
129, 257, 385, 513, 641, 769, 897, 1 025, 1 153, 1 281, . . .
(los primos estan en negrita).
El primer primo es facil de descartar por su forma, ya que se trata de 28 + 1
5
y modulo 28 + 1 se cumple [22 + 1] = [28 ]4 + [1] = [1]4 + [1] = [2] 6= [0].
Respecto al siguiente, las potencias de 2 modulo 641 son las siguientes:
2, 4, 8, 16, 32, 64, 128, 256, 129, 258,
125, 250, 141, 282, 77, 154, 308, 25, 50, 100,
200, 400, 159, 318, 5, 10, 20, 40, 80, 160,
320, 1.
140 Captulo 4. Algunas aplicaciones

5 5
As pues, [22 + 1] = [0], es decir, 641 | 22 + 1 que no es, por tanto, primo.
Posiblemente as fue como Gauss llego a descubrir este hecho. Por supuesto una
5
calculadora nos da mas rapidamente que 22 + 1 = 641 6.700.417 (y el segundo
factor resulta ser primo).
Hoy en da no se conoce ningun otro primo de Fermat distinto de los cinco
que ya hemos encontrado, a saber:
3, 5, 17, 257, 65 537.

4.3 Ternas pitagoricas


Diofanto trato en su Aritmetica el problema de encontrar ternas de numeros
naturales no nulos x, y, z tales que x2 + y 2 = z 2 . Estas ternas se llaman ternas
pitagoricas, pues segun el teorema de Pitagoras permiten construir triangulos
rectangulos con lados enteros. Los egipcios las usaban para construir angulos
rectos en arquitectura. Entre los ejemplos mas conocidos estan 32 + 42 = 52 ,
52 + 122 = 132 , 72 + 242 = 252 . Como encontrarlas todas?
En primer lugar notamos que si (x, y, z) es una terna pitagorica, tambien lo
es (mx, my, mz) para cualquier numero m y, recprocamente, dada una terna
pitagorica (x, y, z), podemos dividir sus componentes por su m.c.d. para ob-
tener otra que cumpla ademas (x, y, z) = 1. Una terna cuyos elementos no
tengan divisores comunes se llama primitiva. Si encontramos un metodo para
hallar todas las ternas primitivas, las restantes se obtienen multiplicandolas por
numeros arbitrarios, luego el problema esta resuelto. Las ternas anteriores son
todas primitivas.
Ante todo notemos que un divisor primo de dos de las componentes de una
terna pitagorica, divide a la tercera. Por ejemplo, si p | x y p | z, entonces
p | z 2 x2 , con lo que p | y 2 y por lo tanto p | y. Esto significa que, en realidad,
las componentes de una terna pitagorica primitiva son primas entre s dos a dos.
En particular no puede haber mas de una componente par. Un numero es par o
impar si y solo si lo es su cuadrado, y la suma y la diferencia de numeros impares
es par. Como consecuencia si dos de las componentes son impares, la restante
ha de ser par, es decir, en una terna primitiva hay siempre dos componentes
impares y una par.
Ahora veamos que z ha de ser impar. En otro caso lo son x e y, es decir,
x = 2m + 1, y = 2n + 1, luego x2 = 4m2 + 4m + 1, y 2 = 4n2 + 4n + 1. Al tomar
clases modulo 4 resulta que [z]2 = [x]2 + [y]2 = [1] + [1] = [2]. Sin embargo
ninguna clase modulo 4 tiene a [2] por cuadrado: [0]2 = [0], [1]2 = [1], [2]2 = [0],
[3]2 = [1].
Como la situacion de x e y es simetrica, podemos suponer que x es par e y
impar. Segun lo visto z es tambien impar. Consecuentemente z + y, z y son
ambos pares. Digamos que x = 2u, z + y = 2v, z y = 2w.
Ahora x2 = z 2 y 2 = (z + y)(z y), luego u2 = vw, v > 0, w > 0.
Por otro lado (v, w) = 1, ya que si un primo p divide a ambos, entonces
1 1 1
p | (v + w) = (z + y) + (z y) = 2z = z,
2 2 2
4.3. Ternas pitagoricas 141

Tabla 4.2: Ternas pitagoricas

p q x y z
2 1 4 3 5
3 2 12 5 13
4 1 8 15 17
4 3 24 7 25
5 2 20 21 29
5 4 40 9 41
6 1 12 35 37
6 5 60 11 61
7 2 28 45 53
7 4 56 33 65
7 6 84 13 85

1 1
p | (v w) = (z + y) (z y) = y,
2 2

y como (y, z) = 1, esto es contradictorio.


Por la factorizacion unica, es claro que si vw = u2 con (v, w) = 1, v > 0,
w > 0, entonces tanto v como w han de ser cuadrados (cada uno ha de contener
cada primo un numero par de veces porque as le ocurre a u). Pongamos v = p2
y w = q 2 . Obviamente (p, q) = 1.
As tenemos que z = v + w = p2 + q 2 , y = v w = p2 q 2 . En particular
q < p.
Como z e y son impares, p y q deben tener paridad opuesta. Sustituyendo
en las formulas anteriores queda

x2 = z 2 y 2 = p4 + 2p2 q 2 + q 4 p4 + 2p2 q 2 q 4 = 4p2 q 2 = (2pq)2 ,

luego x = 2pq.
En consecuencia la terna original queda de la forma

(x, y, z) = (2pq, p2 q 2 , p2 + q 2 ),

donde p, q son numeros naturales primos entre s, q < p y de paridad opuesta.


Recprocamente, es facil comprobar que cualquier terna en estas condiciones
es una terna pitagorica primitiva. Por lo tanto ya sabemos enumerarlas todas.
La tabla 4.3 contiene las correspondientes a los valores de p 7.
En una tablilla cuneiforme aproximadamente del ano 1.500 a.C. se ha en-
contrado una enumeracion de ternas pitagoricas, entre las cuales se encontraba
(4.961, 6.480, 8.161). Se obtiene con p = 81 y q = 40.

Ejercicio: Comprobar que toda terna pitagorica contiene un multiplo de 3, un


multiplo de 4 y un multiplo de 5.
142 Captulo 4. Algunas aplicaciones

4.4 Sumas de cuadrados


Una pregunta relacionada con el problema anterior es: que numeros natu-
rales pueden expresarse como suma de dos cuadrados? Antes de teorizar sobre
ellos echemos una ojeada a las sumas de los primeros diez cuadrados, que se
muestran en la tabla siguiente. Los primos estan en negrita.
Para interpretar la tabla pensemos un poco que debemos buscar en ella.
Notemos que si z = x2 + y 2 entonces para todo natural n se cumple tambien
n2 z = (nx)2 + (ny)2 , es decir, que si multiplicamos una suma de cuadrados por
un cuadrado, obtenemos otra suma de cuadrados. Se dice que un numero n
es libre de cuadrados si todos los primos que lo dividen tienen multiplicidad 1.
Todo numero n puede expresarse de forma unica como producto de un cuadrado
perfecto y de un numero libre de cuadrados. Basta agrupar por un lado todos
los pares de primos que lo dividen y por otro los primos que queden sin pareja.
Lo que decamos hace un momento es que si la parte libre de cuadrados de
un numero natural n es suma de dos cuadrados, entonces n tambien lo es. Lo
primero que podemos observar en la tabla es que se cumple el recproco, es decir,
la parte libre de cuadrados de todos los numeros de la tabla esta tambien en la
tabla. Por ejemplo: la parte libre de cuadrados de 117 es 13. Esto nos lleva a
nuestra primera conjetura: Un numero es suma de dos cuadrados si y solo si lo
es su parte libre de cuadrados.

0 1 4 9 16 25 36 49 64 81 100
2 5 10 17 26 37 50 65 82 101
8 13 20 29 40 53 68 85 104
18 25 34 45 58 73 90 109
32 41 52 65 80 97 116
50 61 74 89 106 125
72 85 100 117 136
98 113 130 149
128 145 164
162 181
200

Ahora quedemonos tan solo con los numeros de nuestra lista que son libres
de cuadrados, es decir:

0, 1, 2, 5, 10, 13, 17, 26, 29, 34, 37, 41, 53, 58,

61, 65, 73, 74, 82, 85, 89, 97, 101, 106, 109, 113.
Esta lista contiene todos los numeros libres de cuadrados menores que 121 (el
primer numero que falta en la tabla) que pueden expresarse como suma de dos
cuadrados.
Vemos que no estan todos los primos, pero los primos que aparecen en los
compuestos estan tambien en la lista: 10 = 2 5, 26 = 2 13, 34 = 2 17,
58 = 2 29, 65 = 5 13, 74 = 2 37, 82 = 2 41, 85 = 5 17, 106 = 2 53.
4.4. Sumas de cuadrados 143

La conjetura es, pues, que un numero libre de cuadrados es suma de dos


cuadrados si y solo si lo son los primos que lo componen. Respecto a los primos
que son suma de dos cuadrados nos quedan los siguientes

2, 5, 13, 17, 29, 37, 41, 53, 61, 73, 89, 97, 101, 109, 113.

Si el lector no conjetura nada a simple vista, no cuesta mucho encontrar una


condicion que han de cumplir. Si un primo impar es de la forma p = x2 + y 2 ,
entonces x e y han de tener paridades opuestas, digamos x = 2u, y = 2v + 1.
Como consecuencia resulta que p = 4u2 + 4v 2 + 4v + 1, es decir, p = 4m + 1. Si
el lector calcula los primeros primos de la forma 4n + 1 obtendra precisamente
la lista anterior (sin el 2, claro).
Sospechamos entonces que un primo impar es suma de dos cuadrados si y
solo si es congruente con 1 modulo 4. La conjetura general sera entonces que un
numero es suma de dos cuadrados si y solo si los primos impares que lo dividen
con multiplicidad impar son congruentes con 1 modulo 4. Vamos a probar que
la conjetura es exacta. De hecho, vamos a ver que estos hechos que estamos
observando son reflejos en Z de la aritmetica de los enteros de Gauss Z[i].

En efecto, en el captulo anterior hemos visto que tenemos definida la norma


N Z[i] N dada por N (a + bi) = a2 + b2 . Por lo tanto, un numero natural
:
es suma de dos cuadrados si y solo si existe un u Z[i] tal que N(u) = n.
Sabemos que Z[i] es un dominio de factorizacion unica. Notemos que

a + bi | (a + bi)(a bi) = N(a + bi),

es decir, todo entero de Gauss divide a su norma.

Si es un primo de Gauss, entonces | N() y N() es un numero natural


que se descompone en producto de primos en Z, luego ha de dividir a uno de
esos primos. Es decir, existe un primo p tal que | p, luego N() | p2 , luego
N() = p o N() = p2 . As pues, hay dos clases de primos de Gauss: los de
norma prima p y los de norma p2 .

Fijemonos en primer lugar en los primos tales que N() = p2 . Sabemos


que | p, digamos p = , para cierto Z[i]. Tomando normas, p2 = p2 N(),
luego es una unidad, y por consiguiente es asociado a p. En otras palabras,
los primos de norma p2 son los de la forma p y pi, los asociados de p. Si p es
primo de Gauss, entonces no es suma de dos cuadrados, pues si p = N(), para
cierto Z[i], entonces | N() = p, pero p es primo (y no es una unidad),
luego es asociado a p y, por consiguiente, su norma es p2 , no p. Por otra parte,
si es un primo de Gauss de norma p, entonces sabemos que p es suma de dos
cuadrados. Resumimos lo que hemos obtenido:

Para todo primo p en Z, se cumple que p es suma de dos cuadrados


si y solo si es la norma de un primo de Gauss y no es suma de dos
cuadrados si y solo si p es un primo de Gauss.
144 Captulo 4. Algunas aplicaciones

De aqu se sigue la mayor parte de nuestras conjeturas: un numero n es suma


de dos cuadrados si y solo si existe un entero de Gauss u tal que N(u) = n. Si
descomponemos u = 1 r en producto de primos queda n = N(1 ) N(r ).
Ahora es obvio que si un primo p divide a n con exponente impar, uno de los
factores N (i ) ha de ser igual a p (si solo hubiera del tipo p2 el exponente en n
sera par), luego p es suma de dos cuadrados. Recprocamente, si los primos que
dividen a n con exponente impar son suma de dos cuadrados, podemos formar
un entero de Gauss u de norma n (multiplicando primos de Gauss de norma p
si el exponente de p en n es impar y primos naturales p si el exponente es par).
En resumen: un numero natural es suma de dos cuadrados si y solo si los
primos que lo dividen con exponente impar son sumas de dos cuadrados.
Teniendo en cuenta que la parte libre de cuadrados de un numero es el
producto de los primos que lo dividen con exponente impar, esto implica todo
lo que habamos conjeturado excepto una cosa: que los primos que son suma de
dos cuadrados son 2 y los congruentes con 1 modulo 4. Puesto que obviamente
2 = 12 + 12 , lo unico que falta por probar es que un primo impar p es suma de
dos cuadrados si y solo si p 1 (mod 4).
Una implicacion es trivial: Si p = x2 + y 2 , basta observar que, en Z/4Z, los
unicos cuadrados son 0 y 1, luego p 0, 1, 2 (mod 4), pero descartamos el 0 y
el 2 porque entonces p sera par, y as queda que p 1 (mod 4).
Supongamos ahora que p 1 (mod 4) y vamos a probar que p no es primo
en Z[i], pues eso ya implica que p es suma de dos cuadrados. A su vez, para
ello basta probar que existe un n Z tal que 1 n2 (mod p). En efecto, en
tal caso p | n2 + 1 = (n + i)(n i), pero claramente p n i en Z[i], luego p no
puede ser primo.
En otros terminos, hemos de probar que 1 tiene raz cuadrada en Z/pZ.
Para ello consideramos el polinomio x(p1)/2 1, entre cuyas races estan todos
los cuadrados no nulos de Z/pZ (por el teorema de Fermat 3.42). Por otra
parte, en Z/pZ hay (p 1)/2 cuadrados no nulos (x2 = y 2 si y solo si y = x, y
x 6= x). Como un polinomio tiene a lo sumo tantas races en un cuerpo como
indica su grado, concluimos que las races de x(p1)/2 1 son exactamente los
elementos con raz cuadrada. Ciertamente, si p 1 (mod 4) tenemos que 1 es
una de dichas races.
Con lo visto podemos comprender la utilidad de los conceptos algebraicos
tales como el anillo de enteros de Gauss. Es posible demostrar estos resultados
sin recurrir a ellos, pero las pruebas son mas tecnicas y laboriosas. La prueba
que hemos dado no requiere apenas calculos, es por lo tanto mas facil de recordar
y explica realmente por que la propiedad de ser suma de dos cuadrados depende
solo de la parte libre de cuadrados. En muchos casos, las tecnicas algebraicas
permiten llegar a resultados que seran imposibles mediante meros calculos. Mas
adelante veremos mas ejemplos.
No estamos en condiciones de estudiar que numeros pueden expresarse como
suma de tres cuadrados (aunque el lector podra conjeturar facilmente cuales
son), pero vamos a demostrar un importante resultado debido a Lagrange:
4.4. Sumas de cuadrados 145

Teorema 4.2 Todo numero natural es suma de cuatro cuadrados.


Demostracion: En primer lugar observamos que el producto de dos nume-
ros naturales expresables como suma de cuatro cuadrados es tambien suma de
cuatro cuadrados. Esto puede probarse comprobando directamente la identidad
siguiente:
(x2 + y 2 + z 2 + w2 )(x2 + y 2 + z 2 + w2 )
= (xx yy zz ww )2 + (xy + yx + zw wz )2
+(xz + zx + wy yw )2 + (xw + wx + yz zy )2 ,
pero conviene tener presente que esta formula no es el producto de una gran
inspiracion, sino que surge de forma natural al considerar los anillos de cuater-
nios.1
Como consecuencia basta demostrar que todo numero primo es expresable
como suma de cuatro cuadrados.
Por razones tecnicas vamos a necesitar la variante que resulta de sustituir x
por x en la formula anterior:
(x2 + y 2 + z 2 + w2 )(x2 + y 2 + z 2 + w2 )
= (xx yy zz ww )2 + (xy yx + zw wz )2
+(xz zx + wy yw )2 + (xw wx + yz zy )2 . (4.3)
Como 2 = 12 + 12 + 02 + 02 , basta probar que todo primo impar p es suma
de cuatro cuadrados.
Los numeros x2 con 0 x 21 (p 1) son incongruentes modulo p, e igual-
mente ocurre con 1 y 2 con 0 y 21 (p 1).
Como en total son p + 1, existen x, y en estas condiciones tales que
x2 1 y 2 (mod p).
Equivalentemente, existe un natural m tal que
 1 2
mp = x2 + y 2 + 1 < 1 + 2 p < p2 ,
2
luego 0 < m < p.
Sea r el menor natural no nulo tal que existen numeros enteros x, y, z, w
que cumplan rp = x2 + y 2 + z 2 + w2 . Como m cumple esto, sera r m < p.
Necesariamente r es impar, pues si fuera par, 0, 2 o 4 de los x, y, z, w seran
pares y, reordenandolos, podramos exigir que x + y, x y, z + w y z w fueran
pares. Entonces
1 1 2 1 2 1 2 1 2
rp = (x + y) + (x y) + (z + w) + (z w) ,
2 2 2 2 2
1 Vease el final de la seccion 5.3 de [G], los cuatro cuadrados que aparecen en el segundo

miembro son las coordenadas del producto de cuaternios


(x + yi + zj + wk)(x + y i + z j + w k).
146 Captulo 4. Algunas aplicaciones

en contradiccion con la minimalidad de r.

Nuestro objetivo es probar que r = 1. Supongamos que r > 1.


Sean x , y , z , w los restos modulo r de x, y, z, w entre r/2 y r/2 (es
posible ya que r es impar).
Claramente n = x2 + y 2 + z 2 + w2 x2 + y 2 + z 2 + w2 = rp 0 (mod r),
pero n > 0, pues en otro caso x = y = z = w = 0, r dividira x, y, z, w, luego
r2 | x2 + y 2 + z 2 + w2 = rp, de donde r | p y en consecuencia r = 1, contra lo
supuesto. Tambien es claro que n < 4( 12 r)2 = r2 .
Sea 0 < k < r tal que n = kr. Por la identidad (4.3), krpr = z12 +z22 +z32 +z42
para ciertos naturales z1 , z2 , z3 , z4 y, teniendo en cuenta como se obtienen a
partir de x, y, z, w, x , y , z , w , es claro que los cuatro son multiplos de r (por
ejemplo z1 = xx yy zz ww x2 y 2 z 2 w2 = rp 0 (mod r)).
As pues zi = rti y por tanto r2 kp = r2 t21 + r2 t22 + r2 t23 + r2 t24 , con lo que
kp = t21 + t22 + t23 + t24 , en contra de la minimalidad de r.

4.5 El Ultimo Teorema de Fermat


Pierre de Fermat fue un eminente matematico que realizo grandes descubri-
mientos en teora de numeros, pero, de acuerdo con las costumbres de su epoca,
jamas publico nada, y su trabajo es conocido por la correspondencia que man-
tuvo con otros matematicos, as como por la publicacion postuma de sus obras,
llevada a cabo por su hijo Samuel. Entre las notas as publicadas se encontraban
ciertas anotaciones en los margenes de una edicion de la Aritmetica de Diofanto,
una de las cuales, situada junto al punto en el que Diofanto encuentra las ternas
pitagoricas, afirma que mientras que ciertamente existen numeros enteros
que satisfacen la ecuacion x2 + y 2 = z 2 , el resultado es falso para exponentes
mayores que dos, es decir, que la ecuacion xn + y n = z n no tiene soluciones
positivas para n > 2. Fermat afirma tener una maravillosa demostracion de
este hecho, pero que no cabe en el margen del libro. Indudablemente Fermat
debio de cometer un error, pues solo recientemente se ha encontrado una com-
pleja prueba basada en potentes tecnicas algebraicas de las que Fermat distaba
mucho de disponer.
La afirmacion:

La ecuacion xn + y n = z n no tiene soluciones enteras positivas para


exponentes n > 2.

se conoce con el nombre de Ultimo Teorema de Fermat, aunque, segun lo dicho,


es practicamente seguro que Fermat nunca lo demostro ni tampoco fue su ultima
conjetura, ni mucho menos.
Aqu vamos a resolver algunos casos particulares del Ultimo Teorema de
Fermat y daremos algunas indicaciones del camino que permite obtener mas re-
sultados sobre el. El caso mas simple, dado el estudio sobre las ternas pitagoricas
que hemos llevado a cabo, es el caso n = 4.
4.5. El Ultimo Teorema de Fermat 147

Teorema 4.3 La ecuacion, x4 + y 4 = z 2 no tiene soluciones enteras positivas.


En particular el Ultimo Teorema de Fermat es cierto para n = 4.
Demostracion: Si existen soluciones positivas de la ecuacion x4 + y 4 = z 2 ,
entonces (x2 , y 2 , z) es una terna pitagorica. Notemos que si un primo p divide a
x, y, z entonces p2 | z y (x/p, y/p, z/p2) sigue cumpliendo la ecuacion. Aplicando
esto un numero finito de veces podemos suponer que (x, y, z) = 1, y claramente
esto implica que en realidad son primos entre s dos a dos y que la terna (x2 , y 2 , z)
es primitiva.
Segun la clasificacion de las ternas pitagoricas, x2 = 2pq, y 2 = p2 q 2 ,
z = p2 + q 2 , donde p y q son numeros enteros primos entre s, de distinta
paridad y p > q > 0 (intercambiamos x con y si es necesario para que x2 sea el
par).
Ahora, p2 = y 2 + q 2 , luego (q, y, p) es otra terna pitagorica, lo que obliga a
que p sea impar, luego q ha de ser par, y as q = 2ab, y = a2 b2 , p = a2 +b2 , para
ciertos enteros a y b primos entre s, de paridad opuesta, a > b > 0 (notemos
que se trata de una terna primitiva porque (p, q) = 1).
Por lo tanto x2 = 4ab(a2 + b2 ) y en consecuencia ab(a2 + b2 ) = (x/2)2 . Por
otra parte (a, b) = 1 implica facilmente que (ab, a2 + b2 ) = 1.
Ahora usamos un argumento muy simple pero importante: si el producto
de dos numeros naturales primos entre s es un cuadrado, entonces ambos son
cuadrados, pues cada uno de ellos debe tener cada factor primo con exponente
par.
Concluimos que ab y a2 + b2 son cuadrados y, por el mismo argumento,
tambien lo son a y b. Digamos a = u2 , b = v 2 , a2 + b2 = w2 . Entonces
u 4 + v 4 = a2 + b 2 = w 2 = p < p 2 + q 2 = z < z 2 .
En resumen, si existe una terna de numeros positivos (x, y, z) que satisfaga
la ecuacion x4 + y 4 = z 2 , existe otra (u, v, w) que cumple lo mismo pero con
w2 < z 2 . Si existieran tales ternas debera haber una con z mnimo, lo cual es
falso segun lo visto, por lo que la ecuacion no tiene solucion.
Es importante notar que el teorema anterior no solo prueba el Ultimo Teo-
rema de Fermat para n = 4, sino en general para n = 4k. En efecto, si existieran
numeros positivos (x, y, z) tales que x4k + y 4k = z 4k , entonces (xk , y k , z k ) sera
una solucion a la ecuacion x4 + y 4 = z 4 , lo cual es imposible. En particular el
Ultimo Teorema de Fermat es cierto para las potencias de dos.
De aqu se sigue ahora que si el Ultimo teorema de Fermat es cierto para
exponentes primos impares, entonces es cierto para todo exponente. En efecto,
si existen soluciones positivas a una ecuacion xn + y n = z n , entonces n no puede
ser potencia de 2, luego existe un primo impar p tal que p | n, o sea, n = pk,
para cierto entero k, luego (xk , y k , z k ) es una solucion positiva a la ecuacion
xp + y p = z p .
Observemos tambien que si p es impar el Ultimo Teorema de Fermat equivale
a la no existencia de soluciones enteras no triviales (o sea, con xyz 6= 0) de la
ecuacion
xp + y p + z p = 0,
148 Captulo 4. Algunas aplicaciones

lo que muestra que en realidad el papel de las tres variables es simetrico. Esto
simplifica algunos argumentos.
Terminaremos esta seccion demostrando el Ultimo Teorema de Fermat para
el exponente p = 3. Para ello necesitamos estudiar un poco mas la aritmetica
del anillo Z[] de los enteros ciclotomicos de orden 3, que hemos introducido al
final del captulo anterior. Recordemos que sus elementos se expresan de forma
unica como a + b, con a, b Z, donde 3 = 1 y, mas concretamente, satisface
la relacion 2 + + 1 = 0.
Sabemos que Z[] tiene seis unidades: 1, , 2 , y que = 1 es
primo y divide a 3, cuya factorizacion es 3 = 2 2 .
Mas en general, si restamos dos de las unidades 1, , 2 obtenemos un
asociado de :

1 = , 2 1 = 2 , 2 = .

En cambio, si las sumamos, obtenemos una unidad:

1 + = 2 , 1 + 2 = , + 2 = 1.

Si sumamos una consigo misma obtenemos un asociado del primo 2:

1 + 1 = 2, + = 2, 2 + 2 = 2 2 .

De aqu concluimos la primera de las propiedades siguientes:

Si dos unidades cumplen 1 2 (mod 3), tiene que ser 1 = 2 , puesto


que la diferencia solo puede ser divisible entre 2 o entre salvo que sean
la misma.

Si = a + b, se cumple que | si y solo si 3 | a + b.


En efecto, obviamente 1 (mod ), luego a + b a + b (mod ). Por
lo tanto, si | , tenemos que | a + b, luego 3 = N() | (a + b)2 , luego
3 | a + b. Recprocamente, si 3 | a + b, entonces | a + b, luego | .

Si , entonces existe una unidad tal que (mod 3).


Como 3 a + b, tiene que darse uno de los casos siguientes, con e = 1:

(a, b) = (3h + e, 3k), (3h, 3k + e), (3h + e, 3k + e),

luego e (mod 3), e (mod 3), e(1 + ) (mod 3), respectiva-


mente, y en cualquier caso (mod 3), para una cierta unidad .

Si , entonces 3 1 (mod 9).


Por la propiedad precedente sabemos que = 3 + , luego

3 = (3 + )3 3 = 1 (mod 9).
4.5. El Ultimo Teorema de Fermat 149

Ahora mostramos la conexion entre la ecuacion de Fermat y los enteros


ciclotomicos. Observemos que 1, y 2 son races distintas en el cuerpo
Q() del polinomio t3 + 1, luego son todas sus races, y podemos factorizar:

t3 + 1 = (t + 1)(t + )(t + 2 ).

En particular, si , Z[] y 6= 0, sustituyendo t = / y multiplicando por


3 queda
3 + 3 = ( + )( + )( + 2 ),
que vale igualmente si = 0. Si multiplicamos el segundo factor por y el
tercero por 2 en total hemos multiplicado por 3 = 1, luego la igualdad sigue
siendo valida, pero pasa a tener la forma

3 + 3 = ( + )( + 2 )( 2 + ). (4.4)

Esta segunda factorizacion tiene la propiedad adicional de que

+ + + 2 + 2 + = 0.

Con esto ya podemos probar:

Teorema 4.4 La ecuacion x3 + y 3 + z 3 = 0 no tiene soluciones no triviales (es


decir, con todas las variables no nulas) en Z[], en particular en Z.

Demostracion: Supongamos que la ecuacion tiene una solucion no trivial


3 + 3 + 3 = 0. Entonces existe una solucion primitiva, es decir, una solucion
no trivial tal que , y sean primos entre s dos a dos, pues si un primo
divide a dos de ellos, la ecuacion hace que divida al tercero, luego /, /, /
son tambien una solucion no trivial de la ecuacion, y repitiendo este proceso un
numero finito de veces tenemos que llegar a una solucion primitiva.
Observemos ahora que tiene que dividir a uno de los numeros , , (y
solo a uno, porque la solucion es primitiva). En efecto, si no divide a ninguno
de ellos, hemos visto que

3 e1 (mod 9), 3 e2 (mod 9), 3 e3 (mod 9),

donde ei = 1. Pero entonces2 e1 + e2 + e3 0 (mod 9), lo cual es imposible.


Llamaremos coordenada especial de una solucion primitiva (, , ) a la que
es divisible entre . Si la ecuacion tiene solucion, debera haber una solucion
primitiva en la que el exponente de en la coordenada especial fuera el menor
numero natural posible (no nulo). Sin embargo, vamos a probar que a partir de
cualquier solucion primitiva se puede encontrar otra tal que el exponente de
en la coordenada especial sea menor, con lo que tendremos una contradiccion.
2 En principio, esta congruencia es en Z[], pero notemos en general, que m, n, r Z

cumplen m n (mod r) en Z[] si y solo si lo cumplen en Z, ya que si m n = (a + b)r,


igualando coordenadas tiene que ser br = 0, luego la congruencia se cumple en Z.
150 Captulo 4. Algunas aplicaciones

Dada la simetra, no perdemos generalidad si suponemos que | . Entonces


3 | 3 y la ecuacion nos da que 3 | 3 + 3 . Como no divide a ni a ,
sabemos que 3 e (mod 9), 3 f (mod 9), donde e = 1, f = 1.
Como 2 | 3, en particular 3 | 9, luego las congruencias anteriores valen
tambien modulo 3 , y por consiguiente
e + f 3 + 3 0 (mod 3 ).
En particular, 3 | e + f y esto solo es posible si e + f = 0 (pues la suma solo
puede ser 0, 2 o 2). Por lo tanto,
3 = 3 + 3 e + f = 0 (mod 9).
As pues, 4 | 3 , por lo que 2 | .
En definitiva, con esto hemos demostrado que la coordenada especial debe
ser divisible entre , no una, sino al menos dos veces.
Ahora consideramos la factorizacion de 3 = 3 + 3 dada por (4.4).
Llamemos
1 = + , 2 = + 2 , 3 = 2 + ,
de modo que 3 = 1 2 3 y 1 + 2 + 3 = 0.
Observamos que 1 2 3 (mod ), pues los tres son congruentes con
+ . Como 3 | 1 2 3 , en principio divide a uno de los tres, pero como son
congruentes, | i para los tres valores i = 1, 2, 3.
Sea i = i / y vamos a probar que 1 , 2 y 3 son primos entre s dos a dos.
En efecto, si un primo divide a dos de ellos, por ejemplo a 1 y 2 , entonces
| 1 y | 2 , luego
| 2 2 1 = ( 2 ) = , | 2 1 = ( 2 ) = ,
luego | y | , cuando y son primos entre s. Igualmente llegamos a
una contradiccion si suponemos que 1 y 3 o 2 y 3 no son primos entre s.
Tenemos, pues, que 3 = 3 1 2 3 y 1 + 2 + 3 = 0. Sea = /, que
sigue cumpliendo | , pues hemos visto que divide al menos dos veces a .
Entonces 3 = 1 2 3 y ahora razonamos como sigue: cada primo aparece
con exponente multiplo de 3 en el miembro izquierdo de esta ecuacion, luego
tambien en el miembro derecho, pero como los tres factores no tienen primos en
comun, podemos afirmar que cada primo aparece con exponente multiplo de 3
en cada uno de ellos, es decir, que, para i = 1, 2, 3, se cumple que i = i i3 ,
para ciertos i Z[] y ciertas unidades i . As pues,
3 = 1 2 3 13 23 33 , 1 13 + 2 23 + 3 33 = 0,
y los i son primos entre s dos a dos porque lo eran los i .
Mas aun, = 1 2 3 , para cierta unidad tal que 3 = 1 2 3 . Pero
toda unidad elevada al cubo da 1, luego e = 1 2 3 = 1. Como | ,
tenemos que divide a un i , y solo a uno, porque son primos entre s dos a
dos. Recapitulemos lo que tenemos hasta aqu:
4.5. El Ultimo Teorema de Fermat 151

Hemos encontrado una ecuacion


1 13 + 2 23 + 3 33 = 0 (4.5)
en la que los i son primos entre s dos a dos y uno de ellos es divisible entre
, los i son unidades y e = 1 2 3 = 1, y mas aun, si | i , entonces su
exponente cumple
1 1 1
v (i ) = v (i ) = (v (i ) 1) < (v (1 ) + v (2 ) + v (3 )) = v ().
3 3 3
Solo falta ver que podemos eliminar las unidades de (4.5) para obtener una
nueva solucion primitiva en la que el exponente de en la coordenada especial
sea menor que el de partida. En lo que queda de la prueba solo nos vamos a
apoyar en estos hechos, luego por simetra podemos suponer que | 3 .
Entonces 13 e (mod 9) y 23 f (mod 9), para ciertos e = 1, f = 1.
Como | 3 , en particular 3 | 33 , luego (4.5) nos da que
e1 + f 2 1 13 + 2 23 3 33 0 (mod 3).
Segun hemos visto en las observaciones previas a este teorema, esto implica
que e1 + f 2 = 0, luego 1 = 2 , luego e = 21 3 . Por consiguiente, si
multiplicamos (4.5) por 21 obtenemos
31 13 + 31 23 + e33 = 0
y, teniendo en cuenta que e = 1 = e3 , esto equivale a
(1 1 )3 + (1 2 )3 + (e3 )3 = 0,
luego llamando = 1 1 , = 1 2 , = e3 , vemos que se trata de una
solucion primitiva de la ecuacion de Fermat con 0 < v ( ) < v () y tenemos
la contradiccion que buscabamos.

Enteros ciclotomicos Uno de los ingredientes centrales de la prueba del


teorema 4.4 ha sido la factorizacion (4.4) de la suma 3 + 3 . La primera
demostracion de este teorema se debe a Euler, quien uso la factorizacion parcial:
x3 + y 3 = (x + y)(x2 xy + y 2 )
que podemos conseguir sin introducir numeros imaginarios. El caso p = 5
fue demostrado independientemente por Dirichlet y Legendre mediante tecnicas
similares, considerando la factorizacion
x5 + y 5 = (x + y)(x4 x3 y + x2 y 2 xy 3 + y 4 ).
Sin embargo, el hecho de que el segundo factor fuera cada vez mas complicado
haca que los argumentos se volvieran cada vez mas enrevesados. Los casos
superiores se vuelven practicamente intratables debido a que la complejidad
aumenta desmesuradamente. Dirichlet intento probar el caso p = 7, pero solo
consiguio una prueba para exponente 14.
152 Captulo 4. Algunas aplicaciones

Fue Kummer quien, basandose en ideas de Lame, obtuvo una prueba del
teorema de Fermat para una amplia clase de primos. No estamos en condi-
ciones de abordar la teora de Kummer, pero podemos indicar que uno de sus
ingredientes es factorizar completamente el polinomio xp + y p tal y como hemos
hecho en el caso p = 3. Concretamente, tenemos la factorizacion

xp 1 = (x 1)(xp1 + + x + 1),

y vimos en el captulo anterior que el factor p(x) = xp1 + + x + 1 es


irreducible. El teorema 3.49 nos da que existe un cuerpo Q[] en el que p(x)
tiene una raz . Concretamente

Q[] = {ap2 p2 + + a1 + ao | ap2 , . . . , a0 Q},

y ademas la expresion de cada elemento es unica. Por razones que veremos mas
adelante a este cuerpo se le llama cuerpo ciclotomico pesimo.
Como p() = 0 y p(x) | xp 1, resulta que p 1 = 0, o sea, p = 1 y,
obviamente, 6= 1.
No puede ocurrir que n = 1 para 0 < n < p, pues entonces, tomando el
mnimo n que cumple esto, p = nc + r con 0 < r < p (p es primo), y entonces
p = ( n )c r = r 6= 1, contradiccion. Esto significa que las potencias 1 = 0 ,
, 2 , . . . , p1 , son distintas dos a dos, pues si i = j , entonces ij = 1.
Ademas todas cumplen ( i )p = 1, luego son las p races del polinomio xp 1,
o sea, xp 1 = (x 1)(x ) (x p1 ).
Sustituyendo x = x/y y multiplicando por y p obtenemos la factorizacion

xp + y p = (x + y)(x + y) (x + p1 y).

Esta factorizacion en polinomios de grado 1 es la mas simple posible, y es la


clave para obtener pruebas del teorema de Fermat para numerosos valores de p.
Para ello es necesario estudiar el cuerpo Q[] as como el anillo de los llamados
enteros ciclotomicos:

Z[] = {ap2 p2 + + a1 + a0 | ap2 , . . . , a0 Z}.

Kummer demostro que si este anillo es DFU entonces se cumple el Ultimo


Teorema de Fermat para exponente p, y luego generalizo el argumento sustitu-
yendo la hipotesis por otra mucho mas debil.
Como la relacion p = 1 es mas sencilla de manejar que la relacion

p1 + + + 1 = 0, (4.6)

resulta conveniente trabajar con los elementos de Q[] en la forma

ap1 p1 + + a1 + a0 (4.7)

(de modo que, al operar, simplemente reducimos las potencias p que puedan
aparecer).
4.5. El Ultimo Teorema de Fermat 153

El unico inconveniente es que la expresion ya no es unica. Si tenemos

ap1 p1 + + a1 + a0 = 0,

usando la relacion (4.6) tenemos que

ap1 p1 + + a1 + a0 ap1 ( p1 + + + 1) = 0,

o sea,

(ap2 ap1 ) p2 + + (a1 ap1 ) + (a0 ap1 ) = 0,

y por la unicidad
ap1 = ap2 = = a1 = a0 .
De aqu se sigue en general que

ap1 p1 + + a1 + a0 = bp1 p1 + + b1 + b0

si y solo si (restando los dos miembros)

ap1 bp1 = ap2 bp2 = = a1 b1 = a0 b0 ,

o en otras palabras, si existe un numero racional c tal que ai = bi + c, para todo


i = 0, . . . , p 1. Equivalentemente, los coeficientes de una expresion (4.7) estan
unvocamente determinados salvo suma de un numero racional (o de un numero
entero si el elemento esta en Z[]).
En los proximos captulos iremos aplicando a estos anillos los resultados
que vayamos obteniendo. En 11.20 probaremos un resultado general que, en
particular, nos dara que el teorema de Fermat es cierto tambien para p = 5.
Captulo V

Modulos y espacios
vectoriales

Consideremos el anillo de enteros ciclotomicos Z[] para p = 5, que esta


formado por elementos de la forma a + b + c 2 + d 3 , donde a, b, c, d Z.
Puede probarse que es un DFU, pero la prueba es complicada. Eso nos asegura
que todo entero ciclotomico se expresa en la forma 1e1 rer , para ciertos
primos ciclotomicos i no asociados dos a dos y cierta unidad . Sin embargo,
determinar cuales son los primos ciclotomicos no es inmediato, ni tampoco lo es
determinar cuales son las unidades ciclotomicas y cuales son sus caractersticas
algebraicas.
Frente a estas dificultades, tenemos un resultado sencillo sobre la forma que
tiene un entero ciclotomico arbitrario, y es que cada uno de ellos se expresa de
forma unica como suma de los elementos 1, , 2, 3 multiplicados por enteros.
Esta representacion esta en la base de todo estudio que podamos hacer sobre
estos anillos, y ahora vamos a introducir una estructura algebraica mas debil
que la de anillo que permite formular resultados de este tipo en contextos muy
generales. La idea basica particularizada a este ejemplo concreto consiste en
prescindir del producto en general entre dos enteros ciclotomicos cualesquiera y
considerar unicamente productos entre enteros ordinarios y enteros ciclotomicos.
Sucede entonces que el hecho de que Z Z[] resulta irrelevante, y resulta
mas conveniente pensar en Z como un dominio de operadores externo a Z[],
es decir, como un conjunto sin mas vinculacion con Z[] que el hecho de que
esta definido un producto Z Z[] Z[] que cumpla unos axiomas basicos.
Esto nos lleva a la definicion de modulo:

5.1 Modulos
Definicion 5.1 Sea A un anillo unitario. Un Amodulo izquierdo es una terna
(M, +, ) tal que M es un conjunto, + : M M M es una operacion
interna en M y es lo que se llama una operacion externa en M con dominio de

155
156 Captulo 5. Modulos y espacios vectoriales

operadores en A, lo que significa simplemente que : A M M . Ademas


se han de cumplir las propiedades siguientes:

1. (r + s) + t = r + (s + t) para todos los r, s, t M .

2. r + s = s + r para todos los r, s M .

3. Existe un elemento 0 M tal que r + 0 = r para todo r M .

4. Para todo r M existe un elemento r M tal que r + (r) = 0.

5. a(r + s) = ar + as para todo a A y todos los r, s M .

6. (a + b)r = ar + br para todos los a, b A y todo r M .

7. a(br) = (ab)r para todos los a, b A y todo r M .

8. 1r = r para todo r M .

Observamos que la suma en un modulo ha de cumplir las mismas propiedades


que la suma en un anillo, por lo que las propiedades elementales de la suma
de anillos valen para modulos. Por ejemplo, el elemento 0 que aparece en la
propiedad 3 es unico, as como los elementos simetricos que aparecen en 4.
Un Amodulo derecho se define igualmente cambiando la operacion externa
por otra de la forma : M A M . La unica diferencia significativa es
que la propiedad 7 se convierte en (rb)a = r(ba), que escrito por la izquierda
sera a(br) = (ba)r (en lugar de a(br) = (ab)r, que es la propiedad de los
modulos izquierdos). Mientras no se indique lo contrario solo consideraremos
modulos izquierdos, aunque todo vale para modulos derechos. Seguiremos el
mismo convenio que con los anillos, segun el cual las operaciones de un modulo
se representaran siempre con los mismos signos, aunque sean distintas en cada
caso. Tambien escribiremos M en lugar de (M, +, ).
Veremos que los modulos sobre cuerpos tienen un comportamiento mucho
mas simple y regular que sobre anillos arbitrarios, aunque en realidad conviene
notar que la propiedad conmutativa del producto en los cuerpos no es relevante
para ello.
Por eso definimos un anillo de division como un anillo unitario en el que
1 6= 0 y donde todo elemento no nulo tiene inverso para el producto. En otras
palabras, es un anillo que cumple todos los axiomas de la definicion de cuerpo
salvo quiza la conmutatividad del producto.
Si D es un anillo de division, los Dmodulos se llaman espacios vectoriales.
Tenemos disponibles muchos ejemplos de modulos:

1. En primer lugar, si A es un anillo unitario, entonces A es un Amodulo


con su suma y su producto.
5.1. Modulos 157

2. Mas en general, si B es un anillo unitario y A es un subanillo que contenga


a la identidad, entonces B es un Amodulo con la suma de B y el producto
restringido a A B.

3. Mas en general aun, si : A B es un homomorfismo de anillos unita-


rios tal que (1) = 1, entonces B es un Amodulo con la suma en B y el
producto dado por ab = (a)b (el ejemplo anterior sera un caso particular
de este tomando como homomorfismo la inclusion).

4. Un caso particular de este ejemplo es que si A es un anillo unitario e I es


un ideal de A, entonces el anillo cociente A/I es un Amodulo con su suma
y el producto dado por a[b] = [ab] (basta tomar como el epimorfismo
canonico).

5. Otro caso particular es que si A es un anillo unitario, entonces A es un Z


modulo con el producto usual de un entero por un elemento de A (tomando
(m) = m1).

As, continuando el ejemplo que hemos considerado al principio del captulo,


podemos considerar a Z[] como Z-modulo como caso particular de 2) o de 5),
aunque tambien podemos considerarlo como Z[]modulo en virtud de 1).
Enunciemos a continuacion las propiedades elementales de los modulos. To-
das se demuestran igual que para anillos. Observemos que el producto de
numeros enteros por elementos de un modulo esta definido exactamente igual
que para anillos.

Teorema 5.2 Sea A un anillo unitario y M un Amodulo.

1. Si r + s = r + t entonces s = t para todos los r, s, t M ,

2. r + r = r si y solo si r = 0, para todo r M ,

3. (r) = r para todo r M ,

4. (r + s) = r s, para todos los r, s M ,

5. a0 = 0r = 0, para todo a A y todo r M ,

6. n(ar) = (na)r = a(nr), para todo n Z, a A y r M ,

7. Si A es un anillo de division, a A, r M y ar = 0, entonces a = 0 o


r = 0.

(Por ejemplo, la propiedad 7 se cumple porque si a 6= 0, entonces existe a1


y por tanto a1 ar = a1 0 = 0, 1r = 0, r = 0).

Definicion 5.3 Sea A un anillo unitario y M un Amodulo. Diremos que un


modulo N es un submodulo de M si N M y las operaciones de N son las
mismas que las de M .
158 Captulo 5. Modulos y espacios vectoriales

Evidentemente, si un subconjunto de un modulo dado puede ser dotado de


estructura de submodulo, la forma de hacerlo es unica (pues las operaciones
en N han de ser las restricciones de las de M ). Por tanto es indistinto hablar
de submodulos de M que de subconjuntos que pueden ser estructurados como
submodulos. Pero no siempre es posible considerar a un subconjunto como
submodulo (por ejemplo si no contiene al 0). Las condiciones que se han de
cumplir para ello las da el teorema siguiente:

Teorema 5.4 Sea A un anillo unitario y M un Amodulo. Un subconjunto


N de M puede ser dotado de estructura de submodulo si y solo si cumple las
condiciones siguientes:

1. N 6= ,

2. Si r, s N entonces r + s N ,

3. Si a A y r N , entonces ar N .

Demostracion: Obviamente si N es un submodulo ha de cumplir estas


condiciones. Si N cumple estas condiciones entonces por 2) y 3) la suma y el
producto estan definidos en N . Por 1) existe un r N , por 3) r = (1)r N ,
por 2) 0 = r r N . Por tanto N tiene neutro y de nuevo por 3) el simetrico
de cada elemento de N esta en N . El resto de las propiedades exigidas por la
definicion se cumplen por cumplirse en M .
Las condiciones 2) y 3) del teorema anterior pueden resumirse en una sola:

Teorema 5.5 Sea A un anillo unitario y M un Amodulo. Un subconjunto N


de M puede ser dotado de estructura de submodulo si y solo si N 6= y para
todos los a, b A y todos los r, s N se cumple que ar + bs N .

Definicion 5.6 De los teoremas anteriores se desprende que si A es un anillo


unitario y M es un Amodulo, entonces M y 0 = {0} son submodulos de M ,
y se llaman submodulos impropios. Cualquier otro submodulo de M se llama
submodulo propio. El submodulo 0 se llama tambien submodulo trivial.

Es obvio que la interseccion de una familia de submodulos de M es un


submodulo de M . Si X es un subconjunto de M , llamaremos submodulo gene-
rado por X a la interseccion de todos los submodulos de M que contienen a X.
Lo representaremos hXi.
Es inmediato a partir de la definicion que si N es un submodulo de M y
X N , entonces hXi N . Igualmente si X Y M , entonces se cumple
hXi hY i. Notemos que hi = 0. Cuando el conjunto X sea finito, digamos
X = {x1 , . . . , xn }, escribiremos tambien hXi = hx1 , . . . , xn i.
Si M = hXi diremos que el conjunto X es un sistema generador de M .
Diremos que M es finitamente generado si tiene un sistema generador finito. El
modulo M es monogeno si admite un generador con un solo elemento.
5.1. Modulos 159

Al considerar a un anillo conmutativo y unitario A como Amodulo los


submodulos coinciden con los ideales, de donde se sigue que el submodulo ge-
nerado por un subconjunto X coincide con el ideal generado por X, es decir,
(X) = hXi.

Es facil reconocer los elementos del submodulo generado por un subconjunto


(cf. 3.4):

Teorema 5.7 Sea A un anillo unitario, M un Amodulo y X M . Entonces

hXi = {a1 r1 + + an rr | n N, ai A, ri X} .

La prueba es sencilla: un submodulo que contenga a X ha de contener


necesariamente al conjunto de la derecha, pero es facil ver que este subconjunto
es de hecho un submodulo, luego contiene a hXi.

Los elementos de la forma a1 r1 + + an rr , con los ai A, se llaman


combinaciones lineales de r1 , . . . , rn . En estos terminos, el teorema anterior
afirma que el submodulo generado por un conjunto X es el conjunto de todas
las combinaciones lineales de los elementos de X.


Por ejemplo, ahora podemos decir que Z[] = 1, , 2 , 3 , y as tene-
mos enmarcada en un contexto general la relacion que permite expresar todo
entero ciclotomico en funcion de estos cuatro generadores y de numeros en-
teros. Igualmente

tenemos
que Q[] es un Q espacio vectorial, as como que
Q[] = 1, , 2, 3 . En situaciones como esta en las que puede haber am-
biguedad es costumbre explicitar

el anillo que estamos

tomando
como domino
de operadores para distinguir 1, , 2 , 3 Z de 1, , 2 , 3 Q , de modo que el
primero es el modulo formado por todas las combinaciones lineales de los ge-
neradores con coeficientes en Z y el segundo el espacio vectorial formado por
todas las combinaciones lineales de los generadores con coeficientes en Q.
Lo mismo sucede en otros contextos. Por ejemplo, podemos considerar a Q[]
como Q[]-modulo y tambien como Z-modulo. Por ello, distinguiremos entre
sus Q[]-submodulos (es decir, submodulos respecto de su estructura de Q[]-
modulo) y sus Z-submodulos (que son sus submodulos respecto de su estructura
de Z-modulo).
Concretamente, como Q[] es un cuerpo, no tiene ideales propios (es decir,
no tiene Q[]-submodulos propios y se cumple trivialmente que Q[] = h1iQ[] ,
mientras que s que tiene muchos Z-submodulos propios, como Z = h1iZ , o
h1 + iZ = {n + n | n Z}.

Los modulos cociente se definen exactamente igual que los anillos cociente:

Definicion 5.8 Sea A un anillo unitario, M un Amodulo y N un submodulo


de M . Definimos en M la relacion de congruencia modulo N mediante
r s (mod N ) si y solo si r s N .
160 Captulo 5. Modulos y espacios vectoriales

Es facil probar que se trata de una relacion de equivalencia en M . Llamare-


mos M/N al conjunto cociente. La clase de equivalencia de un elemento r M
es
[r] = r + N = {r + s | s N }.
La prueba del teorema siguiente es completamente analoga a la de 3.37:

Teorema 5.9 Sea A un anillo unitario, M un Amodulo y N un submodulo


de M . El conjunto M/N es un Amodulo con las operaciones dadas por

[r] + [s] = [r + s] y a[r] = [ar].

Se le llama modulo cociente.

Es facil ver que si I es un ideal de un anillo A, entonces el A-modulo cociente


A/I es el modulo que resulta de considerar al anillo cociente A/I como A-modulo
a traves del epimorfismo canonico A A/I.
Definimos los homomorfismos de modulos de forma analoga a los de anillos.
Su interpretacion es la misma:

Definicion 5.10 Sea A un anillo unitario y M , N dos Amodulos. Una apli-


cacion f : M N es un homomorfismo de modulos si cumple:
f (r + s) = f (r) + f (s), para todos los r, s M ,
f (ar) = af (r), para todo a A y todo r M .

Obviamente esto equivale a que f (ar + bs) = af (r) + bf (s), para a, b A,


r, s M .

Un monomorfismo de modulos es un homomorfismo inyectivo.

Un epimorfismo de modulos es un homomorfismo suprayectivo.

Un isomorfismo de modulos es un homomorfismo biyectivo.

Un endomorfismo de modulos es un homomorfismo de un modulo en s


mismo.

Un automorfismo de modulos es un isomorfismo de un modulo en s mismo.

Una aplicacion lineal es un homomorfismo de espacios vectoriales.

La composicion de homomorfismos es un homomorfismo, la inversa de un


isomorfismo es un isomorfismo. Dos modulos M y N son isomorfos (M = N)
si existe un isomorfismo entre ellos.
Si f : M N es un homomorfismo de modulos, es facil ver que si N es
un submodulo de N entonces f 1 [N ] es un submodulo de M y si M es un
submodulo de M , entonces f [M ] es un submodulo de N .
5.2. Suma de modulos 161

En particular, se define el nucleo de f como N(f ) = {r M | f (r) = 0},


es decir, N(f ) = f 1 [0], que es un submodulo de M . La imagen de f es
Im f = f [M ] = {f (r) | r M }, que es un submodulo de N .
Si A es un anillo unitario, M es un Amodulo y N es un submodulo de M , la
aplicacion f : M M/N dada por f (r) = [r] es un epimorfismo de modulos
llamado epimorfismo canonico. Se cumple que N(f ) = N .
Dado un modulo M y submodulos N N M es claro que N /N es un
submodulo de M/N . Es facil probar que todo submodulo de M/N es de esta
forma.
Los teoremas siguientes son analogos a 3.44 y 3.45, respectivamente:

Teorema 5.11 Un homomorfismo de modulos es inyectivo si y solo si su nucleo


es trivial.

Teorema 5.12 (Teorema de isomorfa) Consideremos un anillo unitario A


y sea f : M N un homomorfismo de Amodulos. Entonces la aplicacion
f : M/ N(f ) Im f definida por f([r]) = f (r) es un isomorfismo de modulos.

5.2 Suma de modulos


Como hemos indicado, una de las razones por las que es util la estructura
de modulo es porque permite obtener descripciones sencillas de los elementos de
un modulo que resultan faciles de manejar. Un primer analisis de la estructura
de un modulo consiste en descomponerlo en suma de modulos mas simples en
el sentido en que indicamos a continuacion:

Definicion 5.13 Sea A un anillo conmutativo y unitario y M un Amodulo.


Llamaremos suma de una familia de submodulos {Ni }iI de M al submodulo
P
S
Ni = Ni
iI iI

Es decir, la suma de una familia de submodulos es el menor submodulo que


los contiene a todos. Por el teorema 5.7, un elemento de este submodulo es una
combinacion lineal de elementos de algunos de los modulos Ni con coeficientes
en A, pero al multiplicar un elemento de Ni por un elemento de A obtenemos
otro elemento de Ni , y la suma de dosPelementos de un mismo Ni esta tambien
en Ni . Por lo tanto un elemento de Ni es de la forma r1 + + rn , donde
iI
cada sumando esta en un submodulo distinto. En particular si la familia es
finita,
N1 + + Nn = {r1 + + rn | ri Ni }.
Descomponer un modulo en suma de submodulos nos da una informacion
importante sobre su estructura. Por ejemplo, el hecho de que todo elemento de
Z[] se exprese como combinacion lineal de 1, , 2 , 3 equivale a decir que



Z[] = h1i + hi + 2 + 3 .
162 Captulo 5. Modulos y espacios vectoriales

Pero sabemos que se cumple mas: cada elemento de Z[] se expresa de forma
unica como suma de un elemento de cada uno de estos cuatro submodulos.
Vamos a analizar en general cuando sucede algo as:

Definicion 5.14 Sea A un anillo unitario y M un Amodulo. Se dice que una


familia de submodulos {Ni }iI es independiente si para cada ndice i se cumple
P
Ni Nj = 0.
j6=i

Si {Ni }iI es una familia


P de submodulos L independientes, se dice que su suma
es directa y en lugar de Ni se escribe Ni .
iI iI

Teorema 5.15 Sea A un anillo unitario, M un Amodulo y N1 , . . . , Nn una


familia de submodulos tales que M = N1 + + Nn . Equivalen:
1. M = N1 Nn .
2. Si m1 + + mn = 0 con cada mi Ni , entonces cada mi = 0.
3. Cada elemento m M se expresa de forma unica como suma

m = m1 + + mn

con cada mi Ni .

Demostracion: Por simplificar, vamos a probarlo para el caso n = 3. El


caso general es analogo. De hecho el resultado es cierto incluso con infinitos
sumandos.
1) 2). Si m1 + m2 + m3 = 0 con cada mi Ni , entonces

m1 = m2 m3 N1 (N2 + N3 ) = 0,

y analogamente se concluye que m2 = m3 = 0.


2) 3). Como M = N1 + N2 + N3 , todo elemento de M se descompone en
una suma de la forma m1 + m2 + m3 , con cada mi Ni . Si un elemento admite
dos descomposiciones

m1 + m2 + m3 = m1 + m2 + m3

entonces (m1 m1 )+ (m2 m2 )+ (m3 m3 ) = 0, luego por 2) podemos concluir


que (m1 m1 ) = (m2 m2 ) = (m3 m3 ) = 0, luego ambas descomposiciones
son la misma.
3) 1). Si un elemento m1 N1 (N2 + N3 ), entonces m1 = m2 + m3 ,
mi Ni , o sea, m1 + 0 + 0 = 0 + m2 + m3 , luego por la unicidad, m1 = 0, es
decir, N1 (N2 + N3 ) es el submodulo trivial. Igualmente ocurre si permutamos
los ndices.
Por ejemplo, ahora podemos afirmar que



Z[] = h1i hi 2 3 .
5.2. Suma de modulos 163

Nota Hemos enunciado el teorema anterior para sumas finitas porque es el


caso que realmente vamos a necesitar, y el enunciado general para sumasPposi-
blemente infinitas oculta parcialmente la idea basica. En general, si M = Ni ,
iI
que la suma sea directa equivale a que siempre que una suma mi1 + +min = 0
con mij Nij y los ndices ij I son distintos dos a dos, entonces cada mij = 0
(esta es la version general de 2), lo cual equivale a su vez a que todo m M no
nulo se expresa de forma unica como suma m = mi1 + + min con mij Nij
no nulo y los ndices ij I distintos dos a dos (y esta es la version general
de 3). La prueba del caso general se obtiene modificando ligeramente la que
hemos visto.
En general, si un modulo M se expresa como suma directa de una familia
de n submodulos, entonces cada elemento de M determina y esta determinado
por un elemento de cada uno de los submodulos, es decir, determina y esta
determinado por un elemento del producto cartesiano de los submodulos. Esto
nos lleva a introducir el concepto de producto de modulos:

Definicion 5.16 Sea A un anillo unitario y M1 , . . . , Mn una familia de A


modulos. Entonces el producto cartesiano

M1 Mn = (m1 , . . . , mn ) | mj Mj para cada j = 1, . . . , n

es un Amodulo con las operaciones dadas por

(m1 , . . . , mn ) + (m1 , . . . , mn ) = (m1 + m1 , . . . , mn + mn ),

r (m1 , . . . , mn ) = (rm1 , . . . , rmn ).

Esto vale en particular cuando todos los factores son un mismo modulo M ,
con lo que tenemos una estructura de Amodulo sobre el producto M n .
Es obvio que la aplicacion i : Mi M1 Mn que a cada elemento
m Mi le asigna la ntupla cuya componente iesima es m y las restantes
son 0 es un monomorfismo de modulos, por lo que podemos identificar a cada
Mi con su imagen, es decir, con el submodulo de M1 Mn formado por
las ntuplas que tienen nulas todas sus componentes salvo la iesima. La unica
precaucion es que en principio puede ocurrir que Mi = Mj , mientras que sus
imagenes respectivas por i y j seran submodulos distintos de M1 Mn
(isomorfos, pero distintos).
Tambien es inmediato que si (m1 , . . . , mn ) M1 Mn entonces

(m1 , . . . , mn ) = 1 (m1 ) + + n (mn ),

luego M1 Mn = M1 + + Mn . Ademas M2 + + Mn esta formado por


las ntuplas con la primera componente nula, luego M1 (M2 + + Mn ) = 0.
Lo mismo vale con otros ndices, con lo que M1 Mn = M1 Mn .
En resumen, dada una familia de Amodulos, hemos construido un A
modulo que es suma directa de una familia de submodulos isomorfos a los
164 Captulo 5. Modulos y espacios vectoriales

dados. Recprocamente, si un modulo M es suma directa de una familia de


submodulos M = M1 Mn , entonces M es isomorfo al producto carte-
siano M1 Mn . El isomorfismo es la aplicacion que a cada elemento de M
le asigna la ntupla formada por los elementos en los que se descompone segun
el teorema 5.15.
Estos resultados son ciertos en el caso de tener infinitos modulos, pero con
una precaucion:
Q
Si tenemos una familia de Amodulos {Mi }iI , el producto cartesiano Mi
es un Amodulo con las operaciones definidas por iI

(xi )iI + (yi )iI = (xi + yi )iI ,


r (xi )iI = (r xi )iI .
Q
Igualmente, las aplicaciones i : Mi Mi dadas por
iI

m si j = i,
i (m)(j) =
0 si j =
6 i,
son monomorfismos de modulos,
Q pero
P al identificar cada modulo Mi con su
imagen ya no es cierto que Mi = Mi , sino que
iI iI
P  Q
Mi = f Mi {i I | f (i) 6= 0} es finito ,
iI iI

pues el miembro derecho es claramente un submodulo del producto cartesiano


que contiene a todos los submodulos Mi , luego tambien a su suma. Esto nos
da la inclusion , y la contraria se sigue inmediatamente de que todo elemento
no nulo del miembro derecho es suma de un numero finito de elementos de los
submodulos Mi :
f = i1 (f (i1 )) + + in (f (in )),
donde {i1 , . . . , in } = {i I | f (i) 6= 0}.
Pero la suma de los submodulos i [Mi ] sigue siendo directa (por el mismo
argumento que en el caso finito), por lo que definimos la suma directa externa
de los modulos {Mi }iI como
L  Q
Mi = f Mi {i I | f (i) 6= 0} es finito .
iI iI

De este modo, dada una familia arbitraria de Amodulos, podemos construir


un modulo que se expresa como suma directa de submodulos isomorfos a los
modulos dados. Pero es importante recordar que esta suma directa externa no
coincide con el producto cartesiano cuando el numero de factores es infinito. En
tal caso tenemos dos modulos distintos:
L Q
Mi Mi .
iI iI

El segundo consta de tuplas infinitas arbitrarias, mientras que el primero


contiene las que solo tienen una cantidad finita de componentes no nulas.
5.2. Suma de modulos 165

Alrededor de las sumas directas y productos hay definidos diversos homo-


morfismos naturales. Todas las propiedades concernientes a ellos se demuestran
facilmente y los dejamos como ejercicios para el lector:
Q
Las proyecciones: i : Mi Mi dadas por i (f ) = f (i) son clara-
iI
menteLepimorfismos de modulos, que a su vez se restringen a epimorfismos
i : Mi Mi .
iI
Cuando el numero de factores es finito, M = M1 Mn , las proyec-
ciones vienen dadas, mas explcitamente, por i (m1 + + mn ) = mi .

Si tenemos homomorfismos
Q Qde modulos
Q fi : Mi Ni , podemos definir
un homomorfismo fi : Mi Ni mediante
iI iI iI
Q
( fi )((mi )iI ) = (fi (mi ))iI .
iI

L L L
Este se restringe a su vez a un homomorfismo fi : Mi Ni .
iI iI iI
En el caso finito la definicion es

(f1 fn )(m1 , . . . , mn ) = (f1 (m1 ), . . . , fn (mn )).

Dados homomorfismos
P de modulos fi : Mi N , podemos definir otro
L
homomorfismo fi : Mi N mediante
iI iI
P P
( fi )(x) = fi (xi ),
iI iI

donde es fundamental que la suma de la derecha tiene un numero finito


de sumandos no nulos, pues en otro caso no estara definida.
En el caso finito queda

(f1 + + fn )(m1 , . . . , mn ) = f1 (m1 ) + + fm (mn )

Dados homomorfismos
Q de modulos
Q fi : M Ni , podemos definir otro
homomorfismo fi : M Ni mediante
iI iI
Q
( fi )(m)(i) = fi (m).
iI

En el caso finito: (f1 fn )(m) = (f1 (m), . . . , fn (m)).

Es posible enunciar y demostrar muchas propiedades elementales de estos


homomorfismos.
Q Q Por
Q ejemplo,
L si L fi : Mi
L Ni son isomorfismos, entonces
fi : Mi Ni y fi : Mi Ni son tambien isomorfismos.
iI iI iI iI iI iI
166 Captulo 5. Modulos y espacios vectoriales

5.3 Modulos libres


El hecho de que todo entero ciclotomico se exprese de forma unica como
combinacion lineal de 1, , 2 , 3 puede expresarse de una forma mas directa en
terminos de la estructura de Z-modulo de Z[] que mediante la descomposicion
en suma directa que hemos mostrado. Para ello introducimos el concepto de
independencia lineal:

Definicion 5.17 Sea A un anillo unitario, M un Amodulo y X un subconjunto


de M . Diremos que X es un conjunto libre, o que sus elementos son linealmente
independientes, si para todos los x1 , . . . , xn X distintos dos a dos1 y todos los
a1 , . . . , an A, la igualdad a1 x1 + + an xn = 0 solo se da en el caso trivial
a1 = = an = 0.
En caso contrario se dice que X es un conjunto ligado o que sus elementos
son linealmente dependientes.

En otras palabras, un conjunto X es libre si la unica forma de expresar el 0


como combinacion lineal de elementos de X es tomando todos los coeficientes
nulos.
Es claro que un conjunto que contenga a 0 es ligado, pues 1 0 = 0 es una
combinacion lineal no trivial nula.
Un subconjunto X de un Amodulo M es una base de M si es un generador
libre. Un modulo es libre si tiene una base.
Notemos que las definiciones implican trivialmente que es una base del
modulo nulo.
Por ejemplo, es facil ver que una base de An es {e1 , . . . , en }, donde ei An
es la n-tupla dada por 
1 si i = j,
eij =
0 si i 6= j.
Esta base recibe el nombre de base canonica de An . Por ejemplo, la base
canonica de A3 es la formada por (1, 0, 0), (0, 1, 0), (0, 0, 1).
Observemos que si X = {x1 , . . . , xn } es una base de un Amodulo M , en-
tonces
M = hx1 i hxn i ,
pues por el teorema 5.7 todo elemento de M es de la forma a1 x1 + + an xn ,
es decir, M = hx1 i + + hxn i, y por la definicion de conjunto libre se cumple
la condicion 2) del teorema 5.15, luego la suma es directa.
1 Notemos que los elementos de X con los que formamos la combinacion lineal tienen

que ser distintos dos a dos. De lo contrario, todo conjunto no vaco sera ligado. Podemos
definir tambien que una n-tupla (x1 , . . . , xn ) es linealmente independiente si cuando se cumple
a1 x1 + +an xn = 0 necesariamente a1 = = an = 0, y esto implica que los xi son distintos
dos a dos, pues si xi = xj con i 6= j, bastara tomar ai = 1, aj = 1 y los demas coeficientes
nulos para tener una combinacion lineal no trivial nula.
5.3. Modulos libres 167

De nuevo por el teorema 5.15, cada elemento m M se expresa de forma


unica como combinacion lineal

m = a1 x1 + + an xn

de los elementos de X. La n-tupla (a1 , . . . , an ) An de los coeficientes de dicha


combinacion se llaman coordenadas de m en la base X (esto presupone que
hemos fijado una ordenacion de la base). Mas aun, teniendo en cuenta que

(a1 x1 + + an xn ) + (b1 x1 + + bn xn ) = (a1 + b1 )x1 + + (an + bn )xn ,

a(a1 x1 + + an xn ) = aa1 x1 + + aan xn ,


es obvio que la aplicacion que a cada elemento de M le asigna su ntupla de
coordenadas es un isomorfismo de modulos, o sea, M
= An .
Teniendo en cuenta que An siempre es un A-modulo libre, tenemos probado
el teorema siguiente:

Teorema 5.18 Sea A un anillo unitario y M un Amodulo. Se cumple que M


tiene una base con n elementos si y solo si M es isomorfo al Amodulo An .

Es facil ver que esto vale igualmente para bases infinitas: Un Amodulo
L M
tiene una base X si y solo si es isomorfo a una suma directa M = A. La
xX
base canonica de la suma directa es la formada por los ex dados por

1 si y = x,
ex (y) =
0 si y 6= x.

Ahora podemos decir, por ejemplo, que 1, , 2 , 3 forman una base de Z[]
como Z-modulo, y tambien de Q[] como Q-espacio vectorial.
Es facil ver que una base de un anillo de polinomios A[x] como A-modulo es
la formada por todas las potencias de x:

1, x, x2 , x3 , x4 , ...

Es importante senalar que no todos los modulos son libres, aunque s lo


seran casi todos los que nos van a interesar. Por ejemplo, el anillo Z/nZ es un
Zmodulo no libre, ya que si fuera libre debera ser isomorfo a una suma directa
de varias veces Z, lo cual es imposible, ya que tales sumas son infinitas y Z/nZ
es finito.
Las bases son utiles a la hora de determinar los homomorfismos de un modulo
en otro. Es inmediato que si dos homomorfismos de modulos coinciden sobre
los elementos de un sistema generador, entonces son el mismo homomorfismo.
Sobre las bases se puede decir mas:

Teorema 5.19 Sea A un anillo unitario, M y N dos Amodulos y X una


base de M . Entonces cada aplicacion f : X N se extiende a un unico
homomorfismo f : M N .
168 Captulo 5. Modulos y espacios vectoriales

Demostracion: Cada elemento no nulo de M se expresa de forma unica


como combinacion lineal a1 x1 + + an xn de elementos de X con coeficientes
en A no nulos. La unicidad nos permite definir sin ambiguedad
f (a1 x1 + + an xn ) = a1 f (x1 ) + + an f (xn )
y es facil ver que la aplicacion as definida (con la condicion adicional f (0) = 0)
es un homomorfismo.

Ejemplo Podemos definir un homomorfismo : Z[] Z[] de Z-modulos


sin mas que especificar las condiciones
(1) = 1, () = 2 , ( 2 ) = 4 , ( 3 ) = 6 = .
Esto determina la imagen de cualquier otro elemento de Z[] (que en este caso
es la que se obtiene cambiando por 2 ), por ejemplo:
( 4 ) = (1 2 3 ) = 1 2 4 = 3 = ( 2 )4
Todo lo que hemos dicho hasta aqu en este captulo es valido para A-modulos
arbitrarios. Ahora vamos a ver que caractersticas adicionales se dan cuando A
es un anillo de division, es decir, cuando consideramos espacios vectoriales.
Si D es un anillo de division y V es un D-espacio vectorial, es costumbre
llamar vectores a los elementos de V y escalares a los elementos de D. Hay un
hecho elemental que marca la diferencia entre un espacio vectorial y un modulo
cualquiera:
Teorema 5.20 Si V es un D-espacio vectorial, entonces un conjunto X V
es ligado si y solo si uno de sus elementos es combinacion lineal de los restantes.
Demostracion: Si x = 1 x1 + + n xn , con xi X \ {x}, entonces
x+1 x1 + +n xn = 0 es una combinacion lineal nula no trivial de elementos
de X, luego X es ligado. Recprocamente, si X es ligado, existen elementos
x1 , . . . , xn X distintos dos a dos y escalares 1 , . . . , n D no todos nulos
tales que 1 x1 + + n xn = 0. Renumerando podemos suponer que 1 6= 0,
y entonces (y aqu usamos que D es un anillo de division)
x1 = 1 1
1 2 x2 1 n xn ,

luego x1 es combinacion lineal de x2 , . . . , xn .

Nota Esto no es cierto para modulos arbitrarios. Por ejemplo, en Z como


Z-modulo tenemos que X = {2, 3} es ligado, ya que 3 2 + (2) 3 = 0, pero no
es cierto que 2 = n3 ni 3 = n2 para ningun entero n, luego ninguno de los dos
es combinacion lineal del otro.
Una consecuencia importante resulta de unir el teorema anterior a un sen-
cillo hecho general: si x es combinacion lineal de los elementos de X, entonces
hXi = hX {x}i. Esto es inmediato, porque X {x} hXi, y esto implica
hX {x}i hXi. La otra inclusion es cierta en general.
5.3. Modulos libres 169

Teorema 5.21 Si V es un D-espacio vectorial finitamente generado (es decir,


si tiene un generador finito), entonces tiene una base. Mas aun, todo sistema
generador contiene una base.
Demostracion: Consideremos un generador finito de V , de modo que
V = hv1 , . . . , vn i. Si no es libre, por el teorema anterior uno de los generadores
es combinacion lineal de los demas, y por la observacion precedente puede ser
eliminado, con lo que pasamos a tener un sistema generador de V con n 1
elementos. Tras un numero finito de pasos tenemos que llegar a un generador
libre (que puede ser , si V = 0).
Con esto hemos probado que todo generador finito contiene una base. Si X es
un sistema generador arbitrario de V , basta probar que contiene un generador
finito. Ahora bien, si v1 , . . . , vn es un generador finito de V , entonces cada
vi puede expresarse como combinacion lineal de un cierto subconjunto finito
Sn
Xi X. El conjunto X = Xi X es finito y es un sistema generador
i=1
de V , pues V = hv1 , . . . , vn i hX i V .
Y ahora podemos probar uno de los resultados fundamentales:
Teorema 5.22 Si V es un D-espacio vectorial finitamente generado, entonces
todas las bases de V tienen el mismo cardinal.
Demostracion: En la prueba del teorema anterior hemos visto que todo
generador contiene una base finita, luego todas las bases de V tienen que ser
finitas (una base no puede estar estrictamente contenida en otra base, ya que en-
tonces la mayor no sera libre). Sean, pues X = {x1 , . . . , xn }, Y = {y1 , . . . , ym }
dos bases de V . Podemos tomar n m.
El elemento y1 se expresa como combinacion lineal de los elementos de X
y1 = d1 x1 + + dn xn ,
y como es no nulo, alguno de los coeficientes sera no nulo. Reordenando la base
podemos suponer que d1 6= 0. Entonces podemos despejar
x1 = d1 1 1
1 y1 d1 d2 x2 d1 dn xn ,

luego resulta que x1 hy1 , x2 , . . . xn i. Obviamente X hy1 , x2 , . . . xn i y as


hy1 , x2 , . . . , xn i = V .
Consecuentemente y2 = e1 y1 + +en xn y alguno de los coeficientes distintos
de e1 ha de ser no nulo (o si no y2 = e1 y1 , luego e1 y1 y2 = 0, con lo que Y
sera ligado).
Reordenando la base podemos suponer que e2 6= 0 y repitiendo el argumento
anterior concluimos que hy1 , y2 , x3 , . . . , xn i = V .
De este modo llegamos finalmente a que hy1 , . . . , yn i = V . De aqu se sigue
que m = n, pues en otro caso existira yn+1 y sera combinacion lineal de
y1 , . . . , yn , con lo que Y sera ligado.
Antes hemos visto que si en un sistema generador un vector es combinacion
lineal del resto, podemos eliminarlo y seguimos teniendo un sistema generador.
170 Captulo 5. Modulos y espacios vectoriales

Otro hecho elemental es que si X es un sistema libre y v es un vector que no es


combinacion lineal de elementos de X, entonces X {v} sigue siendo libre.
En efecto, si fuera ligado, existira una combinacion lineal no trivial
1 x1 + + r xr + v = 0,
donde necesariamente 6= 0, o de lo contrario X sera ligado, y esto nos per-
mitira despejar v (usando que tiene inverso, de modo que este argumento
requiere que D sea un anillo de division) para concluir que v s que es combi-
nacion lineal de elementos de X, en contra de lo supuesto.
De aqu deducimos otra consecuencia importante sobre los espacios vecto-
riales:
Teorema 5.23 Si V es un D-espacio vectorial finitamente generado, entonces
todo conjunto libre de vectores de V esta contenido en una base.
Demostracion: Sea v1 , . . . , vn una base de V . Si X no es generador,
alguno de los vi no es combinacion lineal de los elementos de X, pues si todos
lo fueran tendramos que V = hv1 , . . . , vn i hXi V . Pongamos que es v1 .
Entonces, por la observacion precedente, X {v1 } es libre.
Si X{v1 } no es generador, entonces, como antes, algun vi no es combinacion
lineal de sus elementos (y obviamente no sera v1 , luego podemos suponer que
es v2 ) y por lo tanto X {v1 , v2 } es libre. Tras un numero finito de pasos
tenemos que llegar a que X {v1 , . . . , vr } es un generador libre (pues en el
peor de los casos lo sera cuando anadamos todos los vectores de la base), y as
tenemos una base que contiene a X.

Definicion 5.24 Si V es un espacio vectorial sobre un anillo de division D, se


llama dimension de V , y la representaremos por dimD V , al numero de elementos
de cualquier base de V .
El teorema 5.22 implica que todo espacio vectorial finitamente generado
tiene asociada una dimension, que es un numero natural (el espacio vectorial
nulo tiene dimension 0). Por ello, en lugar de hablar de espacios vectoriales
finitamente generados, es mas frecuente referirse a ellos como espacios vectoriales
de dimension finita.
En la seccion 5.6 recogemos los resultados que prueban que el concepto de
dimension esta bien definido tambien para espacios no finitamente generados
(que se llaman, consecuentemente, espacios vectoriales de dimension infinita),
pero nunca vamos a necesitar esos resultados.
Que un espacio vectorial V tenga dimension n significa que, fijada una base,
cada elemento de V esta determinado por n elementos de D. Por ejemplo,
dim Q[] = 4 porque cada elemento de Q[] esta determinado por cuatro coor-
denadas enteras.
Nos gustara afirmar lo mismo para Z[], pero primero tenemos que justificar
que tambien en el caso de un Z-modulo libre todas las bases tienen el mismo
numero de elementos. El teorema siguiente nos lo garantiza:
5.3. Modulos libres 171

Teorema 5.25 (AE) Si A es un anillo conmutativo y unitario y M es un


Amodulo libre finitamente generado, entonces todas las bases de M tienen el
mismo numero de elementos.2
Demostracion: Sea I un ideal maximal de A (teorema 3.19). Es claro que
 n 
P
IM = ai mi n N, ai I, mi M

i=1

es un submodulo de M . El Amodulo cociente M/IM se convierte en un A/I


modulo con el producto dado por [a][m] = [am].
Esta definicion es correcta, pues si [a] = [a ] y [m] = [m ], entonces
am a m = am am + am a m = a(m m ) + (a a )m IM,
pues m m M y a a I.
Como I es un ideal maximal, el anillo cociente A/I es en realidad un cuerpo,
luego M/IM es un espacio vectorial. Ahora basta probar que que toda Abase
de M tiene el mismo cardinal que una A/Ibase de M/IM , pues entonces
M/IM sera un espacio vectorial de dimension finita y todas las bases de M
tendran como cardinal la dimension de M/IM .
En efecto, si X = {x1 , . . . , xn } es una Abase de M , vamos a demostrar que
X = {[x1 ], . . . , [xn ]} es una A/Ibase de M/IM y que las n clases son distintas
dos a dos, con lo que tambien tiene n elementos.
Pn
Todo elemento de M/IM es de la forma [u], con u M , luego u = aj xj ,
Pn j=1
y entonces [u] = [aj ][xj ], lo que prueba que X genera M/IM .
j=1
Pn
Supongamos ahora que [aj ][xj ] = [0] para ciertos elementos aj de A y
j=1
vamos a probar que [a1 ] = [an ] = 0, lo cual demuestra a la vez que los [xj ]
son distintos dos a dos y que son linealmente independientes.
Pn n
P m
P
Tenemos que aj xj IM , luego aj xj = bk mk , para ciertos ele-
j=1 j=1 k=1
mentos mk M y ciertos bk I.
n
P
Como X es una base de M , cada mk se expresa como mk = cjk xj .
j=1
Por lo tanto
n m m n n
 m

P P P P P P
aj xj = b k mk = bk cjk xj = bk cjk xj .
j=1 k=1 k=1 j=1 j=1 k=1

m
P
Pero como X es base, aj = bk cjk I, porque cada bk I, luego aj I,
k=1
luego [aj ] = 0. Con esto tenemos que X es base de M/IM y tiene el mismo
numero de elementos que X.
2 Notemos que el axioma de eleccion solo aparece en la prueba al aplicar el teorema 3.19,

luego no es necesario si suponemos que el anillo A es noetheriano.


172 Captulo 5. Modulos y espacios vectoriales

Definicion 5.26 Si M es un modulo libre sobre un anillo conmutativo y uni-


tario A, llamaremos rango de M (rang M ) al numero de elementos de cualquier
base de M .

Por supuesto, el que se use la palabra rango al hablar de modulos libres


arbitrarios y de dimension al hablar de espacios vectoriales no es mas que una
costumbre arraigada, pero en realidad el concepto es el mismo.
Como en el caso de la dimension, hemos probado que el rango esta defi-
nido para todo A-modulo libre finitamente generado con A conmutativo y
unitario, por lo que es habitual referirse a ellos como A-modulos libres de
rango finito. No obstante, la prueba del teorema anterior se adapta trivial-
mente al caso de modulos no necesariamente finitamente generados usando la
generalizacion 5.52 de 5.22 a espacios vectoriales no necesariamente finitamente
generados.
Ahora ya podemos afirmar que rang Z[] = 4, y esto significa simplemente
que cada entero ciclotomico esta completamente determinado por 4 numeros
enteros.
Observemos que si M y N son A-modulos libres, entonces

rang(M N ) = rang M + rang N.

En efecto, si los rangos son finitos tenemos que M = Am , N = An , y entonces



M N =A A =Am n m+n
, donde el ultimo isomorfismo es el dado por

((a1 , . . . , am ), (b1 , . . . , bn )) 7 (a1 , . . . , am , b1 , . . . , bn ).

El argumento se generaliza facilmente al caso en que alguno de los rangos es


infinito, usando que si I J = , entonces
L L L
A A= A.
iI jJ iIJ

La dimension en espacios vectoriales se comporta mucho mejor que el rango


en modulos libres en general. Veamos primero algunos resultados positivos sobre
espacios vectoriales y despues comentaremos la situacion general.

Teorema 5.27 Sea V un espacio vectorial de dimension finita sobre un anillo


de division D y sea W un subespacio de V . Entonces:3
1. dim V = dim W + dim(V /W ). En particular dim W dim V .
2. Si dim W = dim V entonces W = V .

Demostracion: 1) Sea X una base de W . Por el teorema 5.23 sabemos


que X se extiende a una base Y de V . Veamos que si y1 , . . . , yn Y \ X,
entonces las clases [y1 ], . . . , [yn ] son linealmente independientes (y en particular
distintas) en V /W .
3 El lector familiarizado con la teora de cardinales infinitos se dara cuenta de que la prueba

de 1. vale igualmente aunque las dimensiones sean infinitas. No puede decirse lo mismo de 2.
5.3. Modulos libres 173

En efecto, si a1 [y1 ] + + an [yn ] = 0 entonces a1 y1 + + an yn W , luego


se expresa como combinacion lineal de elementos de X, es decir,

a1 y1 + + an yn = b1 x1 + + bm xm ,

y esto nos da dos expresiones distintas de un mismo elemento de V como com-


binacion lineal de elementos de la base Y , lo cual es imposible salvo que todos
los coeficientes sean nulos.
Por otra parte, todo elemento de V /W es de la forma [v], donde v V . El
elemento v se expresa como combinacion lineal de elementos de Y , digamos

v = a1 y1 + + an yn + b1 x1 + + bm xm ,

donde y1 , . . . , yn Y \ X y x1 , . . . , xm X. Por lo tanto

[v] = a1 [y1 ] + + an [yn ] + b1 [x1 ] + + bm [xm ] = a1 [y1 ] + + an [yn ] + 0



y esto prueba que [y] | y Y \ X es un generador, luego una base de V /W ,
que segun lo visto tiene el mismo cardinal que Y \ X. As pues

dim V = |Y | = |X| + |Y X| = dim W + dim(V /W ).

2) Si dim W = dim V = n finito, entonces una base de W (con n elementos)


se ha de extender hasta una base de V , tambien con n elementos, luego toda
base de W lo es tambien de V . Esto implica que W = V .
Un razonamiento similar permite probar el resultado siguiente:

Teorema 5.28 Sean V y W dos subespacios de dimension finita de un espacio


vectorial sobre un anillo de division D. Entonces existen conjuntos X e Y tales
que X es base de V , Y es base de W , X Y es base de V W y X Y es base
de V + W . En particular

dim(V + W ) + dim(V W ) = dim V + dim W.

La prueba consiste esencialmente en partir de una base de V W y extenderla


hasta una base X de V y hasta una base Y de W . En realidad, la prueba vale
tambien si las dimensiones no son finitas.
En particular la dimension de una suma directa de subespacios es igual a la
suma de las dimensiones de los subespacios.
Como consecuencia inmediata del teorema de isomorfa y del teorema 5.27
se cumple lo siguiente:

Teorema 5.29 Sea f : V W una aplicacion lineal entre espacios vectoria-


les sobre un anillo de division D. Entonces dim V = dim N(f ) + dim Im f .

Otra propiedad sencilla en torno a las dimensiones es que si V es un espacio


vectorial de dimension finita n, entonces todo sistema libre con n elementos es
una base, al igual que todo sistema generador con n elementos. En efecto, todo
174 Captulo 5. Modulos y espacios vectoriales

sistema libre con n elementos se extiende hasta una base, que ha de tener n
elementos, luego tiene que ser ya una base. Igualmente, todo sistema generador
con n elementos contiene una base con n elementos, luego el mismo es una base.
Casi todos estos resultados son falsos sobre modulos libres cualesquiera, in-
cluso en los casos mas simples. Por ejemplo, 2Z es un submodulo de Z con el
mismo rango finito, pero 2Z 6= Z (al contrario que 5.27). Por otro lado {2} es
un subconjunto libre de Z que no puede extenderse hasta una base de Z y el
conjunto {2, 3} es un generador de Z que no contiene una base. Por otra parte,
no todo cociente de un modulo libre es libre (p.ej. Z/2Z).

5.4 Matrices
Una base finita en un A-modulo libre M no solo permite determinar los
elementos de M en terminos de una n-tupla de coordenadas en An , sino que
tambien permite reducir a un numero finito de coordenadas los homomorfismos
entre M y cualquier otro A-modulo libre que tenga tambien una base finita.
Para mostrarlo necesitamos el concepto de matriz:

Definicion 5.30 Sea A un anillo unitario y m, n numeros naturales no nulos.


Una matriz m n sobre A es una aplicacion B : {1, . . . , m} {1, . . . , n} A.
Escribiremos bij en lugar de B(i, j) y tambien B = (bij ). En la practica escri-
biremos los elementos de una matriz m n dispuestos en m filas y n columnas
as:
b11 b1n
B = ... ..

.
bm1 bmn

Llamaremos Matmn (A) al conjunto de todas las matrices m n sobre A.


Las matrices n n se llaman matrices cuadradas. Escribiremos Matn (A) en
lugar de Matnn (A).
Evidentemente dos matrices B = (bij ) y C = (cij ) son iguales si y solo si
tienen las mismas dimensiones m n y bij = cij para todo par de ndices i, j.
Podemos identificar los elementos de An con las matrices 1 n, es decir,
con las matrices con una sola fila y n columnas. A estas matrices se las llama
matrices fila. Cuando A es un anillo de division se las llama tambien vectores
fila.
Por analoga, las matrices m 1, es decir, las matrices que constan de una
sola columna, se llaman matrices columna o vectores columna cuando A es un
anillo de division.
En las matrices fila y columna suprimiremos el ndice fijo, es decir, las re-
presentaremos as:
a1
..
(a1 , . . . , an ), . .
an
5.4. Matrices 175

Llamaremos matriz traspuesta de una matriz B Matmn (A) a la matriz


B t Matnm (A) que resulta de intercambiar las filas de B por sus columnas,
es decir, la componente (i, j) de B t es la componente (j, i) de B.
De este modo, la traspuesta de una matriz fila es una matriz columna y
viceversa. Claramente B tt = B.
Una matriz cuadrada B es simetrica si B = B t , es decir, si bij = bji para
todo par de ndices i, j.
La fila i-esima de una matriz B es la matriz fila Bi = (bi1 , . . . , bin ). La
columna j-esima de la matriz B es la matriz columna

b1j
B j = ...

bmj

luego, en este sentido, una matriz m n tiene m filas y n columnas.


Llamaremos matriz nula de orden m n a la matriz m n que tiene todas
sus componentes iguales a 0.
Llamaremos diagonal principal de una matriz cuadrada B Matn (A) a la
n-tupla (b11 , . . . , bnn ).
Una matriz cuadrada es una matriz diagonal si tiene nulas todas sus com-
ponentes que no estan en la diagonal principal.
Una matriz diagonal es una matriz escalar si tiene todas sus componentes
de la diagonal principal iguales entre s.
La matriz identidad de orden n es la matriz escalar n n cuyas componentes
de la diagonal principal son iguales a 1. La representaremos por In . Si definimos
la delta de Kronecker mediante

1 si i = j
ij =
0 si i 6= j

entonces In = (ij ).
Ahora definimos unas operaciones con matrices:
Si B = (bij ) y C = (cij ) son matrices m n, llamaremos B + C a la matriz
m n dada por B + C = (bij + cij ).
Si B = (bij ) es una matriz m n y a A, llamaremos aB a la matriz m n
dada por aB = (abij ).
Con estas operaciones Matmn (A) se convierte en un A-modulo libre de
rango mn. Una base la forman las mn matrices que tienen un 1 en cada una de
las posiciones posibles y las restantes componentes nulas.
La estructura de A-modulo en los espacios de matrices fila no es sino la
estructura usual en los espacios An .
176 Captulo 5. Modulos y espacios vectoriales

Finalmente definimos el siguiente producto de matrices:


Si B Matmn (A) y C Matnr (A), la matriz BC Matmr (A) es la
n
P
que tiene en la posicion (i, j) el elemento bik ckj .
k=1

Es pura rutina comprobar las propiedades siguientes (que se cumplen cuando


las dimensiones de las matrices son las apropiadas):
1. B(CD) = (BC)D.
2. B(C + D) = BC + BD.
3. (B + C)D = BD + CD.
4. BIn = Im B = B.
5. Si A es conmutativo (BC)t = C t B t .
En general, el producto de matrices no es una operacion interna en el con-
junto Matmn (A), pero s lo es en los espacios de matrices cuadradas. Los
espacios Matn (A) son anillos unitarios con la suma y el producto de matrices.
Salvo en casos triviales no son conmutativos. La aplicacion que a cada elemento
a A le asigna la matriz escalar aIn es un monomorfismo de anillos, con lo que
podemos identificar los elementos de A con las matrices escalares, y as A es un
subanillo de Matn (A). El producto de una matriz por el elemento a coincide
con el producto por la matriz aIn .
Vamos a dar una interpretacion de todo esto en terminos de modulos.
Sea M un A-modulo libre de rango finito n. Una base ordenada de M es
una n-tupla B = (u1 , . . . , un ) tal que u1 , . . . , un forman una base de M .
Llamaremos sistema de coordenadas asociado a la base ordenada B a la
aplicacion B : M An que a cada elemento m M le asigna la n-tupla
(a1 , . . . , an ) tal que m = a1 u1 + + an un . A B (m) se le llama n-tupla de
coordenadas de m respecto a la base B.
Sea f : M N un homomorfismo entre modulos libres de rangos m y n
respectivamente. Sean B = (u1 , . . . , um ) y B = (v1 , . . . , vn ) bases ordenadas
de M y N . Entonces, para cada ui existen unos unicos elementos aij A tales
n
P
que f (ui ) = aij vj .
j=1

Llamaremos matriz asociada a f en las bases B y B a MB B (f ) = (aij ), es
decir, a la matriz que tiene por filas a las coordenadas en la base B de las
imagenes de los miembros de la base B.
Teorema 5.31 Sea f : M N un homomorfismo entre A-modulos libres
de rangos m y n respectivamente. Sean B y B bases ordenadas de M y N .

Entonces MBB (f ) es la unica matriz que cumple:

B f (u) = B (u)MBB (f ),

para todo u M .
5.4. Matrices 177



Demostracion: Sean B = (u1 , . . . , um ) y BP = (v1 , . . . , vn ), sea MB
B (f ) =
m
(aij ) y sea B (u) = (x1 , . . . , xm ). Entonces u = i=1 xi ui y
m m n
m 
P P Pn P P
f (u) = xi f (ui ) = xi j=1 aij vj = xi aij vj ,
i=1 i=1 j=1 i=1

luego m 
 P
B f (u) = xi aij = B (u)MB
B (f ).
i=1

Si una matriz C cumple B f (u) = B (u)C, entonces tomando u = ui la
n-tupla B (u) es la que tiene un 1 en el lugar i-esimo y 0 en los restantes. El
producto B (u)C no es sino la fila i-esima
 de C, luego dicha fila i-esima esta

formada por las coordenadas B f (ui ) , al igual que la fila i-esima de MB
B (f ).

Por lo tanto C = MB B (f ).

Definicion 5.32 Si M y N son A-modulos, llamaremos HomA (M, N ) al con-


junto de todos los homomorfismos entre M y N . Si ambos son libres de rangos
m y n, fijadas dos bases ordenadas B y B de M y N respectivamente, tenemos
definida una aplicacion

MB
B : HomA (M, N ) Matmn (A),

que claramente es biyectiva.



En efecto, si MB B
B (f ) = MB (g), entonces
 por el teorema
 anterior para todo
elemento u de M , se cumple B f (u) = B g(u) , luego ha de ser f (u) =
g(u) y por lo tanto f = g, la aplicacion es inyectiva. Por otra parte, dada una
matriz C Matmn (A), por el teorema 5.19 existe f HomA (M, N ) que enva
a cada componente de la base B al elemento de N que en la base B tiene por

n-tupla de coordenadas a la correspondiente fila de C, con lo que MB B (f ) = C.

Ejemplo La aplicacion f : Q[] Q[] dada por f () = es claramente


una aplicacion lineal, considerando a Q[] como Q-espacio vectorial. Vamos a
calcular su matriz en la base ordenada B = (1, , 2 , 3 ). Para ello notamos
que f (1) = , f () = 2 , f ( 2 ) = 3 y f ( 3 ) = 4 = 1 2 3 . Por
lo tanto,
0 1 0 0
0 0 1 0
MBB (f ) = 0

0 0 1
1 1 1 1
As, esta matriz (un numero finito de datos) determina completamente la apli-
cacion f .
Si A es un anillo conmutativo, el conjunto HomA (M, N ) puede ser dotado
de estructura de A-modulo de forma natural:
178 Captulo 5. Modulos y espacios vectoriales

Definimos f + g como el homomorfismo que sobre cada m M actua me-


diante (f + g)(m) = f (m) + g(m), ysi a A, entonces af es el homomorfismo
determinado por (af )(m) = a f (m) (notemos que si A no es conmutativo af
no tiene por que ser un homomorfismo).

Es facil comprobar que la aplicacion MB B es un isomorfismo de modulos, es

B B
B
decir, que MB B (f + g) = MB (f ) + MB (g) y que MBB (af ) = aMB (f ).

Por ejemplo, si u M , entonces



B

B (u) MBB (f ) + MB (g) = B (u)MB B
B (f ) + B (u)MB (g)
 
= B f (u) + B g(u)

= B f (u) + g(u)

= B (f + g)(u) ,

luego por la unicidad de 5.31, MB B B
B (f + g) = MB (f ) + MB (g).

Esto explica las definiciones que hemos dado de suma de matrices y producto
de una matriz por un elemento de A: la suma de dos matrices es la operacion
que nos da la matriz asociada al homomorfismo suma de los homomorfismos
asociados a los sumandos, y similarmente con el producto por elementos de A.
Respecto al producto de matrices, su interpretacion es la siguiente:

Teorema 5.33 Sean f : M N y g : N R homomorfismos de A-


modulos libres de rango finito. Sean B, B y B bases ordenadas de M , N y R

B B
respectivamente. Entonces MB B (f g) = MB (f )MB (g).

Demostracion: Si u M , entonces

 
B (u)MB B
B (f )MB (g) = B f (u) MB B (g) = B g f (u)

= B (f g)(u) ,

luego por la unicidad de 5.31, MB B B
B (f g) = MB (f )MB (g).

Definicion 5.34 Si M es un A-modulo, representaremos por EndA (M ) =


HomA (M, M ) al conjunto de todos los endomorfismos de M . Es facil ver que
EndA (M ) es un anillo con la suma de homomorfismos que ya tenemos definida
y con la composicion de aplicaciones como producto.

Si M es libre de rango n y B es una base ordenada, el teorema anterior prueba


que la aplicacion MBB : EndA (M ) Matn (A) es un isomorfismo de anillos.
Notemos que la matriz identidad se corresponde con la aplicacion identidad.
Las unidades de EndA (M ) son los endomorfismos que tienen una inversa
como aplicaciones, es decir, los endomorfismos biyectivos, que reciben el nombre
de automorfismos de M . Si M es libre de rango finito, la aplicacion MBB hace
corresponder los automorfismos de M con las matrices regulares en el sentido
siguiente:
5.4. Matrices 179

Definicion 5.35 Una matriz C Matn (A) es regular si es una unidad del
anillo Matn (A), es decir, si existe una matriz C 1 Matn (A) tal que CC 1 =
C 1 C = In . En tal caso la matriz C 1 es unica y se llama matriz inversa de C.
Una matriz cuadrada que no es regular es una matriz singular.

Una propiedad elemental es que si A es conmutativo y B es una matriz


regular, entonces la matriz traspuesta B t tambien es regular y (B t )1 = (B 1 )t .
En efecto, basta observar que (B 1 )t B t = (BB 1 )t = Int = In , e igualmente en
orden inverso.

Teorema 5.36 Si f : M N es un homomorfismo entre modulos libres del


mismo rango finito y B, B son bases ordenadas de M y N respectivamente,

entonces f es un isomorfismo si y solo si MB
B (f ) es regular y, en tal caso,

MBB (f
1
) = MB
B (f )
1
.

Demostracion: Sea g HomA (N, M ) tal que g = f 1 si suponemos que


B
f es isomorfismo o tal que MB B (g) = MB (f )
1
si suponemos que MB B (f ) es
regular.

En cualquier caso se cumple que MB B B B
B (f )MB (g) = MB (f g) = In = MB (I)

B B B B
y MB (g)MB (f ) = MB (g f ) = In = MB (I), de donde se siguen las dos
implicaciones.
Las matrices tambien proporcionan una forma sencilla de obtener las coorde-
nadas de un elemento de un modulo libre en una base conocidas sus coordenadas
en otra base:

Definicion 5.37 Si B = (u1 , . . . , un ) y B = (v1 , . . . vn ) son dos bases ordena-


das de un mismo A-modulo M , se llama matriz de cambio de base a la matriz

B
MBB = MB (I), donde I es la identidad en M .

Claramente MB B 1
B es regular y (MB ) = MB B
B . La fila i-esima de MB es
B (ui ) y para todo m M se cumple la relacion

B (m) = B (m)MB
B ,

es decir, el producto por MB
B transforma las coordenadas de m en B en las
coordenadas de m en B .

Teorema 5.38 Se cumple


1. Si A es un dominio ntegro y B, C Matn (A) cumplen que BC = In ,
entonces B y C son regulares y C = B 1 .
2. Si A es un dominio ntegro y B Matmn (A), C Matnm (A) cumplen
que BC = Im , CB = In , entonces n = m, B y C son regulares y C = B 1 .

Demostracion: Sea K el cuerpo de cocientes de A. Entonces Matn (A)


puede considerarse como un subanillo de Matn (K). Fijemos una base del espacio
vectorial K n y consideremos las aplicaciones lineales f , g : K n K n cuyas
180 Captulo 5. Modulos y espacios vectoriales

matrices en la base considerada sean B y C respectivamente. Entonces la matriz


de f g es In , lo que significa que f g es la aplicacion identidad. De aqu se
sigue que f es un monomorfismo, luego dim Im f = dim K n = n. Por 5.27
tenemos que Im f = K n , luego f es un isomorfismo y por el teorema anterior
B es regular. Multiplicando por B 1 en BC = In obtenemos que C = B 1 . La
prueba de 2 es analoga.

5.5 Modulos finitamente generados sobre DIPs


Podemos resumir los resultados que hemos demostrado sobre espacios vecto-
riales de dimension finita diciendo que un espacio vectorial de dimension finita
sobre un anillo de division D esta completamente determinado por un numero
natural, su dimension d, en el sentido de que todos los Despacios vectoria-
les de dimension d son isomorfos a Dd y desde un punto de vista algebraico,
como espacios vectoriales, podemos decir que todos son el mismo espacio,
aunque difieran como conjuntos. Podemos expresar esto diciendo que los espa-
cios vectoriales de dimension finita quedan completamente clasificados por su
dimension, en el sentido de que, conocida la dimension, conocido el espacio.
En esta seccion vamos a tratar de llegar a resultados similares para modulos
finitamente generados sobre un dominio de ideales principales D. Sabemos que
lo anterior es cierto igualmente para los Dmodulos libres de rango finito, pero
tambien sabemos que puede haber D-modulos finitamente generados que no
sean libres.
Vamos a probar que tambien es posible asignar a cada D-modulo finitamente
generado un numero finito de datos que lo determinaran salvo isomorfismo,
aunque ahora los datos no se reduciran a un mero numero natural, como
en el caso de los espacios vectoriales. El resultado sera una clasificacion com-
pleta de los D-modulos finitamente generados en el mismo sentido que en el
caso de los espacios vectoriales: cada modulo tendra asignados unos datos de
modo que, conocidos los datos, conocido el modulo y, aun sin conocer los datos
que determinan a un modulo dado, podremos enumerar en la practica todas
las posibilidades que pueden darse, de modo que podamos analizar cada una
separadamente si es necesario sabiendo que con ello cubrimos todos los casos
posibles.
El teorema de clasificacion que vamos a probar aqu es un resultado mucho
mas abstracto que cualquier otro que hayamos probado hasta el momento, y tal
vez el lector no este en condiciones de apreciar el valor de trabajar con tanta
generalidad. Sin embargo, veremos que el nivel de abstraccion de esta seccion se
traduce en que los resultados que vamos a obtener seran aplicables en contextos
muy diversos, incluyendo la clasificacion de las isometras de un espacio eucldeo,
por citar uno de los ejemplos mas alejados del terreno que estamos tratando en
este libro.
Nuestro punto de partida sera el teorema siguiente:
5.5. Modulos finitamente generados sobre DIPs 181

Teorema 5.39 (AE) Todo submodulo de un modulo libre sobre un dominio de


ideales principales es libre de rango menor o igual que el del modulo.4

Demostracion: Sea L un modulo libre sobre un dominio de ideales prin-


cipales D. Sea B L una base y consideremos en ella un buen orden . Para
cada b B definimos

Lb = hc B | c < bi , Lb = hc B | c bi .

Cada a Lb se expresa de forma unica como a = u + db, con u Lb y d D.


La aplicacion fb : Lb D dada por a 7 d es claramente un homomorfismo
de modulos.
Tomemos ahora un submodulo M L y vamos a considerar los homomor-
fismos fb restringidos a fb : M Lb D. As, el nucleo de fb es claramente
M Lb . La imagen de fb sera un ideal de D. Como D es un dominio de ideales
principales, estara generada por un cierto db D. Sea B = {b B | db 6= 0} y,
para cada b B elegimos un mb M Lb tal que fb (mb ) = db .
El teorema quedara probado si demostramos que C = {mb | b B } es una
base de M (pues, ciertamente, su cardinal es menor o igual5 que el de B).
En primer lugar demostramos que C es linealmente independiente. Suponga-
mos, para ello, que tenemos una combinacion lineal nula a1 mb1 + +an mbn = 0,
donde ai D y b1 < < bn son elementos de B. En esta situacion, para cada
i < n, tenemos que mbi M Lbi M Lbn , luego

a1 mb1 + + an1 mbn1 M Lbn .

Por lo tanto,

0 = fbn (0) = fbn (a1 mb1 + + an1 mbn1 ) + fbn (an mbn ) = an dbn ,

y concluimos que an = 0. Aplicando ahora fbn1 se obtiene que an1 = 0, e


igualmente con todos los coeficientes.
Veamos ahora que C es un sistema generador de M . Por reduccion al ab-
surdo, supongamos que existe un m M que no puede expresarse como com-
binacion lineal de elementos de C. Entonces m M Lb para cierto b B, y
podemos tomar el mnimo b tal que existe un m en estas condiciones.
Si b / B , entonces la imagen de fb es nula, luego fb (m) = 0, lo que significa
que m M Lb , pero entonces existira un b < b tal que m M Lb ,
en contradiccion con la minimalidad de b. Concluimos, pues, que b B , y
entonces fb (m) = ddb , para cierto d D.
4 El teorema usa AE unicamente al suponer que el modulo dado tiene una base que ad-

mite un buen orden, pero esto se cumple trivialmente para modulos rango de numerable (en
particular, finito). En tal caso no es necesario AE.
5 En el caso en que la base B sea infinita, el lector debe saber que el cardinal de un

subconjunto es menor o igual que el cardinal del conjunto. Nosotros hemos visto que esto es
as cuando B es finito o incluso infinito numerable, y nunca vamos a necesitar otros casos. De
hecho, en esta seccion solo necesitaremos el caso finito.
182 Captulo 5. Modulos y espacios vectoriales

Llamemos m = m dmb M Lb . Claramente fb (m ) = ddb ddb = 0.


Consecuentemente, m M Lb , luego, existe un b < b tal que m M Lb
y, por la minimalidad de b, tenemos que m es combinacion lineal de elementos
de C, pero entonces m tambien lo es, y llegamos a una contradiccion.
Un poco mas en general, todo submodulo de un modulo finitamente generado
es finitamente generado:

Teorema 5.40 Sea D un dominio de ideales principales y M un Dmodulo


con un generador finito de n elementos. Entonces todo submodulo de M admite
un generador finito con a lo sumo n elementos.

Demostracion: Sea {x1 , . . . , xn } un generador de M , sea L un Dmodulo


libre de rango n y sea {y1 , . . . , yn } una base de L. Entonces por el teorema 5.19
existe un homomorfismo f : L M tal que f (yi ) = xi para cada i = 1, . . . , n.
Como Imf es un submodulo que contiene a un generador de M , necesaria-
mente ha de ser Imf = M , luego f es suprayectiva.  
Ahora, si N es un submodulo de M , se cumple que N = f f 1 [N ] , y
por 5.39 tenemos que f 1 [N ] es un submodulo de L libre y de rango menor
o igual que n. La imagen de una base de f 1 [N ] es claramente un sistema
generador de N .
Ya hemos senalado que no todo Z-modulo es libre (por ejemplo, Z/nZ). Sin
embargo, ahora podemos dar una condicion sencilla que determina cuando un
modulo finitamente generado sobre un DIP es libre. Para ello introducimos
algunos conceptos:

Definicion 5.41 Si A es un dominio y M es un Amodulo, un elemento m M


es de torsion si existe un a A no nulo tal que am = 0. Llamaremos Mt al
conjunto de todos los elementos de torsion de M . Es inmediato comprobar que
Mt es un submodulo de M , que recibe el nombre de submodulo de torsion de M .
Si M = Mt se dice que M es un modulo de torsion. Si Mt = 0 se dice que M
es libre de torsion.

Por ejemplo, Z/nZ es un Zmodulo de torsion, pues nx = 0 para todo


x Z/nZ.
En general, si D es un dominio ntegro y M es un Dmodulo libre, entonces
es libre de torsion, pues si m M es un elemento de torsion, podemos expresarlo
como combinacion lineal de los elementos de una base:

m = d1 b1 + + dn bn ,

y entonces, si existe un d D no nulo tal que dm = 0, tenemos que

0 = dm = dd1 b1 + + ddn bn ,

luego, por la independencia lineal de la base, dd1 = ddn = 0, y como D es


ntegro, esto implica que d1 = = dn = 0, luego m = 0.
En el contexto en el que estamos trabajando, se cumple el recproco:
5.5. Modulos finitamente generados sobre DIPs 183

Teorema 5.42 Si D es un dominio de ideales principales, entonces un D-


modulo finitamente generado es libre si y solo si es libre de torsion.

Demostracion: Sea M un Dmodulo finitamente generado (que pode-


mos suponer no nulo). Acabamos de ver que si es libre tambien es libre de
torsion. Ahora supongamos que es libre de torsion. Esto equivale a que cual-
quier y M no nulo es libre. Sea G un sistema generador finito de M y sea
y1 uno cualquiera de sus elementos no nulos. En general, podemos ir eligiendo
elementos y1 , . . . , yn G tales que {y1 , . . . , yn } sea un sistema libre hasta agotar
los elementos de G o bien hasta que cualquier y G \ {y1 , . . . , yn } haga que
{y1 , . . . , yn , y} sea ligado. Pongamos que G = {y1 , . . . , yn , yn+1 , . . . ym }, donde
tal vez m = n y sea L = hy1 , . . . , yn i, que es un Dmodulo libre finitamente
generado.
Si m > n, para cada n i m, tenemos una combinacion lineal nula

d1 y1 + + dn yn + di yi = 0,

donde no todos los coeficientes son nulos, pero, concretamente, tiene que ser
di 6= 0, pues de lo contrario {y1 , . . . , yn } sera ligado. Entonces di yi L. Sea
d = dn+1 dm 6= 0, de modo que dyi L para todo i = 1, . . . , m. El hecho
de que G es un generador de M implica claramente que dm L para todo
m M . Consideremos ahora la aplicacion f : M L dada por f (m) = dm.
Claramente es un homomorfismo de modulos, y es un monomorfismo (tiene
nucleo trivial) porque M es libre de torsion. Por lo tanto M es isomorfo a su
imagen, que es un submodulo de L, luego es libre por el teorema 5.39.

Ejercicio: Probar que Q es un Zmodulo libre de torsion, pero no libre.

Podemos precisar mas la situacion:

Teorema 5.43 Sea D un dominio de ideales principales y sea M un Dmodulo


finitamente generado. Entonces M/Mt es un Dmodulo libre y existe un submo-
dulo libre L de M tal que M = Mt L. En particular L = M/Mt , luego su
rango esta determinado por M .

Demostracion: Observemos en primer lugar que M/Mt es libre de torsion.


En efecto, si [x] M/Mt es un elemento de torsion, esto significa que existe un
d D no nulo tal que [dx] = 0, es decir, dx Mt , luego existe un d D no
nulo tal que d dx = 0, luego x Mt , luego [x] = 0. Tambien es claro que M/Mt
es finitamente generado. Por el teorema anterior tenemos que M/Mt es libre.
Sea [m1 ], . . . , [mn ] una base de M/Mt y sea L = hm1 , . . . , mn i. Se cumple
que m1 , . . . , mn son linealmente independientes, pues si

d1 m1 + + dn mn = 0,

entonces d1 [m1 ] + + dn [mn ] = 0, luego d1 = = dn = 0, por la indepen-


dencia lineal de las clases [mi ].
184 Captulo 5. Modulos y espacios vectoriales

Por otra parte, M = Mt + L, ya que si m M , entonces existen di D


tales que [m] = d1 [m1 ] + + dn [mn ], luego x = d1 m1 + dn mn L cumple
[m] = [x], luego m x = t Mt , luego m = t + x Mt + L.
Finalmente, M = Mt L, pues esto equivale a que Mt L = 0 y, en efecto,
si m Mt L, entonces m = d1 m1 + + dn mn para ciertos di D, pero
entonces d1 [m1 ]+ + dn [mn ] = [m] = 0, luego d1 = = dn = 0, luego m = 0.
Notemos que la proyeccion M = Mt L L es un epimorfismo de modulos
con nucleo Mt , lo que nos da el isomorfismo L
= M/Mt .

Definicion 5.44 Si M es un modulo finitamente generado sobre un DIP D,


llamaremos rango de M al rango del modulo libre M/Mt .

Con esto tenemos ya uno de los datos que nos permitiran clasificar los
modulos finitamente generados sobre un DIP. Dos modulos tienen el mismo
rango si y solo si tienen partes libres isomorfas. Ahora vamos a encontrar otros
datos que determinen todas las posibilidades para la parte de torsion.
Si M es un D-modulo arbitrario y m M , llamaremos orden de m al
conjunto
o(m) = {d D | dm = 0}.
Claramente es un ideal de D, que sera no nulo si y solo si m es un elemento de
torsion. En tal caso, si o(m) = (a), entonces tenemos que a 6= 0 y un d D
anula a m (es decir, cumple dm = 0) si y solo si a | d. Diremos que a es un
periodo de m.
Notemos que los generadores de un ideal principal estan determinados salvo
unidades, por lo que cada m M determina sus periodos salvo unidades. En
los casos en que tengamos un criterio para seleccionar un generador de cada
ideal no distinguiremos entre orden y periodos. Por ejemplo, en el caso de Z
modulos podemos considerar que el orden de un elemento de torsion m es su
unico periodo positivo, y es el menor natural a tal que am = 0.

Ejemplo Si M = Z/6Z, entonces los ordenes de sus elementos son los dados
por la tabla siguiente:
m 0 1 2 3 4 5
o 1 6 3 2 3 6
Veremos enseguida que no es casual que todos los ordenes sean divisores de 6.

Si a D, definimos M [a] = {m M | am = 0}, que claramente es un


submodulo de M .
Definimos el anulador de M como An(M ) = {d D | M [d] = M }, es decir,
el conjunto de los elementos de D que anulan a todos los elementos de M . Es
claro que tambien es un ideal de D, y si M es un modulo de torsion finitamente
generado entonces es no nulo, pues basta tomar un generador finito de M y
5.5. Modulos finitamente generados sobre DIPs 185

multiplicar un periodo de cada uno de sus miembros para obtener un elemento


no nulo de An(M ).
Si An(M ) = (e) se dice que e es un exponente de M . As, cada Dmodulo de
torsion tiene un exponente no nulo determinado salvo unidades. En el caso de
Z podemos considerar que el exponente de un Z-modulo de torsion es el unico
exponente positivo.
Por ejemplo, el exponente de Z/6Z es 6 y, en general, es claro que un expo-
nente de D/eD es e.
Es claro que el orden de todo elemento de un modulo de torsion finitamente
generado tiene que dividir a su exponente (que es lo que habamos observado
en el caso de Z/6Z).

Ejemplos Los Z-modulos de torsion mas sencillos que podemos considerar


son los modulos Z/nZ, pero no son los unicos, pues, por ejemplo, Z/2Z Z/2Z
es un Z-modulo de torsion con cuatro elementos y no es el mismo que (no es
isomorfo a) Z/4Z. Para comprobar que no son isomorfos basta calcular los
ordenes de sus elementos:
m 0 1 2 3 m (0, 0) (1, 0) (0, 1) (1, 1)
o 1 4 2 4 o 1 2 2 2
Si los modulos fueran isomorfos, tendran que tener los mismos elementos de los
mismos ordenes.
Similarmente, podramos pensar que Z/6Z y Z/2Z Z/3Z son dos ejemplos
de Z-modulos con seis elementos no isomorfos entre s, pero no es cierto. En
este caso s que son isomorfos, como se desprende del teorema siguiente:

Teorema 5.45 Si D es un dominio de ideales principales y a, b D son


elementos no nulos primos entre s, entonces

D/(ab)
= D/(a) D/(b).
Demostracion: Sea f : D/(ab) D/(a) D/(b) la aplicacion dada por
f ([x]) = ([x], [x]). Claramente es un homomorfismo de modulos, y ademas es
inyectivo, porque si [x] = 0, [x] = 0, esto significa que a | x y b | x y, como son
primos entre s, esto implica que ab | x, luego [x] = 0 (en D/(ab).
Para probar que f es suprayectivo (y, por lo tanto, un isomorfismo) usamos
la relacion de Bezout 3.22, que nos da u, v D tales que ua + vb = 1. As, dado
([x], [y]) D/(a) D/(b), una antiimagen por f es [uay + vbx].
Vamos a demostrar que los unicos D-modulos de torsion finitamente gene-
rados son, salvo isomorfismo, las sumas directas de modulos de tipo D/aD, y
que son todas distintas entre s salvo las que resultan isomorfas en virtud del
teorema anterior.
Por ejemplo, los unicos Z-modulos con 12 elementos son

Z/4Z Z/3Z, Z/2Z Z/2Z Z/3Z.


186 Captulo 5. Modulos y espacios vectoriales

No incluimos Z/12Z porque es isomorfo al primero, ni Z/2Z Z/6Z porque


es isomorfo al segundo. Observemos que el primero tiene exponente 12 y el
segundo 6.
En general, el teorema anterior implica que, a la hora de cubrir todos los
posibles Z-modulos de torsion solo hemos de considerar sumandos de cardinal
potencia de primo, pues si n no es potencia de primo, entonces Z/nZ se des-
compone en sumandos de tipo Z/(pr ).

Ejemplo Dado el Z-modulo de torsion


M = Z/6Z Z/18Z Z/10Z Z/25Z Z/15Z,
aplicando el teorema anterior vemos que es isomorfo a
M Z/2Z Z/2Z Z/2Z Z/3Z Z/3Z Z/9Z Z/5Z Z/5Z Z/25Z,
donde simplemente hemos descompuesto el orden de cada sumando en potencias
de primo. A los numeros 2, 2, 2, 3, 3, 9, 5, 5, 25 los llamaremos divisores elemen-
tales de M , y vamos a demostrar que estan determinados y determinan a M
salvo isomorfismo, en el sentido de que, por una parte, no es posible obtener otra
descomposicion de M que de lugar a un juego distinto de divisores elementales
y, por otra parte, dos Z-modulos de torsion con juegos diferentes de divisores
elementales no pueden ser isomorfos entre s.
Observemos que, en general, un D-modulo M es isomorfo a un D/(a) si y
solo si M = hxi con o(x) = (a), pues en tal caso la aplicacion D M dada
por d 7 dx es un epimorfismo de modulos de nucleo (a), luego ciertamente
M = D/(a), y el recproco es inmediato, ya que D/(a) = h[1]i y o([1]) = (a).
El teorema siguiente muestra que a todo D-modulo de torsion finitamente
generado le podemos asignar unos divisores elementales. Luego probaremos que
son unicos:
Teorema 5.46 Sea D un dominio de ideales principales y M un Dmodulo de
torsion no nulo finitamente generado. Entonces M = hm1 i hmr i, donde
cada mi tiene periodo potencia de primo.
Demostracion: Observemos en primer lugar que si a, b D son primos
entre s, entonces M [ab] = M [a] M [b].
En efecto, por la relacion de Bezout 3.22 podemos expresar ua + vb = 1,
para ciertos u, v D. As, dado m M [ab], tenemos que m = uam + vbm, con
uam M [b] y vbm M [a], luego M [ab] = M [a] + M [b]. Ademas la suma es
directa, porque si m M [a] M [b], entonces m = uam + ubm = 0.
Ahora tomamos un exponente e de M , lo descomponemos en potencias de
primos no asociados dos a dos, e = pe11 perr (notemos que no hace falta anadir
un factor unitario porque podemos eliminarlo y seguimos teniendo un periodo)
y aplicamos lo anterior:
M = M [e] = M [pe11 ] M [perr ].
5.5. Modulos finitamente generados sobre DIPs 187

Ahora basta probar que cada M [pei i ] se descompone en suma directa de


submodulos monogenos con generadores de periodo potencia de primo. Alter-
nativamente, podemos suponer que M = M [pe ] tiene exponente pe , donde p D
es primo. Entonces los periodos de todos los elementos de M son tambien (salvo
unidades) potencias de p.
Sea k = D/(p), que es un cuerpo, y observemos que M [p] tiene estructura de
k-espacio vectorial (de dimension finita) con el producto dado por [d]m = dm
(el punto relevante es que el producto esta bien definido).
Vamos a probar, por induccion sobre dimk M [p], que
M = hm1 i hmr i ,
de modo que cada mi tiene periodo pei con e1 e2 er .
Para ello tomamos m1 M tal que su periodo sea pe1 con el mayor expo-
nente e1 posible. Si M = hm1 i tenemos ya la conclusion. En caso contrario
consideramos el cociente M = M/ hm1 i, que sera no nulo. Como todos los ele-
mentos de M tienen periodo divisor de pe1 , tenemos que M = M [pe1 ]. Ahora
probamos un hecho general:
En toda clase [y] M podemos elegir un representante [y] = [y ] de
modo que [y] e y tienen el mismo periodo.
En efecto. Notemos que, en general, el periodo de una clase divide al de
cualquiera de sus representantes. Si el periodo de [y] es ps , entonces ps y hm1 i,
luego ps y = pt cm1 , con (p, c) = 1, para cierto t e1 . Si t = e1 , entonces ps y = 0,
luego el periodo de y es ps .
Si t < e1 , entonces pt cm1 tiene periodo pe1 t , luego y tiene periodo ps+e1 t ,
luego s + e1 t e1 , porque pe1 anula a y, luego s t y concluimos que
y = y pts cm1 cumple [y ] = [y] y que y tiene periodo ps .
A continuacion veamos que dimk M [p] < dimk M [p].
Para ello tomamos una k-base [x1 ], . . . , [xs ] de M [p]. Por el resultado que
acabamos de obtener, podemos suponer que cada xi tiene periodo p, es decir,
que x1 , . . . , xs M [p] y se cumple que m1 , x1 , . . . , xs M [p] son linealmente
independientes sobre k, pues si
[d]m1 + [d1 ]x1 + + [ds ]xs = 0,
entonces [d1 ][x1 ]+ + [ds ][xs ] = 0, luego [d1 ] = = [ds ] = 0, luego [d]m1 = 0,
luego [d] = 0.
As pues, podemos aplicar la hipotesis de induccion, segun la cual
M = h[m2 ]i h[mr ]i ,
donde cada [mi ] tiene periodo pei con e2 er . Segun hemos visto,
podemos exigir que cada mi tenga tambien periodo pei y, como e1 era el mayor
posible, se cumple que e1 e2 . Ahora basta ver que
M = hm1 i hmr i .
188 Captulo 5. Modulos y espacios vectoriales

En efecto, es claro que M se descompone en suma de estos submodulos.


Falta ver que la suma es directa, pero es que si

d1 m1 + + dr mr = 0,

entonces en M tenemos que [d2 m2 ] + + [dr mr ] = 0, luego, al ser la suma


directa, [d2 m2 ] = = [dr mr ] = 0, luego pei | di (para i 2), luego di mi = 0
(porque el periodo de mi es el mismo que el de [mi ]), luego d1 m1 = 0.
Segun la ultima observacion previa al teorema, ahora tenemos probado que
todo Dmodulo de torsion finitamente generado es isomorfo a una suma directa
de modulos de tipo D/aD con a potencia de primo.
Ahora falta probar la unicidad, es decir, que si un mismo modulo admite
dos descomposiciones en las condiciones del teorema anterior, aunque los gene-
radores mi puedan ser distintos, el numero de sumandos y los ordenes de estos
seran los mismos, lo cual nos permitira hablar de los divisores elementales del
modulo, que no dependeran de la eleccion de la descomposicion elegida para
calcularlos.
Hay otro tipo de descomposicion de un modulo de torsion que a menudo es
mas conveniente. La ilustramos primero con un ejemplo:

Ejemplo Consideremos de nuevo el Z-modulo de torsion de divisores elemen-


tales 2, 2, 2, 3, 3, 9, 5, 5, 25, es decir,

M = hm1 i hm2 i hm3 i hm4 i hm5 i hm6 i hm7 i hm8 i hm9 i ,

donde los ordenes de los mi son los indicados (2, 2, 2, 3, . . .). Tomemos los ge-
neradores cuyos ordenes son las mayores potencias de cada primo, en este caso
o(m3 ) = 2, o(m6 ) = 9, o(m9 ) = 25, y entonces el teorema 5.45 nos da que

hm3 i hm6 i hm9 i = hm3 i ,

con o(m3 ) = 2 9 25 = 450. De los sumandos restantes, tomamos los que


corresponden a divisores elementales con las mayores potencias de primos, en
este caso o(m2 ) = 2, o(m5 ) = 3, o(m8 ) = 5, y observamos que

hm2 i hm5 i hm8 i = hm2 i ,

con o(m2 ) = 30. Ahora nos quedan o(m1 ) = 2, o(m4 ) = 3, o(m7 ) = 5, con lo
que podemos agrupar hm1 i hm4 i hm7 i = hm1 i, con o(m1 ) = 30. En total

M = hm1 i hm2 i hm3 i ,

donde los tres generadores tienen ordenes 30, 30, 450. Observemos que hemos
empezado a numerar los generadores por el m3 porque el numero de generadores
que obtenemos mediante esta agrupacion es igual al maximo numero de divisores
elementales con la misma base.
Estos ordenes, caracterizados por que cada uno divide al siguiente, se llaman
factores invariantes de M , y vamos a ver que sucede lo mismo que con los
5.5. Modulos finitamente generados sobre DIPs 189

divisores elementales, es decir, que, por una parte, no es posible obtener dos
descomposiciones distintas de M que lleven a dos juegos distintos de factores
invariantes y, por otra parte, que dos modulos de torsion con factores invariantes
distintos no pueden ser isomorfos.

Teorema 5.47 Sea D un dominio de ideales principales y M un D-modulo


finitamente generado.
1. Existen elementos x1 , . . . , xn M tales que Mt = hx1 i hxn i y para
cada i = 1, . . . , n, o(xi ) = (pei i ), donde pi es un primo de D y ei es un
numero natural no nulo.
2. Existen elementos y1 , . . . , ym M tales que Mt = hy1 i hym i, y si
o(yi ) = (fi ), entonces para cada i = 1, . . . , m, se cumple que fi no es cero
ni unidad y si i < m, entonces fi | fi+1 .
3. Los numeros n y m, los ideales (pei i ) para i = 1, . . . , n y los ideales (fi )
para i = 1, . . . , m estan determinados por M , es decir, cualquier descom-
posicion de M en la forma indicada en 1) o en 2) da lugar a los mismos
n, m, etc. Los elementos pei i se llaman divisores elementales de M , los
elementos fi se llaman factores invariantes de M .

Demostracion: Tenemos probado 1), mientras que 2) es una consecuencia


inmediata: Dada una descomposicion de tipo 1), multiplicamos todos los primos
que aparecen como base de divisores elementales elevados al mayor exponente
posible, con lo que obtenemos el ultimo factor invariante fm (donde m es el
mayor numero de divisores elementales con la misma base) y el teorema 5.45 nos
da que las sumas de los generadores correspondientes a los divisores elementales
que hemos tomado es un ym de periodo fm . Luego formamos el factor invariante
fm1 repitiendo el proceso con los divisores elementales que quedan, y seguimos
as hasta que se acaben los divisores elementales.
En cuanto a 3), basta probar la unicidad de los factores invariantes, pues es
claro que si existieran dos descomposiciones distintas en divisores elementales,
a partir de ellas podramos obtener dos descomposiciones distintas en factores
invariantes por el procedimiento que acabamos de describir. Descomponemos
la prueba en varios pasos:
a) Sea Mt = hy1 i hym i una descomposicion tipo 2) y sea p un primo
de D. Llamando Mi = hyi i, es claro que M [p] = M1 [p] Mm [p], y que
esto es cierto tambien si consideramos a todos los modulos como D/(p)-espacios
vectoriales.
(
0 si p fi ,
b) Se cumple que dim Mi [p] =
1 si p | fi .
En efecto, si p fi , entonces un r Mi [p] es de la forma r = uyi para un
u A y pr = 0, luego puyi = 0 y fi | pu, luego fi | u, y as r = uyi = 0, o sea,
Mi [p] = 0.
190 Captulo 5. Modulos y espacios vectoriales

Si fi = pv, para un v D, entonces razonando igual que antes concluimos


que fi | pu, luego v | u, digamos u = tv, con lo que r = tvyi , y por lo tanto
Mi [p] = hvyi i (es claro que vyi Mi [p] y que es no nulo).
c) Por lo tanto la dimension de M [p] es igual al numero de factores invariantes
divisibles entre p.
d) Si tenemos dos descomposiciones tipo 2), una en m sumandos y otra en
m sumandos, tomamos un primo que divida al primer factor invariante de la
primera descomposicion (y que por lo tanto divide a los m factores invariantes).
La definicion de M [p] no depende de la descomposicion de tipo 2) escogida y
su dimension como D/(p)-espacio vectorial es, por una parte, igual al numero
de factores invariantes de la primera descomposicion divisibles entre p (o sea,
= m) y, por otra parte, es el numero de factores invariantes de la segunda
descomposicion divisibles entre p (es decir, m ). Esto prueba que m m , e
igualmente se prueba m m, luego tenemos que dos descomposiciones tipo 2)
han de tener el mismo numero de sumandos. As pues, el numero de factores
invariantes es invariante.
Mas aun, hemos probado que todo primo que divide al primer factor in-
variante de una descomposicion divide al primer factor invariante de cualquier
otra descomposicion.
e) En una descomposicion de tipo 2), el ultimo factor invariante fm es
multiplo de todos los anteriores, luego anula a todos los generadores de Mt ,
y por lo tanto a todos los elementos de Mt , luego es un exponente de Mt (en
principio, hemos probado que es un multiplo de cualquier exponente de Mt ,
pero cualquier exponente anula a ym , luego es multiplo de fm y concluimos que
es asociado a fm ). Puesto que Mt determina sus exponentes, concluimos que
dos descomposiciones tipo 2) deben tener igual (salvo unidades) el ultimo factor
invariante.
f) Vamos a probar la unicidad de los factores invariantes por induccion sobre
el numero de factores primos en que se descompone el ultimo factor invariante
de M (que ya sabemos que es invariante).
Sean dos descomposiciones tipo 2:

Mt = hy1 i hym i y Mt = hz1 i hzm i ,

la primera con factores invariantes f1 , . . . , fm y la segunda con factores inva-


riantes g1 , . . . , gm . Ya sabemos que (fm ) = (gm ).
Si fm se descompone en un solo primo, entonces fm es primo, y como los
restantes factores invariantes son divisores suyos, son todos salvo unidades ese
mismo primo, es decir, todos los fi y los gi son iguales, luego tenemos la unicidad.
Supongamos que la unicidad se cumple para modulos cuyo ultimo factor
invariante se descomponga en n factores primos y que fm se descompone en
n + 1 primos. En d) hemos probado que f1 y g1 son divisibles entre los mismos
primos. Sea p un primo que divida a ambos (luego divide a todos los fi y a
todos los gi ).
5.5. Modulos finitamente generados sobre DIPs 191

Sea pMt = {pr | r Mt }. Es claro que pMt es un submodulo de Mt y


ademas
pMt = hpy1 i hpym i = hpz1 i hpzm i .

Tambien es obvio que o(pyi ) = (fi /p) y o(pzi ) = (gi /p).

Puede ocurrir que los primeros fi sean iguales a p, con lo que los primeros su-
mandos de estas descomposiciones seran nulos. Si en ambas descomposiciones
eliminamos los primeros sumandos si son nulos, obtenemos dos descomposicio-
nes tipo 2) del modulo pMt , donde el ultimo factor invariante es fm /p, luego
podemos aplicar la hipotesis de induccion y concluir que el numero de suman-
dos nulos el igual para las dos descomposiciones, y que las restantes tienen los
mismos factores invariantes (salvo unidades), es decir, el numero de fi s iguales
a p es el mismo que el de gi s, y para los restantes, (fi /p) = (gi /p). Esto implica
la igualdad de los (fi )s y los (gi )s.

En resumen, tenemos la clasificacion siguiente de los modulos finitamente


generados sobre un dominio de ideales principales:

Teorema 5.48 Sea D un DIP y M , N dos D-modulos finitamente generados.


Entonces M = N si y solo si M y N tienen el mismo rango y los mismos
factores invariantes (o el mismo rango y los mismos divisores elementales).

Demostracion: Una implicacion es obvia. Supongamos que M y N tie-


nen el mismo rango y los mismos factores invariantes o divisores elementales.
Entonces existen descomposiciones

M = M hx1 i hxm i N = N hy1 i hym i ,

donde M y N son modulos libres del mismo rango y o(xi ) = o(yi ) para cada
i = 1, . . . , m.
Pero ya hemos observado que hxi i = D/o(xi ) = D/o(yi )
= hyi i, y por otra
parte M = N porque son dos modulos libres del mismo rango. A partir de
un isomorfismo entre cada sumando directo podemos construir un isomorfismo
entre las dos sumas, es decir, M = N.

Nota Es inmediato (y ya lo hemos usado en la demostracion precedente) que


el ultimo factor invariante de un modulo de torsion finitamente generado sobre
un DIP es precisamente el exponente del modulo. Esto es un hecho no trivial
que resulta util en algunas ocasiones: el exponente de un modulo de torsion
finitamente generado (que en principio es el mnimo comun multiplo de los
ordenes de sus elementos) es siempre el orden de uno de sus elementos.

Terminamos esta seccion con una consecuencia que necesitaremos mas ade-
lante:
192 Captulo 5. Modulos y espacios vectoriales

Teorema 5.49 Sea D un DIP, sea L un D-modulo libre de rango finito6 y sea
M un submodulo de L no nulo y finitamente generado. Entonces existe una
base B de L, existen existen elementos e1 , . . . , em B y f1 , . . . , fm D tales
que f1 e1 , . . . , fm em forman una base de M y para cada i < m se cumple que
fi | fi+1 . Ademas, los ideales (fi ) estan unvocamente determinados por L y M .

Demostracion: Vamos a probar la existencia por induccion sobre el rango


de M . Observemos que si B = {x1 , . . . , xn } es una base de L, las aplicaciones
i
B : L D que a cada x L le asignan respectivamente su coordenada
i-esima en la base B son homomorfismos de modulos y, como M 6= 0, no pueden
ser todos nulos.
En general, para cada homomorfismo h : L D, tenemos que h[M ] es un
ideal de D y, como D es noetheriano, toda familia no vaca de ideales tiene un
elemento maximal, es decir, podemos encontrar un homomorfismo h1 tal que el
ideal h1 [M ] = (f1 ) no este contenido estrictamente en ningun otro ideal de esta
i
forma. En particular f1 6= 0, pues los B [M ] no son todos nulos.
Sea y1 M tal que h1 (y1 ) = f1 . Entonces, si h : L D es cualquier
homomorfismo, se tiene que cumplir que h(y1 ) (a1 ), pues en caso contrario
(f1 ) h[M ]. En particular, esto implica que si B es cualquier base de L, las
coordenadas de todo x M en la base B tienen que ser divisibles entre f1 ,
luego todo elemento de M es divisible entre f1 . En particular y1 = f1 e1 , para
cierto e1 L.

Veamos ahora que L = he1 i N(h1 ). En efecto, tenemos que h1 (e1 ) = 1,


luego todo x L se descompone como x = h1 (x)e1 + (x h1 (x)e1 ) y el segundo
sumando esta en el nucleo N(h1 ). Ademas la suma es directa, porque si tomamos
de1 he1 i N(h1 ) al aplicar h1 sale d = 0, luego de1 = 0.

Si M = hf1 e1 i ya se cumplen las condiciones del enunciado. En caso con-


trario consideramos L1 = N(h1 ) y M1 = M L1 , y es claro entonces que
M = hx1 iM1 . Por lo tanto, M1 6= 0 es libre de rango una unidad menos que M .
Por hipotesis de induccion existe una base B1 de L1 , existen e2 , . . . , em B1 y
existen f2 , . . . , fm D tales que f2 e2 , . . . , fm em son una base de M1 y fi | fi+1 .
Es claro entonces que B = {e1 } B1 es una base de L y que f1 e1 , . . . , fm em
es una base de M . Ademas sabemos que las coordenadas de f2 e2 en la base B
(que son f2 y ceros) son divisibles entre f1 , luego f1 | f2 .

Veamos ahora la unicidad de los (fi ). Notemos que, a diferencia de lo que


sucede en el teorema 5.47, los fi pueden ser unidades de D (y entonces podemos
tomarlos iguales a 1). Pongamos que f1 = = fr = 1, que fr+1 , . . . , fm no
son unidades y que B = {e1 , . . . , en }, con m n. Entonces

L = he1 , . . . , en i , M = hf1 e1 , . . . , fm em i ,
6 Si el rango de L no es finito podemos tomar un subconjunto finito de una base de L

que permita expresar como combinaciones lineales a todos los generadores de M , y podemos
sustituir L por el submodulo generado por dicho conjunto finito, que sera un D-modulo libre
de rango finito, por lo que el teorema vale igualmente, pero en este paso se usa AE.
5.6. Apendice: Espacios vectoriales de dimension infinita 193

de donde se sigue que

L/M
= (her+1 i / hfr+1 er+1 i) (hem i / hfm em i) hem+1 i hen i .

El ultimo bloque de sumandos forma un Dmodulo libre de rango n m, mien-


tras que los primeros forman el modulo de torsion del cociente, y como es
claro que o(ei ) = (fi ), resulta que los factores invariantes de L/M son pre-
cisamente fr+1 , . . . , fm . As pues, tenemos que m es el rango de M , luego
esta unvocamente determinado, los fi no unitarios son los factores invariantes
de L/M , luego los ideales que generan estan unvocamente determinados, y el
numero de fi s unitarios es exactamente m menos el numero de fi s no unitarios,
luego todos los (fi ) estan unvocamente determinados.

5.6 Apendice: Espacios vectoriales de dimension


infinita
Recogemos aqu las pruebas de existencia y equicardinalidad de bases para
espacios vectoriales no finitamente generados. Todas ellas usan de forma esencial
el axioma de eleccion. En primer lugar probamos la existencia de bases:

Teorema 5.50 (AE) Si V es un Despacio vectorial, entonces V es libre. Mas


aun, todo subconjunto libre de V esta contenido en una base.

Demostracion: La familia de los subconjuntos libres de V que contienen a


uno dado (y siempre podemos tomar como conjunto libre dado el conjunto vaco)
esta parcialmente ordenada por la inclusion y cumple claramente las hipotesis
del lema de Zorn. Por lo tanto todo subconjunto libre de un espacio vectorial
esta contenido en uno maximal para la inclusion.
En realidad, la prueba vale hasta aqu para modulos cualesquiera, pero ahora
observamos que todo subconjunto libre X de un D-espacio vectorial maximal
para la inclusion es generador y, por lo tanto, base. En efecto, si no es gene-
rador, existe un v V que no es combinacion lineal de elementos de X, y por
la observacion previa al teorema anterior concluimos que X {v} es libre y
contradice la maximalidad de X.
El hecho de que todo generador contiene una base tambien es cierto en
general:

Teorema 5.51 (AE) Si V es un Despacio vectorial, todo generador de V


contiene una base.

Demostracion: Sea X un generador de V . El lema de Zorn nos garantiza


la existencia de un conjunto libre B X maximal respecto a la inclusion (es
decir, tal que no esta estrictamente contenido en ningun otro subconjunto libre
de X). Se cumple que X hBi, pues si existiera un elemento x X \ hBi,
entonces tenemos que B {x} es libre y esta contenido en X, en contradiccion
con la maximalidad de B.
194 Captulo 5. Modulos y espacios vectoriales

Por lo tanto V = hXi hBi, es decir, V = hBi, y as el conjunto B es una


base de V contenida en X.
Ahora podemos demostrar que todas las bases de un espacio vectorial tienen
el mismo cardinal:

Teorema 5.52 (AE) Si X e Y son dos bases de un mismo D-espacio vectorial,


entonces existe una biyeccion X Y .

Demostracion: Sea V un espacio vectorial con bases X e Y . Como ya


hemos probado el teorema 5.22, podemos suponer que V no es finitamente
generado, con lo que las dos bases son infinitas.
Cada x X puede expresarseScomo combinacion lineal de un conjunto
finito Yx Y . Si llamamos Y0 = Yx , tenemos que todo elemento de X es
xX
combinacion lineal de elementos de Y0 , luego X hY0 i, luego V = hXi hY0 i.
Esto implica que Y = Y0 , pues un elemento de Y \ Y0 podra expresarse como
combinacion lineal de elementos de Y0 , y entonces Y no sera libre.
Fijando una enumeracion de cada conjunto Yx , podemos definir una apli-
cacion inyectiva Y X N (a cada y Y le asignamos un par (x, i), donde
y es el i-esimo elemento de Yx ). El teorema B.11 nos da entonces una apli-
cacion inyectiva Y X. Similarmente obtenemos una aplicacion inyectiva
X Y , luego el teorema de Cantor-Bernstein implica que existe la biyeccion
del enunciado.
Admitiendo, tal y como indicamos en el apendice B, que es posible defi-
nir el cardinal de un conjunto arbitrario de modo que dos conjuntos tienen el
mismo cardinal si y solo si son biyectables, ahora es claro que la definicion de
la dimension 5.24 es valida para todo espacio vectorial, si bien nosotros solo la
usaremos en el caso de espacios de dimension finita.
Igualmente, el lector familiarizado con la teora de cardinales infinitos con-
cluira ahora que la prueba del teorema 5.25 es valida para modulos no nece-
sariamente finitamente generados, por lo que la definicion del rango 5.26 libre
vale para todo modulo libre sobre un anillo conmutativo y unitario.
Captulo VI

Grupos

La estructura de grupo, que vamos a estudiar aqu, es la mas simple de to-


das las que hemos estudiado hasta ahora y en parte por esa misma razon
una de las que aparecen con frecuencia en los contextos mas diversos, y que
contribuye en mayor medida a unificar situaciones aparentemente muy alejadas
entre s a traves de un mismo patron teorico. Los problemas que pueden abor-
darse mediante el estudio de ciertos grupos varan entre estudiar la posibilidad
de dibujar una figura con regla y compas hasta estudiar si ciertos anillos tienen
factorizacion unica, pasando por muchos otros contextos aritmeticos, algebrai-
cos, geometricos, topologicos, etc.

6.1 Conceptos basicos


Definicion 6.1 Un grupo es un par ordenado (G, ), donde G es un conjunto
y : G G G es una ley de composicion interna en G que sea asociativa,
tenga elemento neutro y todo elemento de G tenga un opuesto. Si ademas es
conmutativa se dice que (G, ) es un grupo abeliano. En la practica escribiremos
G en lugar de (G, ).

Tal y como explicamos en la seccion 2.1 al tratar el concepto de semigrupo,


el elemento neutro de un grupo G es unico, y tambien lo es el opuesto de cada
elemento de G.
Habitualmente usaremos la notacion multiplicativa, en la cual la operacion
del grupo se representa por , el elemento neutro se representa por 1 (de modo
que g 1 = 1 g = g para todo g G) y el opuesto de un g G se representa por
g 1 (de modo que gg 1 = g 1 g = 1) y se llama habitualmente inverso de g.
No obstante, para grupos abelianos usaremos tambien la notacion aditiva,
en la cual la operacion del grupo se representa por +, el elemento neutro se
representa por 0 (de modo que g + 0 = 0 + g = g para todo g G) y el opuesto
de un g G se representa por g (de modo que g g = g + g = 0 para todo
g G) y se llama habitualmente simetrico de g.

195
196 Captulo 6. Grupos

Una relacion basica al operar en un grupo es que (g1 g2 )1 = g21 g11 (donde
el cambio de orden es crucial si los elementos no conmutan), lo cual se justifica
sin mas que comprobar que g1 g2 g21 g11 = 1.
En la seccion 2.1 vimos que en todo semigrupo con elemento neutro estan
definidas las potencias g n para n N. En el caso de un grupo podemos definir,
de hecho, g n para todo n Z estableciendo que g n = (g 1 )n cuando n < 0.
Comprobaciones rutinarias muestran que se cumplen las propiedades:

g m+n = g m g n , (g m )n = g mn , (g1 g2 )m = g1m g2m si g1 g2 = g2 g1 .

Con notacion aditiva (para grupos abelianos) estas propiedades se expresan


as:

(m + n)g = mg + ng, n(mg) = (nm)g, m(g1 + g2 ) = mg1 + mg2 .

Esto significa que si (G, +) es un grupo abeliano, el producto Z G G


que acabamos de definir hace que (G, +, ) sea un Z-modulo. Recprocamente,
si (G, +, ) es cualquier Z-modulo, entonces (G, +) es un grupo abeliano y el
producto es precisamente el que acabamos de definir.
Como consecuencia, vemos que los grupos abelianos se corresponden biunvo-
camente con los Z-modulos, en el sentido de que cada grupo abeliano admite una
unica estructura de Z-modulo (con la suma dada por la operacion del grupo) y
cada Z-modulo es un grupo abeliano con su suma.
En definitiva, un grupo abeliano es esencialmente lo mismo que un Z-modulo,
por lo que el autentico aporte de la teora de grupos frente a la teora de modulos
aparece al tratar con grupos no abelianos.
Antes de adentrarnos en el estudio de los grupos conviene senalar algunos
ejemplos de grupos que ya nos hemos encontrado:

Los Z-modulos son los grupos abelianos.


Si A es un anillo unitario, el conjunto U (A) de las unidades de A es un
grupo con la restriccion del producto de A, por lo que es habitual referirse
a el como el grupo de las unidades de A.
En particular, si D es un anillo de division (o un cuerpo), su grupo de
unidades es D = {d D | d 6= 0} y se llama grupo multiplicativo de D.
Si A es un anillo unitario, el conjunto LG(n, A) de las matrices regulares
n n con coeficientes en A es un grupo con el producto de matrices, que
se conoce como el grupo lineal general de dimension n en A.
Si A es un anillo, el conjunto Aut A de los automorfismos de A (isomor-
fismos de A en s mismo) es un grupo con la composicion de aplicaciones.
Igualmente, si M es un D-modulo, el conjunto AutD (M ) de los automor-
fismos de M es un grupo con la composicion de aplicaciones.
6.1. Conceptos basicos 197

Mas en general, el conjunto de aplicaciones biyectivas f : X X tales que


tanto f como f 1 conservan una estructura en X es habitualmente un grupo
con la composicion de aplicaciones. Esto incluye a los homeomorfismos de un
espacio topologico en s mismo, a las biyecciones afines de un espacio afn en s
mismo, a las isometras de un espacio metrico en s mismo, etc.

Homomorfismos Los conceptos basicos de la teora de grupos son variantes


de los que ya hemos visto para modulos. Empezamos por el de homomorfismo:

Definicion 6.2 Una aplicacion f : G H entre dos grupos G y H es un


homomorfismo de grupos si cumple f (uv) = f (u)f (v) para todo u, v G.

La aplicacion f es un monomorfismo, epimorfismo o isomorfismo de grupos si


ademas es inyectiva, suprayectiva o biyectiva, respectivamente. Un isomorfismo
de un grupo G en s mismo es un automorfismo de G. Llamaremos Aut G al
conjunto de todos los automorfismos de un grupo G.
Es facil ver que la composicion de homomorfismos de grupos es un homomor-
fismo y que la inversa de un isomorfismo de grupos es tambien un isomorfismo.
En particular, resulta que Aut G es un grupo con la composicion de aplicaciones.
Diremos que dos grupos G y H son isomorfos si existe un isomorfismo entre
ellos, y lo representaremos por G = H. En tal caso G y H tienen las mismas
propiedades definibles a partir de la estructura de grupo.
Notemos que, en un grupo G, el elemento neutro es el unico g G que cumple
gg = g. Como consecuencia, si f : G H es un homomorfismo de grupos, se
cumple f (g)f (g) = f (g), luego f (1) = 1. Ademas, como f (g)f (g 1 ) = f (1) = 1,
tambien se cumple que f (g 1 ) = f (g)1 .

Subgrupos Pasamos ahora al concepto de subgrupo, analogo al de submodulo:

Definicion 6.3 Si G es un grupo, un subgrupo de G es un grupo H G tal


que el producto de dos elementos de H sea el mismo calculado en H o en G. Lo
representaremos por H G.

Notemos que si H G entonces el elemento neutro de H es el mismo que el


de G, pues es el unico elemento de H o de G que cumple hh = h. Igualmente,
el inverso de un h H es el mismo en H o en G, pues el inverso en h cumple
tambien las condiciones para ser su inverso en G, y este es unico.
Por lo tanto, si H G entonces H es un subconjunto de G tal que el
producto de dos elementos de H esta en H, el neutro de G esta en H y el
inverso de cada elemento de H esta en H. Recprocamente, todo subconjunto
de H que cumpla estas condiciones puede dotarse de forma unica de estructura
de grupo de modo que sea un subgrupo de G (estableciendo que el producto de
dos elementos de H sea su producto en G). En la practica conviene resumir
estas condiciones en una sola:
198 Captulo 6. Grupos

Teorema 6.4 Sea G un grupo y H un subconjunto no vaco de G. Entonces


H es un subgrupo de G (con la restriccion del producto de G) si y solo si para
todos los elementos h1 , h2 H se cumple h1 h1
2 H.

Demostracion: Obviamente un subgrupo debe cumplir esta condicion. Si


H la cumple, por ser no vaco existe h H, luego 1 = hh1 H. Ademas, si
h H, entonces h1 = 1 h1 H, y si h1 , h2 H, tenemos que h1 , h1
2 H,
luego h1 h2 = h1 (h1
2 )1
H. Esto prueba que H G.
Todo grupo G tiene como subgrupos el propio G y el subgrupo 1 = {1},
llamado subgrupo trivial. Los grupos 1 y G se llaman subgrupos impropios de G.
Cualquier otro subgrupo es un subgrupo propio.
Si f : G H es un homomorfismo de grupos, G1 G y H1 H, es facil
ver que f [G1 ] H y que f 1 [H1 ] G. En particular se define el nucleo de f
como el subgrupo N(f ) = f 1 [1] = {g G | f (g) = 1} G y la imagen de f
como el subgrupo Im f = f [G] H.
Al igual que sucede con los homomorfismos de anillos y de modulos, un
homomorfismo de grupos es inyectivo si y solo si su nucleo es trivial.
A la hora de definir los grupos cociente nos encontramos con una dificultad, y
es que en grupos no abelianos podemos definir la relacion de congruencia de dos
formas distintas. Por ello la definicion de los grupos cociente requiere algunos
conceptos adicionales que veremos despues. De momento nos limitaremos a
definir las congruencias y probaremos algunos resultados elementales en torno
a ellas, necesarios en el estudio de los subgrupos en general.

Definicion 6.5 Sea G un grupo y H G. Diremos que u, v G son con-


gruentes por la izquierda modulo H (y lo representaremos u i v (mod H)) si
cumplen u1 v H.
Diremos que u y v son congruentes por la derecha modulo H (y lo represen-
taremos u d v (mod H)) si cumplen uv 1 H.

Es muy facil comprobar que ambas relaciones son de equivalencia y que la


clase de equivalencia de un elemento a G para la congruencia por la izquierda
es el conjunto aH = {ah | h H}, mientras que la clase de equivalencia de a
para la congruencia por la derecha es Ha = {ha | h H}.
Llamaremos (G/H)i y (G/H)d a los conjuntos cociente para las relaciones
de congruencia modulo H por la izquierda y por la derecha, respectivamente.
En general se cumple que todas las clases de congruencia modulo H tienen
tantos elementos como H, pues la aplicacion que a cada h H le asigna el
elemento ah aH biyecta H con aH (e igualmente por la derecha).
As pues, si G es finito, los dos conjuntos cociente (G/H)i y (G/H)d tienen
cardinal igual a |G|/|H|. A este cardinal lo llamaremos ndice del subgrupo H
en el grupo G, y lo representaremos por |G : H|.
Por otra parte, es costumbre llamar orden de un grupo a su numero de
elementos, es decir, a su cardinal.
6.1. Conceptos basicos 199

Tenemos demostrado el teorema siguiente:

Teorema 6.6 (Teorema de Lagrange) Sea G un grupo finito1 y H G.


Entonces |G| = |G : H| |H|. En particular el orden de todo subgrupo de G es
un divisor del orden de G.

Generadores, grupos cclicos Es inmediato que la interseccion de toda


familia de subgrupos de un grupo dado es de nuevo un subgrupo, lo cual nos
permite definir el subgrupo generado por un conjunto:

Definicion 6.7 Sea G un grupo y X G. Llamaremos subgrupo generado


por X a la interseccion de todos los subgrupos de G que contienen a X. Lo
representaremos mediante hXi.
Si G = hXi diremos que el conjunto X es un generador de G. Un grupo que
admite un generador con un solo elemento es un grupo cclico.

Los elementos del submodulo generado por un conjunto de generadores son


las combinaciones lineales de los generadores. En el caso de los grupos la si-
tuacion es mas complicada debido a que no podemos contar con la propiedad
conmutativa:

Teorema 6.8 Sea G un grupo, X un subconjunto de G, X 1 = {x1 | x X}


y g un elemento de G. Entonces:
1. hXi = {x1 xn | n N, x1 , . . . , xn X X 1 }.

2. Si G es finito hXi = {x1 xn | x1 , . . . , xn X}.

3. hgi = {g n | n Z}.

4. Si hgi = m, entonces hgi = {1, g, . . . , g m1 } y g n = 1 si y solo si m | n.

Demostracion: 1) Sea H = {x1 xn | n N, x1 , . . . , xn X X 1 }.


Tenemos que hXi es un grupo que contiene a los elementos de X, luego tambien
a sus inversos y a los productos que pueden formarse entre ellos. Por lo tanto
H hXi. Es facil ver que H es un subgrupo de G y obviamente contiene a X,
luego hXi H.
2) Basta ver que si G es finito y x G, entonces x1 = xm para cierto
numero natural m. As un elemento de X 1 puede ser sustituido por varios
factores (iguales) de X.
Esto es cierto porque las potencias x, x2 , x3 , . . . no pueden ser todas distintas
(ya que solo pueden tomar un numero finito de valores), por lo que existen dos
numeros naturales m < n tales que xm = xn .
Entonces xnm = 1 con n m > 0, luego x1 = xnm1 , con n m 1 0.
3) Es consecuencia inmediata de 1).
1 El lector familiarizado con la teora de cardinales infinitos observara que la demostracion

que hemos dado vale igualmente si el grupo G es infinito.


200 Captulo 6. Grupos

4) En la prueba de 2) hemos visto que existe un numero natural n 6= 0


tal que g n = 1. Tomemos el menor natural n que cumple esto. Entonces los
elementos 1, g, g 2 , . . . g n1 son todos distintos, pues si dos de ellos coincidieran,
g i = g j con i < j, entonces tendramos g ji = 1 con 0 < j i < n, en contra
de la eleccion de n. A partir de n las potencias de g se repiten, pues si k Z y
k = nc + r, con 0 r < n, entonces g k = (g n )c g r = g r . En particular g k = 1 si
y solo si n | k.
As pues, hgi = {1, g, g 2 , . . . , g n1 }, por lo que n es el orden de hgi, o sea,
n = m.

El teorema anterior nos proporciona mucha informacion sobre los grupos


cclicos. Un hecho obvio es que todo grupo cclico es abeliano, pues dos elementos
de un grupo cclico son de la forma g i y g j , para ciertos numeros enteros i y j,
luego su producto en cualquier orden es g i+j = g j+i .

As pues, si G = hgi es un grupo cclico, podemos considerarlo como un Z-


modulo, y la aplicacion f : Z hgi dada por f (n) = g n es un epimorfismo de
Z-modulos (notemos que en G estamos usando notacion multiplicativa, lo cual
no es habitual cuando hablamos de Z-modulos en general). Ahora observamos
que el nucleo N(f ) es un Z-submodulo de Z, es decir, un ideal, luego N(f ) = (n),
para cierto numero natural n. Si n = 0 entonces f es un isomorfismo, y tenemos
que G = Z como Z-modulos, luego tambien como grupos abelianos. En otro caso
el teorema de isomorfa nos da que G = Z/nZ. As pues, tenemos clasificados
todos los grupos cclicos salvo isomorfismo:

Teorema 6.9 Sea G = hgi un grupo cclico.

1. Si G es infinito, entonces G = Z y cada elemento de G se expresa de


forma unica como g m , con m Z.

2. Si |G| = n, entonces G = Z/nZ, y G = {1, g, . . . , g n1 }, de modo que


g = g si y solo si i j (mod n). En particular, g i = 1 si y solo si n | i.
i j

Conviene introducir el concepto siguiente:



Definicion 6.10 Sea G un grupo y g G. Se llama orden de g a o(g) = hgi .

As, si o(g) es infinito tenemos que hgi


= Z y estamos en el primer caso del
teorema anterior, mientras que si o(g) = n, entonces n es el menor natural no
nulo que hace que g n = 1, y estamos en el segundo caso del teorema anterior.

Notemos que este concepto de orden es un caso particular del definido en 5.44
para modulos finitamente generados sobre un DIP.

En el contexto de la teora de grupos es costumbre llamar Cn = Z/nZ, de


modo que decir que un grupo G es cclico de orden n es equivalente a decir que
G
= Cn .
6.1. Conceptos basicos 201

Ejemplo Consideremos el grupo multiplicativo U13 del cuerpo Z/13Z, que es


un grupo abeliano de orden 12. La tabla siguiente muestra los ordenes de sus
elementos:
1 2 3 4 5 6 7 8 9 10 11 12
o 1 12 3 6 4 12 12 4 3 6 12 2
Por ejemplo, la tabla siguiente muestra la comprobacion de que o(2) = 12:
n 0 1 2 3 4 5 6 7 8 9 10 11
2n 1 2 4 8 3 6 12 11 9 5 10 7
vemos que las potencias de 2 no se repiten hasta 212 = 7 2 = 14 = 1, luego 12
es el menor exponente no nulo que cumple 2n = 1.
Si interpretamos la primera fila de la tabla anterior como los elementos
de Z/12Z, entonces la tabla muestra el isomorfismo Z/12Z U13 dado por
n 7 2n . Las propiedades de los elementos de U13 se comprenden mejor a traves
de este isomorfismo. Por ejemplo, a priori no podamos saber que 3 iba a tener
orden orden 3 en U13 , pero si sabemos que 3 = 24 , entonces es obvio, pues si 12
es el menor natural que cumple 2n = 1, entonces el menor natural que cumple
(24 )m = 1 es m = 3. El apartado 2) de 6.12 nos da la formula general para el
orden de una potencia g m en funcion del orden de g.
Es facil ver que
h3i = {1, 3, 9}, h4i = {1, 3, 4, 10, 9, 12}, h5i = {1, 5, 8, 12}, h12i = {1, 12},
y estos son todos los subgrupos cclicos propios de U13 pues, los elementos de
orden 12 generan todo U13 , 1 genera el subgrupo trivial y los demas generan
alguno de los tres subgrupos anteriores. Por ejemplo, h9i = h3i. El teorema
siguiente implica que son todos los subgrupos propios de U13 , de modo que en
total tiene 6 subgrupos, de ordenes 1, 2, 3, 4, 6, 12, respectivamente. Vemos que
hay uno para cada orden posible divisor de 12. Esto no es casual.

Teorema 6.11 Todo subgrupo de un grupo cclico es cclico.


Demostracion: Sea G = hgi un grupo cclico. Hemos visto que la apli-
cacion f : Z G dada por f (n) = g n es un epimorfismo de grupos. Si
H G, entonces f 1 [H] Z, pero los subgrupos de Z coinciden con los ideales
(son sus Z-submodulos), luego existe un m Z tal que f 1 [H] = mZ, luego
H = {g mn | n Z} = hg m i.
El teorema siguiente recoge los hechos basicos sobre los grupos cclicos finitos:
Teorema 6.12 Sea G = hgi un grupo cclico de orden n.



1. Si m es un numero entero, g m = g d , donde d = (m, n).
2. En general o(g m ) = n/(m, n).
3. Si m | n, el grupo G tiene un unico subgrupo de orden m.
202 Captulo 6. Grupos
r

Demostraci

on: 1) Sea m = rd. Entonces g m = g d g d , luego
hg m i g d . Por otra parte, la relacion de Bezout nos da enteros a y b tales
que d = am + bn.

a d a a
As, g d = (g m ) (g n ) = (g m ) 1 = (g m ) hg m i, luego g d hg m i.
2) Por el apartado anterior, basta probar que si d | n, entonces o(g d ) = n/d,
pero es obvio que (g d )n/d = g n = 1 y n/d es el menor natural que cumple esto,
ya que si (g d )m = 1, entonces n | dm, luego n/d | m, luego n/d m.
3) De 2) se deduce que si m | n, entonces G tiene
un
subgrupo

de orden
m. Si G tiene dos subgrupos de orden m, digamos g r y g r , entonces se
r r
cumple

r
qued
o(g
)r = o(g ) = m, luego por 2) (r, n) = (r , n) = d, y por 1)
g = g = g .

Ejercicio: Probar que todo grupo de orden primo es cclico.

Al calcular los ordenes de los elementos de U13 hemos visto que haba varios
elementos de orden 12, pero en principio no tendra por que haber sido as. Hay
grupos abelianos de orden 12 que no tienen elementos de orden 12, como es el
caso de Z/2Z Z/6Z. Sin embargo, el hecho de que U13 sea cclico no es casual,
sino que es consecuencia del teorema siguiente, el cual se basa a su vez en el
teorema de estructura de los modulos finitamente generados sobre un DIP que
demostramos en el captulo anterior:

Teorema 6.13 Todo subgrupo finito del grupo de unidades de un dominio n-


tegro es cclico.

Demostracion: Sea D un dominio ntegro y sea K su cuerpo de cocientes.


Entonces D K , luego basta probar que todo subgrupo finito del grupo
multiplicativo de un cuerpo es cclico. Sea, pues, G K finito. Entonces G es
un Z-modulo finitamente generado de torsion (por ser finito). Ahora tenemos en
cuenta la nota tras el teorema 5.48, segun la cual el exponente m de G coincide
con el ultimo factor invariante y es, por lo tanto, el orden de un elemento de
G. Consideramos ahora el polinomio xm 1 K[x]. El hecho de que m sea el
exponente de G se traduce en que todos los elementos de G son races de este
polinomio, pero el numero de races de un polinomio en un cuerpo no puede
exceder a su grado, luego |G| m. Como G tiene un elemento de orden m,
tiene que ser |G| = m, y G es cclico.
As pues, como Z/pZ es un cuerpo, su grupo multiplicativo Up es un grupo
cclico de orden p 1.

El grupo cuaternio Veamos un ejemplo de grupo finito no abeliano. Con-


sideremos el cuerpo k = Z/3Z = {0, 1, 1} y el grupo LG(2, k) de las matrices
regulares 2 2 con coeficientes en k. Seleccionamos las dos matrices siguientes:
   
1 1 1 1
i= , j= ,
1 1 1 1
6.1. Conceptos basicos 203

y vamos a estudiar el grupo Q8 = hi, ji. Se trata de un grupo finito, pues


obviamente LG(2, k) es un grupo finito. En primer lugar tenemos que comprobar
que las dos matrices i, j son realmente regulares, pero esto se ve al calcular sus
potencias:
     
1 0 1 1 1 0
i2 = , i3 = , i4 = ,
0 1 1 1 0 1
     
2 1 0 3 1 1 4 1 0
j = , j = , j = .
0 1 1 1 0 1
Esto prueba que i, j tienen por inversas respectivas a i3 , j 3 . Todas las matrices
que hemos calculado son elementos de Q8 . Vamos a darles nombres descriptivos.
La matriz identidad es el elemento neutro de Q8 , por lo que la llamaremos
 
1 0
1= .
0 1

A la matriz i2 , que es la identidad cambiada de signo, la llamaremos 1, de


modo que i2 = j 2 = 1 y (1)2 = 1. Como i3 y j 3 resultan de cambiar el
signo a i, j, respectivamente, llamaremos a estas matrices i y j, con lo que
se cumple que i3 = i, j 3 = j. Notemos que i = (1)i, donde aqu 1 es la
matriz i2 = j 2 .
Con esto tenemos ya seis elementos distintos en Q8 , a saber, las matrices
1, i, j. No son las unicas, pues tambien estan
   
0 1 0 1
k = ij = , ji = = (1)k = k.
1 0 1 0

(La ultima igualdad es una definicion, es decir, llamamos k a la matriz (1)k.)


Se cumple que Q8 = {1, i, j, k}. En efecto, basta tener en cuenta que

(1)i = i = i(1), (1)j = j = j(1), ji = ij.

En principio, todo elemento de Q8 se expresa como productos de is y js,


pero las relaciones anteriores permiten pasar todas las is a la izquierda y todas
las js a la derecha, con lo que llegamos a que todo elemento de Q8 es de la
forma im j n , y a su vez m y n pueden reducirse a 1 o 3, lo que solo nos deja
8 opciones posibles. As pues, por una parte Q8 tiene a lo sumo 8 elementos y,
por otra parte, hemos encontrado 8 elementos distintos en el, luego no hay mas.
El algebra del grupo cuaternio se recuerda facilmente si tenemos en cuenta
que
i2 = j 2 = k 2 = 1, (1)2 = 1,
(1)i = i(1) = i, (1)j = j(1) = j, (1)k = k(1) = k,
y que al multiplicar dos de los tres elementos i, j, k se obtiene el tercero si el
producto se hace en el sentido que indican las flechas:
204 Captulo 6. Grupos

i j


k
y el tercero cambiado de signo si se hace en sentido contrario, es decir:

ij = k, jk = i, ki = j, ji = k, kj = i, ik = j.

Vemos, pues, que Q8 es un grupo no abeliano que tiene cuatro subgrupos


cclicos propios:

h1i = {1, 1}, hii = {1, i}, hji = {1, j}, hki = {1, k}.

De hecho, no hay mas subgrupos, pues 1 es el unico elemento de orden 2,


luego no puede haber mas subgrupos de orden 2, y un subgrupo de orden 4
debe contener a alguno de los elementos i, j, k, y como todos ellos tienen
orden 4, el subgrupo sera necesariamente el generado por uno de ellos, que es
uno de los tres subgrupos de orden 4 que ya hemos mostrado.

6.2 Grupos de permutaciones


Antes de seguir introduciendo nuevos conceptos sobre grupos, vamos a estu-
diar con detalle una familia concreta de grupos finitos que nos ayudara a ilustrar
la teora.
En 1.37 hemos definido el conjunto A de todas las biyecciones f : A A,
donde A es un conjunto arbitrario. Ahora es inmediato que dicho conjunto tiene
estructura de grupo con la operacion dada por la composicion de aplicaciones.
Se le llama grupo simetrico del conjunto A. A los elementos de A se les llama
permutaciones de A.
El teorema 1.38 afirma que si A es un conjunto finito con n elementos,
entonces el orden de A es n!
Es inmediato que si dos conjuntos A y B tienen el mismo cardinal, entonces
los grupos simetricos A y B son isomorfos. Basta tomar una aplicacion
biyectiva h : A B y asignar a cada permutacion f A la permutacion
h1 f h B .
En otras palabras, da igual hablar de las permutaciones del conjunto {a, b, c}
que del conjunto {1, 2, 3}. El isomorfismo entre ambos grupos se obtiene cam-
biando el nombre a los elementos. Por ejemplo, la permutacion que enva el 1
al 2, el 2 al 3 y el 3 al 1 se corresponde con la que enva a a b, b a c y c a a.
Por lo tanto, a efectos practicos, el estudio de los grupos de permutaciones de
conjuntos finitos se reduce al de los grupos de permutaciones de los conjuntos
In = {1, . . . , n}. Al grupo simetrico sobre este conjunto lo representaremos
por n , y nos referiremos a el como el grupo de permutaciones de n elementos.
6.2. Grupos de permutaciones 205

Acciones de grupos Un grupo de permutaciones es un caso particular de


una situacion que conviene estudiar en un contexto mas general:
Definicion 6.14 Una accion de un grupo G sobre un conjunto es una apli-
cacion G que cumple las propiedades siguientes (para todos los a
y todos los g1 , g2 G):
1. (ag1 )g2 = a(g1 g2 ).
2. a1 = a.
Cuando hablemos de un grupo G que actua sobre un conjunto , esto debe
entenderse como que estamos considerando una cierta accion de G sobre .
Por ejemplo, si G , entonces G actua sobre mediante la accion dada
por a = (a).
En general, si G actua sobre un conjunto , a cada g G le podemos asignar
la aplicacion g : dada por g (a) = ag. Se cumple que es inyectiva,
pues si g (a) = g (b), entonces ag = bg, luego, multiplicando por g 1 , queda
que a = b. Tambien es suprayectiva, pues g (ag 1 )) = a. As pues, g .
Por consiguiente, tenemos una aplicacion : G que resulta ser un
homomorfismo de grupos. En efecto, se trata de probar que gh = g h , para
lo cual tomamos a y comprobamos que
gh (a) = agh = (ag)h = h (g (a)) = (g h )(a).
Recprocamente, todo homomorfismo : G determina una accion de
G en dada por ag = g (a) cuyo homomorfismo asociado es el propio . As
pues, podemos identificar las acciones de un grupo G en un conjunto con los
homomorfismos : G .
As pues, un grupo G actua sobre un conjunto cuando podemos asociar
a cada elemento de G una permutacion de de modo que la asociacion sea
un homomorfismo de grupos (pero el homomorfismo no tiene por que ser
inyectivo, de manera que dos elementos de g pueden inducir en la misma
permutacion).
Es obvio que si un grupo G actua sobre un conjunto , todo H G actua
sobre con la accion en la que, para cada h H, el elemento ah es el deter-
minado por h como elemento de G. Si la accion de G se corresponde con el
homomorfismo , la de H se corresponde con la restriccion |H .
Podemos pensar que cuando un grupo G actua sobre un conjunto cada
elemento g G transforma cada elemento a en otro ag , y podemos
considerar todos los elementos de por los que pasa uno dado a medida
que actuan sobre el los distintos elementos de G. Esto se concreta mediante la
definicion siguiente:
Si un grupo G actua sobre un conjunto , definimos en la relacion dada
por
a b si y solo si existe g G tal que ag = b.
206 Captulo 6. Grupos

Es facil ver que se trata de una relacion de equivalencia. La clase de equi-


valencia de un elemento a A recibe el nombre de orbita de a bajo G, y esta
formada por todos los elementos de en que se puede transformar a mediante
los elementos de G. La representaremos por a .
Por otra parte, si a , definimos el estabilizador de a como el conjunto
Ga = {g G | ag = a}, es decir, el conjunto de elementos de G que dejan
invariante a a. Es inmediato comprobar que Ga G.
Entre estos conceptos existe una relacion fundamental:
Teorema 6.15 Sea G un grupo que actua sobre un conjunto y sea a .
Entonces |a | = |G : Ga |. En particular, si G es finito, el cardinal de las orbitas
que determina en divide al orden de G.
Demostracion: Definimos f : (G/Ga )d a mediante f (Ga g) = ag. La
aplicacion esta bien definida, pues si Ga g = Ga g , entonces g g 1 Ga , luego
ag g 1 = a, luego ag = ag.
La aplicacion f es suprayectiva, pues todo b a es de la forma b = ag,
para cierto g G, y tambien es inyectiva, pues si f (Ga g) = f (Ga g ), entonces
ag = ag , luego ag g 1 = a, luego g g 1 Ga , luego Ga g = Ga g. Por lo tanto
f es biyectiva, y as |a | = |(G/Ga )d | = |G : Ga |.

Ejemplo Consideremos la aplicacion g 8 dada por


g = {(1, 3), (2, 7), (3, 4), (4, 1), (5, 8), (6, 6), (7, 2), (8, 5)}.
La figura siguiente nos permite visualizarla mejor:
1 3 7 8




6
4 2 5
Las agrupaciones que vemos en la figura son precisamente las orbitas de
la accion sobre I8 del grupo G = hgi. En efecto, tenemos que 1g = 3 y 3g = 4,
luego 1g 2 = 4, e igualmente 1g 3 = 1, luego 1g 4 = 3, y as vemos que cualquier
elemento de G transforma el 1 en uno de los tres numeros 1, 3, 4. Igualmente se
razona con las demas, luego concluimos que la accion de G sobre I8 determina
cuatro orbitas, que son
{1, 3, 4}, {2, 7}, {5, 8}, {6}.

Ciclos Consideremos, en general, una permutacion g n , sea G = hgi y


sea a In . Entonces la orbita de a respecto de G es {ag m | m Z}. Ahora
bien, como tiene que ser un conjunto finito, existen enteros m1 < m2 tales
que ag m1 = ag m2 , luego ag m2 m1 = a. En suma, existe un numero natural
m > 0 tal que ag m = a. Si m es el menor posible y k es cualquier numero
entero, entonces k = mc + r, con 0 r < m, y ag k = a(g m )c g r = ag r . En
suma, la orbita de a es en realidad {a, ag, . . . ag m1 }, y tiene cardinal m, pues si
ag i = ag j con 0 i < j < m, entonces aji = 0, con j i < m, en contradiccion
con la minimalidad de m.
6.2. Grupos de permutaciones 207

As pues, al ir aplicando a un elemento a las potencias sucesivas de g vamos


obteniendo elementos distintos

a 7 ag 7 ag 2 7 7 ag m1 7 a

hasta que, para un cierto m, se cumple ag m = a, y a partir de ah, si seguimos


aplicando g, los elementos de la orbita se van repitiendo cclicamente. El ejemplo
anterior muestra varios casos concretos de esta situacion:

1 7 3 7 4 7 1 7 3 7 4 7 2 7 7 7 2 7 7 7

5 7 8 7 5 7 8 7 6 7 6 7 6 7

Definicion 6.16 Sea g n una permutacion, sea G = hgi y sea a In .


Diremos que g es un ciclo si todas las orbitas que determina en In son triviales
(en el sentido de que tienen un unico elemento) excepto una. La longitud de un
ciclo se define como el cardinal de su orbita no trivial. Los ciclos de longitud 2
se llaman trasposiciones.
En general, cuando hablemos de la orbita de un ciclo se entendera que nos
referimos a su orbita no trivial. Diremos que dos ciclos son disjuntos si sus
orbitas lo son.

Si un ciclo g tiene orbita {a, ag, . . . , ag m1 }, con ag m = a, lo representaremos


con la notacion
g = (a, ag, . . . , ag m1 ).
Por ejemplo, el ciclo (1, 3, 4) = (4, 1, 3) = (3, 4, 1) 8 es la permutacion
que cumple

1 7 3 7 4 7 1, 2 7 2, 5 7 5, 6 7 6, 7 7 7, 8 7 8.

Notemos que, en general, si g es un ciclo de longitud m y a es un elemento


de su orbita, tenemos que ag m = 1, y entonces g m fija a todos los elementos de
la orbita de a, pues otro cualquiera es de la forma ag i , y resulta que

ag i g m = ag m+i = ag m g i = ag i .

Por otra parte, como g fija a todos los elementos que no estan en su orbita, lo
mismo le sucede a g m , y concluimos que g m = 1. Por otra parte, si 0 < i < m
tiene que ser g i 6= 1, porque ag i 6= a. Por lo tanto, la longitud de un ciclo no es
ni mas ni menos que el menor natural m > 0 tal que g m = 1, es decir su orden.

Teorema 6.17 Sea n > 0 un numero natural.


1. La longitud de un ciclo de n coincide con su orden.
2. Dos ciclos disjuntos conmutan.
3. Toda permutacion de n distinta de 1 se expresa de forma unica salvo el
orden como producto de ciclos disjuntos dos a dos.
208 Captulo 6. Grupos

4. El orden de un producto de ciclos disjuntos es el mnimo comun multiplo


de las longitudes de los ciclos.
5. n esta generado por las trasposiciones.

Demostracion: 1) lo acabamos de probar. Para probar 2), consideramos


un ciclo g de orbita A y otro g de orbita A , con A A = . Entonces, si
i In , tenemos que

g(i) si i A,
(gg )(i) = g (i) si i A ,

i si i In \ (A A ),

y esto no depende del orden, es decir, g g es la misma permutacion.


3) Dada g n , sean A1 , . . . , Am sus orbitas no triviales. Es claro que
g[Ai ] = Ai , luego podemos definir gi n tal que gi |Ai = g|Ai y gi |In \Ai es la
identidad. Claramente gi es un ciclo de orbita Ai , y es facil ver que g = g1 gm .
La unicidad se debe a que si g = g1 gm , donde los gi son ciclos disjuntos
de orbitas A1 , . . . , Am , entonces necesariamente gi |Ai = g|Ai , de donde se sigue
que A1 , . . . An son necesariamente las orbitas de g. Esto determina los gi salvo
el orden.
4) Sabemos que el orden de un ciclo es su longitud, luego si g = g1 gm es
una descomposicion en ciclos disjuntos y r es el mnimo comun multiplo de sus
longitudes, entonces gir = 1, luego (teniendo en cuenta que los ciclos conmutan)
r
g r = g1r gm = 1. Por otra parte, si r < r, entonces existe un i tal que el

orden de gi no divide a r , luego gir 6= 1, pero si Ai es la orbita de gi , tenemos

que g|Ai = gi |Ai , luego g r |Ai = gir |Ai 6= 1, luego g r 6= 1, luego r es el menor
natural no nulo que cumple g r = 1, es decir, el orden de g.
5) El hecho de que toda permutacion se descomponga en producto de ciclos
implica que los ciclos generan n , pero a su vez cada ciclo se puede expresar
como producto de trasposiciones:

(a1 , . . . , am ) = (a1 , a2 )(a1 , a3 ) (a1 , am ),

luego las trasposiciones tambien son un generador.

Ejemplo La descomposicion en ciclos disjuntos de la permutacion del ejemplo


de la pagina 206 es
g = (1, 3, 4)(2, 7)(5, 8).
Es facil operar con permutaciones cuando estan expresadas como productos
de ciclos disjuntos. Por ejemplo, para calcular el producto de (2, 5, 7)(1, 3) por
(1, 3, 4)(7, 8), es decir,
(2, 5, 7)(1, 3)(1, 3, 4)(7, 8),
tomamos el 1, y vemos que al aplicar sucesivamente los cuatro ciclos obtenemos

1 7 1 7 3 7 4 7 4,
6.2. Grupos de permutaciones 209

luego el producto empieza por un ciclo (1, 4, . . .) Ahora calculamos

4 7 4 7 1 7 1,

luego cerramos el ciclo (1, 4). Pasamos al 2:

2 7 5 7 5 7 5 7 5,

luego tenemos (1, 4)(2, 5, . . .). Ahora partimos del 5:

5 7 7 7 7 7 7 7 8,

luego (1, 4)(2, 5, 8, . . .). Pasamos al 8:

8 7 8 7 8 7 8 7 7,

luego (1, 4)(2, 5, 8, 7, . . .). Ahora:

7 7 2 7 2 7 2 7 2,

luego cerramos el ciclo (1, 4)(2, 5, 8, 7). Falta estudiar el 3 y el 6, pero es facil
ver que quedan fijos, luego concluimos que

(2, 5, 7)(1, 3)(1, 3, 4)(7, 8) = (1, 4)(2, 5, 8, 7).

El calculo de inversos es tambien muy simple, pues es claro que

(a1 , . . . , an )1 = (an , . . . , a1 ),

y, como los ciclos disjuntos conmutan, el inverso de un producto de ciclos dis-


juntos es el producto de los ciclos inversos.

Ejemplo: El grupo 3 Observemos que 1 = 1 y 2 = {1, (1, 2)} es un


grupo cclico de orden 2. Consideremos ahora 3 , que es un grupo de orden 6.
Sus elementos distintos de 1 pueden ser trasposiciones (, ) o ciclos de longi-
tud 3: (, , ). Analizando todos los casos posibles, vemos que

3 = {1, (1, 2), (1, 3), (2, 3), (1, 2, 3), (3, 2, 1)}.

En particular vemos que 3 tiene tres elementos de orden 2 y dos elementos de


orden 3. Eso nos da los subgrupos cclicos

h(1, 2)i = {1, (1, 2)}, h(1, 3)i = {1, (1, 3)}, h(2, 3)i = {1, (2, 3)},

h(1, 2, 3)i = {1, (1, 2, 3), (3, 2, 1)}.


Y no hay mas subgrupos propios, pues todo subgrupo propio tiene que tener 2
o 3 elementos, luego tiene que ser cclico. Observemos que 3 es no abeliano,
pues, por ejemplo,

(1, 2)(1, 3) = (1, 2, 3), (1, 3)(1, 2) = (3, 2, 1).


210 Captulo 6. Grupos

En realidad, esto prueba que si n 3 el grupo n no es abeliano. Volviendo


al caso n = 3, si llamamos H = {1, (1, 2)}, es facil ver que

(3 /H)i = {{1, (1, 2)}, {(1, 3), (3, 2, 1)}, {(2, 3), (1, 2, 3)}},

(3 /H)d = {{1, (1, 2)}, {(1, 3), (1, 2, 3)}, {(2, 3), (3, 2, 1)}},
con lo que vemos que, tal y como habamos indicado, las dos relaciones de
congruencia modulo un subgrupo no tienen por que coincidir.

Ejemplo: El grupo 4 El grupo 4 tiene 24 elementos, la tabla siguiente


recoge los tipos posibles y el numero de permutaciones de cada tipo:

1 (, ) (, )(, ) (, , ) (, , , )
1 6 3 8 6

Por ejemplo, para calcular el numero de ciclos (a, b, c) de longitud 3 observa-


mos que tenemos 4 posibilidades para elegir a, otras 3 para elegir b y otras 2 para
elegir c, lo que nos da 24 posibilidades, pero como (a, b, c) = (c, a, b) = (b, c, a),
estamos contando tres veces cada ciclo, luego el numero de ciclos es 8.
Este grupo se nos queda ya demasiado grande, en el sentido de que no
estamos en condiciones de encontrar todos sus subgrupos, pues tiene muchos
mas que los subgrupos cclicos que podramos calcular facilmente. Por ejemplo,
el estabilizador de cada i = 1, 2, 3, 4 (es decir, el conjunto de las permutaciones
en cuya expresion en ciclos no aparece el ndice i) es un subgrupo de 4 isomorfo
a 3 . Pero esto no agota los subgrupos que pueden encontrarse en 4 .

Ejercicio: Determinar los tipos de permutaciones de 5 as como cuantas permuta-


ciones hay de cada tipo.

El grupo D Veamos ahora un ejemplo de grupo infinito, uno de los mas


sencillos despues del grupo cclico infinito Z. Consideramos en Z las permuta-
ciones dadas por (n) = n + 1 y (n) = n. Definimos el grupo diedrico infinito
como D = h, i.
En primer lugar observamos que i (n) = n + i, de donde se sigue que las
potencias i son distintas dos a dos, luego el orden de es infinito. Por el
contrario, 2 = 1, luego tiene orden 2. Ahora observamos que = 1 (lo
que prueba, en particular, que D no es abeliano), pues

( )(i) = ( (i)) = (i) = i + 1,

( 1 )(i) = ( 1 (i)) = (i 1) = i + 1.
Operando la relacion que hemos obtenido se sigue que 1 = . Teniendo
esto en cuenta, aunque cada elemento de D se expresa en principio como
un producto de permutaciones 1 y (como 1 1 1 ), podemos
6.3. Subgrupos normales 211

intercambiar los factores hasta que todas las s queden a la izquierda, y as,
concluimos que
D = { n i | n Z, i = 0, 1}.
Ademas, ( n i )(0) = i ( n (0)) = i (n) = n, donde el signo depende de i,
luego las permutaciones n i son distintas dos a dos.
Es facil ver que las permutaciones n son todas las permutaciones de Z que
conservan el orden, mientras que las permutaciones n son todas las permuta-
ciones de Z que invierten el orden.
Observemos que todos los elementos n tienen orden infinito, mientras que
todos los n tienen orden 2, porque, segun las relaciones que hemos probado,
n n = n n = 1.
En particular, observemos que y son dos elementos de orden 2 cuyo
producto = tiene orden infinito. Esto muestra que hay que ser precavido
al tratar de calcular el orden de un producto de dos elementos de un grupo.
Mas aun, es claro que D = h, i, luego D es un grupo infinito generado
por dos elementos de orden 2.

6.3 Subgrupos normales


Hemos visto que en general las relaciones de congruencia por la izquierda
y por la derecha respecto a un subgrupo no tienen por que coincidir, y sucede
que solo cuando coinciden puede definirse consistentemente una estructura de
grupo en el conjunto cociente. Estudiemos, pues, en que casos coinciden. Para
ello nos sera de utilidad el concepto de automorfismo interno de un grupo.

Definicion 6.18 Sea G un grupo y g, h G. Definimos el conjugado de h por g


como el elemento hg = g 1 hg G. Definimos la funcion g : G G dada por
g (h) = hg . Es facil comprobar que g es un automorfismo de G. Mas aun, la
aplicacion : G Aut G dada por (g) = g es un homomorfismo de grupos.
A la imagen de este homomorfismo, es decir, al subgrupo Int G = {g | g G}
se le llama grupo de los automorfismos internos de G.

Es evidente que hg = h si y solo si gh = hg, luego Int G = 1 si y solo si G es


abeliano.
Si A G, escribiremos Ag = g [A] = {ag | a A}.

Teorema 6.19 Sea G un grupo y H un subgrupo de G. Las siguientes condi-


ciones son equivalentes:
1. La relacion de congruencia modulo H por la izquierda coincide con la
relacion de congruencia modulo H por la derecha.
2. gH = Hg para todo elemento g G.
3. (G/H)i = (G/H)d (y entonces escribiremos simplemente G/H).
212 Captulo 6. Grupos

4. H g = H para todo elemento g G.

5. H g H para todo elemento g G.

Demostracion: Teniendo en cuenta que gH y Hg son las clases de equi-


valencia de g por la izquierda y por la derecha modulo H, es claro que 1), 2) y
3) son equivalentes.
Tambien es facil probar que gH = Hg equivale a que H = g 1 Hg = H g .
1
Solo falta probar que 5) implica 4), pero esto es consecuencia de que H g H
implica que H H g , luego de hecho H = H g .

Definicion 6.20 Diremos que N es un subgrupo normal de un grupo G si cum-


ple las condiciones del teorema anterior. Lo representaremos mediante N E G.

Es inmediato que 1, G E G, as como que todo subgrupo de un grupo abe-


liano es normal. Tambien es facil ver que todo subgrupo de ndice 2 es normal.
La razon es que un subgrupo H con ndice 2 en un grupo G da lugar a dos clases
de congruencia, una es H (tanto por la izquierda como por la derecha) y la otra
es G \ H, luego se cumple la condicion 3) de 6.19.
Tambien es claro que si G = hXi, entonces para que N G sea un subgrupo
normal basta con que N x = N para todo x X, y si G es finito basta con que
N x N para todo x X.
El homomorfismo G Int(G) Aut(G) G hace que podamos conside-
rar a la conjugacion como una accion de G en el propio G visto como conjunto.
La relacion de equivalencia en G asociada a esta accion se llama tambien
conjugacion, es decir, dos elementos g1 , g2 G son conjugados si existe un
g G tal que g1g = g2 .
La orbita de un elemento g G respecto de la conjugacion se llama clase de
conjugacion de g y se representa por

cl(g) = {g x | x G}.

El estabilizador de un g G recibe el nombre de centralizador de g, y se repre-


senta por
CG (g) = {x G | g x = g} = {x G | xg = gx},
es decir, esta formado por los elementos de G que conmutan con g. La relacion
general entre estabilizadores y orbitas afirma en este caso que

|cl(g)| = |G : CG (g)|.

Si H G y g G, el conjunto H g es la imagen de H por un automor-


fismo (interno) de G, luego H g G. Los subgrupos de la forma H g se llaman
conjugados de H.
Es claro que H 7 H g determina una accion de G sobre el conjunto de
todos los subgrupos de G. La orbita de un subgrupo es el conjunto de todos sus
6.3. Subgrupos normales 213

subgrupos conjugados. El estabilizador de un subgrupo H se llama normalizador


de H en G, y se representa por

NG (H) = {g G | H g = H}.

es claro que H E NG (H) G. De hecho, NG (H) es el mayor subgrupo de G en


el que H es normal. La relacion fundamental entre orbitas y estabilizadores se
traduce ahora en que |G : NG (H)| es el numero de conjugados de H en G. En
particular, H E G si y solo si NG (H) = G.
Veamos las propiedades de la conjugacion en grupos de permutaciones.

Teorema 6.21 Sea n un numero natural no nulo.


1. Si (a1 , . . . , am ) es un ciclo en n y n , entonces

(a1 , . . . , am ) = (a1 ), . . . , (am ) .

2. Dos permutaciones de n cuyas descomposiciones en producto de ciclos


disjuntos sean 1 r y 1 s son conjugadas si y solo si r = s y
(reordenando adecuadamente) la longitud de cada i coincide con la de i .

Demostracion: 1) En primer lugar,


    
(a1 , . . . , am ) (a1 ) = (a1 , . . . , am ) 1 (a1 )

= (a1 , . . . , am )(a1 ) = (a2 )
 
= (a1 ), . . . , (am ) (a1 ) .

Lo mismo vale para cualquier otro ai . Si a es distinto de (a1 ), . . . , (am ),


entonces 1 (a) es distinto de a1 , . . . , am , luego (a1 , . . . , am ) 1 (a) = 1 (a)
y
   
(a1 , . . . , am ) 1 (a) = 1 (a) = a = (a1 ), . . . , (am ) (a).

As pues (a1 , . . . , am ) y (a1 ), . . . , (am ) actuan igual sobre todos los
elementos, luego son iguales.
2) Si g n , entonces (1 r )g = 1g rg , donde los ig son ciclos dis-
juntos (por el apartado anterior, si las orbitas de 1 , . . . , r son A1 , . . . , Ar ,
entonces las orbitas de 1g , . . . , rg son g[A1 ], . . . , g[Ar ]). La unicidad de la des-
composicion hace que, r = s y, salvo reordenacion, ig = i , luego i y i tienen
la misma longitud.
Respectivamente, si r = s y la longitud de i coincide con la de i , digamos
que i = (ai1 , . . . , aimi ), i = (bi1 , . . . , bimi ), podemos tomar g n que cumpla
g(aij ) = bij , y entonces, por el apartado anterior, ig = i , y concluimos que
(1 r )g = 1 r .
Veamos un par de aplicaciones de este teorema:
214 Captulo 6. Grupos

Teorema 6.22 n esta generado por las trasposiciones (i, i+1), para 1 i < n.

Demostracion: Por 6.17 sabemos que n esta generado por las trasposi-
ciones, luego basta ver que toda trasposicion (i, j) se expresa como producto de
las indicadas en el enunciado. Ahora bien, por ejemplo,

(15) = (25)(12) = (35)(23)(12) = (45)(34)(23)(12) = (12)(23)(34)(45)(34)(23)(12),

y es claro que del mismo modo podemos expresar cualquier (i, j) en producto
de trasposiciones de numeros consecutivos.

Teorema 6.23 Si p es primo, entonces p esta generado por un p-ciclo cual-


quiera y una trasposicion cualquiera.

Demostracion: Sea un p-ciclo y = (ab) una trasposicion y llamemos


H = h, i. Como la orbita de recorre todos los ndices, existe un k tal que
k (a) = b. Como k H y es tambien un p-ciclo (porque p es
primo, luego
todas sus potencias no triviales tienen orden p), basta probar que k , = p .
Equivalentemente, podemos suponer que (a) = b. Si = (a, b, a3 . . . , ap ), sea
p dada por (1) = a, (2) = b, (ai ) = i. Entonces = (1, . . . , p) y
= (12), luego basta probar que H = h(1, . . . , p), (12)i = p , pues en tal
caso, conjugando por 1 obtenemos que H = p . Equivalentemente, podemos
i
suponer que = (1, . . . , p), = (12). Ahora bien, (12) = (i, i + 1) H, luego
H = p por el teorema anterior.

Ejemplos El grupo 3 tiene tres clases de conjugacion, correspondientes a


los tres tipos de permutaciones segun su descomposicion en ciclos disjuntos, que
son 1, (, ) y (, , ).
Observemos que un subgrupo es normal si y solo si es union de clases de con-
jugacion. As, el subgrupo N = h(1, 2, 3)i es normal, pues consta de dos clases
de conjugacion (y tambien2 porque tiene ndice 2), mientras que los subgrupos
de orden 2 no son normales, ya que contienen una trasposicion, pero no todas
las trasposiciones, que forman una misma clase de conjugacion.
En 4 tenemos cuatro clases de conjugacion de cardinal 1, 6, 3, 8 y 6, res-
pectivamente (vease la tabla de la pagina 210). Vamos a encontrar todos sus
subgrupos normales. Para ello observamos en primer lugar que los ordenes po-
sibles son 1, 2, 3, 4, 6, 8, 12, 24. Los ordenes 1 y 24 corresponden a los subgrupos
impropios.
Ningun subgrupo normal propio puede contener la clase de las trasposiciones,
ya que generan todo el grupo. Tampoco puede contener a los ciclos de longitud 4,
ya que son 6, mas el neutro 7, luego el grupo debera tener orden 8 o 12, pero
2 Un tercer argumento es que si un grupo tiene un unico subgrupo de un orden dado,

entonces tiene que ser normal, pues no puede tener otros conjugados, ya que tendran el
mismo orden.
6.3. Subgrupos normales 215

no hay ninguna otra clase de conjugacion de cardinal 1 o 5 que podamos anadir


para completar esos 7 elementos. Es facil ver que
 
V4 = {1} cl (1, 2)(3, 4) = 1, (1, 2)(3, 4), (1, 3)(2, 4), (1, 4)(2, 3)
es un subgrupo normal de 4 en el que todos los elementos no triviales tienen
orden 2 (o sea, que no es cclico). A este grupo se le llama el grupo de Klein.
Para que un subgrupo normal propio contenga a los ciclos de longitud 3 (que
son 8 mas elneutro 9) ha de tener orden 12, luego faltan los 3 elementos de
cl (1, 2)(3, 4) . El lector puede probar directamente que
 
A4 = {1} cl (1, 2)(3, 4) cl (1, 2, 3)
es un subgrupo normal de orden 12 llamado grupo alternado de grado 4, aunque
mas adelante daremos un argumento que no requerira ningun calculo.
D E
Ejercicio: Probar que A4 = (1, 2, 3), (1, 2)(3, 4) .

En resumen, los unicos subgrupos normales de 4 son 1 < V4 < A4 < 4 .


El grupo V4 es abeliano, mientras que A4 no lo es. Todo subgrupo de orden 12
en 4 es normal por tener ndice 2, luego A4 es el unico.
Ejercicio: Si H E K E G, es necesariamente H E G?
Consideremos g = (1, 2)(3, 4) 4 . Su clase de conjugacion tiene 3 elemen-
tos, luego C4 () tiene orden 8. Es claro que V4 C4 (), pues el centralizador
contiene a todas las permutaciones que conmutan con g y sucede que g V4
y V4 es abeliano. Pero el centralizador contiene mas elementos. No es difcil
encontrar otro: = (1, 3, 2, 4) C4 (g), pues
(1, 2)(3, 4)(1,3,2,4) = (3, 4)(2, 1) = (1, 2)(3, 4).

Ahora observamos que el centralizador no es abeliano, pues sabemos que


= (1, 4)(2, 3) C4 (g) y = 1 . En efecto:
(1, 3, 2, 4)(1,4)(2,3) = (4, 2, 3, 1) = (1, 3, 2, 4)1.
Ahora es facil identificar 8 elementos en el centralizador, y sabemos que esos
son todos:
1 2 3 2 3
1 (1324) (12)(34) (4231) (14)(23) (12) (13)(24) (34)
o 1 4 2 4 2 2 2 2
Este grupo recibe el nombre de grupo diedrico de orden 8 y se representa por D8 .
Vemos que tiene dos elementos de orden 4 y 5 de orden 2, pero no son todos
iguales, en el sentido de que 2 = g conmuta con todos los elementos del

grupo
(puesto que este es el centralizador de g en 4 ) lo que se traduce en que
2 E D8 , mientras que los otros cuatro subgrupos de orden 2 no son normales.
De hecho, las clases de conjugacion de D8 son:
{1}, { 2 }, {, 3 }, {, 2 }, {, 3 }.
216 Captulo 6. Grupos

Ejercicio: Probar que D8 tiene tres subgrupos de orden 4.

Observemos que (1, 2)(3, 4) y (1, 4)(2, 3) son permutaciones conjugadas en


4 , pero no en D8 . Hay que tener presente que la relacion de conjugacion
depende del grupo en el que se considera y una clase de conjugacion en un
grupo puede partirse en varias en un subgrupo. Otro ejemplo de esta situacion la
proporcionan los ciclos de longitud 3, que forman una unica clase de conjugacion
en 4 (de 8 elementos) y, aunque todos ellos estan en A4 , en este subgrupo
forman dos clases de conjugacion de 4 elementos cada una.
Basta tener en cuenta que C4 ((1, 2, 3, 4)) tiene 4 elementos (pues su ndice
es el numero de conjugados del ciclo), luego C4 ((1, 2, 3, 4)) = h(1, 2, 3, 4)i, pues
obviamente el subgrupo de la derecha tiene que estar en el centralizador, y tiene
ya los elementos justos. Pero entonces,

CA4 ((1, 2, 3, 4)) = A4 C4 ((1, 2, 3, 4)) = h(1, 2, 3, 4)i ,

es decir, el centralizador de un ciclo de longitud 4 en A4 es el mismo que en 4 ,


pero entonces su ndice es la mitad, y as la clase de conjugacion tiene solo 4
elementos, en lugar de 8. En otras palabras, en 4 hay dos clases de conjugacion
de ciclos de longitud 4, con 4 elementos cada una.
No ocurre lo mismo con la clase de conjugacion de (1, 2)(3, 4), que esta
formada por tres permutaciones en 4 y las tres siguen siendo conjugadas en
A4 , ya que CA4 ((1, 2)(3, 4)) = C4 ((1, 2)(3, 4)) A4 = V4 (ya que la interseccion
no puede ser todo D8 , pues (1, 3, 2, 4) / A4 ), luego |A4 : CA4 ((1, 2)(3, 4))| = 3.
En total, A4 tiene cuatro clases de conjugacion, de cardinales 1, 3, 4, 4. Esto
implica, por ejemplo, que A4 no tiene subgrupos de orden 6, ya que un subgrupo
de orden 6 tendra ndice 2, luego sera normal, luego sera union de clases de
conjugacion, pero entre los numeros 1, 3, 4, 4 no los hay que sumen 6. As pues,
un grupo no tiene por que tener subgrupos de todos los ordenes que dividen a
su orden.
El grupo Q8 tiene una propiedad que no es frecuente en los grupos no abe-
lianos, y es que todos sus subgrupos son normales. En efecto, hemos calculado
todos sus subgrupos y hemos visto que, aparte de los impropios, tiene subgrupos
de orden 4, que son normales porque tienen ndice 2, y un subgrupo de orden 2,
que es {1, 1}, que es normal porque 1 conmuta con todos los elementos del
grupo, luego queda invariante por conjugacion.
El lector debera apreciar a traves de los ejemplos anteriores como los con-
ceptos de la teora de grupos (subgrupos, conjugacion, centralizador, etc.) nos
permiten profundizar en la estructura de grupos como 4 , mucho mas alla de
su mera definicion como conjunto de las biyecciones de un conjunto de cuatro
elementos.
Hemos calculado C4 ((1, 2)(3, 4)), pero es evidente que el centralizador de
cualquier otra permutacion de tipo (, )(, ) va a ser isomorfo al que hemos
calculado. De hecho, va a ser conjugado, como consecuencia de un resultado
general que conviene conocer:
6.4. Producto de grupos 217

Teorema 6.24 Si un grupo G actua sobre un conjunto X y tomamos x X,


g G, entonces Gxg = Ggx .

Demostracion: Tenemos que h Gxg si y solo si xgh = xg, si y solo si


xghg 1 = x, si y solo si ghg 1 = h Gx , si y solo si h = hg Ggx .
En particular, al aplicar esto a la accion de 4 en s mismo por conjugacion,
tenemos que, como dos permutaciones cualesquiera de tipo (, )(, ) son con-
jugadas, sus centralizadores tienen que ser conjugados.

6.4 Producto de grupos


Necesitabamos el concepto de subgrupo normal para adaptar al caso de
grupos el concepto de suma directa de modulos. Nos ocupamos de ello en esta
seccion:

Definicion 6.25 Sea G un grupo y A y B dos subconjuntos de G. Llamaremos


AB = {ab | a A, b B}. En notacion aditiva hablaremos de suma de
subconjuntos y la representaremos A + B.

A diferencia de lo que ocurre con modulos, el producto de dos subgrupos no


es necesariamente un subgrupo. El teorema siguiente aclara la situacion.

Teorema 6.26 Sea G un grupo y H y K dos subgrupos de G.

1. HK G si y solo si HK = KH.

2. Si H E G o K E G, entonces HK G.

3. Si H E G y K E G, entonces HK E G.

Demostracion: 1) Si HK G y x HK, entonces x1 HK, luego es


de la forma x1 = hk, con h H y k K. Por lo tanto x = k 1 h1 KH.
Igualmente se prueba la otra inclusion, luego HK = KH.
Si HK = KH, sean x, y HK. Entonces x = hk e y = h k con h, h H
y k, k K. Por lo tanto xy 1 = hkk 1 h1 . El elemento kk 1 h1 KH =
HK, luego kk 1 h1 = h k para ciertos h H y k K. Consecuentemente
xy 1 = hh k HK. Por el teorema 6.4 tenemos que HK G.
2) Si H E G y hk HK, entonces hk = kk 1 hk = khk KH k = KH
e igualmente se prueba la otra inclusion. Por lo tanto HK = KH y por 1)
HK G.
3) Si g G, como la conjugacion por g es un automorfismo de G, se cumple
que (HK)g = H g K g = HK. Por lo tanto HK E G.
El lector debe tener clara la diferencia entre que HK = KH y que hk = kh
para todo h H y todo k K. En el primer caso se dice que H y K conmutan.
En el segundo se dice que conmutan elemento a elemento. La segunda propiedad
218 Captulo 6. Grupos

implica obviamente la primera, pero el recproco no es cierto. Es facil encontrar


ejemplos en el grupo 3 .
Notemos que si G es abeliano se cumplen trivialmente todas las condiciones
del teorema anterior y el producto de subgrupos es siempre un subgrupo (cosa
que ya sabamos viendolos como Z-modulos).
A menudo es util este sencillo resultado:

Teorema 6.27 Si dos subgrupos normales de un grupo G tienen interseccion


trivial, entonces conmutan elemento a elemento.

Demostracion: Sean N y M E G tales


n que N M = 1. Sean n N
y m M . Entonces n1 m1 nm = m1 m = n1 nm N M = 1, luego
nm = mn.

Definicion 6.28 Diremos que un grupo G es producto directo de los subgrupos


N1 , . . . , Nr si todos son normales en G, se cumple que G = N1 Nr y la
interseccion de cada Ni con el producto de los factores restantes es trivial. En
tal caso se escribe G = N1 Nr .

Para grupos abelianos el concepto de producto directo coincide con el con-


cepto de suma directa de subgrupos vistos como Z-modulos. Simplemente hemos
cambiado la notacion aditiva por la multiplicativa (Notemos que N1 Nr =
hN1 , . . . , Nr i). Teniendo en cuenta el teorema anterior, la prueba del resultado
siguiente es analoga a la del teorema 5.15.

Teorema 6.29 Sea G un grupo y N1 , . . . , Nr una familia de subgrupos nor-


males tales que G = N1 Nr . Entonces:
1. Si se da la igualdad n1 nr = 1 con cada ni Ni , entonces cada ni = 1.
2. Cada elemento g G se expresa de forma unica como producto g =
n1 nr con cada ni Ni .

Al igual que ocurre con los modulos, si tenemos una familia de grupos po-
demos construir un grupo que se exprese como producto directo de una familia
de subgrupos isomorfos a los dados.

Definicion 6.30 Sea una familia de grupos G1 , . . . , Gr . Llamaremos producto


directo externo de G1 , . . . , Gr al grupo

G1 Gr = (g1 , . . . , gr ) gj Gj para cada j = 1, . . . , r

con la operacion dada por (g1 , . . . , gr )(g1 , . . . , gr ) = (g1 g1 , . . . , gr gr ).

Como en el caso de los modulos, la aplicacion i : Gi G1 Gr que


a cada elemento g Gi le asigna la r-tupla cuya componente i-esima es g y las
restantes son 1 es un monomorfismo de grupos, por lo que podemos identificar
cada Gi con su imagen, es decir, con el subgrupo Ni de G1 Gr formado
6.5. Grupos cociente 219

por las r-tuplas que tienen todas sus componentes iguales a 1 salvo quiza la i-
esima. Es facil ver que cada Ni es isomorfo a Gi y que G1 Gr es producto
directo (en el sentido de 6.28) de los subgrupos Ni .
Dejamos al lector la extension de estos conceptos y resultados al caso de
infinitos factores, que es completamente analoga al caso de los modulos, aunque
no vamos a necesitarla en Q ningun momento. Hay que distinguir igualmente entre
el producto de grupos: Gi , con la operacion dada por (f g)(i) = f (i)g(i), y el
producto directo: iI

Q Q Q
Gi = {f Gi | {i I | f (i) 6= 1} es finito} Gi .
iI iI iI

Los teoremas de estructura de la seccion 5.5 nos dan en particular el resultado


siguiente:

Teorema 6.31 Todo grupo abeliano finitamente generado (en particular todo
grupo abeliano finito) es producto directo de un numero finito de grupos cclicos.

En particular, podemos hablar de los factores invariantes y los divisores


elementales de un grupo abeliano finito, que nos permiten determinar todos los
grupos abelianos finitos de un determinado orden no isomorfos entre s.
Por ejemplo, tenemos que todo grupo abeliano de orden primo p es isomorfo
a Cp (y, de hecho, es claro que todo grupo de orden primo tiene que ser abeliano,
luego, salvo isomorfismo, Cp es el unico grupo de orden p). En cambio, un grupo
abeliano de orden p2 puede ser isomorfo a Cp2 o a Cp Cp . Por ejemplo, es
claro que V4 = C2 C2 , pues no tiene elementos de orden 4.
Teniendo en cuenta que un grupo cclico finito tiene subgrupos de todos los
ordenes posibles (divisores de su orden), ahora es inmediato:

Teorema 6.32 Un grupo abeliano finito tiene subgrupos de todos los ordenes
que dividen a su orden.

6.5 Grupos cociente


Pasamos por fin al estudio de los grupos cociente. Resulta que solo pue-
den definirse cuando la congruencia izquierda coincide con la derecha, es decir,
cuando el subgrupo es normal:

Teorema 6.33 Sea G un grupo y N E G. Entonces el conjunto cociente G/N


es un grupo con la operacion dada por (gN )(hN ) = ghN . El elemento neutro
de G/N es 1N = N . Si g G, se cumple que (gN )1 = g 1 N . Si el grupo G
es abeliano o cclico, entonces G/N tambien lo es.

Demostracion: Hay que probar que la operacion en G/N esta bien defi-
nida, es decir, que si gN = g N y hN = h N , entonces ghN = g h N .
Para ello observamos que (gh)1 g h = h1 g 1 g h = h1 h h1 g 1 g h .
220 Captulo 6. Grupos

Ahora, h1 h N y g 1 g N porque por hipotesis son congruentes modulo



N , y como N es normal, h1 g 1 g h = (g 1 g )h N , luego (gh)1 g h N y

as ghN = g h N .
El resto del teorema es obvio. En todo caso, notese que si G = hgi, entonces
G/N = hgN i.

Nota Tal y como hemos indicado, la normalidad de H G no solo es una


condicion suficiente, sino tambien necesaria para que el producto considerado
en el teorema anterior en (G/H)i o (G/H)d este bien definido. En efecto, si
el producto esta bien definido, por ejemplo en (G/H)d , dado h H y g G,
tenemos que Hh = H1, y que Hg 1 = Hg 1 , luego tambien Hg 1 h = Hg 1 ,
luego Hg 1 hg = H, luego hg H, luego H g H, luego H E G.
Es inmediato comprobar que si f : G H es un homomorfismo de grupos y
N E H, entonces f 1 [N ] E G. En particular N(f ) E G, y se cumple el analogo
al teorema de isomorfa de modulos (con esencialmente la misma prueba):
Teorema 6.34 (Teorema de Isomorfa) Sea f : G H un homomor-
fismo de grupos. Entonces N(f ) E G, y la aplicacion f : G/ N(f ) Im f
dada por f g N(f ) = f (g) es un isomorfismo de grupos.
Recprocamente, todo subgrupo normal N de un grupo G es el nucleo de
un epimorfismo de grupos, a saber, de la proyeccion canonica p : G G/N
definida mediante p(g) = gN .
Teorema 6.35 Sea G un grupo y N E G.
1. Si N H G, entonces H/N G/N .
2. Si K G/N , entonces existe un subgrupo H de G tal que N H G y
K = H/N .
3. Si N H G, entonces H/N E G/N si y solo si H E G.
4. Las correspondencias descritas en los apartados 1) y 2) determinan una
biyeccion entre los subgrupos de G/N y los subgrupos de G que contienen
a N . Los subgrupos normales de G se corresponden con los subgrupos
normales de G/N .
Demostracion: 1) Es inmediato. Los elementos de H/N son las clases hN
con h H y los de G/N son las clases gN con g G. La operacion es la misma.
2) Consideremos el epimorfismo canonico p : G G/N dado por p(g) =
gN . Definimos H = p1 [K] G. Como N = p1 [1N ], claramente N H. As
H/N = {hN | h H} = p[H] = p p1 [K] = K.
3) Si H/N E G/N , entonces al conjugar un elemento h H por un elemento
g G se cumple hg N = (hN )gN H/N , luego hg H y as H E G. El
recproco es analogo.
4) Si H/N = H /N , entonces H = p1 [H/N ] = p1 [H /N ] = H , luego la
correspondencia es inyectiva, y por 2) es suprayectiva.
6.5. Grupos cociente 221

Veamos un par de resultados adicionales muy utiles cuando se manejan gru-


pos cociente.

Teorema 6.36 (Segundo teorema de isomorfa) Sea G un grupo, H G


y K E G. Entonces HK/K
= H/(H K).

Demostracion: Consideremos la aplicacion f : H HK/K dada por


f (h) = hK. Es claro que se trata de un homomorfismo de grupos. Ademas es
un epimorfismo, pues un elemento de HK/K es de la forma hkK con h H y
k K, pero hkK = hK = f (h).
Un elemento h H esta en N(f ) si y solo si h H y hK K, si y solo
si h H K, luego N(f ) = H K y por el teorema de isomorfa concluimos
HK/K = H/(H K).

Teorema 6.37 (Tercer teorema de isomorfa) Consideremos un grupo G


y dos subgrupos K E G y K H E G. Entonces (G/K)/(H/K)
= G/H.

Demostracion: Un elemento de G/K es de la forma gK con g G, luego


un elemento cualquiera de (G/K)/(H/K) es de la forma (gK)(H/K). Ademas
(gK)(H/K) = (1K)(H/K) si y solo si gK H/K, es decir, si y solo si g H.
Esto significa que la aplicacion f : G (G/K)/(H/K) definida mediante
f (g) = (gK)(H/K) es un epimorfismo de nucleo H, luego por el teorema de
isomorfa, (G/K)/(H/K) = G/H.

Ejercicio: Enunciar y demostrar teoremas de isomorfa analogos para modulos.


El segundo teorema de isomorfa implica que si H y K son subgrupos de
un grupo finito G y K es normal, entonces |HK| = |H| |K|/|H K|. Vamos a
probar que esto sigue siendo cierto aunque ninguno de los subgrupos sea normal
y HK no sea un subgrupo.

Teorema 6.38 Sea G un grupo finito y H, K dos subgrupos de G. Entonces

|H| |K|
|HK| = .
|H K|

Demostracion: Consideremos la aplicacion f : H K HK dada por


f (h, k) = hk. Obviamente es suprayectiva. Si f (h, k) = f (h , k ), entonces
hk = h k , luego u = (h )1 h = k k 1 H K.
Hemos probado que si f (h, k) = f (h , k ), entonces (h , k ) = (hu, u1 k) para
cierto u H K. El recproco es trivialmente  cierto. Esto
significa que
para
1 1
cada
1 hk HK se cumple que f [hk] = (hu, u k) u H K , luego
f [hk] = |H K|.
En consecuencia, el numero de elementos de H K es igual al numero de
conjuntos de la forma f 1 [hk] (que es |HK|) multiplicado por el numero de
elementos de cada uno de estos conjuntos (que es |H K|), es decir, hemos
probado que |H| |K| = |HK| |H K|.
222 Captulo 6. Grupos

Ejemplo: Los grupos diedricos finitos Consideremos de nuevo el grupo


diedrico infinito D = h0 , 0 i que hemos construido en la pagina 210, donde
N = h0 i es un grupo cclico infinito y 00 = 01 . Los subgrupos de N son
cclicos, luego son los subgrupos Nn = h0n i, de modo que N = N1 . Se cumple
que Nn E D , pues
Nn0 = Nn (porque 0 conmuta con los elementos de Nn )
y Nn0 = h(0n )0 i = 0n = Nn .
Definimos el grupo diedrico de orden 2n como D2n = D / h0n i. Si llamamos
= 0 Nn , = 0 Nn , tenemos que D2n = h, i, donde n = 2 = 1 y = 1 .
Notemos que tiene orden n, pues si 0 < i < n no puede suceder que i = 1,
ya que esto equivale a que 0i h0n i, lo cual es absurdo. Igualmente, tiene
orden 2, ya que 0 / N , luego en particular 0 / Nn .
Como todo elemento de D se expresa como 0i 0j , con j = 0, 1, es claro
que todo elemento de D2n se expresa como i j , con i = 0, . . . , n 1, j = 0, 1.

Ademas la expresion es unica, ya que si i j = i j entonces j = j , pues en

caso contrario, si, por ejemplo, j = 0, j = 1, tendramos que = ii y de
aqu se sigue que 0 N , contradiccion. As pues, j = j , lo que implica que

i = i y por lo tanto i = i (pues suponemos que los exponentes son menores
que n).
En definitiva: D2n = {1, , . . . , n1 , , , . . . n1 } es realmente un grupo
de orden 2n, que contiene un subgrupo cclico hi de orden n (normal, por tener
ndice 2) y los elementos restantes, de la forma i , tienen todos orden 2.
= C2 y D4
Es facil ver que D2 = C2 C2 son abelianos, mientras que D2n
no es abeliano para n 3, ya que entonces 1 =6 , por lo que la relacion
= 1 implica que y no conmutan.
El teorema siguiente nos permite identificar facilmente un grupo diedrico:

Teorema 6.39 Si G = h, i es un grupo de orden 2n tal que n = 2 = 1 y


= 1 , entonces G
= D2n .

Demostracion: Las relaciones = 1 y 1 = permiten reducir


todo elemento de G a la forma i j , con 0 i < n, 0 j < 1. Por lo tanto

G = {1, , . . . , n1 , , , . . . n1 }

y estos 2n elementos tienen que ser distintos dos a dos. Ademas el producto en
G viene determinado por las relaciones:

i j = i+j , i j = ij , i j = i+j , i j = ij .

Esto hace que si dos grupos G = h, i y G = h , i cumplen las condiciones


del enunciado, la aplicacion f : G G dada por f ( i j ) = i j es un iso-
morfismo de grupos. Como el grupo D2n cumple las condiciones del enunciado,
cualquier otro grupo que las cumpla es isomorfo a el.
Observemos que 3 cumple las condiciones del teorema anterior con las
permutaciones = (1, 2, 3), = (1, 3), luego 3
= D6 .
6.5. Grupos cociente 223

Por otra parte, D8 es un grupo no abeliano de orden 8 distinto de Q8 , ya que


en Q8 hay seis elementos de orden 4 y uno de orden 2, mientras que en D8 hay
dos elementos de orden 4 y cinco de orden 2. En cambio, el grupo D8 definido
en la pagina 215 es claramente isomorfo al grupo D8 que hemos definido aqu,
de modo que D8 = C4 ((1, 2)(3, 4)) 4 .
En general, es facil ver que n tiene un subgrupo isomorfo a D2n . Basta
tomar = (1, . . . , n) y = (1, n)(2, n 2) , de modo que = 1 . Es
facil ver entonces que h, i tiene orden 2n y cumple las hipotesis del teorema
anterior.
Ya conocemos todos los grupos de orden 8:
Teorema 6.40 Todo grupo no abeliano de orden 8 es isomorfo a D8 o a Q8 .
Demostracion: Sea G un grupo no abeliano de orden 8. Un hecho elemen-
tal es que si un grupo tiene todos sus elementos de orden 2 entonces es abeliano.
En efecto, dados x, y G, tenemos que xy = (xy)1 = y 1 x1 = yx.
Por lo tanto, G tiene que tener un elemento de orden distinto de 2, y no
puede tener elementos de orden 8, porque entonces sera abeliano. Concluimos
que G tiene al menos un elemento x de orden 4. Sea N = hxi, que es un
subgrupo normal de G, porque tiene ndice 2. Explcitamente, tenemos que
N = {1, x, x2 , x3 }, donde o(x) = o(x3 ) = 4 y o(x2 ) = 2. Vamos a distinguir dos
casos:
1) En G existe otro elemento y de orden 2 distinto de x2 .
Entonces hxi hyi = 1, luego | hxi hyi | = 8, luego G = hxi hyi = hx, yi.
Como N E G, tenemos que xy N y tiene orden 4, pero no puede ser xy = x,
ya que entonces x e y conmutaran, luego G sera abeliano. Por consiguiente
xy = x1 y el teorema anterior nos da que G = D8 .
2) En G no existen mas elementos de orden 2.
Entonces, si y G \ N , necesariamente y tiene que tener orden 4 y x2 = y 2 ,
puesto que y 2 tiene orden 2. En particular | hxi hyi | = 2, luego | hxi hyi | = 8 y
G = hxi hyi = hx, yi. Sea z = xy. Entonces z / hxi, pues en tal caso y hxi, e
igualmente z / hyi, luego z es un nuevo elemento de orden 4 y z 2 = x2 = y 2 .
Vamos a llamar 1 = x2 = y 2 = z 2 , que claramente conmuta con x, y, z y
podemos llamar a su vez
x = (1)x = x(1) = x3 , y = (1)y = y(1) = y 3 ,
z = (1)z = z(1) = z 3 .
Como en el caso anterior, por la normalidad de N , se cumple que xy = x3 ,
luego xy = yx3 = yx, luego yx = z. Por otra parte yz = yxy = xy 2 = x, e
igualmente se comprueba que zy = x, zx = y, xz = y, y con esto ya es facil
probar que la biyeccion obvia determina un isomorfismo G
= Q8 .
As pues, en total hay cinco grupos de 8:
C8 , C4 C2 , C2 C2 C2 , D8 , Q8 .
224 Captulo 6. Grupos

6.6 Las unidades de Z/nZ.


Estudiamos ahora los grupos Un de unidades del anillo Z/nZ. Observamos
en primer lugar que las unidades son faciles de identificar:
Teorema 6.41 Para cada numero natural n 1, se cumple que
Un = {[m] Z/nZ | (m, n) = 1}.
Demostracion: Si (m, n) = 1, por la relacion de Bezout existen enteros u,
v tales que um + vn = 1, luego [u][m] = 1, luego [m] Un . Si, por el contrario,
d | m, d | n con d > 1, entonces n = dn con 0 < n < n, luego [n ] 6= 0 y
[n ][m] = [n ][d][m ] = 0, luego [m] es un divisor de 0, luego [m]
/ Un .
El teorema 5.45 afirma en particular que si (m, n) = 1, entonces tenemos un
isomorfismo de Z-modulos
Z/mnZ
= (Z/mZ) (Z/nZ)
que viene dado por [x] 7 ([x], [x]). Pero es inmediato que se trata de un
isomorfismo de anillos si en el producto cartesiano de la derecha consideramos
el producto dado por (a, b)(c, d) = (ac, bd), y tambien es claro que las unidades
de este producto de anillos son los pares de unidades. Ademas, un isomorfismo
de anillos se restringe a un isomorfismo entre los grupos de unidades de los
anillos, luego tenemos probado el teorema siguiente:
Teorema 6.42 Si m, n son numeros naturales primos entre s, entonces
Umn
= Um Un .
Por lo tanto, para conocer la estructura de los grupos de unidades basta estu-
diar los de la forma Upn , con p primo. Antes de ocuparnos de ello estudiaremos
una funcion que nos aparecera en varios contextos:
Definicion 6.43 La funcion de Euler : N N es la que a cada numero
natural n le asigna el numero (n) de numeros naturales menores que n primos
con n.
Equivalentemente, (n) = |Un |.
Teorema 6.44 La funcion de Euler esta caracterizada por las propiedades si-
guientes:
(pn ) = (p 1)pn1 , si (m, n) = 1, (mn) = (m)(n).
Demostracion: La segunda propiedad es consecuencia inmediata del teo-
rema anterior. En cuanto a la primera, los numeros naturales menores que pn
que no son primos con pn son los de la forma pm, con 0 m < pn1 , luego son
pn1 , luego (pn ) = pn pn1 = (p 1)pn1 .
As, por ejemplo, (1 000) = (23 )(53 ) = (2 1)22 (5 1)52 = 400.
He aqu un ejemplo en el que interviene la funcion de Euler:
6.6. Las unidades de Z/nZ. 225

Teorema 6.45 Si G es un grupo cclico de orden n y m | n, entonces G tiene


exactamente (m) elementos de orden m.

Demostracion: Por 6.12 sabemos que G tiene un unico subgrupo H de


orden m, el cual contiene a todos los elementos de orden m. Si H = hhi, ese
mismo teorema nos da que o(hr ) = m/(m, r), luego o(hr ) = m si y solo si
(m, r) = 1, de donde es claro que hay (m) elementos de orden m.
Tambien sucede que un grupo cclico de orden n tiene (n) automorfismos.
De hecho, podemos precisar mas:

Teorema 6.46 Si G es un grupo cclico de orden n, entonces Aut(G)


= Un .

Demostracion: No perdemos generalidad si suponemos que G = Z/nZ.


Entonces, cada u Un define un automorfismo u : G G definido por
u (x) = ux. La aplicacion Un Aut(G) dada por u 7 u es claramente
un homomorfismo. Es inyectivo, porque si u = 1 entonces u = u (1) = 1, y
es suprayectivo, porque si Aut(G), entonces (1) tiene que tener orden n,
luego por 6.12 tenemos3 que u = (1) Un , luego (1) = u (1) y esto implica
que = u , pues dos homomorfismos que coinciden en un generador son iguales.

Pasamos ya a estudiar la estructura de los grupos Un . Nuestro punto de


partida es el teorema 6.13, que nos da que si p es primo Up es cclico (ya que es
el grupo de unidades del cuerpo Z/pZ). Los generadores de Up se llaman races
primitivas modulo p.

Teorema 6.47 Sea p un primo impar y e 2. Entonces el grupo Upe es cclico


y un generador es [r(p + 1)], donde r es una cierta raz primitiva modulo p
(elegida adecuadamente).

Demostracion: Puesto que el orden de Upe es (pe ) = pe1 (p 1), basta


probar que [r] tiene orden p 1 y [p + 1] tiene orden pe1 .
Sea s una raz primitiva modulo p cualquiera. Entonces definimos
e1
r = sp s (mod p),

con lo que r tambien es una raz primitiva modulo p. Ademas


e1
[r]p1 = [s]p (p1)
= [1],

pues el orden de cualquier elemento divide al orden del grupo.


Si [r]m = [1], entonces pe | rm 1, luego p | rm 1, luego p 1 | m (pues r
tiene orden p 1 modulo p). Esto prueba que el orden de [r] es p 1.
e2
Veamos por induccion sobre e 2 que (1 + p)p 1 + kpe1 (mod pe ),
para un cierto k (dependiente de e) tal que k 6 0 (mod p).
3 Tomamos g = 1 en 6.12, teniendo en cuenta que all la notacion es multiplicativa y aqu

es aditiva. La conclusion es que (1) = r 1, donde n/(n, r) = n, luego r 1 = [r] Un .


226 Captulo 6. Grupos

Para e = 2 se cumple con k = 1.


e2
Supuesto cierto para e, tenemos (1 + p)p = 1 + kpe1 + ape = 1 + tpe1 ,
donde t = k + ap 6 0 (mod p). Entonces
e1
(1 + p)p = (1 + tpe1 )p = 1 + ptpe1 + + tp pp(e1) .
Como p > 2 y e 2, esta expresion es de la forma 1 + tpe + bpe+1 , luego
e1
(1 + p)p 1 + tpe (mod pe+1 ), con t 6 0 (mod p).
e1
Por lo tanto al tomar clases modulo pe resulta [1 + p]p = [1], luego el
orden de la clase [1 + p] ha de ser un divisor de pe1 . Si el orden fuera menor
e2
que pe1 , entonces tendramos que [1 + p]p = [1], o sea, [kpe1 ] = [0], luego
p | k, contradiccion. Por lo tanto el orden de [1 + p] es exactamente pe1 .
El teorema anterior no es valido para p = 2. Obviamente U2 = 1 y U4 = C2 .
Para potencias mayores la situacion es la siguiente:
Teorema 6.48 Si e 3, entonces U2e = C2 C2e2 . Un generador del primer
factor es [1] y un generador del segundo es [5], es decir, todo elemento de U2e
se expresa de forma unica como [5]j , donde j = 0, . . . , 2e2 1.
El orden de U2e es 2e1 . Claramente [1] tiene orden 2. Una simple in-
duccion muestra que para e 3
e3 e3
52 = (1 + 22 )2 1 + 2e1 (mod 2e ),
e3
de donde [5]2 6= [1], mientras que
e2
52 (1 + 2e1 )2 1 (mod 2e ),
luego el orden de [5] es 2e2 .
Por otra parte [1] no es una potencia de [5], ya que si se cumpliera 2e | 5r +1
para algun r, entonces 4 | 5r + 1, pero modulo 4 es [5]r = [1]r = [1] 6= [1].



De este modo, los subgrupos
[1]
y
[5]
tienene1 interseccion trivial, luego
su suma es directa. As pues, [1] [5] tiene 2 elementos y por consi-
guiente es todo el grupo U2e .
Por ejemplo, U3000 = U8 U3 U125 = C2 C2 C2 C100 .

6.7 Grupos alternados


Vamos a ver ahora que cada grupo n tiene un unico subgrupo de ndice 2
que ya conocemos para el caso de 4 (y trivialmente en 2 y 3 ). Para probar
su existencia en general necesitamos una definicion un tanto tecnica:

Definicion 6.49 Sea n 2, sea Pn = {i, j} 1 i < j n . Para cada
permutacion n y cada b = {i, j} con 1 i < j n, sea

1 si (i) < (j)
(, b) =
1 si (j) < (i)
6.7. Grupos alternados 227

Llamaremos signatura de a
Q
sig = (, b) {1, 1}.
bPn

Las permutaciones de signatura 1 se llaman permutaciones pares. Las de signa-


tura 1 se llaman impares.

Enseguida daremos una interpretacion sencilla de este concepto. Primero


conviene probar lo siguiente:

Teorema 6.50 Sea n 2. Entonces la aplicacion sig : n {1, 1} es un


homomorfismo de grupos.

Demostracion: Sean  , n y sea b Pn . Es facil comprobar que


(, b) = (, b) , [b] . Como la aplicacion Pn Pn dada por b 7 [b] es
biyectiva, se cumple que
Q Q 
sig( ) = (, b) = (, b) , [b]
bPn bPn

Q Q  Q Q
= (, b) , [b] = (, b) (, b) = (sig )(sig ).
bPn bPn bPn bPn


Consideremos la trasposicion (1, 2) n . Es claro que (1, 2), b = 1 si y
solo si b = {1, 2}, luego sig(1, 2) = 1. Mas aun, todas las trasposiciones son
conjugadas (por el teorema 6.21), y obviamente

sig( ) = (sig )sig = sig ,

pues {+1, 1} es un grupo abeliano. Esto implica que todas las trasposiciones
tienen signatura 1. Si unimos esto al teorema anterior y al teorema 6.17,
tenemos probado el teorema siguiente:

Teorema 6.51 Una permutacion es par o impar si y solo si se descompone en


un numero par o impar de trasposiciones, respectivamente.

No podamos tomar esto como definicion porque requiere probar que una
misma permutacion no puede descomponerse a la vez en producto de un numero
par y de un numero impar de trasposiciones, cosa que ha quedado probada
implcitamente.
Es facil reconocer la signatura de una permutacion descompuesta en ciclos.
Basta recordar que, segun la prueba de 6.17 5), un ciclo de longitud m se
descompone en m 1 trasposiciones, luego un ciclo es par si y solo si su longitud
es impar.

Definicion 6.52 Llamaremos grupo alternado de grado n al grupo An formado


por las permutaciones pares de n , es decir, al nucleo del homomorfismo sig.
228 Captulo 6. Grupos

Por el teorema de isomorfa, n /An


= {1, 1}, luego |n : An | = 2, es decir,
|An | = n!/2. Notemos que esto vale en realidad para n 2, pues en 1 = 1 no
hay permutaciones impares.
Claramente A2 = 1, A3 = C3 y A4 es el grupo de 12 elementos que ya
hemos estudiado. Es no abeliano, y no es isomorfo a D12 , porque D12 tiene un
subgrupo de orden 6, mientras que hemos visto que A12 no lo tiene.

6.8 p-grupos
Todos los teoremas que hemos demostrado hasta aqu (salvo el teorema de
estructura de los grupos abelianos finitos) son meras consecuencias sencillas de
las definiciones que hemos dado. A partir de aqu vamos a demostrar algunos
resultados no triviales sobre grupos finitos que aplicaremos en diversas ocasiones.
En esta seccion estudiamos los p-grupos, es decir, los grupos de orden potencia
de primo. Para ello conviene introducir un concepto:

Definicion 6.53 Llamaremos centro de un grupo G al conjunto Z(G) de los


elementos de G que conmutan con todos los elementos de G, es decir:

Z(G) = {g G | CG (g) = G}.

Es claro que Z(G) E G y que G es abeliano si y solo si Z(G) = G.

Por ejemplo, es facil comprobar que Z(Q8 ) = {1} y que Z(A4 ) = 1.

Teorema 6.54 Si n 3, entonces Z(n ) = 1 y



1
si n es impar,
Z(D2n ) = n/2

si n es par.

Demostracion: Sea n tal que 6= 1. Esto significa que existen


i, j In tales que (i) = j, i 6= j. Como n 3 existe un k In distinto de i,
j. Entonces (jk) (i) = k , luego (jk) 6= 1, luego no conmuta con (jk), luego
/ Z(n ).
En D2n tenemos que i = i si y solo si i1 = i+1 , si y solo si
= 1, lo cual no puede suceder si n 3, luego i
2
/ Z(D2n ).
En cambio, i = i si y solo si i = i , si y solo si 2i = 1, lo cual, si
1 i < n, solo puede ser si n = 2i, y en tal caso n/2 Z(D2n ), pues hemos
visto que conmuta con , y obviamente conmuta con .

Ejercicio: Probar que si n es impar D4n


= D2n C2 .

En particular, los dos grupos no abelianos que conocemos de orden 8, es


decir, D8 y Q8 tienen el centro de orden 2. Vamos a ver que esto no es casual.
Para ello probamos un resultado general:
6.8. p-grupos 229

Teorema 6.55 (Ecuacion de clases) Si G es un grupo finito no abeliano,


existen elementos x1 , . . . , xn G tales que CG (xi ) 6= G y
n
P
|G| = |Z(G)| + |G : CG (xi )|.
i=1

Demostracion: Sean x1 , . . . , xm un representante de cada clase de con-


jugacion de G. Podemos suponer que las clases de x1 , . . . , xn tienen mas de
un elemento cada una, mientras que las de xn+1 , . . . , xm tienen un solo ele-
mento. Pero cl(x) = {x} es equivalente a x Z(G), luego tenemos que
Z(G) = {xn+1 , xn }. Ahora basta tener en cuenta que
m
P n
P n
P
|G| = |cl(xi )| = |Z(G)| + |cl(xi )| = |Z(G)| + |G : CG (xi )|,
i=1 i=1 i=1

donde |G : CG (xi )| 6= 1.
De aqu se sigue inmediatamente:

Teorema 6.56 Si p es un primo y G es un p-grupo (un grupo de orden potencia


de p), entonces Z(G) 6= 1.

Demostracion: Basta considerar la ecuacion de clases para G, en la que


p divide tanto a |G| como a cada |CG (xi )|, luego p | |Z(G)|, y esto implica que
Z(G) 6= 1.
En el caso de los grupos no abelianos de orden 8, en principio su centro
podra tener 2 o 4 elementos, pero el teorema siguiente descarta el segundo
caso:

Teorema 6.57 Si un grupo G cumple que G/Z(G) es cclico, entonces G es


abeliano, luego |G : Z(G)| no puede ser un numero primo.

Demostracion: Sea G/Z(G) = hgZ(G)i. Entonces, todo x G cumple


que xZ(G) = g n Z(G), luego x = g n z, con z Z(G), pero es claro que dos
elementos de esta forma conmutan, luego G es abeliano.
As pues, el centro de todo grupo de orden p3 tiene que tener orden p. Mas
aun:

Teorema 6.58 Si p es primo, todo grupo de orden p o p2 es abeliano.

Demostracion: Ya sabemos que todo grupo de orden p es isomorfo a


Cp . Si G tiene orden p2 , los dos teoremas anteriores nos dan que Z(G) 6= 1 y
|Z(G)| 6= p, luego Z(G) = G.
As pues, todos los grupos de ordenes 1, 2, 3, 4, 5, 7, 9, 11, 13 son abelianos y
son todos de la forma Cp o bien Cp Cp .
El teorema siguiente nos sera util en varias ocasiones:
230 Captulo 6. Grupos

Teorema 6.59 Si p es un primo, todo p-grupo posee subgrupos de todos los


grupos que dividen a su orden.

Demostracion: Sea |G| = pn . Vamos a probar que G cumple el resultado


por induccion sobre n. Si n = 1 entonces G es cclico y no hay nada que probar.
Si vale para grupos de orden pm con m < n distinguimos dos casos: si G es
abeliano ya sabemos que cumple el teorema. En caso contrario, |Z(G)| = pr ,
con r > 0 luego |G/Z(G)| = pnr . Por hipotesis de induccion G/Z(G) tiene un
subgrupo H/Z(G) de orden pi , para todo i n r, luego |H| = pi+r . Esto
prueba que G tiene subgrupos de todos los ordenes pi con r i n, pero como
Z(G) es abeliano, tiene subgrupos de orden pi para 0 i r, luego G tambien.

En particular todo p-grupo tiene un subgrupo de ndice p. Vamos a probar


que tales subgrupos tienen que ser normales, lo cual es consecuencia de un
resultado mas general. Para demostrarlo introducimos una accion que usaremos
con frecuencia:

Definicion 6.60 Si G es un grupo y H G, definimos la accion por multipli-


cacion de G sobre el conjunto = (G/H)d como la dada por (Hg)g = H(gg ).

Claramente se trata de una accion, luegoTdetermina un homomorfismo de


grupos : G cuyo nucleo es N( ) = Hg.
gG
En efecto, x N( ) si y solo si para todo g G se cumple que Hgx = Hg,
lo cual equivale a que gxg 1 H, o tambien a que x H g , para todo g G.

En particular, N( ) H.

Por ejemplo, tomando H = 1 obtenemos esta consecuencia:

Teorema 6.61 Todo grupo finito es isomorfo a un subgrupo de un grupo n .

Pero el resultado que perseguamos es el siguiente, que generaliza al hecho


de que los subgrupos de ndice 2 son normales:

Teorema 6.62 Sea G un grupo finito y H un subgrupo tal que |G : H| = p sea


el menor primo que divide a |G|. Entonces H E G.

Demostracion: Sea = (G/H)d y : G el homomorfismo aso-


ciado a la accion por multiplicacion. Sea N = N( ) E G. Se cumple que
N H G. Por el teorema de isomorfa G/N es isomorfo a un subgrupo de
, luego |G : N | p!, pero tambien |G : N | |G| y p es el menor primo que
divide a |G|. Es claro entonces que |G : N | = p (no puede ser |G : N | = 1
porque p = |G : H| |G : N |). Ahora bien, si N H G y los dos tienen
ndice p, tiene que ser H = N E G.
6.9. Los teoremas de Sylow 231

6.9 Los teoremas de Sylow


Terminamos este captulo con unos resultados fundamentales sobre existen-
cia de subgrupos en grupos finitos. Hemos visto que el grupo alternado A4
tiene orden 12, pero no tiene subgrupos de orden 6. Sin embargo, ahora vamos
a probar que todo grupo finito tiene subgrupos de cualquier orden potencia de
primo que divida a su orden. Para ello conviene dar esta definicion:

Definicion Sea G un grupo finito y p un numero primo. Sea |G| = pn m,


con (p, m) = 1 (quiza con n = 0). Un subgrupo H de G de orden pn se llama
p-subgrupo de Sylow de G.

Teorema 6.63 (Primer teorema de Sylow) Si G es un grupo finito y p un


numero primo, entonces G tiene un p-subgrupo de Sylow.

Demostracion: Por induccion sobre el orden de G. Si G tiene orden 1


es obvio. Supongamos que todos los grupos de orden menor que |G| tienen
p-subgrupos de Sylow y demostremos que G tambien los tiene.
Si p |G|, entonces el subgrupo trivial es un p-subgrupo de Sylow de G.
Supongamos, pues, que p |G|. Sea |G| = pn m, con (p, m) = 1.
Distinguimos dos casos:
Caso 1 Existe un subgrupo H < G tal que p |G : H|.
Entonces pn | |H| y por hipotesis de induccion H tiene un p-subgrupo de
Sylow P de orden pn , y as, P es tambien un p-subgrupo de Sylow de G.
Caso 2 Para todo subgrupo H < G, se cumple que p | |G : H|.

Entonces la ecuacion de clases nos da que p |Z(G)|. Como se trata de un
grupo abeliano, tiene un elemento de orden p o, lo que es lo mismo, tiene un
subgrupo H Z(G) de orden p. Como los elementos de H conmutan con todos
los elementos de G, es evidente que H g = H para todo g G, o sea, H E G.
Se cumple que |G/H| = pn1 m y tiene un subgrupo de Sylow P/H que
cumplira |P/H| = pn1 , luego |P | = pn , es decir, P es un subgrupo de Sylow
de G.
Como todo p-grupo tiene subgrupos de todos los ordenes posibles, es claro
que, tal y como habamos anunciado, todo grupo finito tiene subgrupos de
todos los ordenes potencia de primo que dividan a su orden. Veamos algunas
aplicaciones:

Teorema 6.64 Si p es un primo impar, todo grupo no abeliano de orden 2p es


isomorfo a D2p .

Demostracion: Sea G un grupo no abeliano de orden 2p. Por el teorema de


Sylow tiene que tener un elemento x de orden p y otro y de orden 2. Entonces
hxi hyi = 1, luego | hxi hyi | = 2p, luego G = hx, yi. El grupo N = hxi es
normal, porque tiene ndice 2, luego xy N . Pongamos que xy = xi . Entonces
232 Captulo 6. Grupos

2 2
x = xy = (xy )y = xi , luego i2 1 (mod p), luego i = 1, pero si i = 1
entones xy = x y G sera abeliano, luego xy = x1 , luego G
= D2p por 6.39.

En particular, todo grupo de orden 6 es isomorfo a C6 o a D6


= 3 .

Teorema 6.65 Si p < q son primos y p q 1, entonces todo grupo de orden pq


es cclico. Por ejemplo, todo grupo de orden 15 es cclico.

Demostracion: Sea G un grupo de orden pq y sea N E G un q-subgrupo


de Sylow, que es normal por 6.62. Sea H un p-subgrupo de Sylow. Entonces
N H = 1, luego |N H| = pq, luego G = N H. Consideramos el homomorfismo
f : H Aut(N ) que a cada h H le asigna la conjugacion por h. Por 6.46
tenemos que |Aut(N )| = q 1, luego N(f ) 6= 1, luego N(f ) = H, y esto significa
que si n N y h H entonces nh = n, es decir, que N y H conmutan elemento
a elemento, luego G es abeliano, luego es cclico.
La tabla siguiente contiene todos los subgrupos de cada orden posible entre
2 y 15. El unico caso que no tenemos demostrado es el correspondiente a los
subgrupos de orden 12, donde aparece un grupo Q12 que no conocemos:

orden grupos orden grupos


2 C2 9 C9 , C3 C3
3 C3 10 C10 , D10
4 C4 , C2 C2 11 C11
5 C5 12 C12 , C6 C2 , A4 , D12 , Q12
6 C6 , D6 = 3 13 C13
7 C7 14 C14 , D14
8 C8 , C4 C2 , C2 C2 C2 , 15 C15
D8 , Q8

Antes de ocuparnos de ese caso conviene refinar un poco el teorema de Sylow:

Teorema 6.66 (Segundo teorema de Sylow) Si G es un grupo finito, todo


p-subgrupo de G esta contenido en un p-subgrupo de Sylow y dos p-subgrupos de
Sylow cualesquiera son conjugados.

Demostracion: Sea P un p-subgrupo de Sylow de G y sea Q un p-subgrupo


arbitrario. Entonces Q actua sobre = (G/P )d por multiplicacion a derecha.
El teorema 6.15 nos da que las orbitas de los elementos de tienen cardinal
potencia de p, sin excluir la posibilidad de que alguna tenga cardinal p0 = 1.
De hecho, concluimos que alguna orbita ha de tener cardinal igual a 1, pues,
de lo contrario, el cardinal de , que es |G : P |, sera suma de potencias (no
triviales) de p, luego sera multiplo de p.
As pues, existe un g G tal que la clase x = P g forma una orbita trivial,
con x como unico elemento. Mas explcitamente, P gq = P g para todo q Q.
En particular gq P g, luego q P g , para todo q Q. Concluimos que Q P g
y P g es tambien un subgrupo de Sylow de G.
6.9. Los teoremas de Sylow 233

Si Q es tambien un p-subgrupo de Sylow de G, entonces ha de darse la


igualdad Q = P g , pues tenemos una inclusion y ambos grupos tienen el mismo
orden.

As pues, los p-subgrupos de Sylow forman una orbita en la accion de G por


conjugacion en el conjunto de todos sus subgrupos, luego si P es un p-subgrupo
de Sylow, el numero total de ellos es |G : NG (P )|, que es un divisor del orden de
G (e incluso de |G : P |). En particular G tiene un unico p-subgrupo de Sylow
si y solo si tiene un p-subgrupo de Sylow normal.

Grupos de orden 12 Sea G un grupo no abeliano de orden 12. Sea P3 un


3-subgrupo de Sylow. Supongamos que no es normal. Entonces la accion por
multiplicacion de G sobre el conjunto = (G/P3 )d determina un homomorfismo
: G tal que N( ) P3 . Como P3 no es normal, tiene que ser N( ) = 1,
luego G es isomorfo a un subgrupo de 4 de orden 12, luego G = A4 .
A partir de aqu suponemos que P3 E G, con lo que P3 = {1, x, x2 } es el
unico 3-Sylow de G y x, x2 son los unicos elementos de orden 3 de G.
Entonces G actua por conjugacion sobre P3 , luego |G : CG (x)| 2, ya que
cl(x) {x, x2 }. As pues, CG (x) tiene orden 6 o 12. En cualquier caso hay un
y CG (x) de orden 2, luego a = xy tiene orden 6. Sea N = hai E G (es normal
porque tiene ndice 2).
Un elemento b G \ N tiene que tener orden 2, 4, 6 (no puede tener orden 3
porque ya hemos visto que no hay mas elementos de orden 3 ni 12, porque
entonces G sera abeliano). Si tiene orden 6, entonces | hbi N | = 3, pues la
interseccion tiene que contener a los elementos de orden 3, luego b3
/ N y tiene
orden 2. As pues, cambiando b por b3 si es preciso podemos tomar un b G \ N
de orden 2 o 4. Si o(b) = 4, entonces, como no puede ser N hbi = 1 (ya que
entonces |N hbi | = 24), tiene que ser b2 N . En ambos casos G = ha, bi.
Veamos que ab = a1 . En efecto, con N E G, tenemos que ab = ai , para
2 2
cierto i, de modo que a = ab = ai , luego i2 1 (mod 6), y considerando las
seis clases de Z/6Z, vemos que esto solo puede ocurrir si ab = a o ab = a1 . En
el primer caso G sera abeliano, luego concluimos que ab = a1 . Si o(b) = 2 el
teorema 6.39 nos da que G = D12 . Si o(b) = 4, entonces tenemos que

G = ha, bi , con a6 = b4 = 1, a3 = b 2 , ab = a1 .

Sucede que estas propiedades determinan completamente a un grupo Q12 ,


en el sentido de que, por una parte, existe un grupo de orden 12 que cumple
estas condiciones y, por otra parte, dos grupos de orden 12 que las cumplan son
isomorfos entre s.

Dejamos al lector comprobar los detalles: los elementos de un grupo de orden


12 en estas condiciones se expresan de forma unica como ai bj , con i = 0, . . . , 5,
j = 0, 1, y el producto de dos de ellos se describe exactamente igual a como
hemos hecho en el teorema 6.39 con el grupo diedrico.
234 Captulo 6. Grupos

Para probar que realmente existe un grupo que cumple estas condiciones
consideramos el cuerpo ciclotomico Q[] de orden 3, donde 3 = 1 y las matrices
   
0 0 1
a= , b = .
0 2 1 0

El grupo G = ha, bi cumple lo requerido.


Terminamos esta captulo con algunos resultados que terminan de perfilar
la teora de Sylow:

Teorema 6.67 (Tercer teorema de Sylow) El numero p de p-subgrupos de


Sylow de un grupo finito cumple p 1 (mod p).

Demostracion: Sea G un grupo finito, sea el conjunto de sus p-subgrupos


de Sylow, sea P y consideremos la accion de P en por conjugacion. Ob-
viamente, P g = P para todo g P , luego la orbita de P es trivial. Veamos
que es la unica. Si Q , cumple que Qg = Q para todo g P , entonces
P NG (Q), pero entonces P y Q son p-subgrupos de Sylow de NG (Q), luego
son conjugados en NG (Q), es decir, existe g NG (Q) tal que P = Qg = Q.
Las orbitas que P forma en tiene cardinal potencia de P , y hemos visto
que la unica que tiene cardinal 1 es la de p, luego p = || 1 (mod p).

Ejemplo Todo grupo de orden 42 tiene un unico 7-subgrupo de Sylow, que es,
por consiguiente, normal.
En efecto, el numero de 7-subgrupos de Sylow tiene que dividir a 6 y ser
congruente con 1 modulo 7, luego tiene que ser 7 = 1.

Ejemplo Todo subgrupo de orden 30 tiene un subgrupo de Sylow normal.


En efecto, como en el ejemplo anterior vemos que 3 = 1, 10, y que 5 = 1, 6.
Ahora bien, si fuera 3 = 10 y 5 = 6, el grupo tendra que tener 10 2 = 20
elementos de orden 3 y 6 4 = 24 elementos de orden 5, lo que suma 44, mas
que el total de elementos del grupo. Por lo tanto, o bien hay un 3-Sylow, o bien
un 5-Sylow normal.

Teorema 6.68 Si G es un grupo finito, N E G y P es un p-subgrupo de Sylow


de G, entonces P N es un p-subgrupo de Sylow de N y N P/N es un p-subgrupo
de Sylow de G/N .

Demostracion: Si P es un p-subgrupo de Sylow de N , entonces P P ,


para cierto p-subgrupo de Sylow P de G, y existe un g G tal que P g = P ,
luego P g P g N g = P N y P N es un p-subgrupo de N que contiene un
p-subgrupo de Sylow de N , luego P N = P g es un p-subgrupo de Sylow de N .
La segunda parte se deduce facilmente de que |N P/N | = |P : N P |.
Captulo VII

Extensiones de cuerpos

Con la teora de espacios vectoriales y la teora de grupos como herramien-


tas, estamos en condiciones de profundizar notablemente en el estudio de los
anillos que nos hanido apareciendo
 en captulos anteriores, tales como los cuer-
pos cuadraticos Q 5 o los cuerpos ciclotomicos Q[]. De momento nos
ocuparemos solode los
 cuerpos y dejaremos para mas adelante el estudio de los
anillos como Z 5 o Z[], pues en este captulo usaremos fuertemente las
propiedades de los espacios vectoriales.

7.1 Extensiones algebraicas


Definicion 7.1 Diremos que K/k es una extension de cuerpos (o simplemente
una extension) si K es un cuerpo y k es un subcuerpo de K. El cuerpo k se
llama cuerpo base de la extension.

La primera observacion importante es que si K/k es una extension, entonces


K es un kespacio vectorial con las operaciones obvias. Llamaremos grado de
la extension a la dimension de K como kespacio vectorial. Lo representaremos
por |K : k|. Una extension es finita o infinita segun lo sea su grado.
   
Por ejemplo, Q 5 : Q = 2, pues una base de Q 5 como Qespacio

vectorial esta formada por los numeros 1 y 5. Los resultados vistos en la
seccion
4.5
sobre los cuerpos ciclotomicos Q[] para un primo p nos dan que
Q[] : Q = p1, pues una base de Q[] como Qespacio vectorial es la formada
por 1, , . . . , p2 .
Nos van a interesar especialmente las extensiones finitas, aunque tendremos
ocasion de trabajar con algunas infinitas. El resultado siguiente es fundamental
en todo lo que sigue:

Teorema 7.2 (Teorema de transitividad de grados) Sea k K L una


cadena de extensiones de cuerpos. Entonces |L : k| = |L : K| |K : k|.

235
236 Captulo 7. Extensiones de cuerpos

Lo probaremos para extensiones finitas, aunque el caso general se prueba sin


ningun cambio importante.
Demostracion: Sea {x1 , . . . , xm } una base de K como kespacio vectorial.
Sea {y1 , . . . , yn } una base de L como Kespacio vectorial. Basta probar que el
conjunto
{xi yj | i = 1, . . . , m, j = 1, . . . , n}
es una base de L como kespacio vectorial con exactamente mn elementos.
n P
P m
Supongamos que aij xi yj = 0 para ciertos coeficientes aij en k. En-
j=1 i=1
m
P
tonces, para cada j, se cumple que aij xi K y como {y1 , . . . , yn } es una
i=1
m
P
base de L sobre K, podemos concluir que aij xi = 0 para cada j. Ahora,
i=1
al ser {x1 , . . . , xm } una base de K sobre k, podemos concluir que todos los
coeficientes aij son nulos.
Esto prueba que los xi yj son distintos para ndices distintos y que forman
un conjunto linealmente independiente. En particular tiene mn elementos.
Ahora sea z cualquier elemento de L. Como {y1 , . . . , yn } es una base de L
Pn
sobre K, existen elementos b1 , . . . , bn en K tales que z = bj yj . A su vez,
j=1
m
P
cada elemento bj se expresa como combinacion lineal bj = aij xi para ciertos
i=1
coeficientes aij en k.
n P
P m
Por tanto z = aij xi yj es combinacion lineal de los elementos xi yj ,
j=1 i=1
que son, pues un generador de L.
En particular una extension finita de una extension finita es una extension
finita del cuerpo menor. Ahora introducimos el concepto mas importante de
este captulo:

Definicion 7.3 Sea K/k una extension y a K. Se dice que el elemento a es


algebraico sobre k si existe un polinomio p(x) k[x] no nulo tal que p(a) = 0.
En caso contrario se dice que es trascendente sobre k.
La extension K/k es algebraica si todos los elementos de K son algebraicos
sobre k. En caso contrario se dice que es trascendente.

Por ejemplo, todo elemento a del cuerpo


base es algebraico, pues es raz del
polinomio x a k[x]. El numero 5 es raz de x2 + 5 Q[x], luego es
algebraico sobre Q. Por el contrario, en la extension Q(x)/Q, el elemento x es
obviamente trascendente.
Puede parecer fuerte la exigencia de que todos los elementos de una extension
sean algebraicos, pero en realidad se cumplira en todos los casos que vamos a
manejar. De ello es responsable en gran parte el teorema siguiente:

Teorema 7.4 Toda extension finita es algebraica.


7.1. Extensiones algebraicas 237

Demostracion: Sea K/k una extension finita de grado n y sea a K.


Consideremos las potencias

1, a, a2 , ... , an .

Si hay dos iguales, digamos ai = aj con i 6= j, entonces a es raz del polinomio


no nulo xi xj k[x].
Si son distintas, son n + 1 elementos distintos de un espacio vectorial de di-
mension n, luego no pueden ser linealmente independientes. Existen coeficientes
b0 , . . . , bn en k no todos nulos de modo que b0 + b1 a + + bn an = 0, con lo que
a es raz del polinomio no nulo b0 + b1 x + + bn xn k[x].
 
Por ejemplo, consideremos el elemento 1 + 5 Q 5 . Como la ex-
 
tension Q 5 /Q tiene grado 2, siguiendo la prueba del teorema anterior es

suficiente considerar las potencias 1, 1 + 5, (1 + 5 )2 = 4 + 2 5. Hay
que buscar numeros racionales a, b, c que cumplan

a + b(1 + 5) + c(4 + 2 5 ) = a + b 4c + (b + 2c) 5 = 0,

lo que equivale a que a


+ b 4c = 0 = b + 2c. Por ejemplo sirven c = 1, b = 2
y a = 6. As pues, 1 + 5 es raz del polinomio 6 2x + x2 Q[x].
Introducimos ahora en general una notacion que venimos empleando desde
hace tiempo en muchos casos particulares. Se trata de una forma muy comoda
de describir extensiones de un cuerpo a partir de elementos generadores:

Definicion 7.5 Sea B un dominio ntegro y A un subanillo unitario. Sea S un


subconjunto de B. Llamaremos A[S] a la interseccion de todos los subanillos de
B que contienen a A y a S.

Es facil probar que

A[S] = {p(a1 , . . . , an ) | n N, p(x1 , . . . , xn ) A[x1 , . . . , xn ], a1 , . . . , an S},

pues este conjunto es ciertamente un subanillo de B que contiene a A y a S,


luego contiene a A[S], y por otra parte, como A[S] es un anillo, ha de contener
a todos los elementos de la forma p(a1 , . . . , an ).
Sea ahora K un cuerpo y k un subcuerpo de K. Si S es un subconjunto de K,
llamaremos k(S) a la interseccion de todos los subcuerpos de K que contienen
a k y a S. Se prueba igualmente que
 
p(b1 , . . . bn )
k(S) = | n N, p, q k[x1 , . . . , xn ], bi S, q(b1 , . . . , bn ) 6= 0 .
q(b1 , . . . bn )

El cuerpo k(S) se llama adjuncion a k de S. Cuando S = {b1 , . . . , bn } es un


conjunto finito escribiremos tambien

A[b1 , . . . , bn ] y k(b1 , . . . , bn ).
238 Captulo 7. Extensiones de cuerpos

Notemos que A[S T ] = A[S][T ] y k(S T ) = k(S)(T ). En particular

A[b1 , . . . , bn ] = A[b1 ] . . . [bn ] y k(b1 , . . . , bn ) = k(b1 ) . . . (bn ).

Observemos que la notacion A[S] y k(S) para los anillos de polinomios y los
cuerpos de fracciones algebraicas que venimos utilizando es un caso particular
de la que acabamos de introducir.
 Tambien
 son casos particulares los nombres
que hemos dado a los anillos Z 5 , etc.
Una extension K/k es finitamente generada si K = k(S), para un conjunto
finito S K. Si K = k(a) la extension es simple. Todo a que cumpla esto (que
no es unico) se llama elemento primitivo de la extension.
Es facil ver que toda extension finita es finitamente generada, pues si S es
una kbase de K es claro que K = k[S] = k(S).

Ejercicio: Probar que Q( 2, 3 ) = Q( 2 + 3 )
Las extensiones algebraicas tienen un comportamiento y una estructura muy
simples. Sus propiedades basicas son consecuencia del teorema siguiente. Es
de destacar que en la prueba hacemos uso de los principales resultados que
conocemos sobre anillos de polinomios y divisibilidad.

Teorema 7.6 Sea K/k una extension y a K un elemento algebraico sobre k.


Entonces:
1. Existe un unico polinomio monico irreducible p(x) k[x] tal que p(a) = 0.
2. Un polinomio g(x) k[x] cumple g(a) = 0 si y solo si p(x) | g(x).

3. k(a) = k[a] = r(a) | r(x) k[x] y grad r(x) < grad p(x) .

Demostracion: Consideremos el epimorfismo : k[x] k[a] dado por


(g(x)) = g(a). El hecho de que a sea algebraico significa que N() es un ideal
no nulo y, como k[x] es DIP, existe un polinomio no nulo p(x) k[x] tal que
N() = p(x) . Como las constantes son unidades, podemos exigir que p(x) sea
monico (al dividir por el coeficiente director obtenemos un asociado que genera
el mismo ideal). 
Por el teorema de isomorfa, k[x]/ p(x) = k[a], que es un dominio ntegro,
luego el ideal (p(x)) es primo, y por 3.17 es maximal, luego p(x) es irreducible
y k[x]/ p(x) es un cuerpo. Por lo tanto k[a] resulta ser un cuerpo, de donde se
sigue que k[a] = k(a).
El polinomio p es unico, pues
 si q(x) tambien cumple 1), entonces q(a) = 0,
es decir, q(x) N() = p(x) , luego p(x) | q(x), pero si q(x) es irreducible han
de ser asociados, es decir, difieren en una constante, y al ser ambos monicos
deben coincidir. 
El apartado 2) es consecuencia de que N() = p(x) . Respecto a 3), un
elemento de k[a] es de la forma q(a) con q(x) k[x]. Existen polinomios c(x)
y r(x) tales que q(x) = p(x)c(x) + r(x) y grad r(x) < grad p(x). Entonces
q(a) = p(a)c(a) + r(a) = 0 c(a) + r(a) = r(a), luego tiene la forma pedida.
7.1. Extensiones algebraicas 239

Definicion 7.7 Sea K/k una extension y a K un elemento algebraico sobre k.


Llamaremos polinomio mnimo de a sobre k al polinomio pol mn(a, k) k[x]
que cumple el teorema anterior.

As pues, pol mn(a, k) es el menor polinomio no nulo de k[x] que tiene a a


por raz, en el sentido de que divide a cualquier otro que cumpla lo mismo.
El teorema siguiente precisa un poco mas los resultados que hemos obtenido:

Teorema 7.8 Sea K/k una extension y a K un elemento algebraico sobre k.


Sea p(x) = pol mn(a, k). Entonces:

1. La extension k(a)/k es finita y |k(a) : k| = grad p(x).

2. Una base de k(a) sobre k es {1, a, . . . , an1 }, donde n = grad p(x).

Demostracion: El teorema 7.6 3) afirma que {1, a, . . . , an1 } es un gene-


rador de k(a) como kespacio vectorial. Por otra parte ha de ser libre, pues una
combinacion lineal de sus elementos no es sino un polinomio q(a) con coeficien-
tes en k y grado menor o igual que n 1, luego q(a) = 0 implica que p(x) | q(x),
luego por grados q(x) = 0 y los coeficientes de la combinacion lineal son nulos.

As pues, al adjuntar a un cuerpo un elemento algebraico obtenemos una ex-


tension finita, y en particular algebraica. Esto sigue siendo cierto si adjuntamos
un numero finito de elementos algebraicos. Si adjuntamos infinitos podemos
perder la finitud, pero nunca el caracter algebraico de la extension resultante.
Veamoslo.

Teorema 7.9 Sea K/k una extension y S un conjunto de elementos de K al-


gebraicos sobre k. Entonces k(S) = k[S] y k(S)/k es una extension algebraica.
Si el conjunto S es finito, entonces k(S)/k es finita.

Demostracion: Supongamos primero que S = {a1 , . . . , an } es finito. En-


tonces k(a1 ) = k[a1 ], ahora bien, como k[x] k(a1 )[x], todo elemento algebraico
sobre k lo es sobre k(a1 ), luego aplicando de nuevo el teorema 7.6 tenemos
que k(a1 )(a2 ) = k(a1 )[a2 ], luego k(a1 , a2 ) = k[a1 ][a2 ] = k[a1 , a2 ]. Ademas
k(a1 , a2 )/k(a1 ) es finita y por el teorema de transitividad de grados k(a1 , a2 )/k
tambien es finita. Repitiendo n veces llegamos a que la extension k(a1 , . . . , an )/k
es finita y k[a1 , . . . , an ] = k(a1 , . . . , an ).
Sea ahora S un conjunto cualquiera. Si a k(S), entonces

p(b1 , . . . bn )
a= ,
q(b1 , . . . bn )

para ciertos polinomios p, q k[x1 , . . . , xn ] y ciertos b1 , . . . , bn S.


Por lo tanto a k(b1 , . . . , bn ) = k[b1 , . . . , bn ] k[S]. Ademas, segun lo ya
probado, la extension k(b1 , . . . , bn )/k es algebraica, luego a es algebraico sobre k.
En consecuencia k(S) = k[S] es una extension algebraica de k.
240 Captulo 7. Extensiones de cuerpos

Por consiguiente, una extension algebraica es finita si y solo si es finitamente


generada. Una propiedad que acaba de redondear el comportamiento de las
extensiones algebraicas es la siguiente:

Teorema 7.10 Consideremos cuerpos k K L. Entonces la extension L/k


es algebraica si y solo si lo son L/K y K/k.

Demostracion: Si L/k es algebraica, es obvio que K/k lo es. Por otra


parte, todo elemento de L es raz de un polinomio no nulo con coeficientes en k,
luego en K, y esto quiere decir que L/K tambien es algebraica.
Supongamos que L/K y K/k son algebraicas. Tomemos un a L. Entonces
a es algebraico sobre K. Sean b1 , . . . , bn K los coeficientes de pol mn(a, K).
As, pol mn(a, K) k(b1 , . . . , bn )[x], luego a es algebraico sobre k(b1 , . . . , bn ),
luego la extension k(b1 , . . . , bn )(a)/k(b1 , . . . , bn ) es finita. Como b1 , . . . , bn son
algebraicos sobre k, la extension k(b1 , . . . , bn )/k tambien es finita, luego por
transitividad de grados, k(b1 , . . . , bn )(a)/k es finita, luego algebraica, luego a es
algebraico sobre k.

Una consecuencia sencilla pero importante de estas propiedades es que las


operaciones con elementos algebraicos dan elementos algebraicos.

Teorema 7.11 Si K/k es una extension de cuerpos, el conjunto de los elemen-


tos de K que son algebraicos sobre k es un subcuerpo de K.

Demostracion: Si , K son algebraicos sobre K, entonces la extension


k(, )/k es finita, luego es algebraica, luego , , / (el cociente si 6= 0)
son algebraicos sobre k, pues estan en k(, ).

Ejercicio: Probar que si K/k es una extension y p(x) K[x] tiene coeficientes
algebraicos sobre k, entonces toda raz de p(x) en K es algebraica sobre k.

Estudiamos ahora los homomorfismos entre extensiones. Como los cuerpos


no tienen ideales propios, un homomorfismo de cuerpos no nulo es de hecho un
monomorfismo, por lo que definiremos tan solo monomorfismos e isomorfismos
entre extensiones.

Definicion 7.12 Sean K/k y L/l dos extensiones de cuerpos. Un isomorfismo


entre ellas es un isomorfismo de cuerpos : K L tal que [k] = l.

Si K/k y L/k son extensiones de un mismo cuerpo k, entonces un k


monomorfismo (kisomorfismo) entre ellas es un monomorfismo (isomorfismo)
: K L que deja invariantes a los elementos de k. En particular los k
monomorfismos de extensiones son monomorfismos de kespacios vectoriales.

Si K/k es una extension, un kautomorfismo de K es un kisomorfismo de


K/k en K/k, es decir, un isomorfismo de K en K que deja invariantes a los
elementos de k.
7.1. Extensiones algebraicas 241

Notemos que si : K K es un isomorfismo de cuerpos, entonces el con-


junto {a K | (a) = a} es un subcuerpo de K, luego contiene al cuerpo primo.
Esto quiere decir, por ejemplo, que los Qautomorfismos de una extension K/Q
son todos los automorfismos de K, es decir, la condicion de fijar a los elementos
de Q no es una restriccion en realidad.
Llamaremos grupo de Galois de una extension de cuerpos K/k el grupo
G(K/k) de todos los kautomorfismos de K.
Veremos que, a traves de los grupos de Galois, la teora de grupos se convierte
en una poderosa herramienta para el estudio de las extensiones de cuerpos.
Si tenemos un cuerpo k y un polinomio irreducible p(x) k[x], el teorema
3.49 nos da una extension de k donde p(x) tiene una raz. Si recordamos
 la
prueba veremos que la extension es concretamente K = k[x]/ p(x) y la raz
es a = [x] (identificando a k con las clases de polinomios constantes). Esta
extension cumple ademas que K = k(a). Por otra parte, en la prueba del
teorema 7.6 hemos obtenido que toda extension de la forma k(a), donde a
es raz de p(x), es isomorfa a la construida en 3.49. Como consecuencia dos
cualesquiera de estas extensiones son isomorfas entre s. Lo probamos en un
contexto mas general.

Teorema 7.13 Sean K/k y L/l dos extensiones y : k l un isomorfismo.


Sea a K un elemento algebraico sobre k. Sea p(x) = pol mn(a, k). Conside-
remos la extension de a los anillos de polinomios : k[x] l[x]. Sea b una
raz en L de p(x). Entonces se extiende a un isomorfismo : k(a) l(b)
tal que (a) = b.

Demostracion: La aplicacion : k[x] k(a) dadapor g(x) = g(a) es
un epimorfismo cuyo nucleo
 es precisamente el ideal p(x) , luego por el teorema
de isomorfa k[x]/ p(x) = k(a), y la imagen de [x] por el isomorfismo es a.
Es obvio que p(x) = pol mn(b, l), luego por el mismo argumento tenemos
tambien que l[x]/ p(x) = l(b), y la imagen de [x] por el isomorfismo es b.
Por otra parte el isomorfismo
 : k[x]
 l[x] cumple (x) = x e induce un
isomorfismo k[x]/ p(x) = l[x]/ p(x) que lleva [x] a [x].
La composicion de todos estos isomorfismos nos da el isomorfismo buscado.

En particular, un cuerpo de la forma k(a) (con a algebraico) esta totalmente


determinado por k y el polinomio mnimo de a. Para enunciar esto de la forma
mas adecuada conviene introducir un concepto.

Definicion 7.14 Sean K/k y L/k dos extensiones de un mismo cuerpo k y sean
a K y b L dos elementos algebraicos sobre k. Diremos que son kconjugados
si su polinomio mnimo sobre k es el mismo.

Teorema 7.15 Sean K/k y L/k dos extensiones del mismo cuerpo k, sean
a K y b L algebraicos sobre k. Entonces a y b son kconjugados si y solo
si existe un kisomorfismo : k(a) k(b) tal que (a) = b.
242 Captulo 7. Extensiones de cuerpos

Demostracion: Si a y b son kconjugados el resultado se sigue del teorema


anterior.
Si existe en dichas condiciones
 y p(x)
 = pol mn(a, k), entonces p(a) = 0,
luego tambien p(b) = p (a) = p(a) = 0, con lo que p(x) = pol mn(b, k)

En la prueba anterior hemos usado dos hechos elementales, pero de uso


muy frecuente: el primero es que un polinomio monico irreducible es el polino-
mio mnimo de cualquiera de sus races. El segundo es que la imagen por un
kmonomorfismo de una raz de un polinomio de k[x] es necesariamente otra
raz de dicho polinomio.
 
Ejemplo Consideremos la extension Q 5 /Q, que podemos interpretar se-
 
gun la definicion 3.50 aplicada al polinomio x2 5, de modo que Q 5 es un

cuerpo en el que 5 es una raz del polinomio x2 5, y que es la adjuncion a
Q de dicha raz en el sentido de la definicion 7.5, pues sus elementos son de la
forma a + b 5, con a, b Q.
Concretamente, en 3.50 hemos definido este cuerpo como el anillo cociente
Q[x]/(x2 5), de modo que 5 es la clase de equivalencia del polinomio x, y as
obtenemos ciertamente un cuerpo en el que x2 5 tiene una raz. Ahora bien,
ya conocemos un cuerpo donde x2 5 tiene una raz, a saber, el cuerpo Rde los
numeros reales, por lo que tambien podemos considerar el cuerpo Q 5 R.
 
El teorema anterior nos dice que los dos cuerpos Q 5 son Q-isomorfos, por lo

que es irrelevante que pensemos en uno o en otro. Da igual pensar que 3 + 7 5
es un numero real
o una clase de equivalencia de polinomios. Los elementos de
la forma a + b 5, sean numeros reales o clases de equivalencia de polinomios,
constituyen cuerpos Q-isomorfos, y todas las propiedades algebraicas que valen
para uno, valen para el otro.  
En cambio, podemos hablar del cuerpo Q 5 definido segun 3.50 como
cociente del anillo Q[x], pero no podemos identificar sus elementos con numeros
reales, pues el polinomio x2 + 5 no tiene races en R.
Veamos un primer resultado sobre grupos de Galois:

Teorema 7.16 Si K/k es una extension finita, entonces el grupo de Galois


G(K/k) es finito.

Demostracion: Sea K = k[S], donde S = {1 , . . . , n }. Entonces, cada


K es de la forma = p(1 , . . . , n ), con p(x1 , . . . , xn ) k[x1 , . . . , xn ].
Si G(K/k), entonces () = p((1 ), . . . , (n )). Por lo tanto, si dos
k-automorfismos coinciden sobre S, son iguales.
Ahora bien, si pi (x) k[x] es el polinomio mnimo de i , tenemos que
pi (i ) = 0, luego pi ((i )) = (p(i )) = 0, luego (i ) es una de las races de
pi (x) en K. Como un polinomio tiene un numero finito de races en un cuerpo,
resulta que (i ) solo puede tomar un numero finito de valores. Si llamamos
T al conjunto de las imagenes de elementos de S por elementos de G(K/k),
tenemos que es un conjunto finito, y la aplicacion G(K/k) T S dada por
7 |S es inyectiva, luego G(K/k) es finito.
7.1. Extensiones algebraicas 243

Particularicemos el argumento del teorema anterior al caso de una extension


algebraica simple k(a)/k. Tenemos que un kautomorfismo esta determinado
por el valor (a) que toma en el elemento primitivo a, as como que (a) ha de
ser una raz de pol mn(a, k), luego la extension k(a)/k tiene a lo sumo tantos
kautomorfismos como races tiene (en k(a)) el polinomio mnimo de a.
Recprocamente, si b k(a) es una raz de pol mn(a, k), entonces a y b son
kconjugados, luego existe un kisomorfismo : k(a) k(b), pero k(b) k(a)
y ambos tienen el mismo grado sobre k (el grado del polinomio mnimo de a).
As pues, k(a) = k(b) y es un kautomorfismo de k(a).
En resumen, una extension algebraica simple k(a)/k tiene exactamente tan-
tos kautomorfismos como races tiene en k(a) el polinomio mnimo de a. En
particular el numero de kautomorfismos no puede superar al grado de la ex-
tension.

Por ejemplo, en la extension Q(i)/Q el elemento primitivo i tiene dos con-


jugados, el mismo y i. En consecuencia Q(i) tiene dos automorfismos, la
identidad y el determinado por (i) = i, es decir, (a + bi) = a bi.

Recordemos
 que en los ejemplos de la seccion 3.7, sobre los cuerpos Q(i),
Q() o Q 5 ha sido crucial la consideracion de las normas respectivas.
Uno de los resultados que proporciona la teora de extensiones algebraicas es
la posibilidad de definir normas similares en cualquier extension finita. Si una
extension K/k tiene grado n y 1 , . . . n son kautomorfismos de K, la norma
de un elemento a K puede definirse como

N(a) = 1 (a) n (a).

Es claro que una norma as definida conserva productos, pero todava no sabe-
mos probar otro hecho fundamental, y es que, para que sirva de algo, N(a) ha
de pertenecer al cuerpo base k.
De momento podemos comprobar, al menos, que este esquema general es
valido en los ejemplos que hemos manejado. Por ejemplo, la norma en Q(i)
viene dada por N(a + bi) = a2 + b2 = (a + bi)(a bi) = (a + bi)(a + bi), luego
es ciertamente el producto de los dos automorfismos
de la extension Q(i)/Q. El
lector puede igualmente contrastar el caso de Q 5 , etc.

Ejercicio: Comprobar que la extension ciclotomica Q()/Q, donde p = 1, tiene


exactamente p 1 automorfismos. Calcular explcitamente la norma de un elemento
a0 + a1 + + ap2 p2 (definida como el producto de sus imagenes por todos los
automorfismos) en los casos p = 3 y p = 5. Comprobar que en ambos casos la norma
es un numero racional y que la norma de un elemento del anillo Z[] es un entero.

Sin embargo no todas las extensiones algebraicas simples tienen tantos iso-
morfismos como su grado. Se trata de una patologa relativamente frecuente
que debemos comprender. A continuacion analizamos con detalle un ejemplo
concreto. Nuestro objetivo a medio plazo sera obtener un marco general que
sustituya a los razonamientos particulares que aqu vamos a emplear:
244 Captulo 7. Extensiones de cuerpos

Ejemplo Consideremos el polinomio x3 2, que no tiene races en Q porque


no las tiene en Z (criterio de Gauss).
Por lo tanto es irreducible en Q[x]. Sin
3
embargo,
tiene una unica raz 2 R, que nos permite formal la extension
Q[ 3 2]/Q, de grado 3. Tenemos la factorizacion

x3 2 = (x 2)(x2 + 2 x + 4),
3 3 3

donde el segundo factor no tieneraces en R (porque la raz cubica deun numero


es unica), luego tampoco
en Q[ 3 2]. As pues, el elemento primitivo 3 2 no tiene
3 3
conjugados en Q[ 2] (aparte de s mismo), luego G(Q[ 2 ]/Q) = 1.

Sin embargo, podemos aplicar el teorema
3.49
al cuerpo Q[ 3 2] para obtener
un cuerpo en el que el polinomio
x2 + 3 2 x + 3 4 tiene una raz , lo que nos
permite formar el cuerpo Q[ 2, ], que tiene grado 2 sobre Q[ 3 2], luego grado 6
3

sobre Q. 
El polinomio x3 2 tiene dos races en Q 3 2, , luego tiene tres. Por

razones de simetra conviene abandonar la notacion 3 2 y llamar = 3 2, ,
a las tres races. As
x3 2 = (x )(x )(x ).
De este modo, x3 2 es el polinomio mnimo en Q de , y x2 + x + 2 es
el polinomio mnimo en Q() de y . Por lo tanto
|Q(, ) : Q| = |Q(, ) : Q()||Q() : Q| = 2 3 = 6.
Una Qbase de Q() la forman los elementos 1, , 2 . Una Q()base de
Q(, ) la forman 1, , luego una Qbase de Q(, ) esta formada (segun la
prueba de la transitividad de grados) por los elementos
1, , 2 , , , 2 . (7.1)
Nos falta la expresion de en esta base, pero teniendo en cuenta que
x2 + x + 2 = (x )(x ),
resulta que = , luego = .
Ejercicio: Expresar el producto de cada par de elementos de la base (7.1) como
combinacion lineal de los elementos de dicha base. Notemos que 2 + + 2 = 0,
luego 2 = 2 .

Ahora tenemos tres monomorfismos , , : Q 3 2 Q(, ) que

asignan a 3 2 los
valores
 , y . Con ellos ya podemos definir una norma.
Para cada u Q 3 2 sea

N(u) = (u) (u) (u)


y as tenemos una norma multiplicativa como en Q(i). Vamos a ver que,
efecti-
vamente, N(u) Q. El elemento u sera de la forma u = a + b 3 2 + c 3 2 2 , para
ciertos a, b, c Q. Sus conjugados son
a + b + c2 , a + b + c 2 , a + b + c 2 .
7.2. Extensiones normales 245

Por tanto la norma sera


(a + b + c2 )(a + b + c 2 )(a + b + c 2 ).
Tras un calculo no muy complejo (teniendo en cuenta las relaciones que
hemos obtenido entre , , ) se obtiene

3

3 2 3 3 3
N(a + b 2 + c 2 ) = a + 2b + 4c 6abc Q.
 
Mas aun, la norma en el anillo Z 3 2 toma valores enteros.
Una muestra de la potencia de la teora es que no hubiera sido nada facil
probar directamente que esta expresion es multiplicativa, ni mucho menos haber
llegado hasta ella sin el auxilio de la teora de extensiones. No estamos en con-
diciones de apreciar el valor que tiene la norma de una extension, pero lo cierto
es que representa un papel fundamental no solo en la practica, sino tambien en
los resultados teoricos mas profundos.
En general vemos que si queremos definir normas en una extension simple
K/k donde no hay suficientes automorfismos, lo que hay que hacer es considerar
una extension mayor L/K que contenga los conjugados del elemento primitivo y
definir la norma como el producto de todos los kmonomorfismos : K L.
En las secciones siguientes nos ocuparemos de justificar que este procedimiento
siempre funciona.

7.2 Extensiones normales


En esta seccion generalizaremos la tecnica empleada en el ultimo ejemplo de
la seccion precedente en virtud de la cual es posible extender un cuerpo hasta
otro que contenga todas las races de un polinomio dado. Precisamos esta idea
mediante la definicion siguiente:
Definicion 7.17 Sea k un cuerpo y p(x) k[x]. Sea K una extension de k.
Se dice que p(x) se escinde en K[x] si existen elementos a0 , a1 , . . . , an K (no
necesariamente distintos) tales que p(x) = a0 (x a1 ) (x an ). Notemos que
a0 es necesariamente el coeficiente director de p.
Se dice que K es un cuerpo de escision sobre k del polinomio p(x) si k K,
el polinomio p(x) se escinde en K[x] y K = k(a1 , . . . , an ), donde a1 , . . . , an son
las races en K de p(x).
Teorema 7.18 Si k es un cuerpo y p(x) k[x] es un polinomio no nulo, en-
tonces existe una extension K/k tal que K es un cuerpo de escision de p sobre
k, y si K cumple lo mismo, entonces K y K son k-isomorfos.
Demostracion: Vamos a probar una version de la unicidad un poco mas
general: si f : k k es un isomorfismo de cuerpos (que se extiende a un
isomorfismo f : k[x] k [x]), p = f (p) y K es un cuerpo de escision de p (x)
sobre k , entonces existe un isomorfismo g : K K que extiende a f . La
unicidad del enunciado se obtiene tomando como f la identidad en k.
246 Captulo 7. Extensiones de cuerpos

Razonamos por induccion sobre el grado de p(x). Si tiene grado 0 entonces el


unico cuerpo de escision es k y se cumple trivialmente el teorema. Supongamos
que es cierto para polinomios de grado n y que p(x) tiene grado n + 1. Por
el teorema 3.49 existe una extension de k donde p(x) tiene una raz a. Sea
k1 = k(a) y sea p(x) = (x a)p1 (x), con p1 (x) k1 [x]. Por hipotesis de
induccion p1 tiene un cuerpo de escision K sobre k1 .
Esto significa que p1 (x) = a0 (x a1 ) (x an ), con los ai K y ademas
K = k1 (a1 , . . . , an ), pero entonces tambien p(x) = a0 (x a)(x a1 ) (x an )
y K = k(a, a1 , . . . , an ), luego K es un cuerpo de escision de p sobre k.
Supongamos ahora que tenemos un isomorfismo f : k k , que p = f (p)
y que K es un cuerpo de escision de p sobre k . Sea a una raz de p en K
y sea k1 = k (a ). El teorema 7.13 nos da que f se extiende a un isomorfismo
f1 : k1 k1 tal que f (a) = a , que a su vez se extiende a un isomorfismo
k1 [x] k1 [x]. Sea p1 = f (p1 ), de modo que p (x) = (x a )p1 (x). Es claro
entonces que K es un cuerpo de escision sobre k1 de p1 (x), luego por hipotesis
de induccion f1 se extiende a un isomorfismo g : K K , que es tambien una
extension de f .
As, en el ejemplo final de la seccion anterior hemos construido el cuerpo de
escision sobre Q del polinomio x3 2, que es una extension de grado 6 sobre Q.
Ejercicio: Probar que el cuerpo de escision de un polinomio de grado n sobre un
cuerpo k tiene grado sobre k menor o igual que n!

Vemos as que si un polinomio p(x) k[x] tiene en un cuerpo un numero


de races menor que su grado (contando cada raz a tantas veces como el factor
lineal x a divida a p(x)) podemos pasar a una extension K donde tenga
exactamente tantas races como indica su grado, y entonces podemos decir que
p(x) tiene todas sus races en K, en el sentido de que no pueden aparecer
mas races en ninguna extension de K, ya que el numero maximo de races es el
grado del polinomio. En este sentido, podemos decir que el cuerpo de escision
de un polinomio es el cuerpo donde este tiene todas sus races. Ahora vamos
a probar que los cuerpos de escision garantizan la presencia de todas las races
de muchos mas polinomios. Para ello introducimos el concepto siguiente:

Definicion 7.19 Una extension de cuerpos K/k es normal si cuando un poli-


nomio irreducible p(x) k[x] tiene una raz en K, entonces se escinde en K[x].

Vamos a probar que el cuerpo de escision de un polinomio p(x) es siempre


una extension normal, con lo cual no solo contiene a todas las races de p(x),
sino tambien las de todos los polinomios con alguna raz en la extension, en
particular las de todos los polinomios mnimos de sus elementos. Nos apoyamos
en el teorema siguiente:

Teorema 7.20 Sea k F K L una cadena de extensiones algebraicas


tal que K sea el cuerpo de escision de un polinomio de k[x]. Sea : F L
un k-monomorfismo. Entonces [F ] K y se extiende a un k-automorfismo
de K.
7.2. Extensiones normales 247

Demostracion: Sea p(x) k[x] tal que p(x) = a0 (x a1 ) (x an ) y


K = k[a1 , . . . , an ]. Sea F = [F ] L y sea K = F (a1 , . . . , an ). Entonces K
es un cuerpo de escision de p(x) sobre F y K es un cuerpo de escision de p(x)
sobre F . En la prueba del teorema 7.18 hemos visto que se extiende a un
isomorfismo : K K .
Tomemos un F . Entonces = h(a1 , . . . , an ), para cierto polinomio
h(x1 , . . . , xn ) k[x1 , . . . , xn ], y resulta que
() = (h(a1 , . . . , an )) = h((a1 ), . . . , (an )),
pero enva races de p(x) en races de p(x), luego los elementos (a1 ), . . . , (an )
son a1 , . . . , an , tal vez en otro orden, y as () k(a1 , . . . , an ) = K. Con esto
hemos probado que F = [F ] K, pero entonces
K = k(a1 , . . . , an ) K = F (a1 , . . . , an ) K,
luego K = K, luego G(K/k) es una extension de .

Teorema 7.21 Una extension finita K/k es normal si y solo si K es el cuerpo


de escision de un polinomio de k[x].
Demostracion: Supongamos que K es el cuerpo de escision sobre k de
un polinomio y sea p(x) k[x] un polinomio cualquiera con una raz a K.
Tenemos que probar que p(x) se escinde en K[x].
Sea L un cuerpo de escision de p(x) sobre K, de modo que L = K(a1 , . . . , an )
y p(x) = a0 (x a1 ) (x an ). Como a y ai son races de p(x) en L, existe
un k-monomorfismo : k(a) k(ai ), y por el teorema anterior k(ai ) K, es
decir, ai K para todo i, luego a1 , . . . , an K, luego p(x) se escinde en K[x].
Recprocamente, si K/k es normal, como es finita, existen a1 , . . . , an K
tales que K = k[a1 , . . . , an ]. Sea pi = pol mn(ai , k) y sea p = p1 pn . Como
K/k es normal, cada pi se escinde en K[x], luego lo mismo le sucede a p, y es
claro que al adjuntar a k todas las races de p, en particular estamos adjuntando
los ai , luego obtenemos K. Esto prueba que K es un cuerpo de escision de p(x)
sobre k.
Ejercicio: Probar que toda extension de grado 2 es normal.
Por conveniencia reformulamos 7.20 en terminos de extensiones normales:
Teorema 7.22 Sea k F K L una cadena de extensiones algebraicas tal
que K/k sea finita y normal. Sea : F L un k-monomorfismo. Entonces
[F ] K y se extiende a un k-automorfismo de K.
En particular:
Teorema 7.23 Sea K/k una extension finita normal y a, b K. Entonces a y
b son kconjugados si y solo si existe un G(K/k) tal que (a) = b.
Demostracion: Si a y b son conjugados, por 7.15 existe un kisomorfismo
: k(a) k(b), que por el teorema anterior se extiende a un kautomorfismo
de K. El recproco es obvio.
248 Captulo 7. Extensiones de cuerpos

As pues, en una extension normal la conjugacion esta controlada por


el grupo de Galois. El nucleo de la llamada teora de Galois consiste en
obtener informacion de una extension normal a partir de su grupo de Galois. En
realidad veremos que la teora requiere una propiedad adicional en la extension
que estudiaremos en la seccion siguiente.
Observemos que si k K L y L/k es finita normal, entonces L/K tambien
es normal (pues L es el cuerpo de escision sobre K del mismo polinomio que
sobre k), pero en general
 la extension K/k no tiene por que ser normal, como
lo muestra Q Q 3 2 Q(, ).
Definicion 7.24 Dada una extension finita K/k, una clausura normal de K so-
bre k es una extension L/K tal que L/k es normal y no existe ninguna extension
intermedia k K L L tal que L sea normal sobre k.
Es claro que toda extension finita tiene una clausura normal, pues podemos
expresar K = k[a1 , . . . , an ] y si pi = pol mn(ai , k) y p = p1 pn , basta tomar
como L un cuerpo de escision de p sobre K. Entonces L tambien es un cuerpo
de escision de p sobre K y cualquier extension intermedia L normal sobre K
tiene que contener todas las races de p, y entonces tiene que ser L.
Ademas, dos clausuras normales de una misma extension K/k son K-iso-
morfas, pues ambas tienen que ser cuerpos de escision de p sobre K.
Nuestra intencion es definir la norma de un elemento de una extension finita
K/k como el producto de todas sus imagenes por los kmonomorfismos de K en
una clausura
normal de K/k, tal y como hemos hecho con para definir la norma
de Q( 3 2)/Q. Sin embargo, para probar que esto es viable todava necesitamos
estudiar una propiedad adicional de las extensiones algebraicas.

7.3 Extensiones separables


En esta seccion vamos a obtener toda la informacion que necesitamos sobre
los monomorfismos de una extension de cuerpos. La idea basica es que si la nor-
malidad de una extension nos da propiedades cualitativas importantes acerca
de sus automorfismos (que luego resultan aplicables a una extension finita cual-
quiera tomando su clausura normal), aqu vamos a introducir otra propiedad,
la separabilidad, que nos dara propiedades cuantitativas, es decir, acerca del
numero de automorfismos. La separabilidad concierne a la multiplicidad de las
races de los polinomios irreducibles.
En general, si p(x) k[x] es un polinomio no constante y K es una extension
de k tal que p(x) se escinde en K[x], tenemos que
p(x) = a0 (x a1 ) (x an ),
y ahora tenemos que analizar la posibilidad de que algunas races aparezcan
repetidas en esta descomposicion. Agrupando las repeticiones podemos escribir
p(x) = a0 (x a1 )r1 (x am )rm ,
donde r1 + + rm = n, y los ai son distintos dos a dos.
7.3. Extensiones separables 249

Los exponentes ri estan unvocamente determinados por p y K, pues son


los exponentes de la descomposicion de p en factores primos en K[x], que es
un DFU. Diremos que ri es el orden de multiplicidad de la raz ai en p(x).
Si un elemento a K no es raz de p(x), diremos tambien que su orden de
multiplicidad en p(x) es 0.
Una raz se dice simple, doble, triple, etc. segun si su orden de multiplicidad
es 1, 2, 3, etc.
Observemos que si p(x) tiene una raz a en un cuerpo K, podemos factorizar
p(x) = (x a)n g(x), con g(x) K[x] tal que g(a) 6= 0, y entonces n es el orden
de multiplicidad de a en p(x) aunque p(x) no se escinda en K[x]. La razon es
que si pasamos a un cuerpo de escision L de g(x) sobre K, ninguna de las races
de g(x) en L sera a, puesto que g(a) 6= 0, por lo que p se escindira en L[x] y la
multiplicidad de a en la factorizacion seguira siendo n.
Otra observacion menor es que podemos definir el orden de multiplicidad
para polinomios con coeficientes en un dominio ntegro, pues todo dominio
ntegro esta contenido en su cuerpo de fracciones.
Para estudiar la multiplicidad de las races de polinomios es indispensable el
concepto de derivada formal:
n
P
Definicion 7.25 Sea D un dominio ntegro y f (x) = ai xi D[x], llamare-
mos derivada formal del polinomio f (x) al polinomio i=0

n
P
f (x) = iai xi1 D[x].
i=1

Por ejemplo, si f (x) = 5x3 2x2 + 4 Q[x], entonces f (x) = 15x2 4x.
Teorema 7.26 Sea D un dominio ntegro y f , g D[x].
1. Si f D entonces f = 0.
2. Si c D, entonces (cf ) = cf .
3. (f + g) = f + g .
4. (f g) = f g + f g .
5. (f /g) = (f g f g )/g 2 .
Demostracion: Las tres primeras propiedades son inmediatas. Para pro-
m
P n
P
bar la cuarta tomamos f (x) = ai xi , g(x) = bi xi , con lo que, usando las
i=0 i=0
propiedades segunda y tercera,
P  P P
(f g) = ai bj xi+j = ai bj (xi+j ) = (i + j)ai bj (xi+j1 )
ij ij ij
P i1 j
P
= iai x bj x + ai x jbj xj1
i
ij ij
X  X  X  X 
= iai xi1 bj xj + ai xi jbj xj1 = f g + f g .
i j i j
250 Captulo 7. Extensiones de cuerpos

En la quinta propiedad se entiende que g divide a f , y basta calcular


(g(f /g)) con la regla cuarta y despejar la derivada del cociente.
La relacion entre las derivadas y la multiplicidad de las races viene dada
por el teorema siguiente:

Teorema 7.27 Sean D E dominios ntegros, f D[x] y c E tal que


f (c) = 0. Entonces c es una raz simple de f si y solo si f (c) 6= 0.

Demostracion: Sea f (x) = (x c)n g(x), donde g(c) 6= 0 (y n 1 es el


orden de multiplicidad de c). Entonces f (x) = n(x c)n1 g(x) + (x c)n g (x).
Si c es raz simple de f , entonces n = 1, luego f (x) = g(x) + (x c)g (x), y
por lo tanto f (c) = g(c) + 0 = g(c) 6= 0. Si c es raz multiple, entonces n > 1,
luego
f (c) = n(c c)n1 g(c) + (c c)n g (c) = 0.
Este resultado nos lleva a investigar los casos en que la derivada de un
polinomio puede anularse. Un caso trivial es el de los polinomios constantes.

Teorema 7.28 Sea D un dominio ntegro y f (x) D[x] un polinomio no cons-


tante.
1. Si car D = 0 entonces f (x) 6= 0.
2. Si car D = p, entonces f (x) = 0 si y solo si existe g(x) D[x] tal que
f (x) = g(xp ).
n
P
Demostracion: 1) Sea f (x) = ai xi , con n > 0 y an 6= 0. Entonces
i=0
n
P
f (x) = iai xi1 , donde el coeficiente director es nan 6= 0, luego f (x) 6= 0.
i=1

2) Si f (x) = 0, entonces (con la misma notacion del apartado anterior) cada


coeficiente iai = 0, para i = 1, . . . , n. Si ai 6= 0 es necesario que i = 0 (en D),
es decir, que p | i. En otras palabras, que los monomios de f (x) con coeficientes
no nulos tienen exponente multiplo de p, es decir,
r
P r
P
f (x) = ai xpi = ai (xp )i = g(xp ),
i=0 i=0

r
P
donde g(x) = ai xi . El recproco es evidente.
i=0

Ahora ya sabemos lo necesario para estudiar la separabilidad.

Definicion 7.29 Sea K/k una extension y a K un elemento algebraico so-


bre k. Diremos que a es separable sobre k si a es raz simple de pol mn(a, k).

Notar que si p(x) = pol mn(a, k) entonces a es separable si y solo si p (a) 6= 0


(por 7.27), si y solo si p (x) 6= 0, pues si p (a) = 0 entonces p(x) | p (x) y,
teniendo en cuenta los grados, p (x) = 0. Esta ultima condicion depende solo
7.3. Extensiones separables 251

de p, luego si a es separable todos sus conjugados lo son tambien, y pol mn(a, k)


tiene todas sus races simples.
Una extension K/k es separable si todos los elementos de K son separables
sobre k (en particular una extension separable es algebraica). Un cuerpo k es
perfecto si todas sus extensiones algebraicas son separables.
El interes de esta definicion reside en que practicamente todos los cuerpos
que nos van a interesar son perfectos, luego en la practica todas las extensiones
que manejaremos seran separables.
Teorema 7.30 Se cumple:
1. Todo cuerpo de caracterstica 0 es perfecto.
2. Un cuerpo k de caracterstica p es perfecto si y solo si
k = k p = {ap | a k}.

3. Todo cuerpo finito es perfecto.


Demostracion: 1) Si car k = 0 y K/k es una extension algebraica, sea
a K. Entonces el polinomio p(x) = pol mn(a, k) no es constante y p (x) 6= 0,
luego a es separable.
2) Si car k = p y k = k p , sea K/k una extension algebraica y a K, sea
p(x) = pol mn(a, k). Si a no fuera separable, entonces p (x) = 0, luego por 7.28
p(x) = f (xp ) para cierto polinomio f (x) k[x].
Pn
Sea f (x) = ai xi . Como a0 , . . . , ar k = k p , existen b0 , . . . , br k de
i=0
manera que ai = bpi . Por lo tanto
n
P n
P p n
P p
p(x) = bpi xpi = bi xi = bi xi ,
i=0 i=0 i=0
n
P
donde el polinomio bi xi k[x]. Por lo tanto p(x) no es irreducible en k[x],
i=0
contradiccion.
Ahora supongamos que k es perfecto y car k = p. Veamos que k = k p .
Sea a k. Por 3.49 existe una extension K de k donde xp a tiene una
raz b. Entonces bp a = 0, o sea, a = bp .
El polinomio xp a = xp bp = (x b)p , y por otro lado tenemos que
pol mn(b, k) | (x b)p , luego ha de ser pol mn(b, k) = (x b)n , para cierto
n p, pero como k es perfecto b es raz simple de pol mn(b, k), es decir, n = 1,
luego x b = pol mn(b, k) k[x]. Por consiguiente b k y a = bp k p .
3) Si k es un cuerpo finito de caracterstica p, entonces la aplicacion
: k k p dada por (a) = ap es suprayectiva, pero tambien inyectiva,
puesto que si ap = bp , entonces ap bp = (a b)p = 0, luego a b = 0, o sea,
a = b.
Por lo tanto k p k tienen ambos el mismo cardinal, lo que obliga a que
k = kp .
252 Captulo 7. Extensiones de cuerpos

Como una primera muestra del interes de la separabilidad, vamos a ver el


efecto que tiene combinarla con la normalidad. Para ello introducimos algunos
conceptos.

Definicion 7.31 Sea K/k una extension. Definimos su cuerpo fijado como

F = a K | (a) = a para todo G(K/k) .

Es claro que efectivamente F es un cuerpo y k F K.


Una extension de Galois es una extension normal y separable. El teorema
siguiente nos da un importante criterio para determinar cuando un elemento de
una extension finita de Galois pertenece de hecho al cuerpo base:

Teorema 7.32 Una extension finita K/k es de Galois si y solo si su cuerpo


fijado es k.

Demostracion: Sea K/k una extension finita de Galois. Sea a un elemento


de su cuerpo fijado y sea p(x) su polinomio mnimo sobre k.
Por la normalidad, p(x) tiene todas sus races en K. Si b es cualquiera de
ellas, ha de existir un G(K/k) tal que (a) = b (teorema 7.23). Pero a esta
en el cuerpo fijado, luego b = a, o sea, a es la unica raz de p(x), que ha de ser,
pues, p(x) = (x a)n . Pero por otra parte a es separable sobre k, luego ha de
ser una raz simple de p(x). As pues p(x) = x a k[x] y por lo tanto a k.
Supongamos ahora que k es el cuerpo fijado de la extension. Veamos que
K/k es normal. Sea p(x) k[x] un polinomio irreducible (que podemos suponer
monico) con una raz a K. Hemos de ver que p(x) se escinde en K[x].
Sean a1 , . . . , an todas las races de p(x) en K (sin repeticiones). Sea

g(x) = (x a1 ) (x an ) K[x].
 
Para cada G(K/k) se cumple que g(x) = x (a1 ) x (an ) ,
pero es obvio que (a1 ), . . . , (an ) son los mismos a1 , . . . , an cambiados de orden,
luego en realidad g(x) = g(x). Esto significa que todos los coeficientes de g(x)
son fijados por , luego estan en el cuerpo fijado de K/k, que por hipotesis es
k, o sea, g(x) k[x].
Como p(x) es el polinomio mnimo de a y a es una de las races de g(x),
tenemos que p(x) | g(x), pero por otra parte todas las races de g(x) lo son
de p(x) y ademas son simples, luego g(x) | p(x). Como ambos son monicos
p(x) = g(x) se escinde en K[x] y ademas con races simples.
Con esto hemos probado tambien que K/k es separable, pues dado a K, si
tomamos p(x) = pol mn(a, k) hemos probado que las races de p(x) son simples.

Comenzamos ahora la labor de contar los automorfismos de una extension


finita. En realidad si la extension no es normal puede no haber mas auto-
morfismo que la identidad (como le ocurre a Q( 3 2 )/Q), luego si queremos
resultados generales no hemos de contar automorfismos sino monomorfismos.
7.3. Extensiones separables 253

Definicion 7.33 Sea K/k una extension finita. Llamaremos kmonomorfismos


de K a los kmonomorfismos de K en una clausura normal de K sobre k.

En particular, si K/k es normal entonces los kmonomorfismos de K son de


hecho los kautomorfismos de K.
Llamaremos N(K/k) al numero de kmonomorfismos de K (que no de-
pende de la eleccion de la clausura normal de K/k, pues dos cualesquiera
son K-isomorfas, luego todo k-monomorfismo en una se corresponde con un
k-monomorfismo en otra).
Por ejemplo, si k(a)/k es una extension simple de grado n sabemos que el
numero de kmonomorfismos de K es igual al numero de kconjugados de a, y si
a es separable sobre k entonces pol mn(a, k) tiene todas sus races simples, luego
a tiene exactamente n kconjugados, es decir, el numero de kmonomorfismos
de k(a) es igual al grado de la extension. En smbolos:

N(k(a)/k) = |k(a) : k|.


Vamos a generalizar este hecho a extensiones separables cualesquiera. Primero
probamos un resultado tecnico:

Teorema 7.34 Consideremos una cadena de extensiones k K L con L/k


finita normal. Entonces N(L/k) = N(L/K) N(K/k).

Demostracion: Por 7.22 tenemos que cada k-monomorfismo de K se ex-


tiende a un k-automorfismo de L. Basta probar que de hecho se extiende exac-
tamente a N(L/K) de ellos. Notemos que N(L/K) = |G(L/K)| porque la
extension L/K es normal.
Sean y dos extensiones a L de un mismo kmonomorfismo de K. Como
L/k es normal y son kautomorfismos de L, luego 1 es un kautomor-
fismo de L que de hecho fija a K, es decir, = 1 G(L/K) y = .
As pues, si es una extension cualquiera de un kmonomorfismo de K, las
restantes son de la forma con G(L/K).
Por otra parte, si = , componiendo con 1 concluimos que = ,
luego en efecto, hay tantas extensiones como elementos de G(L/K)
Sea ahora una extension finita normal L = k(a1 , . . . , an ), donde los elementos
ai son separables sobre k. Podemosaplicar el teorema anterior con K = k(a1 )
y concluir que N(L/k) = N L/k(a1 ) |k(a1 ) : k|. Ahora consideramos la cadena
k(a1 ) k(a1 , a2 ) L. Es claro que esta tambien en las hipotesis
 del teorema
anterior (a2 es separable sobre k(a1 ) porque pol mn a2 , k(a1 ) pol mn(a2 , k)).
Por lo tanto concluimos que

N(L/k) = N L/k(a1 , a2 ) |k(a1 , a2 ) : k(a1 )| |k(a1 ) : k|

= N L/k(a1 , a2 ) |k(a1 , a2 ) : k|.

Repitiendo el proceso llegamos a N(L/k) = |L : k|.


Esto es esencialmente el resultado al que queremos llegar (y, como vemos, es
una mera generalizacion del caso trivial de extensiones simples). Notemos ahora
254 Captulo 7. Extensiones de cuerpos

que si F es el cuerpo fijado de la extension L/k entonces G(L/k) = G(L/F ),


luego |L : k| = |G(L/k)| = |G(L/F )| = |L : F |, con lo que k = F y el teorema
7.32 nos permite concluir que la extension L/k es separable. De aqu se sigue
en primer lugar:

Teorema 7.35 Si K = k(S), donde S es un conjunto de elementos separables


sobre k, entonces la extension K/k es separable.

Demostracion: Supongamos primero que S es finito. Sean a1 , . . . , an los


conjugados de todos los elementos de S. Sabemos que todos ellos son separables
sobre k. Entonces L = k(a1 , . . . , an ) es la clausura normal de K/k, y en estas
condiciones hemos probado que L/k es separable, luego K/k tambien. El caso
infinito se reduce trivialmente al caso finito.
Notemos que acabamos de probar que la clausura normal de una extension
finita separable es una extension finita de Galois. Finalmente estamos en con-
diciones de enunciar el teorema principal de esta seccion:

Teorema 7.36 Si K/k es una extension finita separable de grado n entonces


el numero de kmonomorfismos de K es exactamente igual a n. En particular
si K/k es finita de Galois |G(K/k)| = |K : k|.

Demostracion: Lo tenemos probado para extensiones normales. Si K/k


no es normal tomamos la clausura normal L/k. Entonces las extensiones L/k
y L/K son normales, luego el teorema 7.34 y el caso normal nos dan |L : k| =
N(K/k) |L : K|, luego tambien N(K/k) = |K : k|.
El teorema siguiente termina de perfilar el comportamiento de las extensiones
separables, totalmente analogo al de las algebraicas en general:

Teorema 7.37 Sea k K L una cadena de extensiones. Entonces L/k es


separable si y solo si L/K y K/k lo son.

Demostracion: Una implicacion es sencilla. La otra se reduce facilmente


al caso en que las extensiones son finitas (ver por ejemplo 7.10).
Supongamos, pues, que L/K y K/k son finitas separables. Si a L y b es un
kconjugado de a, entonces existe un kmonomorfismo de K tal que (a) = b.
Si p(x) = pol mn(a, K) entonces pol mn(b, K) = p(x), y es claro que si
a es una raz simple de p(x) entonces b es raz simple de p(x), es decir, los
kconjugados de elementos de L son separables sobre K. De aqu se sigue que
la clausura normal de L sobre k es separable sobre K, luego podemos suponer
que L/k es normal.
La clausura normal de K/k esta contenida en L, es separable y obviamente L
es separable sobre ella (por la implicacion opuesta a la que estamos probando).
Por lo tanto podemos suponer tambien que K/k es normal.
Veamos que el cuerpo fijado de L/k es k. Si a esta en dicho cuerpo fijado, en
particular a es fijado por G(L/K), luego a K (por 7.32). Todo automorfismo
de K/k se extiende a un automorfismo de L/k que fija a a, luego a esta en el
cuerpo fijado de K/k, que es k.
7.3. Extensiones separables 255

Ejercicio: Probar que si K/k es una extension de cuerpos, el conjunto Ks de los


elementos de K separables sobre k es un subcuerpo de K.
Terminamos esta seccion con un teorema no trivial segun el cual en muchos
casos los esfuerzos por generalizar el caso de extensiones simples a extensiones
finitas arbitrarias es innecesario:

Teorema 7.38 (Teorema del elemento primitivo) Toda extension finita


separable es simple.

Demostracion: Sea K/k una extension finita separable. Distingamos dos


casos segun que el cuerpo base k sea finito o infinito. Si k es finito y K es una
extension finita de k, entonces K tambien es un cuerpo finito (cada elemento de
K esta determinado por sus coordenadas en una k-base, y solo hay un numero
finito de coordenadas posibles). Por el teorema 6.13 el grupo multiplicativo K
es cclico, es decir, existe un elemento a K tal que sus potencias recorren
todos los elementos de K salvo el cero. Obviamente, K = k(a).
Supongamos ahora que k es infinito. Toda extension finita es finitamente
generada, es decir, es de la forma k(a1 , . . . , an )/k.
Razonando por induccion es suficiente probar que si a, b son elementos se-
parables sobre un cuerpo k entonces existe un c k(a, b) tal que k(a, b) = k(c).
Sea A el conjunto de todos los pares (a , b ), donde a es un kconjugado de
a y b es un kconjugado de b. Es claro que si (a1 , b1 ), (a2 , b2 ) son dos pares
distintos en A, existe a lo sumo un u k tal que a1 + ub1 = a2 + ub2 . As pues,
como A es finito y k es infinito existe un elemento v k distinto de cero y para
el que a1 + vb1 6= a2 + vb2 , para todo par de pares distintos (a1 , b1 ), (a2 , b2 ) A.
Sea c = a + vb. Entonces,
 si , son kmonomorfismos distintos de k(a, b)
los pares (a), (b) y (a), (b) son pares distintos de A, luego

(c) = (a) + v(b) 6= (a) + v (b) = (c).

Esto significa que c tiene tantos conjugados como kmonomorfismos tiene


la extension k(a, b)/k. Por los resultados que hemos probado, el grado de
pol mn(c, k) coincide con |k(a, b) : k| o tambien |k(c) : k| = |k(a, b) : k|. Puesto
que k(c) k(a, b), de hecho k(a, b) = k(c).
As pues, para reducir dos generadores a, b de una extension separable a uno
solo, hemos de tomar un elemento de la forma c = a+vb, con v en el cuerpo base.
La finalidad de v es simplemente romper la simetra de la expresion para que el
numero de automorfismos sea el maximo posible. Unos ejemplos aclararan esta
idea.

Ejemplo Consideremos el cuerpo K = Q 2, 3 . La extension K/Q es
normal, pues K es el cuerpo de escision sobre Q del polinomio (x2 2)(x2 3).
Trivialmente es separable, pues los cuerpos son de caracterstica 0. As pues,
K/Q es una extension finita de Galois. Veamos que tiene grado 4. Para ello
consideramos la cadena
 
Q Q 2 Q 2, 3 .
256 Captulo 7. Extensiones de cuerpos

Es claro que el grado del primer tramo es 2, luego basta probar


queelsegundo
tramo tambien tiene grado 2. A su vez esto equivale a que 3
/ Q 2 . Ahora
bien, es facil ver que la ecuacion
2
a + b 2 = a2 + 2b2 + 2ab 2 = 3

no tiene solucion para


a, b Q.
Los conjugados
de
2 son 2 y los conjugados de 3 son 3. Si llama-
mos S = { 2, 3}, tenemos que cada elemento de G(K/Q) esta determi-
nado por su restriccion a S, es decir, que la aplicacion G(K/Q) S dada
por 7 |S es un monomorfismo
de grupos. Como,
ademas, la imagen de 2
solo puede ser 2 y la de 3 solo puede ser 3, vemos que solo hay cuatro
permutaciones posibles en la imagen, que expresadas como productos de ciclos
disjuntos son:

1, ( 2, 2), ( 3, 3), ( 2, 2)( 3, 3).

Como la imagen tiene que tener cuatro permutaciones, tienen que ser estas. Es
claro entonces que G(K/Q) = C2 C2 .

Una Qbase de K es 1, 2, 3, 2 3 = 6. Un elemento primitivo es
2 + 3, pues al aplicar los cuatro automorfismos obtenemos los conjugados

2 + 3, 2 + 3, 2 3, 2 3.

Los cuatro son, efectivamente,distintos


porque sus coordenadas en la base dada
son distintas. Por lo tanto Q 2 + 3 tiene grado 4 sobre Q y esta contenido
en K, luego es K.

Ejercicio: Calcular pol mn( 2 + 3, Q).

Ejemplo Consideremos de nuevo K = Q(, ), donde y son dos de las


races del polinomio x3 2. Segun hemos visto en la seccion anterior, la extension
K/Q es de Galois y tiene grado 6. La imagen de y por cada uno de los seis
automorfismos de K ha de ser , o la tercera raz . Si llamamos S = {, , },
la restriccion 7 |S es un monomorfismo G(K/Q) 3 , y como ambos
grupos tienen orden 6, tiene que ser un isomorfismo. As pues G(K/Q) = 3 y
los seis automorfismos permutan , , de todas las formas posibles.
En este caso el elemento + no es un elemento primitivo de K/Q, pues al
aplicarle los seis automorfismos obtenemos solo tres conjugados: + , + ,
+ . Por lo tanto pol mn( + , Q) tiene grado 3 y Q( + ) es un cuerpo
intermedio de grado 3 sobre Q. Un elemento primitivo es, por ejemplo .
En efecto, sus conjugados son

, = + 2,
= 2 + , = 2 ,
, = 2,
7.4. Normas y trazas 257

y son todos distintos por la independencia lineal de y . Puede comprobarse


que pol mn( ) = x6 + 108. Notemos que la presencia del 1 se traduce
en una perdida de la simetra de la expresion + , que hace que las las seis
imagenes por los automorfismos sean distintas. La prueba del teorema del ele-
mento primitivo justifica que siempre podemos conseguir el maximo numero
posible de conjugados mediante esta tecnica.

7.4 Normas y trazas


Finalmente podemos definir en general la norma de una extension de cuerpos.
Notemos primero que el teorema 7.32 vale en parte para extensiones separables
(no necesariamente normales): Si K/k es separable, un elemento u K esta
en k si y solo si (u) = u para todo k-monomorfismo de K. En efecto, si
consideramos la clausura normal L/k, tenemos que u k si y solo si (u) = u
para todo G(L/k), pero las restricciones a K de los k-automorfismos de L
son los k-monomorfismos de K.

Definicion 7.39 Sea K/k una extension separable de grado n. Sean 1 , . . . , n


los k-monomorfismos de K (en la clausura normal L de K/k). Definimos la
norma y la traza de un K como

N() = 1 () n () L, Tr() = 1 () + + n () L.

Si G(L/k), entonces i es un k-monomorfismo de K en L, luego


i = j para algun j. Mas aun, si i 6= j, entonces i 6= j , pues actuan
de forma distinta sobre un elemento primitivo a de K.
Por lo tanto, la composicion con  permuta los monomorfismos y, en con-
secuencia, N() = N(), Tr() = Tr() para todo y todo , es decir,
N(), Tr() k.
Tenemos as dos aplicaciones N, Tr : K k. Es obvio que

N(uv) = N(u) N(v), Tr(u + v) = Tr(u) + Tr(v).

De hecho la traza es una aplicacion lineal de k-espacios vectoriales. Una pro-


piedad elemental es que si k, entonces
|K:k|
N() = , Tr() = |K : k| .

Teorema 7.40 (Transitividad de la norma) Sea k K L una cadena


de extensiones finitas separables. Entonces para todo L se cumple
 
L K L
Nk () = Nk NK () , TrL K L
k () = Trk TrK ()

Demostracion: Sean 1 , . . . , n los K-monomorfismos de L. As


L
NK () = 1 () n ().
258 Captulo 7. Extensiones de cuerpos

Sean 1 , . . . , m los k-monomorfismos de K. Escojamos para cada uno de


ellos i una extension a un k-automorfismo
 de la clausura normal de L sobre  k,
digamos i . Entonces i NL K () = i (1 ()) i (n ()), y N K
k N L
K () es
el producto de estos terminos para i = 1, . . . , m.
Los monomorfismos j i , definidos sobre L, son distintos dos a dos, pues si
j i = u v , restringiendo a K tenemos i = v , luego i = v, y componiendo
con el automorfismo inverso queda j = u , luego j = u.
Como en total son mn monomorfismos,
 de hecho son todos los k-monomor-
fismos de L, luego NK k N L
K () , que es el producto de todos los i (j ()), es
igual a NLk ().
El mismo razonamiento vale para las trazas.


Ejemplo Vamos a calcular la norma de la extension Q 2, 3 /Q.

Un elemento arbitrario de Q 2, 3 es de la forma

= a + b 2 + c 3 + d 6, con a, b, c, d Q.
 
Su norma en la extension Q 2, 3 /Q 2 es
  
a+b 2+c 3+d 6 a+b 2c 3d 6
 2  2
= a+b 2 c 3+d 6

= a2 + 2b2 + 2ab 2 3c2 6d2 6cd 2,

y la norma de este numero en la extension Q 2 /Q es
 
N() = a2 + 2b2 3c2 6d2 + (2ab 6cd) 2
 
a2 + 2b2 3c2 6d2 (2ab 6cd) 2
2 2
= a2 + 2b2 3c2 6d2 2 (2ab 6cd) .


Ejercicio: Calcular la traza de las extensiones Q( 2, 3 )/Q y Q( 3 2 )/Q.

Ejemplo Consideramos ahora la extension ciclotomica p-esima Q()/Q para


un primo impar p. Su grado es p 1, luego tiene p 1 automorfismos, deter-
minados por la imagen que toman sobre el elemento primitivo , que ha de ser
uno de sus conjugados i para i = 1, . . . , p 1. Evaluando en 0 el polinomio

xp1 + + x + 1 = (x )(x 2 ) (x p1 ),

obtenemos N() = 1. Como la norma conserva productos se cumple N( i ) = 1


para todo i. Evaluando en 1 el mismo polinomio queda
2 p1
N(1 ) = (1 )(1 ) (1 ) = 1p1 + + 1 + 1 = p.
7.5. La teora de Galois 259

Si p i, entonces Tr( i ) es la suma de los p 1 conjugados de i , es decir,

Tr( i ) = + 2 + + p1 = 1.

Si a Q entonces Tr(a) = a + a + + a = (p 1)a. En resumen,



1 si p i
Tr( i ) =
p1 si p | i

Una ventaja de la traza frente a la norma es que es mucho mas facil de


p1
P
calcular. En efecto, si ai i es un elemento cualquiera de Q(), entonces
i=0

p1  p1 p1
P P P
Tr ai i = ai Tr( i ) = a0 Tr(1) ai
i=0 i=0 i=1
p1
P p1
P
= (p 1)a0 ai = pa0 ai .
i=1 i=0

7.5 La teora de Galois


Presentamos ahora el teorema fundamental que permite obtener consecuen-
cias relevantes sobre extensiones de Galois a traves del estudio de sus grupos
de automorfismos. Basicamente afirma que los cuerpos intermedios de una ex-
tension finita de Galois se corresponden de forma natural con los subgrupos del
grupo de Galois. Mas concretamente, la correspondencia de Galois asigna a
cada subgrupo el cuerpo que definimos a continuacion:

Definicion 7.41 Sea K/k una extension de cuerpos y H un subgrupo del grupo
de Galois G(K/k). Llamaremos cuerpo fijado por H al cuerpo

F (H) = a K | (a) = a para todo H .

Es muy facil probar que ciertamente F (H) es un cuerpo y k F (H) K.

El teorema 7.32 afirma que una


 extension algebraica K de un cuerpo k es
de Galois si y solo si F G(K/k) = k. El teorema siguiente contiene la parte
tecnica del teorema de Galois y resulta util por s mismo en algunas ocasiones:

Teorema 7.42 (Teorema de independencia de Dedekind) Consideremos


un cuerpo K y sean 1 , . . . , n automorfismos distintos de K. Si c1 , . . . , cn
n
P
son elementos de K tales que ci i (a) = 0 para todo a K, entonces
i=1
c1 = = cn = 0.
260 Captulo 7. Extensiones de cuerpos

Demostracion: Por induccion sobre n. Si n = 1, entonces c1 1 (a) = 0


para todo a K, luego en particular c1 1 (1) = 0, es decir, c1 = 0. Supongamos
que n > 1 y que
n
P
ci i (a) = 0 para todo a K. (7.2)
i=1
Si algun ci es nulo entonces todos lo son por hipotesis de induccion. Supon-
gamos que son todos no nulos. Como 1 6= n , existe un elemento b K tal
que 1 (b) 6= n (b). Obviamente b 6= 0. Por hipotesis,
n
P
ci i (ba) = 0 para todo a K.
i=1

Multiplicando por n (b1 ) y restando de (7.2) queda:


n
P 
ci 1 n (b1 )i (b) i (a) = 0 para todo a K.
i=1

Como el ultimo sumando es nulo,  podemos aplicar la hipotesis de induccion


y concluir que ci 1 n (b1 )i (b) = 0 para i = 1, . . . , n 1. En particular
1 n (b1 )1 (b) = 0 y 1 (b) = n (b), contradiccion.
Con la ayuda de este resultado podemos probar el teorema siguiente, que
esencialmente contiene la biyectividad de la correspondencia de Galois:

Teorema 7.43 Sea K/k una extension y H un subgrupo finito de G(K/k).


Entonces
|K : F (H)| = |H|.

Demostracion: Supongamos que |K : F (H)| = r < |H| = n. Sea


b1 , . . . , br una base de K como F (H)-espacio vectorial. Sea H = {1 , . . . , n }.
La aplicacion f : K n K r dada por
n
P n
P 
f (x1 , . . . , xn ) = xi i (b1 ), . . . , xi i (br )
i=1 i=1

es claramente lineal, y como n = dim N(f )+dim Im f dim N(f )+r, concluimos
que dim N(f ) > 0, luego existe una n-tupla (c1 , . . . , cn ) de elementos de K no
n
P
todos nulos de modo que ci i (bj ) = 0 para j = 1, . . . , r.
i=1

Si a K, entonces a = a1 b1 + + ar br para ciertos a1 , . . . , ar F (H).


Como son fijados por los automorfismos de H se cumple que
n
P n
P
ci i (aj bj ) = aj ci i (bj ) = 0,
i=1 i=1
n
P
y sumando para todos los j obtenemos que ci i (a) = 0 para todo a K,
pero esto contradice al teorema anterior. i=1

Supongamos ahora que |K : F (H)| > |H| = n. Sean b1 , . . . , bn+1 elementos


de K linealmente independientes sobre F (H).
7.5. La teora de Galois 261

Como antes podemos concluir que existen elementos (a1 , . . . , an+1 ) de K no


todos nulos de modo que
n+1
P
ai j (bi ) = 0 para j = 1, . . . , n. (7.3)
i=1

Tomando el valor de j correspondiente al automorfismo identidad, se cumple


n+1
P
que ai bi = 0, lo que significa que alguno de los ai
/ F (H), pues los bi son
i=1
independientes.
Reordenando podemos suponer que ai 6= 0 para i = 1, . . . , r y que los restan-
tes son nulos. Tambien podemos escoger los ai con r mnimo. Ha de ser r > 1,
porque en otro caso tendramos b1 a1 = 0 y entonces a1 = 0, contradiccion.
Podemos multiplicar todos los ai por a1 r y as suponer que ar = 1. Como
algun ai
/ F (H) y este no es ciertamente ar , podemos tomar a1 / F (H).
Entonces existe un ndice h tal que h (a1 ) 6= a1 .
n+1
P 
Aplicando h a (7.3) tenemos que se cumple h (ai )h j (bi ) = 0 para
i=1
todo j = 1, . . . , n. Como j h recorre todo H cuando j = 1, . . . , n, podemos
P
escribir n+1
i=1 h (ai )j (bi ) = 0 y restando de (7.3) llegamos a que

n+1
X 
ai h (ai ) j (bi ) = 0,
i=1

para j = 1, . . . , n. Pero ahora los coeficientes son nulos para i = r, . . . , n + 1,


aunque no lo es el primero. O sea, hemos encontrado unos valores que cumplen
lo mismo que (a1 , . . . , an+1 ) pero con mas ceros, en contra de la minimalidad
de r.
Con esto llegamos al teorema de Galois. En el apartado 7) usamos la no-
tacion KL para el cuerpo K(L) = L(K), o sea, el mnimo cuerpo que contiene
a K y L (donde K y L son dos cuerpos contenidos en un cuerpo comun).

Teorema 7.44 (Teorema Fundamental de la Teora de Galois) Sea K/k


una extension finita de Galois.

1. Existe una biyeccion entre los cuerpos intermedios k L K y los


subgrupos de G(K/k). Esta biyeccion asigna a cada cuerpo L el grupo
G(K/L) y su inversa asigna a cada grupo H el cuerpo F (H).

2. Si k L L K, entonces G(K/L ) G(K/L) G(K/k).

3. Si H H G(K/k), entonces k F (H ) F (H) K.

4. Si k L K entonces K/L es una extension normal (luego de Galois).

5. Si k L K, la extension L/k es normal (luego de Galois) si y solo si


G(K/L) es un subgrupo normal de G(K/k).
262 Captulo 7. Extensiones de cuerpos

6. Si k L K y L/k es de Galois, la aplicacion r : G(K/k) G(L/k)


dada por r() = |L es un epimorfismo de grupos cuyo nucleo es G(K/L),
luego G(L/k) = G(K/k)/G(K/L)
7. Si H1 , H2 G(K/k) entonces

F hH1 , H2 i = F (H1 ) F (H2 ) y F (H1 H2 ) = F (H1 )F (H2 ).

Demostracion: 4) Si K/k es normal, K es el cuerpo de escision sobre k de


un cierto polinomio p(x), pero, obviamente, K tambien es el cuerpo de escision
sobre L de p(x), luego K/L es normal.
1) La aplicacion que a cada L le asigna G(K/L)  es inyectiva,
 pues si te-
nemos G(K/L) = G(K/L ), entonces F G(K/L) = F G(K/L ) , y como las
extensiones son de Galois, L = L .
Si H G(K/k) y L = F (H), es obvio
que H G(K/L) y, por el teorema
anterior, |H| = |K : L| = G(K/L) porque la extension es de Galois, luego
H = G(K/L). Por lo tanto L es una antiimagen de H, luego la aplicacion es
biyectiva y su inversa es la que indica el enunciado.
2) y 3) son inmediatos.
5) Supongamos que L/k es normal. Sea G(K/L) y G(K/k). Para
cada a L se cumple que 1 (a)  L (por el teorema 7.22). Consecuentemente,
  
1 (a) = 1 (a) y (a) = 1 (a) = 1 (a) = a, luego tenemos
que G(K/L) y en consecuencia G(K/L) E G(K/k).
Si G(K/L) E G(K/k), tomemos un polinomio irreducible p(x) k[x] con
una raz a en L. Como K/k es normal p(x) se escinde en K. Basta probar que
todas las races de p(x) en K estan en L, y as p(x) se escindira en L. Sea b otra
raz de p(x) en K. Por el teorema 7.23 existe un automorfismo
 G(K/k) tal
que (b) = a. Hemos de probar que b F G(K/L) = L. 
Sea G(K/L). Entonces G(K/L), luego ( 1 (a) = a, o sea,
(b) = a o, lo que es lo mismo, (b) = b.
6) La aplicacion r esta bien definida porque si G(K/k), entonces el
teorema 7.22 garantiza que [L] = L, luego r() G(L/k). La aplicacion r es
suprayectiva tambien por el teorema 7.22, y obviamente es un epimorfismo de
grupos. El resto es inmediato.
7) Es una consecuencia inmediata de 1), 2) y 3). El grupo hH1 , H2 i es el
menor subgrupo de G(K/k) que contiene a H1 y a H2 , luego su cuerpo fijado
ha de ser el mayor cuerpo intermedio contenido en F (H1 ) y en F (H2 ), o sea,
ha de ser F (H1 ) F (H2 ). Analogamente se tiene la otra igualdad.

Ejemplo El estudio de los grupos de Galois nos permite conocer todos los
cuerpos intermedios de una extension finita de Galois. Como ilustracion vamos
a aplicarlo al cuerpo de escision sobre Q del polinomio x3 2. Sabemos que es
de la forma K = Q(, ), donde , y son las races del polinomio, as como
7.5. La teora de Galois 263

que el grado de la extension es 6, que el grupo de Galois G es isomorfo a 3 y


que por lo tanto permuta las tres races de todos los modos posibles.
Como 3 tiene cuatro subgrupos propios, el teorema de Galois nos dice que
la extension Q(, )/Q tiene exactamente cuatro cuerpos intermedios. Vamos
a calcularlos.
Los subgrupos de 3 son los tres subgrupos de orden 2 generados por las
trasposiciones (, ), (, ) y (, ) y el subgrupo de orden 3 generado por el
ciclo (, , ).
 
El cuerpo F h(, )i cumple que Q(, ) : F h(, )i = h(, )i = 2,
 

luego F h(, )i : Q = 3 = Q() : Q . Como obviamente F h(, )i ,

tenemos la inclusion
 Q() F h(, )i y, al coincidir los grados, ha de ser
Q() = F h(, )i .
 
Igualmente, Q() = F h(, )i y Q() = F h(, )i .

Nos falta calcular F h(, , )i , que ha de tener grado 2 sobre Q. Para ello
observamos que como 6= , se cumple / 6= 1, pero (/)3 = 2/2 = 1, luego
= / es una raz del polinomio x3 1 distinta de 1. Por consiguiente Q(),
el cuerpo ciclotomico de orden
 3, esta contenido
en K y tiene grado 2 sobre Q,
luego ha de ser F h(, , )i = Q() = Q 3 .

En la seccion siguiente mostraremos un primer ejemplo de como la teora de


grupos permite obtener resultados no triviales sobre cuerpos, pero antes veamos
un par de resultados sencillos pero muy utiles con los que acabaremos de perfilar
la teora de Galois:

Teorema 7.45 Sean K/k y L/k extensiones finitas de un cuerpo k (contenidas


en un mismo cuerpo) y ademas supongamos que K/k es de Galois. Entonces la
extension KL/L es tambien de Galois y G(KL/L)
= G(K/K L).

Demostracion: La extension K/k es normal, luego K es el cuerpo de


escision sobre k de un cierto polinomio f (x) k[x]. Sean a1 , . . . , an las races de
f (x) en K. Entonces K = k(a1 , . . . , an ), luego es obvio que KL = L(a1 , . . . , an ).
Ademas a1 , . . . , an son las races de f (x) L[x] en KL, luego KL es el cuerpo
de escision sobre L de f (x), lo que implica que la extension KL/L es normal.
Como los ai son separables sobre k, lo son sobre L y as KL/L es de Galois.
Si G(KL/L), como K/k es normal, se cumple que |K : K K, y
claramente |K G(K/K L).
La aplicacion : G(KL/L) G(K/K L) dada por () = |K es
ciertamente un homomorfismo de grupos y de hecho es un monomorfismo, pues
si () = I|K , entonces, como |L = I|L , resulta que = I|KL .
Consideremos el cuerpo E = F (Im ). Entonces K L E K. Si a E
se cumple |K (a) = a para todo G(KL/L), luego a F G(KL/L) = L.

Por lo tanto E K L, es decir, E = K L y as F (Im ) = F G(K/K L) ,
con lo que Im = G(K/K L) y es un isomorfismo.
264 Captulo 7. Extensiones de cuerpos

Teorema 7.46 Sean K/k y L/k dos extensiones finitas de Galois de un mismo
cuerpo k (ambas contenidas en un cuerpo mayor) y tales que K L = k. En-
tonces KL/k es finita de Galois y G(KL/k)
= G(K/k) G(L/k).

Demostracion: Si K es el cuerpo de escision sobre k de un polinomio p(x)


y L es el cuerpo de escision de q(x), es claro que KL es el cuerpo de escision
de pq, luego KL/k es una extension finita de Galois (la separabilidad es clara).
Por el teorema de Galois podemos definir : G(KL/k) G(K/k) G(L/k)
mediante () = (|K , |L ).
Obviamente es un homomorfismo de grupos. De hecho es un monomor-
fismo porque su nucleo es claramente trivial. Para probar que es biyectiva
basta
ver que ambos grupos
tienen el mismo orden, pero por el teorema anterior
G(K/k) = G(KL/L) , y as |KL : k| = |KL : L| |L : k| = |K : k| |L : k|.

7.6 Cuerpos algebraicamente cerrados


Sabemos que si k es un cuerpo y p(x) k[x], entonces existe una extension
de k en la que p(x) tiene todas sus races (el cuerpo de escision del polinomio),
pero cabe preguntarse si no es posible encontrar un cuerpo k que contenga ya
todas las races de todos los polinomios de k[x]. El teorema siguiente precisa
esta idea:

Teorema 7.47 Sea K un cuerpo. Las condiciones siguientes son equivalentes:

1. K no tiene extensiones algebraicas distintas de s mismo.

2. Los polinomios irreducibles en K[x] son los polinomios de grado 1.

3. Todo polinomio no constante de K[x] tiene una raz en K.

4. Todo polinomio de K[x] se escinde en K[x].

5. K contiene un subcuerpo k tal que la extension K/k es algebraica y todo


polinomio no constante de k[x] se escinde en K[x].

Demostracion: 1) 2) Sabemos que todo polinomio de grado 1 es irredu-


cible, y los de grado 0 son unidades o el 0. Si existiera un polinomio irreducible
de grado mayor que 1, entonces dicho polinomio no tendra races en K, luego
existira una extension de K en el que tendra una raz a, y K(a) sera una
extension algebraica propia de K.
2) 3) Si un polinomio no es constante entonces no es nulo ni unitario,
luego tiene un factor irreducible, que sera de la forma ax + b K[x] con a 6= 0,
luego el polinomio tendra por raz b/a.
3) 4) Si f (x) K[x] es constante entonces f (x) = a0 K, luego se escinde
en K[x]. Si no es constante tiene una raz a1 K, luego f (x) = (x a1 )f1 (x),
para cierto polinomio f1 (x) K[x]. Si f1 (x) tampoco es constante tiene una
raz a2 K, luego f (x) = (x a1 )f1 (x) = f (x) = (x a1 )(x a2 )f2 (x), para
7.6. Cuerpos algebraicamente cerrados 265

cierto polinomio f2 (x) K[x]. Como el grado de los polinomios que vamos
obteniendo es cada vez una unidad menor, al cabo de un numero finito n de
pasos llegaremos a un polinomio de grado 0, es decir, a una constante a0 y
tendremos f (x) = a0 (x a1 ) (x an ).
4) 5) Basta tomar k = K.
5) 1) Si L/K es una extension algebraica y a L entonces a es algebraico
sobre k, luego podemos considerar el polinomio p(x) = pol mn(a, k), que por
hipotesis se escinde en K[x]. Existen a0 , a1 , . . . , an K tales que
p(x) = a0 (x a1 ) (x an ).
Como p(a) = 0, necesariamente a = ai para algun i, luego a K y en conse-
cuencia L = K.

Definicion 7.48 Diremos que un cuerpo K es algebraicamente cerrado si cum-


ple cualquiera de las condiciones del teorema anterior.
La propiedad 5. esta encaminada a encontrar cuerpos algebraicamente cerra-
dos, pues lo que afirma es que si tenemos un cuerpo k que no es algebraicamente
cerrado, para que una extension algebraica K de k lo sea basta con comprobar
que los polinomios de k[x] se escinden1 en K[x], sin necesidad de considerar los
nuevos polinomios (los de K[x]) que hemos obtenido al extender el cuerpo.
Por ejemplo, es obvio que Q no es algebraicamente cerrado y, a pesar de
que muchos polinomios irreducibles en Q[x] se escinden en R[x], lo cierto es que
R no es lo suficientemente grande como para ser algebraicamente cerrado,
pues, por ejemplo, el polinomio x2 + 1 no tiene races en R. Pero vamos a
demostrar que, en cierto sentido, este es el unico obstaculo por el cual R
no es algebraicamente cerrado, y que, al eliminarlo, (es decir, adjuntando a R
una raz de dicho polinomio, con lo que obtenemos el cuerpo C de los numeros
complejos), llegamos a un cuerpo algebraicamente cerrado.
Conviene enunciar el resultado en un contexto general, que constituye la
primera aplicacion profunda de la teora de Galois que vamos a presentar:
Teorema 7.49 Sea R un cuerpo ordenado que cumpla las dos propiedades si-
guientes:
1. Todo a R positivo tiene una raz cuadrada en R.
2. Todo polinomio de grado impar en R[x] tiene al menos una raz en R.
Sea K = R(i), donde i es una raz del polinomio x2 + 1. Entonces el cuerpo K
es algebraicamente cerrado.
Demostracion: Notemos que x2 + 1 no puede tener races en un cuerpo
ordenado, por lo que |K : R| = 2. El teorema [G 5.2] nos da que todo elemento
de K tiene raz cuadrada. La formula de las ecuaciones de segundo grado nos
da a su vez que todo polinomio de grado 2 con coeficientes en K tiene sus races
en K, lo cual equivale a que K no tiene extensiones algebraicas de grado 2.
1 El teorema 13.20 afirma que, de hecho, basta con que tengan una raz en K.
266 Captulo 7. Extensiones de cuerpos

Supongamos ahora que K no es algebraicamente cerrado. Entonces existe un


polinomio no constante sin races en K. Sea L la adjuncion a K de una raz de
dicho polinomio, con lo que tenemos una extension finita L/K de grado mayor
que 1. La extension L/R tambien es finita. Cambiando L por la clausura
normal de L sobre R podemos suponer que L/R es una extension finita de
Galois (notemos que R, al ser un cuerpo ordenado, tiene caracterstica 0, luego
la extension es separable).
Sea P un 2-subgrupo de Sylow del grupo de Galois G = G(L/R). Notemos
que P 6= 1, porque el grupo tiene orden par. Sea F el cuerpo fijado por P , de
modo que R F L. La extension F/R es finita separable, luego tiene un
elemento primitivo, digamos F = R(a). Sea p = pol mn(a, R). Entonces p es
irreducible en R[x], pero es un polinomio de grado impar, pues |F : R| = |G : P |
es impar. Por hipotesis p tiene que tener una raz en R, lo cual solo es posible
si p tiene grado 1, luego F = R y, por consiguiente, P = G.
As pues, hemos concluido que la extension L/R tiene grado potencia de 2,
luego lo mismo le sucede a L/K. Pongamos que |L : K| = |G(L/K)| = 2n .
Ahora usamos que G(L/K) tiene un subgrupo de ndice 2, por el teorema 6.59.
Si F es su cuerpo fijado, tenemos que |F : K| = 2, pero hemos visto que K no
puede tener extensiones de grado 2.
Observemos que el cuerpo R de los numeros reales cumple las dos hipotesis
del teorema anterior (teoremas [An 1.37] y [An 3.23]), luego el cuerpo C de
los numeros complejos es algebraicamente cerrado. El teorema siguiente nos da
otro ejemplo:
Teorema 7.50 Si K/k es una extension de cuerpos y A es el conjunto de los
elementos de K algebraicos sobre k, entonces A es un cuerpo algebraicamente
cerrado.
Demostracion: Es claro que A = k(A), luego es un cuerpo, y si tomamos
un polinomio no constante p(x) k[x], sabemos que se escinde en K[x], pero
sus races seran algebraicas sobre k, luego estaran en A, luego p(x) se escinde
en A[x], luego A es algebraicamente cerrado por el apartado 5) de 7.47.

Definicion 7.51 Llamaremos A al conjunto de los numeros complejos algebrai-


cos sobre Q que, por el teorema anterior, es un cuerpo algebraicamente cerrado.
Sus elementos se llaman simplemente numeros algebraicos.
Llamamos Ra al conjunto de los numeros reales algebraicos (sobre Q). Es
claro entonces que a + bi A si y solo si a, b Ra .
En efecto, si a, b Ra , entonces, a, b, i A, luego a+bi A. Recprocamente,
si a + bi A, entonces el conjugado a bi tambien es algebraico (con el mismo
polinomio mnimo sobre Q), luego a + bi + a bi = 2a A, luego a A, luego
bi = a + bi a Ra , luego b Ra .
Es claro entonces que A = Ra (i). De hecho, es facil ver que Ra cumple las
hipotesis del teorema 7.49, por lo que la clausura algebraica de A se deduce
tambien de este teorema.
7.6. Cuerpos algebraicamente cerrados 267

Observemos que Ra 6= R porque Ra es numerable [An 1.49] y R no lo es


[An 1.46]. Claramente entonces A tambien es numerable, mientras que |C| = c.
Ejercicio: Probar que la extension A/Q es algebraica, pero infinita.

Definicion 7.52 Diremos que un cuerpo K es una clausura algebraica de un


cuerpo k si K es una extension algebraica de k y es algebraicamente cerrado.

Por ejemplo, C es una clausura algebraica de R, y es la unica salvo R-


isomorfismo, es decir, que si K es cualquier clausura algebraica de R, entonces
K es un cuerpo R-isomorfo a C.
En efecto, podemos considerar una raz K del polinomio x2 + 1, de
modo que existe un R-isomorfismo : C R() K, pero entonces R() es
un cuerpo algebraicamente cerrado y la extension K/R() es algebraica, luego
tiene que ser K = R(), y as : C K es un R-isomorfismo.
Similarmente, A es una clausura algebraica de Q, y tambien es unica salvo
Q-isomorfismo. Vamos a deducir esto de un resultado general:

Teorema 7.53 (AE)2 Sea K/k una extension algebraica y : k L un


monomorfismo de cuerpos, con L es algebraicamente cerrado. Entonces se
extiende a un monomorfismo : K L.

Demostracion: Sea M el conjunto de todos los pares (A, ) tales que


k A K y : A L es un monomorfismo que extiende a . El conjunto
M esta inductivamente ordenado por la relacion

(A, ) (A , ) si y solo si A A y |A = .

Sea (A, ) un elemento maximal. Es suficiente probar que A = K. En


otro caso sea u K \ A. Sea p(x) = pol mn(u, A) y sea p(x) el polinomio
correspondiente en [A][x] L[x] que, al ser L algebraicamente cerrado, tiene
una raz v L.
El teorema 7.13 nos da un monomorfismo : A(u) L que extiende a ,
en contra de la maximalidad de (A, ). Por tanto A = K.
El caso particular que nos interesa de momento es:

Teorema 7.54 (AE)2 Si K es una clausura algebraica de k, K es una clausura


algebraica de k y : k k es un isomorfismo, entonces se extiende a un
isomorfismo : K K . En particular dos clausuras algebraicas de un
cuerpo k son kisomorfas.
2 No se necesita AE si la extension K/k es finita, pues entonces puede expresarse como

K = k(a1 , . . . , an ) y puede ir extendiendose sucesivamente a cada k(a1 , . . . ai ) usando el


teorema 7.13. Si |K : k| = 0 expresamos K = k(a1 , a2 , . . .) y solo necesitamos el axioma ED
junto con 7.13.
268 Captulo 7. Extensiones de cuerpos

Demostracion: Por el teorema anterior, se extiende a un monomorfismo


: K K .
Como K es algebraicamente cerrado, [K] tambien lo es, y la extension
K / [K] es algebraica, luego ha de ser [K] = K , es decir, es un isomor-

fismo.
Si K y K son dos clausuras algebraicas de un mismo cuerpo k, entonces la
identidad en k se extiende a un kisomorfismo de K en K .
Notemos que si consideramos extensiones algebraicas de Q, no perdemos
generalidad si suponemos que son subcuerpos de C y, mas concretamente de
A, pues ahora sabemos que toda extension algebraica de Q es Q-isomorfa a un
subcuerpo de A.
Aunque hemos construido explcitamente una clausura algebraica para R y
para Q, lo cierto es que todo cuerpo tiene una clausura algebraica:

Teorema 7.55 (AE) Todo cuerpo tiene una clausura algebraica.

Demostracion: Sea k un cuerpo y consideremos el conjunto C = k[x] N.


Para cada k, llamemos = (x , 0) C. Sea k = { | k} C.
Notemos que la aplicacion k k dada por 7 es biyectiva, por lo que
todo elemento de k se expresa de forma unica como , para un cierto k.
Dotamos a k de estructura de cuerpo mediante + = + , = . Es
claro que 7 es ahora un isomorfismo de cuerpos, que podemos extender
a un isomorfismo de anillos k[x] k[x]. Si p(x) k[x], representaremos su
imagen por p(x) k[x].
As hemos construido otro cuerpo k que algebraicamente es el mismo que k,
pero que desde un punto de vista conjuntista esta contenido en C. Basta probar
que k tiene una clausura algebraica.
Sea M el conjunto3 de todos los cuerpos K tales que K/k es una extension
algebraica y, como conjunto, K C y ademas, si = (p(x), n) K, entonces
p() = 0.
Notemos que k M pues si k, entonces = = (x , 0), para cierto
k, de modo que x = x = x , y ciertamente es raz de x .
Definimos en M la relacion de orden dada por K K si y solo si K es un
subcuerpo de K . Vamos a comprobar que M S cumple las hipotesis del lema de
Zorn. Si C M es una cadena, entonces L = C C y si , L, existe un
K C tal que , K (porque C es una cadena) y las operaciones + ,
son independientes de la eleccion de K. Por lo tanto, esto define una suma y
un producto en L de modo que cada K C es un subcuerpo de L. Esto implica
claramente que la extension L/k es algebraica, y si = (p(x), n) L, existe un
3 Mas precisamente, los elementos de M son ternas (K, +, ), de manera que k K C y

+, : K K K. En particular +, C C C, luego
(K, +, ) PC P(C C C) P(C C C),
luego M P(PC P(C C C) P(C C C)) = M. La funcion de C en la demostracion
es garantizar que M pueda definirse por especificacion a partir del conjunto M.
7.7. Cuerpos formalmente reales 269

K C tal que K, luego por definicion de M tenemos que p() = 0, luego


L M es una cota superior de C.
Por el lema de Zorn existe un elemento maximal K M. Basta probar
que K es algebraicamente cerrado. En caso contrario, K admite una extension
algebraica K . Para cada polinomio monico irreducible p(x) k[x] tal que p(x)
tenga al menos una raz en K \ K, sean 1 , . . . m sus races en K \ K. Como
p(x) tiene a lo sumo un numero finito de races en K, solo puede haber un
numero finito de numeros naturales n tales que (p(x), n) K, luego podemos
tomar un n mayor que todos ellos y definir i = (p(x), n + i) C \ K.
As tenemos una aplicacion inyectiva K C que sobre K es la identidad
y sobre K \ K es i 7 i . Si llamamos K C a la imagen de esta aplicacion,
es claro que podemos dotar a K de estructura de cuerpo K-isomorfo a K y,
como p(i ) = 0, tenemos que K M y contradice la maximalidad de K.

7.7 Cuerpos formalmente reales


En geometra se trabaja a menudo con cuerpos ordenados, y un cuerpo
ordenado nunca puede ser algebraicamente cerrado. Vamos a estudiar mas
detalladamente que cuerpos admiten una relacion de orden y a continuacion
introduciremos un concepto analogo al de clausura algebraica para cuerpos or-
denados.

Definicion 7.56 Un cuerpo R es (formalmente) real si existe una relacion de


orden en R con la que cumple los axiomas de cuerpo ordenado.

Notemos que la diferencia entre cuerpo real y cuerpo ordenado es que el


segundo concepto presupone una relacion de orden dada en el cuerpo, mientras
que un cuerpo real puede admitir distintas relaciones de orden que cumplan los
axiomas de cuerpo ordenado.
 
Ejemplo Consideremos el cuerpo R = Q 2 R. Obviamente es un cuerpo

ordenado en el que 2 > 0, pero la conjugacion (a + b 2) = a b 2 es un
Q-automorfismo de R que nos permite definir otra relacion de orden en R con
la que R es tambien un cuerpo ordenado, a saber, la dada por

si y solo si () ().

Respecto a este orden, 2 < 0.
Que un cuerpo R sea formalmente real equivale a que exista un subconjunto
con ciertas propiedades:
Sea R un cuerpo. Un conjunto P R es un cono positivo si cumple las
propiedades siguientes:
1. Si a, b P , entonces a + b P y ab P .
2. R = P (P ) y P (P ) = {0} (donde P = {a | a P }).
270 Captulo 7. Extensiones de cuerpos

Es trivial comprobar que si R es un cuerpo ordenado, entonces el conjunto


P = {a R | a 0} es un cono positivo y, recprocamente, si P es un cono
positivo en R, entonces la relacion definida por a b si y solo si b a P es
una relacion de orden total en R con la que R se convierte en cuerpo ordenado
y respecto a la cual P = {a K | a 0}.
Por lo tanto, un cuerpo es real si y solo si admite un cono positivo. Esta
condicion se puede debilitar bastante. Empecemos por relajarla un poco:
Diremos que P R es un precono positivo si cumple las propiedades siguien-
tes:
1. Si a, b P , entonces a + b, ab P .
2. Si a R, entonces a2 P .
3. 1
/ P.
Es claro que todo cono positivo es un precono positivo (basta tener en cuenta
que es el conjunto de elementos 0 del orden que define en K). Recprocamente:

Teorema 7.57 (AE) Si R es un cuerpo, todo precono positivo en R esta con-


tenido en un cono positivo.4

Demostracion: Sea P0 un precono positivo en R y consideremos la familia


de todos los preconos positivos en R que contienen a P0 , considerada como
conjunto parcialmente ordenado por la inclusion. Es claro que el lema de Zorn
implica que existe un precono positivo P que contiene a P0 y es maximal respecto
de la inclusion. Vamos a probar que es un cono positivo. Obviamente cumple
la propiedad 1) de la definicion.
Veamos ahora que si x R, entonces, o bien xP (1 + P ) = , o bien
xP (1 + P ) = .
Supongamos lo contrario. Entonces existen elementos a, b, c, d P tales
que xa = 1 + b, xc = 1 + d. Multiplicando ambas ecuaciones resulta que
acx2 = 1 + b + d + bd, luego 1 = acx2 + b + d + bd P , contradiccion.
Supongamos, pues que xP (1 + P ) = . Sea P = P xP . Como
0 = 02 P , todo p P se puede poner como p = p x0 P , luego P P .
4 Si el cuerpo R del teorema anterior es numerable, entonces no es necesario el axioma de

eleccion. En efecto, podemos partir de una enumeracion {an }


n=1 de R y definir una sucesion
de preconos positivos {Pn } n=0 que empiece con el precono dado P0 y de modo que Pn+1 sea
el conjunto de todos los elementos de R de la forma
s
P
ai1 aimi
i=1

con los aij Pn {an } S


si 1 no esta en dicho conjunto, o Pn+1 = Pn en caso contrario. Es
claro entonces que P = Pn es un precono positivo maximal.
n
Salvo que indiquemos otra cosa, esta observacion se aplica a todos los resultados posteriores
de esta seccion, pues el axioma de eleccion solo interviene a traves de la aplicacion de este
teorema.
7.7. Cuerpos formalmente reales 271

Por otra parte, P es un precono positivo: tomamos p xp , q xq P , con


p, p , q, q P :
(p xp ) + (q xq ) = (p + q) x(q + q ) P .
(p xp )(q xq ) = (pq + x2 p q ) x(pq + qp ) P
Como P P , tenemos que P contiene los cuadrados.
Si 1 P , entonces existen a, b P tales que 1 = a bx, luego
a + 1 = bx xP (1 + P ), contradiccion.
La maximalidad de P implica entonces que P = P y, como 0, 1 P (porque
son cuadrados) x = 0 1x P = P .
Similarmente, si suponemos que xP (1 + P ) = , el mismo razonamiento
aplicado a x nos da que x P . Por consiguiente, R = P (P ).
Supongamos por ultimo que a P (P ) con a 6= 0. Entonces a, a P
y, por la parte ya probada, 1/a P (P ), luego 1/a P , luego resulta que
1 = a(1/a) P , contradiccion.
As pues, un cuerpo es real si y solo si tiene un precono positivo. Ahora ob-
servamos que en todo cuerpo existe un conjunto que casi es un precono positivo:
Definicion 7.58 Si K es un cuerpo, llamaremos SK al conjunto de todas las
sumas de cuadrados en K.
Como los preconos positivos contienen a todos los cuadrados y son cerrados
para sumas, es obvio que SK esta contenido en todo precono positivo de K. Mas
aun, es claro que SK cumple todas las condiciones de la definicion de precono
positivo salvo quiza la ultima, es decir, salvo que 1
/ SK .
Mas aun, conviene observar que SK \ {0} es un subgrupo de K .
Es claro que 1 SK \ {0} y que SK \ {0} es cerrado para productos, luego
la unica comprobacion necesaria es que tambien es cerrado para inversos:
n  2
1 a21 + + a2n X ai
= = .
a21 + + a2n (a21 + + a2n )2 i=1
a21 + + a2n

Con esto llegamos a la caracterizacion mas simple posible de los cuerpos


reales:
Teorema 7.59 (AE) Sea R un cuerpo. Las afirmaciones siguientes son equi-
valentes:
1. R es real.
2. 1 no es suma de cuadrados en R.
3. No todo elemento de R es suma de cuadrados y car R 6= 2.
4. Una suma de cuadrados en R es nula si y solo si todos los sumandos son
nulos.
272 Captulo 7. Extensiones de cuerpos

Demostracion: 1) 3) es trivial, pues si R es real toda suma de cuadrados


es 0 y car R = 0.
3) 2) Si 1 SR y car R 6= 2, entonces para todo a R, se cumple que
 2  2
(a + 1)2 (a 1)2 a+1 a1
a= = + (1) SR ,
4 2 2
luego R = SR .
2) 1) La condicion 1 / SR es la unica que falta para asegurar que SR
es un precono positivo, luego implica que R es real, por el teorema 7.57.
2) 4) Supongamos que a21 + + a2n = 0 y no todos los sumandos son nu-
los. No perdemos generalidad si suponemos que ninguno lo es. Necesariamente
entonces, n 2, luego a2n SR \ {0}, luego 1 SR \ {0} (porque hemos
visto que SR \ {0} es un grupo), contradiccion.
4) 2) Si 1 SR , entonces 12 + (1) = 0 es una suma de cuadrados nula
cuyos terminos no son nulos.
Ahora necesitamos un resultado tecnico:

Teorema 7.60 Sea K/k una extension finita de grado impar de cuerpos de
caracterstica 0 y consideremos a1 , . . . , an k no nulos tales que la ecuacion
a1 x21 + + an x2n = 0 tenga una solucion no trivial en K (es decir, con alguna
xi 6= 0). Entonces existe tambien una solucion no trivial en k.

Demostracion: Por el teorema del elemento primitivo K = k(), para


cierto K. Sea g = pol mn(, k), cuyo grado sera de la forma 2m + 1. Ahora
usamos que K = k[x]/(g), como se ve en la prueba del teorema 7.6. Podemos
trabajar con k[x]/(g), de modo que los xi que estamos suponiendo que existen
en K son clases [fi ], para ciertos fi k[x], de modo que

a1 f1 (x)2 + + an fn (x)2 = h(x)g(x).

Podemos exigir ademas que grad fi 2m y que su m.c.d. es 1. El polinomio del


miembro izquierdo de la igualdad anterior tiene grado par 4m, luego si m 1
el grado de h tiene que ser impar y 2m 1. Entonces, algun factor irreducible
de h tiene que tener grado impar. Digamos que h = h1 h2 , donde h1 es irreducible
de grado impar. Sea una raz de h1 en una extension de k y sea K = k(), que
es una extension de k de grado impar con |K : k| 2m 1 < 2m + 1 = |K : k|.
Como h1 no puede dividir a todos los polinomios fi , tenemos que las clases
[fi ] k[x]/(h1 )
= K no son todas nulas, y determinan una solucion no trivial
de a1 x1 + + an x2n en K . Como el grado va disminuyendo, tras un numero
2

finito de pasos tenemos que llegar a un cuerpo K en el que m = 0, es decir, tal


que K = k.
As pues, una condicion necesaria y suficiente para que un cuerpo admita un
orden compatible con su estructura algebraica es simplemente que 1 no pueda
expresarse como suma de cuadrados.
7.7. Cuerpos formalmente reales 273

Teorema 7.61 (AE) Sea R un cuerpo ordenado y K/R una extension finita.
Supongamos que se da uno de los dos casos siguientes:

1. Existe un a R positivo tal que K = R( a).
2. |K : R| es impar.
Entonces K es real y el orden de R se extiende a un orden en K.

Demostracion: Basta probar que el conjunto P0 formado por los elementos


n
P
de la forma cj 2j , con cj R, j K, cj > 0 es un precono positivo en K,
j=1
pues entonces estara contenido en un cono positivo que contendra a todos los
elementos positivos de R, luego determinara un orden en K que extiende al
de R.
Es claro que P0 cumple todas las condiciones de la definicion de precono
positivo salvo quiza que 1
/ P0 , luego solo se trata de probar que es imposible
que
n
P
1 = cj 2j ,
j=1

con cj > 0 en R y j K. Vamos a dar una prueba separada para cada caso.
En el primero tenemos que
n
P n
P n
P
1 = cj (aj + bj a)2 = cj (a2j + ab2j ) + 2aj bj cj a,
j=1 j=1 j=1

n
P
luego de hecho 1 = cj (a2j + ab2j ), pero esto es imposible, porque la suma es
j=1
obviamente positiva.
En el segundo caso basta aplicar el teorema anterior: tenemos que
n
P
x20 + cj x2j = 0
j=1

tiene solucion en K con x0 = 1, luego tambien tiene solucion no trivial en R, lo


cual es imposible, al igual que antes.
Como consecuencia:

Teorema 7.62 (AE) Si R es un cuerpo real y a R, entonces a es suma de


cuadrados si y solo si es positivo en toda ordenacion de R.

Demostracion: Una implicacion es obvia y, si a no es suma de cuadrados,


el teorema anterior nos da queR( a) es real y en cualquier ordenacion de
este cuerpo sucede que a = ( a)2 > 0, luego a < 0. Un orden en R( a)
se restringe a un orden en R en el que a < 0.

Definicion 7.63 Un cuerpo R es realmente cerrado si es formalmente real y no


tiene extensiones algebraicas formalmente reales (distintas de el mismo).
274 Captulo 7. Extensiones de cuerpos

Teorema 7.64 (AE) Si R es un cuerpo realmente cerrado, entonces admite


una unica relacion de orden (que cumpla los axiomas de cuerpo ordenado),
concretamente, la que tiene por cono positivo a R2 (el conjunto de los cuadrados
en R).

Demostracion: Si R es realmente cerrado, admite una relacion de orden.


2
Sea C su cono positivo. Obviamente R C, pero si a C, entonces el
teorema 7.61 nos da que el cuerpo R( a) es real,
y obviamente es una extension
algebraica de R, luego tiene que ser R = R( a), luego a R2 . Por lo tanto,
R2 es un cono positivo y es, de hecho, el unico posible.
As pues, a partir de aqu consideraremos a todo cuerpo realmente cerrado
como cuerpo ordenado con la unica ordenacion posible.

Teorema 7.65 (AE) Si R es un cuerpo, las afirmaciones siguientes son equi-


valentes:

1. R es realmente cerrado.

2. Todo polinomio en R[x] de grado impar tiene una raz en R y R admite


un orden respecto al que todo elemento positivo tiene raz cuadrada en R.

3. El cuerpo R[i] (donde i2 = 1) es algebraicamente cerrado y contiene


estrictamente a R.

Demostracion: 1) 2) Ya hemos visto que R admite una ordenacion en la


que los elementos positivos son los cuadrados. Si p(x) R[x] es un polinomio de
grado impar, existe una extension de R en la que tiene una raz . Consideramos
entonces la extension R(), que tiene grado impar sobre R, luego el teorema
7.61 nos da que el cuerpo R() es real, luego R = R(), con lo que p(x) tiene
una raz en R.
2) 3) Como R admite un orden, no puede ser que 1 tenga raz cuadrada
en R. El resto es el teorema 7.49.
3) 1) Vamos a probar que toda suma de cuadrados en R es un cuadrado.
Esto implicara que 1 no es suma de cuadrados en R, por lo que 7.59 nos dara
que R es real.
Dados a, b R, tenemos que a + bi = (c + di)2 = c2 d2 + 2cdi, luego
a = c2 d2 y b = 2cd, luego

a2 + b2 = (c2 d2 )2 + 4c2 d2 = (c2 + d2 )2 .

Si K/R es una extension algebraica real, entonces adjuntando a K una raz


de x2 + 1 obtenemos otra K() de modo que R() = R(i), luego R() es
algebraicamente cerrado, luego K K() = R(), pero R() no es real, luego
K = R. Esto prueba que R no tiene extensiones algebraicas reales, luego es
realmente cerrado.
Como consecuencia:
7.7. Cuerpos formalmente reales 275

Teorema 7.66 Si R es un cuerpo realmente cerrado, entonces todo a R tiene


raz n-sima para n impar y, si a > 0, para todo n.

Demostracion: Sea n = 2u m, con m impar. El polinomio xm a tiene que


tener una raz b R. Si a > 0, es claro que tambien b > 0, y entonces podemos
extraer sucesivamente u races cuadradas, lo que nos da una raz n-sima de a.

Es facil ver que si n es impar entonces cada a R tiene una unica raz n-
sima, mientras que si es par y a > 0 tiene dos, de las cuales solo una es positiva.
Por lo tanto, podemos usar la notacion usual n a para referirnos a la unica raz
n-sima de a si n es impar o a la unica raz positiva si n es par y a 0.

Definicion 7.67 Si R es un cuerpo formalmente real, una clausura real de R


es una extension algebraica K/R tal que K sea realmente cerrado con un orden
que extienda al de R.

Por ejemplo, el conjunto Ra de los numeros reales algebraicos es una clausura


real de Q. Mas aun:

Teorema 7.68 Toda clausura real de Q es isomorfa a Ra .

Demostracion: Sea K una clausura real de Q. Recordemos de [An 1.2]


que un cuerpo ordenado K es arquimediano si N no esta acotado en K. Vamos a
probar que K es arquimediano. En caso contrario existe K mayor que todos
los numeros naturales, luego tambien mayor que todos los numeros racionales.
Veamos por induccion sobre n que si p(x) Q[x] es un polinomio de grado n,
entonces n+1 > p(). Para n = 0 es precisamente la hipotesis de que es
mayor que todo elemento de Q. Si vale para n y

p(x) = an+1 xn+1 + + a1 x + a0 ,

por la hipotesis de induccion aplicada al polinomio (p(x) a0 )/x + 1,

n+1 > an+1 n + + a2 + a1 + 1,

luego, multiplicando por > 0,

n+2 > an+1 n+1 + + a2 2 + a1 + > an+1 n+1 + + a2 2 + a1 + a0 .

Esto implica que no puede ser raz de ningun polinomio monico de Q[x], en
contra de que K es algebraico sobre Q.
Por el teorema [An 1.43] tenemos que K es isomorfo (como cuerpo ordenado)
a un subcuerpo R R. Entonces R es tambien una clausura real de Q. En
particular, como R/Q es algebraica, tiene que ser R Ra , pero como Ra es real
y R no admite extensiones algebraicas reales, tiene que ser R = Ra , luego K es
isomorfo a Ra .
En general, todo cuerpo real tiene una clausura real:
276 Captulo 7. Extensiones de cuerpos

Teorema 7.69 (AE) Todo cuerpo ordenado R tiene una clausura real5 cuya
relacion de orden extiende a la de R.

Demostracion: Sea C una clausura algebraica de R. Podemos aplicar el


lema de Zorn al conjunto de todos los cuerpos ordenados R K C tales que
el orden de K extiende al de R. Obtenemos as un elemento maximal K, es
decir, un cuerpo ordenado que contiene a R como subcuerpo ordenado y que
no admite extensiones algebraicas dentro de C que cumplan lo mismo. Basta
probar que K es realmente cerrado.
El mismo argumento del teorema 7.62 prueba que todo elemento positivo
en K tiene raz cuadrada, por lo que el orden en K es unico (los elementos
positivos son los cuadrados).
Es claro que si K admite una extension real algebraica, admite una que
cumple K K C. Pero entonces el orden de K se restringe a un orden en
K, pero como el orden de K es unico, de hecho el orden de K extiende al de K,
luego al de R, pero esto contradice la maximalidad de R salvo que K = K.

Tambien es cierto en general que dos clausuras reales de un mismo cuerpo


real R son R-isomorfas, pero la demostracion tendra que esperar hasta 8.58.
Terminamos ahora con un teorema adicional sobre sumas de cuadrados:

Definicion 7.70 Un numero Ra es totalmente real si todos sus conjugados


(sobre Q) son numeros reales.

Por ejemplo, 3 2 es real, pero no es totalmente real, pues sus conjugados (las
otras races cubicas de 2) son imaginarias.
Es claro que el conjunto Rtr de los numeros totalmente reales es un subcuerpo
de Ra , y de hecho la extension Rtr /Q es de Galois, pues es obvio que todo
conjugado de un numero totalmente real es totalmente real.
Diremos que Ra es totalmente positivo si todos sus conjugados son reales
y positivos.

Teorema 7.71 Si K Rtr , un elemento de K es totalmente positivo si y solo


si es suma de cuadrados en K.

Demostracion: Es inmediato que si K es suma de cuadrados, enton-


ces es totalmente positivo, pues sus conjugados seran numeros reales sumas de
cuadrados de numeros reales. Recprocamente, si no es suma de cuadrados, el
teorema 7.62 nos da que existe un orden en K respecto al cual < 0. Entonces
K es isomorfo (como cuerpo ordenado) a un subcuerpo de R (por el mismo ar-
gumento empleado en 7.68, porque K tiene que ser arquimediano), y la imagen
de por el isomorfismo es un conjugado negativo, luego no es totalmente
positivo.

5 Aqu usamos por segunda vez el lema de Zorn, pero una vez mas es facil ver que no se

requiere AE si el cuerpo es numerable.


7.8. Extensiones ciclotomicas 277

7.8 Extensiones ciclotomicas


En esta seccion mostraremos como la teora de Galois nos da un buen control
sobre los cuerpos ciclotomicos. Mas en general, aprovechamos la ocasion para
introducir el concepto de extension ciclotomica de un cuerpo arbitrario y de un
orden arbitrario, no necesariamente primo.

Definicion 7.72 Llamaremos extension ciclotomica n-sima de un cuerpo k al


cuerpo de escision sobre k del polinomio xn 1.
u
Si car k = p y n = pu m con (m, p) = 1, entonces xn 1 = (xm 1)p , lo
que implica que el cuerpo de escision de xn 1 es el mismo que el de xm 1, o
en otros terminos, que la extension ciclotomica n-sima coincide con la extension
ciclotomica m-sima. Por esta razon podemos restringirnos al caso en el que
car k n (incluyendo el caso car k = 0).
Sea K/k una extension ciclotomica n-sima tal que car k n. Entonces la
derivada del polinomio xn 1 es nxn1 6= 0, y la unica raz de este polinomio
es 0