Вы находитесь на странице: 1из 68

αβγδεζηθικλμνξοπρστυφχψω

Una nota sobre la Teoría Axiomática de


Conjuntos
Índice

1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Axiomas de Zermelo-Fraenkel (ZF) . . . . . . . . . . . . . . . . 4
3 Esquema de Reemplazo (o Sustitución) . . . . . . . . . . . . . . 18
4 Los números naturales N . . . . . . . . . . . . . . . . . . . . . 21
4.1 Orden y Principio de Inducción en N . . . . . . . . . . . 21
4.2 Principio del Buen Orden y Recursión en N . . . . . . . 26
4.3 Conjuntos Finitos . . . . . . . . . . . . . . . . . . . . . 30
4.4 Conjuntos numerables . . . . . . . . . . . . . . . . . . . 33
5 Relaciones de orden y Principio de Inducción Transfinita y
Recursión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
6 El Axioma de Elección y sus equivalencias . . . . . . . . . . . . 41
6.1 Funciones de elección. Producto cartesiano . . . . . . . 47
6.2 El Axioma de Elección (AE) . . . . . . . . . . . . . . . . 51
6.3 Equivalencias de AE . . . . . . . . . . . . . . . . . . . . 52
6.4 Otras equivalencias y aplicaciones de AE . . . . . . . . . 57
7 Cardinalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
8 La Hipótesis del Continuo . . . . . . . . . . . . . . . . . . . . . 63
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

2
1. Introducción 3

1 Introducción
El sistema de axiomas de uso más extendido para una teoría de conjuntos se
llama Teoría de Conjuntos de Zermelo-Fraenkel. Pretendemos con estas
notas dar a conocer este sistema a los estudiantes de los diversos cursos que
se imparten en las carreras de Ciencias.
Esta teoría axiomática fue propuesto por Ernst Zermelo entre 1904 y 1908,
con la finalidad de dar solución a algunos problemas surgidos de la teoría
cantoriana de los conjuntos, y no, como comúnmente se piensa, como un
“intento” de resolver las numerosas paradojas que aparecen en la llamada
“teoría ingenua de los conjuntos”. Aunque ciertamente, la teoría de Zermelo
evita efectivamente las estas paradojas de la teoría ingenua (como la Paradoja
de Russell), se ha enfrentado a otros problemas que no detallaremos aquí. En
estas notas vamos a estudiar brevemente este sistema junto con dos temas
más: El Axioma de Elección (Sec. 6) y la Hipótesis del Continuo (Sec. 8).
Unos años después, el sistema de Zermelo fue retomado y mejorado por
Abraham Fraenkel, Toralf Skolem y oosteriormente por John von Neumann.
En la actualidad, este sistema se presenta de diversas formas, según variadas
interpretaciones que se han hecho de ella. Así que no hay una forma canónica
de sistema de axiomas de Zermelo. Aquí seguiremos principalmente a [3].
Debemos advertir que evitaremos cualquier formalismo lógico excesivo.
No haremos tampoco un estudio detallado ni mucho menos completo de esta
teoría axiomática. Bastará para nuestros fines hacer una lista descriptiva
de los axiomas, junto con un comentario breve sobre su significado y exponer
algunas consecuencias. No obstante, pretendemos ser ilustrativamente extenso
en los pocos conceptos tratados.
Hay otras intrepretaciones axiomáticas para una teoría de conjuntos. La
disputa sobre cuál es la mejor, es un debate que no trateremos aquí. El lector
interesado puede recurrir a las fuentes citadas para detallar y profundizar
sobre el tema.
Hasta ahora, no hay una prueba de que la Teoría de Conjuntos de Zermelo-
Fraenkel sea consistente, aunque la mayoría de los matemáticos así lo cree ([3]).
Nos atenemos a esta creencia.

Una nota sobre la Teoría Axiomática de Conjuntos


4 2. Axiomas de Zermelo-Fraenkel (ZF)

2 Axiomas de Zermelo-Fraenkel (ZF)


En la Teoría de Conjuntos de Zermelo-Fraenkel, que de ahora en adelante
abreviaremos como ZF, los únicos objetos indefinidos son llamados conjuntos
y básicamente se usa una operación binaria indefinida: “∈”, algunas veces
llamado “relator de pertenencia”. Pero en sentido estricto, “ser elemento de”
no significa nada en ZF, aunque es muy cómodo mantener esta libertad en el
lenguaje no formal de ZF para interpretar el símbolo “∈”.
Todos los objetos de ZF se contruyen a partir de conjuntos, la relación
binaria “∈”, y de los conectivos lógicos: ∧ (y), ∨ (o), ⇒ (condicional o im-
plicación material), ⇔ (si y sólo si); los cuantificadores: ∃ (existe), ∀ (para
todo); las variables: x, y, z,..., a, b, c,..., X, Y , Z,..., A, B, C ([5, 6]); y los
siguientes axiomas.

ZF 1. Extensionalidad. Dos conjuntos son iguales si y sólo si tienen los mismos


elementos:
∀A ∀B (A = B ⇔ ∀x (x ∈ A ⇔ x ∈ B)).

El primer axioma de ZF define así una nueva relación binaria básica: “=”.
Es inmediato que para todo A, B y C conjuntos, A = A (reflexividad),
A = B ⇔ B = A (simetría), y si A = B y B = C, entonces A = C
(transitividad).
El axioma de extensionalidad ZF 1 corresponde a la regla lógica del tercero
excluido, es decir, ningún conjunto en ZF está asociado a multiplicidades o
“grados” de pertenencia. Por lo tanto, en ZF, lo que determina de forma
unívoca un conjunto son sus elementos.
Si A y B son conjuntos, definimos la operación binaria A ⊂ B (algunas
veces se escribe B ⊃ A) con la fórmula

A ⊂ B ⇔ ∀x ((x ∈ A) ⇒ (x ∈ B)). (1)

Lo que se lee como “todo elemento de A es un elemento de B”, o simplemente,


“A está contenido en B”, o “B contiene a A”, o “A es un subconjunto de B”.
Es común escribir (1) de la forma

A ⊂ B ⇔ ∀x ∈ A(x ∈ B).

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 5

Es fácil mostrar, como es usual, que ⊂ es transitiva:

∀ A∀ B∀ C ((A ⊂ B ∧ B ⊂ C) ⇒ (A ⊂ C)).

También es inmediato demostrar

∀A∀B(A = B ⇔ (A ⊂ B ∧ B ⊂ A)).

Lo que significa que el operador ⊂ ofrece la técnica usual para comprobar


igualdad entre conjuntos.
Si A y B son conjuntos, entonces decimos que A es un subconjunto propio
de B, si A ⊂ B pero A 6= B. Usamos la notación A $ B. En símbolos, el
operador $ está definido con la fórmula

∀A∀B(A $ B ⇔ (A ⊂ B ∧ A 6= B)).

ZF 2. Conjunto vacío. Existe un conjunto, que llamaremos conjunto vacío,


el cual no tiene elementos:

∃A∀x(x ∈
/ A).

La fórmula x ∈ / A se lee “x no es elemento de A”, o bien “x no está en


A”. El símbolo “ ∈”/ es una nueva relación binaria, definida como la negación
lógica de “∈”. Esto es, x ∈ / A ⇔ ¬(x ∈ A). Con las técnicas habituales,
de ZF 1 puede comprobarse que el conjunto vacío es único, de modo que sin
ambigüedad alguna, preferimos usar la notación ∅, como es usual.
El Axioma del conjunto vacío es de carácter constructivo, pues afirma la
existencia de un conjunto por definición. En cambio, ZF 1 es un axioma de
tipo especificativo.
El conjunto vacío es el único conjunto tal que, dado cualquier otro conjunto
B, entonces ∅ ⊂ B. Esta propiedad es una definición equivalente del Axioma
del conjunto vacío. El lector puede verificar lo anterior rápidamente usando
un esquema de reducción al absurdo.
Con el Axioma del conjunto vacío, garantizamos que en ZF existe al menos
un conjunto. Pero no es en realidad esencial la característica de no tener
elementos. Como veremos un poco más adelante, en ZF es suficiente asumir

Una nota sobre la Teoría Axiomática de Conjuntos


6 2. Axiomas de Zermelo-Fraenkel (ZF)

que existe un conjunto indefinido (ver Proposición 2.3). Las matemáticas


pueden crecer desde la nada, o desde cualquier otra cosa. Por otra parte,
hasta ahora no hay posibilidad de asegurar que existe algún otro conjunto.

ZF 3. Axioma del par. Si A y B son conjuntos, entonces existe un conjunto C


cuyos elementos son exactamente A y B:

∀A∀B∃C(∀x (x ∈ C ⇔ x = A ∨ x = B)).

Por extensionalidad, con las técnicas usuales es fácil mostrar que este conjunto
es único. Este axioma es también de tipo constructivo. Usamos la notación
C = {A, B}. Note que {A, B} = {B, A}. Cuando A = B, abreviamos
{A} = {A, A}. En particular, en ZF hay conjuntos distintos del conjunto
vacío, como el conjunto {∅}. El Axioma del par permite entonces construir
una infinidad de conjuntos distintos:

∅, {∅}, {{∅}}, ... o también, ∅, {∅}, {∅, {∅}}, ...

En ZF hay entonces una infinidad de conjuntos.


Suele cuestionarse la validez de esta última afirmación aludiendo que no
hay hasta el momento una definición precisa (o formal) del término infinito.
Sin embargo, la afirmación “ en ZF hay una infinidad de conjuntos”, desde den-
tro de la propia teoría de ZF, no es una afirmación matemática, sino una afir-
mación metamatemática, no es algo que deba probarse con argumentos dentro
de ZF. Aquí, “infinito” no es un concepto matemático, y ni siquiera corre-
sponde a ninguna idea intuitiva de alguno, pues su sentido es claro: es infinito
porque no se agota en cantidad finita alguna, sin importar cuan grande sea
ésta. Y este sentido de la palabra infinito no necesita formalidad matemática
para comprenderse.
Note la diferencia que hay con la afirmación “el conjunto Z, de los número
enteros, es infinito”. Ésta es una afirmación matemática, relativa a un contexto
formal (matemático), la cual requiere en efecto un prueba para corroborarla
o bien desmentirla ([6]).
Notamos sin embargo, que si A, B y C son conjuntos, el Axioma del par no
permite construir un conjunto que contenga a los tres como elementos, algo
que podríamos escribir como {A, B, C}.

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 7

ZF 4. Separación. Supongamos que P (x) es una propiedad referida a conjuntos


con una variable libre. Si A es un conjunto, entonces existe un conjunto
B contenido en A tal que P (x), para todo x ∈ A:

∀A∃B(∀x (x ∈ B ⇔ x ∈ A ∧ P (x))).

Preferimos escribir

B = {x : x ∈ A ∧ P (x)}, o a veces B = {x ∈ A : P (x)}.

Por extensionalidad, se verifica fácilmente que el conjunto que postula ZF 4


es único. Aquí llamamos “propiedad” a una fórmula bien formada. Una
fórmula bien formada, grosso modo, es un enunciado del que se puede decir
si es verdadadero o falso, pero no ambos. Por supuesto hay reglas precisas,
incluso de carácter sictáctico. Por ejemplo, la cadena de símbolos

∀x (∃y(y = x ∧ y 6= z) (2)

es una fórmula bien formada ([3], p. 505). Cuando una fórmula bien formada
contiene una variable gobernada por alguno de los cuantificadores, ∀ y ∃,
decimos que es una variable acotada. En otro caso, decimos que es libre, o
simplemente que es una variable. Por ejemplo, en (2), las variables x, y, son
acotadas, mientras que z es libre.
El Axioma de separación (o de selección) es en realidad un esquema
axiomático. Es decir, se trata de una regla que define a su vez fórmulas
bien formadas que la teoría acepta como axiomas. En este sentido, ZF tiene
un número infinito de axiomas (este es otro ejemplo de afirmación meta-
matemática). ZF 4 es constructivo, y obliga a construir conjuntos a partir
de conjuntos conocidos previamente. Lo que hacemos es justamente separar
de todos los elementos de un conjunto A dado, aquellos que satisfacen P .
Pero hay que ser cuidadosos, pues tendemos a creer que podemos formar
conjuntos a partir de propiedades arbitrarias P (x), con expresiones como

B = {x : P (x)},

lo cual a veces se conoce como definición por comprensión. En sentido estricto,


esta idea es errónea, y puede producir contradicciones en casos notables.
Pensemos por ejemplo en la famosa Paradoja de Russell :

Una nota sobre la Teoría Axiomática de Conjuntos


8 2. Axiomas de Zermelo-Fraenkel (ZF)

Sea B = {x : x ∈ / x}. En este caso P (x) está definida como


x∈/ x. Es decir, B reúne todos los conjuntos que no se contienen
a sí mimos como elemento. Entonces, si B es un conjunto, cabe
preguntarse si B ∈ B o bien B ∈ / B. Si sucede B ∈ B, entonces
B ∈/ B. Si sucede B ∈ / B entonces B ∈ B. Ambos casos son
absurdos.

¿Cuál es el problema? En el fondo de este asunto está la necesidad (quizá


sicológica) que tenemos de comprender un conjunto como una “colección” de
objetos, tal cual corresponde a la “intuición”. Así que nos parece muy natural
asumir que {x : P (x)} es un conjunto, el de todos objetos que cumplen P . Esta
noción imprecisa de conjunto era común y en apariencia suficiente hasta finales
del s. XIX. Se suponía que todo conjunto debía tener la forma {x : P (x)}. Esta
expresión sintetiza sucintamente la idea de “colección arbitraria de objetos”.
Pero la paradoja de Russell (y otras tantas) mostraron que para una teoría que
habla únicamente de conjuntos, la idea de que un conjunto es una “colección
arbitraria de objetos” parece ser demasiado amplia.
No obstante, sí que tiene mucho sentido hablar de colecciones o familias de
conjuntos. Hay de hecho, otros sistemas axiomáticos que las incluyen detro
de la teoría, junto con los conjuntos habituales, sólo que algunas de ellas
resultan no ser conjuntos. Usualmente, se prefiere precisar el término clase
de conjuntos para referir una colección o una familia de conjuntos. En
términos más o menos precisos y generales, un conjunto es una clase el cual,
a su vez, está contenido propiamente en otra clase. Cualquier otro objeto que
no satisfaga tal condición es una clase propia. De modo que un conjunto es
una clase, pero no siempre a la inversa.
Los matemáticos y filósofos Alfred N. Whitehead y Bertrand Russell, en su
extenso tratado Principia Mathematica de principios del siglo XX, fueron de
los primeros en tratar una teoría axiómatica de los conjuntos y las clases (y en
general, la aritmética de los números naturales, y con ello toda la matemática),
conocida como teoría de los tipos, que según muchos matemáticos es poco
práctica y compleja. A lo largo de los años aparecieron otras teorías más
simplificadas, por ejemplo, las conocidas ahora como teoría de conjuntos de
von Neummann-Bernays-Gödel (NBG) y la teoría de conjuntos de Morse-Kelly

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 9

(MK) ([6]).
Una teoría de conjuntos que además admite la existencia de otros objetos
que no son conjuntos (clases) es muy conveniente, pero para nuestros fines no
es necesaria en realidad. Aunque en sentido estricto las clases de conjuntos
no están incluidas en la teoría de ZF, basta con tenerlas en cuenta por lo
menos dentro de nuestro lenguaje no formal. De hecho, algunas veces usamos
el término “clase” aun cuando se trata por cierto de conjuntos, por lo que el
uso de la palabra clase es sólo por seguir una costumbre que se ha extendido
un poco.
La paradoja de Russell es en realidad la prueba del siguiente enunciado.

Proposición 2.1. La clase {x : x ∈


/ x} no es un conjunto (es decir, es una clase
propia).
No obstante, si A es un conjunto, entonces por separación, la clase

B = {x : x ∈ A ∧ x ∈
/ x}

es un conjunto. Note que el absurdo: x ∈ B ⇔ x ∈ / B, desaparece en esta


definición de B. La descripción de este conjunto no es obvia, como parece
a primera vista, aunque puede corresponder, como uno puede sospechar, al
conjunto A mismo, si admitimos el Axioma de Regularidad (ZF 8), de von
Neumann, del cual hablaremos más adelante.
La afirmación que sigue es la solución negativa a la también muy conocida
paradoja del “conjunto de todos los conjuntos”.

Proposición 2.2. No existe un conjunto de todos los conjuntos (no existe un


“conjunto universal”). En particular, la clase {x : x = x} no es un conjunto
(es una clase propia).

Demostración. Supongamos que V es el conjunto que reúne a todos los


conjuntos. Por el Axioma de Separación (ZF 4), U = {x : x ∈ V ∧ x ∈/ x} es
un conjunto. Debe suceder U ∈ U o bien U ∈ / U . Si U ∈ U entonces U ∈/ U.
Y si U ∈/ U , entonces dado que U ∈ V , se sigue U ∈ U . Ambos casos son
absurdos.

Una nota sobre la Teoría Axiomática de Conjuntos


10 2. Axiomas de Zermelo-Fraenkel (ZF)

Apuntamos una pequeña conclusión que será importante más adelante, y


cuya prueba es inmediata.

Corolario 2.1. Si A es un conjunto, entonces existe un conjunto x tal que x ∈


/ A.
Equivalentemente, existe un conjunto B no vacío tal que B ∩ A = ∅.
Ahora revisamos algunas aplicaciones importantes de ZF 4.

Proposición 2.3. Si A es un conjunto, entonces

∅ = {x : x ∈ A ∧ x 6= x}. (3)

Demostración. Por el Axioma de separación, B = {x : x ∈ A ∧ x 6= x} es


un conjunto. Ahora, si para algún conjunto x, se tiene que x ∈ B, entonces
x 6= x, lo cual es imposible, luego B no tiene elementos, por consiguiente
B = ∅ (por unicidad del conjunto vacío).

Admitiendo entonces ZF 4, el Axioma del conjunto vacío (ZF 2), podría


sustituirse por un axioma que garantice la existencia de un conjunto indefinido.
El conjunto vacío quedaría definido por (3).
Si A y B son conjuntos, y consideramos la propiedad P (x) ≡ x ∈ B,
entonces podemos definir el conjunto, el cual denotaremos como A ∩ B, que
llamaremos intersección de A y B, cuyos elementos son exactamente los
elementos comunes de A y B. Es decir

A ∩ B = {x : x ∈ A ∧ x ∈ B} o también A ∩ B = {x ∈ A : x ∈ B}.

Por extensionalidad, es fácil ver que tal conjunto es único.


De forma más general, si A es un conjunto no vacío y B es algún elemento
de A (i.e. B ∈ A), definimos por separación el conjunto intersección de A
\
x = {y : y ∈ B ∧ ∀ x(x ∈ A ⇒ y ∈ x)}. (4)
x∈A

Podemos abreviar ∀ x(x ∈ A ⇒ y ∈ x) con la fórmula (menos formal pero


muy aceptable) ∀ x ∈ A(y ∈ x), y entonces reescribimos
\
x = {y : y ∈ B ∧ ∀ x ∈ A(y ∈ x)}.
x∈A

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 11

T
La notación A es también común. Es fácil comprobar que este conjunto está
bien definido, es decir, no depende de la elección de B, y por extensionalidad
es único. En particular, si A y B son conjuntos,
\ \
{A, B} = x = A ∩ B.
x∈{A,B}

Con ZF 4 podemos inluso definir la unión de dos conjuntos en un caso


especial: Sean A, B y C conjuntos. Definimos la unión de A y B sobre C
como el conjunto

A ∪C B = {y : y ∈ C ∧ (y ∈ A ∨ y ∈ B)}.

Note que si C = ∅, entonces A ∪C B = ∅, sin importar quién sea A y B. Si


A ⊂ C y B ⊂ C, entonces A ∪C B coincide con la unión usual, que aún no
definimos por cierto, pero que conocemos bien de nuestro cursos básicos.
Desde luego, podemos definir también la diferencia

A\B = {x : x ∈ A ∧ x ∈
/ B}.

Pero aquí es necesaria la siguiente aclaración. Si A es un conjunto no vacío,


entonces no podemos decidir, hasta ahora, si {x : x ∈
/ A} es o no un conjunto.
Es necesario establecer un axioma más.
Por otra parte, aunque no hay un conjunto universal, podemos hablar de
universos locales. Un universo local es un conjunto que contiene al resto
de los conjuntos de algún discurso o teoría matemática. El conjunto formado
por la diferencia de un universo local con cualquiera subconjunto A de éste,
se llama complemento y se usa la notación habitual Ac .

ZF 5. Axioma de la Unión. Si A es un conjunto, entonces existe un conjunto


cuyos elementos son exactamente los elementos de los elementos de A:

∀A∃B(∀x(x ∈ B ⇔ ∃y(y ∈ A ∧ x ∈ y))).

Escribimos
B = {x : ∃y(y ∈ A ∧ x ∈ y)}.

Una nota sobre la Teoría Axiomática de Conjuntos


12 2. Axiomas de Zermelo-Fraenkel (ZF)

Decimos que B es la unión del conjunto A. De nueva cuenta, por extension-


alidad, el conjunto B es único. El axioma ZF 5 es constructivo. Usamos la
notación. [ [
B= x o bien B= A.
x∈A

Note que, a diferencia de la intersección, para la unión es necesario un


axioma de existencia, pues no es posible definirla por separación. El siguiente
caso particular es inmediato.
S
Proposición 2.4. La unión vacía es vacía: ∅ = ∅.
Si A y B son conjuntos, entonces definimos la unión de A y B como el
conjunto [
A ∪ B = {A, B}.
Con las técnicas habituales, es fácil mostrar que la unión es asociativa, esto
es, si A, B y C son conjuntos, entonces

(A ∪ B) ∪ C = A ∪ (B ∪ C).

Si A1 ,..., An , son conjuntos, podemos definir sin ambigüedad el conjunto unión


A1 ∪ A2 ∪ · · · ∪ An recursivamente como

A1 ∪ A2 ∪ · · · ∪ An = ((· · · (A1 ∪ A2 ) ∪ A3 ) ∪ · · · ∪ An−1 ) ∪ An .

En particular, podemos definir el conjunto cuyos elementos son los conjuntos


Ai ,
{A1 , A2 , . . . , An } = {A1 } ∪ {A2 } ∪ · · · ∪ {An }.
Note que [
A1 ∪ A2 ∪ · · · ∪ An = {A1 , A2 , ..., An }.
Por lo tanto, dado que en ZF hay infinitos conjuntos, podemos construir con-
juntos finitos de cualquier tamaño, pero hasta aquí no hay manera de asegurar
la existencia de un conjunto infinito.
Con el Axioma de la unión podemos resolver la última controversia pen-
diente en la descripción del Axioma de separación anterior.

Proposición 2.5. Si A es un conjunto, entonces {x : x ∈


/ A} no es conjunto

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 13

Demostración. Si B = {x : x ∈ / B} es un conjunto, entonces A ∪ B es un


conjunto. Pero observe que A ∪ B es la clase de todos los conjuntos, la cual
no es un conjunto. Absurdo.

ZF 6. Infinito. Existe un conjunto I tal que ∅ ∈ I, y si x ∈ I, entonces


x ∪ {x} ∈ I:

∃I(∅ ∈ I ∧ ∀x (x ∈ I ⇒ x ∪ {x} ∈ I)).

Decimos que un conjunto que satisface las condiciones de ZF 6 es inductivo.


(Advertimos que en la Sec. 5 emplearemos el mismo término en otro contexto
pero con un sentido similar.) El axioma ZF 6 afirma entonces que existe un
conjunto inductivo. Asi que ZF 6 es un axioma constructivo. Decimos que el
conjunto x ∪ {x} es el sucesor de x.
Note que cualquier conjunto inductivo tiene como elementos a los conjuntos
 
∅, {∅}, {∅, {∅}}, ∅, {∅}, ∅, {∅} , ...,

los cuales corresponden, respectivamente, a las notaciones usuales

0, 1, 2, 3, ...,

de los números naturales N, idea debida a von Neumann. Volveremos con más
detalle a este conjunto en Secc. 4.
Señalamos que, en particular, un conjunto inductivo es infinito. Por lo
tanto, en ZF hay conjuntos infinitos.
Ciertamente, la afirmación “un conjunto inductivo es infinito” requiere ya
de una prueba formal, lo que significa en efecto que antes debemos formalizar
el sentido de la palabra infinito (o mejor dicho, quitarle cualquier significado),
dentro de la teoría (Secc. 7). Pero al menos por ahora se entiende, aquí sí,
su sentido intuitivo. Pasa lo mismo que cuando pensamos en la pregunta
¿cuántos números hay? Pues una infinidad, pues si n es un número, n + 1
es otro número distinto (mayor, de hecho). Como todo mundo sabe, esta
es la esencia de la formalización matemática del infinito. Por otro lado, la
afirmación “en ZF hay conjuntos infinitos” es una afirmación metamatemática

Una nota sobre la Teoría Axiomática de Conjuntos


14 2. Axiomas de Zermelo-Fraenkel (ZF)

respaldada por la afirmación matemática de que en ZF un conjunto inductivo


es infinito.
El modo estándar para construir el conjunto de los números naturales se
muestra en el enunciado siguiente.

Teorema 2.1. Existe un único conjuno inductivo N tal que N ⊂ I para todo
conjunto inductivo I.

Demostración. El axioma ZF 6 garantiza la existencia de un conjunto


inductivo. Sea J tal conjunto. Por separación definimos

N = {x ∈ J : ∀N ((N ⊂ J ∧ N inductivo) ⇒ x ∈ N )}. (5)

Esto es, N es el conjunto de todos los elementos de J que pertenecen a todos


los conjuntos inductivos contenidos en J. Es claro que ∅ ∈ N, y si x ∈ N,
entonces x ∈ N , para todo subconjunto inductivo N tal que N ⊂ J, de donde
x ∪ {x} ∈ N . Luego, x ∪ {x} ∈ N. Así que N es inductivo. Ahora, sea
I un conjunto inductivo (no necesariamente contenido en J), un argumento
similar muestra que N ∩ I es inductivo. Pero N ∩ I ⊂ N ⊂ J, y por ende,
N ⊂ N ∩ I ⊂ I. Por último, que N es único es obvio desde la propia definición
(5).

Diremos que N es el conjunto de los números naturales. O también que


N es el mínimo conjunto inductivo. Las operaciones aritméticas se definen
entonces de la manera habitual (Secc. 4). De aquí se sigue, con los métodos
usuales, la construcción de los números enteros Z = {... − 1, 0, 1, ...}, de los
racionales Q, los reales R, los espacios euclídeos Rn y Cn , los reales extendidos
R, y un largo etcétera.
Kurt Gödel, en los años 30’s del siglo pasado, demostró que cualquier teoría
axiomática de conjuntos mediante la cual sea posible definir los números natu-
rales y la aritmética usual, posee al menos un enunciado el cual es indecidible
dentro de la teoría, es decir, que no puede probarse ni refutarse, usando úni-
camente el sistema de axiomas de la teoría. Al menos, hasta donde se sabe,
ZF es consistente. Ninguno de sus axiomas ha producido contradición con
algún otro. No obstante, hay proposiciones indemostrables e irrefutables en

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 15

ZF ([15]). Conocemos al menos dos: el Axioma de Elección (Sec. 6) y la


Hipótesis del Continuo (Sec. 8).

ZF 7. Conjunto Potencia. Para cada conjunto A, existe un conjunto cuyos


elementos son exactamente los conjuntos contenidos en A:

∀A∃C(∀B(B ∈ C ⇔ B ⊂ A)).

Como siempre, por extensionalidad tal conjunto es único. Usamos la notación


tradicional ℘(A). Diremos que ℘(A) es el conjunto potencia o conjunto
de partes de A. El axioma ZF 7 es constructivo y es debido a Georg Cantor
quien lo postuló hacia fines del s. XIX.
Combinando ZF 1, ZF 2, ZF 3 y ZF 7, podemos construir el producto carte-
siano del modo siguiente. Primero, si A y B son conjuntos, entonces definimos
el par ordenado
(A, B) = {A, {A, B}}.

Decimos que A es la primera componente o coordenada y B la segunda com-


ponente o coordenada. Es fácil mostrar como es usual el siguiente enunciado.

Proposición 2.6. Si A, B, C y D son conjuntos, entonces (A, B) = (C, D) si, y


sólo si, A = C y B = D. O en términos formales,

∀A∀B∀C∀D((A, B) = (C, D) ⇔ A = C ∧ B = D).

Hay otras formas de definir un par ordenado ([2]), pero la anterior es la


más común.

Una nota sobre la Teoría Axiomática de Conjuntos


16 2. Axiomas de Zermelo-Fraenkel (ZF)

Teorema 2.2 (Producto Cartesiano). Sean A y B conjuntos. Existe entonces un


único conjunto, que denotaremos como A×B, y llamaremos producto carte-
siano de A y B, el cual reúne todos los pares ordenados cuya primera com-
ponente está en A, y la segunda en B. Formalmente:

∀A∀B∃C∀x(x ∈ C ⇔ ∃a∃b(a ∈ A ∧ b ∈ B ∧ x = (a, b) )).

Demostración. El conjunto

C = {x ∈ ℘(℘(A ∪ B)) : ∃a∃b(a ∈ A ∧ b ∈ B ∧ x = (a, b))}

cumple el teorema.

A su vez, por separación este resultado nos permite definir, para cada
fórmula P (x, y) con dos variables libres, y cualesquiera conjuntos A y B, el
conjunto
{(x, y) ∈ A × B : P (x, y)}.
De aquí podemos definir y demostrar, como es usual, todos los resultados sobre
relaciones y funciones. Supondremos conocidos cada uno de ellos, aunque en
la Secc. 5, detallaremos algunas cuestiones referidas a las relaciones de orden.
Es fácil comprobar que A × B no es siempre igual a B × A. No obstante,
la función f (x, y) = (y, x) es una biyección de A × B y B × A, así que tales
productos son isomórficos.
Si A, B y C son tres conjuntos, definimos el producto cartesiano de A, B
y C como
A × B × C = (A × B) × C.
Nuevamente, es fácil comprobar que, aunque (A×B)×C y A×(B ×C) no son
iguales, si son isomórficos, en el sentido de que existe una relación biyectiva
entre ambos.
Recursivamente, para cualesquiera conjuntos A1 ,...,An , definimos el pro-
ducto cartesiano

A1 × · · · × An = (A1 × · · · × An−1 ) × An .
n
Generalmente escribimos ×i=1 Ai . En particular, si Ai = A, para todo i =
1, ..., n, entonces escribimos An .

Una nota sobre la Teoría Axiomática de Conjuntos


2. Axiomas de Zermelo-Fraenkel (ZF) 17

Los elementos de un producto cartesiano se representan como sucesiones


finitas (ai )ni=1 , o bien, como n-tuplas ordenadas (a1 , ..., an ). Puede probarse
que (a1 , ..., an ) = (b1 , ..., bn ) si, y sólo si, ai = bi , para todo i = 1, ..., n.

ZF 8. Regularidad (von Neumann). ∀ x( x 6= ∅ ⇒ ∃y(y ∈ x ∧ x ∩ y = ∅)).

Casi siempre se dice que este axioma es puramente de carácter técnico, o sea,
que no sirve para nada, más que para evitar que ciertos objetos extraños sean
conjuntos, como por ejemplo objetos del tipo x = {x}, o un par de conjuntos
x, y tales que
x = {y} y y = {x},

o cosas peores ([6]). El axioma ZF 8 postula que sólo existen conjuntos que
se llaman regulares. No proporciona nuevos conjuntos, y por tanto es de
carácter especificativo.
Enunciamos en seguida las consecuencias más relevante de ZF 8.

Teorema 2.3. Sea A un conjunto. Entonces asumiendo ZF 8, A ∈


/ A, es decir,
ningún conjunto pertenece a sí mismo.

Demostración. Por ZF 8, A ∩ {A} = ∅. Luego, si A ∈ A, entonces A ∈


A ∩ {A}. Una contradicción.

Teorema 2.4. Sean A y B conjuntos. Asumiendo ZF 8, si A ∈ B, entonces


B∈
/ A.
Demostración. Supongamos que A ∈ B ∈ A. Por ZF 8, existe x en {A, B}
tal que x ∩ {A, B} = ∅. Pero si x = A, entonces B ∈ A ∩ {A, B} = ∅, y si
x = B, entonces A ∈ B ∩ {A, B} = ∅. Ambos casos son absurdos.

Corolario 2.2. Asumiendo ZF 8, si A es un conjunto, entonces

{x : x ∈ A ∧ x ∈
/ x} = A.

Otra consecuencia inmediata de ZF 8 es que N no es un número natural.


Sin embargo, esto puede mostrarse sin recurrir a ZF 8 (Corolario 4.5).
Muchos matemáticos consideran que ZF 8 es completamente inocuo, pues
en realidad no es necesario excluir de la teoría conjuntos no regulares. Basta

Una nota sobre la Teoría Axiomática de Conjuntos


18 3. Esquema de Reemplazo (o Sustitución)

con no tomarlos en cuenta, o maś bien, hacer como si no existieran, después


de todo, no parece haber ninguna pérdida ni ganancia con ellos o sin ellos.
Como sea, si aceptamos ZF 8, puede probarse que todos los conjuntos
pueden formarse únicamente a partir del vacío, junto con el resto de los ax-
iomas y el uso de un número arbitrario de veces del operador ℘. Lo que
esto quiere decir es que si rastreamos los elementos de un conjunto dado, y a
su vez los elementos de dichos elementos, y así sucesivamente, terminaremos
econtrando al conjunto vacío ([6]).

3 Esquema de Reemplazo (o Sustitución)


En realidad, solamente los axiomas ZF 1-ZF 7, junto con AE (Secc. 6), son
debidos a Zermelo ([11]). Con ellos, podemos construir conjuntos ciertamente
muy grandes. Por ejemplo, si A es un conjunto infinito, entonces consideramos
el conjunto ℘(A), y después ℘(℘(A)), y así sucesivamente. Sin embargo, el
esquema de axiomas ZF 1-ZF 7 no es suficiente para construir conjuntos “de-
masiado” grandes. Por ejemplo, si buscamos un conjunto X tal que N ∈ X y
con la propiedad
∀A (A ∈ X ⇒ ℘(A) ∈ X),
entonces el sistema de ZF 1-ZF 7 no es suficiente para definir tal conjunto ([3],
p. 509).
Para salvar este problema, y algunos otros relacionados con la teoría de
los números transfinitos (ordinales y cardinales), se introduce un axioma más,
conocido como Axioma del Reemplazo o Sustitución, postulado por Fraenkel
hacia 1922. Cuándo este axioma se incluye, entonces el Axioma de Separación
(ZF 4) se prueba como un teorema.
Hay un cierto debate sobre si el Axioma del Reemplazo es realmente nece-
sario fuera de la teoría de los números ordinales transfinitos ([6]). No abun-
daremos aquí en ello.

ZF 9. Esquema de Reemplazo. Supongamos que P (x, y) es una propiedad referida


a conjuntos con dos variables libres tal que

∀x∀y∀z(P (x, y) ∧ P (x, z) ⇒ y = z). (6)

Una nota sobre la Teoría Axiomática de Conjuntos


3. Esquema de Reemplazo (o Sustitución) 19

Entonces la siguiente fórmula es un axioma:



∀A∃B∀y y ∈ B ⇔ ∃x(x ∈ A ∧ P (x, y)) . (7)

De nuevo se trata, en efecto, de un esquema axiomático constructivo. Usamos


la notación (para cada conjunto A y P particular),

B = {y : ∃x(x ∈ A ∧ P (x, y))}.

En palabras, la condición (6) significa que para cada conjunto x hay un único
conjunto y el cual satisface P (x, y). Esto establece en particular una relación
funcional de la clase de todos los conjuntos en sí misma. De modo que el
esquema axiomático del reemplazo dicta que la imagen de cualquier conjunto
bajo una relación funcional es un conjunto. Precisamos esta idea en el siguiente
enunciado.

Teorema 3.1. Sea ϕ una relación funcional de la clase de todos los conjuntos
en sí misma, esto es, ϕ aplica a cada conjunto x en un conjunto ϕ(x), tal que
si ϕ(x) 6= ϕ(y) entonces x 6= y. Si A es un conjunto entonces la clase

ϕ(A) := {y : ∃x(x ∈ A ∧ y = ϕ(x))},

es un conjunto.

Demostración. Basta definir P (x, y) ≡ y = ϕ(x) y aplicar el esquema del


reemplazo.

Naturalmente, un conjunto A es un “conjunto de conjuntos” (en ZF sólo


hay conjuntos), o mejor dicho una clase de conjuntos. Cuando queremos
remarcar este hecho, o cuando es relevante el tipo específico de conjuntos
que pertenecen a este conjunto, preferimos usar una notación caligráfica A y
describir los elementos de A con letras mayúsculas. Esta misma notación es
adoptada en general para clases de conjuntos (propias o no).
Si una clase A es un conjunto, la unión de A está definida (por el axioma
de la unión ZF 5) como el conjunto
[
A = {y : ∃A(A ∈ A ∧ y ∈ A)}. (8)
A∈A

Una nota sobre la Teoría Axiomática de Conjuntos


20 3. Esquema de Reemplazo (o Sustitución)

S
La notación A es también común.
En este caso (cuando la clase A es un conjunto) podemos establecer una
biyección entre el conjunto A en sí mismo, si aplicamos cada conjunto A ∈ A
el conjunto A mismo. En general, decimos que una clase de conjuntos A
es una clase indexada si existe un conjunto I y una relación funcional ϕ
sobreyectiva de I en A. Por lo tanto, si una clase A es un conjunto, entonces
es una clase indexada.
La cuestión es si la el recíproco es cierto. Es decir, si A es una clase
indexada, entonces ¿es un conjunto? Esta pregunta no tiene respuesta en el
sistema de axiomas ZF 1-ZF 8.
Veamos con más detalle porqué: Sea I un conjunto y sea ϕ una relación
funcional sobreyectiva de I en A. Preferimos usar la notación ϕ(i) = Ai , para
cada i ∈ I. La clase A tiene también la descripción

A = {A : ∃i(i ∈ I ∧ A = Ai )}. (9)

Note entonces que no es posible afirmar desde ningún axioma de ZF 1-ZF 8,


que esta clase sea un conjunto (ni siquiera por separación).
Por otro lado, el lector puede verificar rápidamente que la aplicación

A
x si x ∈ I,
x 7→ ϕ(x) :=
∅ si x ∈
/ I,

define una relación funcional de la clase de todos los conjuntos en sí misma.


Luego, si asumimos el Esquema del reemplazo, entonces del Teorema 3.1, la
clase
A = ϕ(I) = {A : ∃i(i ∈ I ∧ A = Ai )}

es un conjunto. Sintetizamos lo anterior en el siguiente enunciado.

Proposición 3.1. Una clase A es un conjunto si, y sólo si, es una clase indexada.
Generalmente, para simplificar la descripción (9), preferimos la notación
idexada A = {Ai }i∈I . Entonces, de la igualdad (8), la unión de A es el
conjunto [
Ai = {y : ∃i(i ∈ I ∧ y ∈ Ai )}.
i∈I

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 21

S∞ Sn
También usamos {Ai }∞ n
i=1 , {Ai }i=1 , i=1 Ai , i=1 Ai , o notaciones parecidas
cuando es el caso.
Queda aún una pregunta en el aire. ¿Es posible definir (como conjunto)
la unión de una clase propia? La respuesta es negativa.

Proposición 3.2. Sea A una clase propia (i.e. una clase de conjuntos que no
es conjunto, o equivalentemente, una clase que no está contenida en ninguna
otra clase). La clase B = {y : ∃A(A ∈ A ∧ y ∈ A)} no es un conjunto.
Demostración. Supongamos que B es un conjunto. Entonces A ∈ ℘(B)
para todo A ∈ A. Esto es A ⊂ ℘(B). Luego A es un conjunto (pues está
contenido en otro conjunto). Contradicción.

4 Los números naturales N


Construir los números naturales es casi siempre el siguiente paso, dentro del
modelo estándar de la teoría de los conjuntos. Describimos aquí, de forma
completa pero breve esta construcción, junto con las definiciones usuales de
orden y las operaciones aritméticas también usuales.
Exponemos también los principios del buen orden y el de recursión, los
cuales son los resultados más relevantes ligados a N. Pretendemos que esta
exposición sirva de introducción para la secciones siguientes, donde general-
izamos los conceptos tratados.
Hay otras formas de introducir los números naturales, por ejemplo el sis-
tema axiomático de Dedekind-Peano, o incluso desde un esquema axiomático
para los números reales R. Las pruebas de algunos de las afirmaciones pre-
sentadas aquí pueden variar según el modelo, pero en esencia, las ideas son
iguales.

4.1 Orden y Principio de Inducción en N


Recordemos que un conjunto I es inductivo, si ∅ ∈ I, y si x ∈ I entonces
x ∪ {x} ∈ I. Decimos que x ∪ {x} es el sucesor de x. Recordemos también
que el conjunto de los números naturales N, es el conjunto inductivo más
“pequeño”.

Una nota sobre la Teoría Axiomática de Conjuntos


22 4. Los números naturales N

Por tanto, los siguientes conjuntos son elementos de N:

0 := ∅,
1 := 0 + 1 = 0 ∪ {0} = {0},
2 := 1 + 1 = 1 ∪ {1} = {0, 1}, (10)
3 := 2 + 1 = 2 ∪ {2} = {0, 1} ∪ {2} = {0, 1, 2},
.. .. ..
. . .

Note que cada número natural es el conjunto de sus antecesores. Los


números naturales es un conjunto de conjuntos anidados.
Intuitivamente, N debería estar completo únicamente con estos conjuntos.
Es decir, N debería ser el conjunto
{0, 1, 2, ...}. (11)
¿Cómo debemos probar esta idea intuitiva? En primer lugar debemos
probar, desde la teoría axiomática de los conjuntos ZF, el esquema axiomático
de Dedekind-Peano, para la fundación de N. Es lo que nos proponemos hacer
a continuación.
En todo lo que sigue, admitimos como definición 0 := ∅ y 1 := {0}.
Denotaremos n + 1 el sucesor de un natural n, esto es, definimos n + 1 :=
n ∪ {n}, para todo n ∈ N. Aunque en la Proposición 4.2, una vez definidas
las operaciones aritméticas en N, quedará justificada esta convención. En
particular, 0 + 1 = 1.

Teorema 4.1 (Axiomas de Dedekind-Peano para N). Sea N el conjunto de los


números naturales. Entonces
(a) 0 ∈ N.

(b) Si n ∈ N entonces el sucesor de n es también un número natural, i.e.


n + 1 = n ∪ {n} ∈ N.

(c) El número natural 0, no es el sucesor de ningún número natural.

(d) Si n y m son números naturales y n + 1 = m + 1, entonces n = m.

(e) Principio de Inducción en N (PI-N). Si N es un subconjunto de N tal que

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 23

(i) 0 ∈ N ,
(ii) Si n ∈ N entonces n + 1 ∈ N ,

entonces N = N.

Demostración. Las propiedades (a), (b), (c) y (e) son inmediatas. Para
probar (d), supongamos que n y m son números naturales tales que n + 1 =
m + 1. Si n 6= m, entonces sin pérdida de generalidad podemos suponer que
existe x ∈ m tal que x ∈
/ n. Desde luego, x ∈ m + 1 = n + 1, y por lo tanto
x = n. Esto es, n ∈
/ m + 1. Contradicción.

En segundo lugar, hay que mostrar ahora que todo natural es igual a cero,
o bien es el sucesor de algún otro número natural.

Corolario 4.1. Si m es un número natural, entonces m = 0, o bien m = n + 1


para algún único n ∈ N. En el segundo caso, usamos la notación n = m − 1.

Demostración. Definimos

N = {m ∈ N : m = 0 ∨ ∃n ∈ N(m = n + 1)}

(por ZF 4 y ZF 5). Es fácil ver que N es inductivo. En consecuencia N = N y


nuestra afirmación queda probada.

Así pues, nuestra intuición acerca de la forma de N quedá justificada.


Admitimos entonces la notación (11) para N.
Pasamos ahora a tratar el Principio de Recursión. Ya hemos dicho que
este principio es uno de los resultados más importantes sobre N. Con éste
podemos definir las operaciones aritméticas usuales en N, pero también es
una herramienta útil en diferentes contextos, pues permite definir sucesiones de
números, conjuntos, funciones, etc. Para probar dicho principio, nos valdremos
del Principio de Inducción. Pero para llegar a tal fin hay que atravesar ciertos
pasos. Primero hay que definir un orden en N. Para este fin inmediato,
hacemos las siguientes observaciones, consecuencias también de PI-N.

Corolario 4.2. Sea m un número natural. Si n ∈ m, entonces n ⊂ m.

Una nota sobre la Teoría Axiomática de Conjuntos


24 4. Los números naturales N

Demostración. Por ZF 4, definimos

N = {m ∈ N : ∀n(n ∈ m ⇒ n ⊂ m)},

Probaremos que N es inductivo. Por vacuidad ∅ ∈ N . Sea m ∈ N y sea


n ∈ N tal que n ∈ n + 1 = m ∪ {m}. Entonces n ∈ m, y en cuyo caso,
por hipótesis n ⊂ m; o bien n = m. En cualquier caso, n ⊂ m + 1. Luego,
m + 1 ∈ J y por tanto J es inductivo como queríamos. Así N = N por (PI-N),
y nuestro corolario queda probado.

La propiedad del corolario anterior se conoce como transitividad de los


números naturales.

Corolario 4.3. Sean n y m números naturales. Entonces n ∈ m si, y sólo si,


n + 1 ∈ m + 1.

Demostración. Sólo probaremos la implicación necesaria, la otra se deja al


lector como ejercicio. Definimos

N = {m ∈ N : ∀ n ∈ N(n ∈ m ⇒ n + 1 ∈ m + 1)}.

Mostraremos que N es inductivo, de donde por PI-N, N = N. Por vacuidad,


0 = ∅ ∈ N . Sea m ∈ N y sea n ∈ N tal que n ∈ m + 1 = m ∪ {m}. Entonces,
n ∈ m o bien n = m. Si n ∈ m, por hipótesis n + 1 ∈ m + 1. Si n = m, desde
luego n + 1 = m + 1. En cualquier caso, n + 1 ∈ (m + 1) + 1. Lo que prueba
m + 1 ∈ N . En consecuencia N es inductivo como queríamos.

Corolario 4.4. Si n es un número natural, entonces n ∈


/ n.

Demostración. Por supuesto, esto es inmediato si asumimos ZF 8 (teo-


rema...), pero puede probarse fácilmente sin recurrir a tal axioma. Sea N =
{n ∈ N : n ∈/ n}. Claramente 0 ∈ N y si n ∈ N , entonces n + 1 ∈ N , si no,
i.e. n + 1 ∈ n + 1, por el corolario anterior, n ∈ n, lo cual es contradictorio
con la hipótesis.

Luego, que N no es un número natural es una consecuencia inmediata del


corolario anterior, sin recurrir a ZF 8.

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 25

Corolario 4.5. N ∈
/ N.
Por último, probamos que la relación ∈ es tricotómica en N, sin ZF 8.

Corolario 4.6. Si n y m son números naturales, entonces sucede una y solo una,
de las siguientes: n ∈ m, m ∈ n o bien n = m.

Demostración. Supongamos que n ∈ m y m ∈ n. Entonces n ⊂ m y m ⊂ n.


De donde n = m y por tanto n ∈ n, lo cual es imposible. Es claro que n = m
excluye las otras dos.

Introducimos ahora la relación de orden usual ≤ en N:

∀n ∈ N ∀m ∈ N(n ≤ m ⇔ (n = m ∨ n ∈ m)).

El orden usual estricto < en N:

∀n ∈ N ∀m ∈ N(n < m ⇔ n ∈ m).

O de otra forma:

∀n ∈ N ∀m ∈ N(n < m ⇔ (n ≤ m ∧ n 6= m)).

El teorema que sigue es inmediato.

Teorema 4.2. El orden usual ≤ sobre N es un orden parcial. Esto es,

(i) ≤ es reflexiva:
∀ n ∈ N(n ≤ n).

(ii) ≤ es antisimétrica:

∀n ∈ N ∀m ∈ N(n ≤ m ∧ m ≤ n ⇒ m = n).

(iii) ≤ es transitiva:

∀n ∈ N ∀m ∈ N ∀k ∈ N(n ≤ m ∧ m ≤ k ⇒ n ≤ k).

Por otra parte, < es un orden parcial estricto, es decir,

Una nota sobre la Teoría Axiomática de Conjuntos


26 4. Los números naturales N

(iv) < es antireflexiva:


∀ n ∈ N(n ∈
/ n).

(v) < es transitiva:

∀n ∈ N ∀m ∈ N ∀k ∈ N(n < m ∧ m < k ⇒ n < k).

Además,

(vi) ∀n ∈ N ∀m ∈ N ∀k ∈ N(n ≤ m < k ∧ n < m ≤ k ⇒ n < k).

Con el orden parcial estricto podemos caracterizar cada número natural,


como el conjunto de sus antecesores (i.e. como un segmento inicial).

Proposición 4.1. Para cada n ∈ N, n = {m ∈ N : m < n}.

Demostración. Definimos

N = {n ∈ N : n = {m ∈ N : m < n}}.

Es inmediato que 0 ∈ N . Sea n ∈ N . Si m ∈ N tal que m < n + 1, entonces


(por definición) m ∈ n + 1. Inversamente, si m ∈ n + 1 = n ∪ {n}, entonces
m ∈ n o bien m = n, en cualquier caso, m < n + 1. Luego, n + 1 ∈ N y N es
inductivo. Por lo tanto N = N y nuestra afirmación queda probada.

Esto último quiere decir que N es un conjunto transitivo, esto es, si n ∈ N


entonces n ⊂ N.

4.2 Principio del Buen Orden y Recursión en N


Ahora revisamos dos principios fundamentales y equivalentes a PI-N. Primero
acordamos la terminología.

Definición 4.1. Si A ⊂ N, entonces decimos que m ∈ N es el elemento míni-


mo (o solo mínimo) de A, si m ∈ A y m ≤ n, para todo n ∈ A. Decimos que
A tiene mínimo, si existe el elemento mínimo de A. N

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 27

Observación 4.1. Es claro que la propiedad ser mínimo de A ⊂ N está deter-


minada unívicamente. Es decir, solo puede haber un único elemento m de
A ⊂ N, tal que m ≤ n para todo n ∈ A. N

Ejemplo 4.1. 0 es el mínimo de N. De hecho, 0 es el mínimo de cualquier


número natural n 6= 0.

Principio del Buen Orden sobre N (PBO-N). Sobre N, el orden parcial usual ≤
es un buen orden, esto es, si A ⊂ N y A 6= ∅, entonces A tiene mínimo.

En el teorema siguiente no sólo probamos la validez de este principio, sino que


además probamos que es equivalente al principio de inducción.

Teorema 4.3. PI-N es equivalente a PBO-N.

Demostración. Supongamos PI-N. Sea n ∈ N. Probabremos primero por


inducción que todo subconjunto no vacío del conjunto n tiene un elemento
mínimo. Sea N el subconjunto de todos los números naturales n, tales que si
A ⊂ n, no vacío, entonces A tiene mínimo. Claramente 0 ∈ N , por vacuidad.
Supongamos que n ∈ N . Sea A un subconjunto no vacío de n + 1. Si A
consiste del único elemento n, entonces éste es el mínimo de A. En otro caso,
el conjunto A ∩ n ⊂ n es no vacío, y por lo tanto tiene un mínimo (dado
que n ∈ N , por hipótesis), el cual es por supuesto el mínimo de A. Luego
n + 1 ∈ N y así N = N. En general, sea A ⊂ N un subconjunto no vacío. Sea
n ∈ A y consideremos el conjunto no vacío B = A ∩ (n + 1). El conjunto B
tiene mínimo. El mínimo de B, es también el mínimo de A.
Inversamente, supongamos PBO-N. Sea N ⊂ N un conjunto inductivo,
esto es, 0 ∈ N y si n ∈ N entonces n + 1 ∈ N . Supongamos que N\N 6= ∅.
Sea m el mínimo de N\N . Notamos que m ∈ / N . Pero entonces m − 1 ∈ N ,
de donde m ∈ N , lo cual es absurdo. Así, N = N.

Como aplicación, extendemos el principio de inducción en N a una versión


un poco más profunda.

Teorema 4.4. Sea N ⊂ N no vacío tal que n + 1 ∈ N siempre que n ∈ N .


Entonces, para todo m ∈ N , {n ∈ N : m ≤ n} ⊂ N . Los conjuntos son
iguales si, y sólo si, m = min N .

Una nota sobre la Teoría Axiomática de Conjuntos


28 4. Los números naturales N

Demostración. Sea m ∈ N . Supongamos que el conjunto

N 0 = {n ∈ N : m < n ∧ n ∈
/ N}

es no vacío. Sea n∗ el mínimo de N 0 . Note que n∗ > 0. Entonces n∗ − 1 ∈ N ,


y por hipótesis n∗ ∈ N . Contradicción.

Del principio del buen orden se sigue la clásica y útil herramienta de


recursión. Antes conviene introducir formalmente la aplicación sucesor
s : N → N, definida como s(n) = n ∪ {n}, o en la notación usual s(n) = n + 1,
para todo n ∈ N. (Note que s es inyectiva y s(N) = N\{0}).

Teorema 4.5 (Principio de Recursión en N). Sea A un conjunto no vacío y sea a un


elemento de A. Sea G (A) la clase de todas las funciones cuyo dominio es algún
número natural n, y cuyo rango es el conjunto A. Supongamos que γ es una
función cuyo dominio es la clase G (A) y cuyo rango es el conjunto A. Entonces
existe una única función g : N → A, tal que g(0) = a y g(s(n)) = γ(g|n), para
todo n ∈ N, donde g|n es la restricción de g al conjunto n.
La prueba es un corolario del Teorema 5.2 maś general, por lo que nos
ahorramos aquí hacer una prueba directa de este resultado. En las referencias
(e.g. [2]) el lector puede encontrar diversas pruebas de este hecho, y también
diferentes versiones. Como una aplicación importante, definiremos las opera-
ciones aritméticas usuales en N. Antes, enunciamos y probamos otra de las
formas usuales del Principio de Recursión.

Corolario 4.7. Sea A un conjunto no vacío y sea a ∈ A. Si h es una función de


A en A, entonces existe una única función g de N en A tal que g(0) = a y
g(s(n)) = h(g(n)), para todo n ∈ N.

Demostración. Definimos la aplicación γ : S (A) → A, tal que si f ∈ S (A)


y n ∈ N tal que el dominio de f es el conjunto n + 1 = {0, ..., n}, entonces
γ(f ) = h(f (n)). Del Principio de Recursión se sigue el resultado.

Definimos las operaciones aritméticas del siguiente modo:


Para la suma, consideremos la aplicación sucesor s de N en N. Fijamos
m ∈ N. Por el corolario anterior, existe una aplicación m+ : N → N tal que

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 29

m + (0) = m y m + (s(n)) = s(m + (n)), para todo n ∈ N. Definimos la suma


como la aplicación binaria + : N × N → N, tal que para todo n y m en N,
m + n = m + (n).
Para el producto, nuevamente fijamos m ∈ N y consideramos la función
m+ de N en N. Por el corolario anterior, existe una aplicación m ∗ : N → N
tal que m ∗ (0) = 0 y m ∗ (s(n)) = m + (m ∗ (n)), para todo n ∈ N. Definimos
el producto como la aplicación binaria ∗ : N × N → N, tal que para todo n y
m en N, m ∗ n = m ∗ (n). Escribimos mn en lugar de m ∗ n.
De aquí se siguen, como es usual, las típicas propiedades de la suma y
del producto: conmutatividad, asociatividad y las reglas distributivas. La
notación n + 1 para el sucesor de un natural n queda también justificada.

Proposición 4.2. Si n ∈ N, entonces n + 1 = n ∪ {n}.

Demostración. Por definición 1 = {0} = 0 ∪ {0} = s(0). Si s(n) = n ∪ {n}


es la aplicación sucesor en N, n+1 = n+s(0) = s(n+0) = s(n) = n∪{n}.

Una propiedad importante relacionada a la propiedad de asociatividad de


la suma y la afirmación del Corolario 4.1, es la siguiente.

Lema 4.1. Si n y m son números naturales tal que m 6= 0, entonces

(n + m) − 1 = n + (m − 1).

Demostración. Usando la notación de la función sucesor, s((n + m) − 1) =


n + m (Corolario 4.1), pero s(n + (m − 1)) = n + s(m − 1) = n + m.

Lema 4.2. Para cualesquiera números naturales n y m, n < m si, y sólo si,
n + 1 ≤ m, o equivalentemente, n ≤ m − 1, donde m − 1 es el único número
natural tal que m = (m − 1) + 1 (ver Corolario 4.1).

Demostración. Definimos

N = {m ∈ N : ∀n ∈ N(n < m ⇒ n + 1 ≤ m)}.

Por vacuidad, 0 ∈ N . Sea m ∈ N y sea n ∈ N tal que n < m + 1. Si n = 0,


entonces n + 1 = 1 ≤ m + 1; si no es así, entonces m + 1 ∈ 1 = {0}, y por
lo tanto m + 1 = 0, es decir, 0 es el sucesor de m, lo cual es contradictorio.

Una nota sobre la Teoría Axiomática de Conjuntos


30 4. Los números naturales N

Si n = (n − 1) + 1, entonces n − 1 < m, y por hipótesis n ≤ m, por lo tanto


n + 1 ≤ m + 1 (Corolario 4.3). Luego, m + 1 ∈ N y en consecuencia N es
inductivo y N = N. El resto de la prueba es análoga.

En seguida probamos cómo el orden usual en N tiene una típica y cómoda


representación, la cual es generalmente usada como definición.

Proposición 4.3. Sean n y m números naturales. Entonces n ≤ m si, y sólo si,


existe k ∈ N tal que m = n + k. Si n < m, entonces k > 0, e inversamente, si
k > 0, entonces n < m.

Demostración. Definimos N = {k ∈ N : n ≤ n + k}. Obviamente 0 ∈ N .


Sea k ∈ N . Entonces, del Corolario 4.3, s(n) ≤ s(n + k), y por otra parte,
es claro que n < s(n), de este modo, n < s(n + k) = n + s(k), por lo tanto
s(k) ∈ N . En consecuencia N = N y la condición suficiente queda probada.
Ahora, supongamos que n ≤ m. Si n = m entonces basta elegir k = 0.
Supongamos n < m. Note que m ≤ n + m (por lo anterior), por lo tanto,
el conjunto {k ∈ N : m ≤ n + k} es no vacío, luego, existe k∗ ∈ N mínimo
de tal conjunto. Supongamos m < n + k∗ . Entonces (Lemas 4.1 y 4.2)
m ≤ (n + k∗ ) − 1 = n + (k∗ − 1), lo cual es imposible. Por lo tanto m = n + k∗ ,
lo que prueba la condición necesaria.

4.3 Conjuntos Finitos


Definición 4.2. Si existe una aplicación inyectiva de un conjunto A en algún
número natural n, entonces decimos que A es finito. Un conjunto infinito es
un conjunto que no es finito. N

Cada número natural n es finito. Si B es finito y A ⊂ B entonces A es


finito. Puede probarse fácilmente que uniones y productos cartesianos finitos
de conjuntos finitos son conjuntos finitos. Desde luego, esperamos que N sea
infinito y que un conjunto finito puede ponerse en relación biyectiva con algún
número natural n. Para probarlo hay que hacer algún camino.

Definición 4.3. Sea A ⊂ N no vacío. Decimos que m ∈ N es el elemento


máximo (o solo máximo) de A, si m ∈ A y n ≤ m para todo n ∈ A.

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 31

Decimos que A tiene máximo si existe el máximo de A. N

Observación 4.2. Es claro que la propiedad ser máximo de A ⊂ N está deter-


minada unívicamente. Es decir, solo puede haber un único elemento m de
A ⊂ N, tal que n ≤ m para todo n ∈ A. N

Proposición 4.4. Si n ∈ N y n 6= 0, entonces n − 1 es el máximo de n.

Demostración. Obviamente n − 1 ∈ n. Ahora, si existe m ∈ N tal que


n − 1 < m ≤ n, entonces n ≤ m ≤ n (Lema 4.2), y por tanto n = m, lo cual
es imposible (pues n ∈
/ n).

Lema 4.3. Si n y m son números naturales y n < m, entonces no existe apli-


cación inyectiva alguna de m en n.

Demostración. Definimos el conjunto

N = {m ∈ N : ∀n ∈ N(n < m ⇒6 ∃f : m → n inyectiva )}.

Probaremos que N es inductivo, con lo cual N = N y así la afirmación queda


probada. Por vacuidad 0 ∈ N . Sea m ∈ N y sea n ∈ N tal que n < m + 1.
Si n = 0 es claro que no existe aplicación inyectiva alguna de m + 1 en n.
Si n > 0, entonces n − 1 < m (Lema 4.2). Por lo tanto, por hipótesis, no
existe aplicación inyectiva alguna de de m en n − 1. Ahora, supongamos que
f : m+1 → n es una aplicación inyectiva. Podemos suponer que f (m) = n−1.
Si no, entonces tomamos (el único) k ∈ m tal que f (k) = n − 1, y definimos
f 0 : m + 1 → n − 1 dada por

n − 1 si i = m


f 0 (i) = f (m) si i = k


f (i) si i 6= m, i 6= k.

Entonces f 0 es una aplicación inyectiva de m + 1 en n, tal que f 0 (m) = n − 1.


Luego, la restricción f |m es una aplicación inyectiva de m en n\(n−1) = n−1,
lo cual es imposible. Luego, m + 1 ∈ N y N es inductivo como queríamos.

Teorema 4.6. N es infinito.

Una nota sobre la Teoría Axiomática de Conjuntos


32 4. Los números naturales N

Demostración. Si N es finito, entonces para algún n ∈ N, existe una apli-


cación inyectiva f de N en n. Luego, si m ∈ N y n < m (por ejemplo
m = n + 1), entonces la restricción f |m de f a m es una aplicación inyectiva
de m en n, lo cual es imposible.

Ahora podemos enunciar algunas otras caraterizaciones de los conjuntos


finitos. Nos valemos del siguiente lema.

Lema 4.4. Sea m ∈ N. Si M ⊂ m, entonces existe un único número natural


n ≤ m y una aplicación biyectiva de M en n. Si M es un subcojunto propio
de m, entonces n < m.

Demostración. Definimos el conjunto

N = {m ∈ N : ∀M ⊂ m ⇒ ∃ n ≤ m ∧ f : M → n biyectiva}.

Claramente 0 ∈ N . Sea m ∈ N y sea M ⊂ m + 1. Deseamos probar que para


algún n ≤ m + 1 existe una aplicación biyectiva de M en n. Si M = m + 1
entonces la función identidad de m + 1 en sí mismo es biyectiva. Supongamos
que M es un subconjunto propio de m + 1. Si m ∈ / M , entonces de hecho
M ⊂ m y por hipótesis existe n ≤ m < m + 1 y una aplicación biyectiva
de M en n. Si m ∈ M , tomamos algún k ∈ m tal que k ∈ / M . Definimos
M 0 = (M \{m}) ∪ {k} ⊂ m. Por hipótesis existe n ≤ m y una aplicación
biyectiva f de M 0 en n. Sea g : M → M 0 dada por

i si i 6= m
g(i) =
k si i = m.

Entonces g ◦ f es una aplicación biyectiva de M en n. Luego, m + 1 ∈ N y


N es inductivo. En consecuencia N = N y el lema en su parte de existencia
queda probado.
Para probar unicidad, supongamos que f1 : M → n1 y f2 : n2 → M
son aplicaciones biyectivas, donde ni ≤ m, i = 1, 2. Entonces f1 ◦ f2 es una
aplicación biyectiva de n2 en n1 , por lo tanto, n1 = n2 (Lema 4.3).

Teorema 4.7. Un conjunto A es finito si, y sólo si, existe una biyección de A
en algún único número natural n. Decimos que n es el cardinal de A.

Una nota sobre la Teoría Axiomática de Conjuntos


4. Los números naturales N 33

Demostración. Para algún m ∈ N existe una aplicación inyectiva de A


en m, por lo tanto, para algún n ≤ m, existe una aplicación biyectiva de
f (A) ⊂ m en n, la composición de tales funciones es una biyección de A en n.
Supongamos ahora que f : A → n1 y g : n2 → A son aplicaciones biyectivas,
entonces f ◦ g es una aplicación biyectiva de n2 en n1 , en consecuencia, por el
Lema 4.3, n1 = n2 .

Corolario 4.8. Si A y B son conjuntos finitos tales que A tiene cardinal n y B


tiene cardinal m, y si B ⊂ A, entonces m ≤ n.

Demostración. Sea f : A → n una aplicación biyectiva. Entonces existe un


único m0 ≤ n y una biyección g : f (B) → m0 . Por lo tanto, g ◦ f |B es una
biyección de B en m0 , donde f |B es la restricción de f a B, y en consecuencia,
por unicidad, el cardinal de B es m0 , i.e., m = m0 .

Ser finito es entonces una característica que depende únicamente del propio
conjunto.

Teorema 4.8. Un conjunto A es finito si, y sólo si, A no puede aplicarse inyec-
tivamente en ningún subconjunto propio de sí mismo.

Demostración. Sea B algún subconjunto de A y sea f : A → n una apli-


cación biyectiva. De la prueba del corolario anterior, el cardinal de B es igual
al cardinal de f (B). Sea m este cardinal. Entonces m ≤ n. Si B es un
subconjunto propio de A, entonces f (B) es un subconjunto propio de n, y
en consecuencia m < n. Ahora, si existe una aplicación inyectiva A en B,
entonces existe una aplicación inyectiva de n en m, lo cual es imposible.

Note que la aplicación f (n) = 2n es una correspondencia biyectiva de N


en un subconjunto propio de N. Esta es otra manera de verificar que N es
infinito.

4.4 Conjuntos numerables


Definición 4.4. Un conjunto A es numerable si existe una correspondencia
biyectiva de A en N. Un conjunto A es contable si es o bien finito o bien
numerable N

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
34 Recursión

Los números naturales N, enteros Z, los enteros positivos Z+ , lo números


racionales Q, son todos conjuntos numerables. Puede probarse que de hecho,
una unión finita de conjuntos numerables (contables) es numerable (contable),
lo mismo si se trata de productos cartesianos finitos de conjuntos numerables
(contables). En particular los conjuntos Z × Z, Z+ × Z+ , {0} × Z, {x} × Q,
Q × Q, son numerables. Note entonces que los conjuntos numerables son
conjuntos infinitos. ¿Será que la afirmación inversa es válida? Aún no podemos
decidir esta cuestión (ver Secc. 7).

Proposición 4.5. Son equivalentes.

(i) A es un conjunto contable.

(ii) Existe una correspondencia inyectiva de A en N.

Demostración. Si A es contable (finito o numerable), es obvio que hay una


correspondencia inyectiva de A en N. Inversamente, sea f : A → N una
correspondencia inyectiva. Definimos

M = {m ∈ N : ∀n(n ∈ f (A) ⇒ n ≤ m)}.

Si M 6= ∅, entonces A es un conjnto finito. Si M = ∅, entonces para cada


m ∈ N, el conjunto Nm = {n ∈ N : n ∈ f (A) ∧ m < n} ⊂ f (A) es no vacío.
Por el principio de recursion del Corolario 4.7, existe una única aplicación
g : N → f (A) tal que g(0) = min N0 y g(n + 1) = min Ng(n) , para todo n ∈ N.
Pero observe que g definine una correspondencia biyectiva, por lo tanto la
aplicación g −1 ◦ f : A → N es biyectiva y N es numerable.

5 Relaciones de orden y Principio de


Inducción Transfinita. Recursión
En esta sección generalizamos los principios de inducción y del buen orden,
tratados antes en N. Recordemos que una relación sobre un conjunto X, es
cualquier subconjunto del producto cartesiano X × X.

Definición 5.1. Una relación ≤ sobre un conjunto X es un orden parcial si

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
Recursión 35

(i) ≤ es reflexiva:
∀ x ∈ X(x ≤ x).

(ii) ≤ es antisimétrica:

∀ x ∈ X ∀ y ∈ X(( x ≤ y ∧ y ≤ x) ⇒ y = x).

(iii) ≤ es transitiva:

∀ x ∈ X ∀ y ∈ X ∀ z ∈ X(( x ≤ y ∧ y ≤ z) ⇒ x ≤ z).

Decimos que X es un conjunto parcialmente ordenado por ≤. En este caso,


definimos el orden parcial estricto <, como

∀ x ∈ X ∀ y ∈ X : x < y ⇔ x ≤ y ∧ x 6= y.

Decimos que un orden parcial ≤ es lineal o total si para todo x, y ∈ X,


sucede alguna de las siguientes: x ≤ y, y ≤ x ó x = y. Decimos en tal caso
que X está linealmente (o totalmente) ordenado por ≤. N

Note que cualquier subconjunto de un conjunto parcialmente (linealmente,


resp.) ordenado, es también un conjunto parcialmente (linealmente, resp.)
ordenado, con la misma relación de orden.

Definición 5.2. Sea ≤ un orden parcial sobre un conjunto X. Decimos que un


subconjunto Y ⊂ X tiene elemento mínimo (rel. a ≤)1 si para algún y∗ ∈ Y ,
se tiene que y∗ ≤ y, para todo y ∈ Y . A veces usamos la notación habitual
y∗ = min Y . Decimos que un orden parcial ≤ sobre X es un buen orden si
todo subconjunto Y de X no vacío tiene elemento mínimo. N

Observación 5.1. Es inmediato comprobar que el elemento mínimo, si lo hubiere,


es único. N

Un buen orden es siempre un orden lineal. En efecto, si x, y ∈ X y ≤ es


un buen orden, entonces el conjunto {x, y} tiene mínimo, de donde, x ≤ y ó
bien y ≤ x ó bien x = y. Cualquier subconjunto de un conjunto linealmente
ordenado, es linealmente ordenado.
1 Queremos decir, relativo a ≤.

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
36 Recursión

Definición 5.3 (Conjunto Inductivo). Sea ≤ un orden parcial sobre un conjunto


X. Un subconjunto I de X es inductivo (rel. a ≤) si, y sólo si

∀ x ∈ X (((∀ y ∈ X(y < x ⇒ y ∈ I)) ⇒ x ∈ I), (12)

donde x < y ⇔ x ≤ y ∧ x 6= y. En particular X es un conjunto inductivo. N

Ejemplo 5.1. El orden usual ≤ en R, es un orden lineal pero no es un buen


orden. El conjunto (−∞, ξ], ξ ∈ R, es inductivo. El conjunto (−∞, ξ) no es
inductivo. El conjunto vacío ∅ es inductivo.

Proposición 5.1. La intersección arbitraria de conjuntos inductivos es un con-


junto inductivo. Esto es, si {Ij }j∈J es una colección de conjuntos inductivos
T
sobre un conjunto parcialmente ordenado X, entonces I = j∈J Ij es un
conjunto inductivo sobre X.2

Demostración. Sea x ∈ X y supongamos que para todo y ∈ X, y ∈ I


siempre que y < x.3 Queremos mostrar que x ∈ I. Pero si y ∈ I, entonces
para cada j ∈ J, y ∈ Ij y por tanto x ∈ Ij . Luego, x ∈ I.

Definición 5.4. Si ≤ es un orden parcial sobre X, entonces para cada x ∈ X


definimos el segmento inicial (rel. a ≤) hasta x como el subconjunto

S(x) = {y ∈ X : y < x}.


N

En estos términos, un subconjunto I de un conjunto parcialmente ordenado


X, es inductivo si, y sólo si,

∀ x ∈ X( S(x) ⊂ I ⇒ x ∈ I).

Lema 5.1. Si un conjunto parcialmente ordenado X tiene elemento mínimo, y


x∗ es el elemento mínimo de X, entonces x∗ ∈ I para todo conjunto inductivo
I de X.
2 Desde luego, sumimos que las propiedades enunciadas en este resultado (y en los sigu-

ientes en esta sección), son siempre relativos a la relación de orden que estemos considerando
para X. Omitiremos escribir esta información cuando no sea esencial, para no ser demasiado
repetitivos.
3 Suponemos implícitamente que ≤ es un orden parcial sobre X. Así será en las pruebas

de esta sección.

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
Recursión 37

Demostración. Por supuesto, X 6= ∅ (pues X tiene al menos un elemento:


el mínimo). Sea I un conjunto inductivo de X. Dado que no existe x ∈ X tal
que x < x∗ , se sigue que S(x∗ ) = ∅ ⊂ I. Por lo tanto x∗ ∈ I.

Exponemos la forma general del principio de inducción en el contexto de


los conjuntos bien ordenados.

Teorema 5.1 (Principio de inducción para un buen orden: Inducción Transfinita). Si X


es un conjunto bien ordenado, entonces X es el único conjunto inductivo.

Demostración. Si X = ∅, entonces ≤ es la relación vacía y el resultado es


obvio. En otro caso, esto es, si X 6= ∅, sea x∗ el mínimo de X. Sea I ⊂ X
un subconjunto inductivo y supongamos que X\I 6= ∅. Sea ζ = min(X\I) ∈
X\I. Dado que x∗ ∈ I, se sigue que x∗ < ζ. Ahora bien, si y < ζ entonces
y ∈ I, y como I es inductivo, ζ ∈ I, lo cual es imposible. Así, X = I.

El enunciado inverso no es válido en general.

Ejemplo 5.2. Sea X un conjunto con al menos dos elementos y sea

≤ = ∆ = {(x, y) ∈ X × X : x = y}.

(El conjunto diagonal). Entonces ≤ es un orden parcial y X es el único


conjunto inductivo, puesto que S(x) = ∅, para todo x ∈ X. Note que X no
tiene elemento mínimo.
Para la equivalencia hay que poner algunas condiciones extra.

Corolario 5.1. Sea ≤ un orden lineal sobre X y supongamos que X tiene ele-
mento mínimo (rel. a ≤) y es el único conjunto inductivo. Entonces ≤ es un
buen orden.

Demostración. Sea x∗ ∈ X el elemento mínimo de X. Sea F el subconjunto


de X que reúne todos aquellos elementos x tal que si A ⊂ S(x) ∪ {x} es no
vacío, entonces tiene mínimo. Notamos que x∗ ∈ F , y por tanto F 6= ∅.
Mostraremos que F es inductivo, y en consecuencia F = X. Sea x ∈ X y
supongamos que para todo y ∈ X, si y < x entonces y ∈ F . Sea A ⊂ S(x)∪{x}
no vacío. Si A = {x} entonces es claro que x es el mínimo de A. Supongamos

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
38 Recursión

que A ∩ S(x) 6= ∅. Para algún a ∈ S(x), la intersección A ∩ S(a) ∪ {a} es
no vacía. Luego, tal conjunto tiene mínimo, el cual es por linealidad del orden
≤, el mínimo de A. Por lo tanto, x ∈ F . De modo que F es inductivo como
queríamos probar. Esto significa que todo subconjunto de cualquier conjunto
de la forma S(x) ∪ {x}, x ∈ X, tiene mínimo.
Ahora, en general, si A ⊂ X es no vacío, elegimos algún a ∈ A. Entonces
el conjunto A ∩ (S(a) ∪ {a}) es no vacío y por tanto tiene mínimo, el cual es
por linealidad del orden ≤, el mínimo de A.

En el resultado anterior, es esencial que ≤ sea un orden lineal.

Ejemplo 5.3. Sea X = {0, 1, 2} y el orden parcial

≤ = ∆ ∪ {(0, 1), (0, 2)},

con ∆ la diagonal. Entonces S(0) = ∅ y S(1) = {0} = S(2). Por lo tanto X


es el único conjunto inductivo. Note que 0 es el mínimo de X. Sin embargo ≤
no es lineal, pues 1 y 2 no están relacionados. Luego, ≤ tampoco es un buen
orden.
Finalmente, enunciamos el principio de recursión transfinita.

Teorema 5.2 (Principio de Recursión para un Buen Orden). Sea ≤ un buen orden
sobre un conjunto X y sea Y cualquier conjunto. Supongamos que Φ es una
función con valores en Y y cuyo dominio es la clase SX (Y ), de todas las
funciones cuyo dominio es un segmento inicial S(x) ⊂ X, para algún x ∈ X, y
cuyo rango es Y . Entonces existe una única función ψ : X → Y tal que para
todo x ∈ X,
ψ(x) = Φ(ψ | S(x)), (13)

donde ψ | S(x) es la restricción de ψ al segmento inicial S(x).

Observación 5.2. Si x∗ es el mínimo de X entonces S(x∗ ) = ∅. La función


vacío f = ∅ es la única función f : ∅ → Y . Generalmente, si y0 es un
elemento fijo de Y , la conlcusión del teorema anterior se enuncia además con
la condición de que ψ(x∗ ) = y0 . Esto está cubierto en nuestro enunciado, sólo
basta considerar Φ(∅) = y0 . N

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
Recursión 39

Para la prueba haremos uso de un pequeño resultado.

Lema 5.2. Sea ≤ un buen orden sobre X. Sea U ⊂ X un subconjunto. En-


tonces U = S(x) para algún x ∈ X o bien U = X si, y sólo si,

∀ u ∈ U : y < u ⇒ y ∈ U. (14)

Demostración. Es claro que si U = X o bien U = S(x) para algún x ∈ X,


entonces la relación (14) es inmediata. En sentido inverso, supongamos que
(14) es válido y supongamos que U 6= X y que U 6= S(x) para todo x ∈ X.
En particular, si r es el mínimo de X\U , se tiene U 6= S(r). Hay dos casos.
Caso I). Para algún u ∈ U , u ≮ r (esto es U * S(r)). Como E es un buen
orden y r 6= u, se tiene r < u, de donde, si (14) es válido, r ∈ U , lo cual es
imposible. Caso II). Para algún ξ < r, existe y < ξ tal que y ∈ / U (esto es
S(r) * U ). Por transitividad, y < r, lo cual es también imposible.

Demostración del Teorema 5.2. Si X = ∅, entonces Φ = ∅ = ψ y la


conclusión del teorema es inmediata. Supongamos que X 6= ∅. La prueba
incluye varias ideas. Serán desarrolladas aparentemente sin conexión, pero
tendrán todas un mismo sentido en la conlcusión.
Primer paso. Definimos S(x) := {u ∈ X : u ≤ x} = S(x) ∪ {x}, para
x ∈ X. Sea I el conjunto de todos los elementos x ∈ X tal que sobre S(x)
existe una función ψ con valores en Y , tal que

ψ(u) = Φ(ψ | S(u)) para todo u ∈ S(x). (15)

Probaremos que si para algún x ∈ X tal función ψ existe, ésta es única.


Sea ψ 0 alguna otra función definida sobre S(x) con valores en Y tal que
ψ 0 (u) = Φ(ψ 0 |S(u)) para todo u ∈ S(x). Sea U = {u ∈ S(x) : ψ(u) = ψ 0 (u)}.
Supongamos que S(u0 ) ⊂ U para algún u0 ∈ S(x). Entonces ψ 0 (u) = ψ(u)
para todo u < u0 , de donde

ψ 0 (u0 ) = Φ(ψ 0 |S(u0 )) = Φ(ψ|S(u0 )) = ψ(u0 ),

y por tanto u0 ∈ U . Así, U es inductivo y en consecuencia U = S(x) y ψ es


única.

Una nota sobre la Teoría Axiomática de Conjuntos


5. Relaciones de orden y Principio de Inducción Transfinita y
40 Recursión

Segundo paso. Ahora probamos que I es no vacío. Si x∗ es el mínimo


elemento de X, entonces S(x∗ ) = ∅ y S(x∗ ) = {x∗ }. Luego, si definimos
ψ(x∗ ) = Φ(∅), entonces ψ es la única función sobre S(x∗ ) con valores en Y
que satisface (15). En consecuencia x∗ ∈ I y por tanto I 6= ∅.

Tercer paso. Ahora construiremos una función ψ que satisface (13) pero
S
sobre el subconjunto SI = x∈I S(x). Para cada x ∈ I, denotamos ψx la
única función sobre S(x) con valores en Y tal que satisface (15). Definimos
la función ψ : SI → Y dada por ψ(u) = ψx (u) si u ∈ S(x), para todo
u ∈ SI . Veamos que ψ está bien definida: Para cualquier u ∈ SI , supongamos
que u ∈ S(x1 ) y u ∈ S(x2 ), donde x1 , x2 ∈ I y sin pérdida de generalidad,
x1 < x2 . Como S(x1 ) ⊂ S(x2 ) y ψx2 satisface (15) sobre S(x2 ), entonces la
restricción ψx2 |S(x1 ) lo hace sobre S(x1 ). Por unicidad, ψx1 = ψx2 |S(x1 ), de
donde ψ(u) = ψx1 (u) = ψx2 (u), y por tanto ψ está bien definida.

Notamos además que ψx = ψ|S(x), para todo x ∈ I. Por consiguiente,

si u ∈ SI entonces ψ(u) = Φ(ψ|S(u)), (16)

puesto que u ∈ S(x), para algún x ∈ I y ψ|S(u) = ψx |S(u).

Por último, por un razonamiento análogo al primer paso, es claro que ψ es


la única función definida sobre SI con valores en Y que satisface (16).

Cuarto paso. Ahora probamos que SI = X. Bastará probar que I = X.


Sea pues x ∈ I y sea x0 < x. Como antes, sea ψx : S(x) → Y la única función
tal que satisface (15), entonces en particular, la restricción ψ 0 = ψx |S(x0 ) es la
única función definida sobre S(x0 ) con valores en Y tal que ψ 0 (u) = Φ(ψ 0 |S(u)),
para todo u ∈ S(x0 ). Por lo tanto x0 ∈ I. Así, I es igual a X o bien I = S(η),
para algún η ∈ X. Supongamos que I 6= X. Sea r el mínimo elemento de X\I.
Dado que η ∈ / I, r ≤ η, pero si r < η, entonces r ∈ I lo cual es imposible,
por lo tanto I = S(r) = SI y la función ψ del tercer paso está definida en
S(r). Sea la función ψ 0 = ψ ∪ {(r, Φ(ψ))}. Entonces ψ 0 satisface (15) y por lo
tanto r ∈ I, una contradicción. Así, I = X y la función ψ del tercer paso es
la función buscada.

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 41

6 El Axioma de Elección y sus equivalencias


El axioma que trataremos en esta sección fue propuesto por primera vez por
Ernst Zermelo en los años 1904 y 1908, como Axioma de Elección (Axiom der
Auswahl), que abreviaremos AE, en tres famosas publicaciones ([19, 20, 21]),
donde da una prueba afirmativa a un problema planteado por Cantor –se trata
del Principio del Buen Orden, que establece que todo conjunto puede ser bien
ordenado–, y a su vez propone una nueva teoría
axiomática de conjuntos, mientras éste último aún trabajaba en su teoría
de los conjuntos, o mejor dicho, su “teoría sobre los números ordinales finitos
y transfinitos, como él mismo les llamó” ([8], p. 13).
La mayoría de los historiadores y matemáticos, coincide en que Zermelo
no estaba interesado en los problemas de la fundamentación de las matemáti-
cas, sino que presentó su sistema axiomático únicamente para darle una base
conceptual sólida a su prueba de que todo conjunto puede ser bien ordenado
(aunque más precisamente, Zermelo probó que R puede dotarse de un buen
orden).
No obstante, Horst Herrlich afirma:

Without question, the Axiom of Choice, AC (which states that for every
family of non-empty sets the associated product is non-empty), is the
most controversial axiom in mathematics. ([4], p. vii).

Equivalentemente, AE establece que, dada una colección arbitraria de con-


juntos no vacíos, entonces existe un conjunto, llamado conjunto de elec-
ción, el cual tiene un elemento de cada miembro de la colección dada. Nos
preguntamos entonces, ¿en dónde está la controversia de la que habla Herrlich.
No parece muy difícil convencerse de que un conjunto de elección existe
cuando la colección de conjuntos dada es finita.
Podemos argumentar a favor de ello que, intuitivamente, es posible tomar,
de conjunto en conjunto, un elemento de cada uno de ellos, y después de cierto
tiempo (finito) completar así un conjunto de elección. Pero ¿qué sucede si con-
sideramos colecciones infinitas de conjuntos? No es posible defender una idea
“intuitiva” de una elección arbitraria infinita como la expuesta anteriormente.

Una nota sobre la Teoría Axiomática de Conjuntos


42 6. El Axioma de Elección y sus equivalencias

El problema aquí no es sólamente una cuestión de tiempo.


Sin AE, no es posible hacer, en todos lo casos, elecciones infinitas cualquiera,
o mejor dicho, reemplazarlas por elecciones definidas.
Quizá no hay mejor forma de comprender el sentido, origen y problemática
de dicha afirmación, que con una pequeña fábula debida, por supuesto, a
Bertrand Russell ([17]):

Igaminemos que debemos elegir un zapato de cada par de una


infinidad de pares de zapatos. Esto es realmente fácil. No es
que nos sobre el tiempo, sino que podemos definir una regla que
determine esta elección a priori (“simultánea”), y de forma unívoca.
Por ejemplo, de cada par, tomamos el zapato izquierdo. O el
derecho de cada par, si se quiere. Cualquiera de ambas reglas es
una regla de elección bien definida.
Pero supongamos ahora que no se trata de una colección infinita
de pares de zapatos, sino de una infinidad de pares de calcetines.
Hasta donde se sabe, (teóricamente) no hay calcentín izquierdo o
derecho. Son simplemente calcetines. Luego, es imposible definir
una regla de elección. Se nos puede ocurrir decir: bueno, pues
entonces tomamos de cada par, cualquier calcetín. Pero esto no
es válido, pues ello es impracticable, nos llevaría una eternidad (o
más) llevar a cabo semejante cosa. No habría de modo de hacer
todas las elecciones de forma “simultánea”. No obstante, podemos
simplemente asumir que es posible definir una regla de elección,
aunque no veamos el modo de definirla. Esto es AE.

La mayoría de los autores afirma que AE es “radicalmente” diferente al


resto de los axiomas ZF 1-ZF 9, porque éste afirma la “existencia de algo [el
conjunto de elección] sin definirlo”, o construirlo, al modo como sucede en el
resto de los axiomas de ZF constructivos ([2]).
Pero según el parecer de muchos historiadores (e incluso matemáticos), AE
ha estado presente a lo largo de la historia moderna de las matemáticas, al
menos de forma implícita. Resulta que hasta antes del trabajo de Zermelo,
ningún matemático parecía haberlo notado. Su validez parecía bastante cierta,

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 43

al menos intuitivamente. Mentes brillantes como Cantor, Russell, Poincare,


Borel y el mismo Lebesgue (crítico de AE) y otros matemáticos, incluso al-
gunos detractores de AE, lo habían usado de alguna forma desde la década
de 1870 hasta principios del siglo XX, más menos concientemente pero sin
reparar mucho en él ([15]). Después de Zermelo, no parecía ya tan claro e
incuestionable.
Pero entonces ¿cuál es el origen de la controversia respecto de un principio
que al parecer había estado presente desde siempre?
Zermelo hizo patente, antes que cualquier otro, un par de cosas que venían
ocurriendo desde hacia un tiempo. En primer lugar, la propia evolución de
las matemáticas, devino en un nuevo concepto del infinito. Un infinito que
podía “fijarse matemáticamente”, según decía Cantor (cit. in [8], p. 52), en
claro desafío a las ideas tradicionales. Por otro lado, el concepto de fun-
ción sufría también una metamorfosis acelerada, quizá desde los trabajos de
Dirichlet y Weierstrass, que tendía a nociones cada vez más arbitrarias. Zer-
melo formuló, en definitiva, el modelo más general de concebir una función,
y con él dio coherencia al polémico infinito cantoriano. Éste modelo era lo
mismo usual que inadvertido en su tiempo, y el punto trascendental, radica
en que Zermelo mostró que era incompatible con otras ideas asentadas en
la mentalidad matemática de la epoca, algunas por la tradición, y otras por
ciertos ideales estéticos o filosóficos
Todos conocemos la histórica resistencia filosófica y científica (y quizá
hasta religiosa) hacia el concepto del infinito como un todo “limitado”, aunque
indeterminablemente extenso, como el infinito matemático de Cantor,
“fijado” como un número. Esta oposición, estaba comprendida (y fundada) en
la antigua negativa aristotélica del infinito “actual”, como un todo, como una
entidad unitaria (“infinito absoluto”, como decía Cantor) pues éste es imposi-
ble en la experiencia, irrealizable, y por tanto, según Aristótels, contradictorio
en sí mismo. En cambio, la idea, también aristotélica, del infinito “potencial”,
inabarcable, pero potencialmente realizable en la experiencia por un proceso
de “recursividad ideterminada” (al modo en que se comprende intuitivamente
la infinitud de los números naturales), constituyó por mucho tiempo la forma
conceptual dominante del infinito ([13]).

Una nota sobre la Teoría Axiomática de Conjuntos


44 6. El Axioma de Elección y sus equivalencias

El mismo Cantor, acerca de su trabajo, afirmaba que la “idea de conside-


rar lo infinitamente grande [el infinito potencial]” como un “infinito absoluto
[infinito actual]”, es decir, como un “número” (los alephs, i.e. los números
transfinitos), le había sido “impuesta en contra de su propia voluntad”, “puesto
que es contraria a las tradiciones que yo había llegado a venerar en el curso
de muchos años de esfuerzos e investigación científica.” (Cantor, cit.in. [8], p.
52).
El Axioma de Elección de Zermelo, cuyo origen son las investigaciones
previas de Cantor, es el tiro de gracia que recibieron estos viejos principios del
infinito. Ciertamente se conocían y se aplicaban desde mucho tiempo atrás, los
métodos formales de definición recursiva numerable, las cuales en algunos casos
son esencialmente elecciones infinitas, pero definidas. Sin emabargo, tales
principios requieren propiedades recursivas intrínsecas. No siempre están ahí
de por sí. Asumir AE es entonces asumir que ello no obsta para encontrarlas
de algún modo. Veamos: según Shaughan Lavine

[...] la teoría de los conjuntos de Cantor no era una teoría de las


colecciones, en el sentido familiar de éstas, sino de las colecciones que
pueden ser contadas usando índices [...] Se desarrolló a partir de una
única y coherente idea: los conjuntos son colecciones que pueden ser
contadas. ([8], p.13).

Luego, aunque la teoría de Cantor no estaba sujeta a las clásicas paradojas


russellianas ([8], p.13),

La teoría de Cantor tenía otros problemas. No incluía en su forma


original, a lo números reales como un conjunto [...] Cantor elaboró un
nuevo supuesto respecto a su teoría tan pronto se percató de que lo
necesitaba, un supuesto que le permitió incorporar a los números reales,
pero que también le causó grandes problemas. El nuevo supuesto fue su
versión de lo que ahora se conoce como Axioma del conjunto potencia.
El problema que se derivó fue que su teoría, que supuestamente era
una teoría de las colecciones que se pueden contar, no podía contar las
nuevas colecciones a que dio lugar el axioma del conjunto potencia. [...]
Parecía que la idea de contar ya no podía servir como la idea clave.

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 45

Cantor no supo como reemplazar esta idea. ([8], p. 13, 14).

Entra entonces en escena Zermelo y su teorema de que cualquier conjunto


puede ser bien ordenado, vía AE. Resulta que, en cierto sentido, un conjunto
que puede ser bien ordenado también puede ser “contado”. Pues si está bien
ordenado, entonces tiene un primer elemento (el mínimo), luego, restando
este elemento, el conjunto restante tendrá un primer elemento, que ocupará el
sitio de un segundo elemento, y así sucesivamente. Esta idea intuitiva, tiene
por supuesto un modelo riguroso que ya estudiamos, que conocemos como
Principio de Recursión para un Buen Orden (Teorema 5.2). En conclusión,

Lo que Zermelo hizo notar, fue que este principio [AE] podía ser utilizado
para “contar”, en el sentido cantoriano, aquellas colecciones que habían
dado a Cantor tantos problemas [...] ([8], p. 14).

Sin ambargo, siguiendo al mismo Lavine,

En gran parte el infinito ha entrado en las matemáticas actuales como


resultado de algunos intentos de dar sentido a la noción de una curva o
de una función arbitraria. ([8], p. 23).

Luego, más allá del impacto sobre los forcejeos sobre el infinito, AE es en
realidad “un principio inherente a la noción de función arbitraria”, en oposición
a la idea de que únicamente las reglas (o fórmulas) específicas pueden usarse
para definir funciones específicas. El debate no es la validez de AE, sino en la
cuestión de si tal principio es apropiado para ser incluido como un principio
de las matemáticas. La fuente real de la controversía que encierra AE, radica
en cuál es la noción “correcta” de función ([8], p. 14).
Específicamente, el punto en disputa es que la prueba de Zermelo, que en
particular implica que los números reales pueden ser “contados”, es decir, bien
ordenados, es netamente existencial. Asumiendo AE, demuestra que hay un
buen orden sobre los números reales, pero no ofrece modo alguno de conocer
explícitamente cuál es ese orden. Para algunos matemáticos de entonces esto
no significaba otra cosa más que AE no podía ser un principio matemático
legítimo. Pero también hubo quien recibió con entusiasmo AE, encontrando
nuevas aplicaciones en diversos campos (álgebra, topología, etc). La historia

Una nota sobre la Teoría Axiomática de Conjuntos


46 6. El Axioma de Elección y sus equivalencias

oficial dice que los matemáticos se dividieron entonces en diversas sectas, los
constructivistas (o intuicionistas o finitistas), que admiten la existencia de un
objeto sólo si es posible definirlo, y en general, sin admitir la regla lógica del
tercero excluido, en oposición a los idealistas, tan contentos con con tal regla
lógica (tan antigua como las matemáticas mismas) y las posibilidad de los
modelos de demostración por reductio ad absurdum, que da lugar a cantidad
de objetos sin necesidad de definirles.
No detallaremos aquí, y mucho menos pretendemos resolver o tomar par-
tido en el asunto. Sólo nos permitimos reproducir una aclaración. Es un
lugar común, decir que las matemáticas entraron en un cisma de proporciones
catastróficas, y que la debacle sólo fue salvada por Zermelo, con una teoría de
los conjuntos adecuada para evitar las paradojas conocidas y salvar el barco
del desastre. Pero para S. Lavine, el origen de la axiomática de Zermelo es
otro:

El trabajo de Zermelo recibió numerosas críticas. [...] Para defender su


teorema de que los números reales pueden ser contados [bien ordenados],
Zermelo elabaró una presentación axiomática de la teoría de conjuntos,
y una nueva demostración del teorema en base a sus axiomas. Los
axiomas eran para ayudar a dejar en claro que había estado trabajando
todo el tiempo con base en una visión totalmente consistente. Esto
se aparta de la opinión común, según la cual, él “axiomátizó” la teoría
de conjuntos para proporcionar una teoría consistente, en ausencia de
alguna otra salida posible a las paradojas. ([8], p. 15).

Hacia finales de la década de 1930, Kurt Gödel probó que AE no podía


refutarse con los axiomas de ZF. Hacia principios de la década de 1960, Paul
Cohen, demostró que tampoco podía probarse en ZF ([4]). Luego, se pueden
postular tanto modelos de ZF con Axioma de Elección, como otros sin tal,
todos hasta donde se sabe consistentes (sin contradicciones o paradojas). Hay
una largo debate sobre cual tipo de modelo es “más intuitivo”, o más válido. No
entraremos aquí en ese asunto. Algo es cierto, en cualquiera de ellos se puede
probar resultados sorprendentes, que lo mismo puede decirse que son de lo
más natural, o absolutamente contraintuitivos. Por ejemplo, sin AE (o mejor

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 47

dicho con su negación), puede construirse un conjunto infinito de números


reales el cual no contiene subconjuntos numerables ([4]). Por otra parte, el
propio Teorema del Buen Orden de Zermelo -el cual afirma, asumiento AE,
que todo conjunto puede ser bien ordenado-, es para muchos (o lo fue durante
un tiempo), prueba de la irrealidad de AE.
Más cercano a la teoría que nos ocupa en este libro, puede probarse que el
único camino para construir conjuntos en R no Lebesgue-medibles, es asumir
AE. De otra forma, hay modelos de ZF, sin AE, donde todos los conjuntos
de R son Lebesgue-medibles ([16]). Lo que en términos intuitivos, significa
que todo conjunto de R tiene asociada una “longitud”, lo que define una regla
de asignación númerica sobre ℘(R), la cual es en esencia, la misma regla
que asigna a todo intervalo acotado (a, b) la longitud b − a. De otro modo,
asumiendo AE, hay en efecto conjuntos en R sin “longitud”, esto es, si hay
una regla de asignación definida sobre los conjuntos de R, la cual puede ser
interpretada como “longitud”, lo que significa, entre otras cosas, que asigna el
número b − a a cualquier intervalo (a, b), entonces es imposible que tal regla
de asignación esté definida en todo el conjunto potencia ℘(R).
En relación a este último problema, vale la pena hacer mención de otro
de los resultados que ha causado más sorpresa, conocido como Teorema de
Banach-Tarski, (o Paradoja de Banach-Tarski, o Paradoja del chícharo y el
Sol). Demostrado por Stefan Banch y Alfred Tarski hacia 1930, asumiendo
AE, este resultado afirma que dado una esfera sólida, de cualquier volumen,
puede seccionarse en un número finito de partes, manipularlas únicamente
con isometrías (en R 3 ) y armarse nuevamente para formar otra esfera de
cualquier otro volumen (fijado previamente). (Hausdoff anteriormente probó
un resultado similar ([17])).

6.1 Funciones de elección. Producto cartesiano


Definición 6.1. Sea {Ai }i∈I una clase indexada de conjuntos (i.e. un conjunto
S
de conjuntos). Una función de elección es una aplicación f : I → i∈I Ai
tal que f (i) ∈ Ai , para todo i ∈ I. N

Una función de elección es una forma de elegir un elemento ai de cada

Una nota sobre la Teoría Axiomática de Conjuntos


48 6. El Axioma de Elección y sus equivalencias

Ai , simultáneamente. La pregunta clave es, dada una clase {Ai }i∈I , ¿cuándo
S
existe una función de elección de I en i∈I Ai ? Pensemos el caso finito.
Supongamos que {Ai }ni=1 es una clase finita de conjuntos. Consideremos el
Sn
conjunto Λ de todas las funciones de elección f : {1, ..., n} → i=1 Ai . Tales
Sn
funciones están en el conjunto {1, ..., n} × i=1 Ai , por lo que Λ está bien
definido, según el Axioma de Separación (ZF 4). ¿Es Λ el conjunto vacío?
Ahora respondemos.

Proposición 6.1. Si A = {Ai }n


i=1 es una clase finita de conjuntos no vacíos,
entonces existe al menos una función de elección.

Demostración. Procedemos por inducción sobre el cardinal (tamaño) de


la clase finita A. Si n = 1, esto es, A = {A}, entonces elegimos x ∈ A
(arbitrario) y definimos la función de elección f (1) = x. Supongamos que
la afirmación es válida para cualquier clase finita de conjuntos no vacíos de
tamaño n. Sea A = {Ai }n+1 i=1 una clase de n + 1 conjuntos no vacíos. Por
hipótesis, para la clase A\{An+1 } = {Ai }ni=1 existe una función de elección
Sn
f : {1, ..., n} → i=1 Ai . Como An+1 es no vacío, elegimos a ∈ An+1 y
Sn+1
definimos f 0 = f ∪ {(n + 1, a)}. Entonces f 0 : {1, ..., n + 1} → i=1 Ai
es una función de elección. Por el Teorema 4.4, nuestra afirmación queda
probada.

En consecuencia, el conjunto Λ de todas las funciones de elección


Sn
f : {1, ..., n} → i=1 Ai es no vacío. Por un argumento inductivo, puede
n
probarse que el producto cartesiano ×i=1 Ai está en correspondencia biyec-
tiva con Λ. Este hecho justifica la notación para los elementos del producto
cartesiano como sucesiones finitas (ai )ni=1 , o bien, como n-tuplas ordenadas
(a1 , ..., an ). Esta misma idea motiva la definición de producto cartesiano de
un número arbitrario de conjuntos.

Definición 6.2 (Producto Cartesiano). Sea {Ai }i∈I una clase indexada arbitraria
de conjuntos. Definimos el producto cartesiano ×i∈I Ai como el conjunto
S
de todas las funciones (de elección) f : I → i∈I Ai tales que ai := f (i) ∈ Ai ,
para todo i ∈ I. N

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 49

Por supuesto, por el Axioma de Separación (ZF 4), el producto cartesiano


×i∈I Ai , está contenido en el conjunto I ×
S
i∈I Ai , por lo que la definición
anterior es apropiada. Si A = Ai para todo i ∈ I, entonces escribimos AI y
si además I = N ó Z+ (ó algo similar), entonces escribimos A∞ , ó AN o algo
similar. Para los elementos {Ai }i∈I , si los hay, usamos la notación en suceción
(ai )i∈I , o bien, si I es numerable (an )∞
n=1 , o algo similar.
A parte del caso finito, algunas veces, es fácil afirmar que ×i∈I Ai es no
vacío (que existe una función de elección). Por ejemplo, si Ai son conjuntos
no vacíos bien ordenados, entonces podemos definir f (i) = min Ai , para todo
i ∈ I. Claramente, f así definida es una función de elección. Otro ejemplo
es cuando cada Ai consta de un único elemento. En este caso, note que
no existen “elecciones arbitrarias”, pues en realidad sólo existe una elección
posible. No requerimos en ninguno de los casos mencionados asumir AE. Hay
otros ejemplos más sutiles e interesantes en todas las ramas matemáticas pero
que no cabe exponerlas aquí.
Pero en general, no es siempre posible afirmar que una función de elección
S
f : I → i∈I Ai existe en todos los casos. Ni siquiera cuando I es un con-
junto numerable, un proceso recursivo es suficiente en todos los casos. Si I
es infinito, no es válido decir simplemente: si Ai es no vacío, entonces existe
a ∈ Ai . El problema, como hemos dicho, es que no es posible hacer elecciones
infinitas cualesquiera, o mejor dicho, reemplazarlas por elecciones definidas.
Si pudieramos probar el Principio del Buen Orden, nuestro problema queda
resuelto. Pero hacer esto, en su instancia más general, es equivalente al propio
AE, como veremos adelante. Por lo pronto podemos dar una solución parcial,
aunque un poco más general que la Proposición 6.1.

Proposición 6.2. Sea {Ai }∞


i=1 una colección numerable (o contable) de conjuntos
contables no vacíos. Entonces existe al menos una función de elección de Z+
S∞ ∞
en i=1 Ai . En consecuencia, el producto cartesiano ×i=1 Ai es no vacío.

Demostración. Primero hay que probar que para todo conjunto contable
existe un buen orden, pero como todo conjunto contable puede ponerse en
relación uno a uno con algún n ∈ N, o con N mismo, basta probar que todo
numero natural n es un buen orden con la relación de orden habitual. Pero

Una nota sobre la Teoría Axiomática de Conjuntos


50 6. El Axioma de Elección y sus equivalencias

esto es inmediato, pues n ⊂ N y N es un buen orden con el orden usual.


Luego, si hi : Ai → Ni , donde Ni ∈ N o bien Ni = N, es una aplicación uno
a uno, definimos un buen orden como sigue: para todo x, y ∈ Ai , x ≤i y, si
y sólo si hi (x) ≤ hi (y). Entonces definimos f (i) = min Ai para todo i ∈ Z+ .
S∞
Claramente f define una función de elección de Z+ en i=1 Ai .

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 51

6.2 El Axioma de Elección (AE)


Axioma de Elección (AE). Sea A = {Ai }i∈I una clase indexada arbitraria de
conjuntos no vacíos (esto es, I es un conjunto, y para cada i ∈ I, Ai
es un conjunto no vacío). Entonces existe una función de elección f de
S S
I en i∈I Ai . Esto es, existe f : I → i∈I Ai tal que para todo i ∈ I,
f (i) ∈ Ai .

El Axioma de Elección es el instrumento del que se valen los matemáticos


para hacer elecciones arbitrarias y reemplazarlas por elecciones definidas. Este
axioma es de tipo existencial, pues postula la existencia de una función sin
definir una regla específica ([2]). La teoría ZF junto con AE, se abrevia ZFE.
Enunciamos algunas equivalencias inmediatas de AE.

Teorema 6.1. Son equivalentes.

(i) AE.

(ii) Sea A = {Ai }i∈I una clase de conjuntos no vacíos. Entonces el producto
cartesiano ×i∈I Ai es no vacío.

(iii) Sea A = {Ai }i∈I una clase de conjuntos no vacíos. Existe un conjunto
C tal que C ∩ Ai es no vacío para todo i ∈ I.

(iv) Sea A = {Ai }i∈I una clase de conjuntos no vacíos disjuntos. Entonces
existe un conjunto C tal que contiene exactamente un elemento de cada
conjunto Ai .

(v) Sea A un conjunto y sea A = ℘(A)\{∅}, el conjunto de todos los subcon-


juntos no vacíos de A. Entonces existe una función de elección f : A → A
tal que f (B) ∈ B, para todo B ∈ A.

Demostración. Probaremos (i) ⇒ (ii) ⇒ (iii) ⇒ (iv) ⇒ (i), (i) ⇔ (v).


(i) ⇒ (ii) es obvio. Para (ii) ⇒ (iii), tomamos una función de elección
S S
f : I → i∈I . Definimos C = {x ∈ i∈I Ai : ∃i ∈ I(x = xi )}. (iii) ⇒ (iv) es
obvio. Para (iv) ⇒ (i), sea A = {Ai }i∈I una familia indexada de conjuntos, y
para cada i ∈ I, definimos A0i = {i} × Ai Entonces A0 := {A0i }i∈I es una clase

Una nota sobre la Teoría Axiomática de Conjuntos


52 6. El Axioma de Elección y sus equivalencias

de subconjuntos ajenos. Por lo tanto, existe un conjunto C tal que contiene un


único elemento de cada A0i , esto es, para cada i ∈ I, existe un único (i, ai ) ∈ C,
S
donde ai ∈ Ai . Note que C ⊂ I × i∈I Ai , por lo tanto, C es de hecho la
S
regla de una aplicación de I en i∈I Ai , tal que C(i) := ai ∈ Ai , para cada
i ∈ I. C es una función de elección. Para (i) ⇒ (v), sea I = A, entonces
A es una clase indexada al conjunto I (en este caso, la regla queda definida
por la identidad: para todo A ∈ I, A 7→ A). Luego, asumiento AE, (v) es
S
inmediato. Para (v) ⇒ (i), basta tomar A = i∈I Ai , entonces la restricción
de f a {Ai }i∈I es una función de elección, lo que prueba AE.

6.3 Equivalencias de AE
Ahora probaremos tres de las más interesantes y útiles equivalencias de AE.
No son las únicas ni las más interesante. En el libro (ref...) el lector puede
encontrar más de 150 equivalencias.

Principio del Buen Orden (PBO). Todo conjunto puede ser bien ordenado. Esto
es, si X es un conjunto, entonces existe un buen orden ≤ sobre X.

Cantor fue quien primero postuló PBO en 1883, primero como un axioma,
aunque unos años después reconoció que tal postulado requería una prueba.
En su famosa lectura en el Congreso Internacional de Paris, del año 1900,
Hilbert se refirió a este postulado como el “teorema de Cantor”, pero propuso
el problema más específico de encontrar un buen orden definido explícitamente
en R ([15]). Zermelo propuso AE y dedujo PBO por primera vez en 1904, en
1908 publicó otra prueba y una teoría axiomática de conjuntos para apoyarla.
Potter afirma al respecto

[...] the more demanding problem of finding a definite well-ordering on


R has been shown not to be soluble even if we assume the axiom of
choice. ([15], p. 147).

Principio Maximal de Hausdorff (PMH). Todo conjunto parcialmente ordenado


(X, ≤) tiene una cadena maximal L ⊂ X. Esto es, existe una cadena L
(i.e. un subconjunto linealmente ordenado por el mismo orden parcial),
tal que no existe ninguna otra cadena P 6= L tal que L ⊂ P .

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 53

Hausdorff postuló por primera vez una versión del principio maximal hacia
1909 ([15]), y en 1914 probó que éste se seguía del principio del buen orden
([3]). Sin embargo, no volvió aparcer en una obra de Hausdorff sino hasta
1927, en la segunda edición de su obra Grundzüge der Mengenlehre, puesto
que, “ni él ni nadie pareció haberse dado cuenta de su utilidad” ([15], p. 147).

When Kuratowski rediscovered the maximal principle in 1922, it was


quite explicitly as part of reductionist programme stemming from
Zermelo’s proof of the well-ordering principle. Zermelo’s first proof
(1904) made use of transfinite induction on the ordinals and was there-
fore haunted by the spectre of the Burali-Forti paradox in the eyes of
some [...] In order to answer this criticism Zermelo published another
proof in 1908 whinh eliminated the previous use of ordinals [...] But in
the following years numerous important results were proved from the
axiom of choice by transfinite induction [...] Kuratowski turned Zer-
melo’s method for eliminating ordinals into general procedure and hence
obtained the maximal principle; the result was a method by wich proofs
which use transfinite induction could be transformed into proofs which
do not and which could therefore be formalized in Zermelo’s system.
([15], p. 147).

Lema de Zorn (LZ). Sea (X, ≤) un conjunto parcialmente ordenado tal que
toda cadena P ⊂ X tiene una cota superior y ∈ X, esto es, x ≤ y
para todo x ∈ P . Entonces X tiene un elemento maximal, es decir, para
algún z ∈ X, no existe x ∈ X tal que z < x.

Según Penélope Maddy ([9]) fue Bartel Leendert van der Waerden quien
amplió las aplicaciones de AE al campo del álgebra. Lo que motivó al matemático
Max Zorn a proponer y estudiar variantes de AE en este mismo campo.

Apparently Zorn was the first to point out that a statement such as ZL
or HMP implies AC, although Zorn never published his proof of this.
([3])

Según Per Martin-Löf,

Una nota sobre la Teoría Axiomática de Conjuntos


54 6. El Axioma de Elección y sus equivalencias

Despite the strength of the initial opposition against it, Zermelo’s axiom
of choice gradually came to be accepted mainly because it was needed at
an early stage in the development of several branches of mathematics,
not only set theory, but also topology, algebra and functional analysis,
for example. Towards the end of the thirties, it had become firmly
established and was made part of the standard mathematical curriculum
in the form of Zorn’s lemma. ([10], p. 210).

La parte importante de esta sección es el teorema siguiente

Teorema 6.2. AE ⇔ PBO ⇔ PMH ⇔ LZ.


Primero hay que acordar formalmente algunas definiciones y probar un
resultado previo.

Definición 6.3. Sea (X, ≤) un conjunto parcialmente ordenado. Decimos que


y ∈ X es un elemento maximal si no existe x ∈ X tal que y < x. N

Definición 6.4. Sea (X, ≤) un conjunto parcialmente ordenado. Un subconjunto


L de X es una cadena si ≤ es un orden lineal sobre L. N

Definición 6.5. Sea X un conjunto y sea A un subconjunto no vacío de X. Sea


f : ℘(X)\{∅} → X una función de elección. Decimos que A es f -ordenado
si para algún orden parcial ≤A sobre A se cumple

(a) ≤A es un buen orden.

(b) Para todo x ∈ A, x = f (X\{y ∈ A : y <A x}). N

Lema 6.1. Sea X un conjunto y sea f : ℘(X)\{∅} → X una función de elección.


Si (A, ≤A ) y (B, ≤B ) son subconjuntos f -ordenados de X, entonces o son
iguales o bien uno de ellos es un segmento inicial del otro, y en tal caso, los
órdenes coinciden sobre A ∩ B (i.e. sobre el conjunto de superposición).

Demostración. ([3]) Si X = ∅, entonces la afirmación es obvia. Sea X 6=


∅. Procedemos por contradicción. Supongamos que A y B son conjuntos
f -ordenados de X distintos y que no son segmentos iniciales uno del otro.
S
Entonces A 6= ∅ 6= B. (¿Por qué?) Note que A = x∈A {a ∈ A : a ≤A x}, por

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 55

tanto, existe x ∈ A mínimo respecto ≤A , tal que el conjunto S := {a ∈ A :


a ≤A x} no es un segmento inicial de (B, ≤B ). Luego, el conjunto S := {a ∈
A : a <A x} es un segmento inicial tanto de A como de B (con sus respectivos
S
órdenes). En efecto, como antes note que S = s∈S {a ∈ A : a ≤A s}, y como
cada {a ∈ A : a ≤A s}, con s ∈ S, es un segmento inicial en B respecto ≤B ,
la unión es también un segmento inicial en B respecto ≤B .
Ahora probaremos que S 6= ∅. Si no, min A = x = min B. Si B = {x},
entonces A\{x} 6= ∅ y por tanto B es el segmento inicial {a ∈ B : a <A u},
donde u = min A\{x}. Contradicción. Por lo tanto B\{x} = 6 ∅ y el conjunto
{a ∈ A : a ≤A x} = {x} es el segmento inicial {b ∈ B : b <B v}, donde
v = min B\{x}, lo cual es imposible.
Sea z ∈ S. Por hipótesis, B\{a ∈ A : a <A z} 6= ∅, sea w ∈ B el mínimo
respecto de ≤B . Entonces {a ∈ A : a <A z} = {b ∈ B : b <B w}. Dado que
A y B son f -ordenados,

z = f (X\{a ∈ A : a <A z}) = f (X\{b ∈ B : b <B w}) = w.

Por lo tanto, sobre S los órdenes ≤A y ≤B coinciden.


Probaremos finalmente que x ∈ B. Como en el párrafo anterior, por
hipótesis, B\S 6= ∅. Sea y ∈ B el elemento mínimo respecto del orden
≤B . Entonces S = {b ∈ B : b <B y}, y como A y B son f -ordenados,
y = f (X\S) = x.
Con todo lo anterior, concluimos que para cualquier s ∈ S, se cumple que
s <A x y el conjunto {a ∈ A : a ≤A s} no es un segmento inicial de (B, ≤B ),
lo que contradice la elección de x.

Demostración del Teorema 6.2. ([3]) AE ⇒ PBO. Sea X un conjuno y


sea f : ℘(X)\{∅} → X una función de elección tal que f (A) ∈ A, para todo
A ⊂ X (la cual existe por AE). Sea F la unión de todos los conjuntos f -
ordenados (A, ≤A ) y sea ≤ la unión de todos sus órdenes. Entonces (F, ≤) es
un conjunto f -ordenado. En efecto, en primer lugar es claro que ≤ es reflexivo,
por otra parte, si x, y ∈ F , entonces para algunos conjuntos f -ordenados A
y B, x ∈ A y y ∈ B, y por el lema anterior, A = B o alguno está contenido
dentro del otro, sin pérdida de generalidad, supongamos que B ⊂ A, luego si

Una nota sobre la Teoría Axiomática de Conjuntos


56 6. El Axioma de Elección y sus equivalencias

x ≤ y y y ≤ x, entonces x ≤A y y ≤A x, por tanto x = y. Del mismo modo


puede probarse transitividad.
Para probar que (F, ≤) es un buen orden, sea G un subconjunto no vacío
de F . Sea y ∈ G. Entonces y ∈ A, para algún conjunto f -ordenado. Veamos
que todos lo “antecesores” de y, respecto al orden ≤, están en A. Sea x ∈ F tal
que x ≤ y. Sea (B, ≤B ) un conjunto f -ordenado tal que x ∈ B. Nuevamente,
por el lema anterior, A = B o B es un segmento inicial de A, o éste lo es de
B. En los primeros dos casos, es obvio que x ∈ A. En el último caso, dado
que x ≤B y, y A es un segmento inicial de B, entonces x ∈ A. De este modo,
el conjunto {x ∈ F : x ≤ y} ∩ G tiene un elemento mínimo en A, el cual es
por supuesto, el mínimo de G en F .
Ahora verificamos que (F, ≤) es f -ordenado. Pero esto es evidente: Si
x ∈ F , entonces x ∈ A para algún conjunto f -ordenado (A, ≤A ), por lo tanto

x = f (X\{y ∈ A : y ≤A x}) = f (X\{y ∈ F : y ≤ x}).

Supongamos ahora que X\F 6= ∅. Sea z = f (X\F ) ∈ X\F . Sobre


F ∪ {z} extendemos el orden ≤ haciendo z ≤ z y x ≤ z para todo x ∈ F .
Note entonces que F ∪ {z} es un conjunto f ordenado, lo cual es imposible.
Luego, X = F y ≤ es un buen orden en X.
PBO ⇒ PMH. Sea (X, ≤) un conjunto parcialmente ordenado y sea ≤W un
buen orden sobre X. Sea x∗ el mínimo de X respecto al orden ≤W . Definimos
la función ψ por recursión (Teorema 5.2) en (X, ≤W ) sobre sí mismo del modo
siguiente: Sea Ψ una función tal que aplica cada función j : S(x) → Y en

x si {x} ∪ {j(y) : y <W x} es una cadena para ≤,
Ψ(j) =
x∗ en otro caso.

Entonces existe una única función ψ : X → X tal que ψ(x∗ ) = x∗ y



x si {x} ∪ {ψ(y) : y <W x} es una cadena para ≤,
ψ(x) = Ψ(ψ | S(x)) =
x∗ en otro caso.

Por lo tanto L := ψ(X) es una cadena maximal respecto a ≤. En efecto, sean


x0 , x00 ∈ L tales que x0 6= x00 . Sin pérdida de generalidad, podemos suponer

Una nota sobre la Teoría Axiomática de Conjuntos


6. El Axioma de Elección y sus equivalencias 57

x0 <W x00 (en particular, x00 6= x∗ ), y por tanto, x0 ∈ {x00 }∪{ψ(x) : x <W x00 },
y como este conjunto es una cadena respecto a ≤, se sigue x0 < x00 o bien
x00 < x0 . Por otra parte, sea P ⊂ X una cadena tal que L ⊂ P y supongamos
que P \L 6= ∅. Si x ∈ P \L, entonces {x} ∪ {ψ(y) : y <W x} no es una cadena
respecto a ≤. Pero note que, de hecho, el conjunto {ψ(y) : y <W x} es una
cadena con respecto a ≤, por lo tanto, para algún y <W x, ψ(y) y x no son
comparables respecto a ≤, pero esto contradice que P es una cadena.
PMH ⇒ LZ. Sea (X, ≤) un conjunto parcialmente ordenado tal que toda
cadena P ⊂ X tiene una cota superior y ∈ X, esto es, x ≤ y para todo x ∈ P .
Sea L ⊂ X una cadena maximal. Por hipótesis, existe x∗ cota superior de L.
Note que x∗ ∈ L, de lo contrario, L ∪ {x∗ } es una cadena más grande que L,
lo cual es imposible. Entonces x∗ es maximal en X, si no, es decir, si existe
y ∈ X tal que x∗ < y, entonces L ∪ {y} es una cadena más grande que L, lo
cual es imposible.
LZ ⇒ AE. Sea X un conjunto y sea F el conjunto de todas las funciones
de elección cuyo dominio es un subconjunto de ℘(X)\{∅}, y consideremos el
orden parcial “inclusión” ⊂ sobre F . Note que para cualquier cadena en C
en F , C ∈ F , el cual es una cota superior de C. Por lo tanto (por LZ), F
S

tiene un maximal f . Sea Domf el dominio de f . Supongamos que Domf 6=


℘(X)\{∅}. Sea A ∈ (℘(X)\{∅})\Domf y x ∈ A. Entonces f ∪ {(x, A)} ∈ F .
Pero esto contradice que f es maximal. Por lo tanto Domf = ℘(X)\{∅} y
AE se sigue.

6.4 Otras equivalencias y aplicaciones de AE


Quizá una de las principales equivalencias, a parte de las ya revisadas antes,
es el conocido Teorema de Tychonoff.

Teorema 6.3 (Tychonoff). Son equivalentes

(i) AE.

(ii) El producto cartesiano de espacios compactos es compacto.

Por otro lado, AE en su forma LZ tiene una aplicación importante en el


álgebra lineal.

Una nota sobre la Teoría Axiomática de Conjuntos


58 7. Cardinalidad

Teorema 6.4. LZ implica que todo espacio vectorial tiene una base.
Hay formas más débiles de AE, las cuales sirven para diversos fines en
distintas áreas. Ver [4] para un estudio más detallado.

7 Cardinalidad
Dos conjuntos A y B tienen la misma cardinalidad si existe una biyección
f : A → B, lo que denotamos como |A| = |B|. El siguiente teorema es un
clásico enunciado de la teoría de conjuntos.

Teorema 7.1 (Cantor-Schröder-Bernstein). Dos conjuntos A y B tienen la misma


cardinalidad si, y sólo si, existe una aplicación inyectiva f : A → B y una
aplicación inyectiva g : B → A.

Demostración. ([3]) Para cada C ⊂ A, definimos

ϕ(C) = A\g(B\f (C)).

Intuitivamente, esperamos que este conjunto sea muy “parecido” a C. Al


menos, deseamos que para algún subconjunto de A, de hecho sean iguales.
Demostraremos que tal conjunto existe. Note que si C ⊂ D ⊂ A, entonces
S
ϕ(C) ⊂ ϕ(D). Definimos la clase C = {C ⊂ A : C ⊂ ϕ(C)}. Sea C1 = C.
Si a ∈ C1 , entonces a ∈ C, para algún C ∈ C, de modo que

a ∈ C ⊂ ϕ(C) ⊂ ϕ(C1 ).

Luego, C1 ⊂ ϕ(C1 ) y de aquí ϕ(C1 ) ⊂ ϕ(ϕ(C1 )). Por lo tanto ϕ(C1 ) ∈ C y


en consecuencia ϕ(C1 ) ⊂ C1 . Así, C1 = ϕ(C1 ). Ahora, g es una aplicación
biyectiva de B\f (C1 ) a g(B\f (C1 )) = A\ϕ(C1 ) = A\C1 . Mientras que f es
una aplicación biyectiva de C1 a f (C1 ). Definimos entonces h : A → B dada
por h(a) = f (a) si a ∈ C1 y h(a) = g −1 (a) si a ∈ A\C1 . Es claro que h es una
aplicación biyectiva.

Diremos que A tiene menor cardinalidad que B si existe una aplicación


inyectiva f : A → B, y no existe aplicación inyectiva alguna de B en A.
Usamos la notación |A| < |B|. Cuando queremos denotar que la cardinalidad

Una nota sobre la Teoría Axiomática de Conjuntos


7. Cardinalidad 59

de A es igual o menor a la de B, entonces ponemos |A| ≤ |B|. Note que


|A| ≤ |B| si, y sólo si, existe una aplicación inyectiva de A en B. En particular,
si A ⊂ B, entonces |A| ≤ |B|. Del Teorema ??, |A| = |B| si, y sólo si, |A| ≤ |B|
y |B| ≤ |A|.

Lema 7.1. Sean A y B conjuntos. Si existe una aplicación inyectiva de A en


B, entonces existe una aplicación sobreyectiva de B en A.

Demostración. Si f : A → B es inyectiva, entonces escogemos algún a0 ∈ A


arbitrariamente, y definimos la aplicación sobreyectiva g : B → A, dada por
g(b) = f −1 (b) si b ∈ f (A) y g(b) = a0 si b ∈ B\f (A).

Teorema 7.2 (Cantor). Si A es un conjunto, entonces |A| < #(℘(A)). Dicho de


otra forma, no existe aplicación inyectiva de ℘(A) en A, ni existe aplicación
sobreyectiva de A en ℘(A).

Demostración. Si definimos f (a) = {a}, de A en ℘(A), entonces f es una


aplicación inyectiva. Supongamos que g : A → ℘(A) es alguna aplicación
sobreyectiva. Sea B = {a ∈ A : a ∈ / g(a)}. Entonces, para algún a0 ∈ A,
g(a0 ) = B. Luego, si a0 ∈ g(a0 ) entonces a0 ∈/ g(a0 ), pero si a0 ∈
/ g(a0 )
entonces a0 ∈ g(a0 ). Un absurdo. Por el lema anterior, no existe aplicación
inyectiva de ℘(A) en A.

Recordemos algunas definiciones: un conjunto es finito y tiene cardinal


n, si tiene la misma cardinalidad que {0, ..., n − 1}, para algún n ∈ N. Si
un conjunto tiene la misma cardinalidad que N, entonces es infinito nume-
rable, o solo numerable y tiene cardinal ℵ0 . Si un conjunto contiene un
subconjunto numerable, es infinito. El recíproco requiere una hipótesis extra.

Teorema 7.3. Asumiendo AE, si un conjunto es infinito, entonces contiene un


subconjunto numerable.

Demostración. (Esquema). Sea A infinito. Si AE, entonces existe un buen


orden ≤ sobre A. Luego, definimos f (0) = min A, y recursivamente f (n+1) :=
min A\{f (0), ..., f (n)}. El subconjunto f (N) ⊂ A es numerable.

Una nota sobre la Teoría Axiomática de Conjuntos


60 7. Cardinalidad

Diremos que un conjunto es contable si es finito o bien numerable. Note


que un conjunto A es contable si, y sólo si, existe una aplicación sobreyectiva
f : N → A. La unión contable de conjuntos contables es contable, y si alguno
de tales conjuntos es numerable, entonces la unión es numerable.

Teorema 7.4 (Cantor). El intervalo [0, 1] de R es infinito no numerable.

Demostración. ([14]. Esquema). Desde luego, [0, 1] es infinito pues contiene


al conjunto numerable Q ∩ [0, 1]. Sea p : N → [0, 1] una aplicación inyectiva.
Denotemos pn = p(n), n ≥ 0. Dividamos el intervalo [0, 1] en tres intervalos
cerrados [0, 1/3], [1/3, 2/3] y [2/3, 1]. Sea I1 el primero de estos intervalos tal
que p0 ∈/ I0 . Nuevamente, dividimos el intervalo I0 en tres intervalos cerrados
de igual longitud, y tomamos I1 como el primero de ellos tal que p1 ∈ / I1 .
Recursivamente, construimos una sucesión anidada I0 ⊃ I1 ⊃ I2 ⊃ · · · de
T
intervalos cerrados y acotados, tales que pn ∈ / In . Luego, I = In 6= ∅ y si
x ∈ I, entonces x 6= pn para todo n ≥ 0. Por lo tanto, f no es sobreyectiva.

Decimos que [0, 1] tiene el cardinal del continuo y lo denotamos con la


letra gótica c.

Corolario 7.1. (0, 1) tiene el cardinal del continuo.

Demostración. Definimos la biyección de [0, 1] en (0, 1),


1
 si x = 0,
2


1
h(x) = si x = n1 , n > 0,


 n + 2
x si x 6= 0, x 6= n1 , n > 0.

Corolario 7.2. R tiene el cardinal del continuo.


x
Demostración. La aplicación f (x) = 1+|x| , de R en (0, 1), es biyectiva.

De aquí se sigue que, de hecho, cualquier intervalo de R tiene el cardinal


del continuo. Entonces, cualquier conjunto en R que contenga un intervalo
no trivial, tiene el cardinal del continuo. Pero tales conjuntos no son lo únicos
que tienen el cardinal del continuo.

Una nota sobre la Teoría Axiomática de Conjuntos


7. Cardinalidad 61

Corolario 7.3. El conjunto R\Q, de los números irracionales, tiene el cardinal


del continuo.
Con AE, podemos llegar un poco más lejos.

Teorema 7.5. Asumiendo AE, si A es infinito no numerable y B es contable


entonces A y A\B tienen la misma cardinalidad.

Demostración. Note que A\B = A\A ∩ B, por lo que podemos suponer


que B ⊂ A. Dado que A\B es infinito, contiene un subconjunto numerable C
(Teorema 7.3). Luego, B ∪ C es numerable. Por lo tanto, existe una biyección
g : B ∪ C → C. Entonces la aplicación

g(a) si a ∈ B ∪ C
f (a) =
a si a ∈ A\B ∪ C,

definine una biyección de A en A\B.

El producto cartesiano finito de conjuntos numerables es numerable, pero


el producto cartesiano numerable de conjunos finitos no es numerable en todos
los casos.

Teorema 7.6. El conjunto {0, 1}N es infinito no numerable y tiene el cardinal


del continuo.

Demostración. (Esquema). Sea J el intervalo [0, 1). Para cada x ∈ J,


tomamos la descomposición binaria 0.x0 x1 . . . donde xi ∈ {0, 1}, para todo
i ∈ N. Entonces la regla x 7→ (xi )i∈N define una aplicación inyectiva de
J en {0, 1}N (no puede ser sobreyectiva porque la representación binaria no
admite colas de puros 1’s). Inversamente, si (xi )i∈N ∈ {0, 1}N , definimos el
número x = i xi /10i+1 , cuya representación decimal es x = 0.x0 x1 · · · ∈ J.
P

Entonces (xi )i∈N 7→ x define una aplicación inyectiva de {0, 1}N → J (note
que no sirve la representación binaria pues ésta no admite colas de puros 1’s).
Por el Teorema 7.1, {0, 1}N es infinito no numerable y tiene el cardinal del
continuo.

Una nota sobre la Teoría Axiomática de Conjuntos


62 7. Cardinalidad

El conjunto {0, 1}N se llama comunmente espacio de Cantor, cuando es


dotado de la topología producto de la topología discreta en {0, 1}. El teorema
anterior tiene dos importantes consecuencias.

Corolario 7.4. ℘(N), ℘(Z+ ) y ℘(Z) son conjuntos infinitos no numerables y


tienen la cardinalidad del continuo.

Demostración. (Esquema). Para cada A ⊂ N, definimos xA = (δi (A))i∈N ,


donde δi (A) = 1, si i ∈ A, y δi (A) = 0 si i ∈
/ A. Entonces x 7→ xA definine una
N
aplicación biyectiva de ℘(N) en {0, 1} . El resto de la prueba es análoga.

Corolario 7.5. El conjunto [0, 1]N tiene el cardinal del continuo.

Demostración. (Esquema). Note que {0, 1}N ⊂ [0, 1]N , por lo tanto seá
suficiente probar que [0, 1]N puede aplicarse inyectivamene en {0, 1}N . La
prueba de este último hecho sigue un esquema similar al que se usa para probar
la numerabilidad de los números racionales, que mostramos ilustrativamente
del siguiente modo: Si (xn ) ∈ [0, 1]N , y xn 6= 1, para al menos un n ∈ N,
entonces de las expresiones binararias

x0 = 0.b00 b01 b02 · · ·


x1 = 0.b10 b11 b12 · · ·
x2 = 0.b20 b21 b22 · · ·
.. .. ..
. . .

extraemos la sucesión (b00 , b01 , b10 , b20 , b11 , b02 , ...). Esta regla define una apli-
cación inyectiva (pero no sobreyectiva, pues la representación binaria no ad-
mite colas de 1’s), del conjunto [0, 1]N al conjunto de Cantor.

El cubo de Hilbert es el conjunto [0, 1]N dotado de la topología producto


de la topología usual consigo misma en el intervalo [0, 1] (Ver ...).

Una nota sobre la Teoría Axiomática de Conjuntos


8. La Hipótesis del Continuo 63

8 La Hipótesis del Continuo


¿Cuántos números reales hay? Con esta pregunta casi siempre se pretende
explicar el Problema del Continuo (PC) ([1]). Georg Cantor fue segu-
ramente el primero en planterse esta pregunta. Él llamó al conjunto de los
números reales R, junto con el orden habitual ≤, el continuo ([15], p. 84),
quizá como síntesis intuitiva de la representación geométrica de la “recta”.
Aunque la frase: “Problema del continuo”, apareció publicada por primera vez
hasta 1901 y no por Cantor, sino por Bernstein ([12], p. 56). Como fuere,
hacia 1878, después de probar que R es no numerable (Teorema 7.4), Cantor
formuló entonces una conjetura respecto a PC:

Hipótesis del Continuo (HC). Si A ⊂ R, entonces A es finito, o bien infinito


numerable, o bien infinito no numerable con el cardinal del continuo c.
([12], p. 41).

Tiempo después, hacia 1895, usando otra terminología, Cantor replanteó esta
afirmación, con la fórmula ([12], p. 41).:

2ℵ0 = ℵ1 . (17)

Esta es ahora la forma más común que HC tiene en los libros especializados, y
al parecer es la idea subyacente a la pregunta: ¿cuántos números reales hay?
No entratremos en detalles técnicos, pero la idea de esta igualdad es la
siguiente: El símbolo ℵ0 es el primer número cardinal transfinito, y es de
hecho el cardinal del conjunto de los números naturales N. Del Teorema
7.2, ℵ0 < 2ℵ0 , donde 2ℵ0 es el cardinal del conjunto potencia de N. Note
que, del Corolario 7.4, c = 2ℵ0 . Ahora, la clase de los números cardinales
transfinitos no es conjunto, aunque puede dotarse de un buen orden (ref...).
Cabe entonces considerar el siguiente número cardinal transfinito despues de
ℵ0 , que denotamos como ℵ1 . Por lo tanto, ℵ1 ≤ 2ℵ0 = c. Note que si HC
es falsa, ℵ1 < 2ℵ0 . Entonces la ecuación (17) es una forma equivalente de
plantear HC.
En realidad Cantor no usó el título de “Hipótesis del Continuo”, al parecer
fue Hilbert quien le tildó tal apodo ([12], p. 41). De hecho, lo propuso

Una nota sobre la Teoría Axiomática de Conjuntos


64 8. La Hipótesis del Continuo

como el problema número uno de la famosa lista que presentó en Paris en


1900, como los principales desafíos que debía enfrentar la matemática en el
siglo XX ([7]). Cantor mismo dedicó el resto de su vida a la búsqueda de
una prueba, sin conseguirlo jamás. En el camino logró, sin embargo, algunos
resultados notables. Desde luego, Cantor no fue el único en perderse en el
intento, el propio Hilbert, Serpinsky, Suslin y tantos otros se acumulan en
la fila. Pero otros tantos fracasaron en el intento de refutarlo y del mismo
modo, en el camino se hicieron grandes aportaciones no sólo a la lógica, sino
a otras áreas, como topología, e inclusive en teoría de la medida ([1], [18]).
Quizá el caso más famoso en esta dirección es la “prueba” (de que HC era
falso) que presentó Julius Konig, en una conferencia dentro del tercer congreso
internacional de matemáticos, con Hilbert, Cantor y Zermelo presentes. De
pasó “probó” que PBO era también falso. Según los relatos del suceso, Cantor
estaba consternado con la plática de Konig. Sin embargo, fue el propio Zermelo
quien tan pronto como al día siguiente descubrió que la supuesta prueba de
Konig estaba equivocada ([12]).
Kurt Gödel fue otro gran matemático que miraba críticamente HC. En
realidad creía que de un modo u otro debía ser falsa:

Therefore one may on good reason suspect that the role of the con-
tinuum problem in set theory will be this; that it will finally lead to the
discovery of new axioms which will make it possible to disprove Cantor’s
conjecture. (Gödel, cit. in. [4], p. 4).

Logró probar, por otra parte, que si ZFE es consistente, entonces HC no puede
ser falsa en ZFE, es decir, si de ZFE junto con HC se sigue una contradiction,
entonces también se sigue una contradicción de ZFE ([3]).
Finalmente, hacia 1963, Paul Cohen probó que tampoco HC podía de-
mostrarse, bajo la misma base de consistencia de ZFE. Es decir,

[...] proved that CH [Continuum Hypothesis] is independent of ZF1-ZF9


and AC [i.e. ZFE]. He found a model, a collection of sets for which
AC and ZF1-ZF9 hold, but in this case CH does not; specifically, the
cardinality of 2ℵ0 is ℵ2 . ([3], p. 518).

Una nota sobre la Teoría Axiomática de Conjuntos


8. La Hipótesis del Continuo 65

En conclusión, HC es indecidible en ZFE. Pero el problema no quedó zan-


jado de ninguna manera. La carrera que emprendieron algunos matemáticos,
como anunció Gödel, consistió en encontrar nuevas bases axiomáticas bajo las
cuales HC tenga solución. Este cuento es muy largo para contarse aquí, por
eso remitimos al lector a las referencias usadas.
En cuanto a la teoría que nos ocupa en este libro, HC juega un rol que de
ninguna manera es despreciable:
Assuming the continuum hypothesis, [...] H. Friedman (1980) showed
that it is consistent with the usual Zermelo-Fraenkel set theory, includ-
ing the axiom of choice, that whenever a bounded (possibly nonmea-
surable) function f on [0, 1] × [0, 1] is such that both iterated integral
RR RR
f dxdy and f dydx are defined, they are equal. So the continuum
hypothesis assumption cannot be dispensed with. With it, there exist
quite strange sets: Sierpiński (1920), by transfinite recursion, defines a
set A in [0, 1] × [0, 1] which intersects every line (not only those parallel
to the axes) in at most two points, but which has outer measure 1 for
λ × λ. ([3], p 149).

Hay una versión más amplia de HC, conocida como Hipótesis del Continuo
Generalizada (HCG) (o también llamada Aleph-Hipótesis) la cual establece
[...] for any infinite sets X and Y , if there are 1-1 functions from X into
Y and from Y into 2X , then Y has the same cardinality as either X or
2X . (Dudley, p 515).

O equivalentemente, para cualquier número ordinal α, ℵα = ℵα+1 ([4], p.17).


En este libro no hableremos nunca de números ordinales, pero el lector puede
encontrar los detalles de lo que estamos diciendo en las referecias señaladas.
Sierpinski probó que HCG ⇒ AC ([4], p.17, [3], p. 519), así que aquí la historia
es casi la misma: El mismo Gödel probó en 1940 que ZFE y HCG es consistente
siempre que ZF sea consistente. La mayoría de los matemáticos cree que ZF
es consistente.
Pero por otra parte,
Consider the set S of all well-orderings of N. Let S/I be the set of
all equivalence classes of elements of S under order isomorphism. Then

Una nota sobre la Teoría Axiomática de Conjuntos


66 Bibliografía

S/I is a set with cardinal ℵ1 . There is no known function from S/I onto
[0, 1] and indeed there cannot be, since CH [i.e. Continuum Hypothesis]
is independent [de ZF]. In this sense, some set theorists say, CH is false
in ’the real world.’ ([3], p. 518).

Bibliografía
[1] Ana Álvarez. El problema del continuo antes de cohen (1873-1963).
Aportaciones Matemáticas. Memorias. SMM, 35:61–69, 2005.

[2] José A. Amor. Teoría de conjuntos para estudiantes de ciencias. Temas de


Matemáticas. Facultad de Ciencias, UNAM., México, 2da edition, 2005
(2011 2a reimpresión).

[3] R. M. Dudley. Real Analysis and Probability. Number 74 in Cambridge


studies in advanced mathematics. Cambridge University Press, New York,
2da edition, 2002.

[4] Horst Herrlich. Axiom of Choice. Number 1876 in Lecture Notes in


Mathematics. Springer, 2006.

[5] Carlos Ivorra. La axiomática de la teoría de conjuntos. http://www.uv.


es/~ivorra/Libros/Axiomas.pdf, ? [Acceso: 07/07/2013].

[6] Carlos Ivorra. Lógica y teoría de conjuntos. http://www.uv.es/


~ivorra/Libros/Logica.pdf, 2011. [Acceso: 07/07/2013].

[7] David E. Joyce. Hilbert’s mathematical problems. http://aleph0.


clarku.edu/~djoyce/hilbert/toc.html, March 1997. [Consulta:
11/07/2013].

[8] Shaughan Lavine. Comprendiento el Infinito. Sección de Obras Científicas


y Tecnológicas. Fondo de Cultura Económica., México, 2005. [Traducción
por Esteban Torres del inglés Understanding the Infinite. 1ra ed. Harvard
University Press, 1994].

Una nota sobre la Teoría Axiomática de Conjuntos


Bibliografía 67

[9] Penelope Maddy. Believing the axioms. i. The Journal of Symbolic Logic,
53(2):481–511, 1988.

[10] Per Martin-Löf. 100 years of zermelo’s axiom of choice: What was the
problem with it? Synthese Library, 49(3):209.

[11] J. A. Amor; G. Campero; F. E. Miranda. Teoría de Conjuntos. Curso in-


termedio. Temas de Matemáticas. Facultad de Ciencias, UNAM., México,
Frebruary 2011.

[12] Gregory H. Moore. Zermelo’s axiom of choice. Its origins, development,


and influence. Number 8 in Studies in the history of mathematics and
physical sciences. Springer-Verlag, New York, 1982.

[13] José Ramón Ortiz. El concepto de infinito. Asociación Matemática Vene-


zolana. Boletín volumen, 1(2):59–81, 1994.

[14] John C Oxtoby. Measure and category: A survey of the analogies between
topological and measure spaces. Springer-Verlag New York, 1971.

[15] Michael D. Potter. Sets. An introduction. Oxford University Press, New


York, 1990.

[16] Robert M Solovay. A model of set-theory in which every set of reals is


lebesgue measurable. The Annals of Mathematics, 92(1):1–56, 1970.

[17] Leonard M Wapner. The pea and the sun: a mathematical paradox. A.
K. Peters, LTD, Wellesley MA, 2005.

[18] Fernando Zalamea. Hipótesis del continuo, defìnibilidad y funciones re-


cursivas: historia de un desencuentro. Mathesis, 10:187–203, 1994.

[19] Ernst Zermelo. “ beweis, daß jede menge wohlgeordnet werden kann”.
In Heinz-Dieter Ebbinghaus, Craig G. Fraser, and Akihiro Kanamori,
editors, Ernst Zermelo. Collected Works/Gesammelte Werke, volume I,
chapter Zermelo 1904, pages 80–119. Springer, New York, 2010. [Traduc-
ción al inglés: Proof that every set can be well-ordered, y nota introduc-
toria por Michael Hallet].

Una nota sobre la Teoría Axiomática de Conjuntos


68 Bibliografía

[20] Ernst. (1908) Zermelo. Neuer beweis für die möglichkeit einer wohlord-
nung. In Op. Cit., pages 120–159. New York. [Traducción al inglés: A
new proof of the possibility of a well-ordering, y nota introductoria por
Michael Hallet].

[21] Ernst. (1908) Zermelo. Untersuchungen über die grundlagen der men-
genlehre i. In Op. Cit., pages 160–129. New York. Traducción al inglés:
Investigations in the foundations of set theory I, y nota introductoria por
Ulrich Felgner.

Una nota sobre la Teoría Axiomática de Conjuntos

Вам также может понравиться