MATEMATICA DISCRETA - Adrian Paenza

Cap´ıtulo 0 El principio de inducci´ on El objetivo fundamental de este cap´ıtulo es familiarizarnos con el principio d

Views 106 Downloads 6 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Cap´ıtulo 0

El principio de inducci´ on El objetivo fundamental de este cap´ıtulo es familiarizarnos con el principio de inducci´ on y comenzar a utilizarlo en algunos ejemplos, ya que ser´a una herramienta necesaria a lo largo de toda la asignatura —y de las dem´as asignaturas, no s´olo de este curso. Al final del cap´ıtulo se incluyen una serie de referencias en las que podr´an completarse algunos de los temas que aqu´ı se esbozan; en casi todas ellas hay ejercicios adicionales (a veces, resueltos) para practicar con el principio de inducci´on, pero es bastante m´as formativo tratar de resolver a fondo personalmente unos pocos ejercicios que leer muchas soluciones ajenas.

0.1.

Revisi´ on de los n´ umeros naturales

Para comenzar a llevar a cabo nuestro plan de revisi´on, empezaremos por reflexionar sobre los objetos matem´aticos m´as sencillos o, mejor dicho, que nos son m´as familiares: los n´ umeros naturales. Previamente, pong´amonos de acuerdo en un punto: ¿Cu´ al es el primer n´ umero natural? La cuesti´on no es tan trivial como aparenta. De hecho, en algunos libros se da como respuesta 1 (especialmente en los de An´alisis matem´atico) pero en otros se contesta que es 0 (especialmente en ´ los de Algebra). Esta pluralidad de respuestas obedece, fundamentalmente, al uso que vaya a hacerse de los n´ umeros naturales. Simplificando burdamente, podr´ıamos decir que incluir 0 entre los n´ umeros naturales responde al deseo de operar con ellos de una manera similar para la suma y el producto; es decir, que igual que para el producto se dispone de un n´ umero que multiplicado por cualquier otro deja como resultado el mismo n´ umero, puede parecer conveniente que haya tambi´en un n´ umero que sumado con cualquier otro deje este u ´ltimo como resultado. Tambi´en puede argumentarse que con el cero podemos representar el n´ umero de elementos de un conjunto vac´ıo, de un conjunto sin elementos. Pero en la vida cotidiana, cuando contamos, contamos “algo”, y empezamos por el 1; escribimos normalmente hh 1o ii por hh primeroii, hh 2o ii por segundo, . . . (El 0 parece m´as ‘artificial’ que ‘natural’, valga el juego de palabras. De hecho, el 0 ha tenido una larga y complicada historia: fue introducido inicialmente como un s´ımbolo y no como un “verdadero” n´ umero, ver [3]). Que en libros ‘serios’ se adopte tanto una como otra posibilidad y en ambos casos se desarrolle una teor´ıa coherente de los n´ umeros naturales, parece sugerir que el quid de la cuesti´on no est´ a en las operaciones aritm´eticas, sino en la propia g´enesis de los n´ umeros naturales, en la manera de ‘fabricarlos’. En este sentido, podr´ıamos preguntar ‘ingenuamente’ ¿Cu´ al es la propiedad m´ as importante de los n´ umeros naturales? Tal vez lo esencial no es que ‘el primer’ n´ umero natural sea el 0 o el 1, sino que haya un primer n´ umero natural, al cual sigue otro, y a ´este otro, y a ´este otro, . . . , y as´ı sucesivamente, sin tope. 1

´ CAP´ITULO 0. EL PRINCIPIO DE INDUCCION

2

Utilizando la jerga profesional, lo que importa es la propiedad de inducci´ on del conjunto de los n´ umeros naturales. Antes de desarrollar esta idea, introducimos la siguiente Notaci´ on. En lo sucesivo, denotaremos con N el conjunto de los n´ umeros naturales o enteros positivos 1, 2, 3, . . . y con N0 el conjunto de los n´ umeros enteros no negativos 0, 1, 2, 3, . . . Acordada esta notaci´on, volvamos al asunto de la inducci´ on en N. Tenemos en N, pues, un elemento inicial que denotamos con 1, al que sigue otro elemento denotado por 2, al que sigue otro elemento denotado por 3, al que . . . . Es decir, como propiedad b´ asica de N consideramos que, en general, cada n´ umero natural n tiene un siguiente o sucesor, que acostumbramos a denotar por n + 1 (en realidad, esta es la definici´ on de n + 1, en el sentido de que hh se define 1 + 1ii como el siguiente a 1, es decir, 2; hh se define 2 + 1ii como el siguiente a 2, es decir, 3; hh se define 3 + 1ii como el siguiente a 3, es decir, 4; . . . hh y as´ı sucesivamenteii. Este es un ejemplo de lo que suelen llamarse definiciones recursivas). La insatisfactoria ‘repetici´on infinita’ que deja abierta el hh y as´ı sucesivamenteii anterior (una sucesi´on de definiciones que no acaba nunca) se zanja aplicando la

Inducci´ on matem´ atica. Un conjunto de n´ umeros naturales que contenga a 1 y que con cada n contenga al siguiente, debe contener a todos los n´ umeros naturales. M´as informal: para probar que un conjunto de n´ umeros naturales ‘agota’ todo N, basta que nos aseguremos de que el 1 est´a en ´el, y que demostremos que est´a n + 1 cada vez que est´e n.

0.2.

Principio de inducci´ on

La ‘propiedad de inducci´on’ de N, en la pr´actica, suele formularse en t´erminos de proposiciones (enunciados que tienen sentido en un cierto contexto, y que pueden resultar ciertos o pueden resultar falsos). Si para cada n ∈ N tenemos una proposici´on Pn , entonces Pn puede ser verdadera para algunos valores de n y falsa para otros. Por ejemplo, si Pn es la proposici´on: hh n2 = n ii, entonces P1 es verdadera (ciertamente 12 = 1), mientras que Pn es falsa para todo n 6= 1, n ∈ N (¿podr´ıas justificar por qu´e?); si Pn es la proposici´on: hh

1 + 2 + 3 + ··· + n =

n (n + 1) 2

ii

entonces Pn es verdadera para todo n ∈ N, porque denotando con s la suma del primer t´ermino de la igualdad, 2

+

3

+ · · · + (n − 1) +

s

=

1

+

s

=

n

+ (n − 1) + (n − 2) + · · · +

n

+) 2

+

1

2s = (n + 1) + (n + 1) + (n + 1) + · · · + (n + 1) + (n + 1) = n (n + 1) n (n + 1) , como quer´ıamos probar. 2 ¿Qu´e hacer si no hay demostraci´on ‘a la vista’ ? Supongamos ahora que la proposici´on Pn es la llamada desigualdad de Bernoulli :

y as´ı s =

´ 0.2. PRINCIPIO DE INDUCCION

3

dado n ∈ N, para todo n´ umero real x ≥ −1 se verifica (1 + x)n ≥ 1 + nx. No hay una estrategia directa de ´exito claro: podr´ıamos pensar en el desarrollo de (1+x)n mediante la f´ormula del binomio, que comenzar´ıa por 1+n x+ 21 n (n−1) x2 +· · · , pero la aparici´on de sumandos posiblemente negativos (donde haya potencias impares de x cuando consideremos 0 > x ≥ −1) dificulta el control del tama˜ no del resultado. Sin embargo, es muy sencillo probar que si para alg´ un n es cierta Pn , es decir, se cumple (1 + x)n ≥ 1 + nx

(∗ )

entonces tambi´en es cierta Pn+1 , es decir, se cumple (1 + x)n+1 ≥ 1 + (n + 1) x. En efecto: multiplicando los dos t´erminos de la desigualdad (∗ ) por el n´ umero real no negativo 1 + x, se mantiene el sentido de la desigualdad y as´ı (1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx) (1 + x) = 1 + (n + 1) x + nx2 , y como nx2 ≥ 0, tendremos 1 + (n + 1) x + nx2 ≥ 1 + (n + 1) x y finalmente (1 + x)n+1 ≥ 1 + (n + 1) x. ¿No habr´a alguna forma de sacarle partido a este hecho? Pensemos un momento: el conjunto de los n´ umeros naturales para los que Pn se cumple tiene la propiedad de que con cada n que est´e en ´el, debe estar tambi´en n + 1. De acuerdo con la inductividad de N, bastar´ıa que 1 estuviese en dicho conjunto, para que todos los n´ umeros naturales estuviesen en dicho conjunto —lo que significar´ıa que Pn ser´ıa cierta para todo n´ umero natural n. Pero P1 dice que ha de ser (1 + x)1 ≥ 1 + 1 · x, o sea, 1 + x ≥ 1 + x, trivialmente cierto (incluso para cualquier n´ umero real x sin restricci´ on). As´ı pues, acabamos de demostrar que Pn es cierta para todo n´ umero natural n. Por tanto, ¡hemos encontrado una demostraci´on indirecta, m´as abordable, del resultado que busc´abamos probar! Esta misma situaci´on se repite suficientes veces como para que el m´etodo empleado merecezca un enunciado destacado, con nombre propio. 1. Principio de inducci´ on. Para cada n´ umero natural n, sea Pn una proposici´on que puede ser cierta o falsa, de tal manera que P1 es cierta, y para cada n ∈ N, suponiendo que Pn es cierta se puede demostrar que Pn+1 es cierta. Entonces se cumple que F Pn es cierta para todo n ∈ N. Veamos la aplicaci´on de este principio en algunos ejemplos. Ejemplos. 1. Demostrar que, cualquiera que sea el n´ umero natural n, n X k=1

(La expresi´on

n X k=1

k2 =

n (n + 1) (2n + 1) . 6

k 2 es una manera abreviada de indicar 12 + 22 + · · · + k 2 + · · · + n2 .)

´ CAP´ITULO 0. EL PRINCIPIO DE INDUCCION

4

No se ve una manera obvia de calcular directamente la suma que nos proponen (lo que no quiere decir que no exista). Pero s´ı podemos probar f´acilmente por inducci´on que se cumple la igualdad para todo n. Para ello, tomemos como Pn la proposici´on del enunciado: n X

Pn ::

k2 =

k=1

P1 es cierta: para n = 1,

1 X

n (n + 1) (2n + 1) . 6

k 2 = 12 = 1, mientras que

k=1

1 (1 + 1) (2 · 1 + 1) n (n + 1) (2n + 1) = = 6 6

1·2·3 = 1. 6 Si es cierta Pn para un n, ¿tambi´en es cierta Pn+1 ? Pn+1 ::

n+1 X

k2 =

k=1

(n + 1) (n + 2) (2n + 3) (n + 1) (n + 1 + 1) (2(n + 1) + 1) = 6 6

S´ı: porque n+1 X

k 2 = 12 + 22 + · · · + k 2 + · · · + n2 + (n + 1)2

k=1

=

n X



k 2 + (n + 1)2 =

k=1

= =

n (n + 1) (2n + 1) + (n + 1)2 6

n (n + 1) (2n + 1) + 6(n + 1)2 (n + 1) [n (2n + 1) + 6(n + 1)] = 6 6 (n + 1) [2n2 + n + 6n + 6] (n + 1) [2n2 + 7n + 6] = . 6 6



En la igualdad = hemos empleado la hh hip´otesis de inducci´onii (esto es, que suponemos Pn cierta). Y por u ´ltimo, tambi´en (n + 1) (n + 2) (2n + 3) (n + 1) [(n + 2) (2n + 3)] (n + 1) [2n2 + 7n + 6] = = . 6 6 6 2. Demostrar que, cualquiera que sea el n´ umero natural n, (i) 42n+1 + 3n+2 es divisible por 13; (ii) 22n + 5 es divisible por 3; (iii) 22n + 15n − 1 es divisible por 9. (i) Para cada n´ umero natural n, tomamos Pn ::

42n+1 + 3n+2 es divisible por 13.

Para n = 1, 42+1 + 31+2 = 64 + 27 = 91 = 13 · 7 (P1 es cierta). Dado un n´ umero natural n arbitrario, supongamos cierta la propiedad para n. Pasando a n + 1,  42(n+1)+1 +3(n+1)+2 = 16·42n+1 +3·3n+2 = (13+3)·42n+1 +3·3n+2 = 13·42n+1 +3 42n+1 + 3n+2 , que, aplicando la hip´otesis de inducci´on, es m´ ultiplo de 13 por ser suma de m´ ultiplos de 13. (ii) Para cada n´ umero natural n, tomamos Pn ::

22n + 5 es divisible por 3.

´ 0.2. PRINCIPIO DE INDUCCION

5

para n = 1, 22 + 5 = 4 + 5 = 3 · 3, y si es cierto para un n que 22n + 5 es m´ ultiplo de 3, pasando a n + 1,  22(n+1) + 5 = 4 · 22n + 5 = (3 + 1) · 22n + 5 = 3 · 22n + 22n + 5 , suma de m´ ultiplos de 3. (iii) Para cada n´ umero natural n, tomamos 22n + 15n − 1 es divisible por 9.

Pn ::

Para n = 1, 22 + 15 − 1 = 18 = 9 · 2 (P1 es cierta). Dado un n´ umero natural n arbitrario, supongamos cierta la propiedad para n, de modo que exista un k ∈ N tal que 22n + 15n − 1 = 9k. Pasando a n + 1, 22(n+1) +15(n+1)−1 = 4·22n +15n+14 = 4(9k−15n+1)+15n+14 = 4·9k−3·15n+18 = 9(4k−5n+2). Alternativamente:  22(n+1) + 15(n + 1) − 1 = 4 22n + 15n − 1 − 45n + 18, que ser´a divisible por 9. O incluso de otra forma:  22(n+1) +15(n+1)−1 = 4·22n +15n+15−1 = 22n +3·2n +15n−1+15 = 22n +15n−1+3 22n + 5 , y como 22n + 5 es m´ ultiplo de 3 seg´ un hemos probado, lo anterior sea m´ ultiplo de 9 (aplicando la hip´otesis de inducci´on). 3. Obs´ervese que 1− 

 1 1− 1− 2    1 1 1− 1− 1− 2 3

1 = 2 

1 = 3  1 = 4

1 , 2 1 , 3 1 . 4

Se pide: conjeturar una ley general sencilla que incluya las anteriores como casos particulares, y demostrarla mediante el principio de inducci´on. Parece que se cumple  Pn ::

1−

1 2

     1 1 1 1 1− 1− ··· 1 − = . 3 4 n n

Veamos si podemos probarlo por inducci´on. 1 1 P1 es cierta, trivialmente 1 − = . 2 2 Supongamos cierta Pn . Entonces        1 1 1 1 1 ∗ 1− 1− 1− ··· 1 − 1− = 2 3 4 n n+1 =

  1 1 1− n n+1 1 (n + 1) − 1 1 n 1 = = , n n+1 n n+1 n+1 ∗

es decir, resulta cierta Pn+1 (hemos aplicado la hip´otesis de inducci´on para escribir =).

´ CAP´ITULO 0. EL PRINCIPIO DE INDUCCION

6

0.3.

Principio de inducci´ on ‘completa’

A veces, la ayuda que proporciona suponer cierta Pn para demostrar Pn+1 es insuficiente, y se hace necesario un “apoyo m´as amplio”. No es dif´ıcil ver que, cuando interese, se puede modificar el principio de inducci´on para usar como “hip´otesis de inducci´on” que son ciertas todas las proposiciones P1 , . . . , Pn , y deducir de ellas Pn+1 . El resultado es lo que algunos textos denominan el principio de inducci´ on ‘fuerte’ (ver [D’A-W]) o principio de inducci´ on ‘completa’.1 2. Principio de inducci´ on ‘completa’. Para cada n´ umero natural n, sea Pn una proposici´ on, cierta o falsa, de tal manera que P1 es cierta, y para cada n ∈ N, suponiendo que P1 , P2 , . . . , Pn son ciertas se puede demostrar que Pn+1 es cierta. Entonces se cumple que F Pn es cierta para todo n ∈ N. Veamos la ventaja conseguida en un ejemplo. Recordemos que un n´ umero natural p distinto de 1 es primo si no tiene m´as divisores en N que 1 y el propio p; abordemos ahora el siguiente ejercicio: 4. Probar que para todo n´ umero natural n ≥ 2 existe un n´ umero primo p que divide a n. Con el principio de inducci´on utilizado como hasta ahora, un intento razonable ser´ıa tomar Pn ::

n = 1 o n ≥ 2 y existe un n´ umero primo p que divide a n.

Trivialmente, P1 es cierta. Pero si para un n es cierta Pn , ¿deber´a ser cierta Pn+1 ? ¿de qu´e sirve que n sea divisible por un n´ umero primo p, si eso no implica que p divida a n + 1, ni que ning´ un n´ umero primo ligado con p (el siguiente, por ejemplo) divida a n + 1? Sin embargo, pasemos al principio de inducci´on completa: ahora, partimos de un n tal que no s´olo es cierta Pn , sino tambi´en P1 , P2 , y Pk para cualquier k ≤ n. Entonces: — si n + 1 es primo, basta tomar p = n + 1 para ver que Pn+1 es cierta; — y si n + 1 no es primo, tendr´a un divisor positivo k distinto de 1 y de n + 1; pero los divisores de un n´ umero son menores o iguales que dicho n´ umero (¿por qu´e?); as´ı pues, ser´a k < n + 1, por lo que k valdr´ a a lo m´as n. En consecuencia, Pk es cierta, por nuestra ‘nueva’ hip´otesis de inducci´ on. Y como k 6= 1, esto significa que k admite un divisor primo p, que a su vez ser´a divisor de n + 1; por tanto Pn+1 es igualmente cierta en este caso. En consecuencia, Pn es cierta para todo n, como quer´ıamos demostrar. Comentarios La estrategia de demostraci´on que el principio de inducci´on proporciona recuerda lo que los franceses llaman reculer pour mieux sauter, retroceder para saltar m´as. Comparando las dos versiones que hemos enunciado, podr´ıamos decir que en la primera tomamos una “peque˜ na carrerilla”, de un s´olo paso, mientras que en la inducci´on completa la “carrerilla”se toma desde el principio. Siguiendo con las comparaciones, tambi´en se llama al ‘primer’ principio de inducci´on el principio de las fichas de domin´ o: si pensamos en una colecci´on infinita de fichas de domin´o puestas una tras otra, para tirarlas todas basta con asegurarse de que cae la primera y de que est´en colocadas de forma que cada ficha tire a la siguiente. 1 Su justificaci´ on es sencilla: basta observar que el conjunto S = {n ∈ : P1 , P2 , . . . , Pn son todas ciertas} cumple que 1 ∈ S y que n ∈ S implica n + 1 ∈ S; o aplicar el principio de inducci´ on “normal” a la proposici´ on Qn = P1 “y” P2 “y” . . . “y” Pn , denotada en l´ ogica proposicional por Qn = P1 ∧ P2 ∧ · · · ∧ Pn , que es cierta cu´ ando y s´ olo cuando cada una de las P1 , . . . , Pn son ciertas. N

´ ‘DESPLAZADA’ 0.4. PRINCIPIO DE INDUCCION

0.4.

7

Principio de inducci´ on ‘desplazada’

Sigamos considerando una colecci´ on de proposiciones P1 , P2 , P3 , . . . (una para cada n´ umero natural). A veces se cumple que Pn+1 es cierta siempre que lo sea Pn , aunque P1 sea falsa. Por ejemplo, consideremos Pn : hh n = n + 1ii; obviamente, de n = n + 1 se sigue que n + 1 = (n + 1) + 1, que es Pn+1 , mientras que 1 6= 2. ¿Qu´e conclusiones cabe extraer de este ejemplo trivial? La primera, algo que no hay que olvidar nunca en Matem´aticas: los enunciados matem´aticos dicen exactamente lo que dicen, y hasta que no hayamos comprobado todas las hip´ otesis, no podemos afirmar ninguna tesis. Y concretamente en el principio de inducci´on, no hay que lanzarse sin m´as a probar que Pn implica Pn+1 olvidando probar que P1 es cierta (lo que sucede con cierta frecuencia). La segunda conclusi´on (ahora que ya nos hemos vuelto extremadamente cuidadosos) es que si Pn implica Pn+1 para todo n ∈ N y P1 es falsa, quiz´ a Pn no sea cierta para ning´ un n. ¿Por qu´e quiz´ a solamente? Porque podr´ıa suceder que para alg´ un valor n1 la correspondiente proposici´on Pn1 fuese cierta. Por ejemplo, examinemos Pn : hh n2 > n + 2 ii. Que Pn implica Pn+1 es sencillo de probar: de n2 > n + 2 (n ∈ N) se sigue que (n + 1)2 = n2 + 2n + 1 > n + 2 + 2n + 1 > (n + 1) + 2; y 12 no es estrictamente mayor que 1 + 2, con lo que P1 es falsa. Pero 42 > 4 + 2, luego P4 es cierta. ¿Qu´e provecho se saca de esta informaci´on? Que Pn es cierta al menos para n ≥ 4, seg´ un se deduce aplicando el principio de inducci´on a la proposici´on Qn = Pn+3 . ¿S´olo para estos n es cierta Pn ? En este caso no: tambi´en es cierta P3 . Por tanto, resumiendo: cuando se cumple que Pn+1 es cierta siempre que lo sea Pn , o bien Pn es falsa para todo n o, en caso contrario, hay al menos un valor n1 tal que Pn1 es cierta, y en este supuesto, procediendo como antes, se prueba lo que suele llamarse el principio de inducci´ on ‘desplazada’ (no es una denominaci´on est´andar). 3. Principio de inducci´ on “desplazada”. Sea n1 un n´ umero natural dado, y para cada n´ umero natural n ≥ n1 sea Pn una proposici´on, cierta o falsa, de tal manera que Pn1 es cierta, y para cada n´ umero natural n ≥ n1 , admitiendo que Pn es cierta se puede demostrar que Pn+1 es es cierta, Entonces se cumple que F Pn es cierta para todo n ≥ n1 . Con esta nueva herramienta y las anteriores, el lector puede abordar por su cuenta los ejercicios del apartado siguiente.

0.5.

Ejercicios

0.1. Demostrar que para cada n´ umero natural n tal que n2 + 5n + 1 es un n´ umero par, tambi´en 2 2 (n + 1) + 5(n + 1) + 1 es un n´ umero par. ¿Se sigue de aqu´ı por inducci´on que n + 5n + 1 es siempre un n´ umero par? ¿Cu´al es la conclusi´on correcta? Demostrarlo. 0.2. ¿Para qu´e n´ umeros naturales n es cierta la desigualdad 2n > n2 ? Demostrarlo por inducci´ on. 0.3. Sea S = {n ∈ N : 2n < 2n }. Probar que n + 1 ∈ S siempre que n ∈ S. ¿Se deduce de aqu´ı que S = N? ¿Por qu´e? Si no, ¿qui´en es S? ¿Por qu´e? 0.4. Demostrar que para todo n ∈ N, n X k=1

3

k =



n(n + 1) 2

2 .

´ CAP´ITULO 0. EL PRINCIPIO DE INDUCCION

8 0.5. Demostrar que para todo n ∈ N,

2n 2n X 1 X (−1)k+1 = . k k

k=n+1

k=1

0.6. Observar que 1 = 1; 1 − 4 = −(1 + 2); 1 − 4 + 9 = 1 + 2 + 3; 1 − 4 + 9 − 16 = −(1 + 2 + 3 + 4). Conjeturar una f´ormula general sencilla que incluya las anteriores como casos particulares, y demostrarla mediante el principio de inducci´on. 0.7. Definamos los n´ umeros a1 , a2 , a3 , . . . por a1 = 9, a2 = 36, an+1 = 6an − 9an−1 si n ≥ 2. Probar que an est´a bien definido para todo n y que an = 3n (n + 2). 0.8. Sea u1 = 2, u2 = 3, un+1 = 3un − 2un−1 si n ≥ 2. Probar que un est´a bien definido para todo n y que un = 2n−1 + 1. 0.9. (a) Conjetura una f´ormula para 1 + 3 + · · · + (2n − 1) evaluando la suma para n = 1, 2, 3 y 4. (b) Prueba tu f´ormula usando el principio de inducci´on. 0.10. (a) Conjetura una f´ormula que simplifique el producto       1 1 1 1 1− 1− ··· 1 − 2 . 1− 4 9 16 n (b) Prueba tu f´ormula usando el principio de inducci´on. Para finalizar el cap´ıtulo, un ‘cl´asico’. 0.11. Evaluar el siguiente resultado: Teorema. En cualquier examen, todos los alumnos presentados obtienen la misma calificaci´ on. Demostraci´ on : La haremos por inducci´on. Para cada n ∈ N, sea Pn la proposici´on hh todo conjunto de n alumnos distintos, al realizar un examen, obtiene una u ´nica calificaci´ on.ii Evidentemente, P1 es cierta. Veamos c´omo de Pn se sigue Pn+1 . Supongamos que tenemos un conjunto {A1 , A2 , . . . , An , An+1 } de n + 1 alumnos distintos, con calificaciones a1 , a2 , . . . , an , an+1 . Considerando {A1 , A2 , . . . , An }, tenemos un conjunto de n alumnos distintos, luego por la hip´otesis de inducci´on (estamos admitiendo que Pn es cierta) se tendr´a a1 = a2 = · · · = an . Considerando ahora {A2 , . . . , An , An+1 }, tenemos igualmente un conjunto de n alumnos distintos, de donde a2 = · · · = an = an+1 . Por tanto, hemos encontrado que ) a1 = a2 = · · · = an luego a1 = a2 = · · · = an = an+1 , a2 = · · · = an = an+1 es decir, los n + 1 alumnos han obtenido la misma calificaci´on, como quer´ıamos demostrar.

Bibliograf´ıa [B-S]

Bartle, R. G.- Sherbert, D. R.: Introducci´ on al An´ alisis Matem´ atico de una Variable. Limusa, M´exico, 1990. Trata el principio de inducci´ on en la Secci´on 1.3 (p´ags. 31 a 35). Muy detallado en sus comentarios. Tiene una buena selecci´ on de ejemplos y ejercicios.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs. Prentice-Hall, Upper Saddle River, NJ, 1997. Citado en la(s) p´agina(s) 6 Dedica al principio de inducci´ on su cap´ıtulo 4 (p´ags. 56 a 73). Es un libro muy original en su planteamiento, y contiene una gran cantidad de ejercicios y problemas (algunos con cierto grado de dificultad).

[Ebb]

Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991. Es un exclente libro de consulta, a medio camino entre la historia de las matem´aticas que tienen que ver con la idea de n´ umero y la exposici´on ‘de teoremas’. Alcanza niveles que superan ampliamente el contenido de este curso, pero merece la pena conocerlo. En la p´ag. 15 se encuentra el principio de inducci´ on. No tiene ejercicios.

[Lieb]

Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca Raton, 2000. De planteamiento muy similar al de esta asignatura, difiere en algunos contenidos y en el orden de exposici´ on. El principio de inducci´ on aparece su cap´ıtulo 8 (p´ags. 55 a 68). Tiene ejercicios muy interesantes, y el cap´ıtulo 9 est´a dedicado a demostrar por inducci´on la f´ormula de Euler hh caras + v´ertices = aristas +2ii, que aplica luego al estudio de los cinco s´olidos plat´onicos (cubo, tetraedro, octaedro, icosaedro y dodecaedro).

[Pest]

Pestana, D. & al.: Curso pr´ actico de C´ alculo y Prec´ alculo. Ariel, Barcelona, 2000. Orientado fundamentalmente a servir de base para el An´alisis matem´atico, parte de su contenido coincide con el de nuestra asignatura. Muy claro y muy pr´actico, explica el principio de inducci´on en la p´agina 30, dentro de un cap´ıtulo titulado M´ etodos de demostraci´ on que merece ser le´ıdo en su totalidad.

Documentos en Internet [1] Interactive Real Analysis, Seton Hall University: http://www.shu.edu/projects/reals/infinity/index.html [2] ¿Es el 0 un n´ umero natural?: Math.Sci FAQ, http://db.uwaterloo.ca/~alopez-o/math-faq/node12.html#SECTION00321000000000000000 [3] Historia del cero, The MacTutor History of Mathematics archive, St Andrews University, Escocia: Citado en la(s) p´agina(s) 1 http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Zero.html

9

Cap´ıtulo 1

Introducci´ on a la teor´ıa de conjuntos. En Matem´aticas, los conjuntos aparecen inevitablemente, bien de forma expl´ıcita o bien de forma impl´ıcita, y podemos encontrar ejemplos en abundancia. Acabamos de examinar una propiedad ‘de los n´ umeros naturales’, el principio de inducci´on, que no es una propiedad de cada n´ umero natural (del 1, o del 2, o del 46) sino del conjunto de los n´ umeros naturales. Igualmente, cuando se dice que hay “infinitos n´ umeros primos”, no expresamos una propiedad de cada n´ umero primo, sino del conjunto que forman: “el conjunto de los n´ umeros primos es infinito”. Muchos conceptos geom´etricos son conjuntos: rectas, planos, circunferencias, cualquier figura geom´etrica es un conjunto de puntos; hablamos del “conjunto de soluciones” de una ecuaci´on o de un sistema de ecuaciones; un espacio vectorial es un conjunto en el que se ha definido una suma y un producto por escalares que cumplen unas ciertas reglas, etc. Sin embargo, el estudio de los conjuntos como objetos matem´aticos en s´ı mismos, es decir, la Teor´ıa de conjuntos como disciplina matem´atica, no aparece hasta la segunda mitad del siglo XIX, creada por G. Cantor. La formalizaci´on de la Teor´ıa de conjuntos como una teor´ıa axiom´atica result´o extremadamente dif´ıcil, pese a lo simple y poco problem´atica que parec´ıa la noci´on de conjunto. Sus primeros desarrollos hicieron aparecer las famosas paradojas de Burali-Forti, de Cantor, de Russell; las discusiones sobre el axioma de elecci´on y la hip´otesis del continuo . . . Pero lo que a nosotros nos interesa de la Teor´ıa de conjuntos es que proporciona un lenguaje b´asico para formular enunciados y argumentos que el lenguaje ordinario har´ıa farragosos o incomprensibles. No nos vamos a enfrentar a ella como “estudiosos”, sino como “usuarios”: nos vamos a limitar a una Teor´ıa intuitiva de conjuntos, planteando este cap´ıtulo esencialmente como el texto [D-H]. Para completar las explicaciones y ver m´as ejemplos, son interesantes [D’A-W], [Ham], [Lieb],[Lip], [O.U.], [S-T], etc.

1.1.

Conjuntos.

1.1.1.

Idea intuitiva de conjunto: pertenencia. Igualdad e inclusi´ on entre conjuntos. Conjunto potencia.

En un enfoque intuitivo de la teor´ıa de conjuntos, como el que aqu´ı vamos a emplear, la noci´ on de conjunto no difiere esencialmente de lo que por tal se entiende en el lenguaje ordinario: una colecci´ on de objetos, reales o abstractos (los elementos del conjunto) agrupados como un todo, percibidos simult´aneamente como un nuevo objeto. Desde el punto de vista matem´atico, esta descripci´ on de lo que entendemos como conjunto no sirve como definici´on: es demasiado vaga e imprecisa, y utiliza otras palabras (‘colecci´on’, ‘agrupamiento’) que no son m´as que sin´onimos de la palabra ‘conjunto’.

11

CAP´ITULO 1. CONJUNTOS

12

Tampoco nos ayuda recurrir a los diccionarios; en el de la Real Academia Espa˜ nola, por ejemplo, encontramos lo siguiente: conjunto : . . . k 4. m. Agregado de varias personas o cosas. k . . . k 6. La totalidad de los elementos o cosas poseedores de una propiedad com´ un, que los distingue de otros. Por ejemplo, los n´ umeros pares. k . . . k 9. (Mat.) La totalidad de los entes matem´aticos que tienen determinada propiedad. El CONJUNTO de los n´ umeros primos. k . . . Es muy dif´ıcil plantear una definici´on de ‘conjunto’ que no recurra a sin´onimos hasta caer en un c´ırculo vicioso: es un concepto tan b´asico que s´olo podemos dar descripciones aproximativas del mismo. De hecho, cuando fue preciso establecer una teor´ıa de conjuntos rigurosa desde el punto de vista matem´atico, una Teor´ıa axiom´ atica de conjuntos, la noci´on de ‘conjunto’ qued´o entre los t´erminos no definidos.1 Proseguiremos, entonces, con nuestras ideas intuitivas de conjunto y de elementos de un conjunto. Si A es un conjunto y a es uno de sus elementos, diremos que a pertenece a A, y escribiremos a ∈ A, mientras que la notaci´on a∈ /A indicar´a que a no pertenece (no es un elemento) de A. Cuando A es un conjunto con pocos elementos, por ejemplo el de los cinco primeros enteros positivos pares, suele indicarse listando sus elementos entre llaves, A = {2, 4, 6, 8, 10}. Pero lo m´as habitual es que los conjuntos vengan descritos por una propiedad que caracteriza a sus elementos: por ejemplo, como citaba el diccionario, el conjunto de todos los enteros positivos pares. Este conjunto se escribe {x : x es un entero positivo par }, y se lee el conjunto de los x tales que x es un entero positivo par. En general, si tenemos una propiedad P (x) relativa a ciertos x, {x : P (x) es cierta }, es el conjunto de los x tales que x es cierta. 1 Cuando una determinada rama de las matem´ aticas se desarrolla axiom´ aticamente, se toman como punto de partida (1) unos t´erminos no definidos (2) unas relaciones no definidas (3) unos axiomas que relacionan los t´erminos no definidos y las relaciones no definidas. A partir de ellos, se van definiendo nuevos t´erminos y se desarrollan teoremas basados en los axiomas o en teoremas anteriores. Por ejemplo, en la geometr´ıa plana eucl´ıdea, ‘punto’ y ‘recta’ son t´erminos no definidos, ‘punto que est´ a en una recta’ o, lo que es equivalente, ‘recta que pasa por un punto’, es una relaci´ on no definida, y son axiomas, entre otros:

‘Dos puntos distintos est´ an en una y una sola recta’ (equivalentemente, ‘por dos puntos distintos pasa una recta y una sola’) ‘Dos rectas distintas no pueden tener m´ as de un punto com´ un’. En la Teor´ıa axiom´ atica de conjuntos, son t´erminos no definidos ‘elemento’ y ‘conjunto’, la relaci´ on no definida es ‘pertenencia de un elemento a un conjunto’, y son axiomas, entre otros, Axioma de extensi´ on. Dos conjuntos A y B son iguales si y s´ olo si cada elemento que pertenece a A tambi´en pertenece a B y cada elemento que pertenece a B tambi´en pertenece a A. Axioma de especificaci´ on. Sea P (x) una afirmaci´ on y sea A un conjunto. Existe entonces un conjunto al que pertenecen exactamente los elementos a que pertenecen a A para los que el enunciado P (a) es cierto. Puede verse un comentario m´ as amplio sobre los sistemas axiom´ aticos en la p´ agina web de la asignatura.

1.1. CONJUNTOS.

13

Frecuentemente, los x son elementos de un conjunto U fijado de antemano (los enteros, en nuestro primer ejemplo). En vez de escribir entonces {x : x ∈ U y P (x) es cierta }, se emplea la notaci´on. {x ∈ U : P (x) es cierta }. Por otra parte, pensar que todos los elementos que se van a manejar quedan dentro de un conjunto “universal” (el universo del discurso) permite eliminar paradojas de car´acter l´ogico, como la no existencia del ‘conjunto de todos los conjuntos’ o la paradoja de Russell, que no hace al caso comentar aqu´ı. (Ver [Ham], p. 111 y ss., donde se explica c´omo la axiom´atica de Zermelo-Fraenkel resuelve estas paradojas; otra soluci´on, la axiom´atica de von Neumann-Bernays-G¨odel, se apunta en [S-T], cap. 13, p. 252 y ss.) Los elementos de un conjunto determinan el conjunto. Precisemos esta idea.

Criterio de igualdad de conjuntos. Dos conjuntos A y B son iguales si y s´olo si constan de los mismos elementos, es decir: (1) para cada x ∈ A tambi´en x ∈ B; (2) para cada x ∈ B tambi´en x ∈ A. Un conjunto muy particular es el conjunto vac´ıo, que no posee ning´ un elemento. Se representa por el s´ımbolo ∅. Los conjuntos con un solo elemento suelen denominarse conjuntos unipuntuales (o tambi´en ‘singuletes’, por la denominaci´on inglesa ‘singletons’). Definici´ on 1.1.1. Dados dos conjuntos A y B, diremos que A es un subconjunto de B si cada elemento de A es tambi´en elemento de B, es decir, si x ∈ A implica x ∈ B. Para indicar que A es un subconjunto de B escribiremos A ⊆ B. Tambi´en se lee hh A est´ a coni i tenido en B . ¡Atenci´ on! Algunos libros usan la notaci´on A ⊂ B para indicar que A est´a contenido en B, mientras que en otros A ⊂ B significa que hh A est´a contenido en B y es distinto de B ii. Para evitar confusiones, en este u ´ltimo caso nosotros pondremos A ⊂ B, le´ıdo hh A contenido estrictamente en 6= B ii. El criterio de igualdad de conjuntos puede reformularse en t´erminos de subconjuntos de manera obvia. Corolario 1.1.2. Dos conjuntos A y B son iguales si y s´ olo si A ⊆ B y B ⊆ A. Ejemplos. Para cualquier conjunto A, trivialmente A ⊆ A y ∅ ⊆ A. Que x ∈ A es equivalente a que {x} ⊆ A (¡pero, en general, no a x ⊆ A ni a {x} ∈ A!). Veremos ejemplos m´as interesantes en ejercicios posteriores. Definici´ on 1.1.3. Dado un conjunto A, el conjunto ℘(A) = {S : S ⊆ A} cuyos elementos son justamente los subconjuntos de A se denomina conjunto potencia de A o conjunto de partes de A.

Ejercicios 1.1. Sea A = {2n + 1 : n ∈ N}. Decir si las siguientes afirmaciones son ciertas o falsas, justificando la respuesta: (i) si x = (2n + 1)2 para alg´ un n ∈ N, entonces x ∈ A. (ii) si x ∈ A, entonces x = (2n + 1)2 para alg´ un n ∈ N.

CAP´ITULO 1. CONJUNTOS

14 (iii) si existen y ∈ A, z ∈ A tales que x = yz, entonces x ∈ A. (iv) si x ∈ A, entonces existen y ∈ A, z ∈ A tales que x = yz. 1.2. Probar que {a} = {b, c} si y s´olo si a = b = c.

1.3. Probar que {{a}, {a, b}} = {{c}, {c, d}} si y s´olo si a = c y b = d. 1.4. ¿Cu´ales de los conjuntos A = {x ∈ R : x2 = 1}, B = {x ∈ R : x4 = 1}, C = {x ∈ C : x2 = 1}, D = {x ∈ C : x4 = 1} son iguales y cu´ales son distintos? ¿Por qu´e? ¿Cu´ales son subconjuntos de otros? 1.5. Demostrar las siguientes igualdades entre conjuntos: (i) {x ∈ R : x3 − x > 0} = {x ∈ R : −1 < x < 0 o x > 1}. (ii) {(x, y, z) ∈ R3 : x = y, x + y + z = 1} = {(x, y, z) ∈ R3 : x = t/2, y = t/2, z = 1 − t para alg´ un t ∈ R}. 1.6. ¿Es cierto que A ⊆ B si y s´olo si ℘(A) ⊆ ℘(B)? ¿Por qu´e? 1.7. Sea A0 = ∅, An = ℘(An−1 ), n ∈ N. Describir expl´ıcitamente A1 , A2 , A3 , A4 . ¿Cu´ antos elementos tiene cada uno de estos conjuntos? ¿Cu´antos elementos crees que tendr´a An para un n arbitrario?

1.1.2.

Operaciones con conjuntos: uni´ on, intersecci´ on, complemento.

Definici´ on 1.1.4. Dados dos conjuntos A y B, su uni´ on es el conjunto A ∪ B = {x : x ∈ A o x ∈ B}, formado por los elementos que pertenecen al menos a uno de los dos conjuntos (pueden pertenecer a los dos). La intersecci´ on de A y B es el conjunto A ∩ B = {x : x ∈ A y x ∈ B}, formado por los elementos que pertenecen simult´aneamente a ambos conjuntos. Si A ∩ B = ∅, diremos que A es disjunto con B (y entonces tambi´en B es disjunto con A). El complementario de B respecto de A es el conjunto A \ B = {x : x ∈ A y x ∈ / B}, formado por los elementos de A que no pertenecen a B. Se le denomina tambi´en la diferencia entre A y B. Cuando todos los conjuntos que se manejan son subconjuntos de un conjunto X dado expl´ıcitamente o inequ´ıvocamente sobreentendido, se pone Ac en vez de X \ A, abreviando hh el complementario de A respecto de X ii por el complementario de A, sin m´as. Diagramas de Venn. Las operaciones con conjuntos permiten realizar “c´alculos” que se intuyen mejor utilizando diagramas de Venn , que consisten en dibujar en el plano regiones, limitadas por circunferencias o curvas adecuadas, que representan a los conjuntos. Por ejemplo, en los diagramas

1.1. CONJUNTOS.

15

hemos representado dos conjuntos A y B como las regiones limitadas por una elipse grande y una circunferencia peque˜ na. Las zonas rayadas representan, sucesivamente, A, B, A ∪ B, A ∩ B, A \ B. Los “c´alculos” con conjuntos comparten algunas reglas (¡no todas!) con las operaciones entre n´ umeros. Proposici´ on 1.1.5. Dados tres conjuntos cualesquiera A, B y C, se tienen las siguientes igualdades: (i) (A ∪ B) ∪ C = A ∪ (B ∪ C). (ii) (A ∩ B) ∩ C = A ∩ (B ∩ C). (iii) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). (iv) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C). Demostraci´ on. Ver [D-H], pp. 10-11. Proposici´ on 1.1.6. Leyes de De Morgan. Sean A, B, subconjuntos de un conjunto X. Entonces (i) (A ∪ B)c = Ac ∩ B c . (ii) (A ∩ B)c = Ac ∪ B c . Demostraci´ on. Ejercicio. Las definiciones de uni´on e intersecci´on de dos conjuntos pueden ampliarse a una colecci´ on arbitraria de conjuntos. Definici´ on 1.1.7. Sea C una colecci´ on no vac´ıa de conjuntos (un conjunto no vac´ıo cuyos elementos son a su vez conjuntos). La uni´ on de C es el conjunto [ [ C= A = {x : x ∈ A para alg´ un A ∈ C}, A∈C

formado por los elementos x que pertenecen a uno al menos de los conjuntos de C. La intersecci´ on de C es el conjunto \ \ C= A = {x : x ∈ A para todos A ∈ C}, A∈C

formado por los elementos x que pertenecen a todos los conjuntos de C. En particular, cuando C = {A, B} reencontramos las definiciones de A ∪ B y A ∩ B. En el caso de que sea C = {A1 , A2 , . . . , Ak }, se emplea la notaci´on k [ n=1

An ,

k \ n=1

An ,

CAP´ITULO 1. CONJUNTOS

16 en vez de

S

C,

T

C, respectivamente. As´ı mismo, cuando C = {An : n ∈ N}, suele emplearse [ \ An , An , n∈

N

n∈

N

o alguna otra notaci´on similar. En ocasiones se manejan ‘conjuntos de ´ındices’ cualesquiera, no solamente N: por ejemplo, C = {Ax : x ∈ R}, donde Ax = (−∞, x) = {y ∈ R : y < x}. En general, si I es un conjunto no vac´ıo arbitrario, y para cada i ∈ I tenemos dado un cierto conjunto Ai , podemos considerar C = {Ai : i ∈ I} y definir [ [ [ \ \ \ Ai = C = {Ai : i ∈ I}, Ai = C = {Ai : i ∈ I}, i∈I

i∈I

de manera que resultar´a [

Ai = {x : x ∈ Ai para alg´ un ´ındice i ∈ I},

i∈I

\

Ai = {x : x ∈ Ai para todos ´ındices i ∈ I}.

i∈I

Cuando C viene dado de este modo, diremos que se trata de una familia de conjuntos con conjunto de ´ındices I. Daremos una definici´on m´as ‘formal’ posteriormente. Proposici´ on 1.1.8. Leyes de De Morgan. Dado un conjunto X, sea C = {Ai : i ∈ I} una familia de subconjuntos de X [es decir, C ⊆ ℘(X)] con conjunto de ´ındices I. Entonces c T S (1) = i∈I Aci . i∈I Ai c S T (2) = i∈I Aci . i∈I Ai Demostraci´ on. Ejercicio.

Ejercicios 2.1. Sea A un subconjunto de un conjunto dado X. Comprobar que (Ac )c = A. 2.2. Probar que dados dos subconjuntos A, B de un conjunto X, entonces X \ A = B si y s´ olo si A ∪ B = X, A ∩ B = ∅. 2.3. Dados dos conjuntos A, B, demostrar que: (1) A ⊆ B si y s´olo si A ∪ B = B. (2) A ⊆ B si y s´olo si A ∩ B = A. (3) A ⊆ B si y s´olo si A \ B = ∅. 2.4. Dado un conjunto X, sean A, B, C ⊆ X. (1) Probar que A \ B = A ∩ B c . (2) Aplicando lo anterior y las leyes de De Morgan, dar otra expresi´on de A \ (B \ C). (3) ¿Es lo mismo A \ (B \ C) que (A \ B) \ C? ¿Por qu´e? 2.5. Dados dos conjuntos A, B, probar que (A \ B) ∪ (B \ A) = (A ∪ B) \ (A ∩ B) (este conjunto se denomina diferencia sim´ etrica o discrepancia de A y B.) 2.6. Sea A0 = ∅, An = An−1 ∪ {An−1 }, n ∈ N. Describir expl´ıcitamente A1 , A2 , A3 , A4 . ¿Cu´ antos elementos tiene cada uno de estos conjuntos? ¿Cu´antos elementos crees que tendr´a An para un n arbitrario? ¿C´omo probar´ıas tu conjetura?

1.2. RELACIONES.

17

2.7. Sea A1 un conjunto arbitrario, y definamos An+1 = ℘(An ), n ∈ N, A = B ⊆ A si y s´ olo si ℘(B) ∈ A?

S

n An .

¿Es cierto que

2.8. Para cada k ∈ N, sea Ak = {n ∈ Z : n ≥ k}. Comprobar que A1 ⊇ A2 ⊇ . . . ⊇ Ak ⊇ Ak+1 ⊇ . . . T y, por tanto, kn=1 An = Ak 6= ∅ cualquiera que sea k ∈ N. T Sin embargo, n∈ An = ∅.     1 1 2.9. Para cada n ∈ N, sea An = 0, 1 − n , Bn = 0, 1 − n . Comprobar que An est´a estricta2 3 mente contenido en Bn para todo n. ¿Est´a la uni´on de los An estrictamente contenida en la uni´ on de los Bn ? S S (No: probar que n∈ An = n∈ Bn = [0, 1).) N

N

N

1.2.

Relaciones.

1.2.1.

Pares ordenados. Producto cartesiano de conjuntos. Relaciones.

El lector ha manejado ya pares ordenados en situaciones concretas: al introducir un sistema de coordenadas en el plano, por ejemplo, cada punto viene representado por un par ordenado (x, y) de n´ umeros reales. La diferencia esencial entre el par ‘ordenado’ (x, y) y el conjunto {x, y} (el ‘par sin ordenar’) es que distinguimos (x, y) de (y, x), considerando iguales dos pares (x, y) y (u, v) si y s´olo si x = u, y = v. Ampliando esta idea, podemos considerar pares ordenados (a, b) cuyo primer elemento a pertenezca a un conjunto cualquiera A y su segundo elemento b pertenezca a un conjunto cualquiera B, manteniendo su ‘propiedad caracter´ıstica’:

Criterio de igualdad de pares ordenados. Dados dos conjuntos arbitrarios A, B, y dos pares ordenados (a, b), (a0 , b0 ), con a, a0 ∈ A, b, b0 ∈ B, (a, b) = (a0 , b0 ) si y s´olo si a = a0 y b = b0 . (Como curiosidad, se˜ nalemos que es posible dar una definici´ on de par ordenado en t´erminos de conjuntos.2 ) Definici´ on 1.2.1. El producto cartesiano de dos conjuntos A y B es el conjunto A × B = {(a, b) : a ∈ A, b ∈ B} formado por todos los pares ordenados cuyo primer elemento est´ a en A y el segundo en B. Ejemplos. El conjunto de las coordenadas de los puntos del plano es R × R. Pero quiz´a el primer producto cartesiano de su vida (de un conjunto de letras por un conjunto de n´ umeros) lo haya manejado el lector en el ‘juego de los barcos’. Definici´ on 1.2.2. Una relaci´ on binaria en un conjunto A es un subconjunto R del producto cartesiano A × A de A por s´ı mismo. En vez de escribir (a, b) ∈ R , suele ponerse a R b, le´ıdo hh a est´ a relacionado con b en la relaci´ on R ii. 2

Concretamente, Kuratowski dio la siguiente definici´ on formal: (a, b) = {{a}, {a, b}}.

Si se revisa el ejercicio 1.3, se ver´ a c´ omo esta definici´ on encaja adecuadamente con la idea intuitiva.

CAP´ITULO 1. CONJUNTOS

18

Ejemplos. (1) Sea R el conjunto de las rectas del plano. Se define en R la relaci´ on de incidencia poniendo: para dos rectas r, s ∈ R, es r R s cuando y s´ olo cuando r y s tienen alg´ un punto com´ un. (Esta relaci´on se expresa brevemente diciendo hh r corta a sii) (2) En el mismo conjunto, se define la relaci´ on de paralelismo k poniendo: para dos rectas r, s ∈ R, es rks cuando y s´ olo cuando r y s son paralelas, es decir, o no tienen ning´ un punto com´ un o coinciden. (3) Sea C el conjunto de las circunferencias del plano. Se define en C la relaci´ on de tangencia poniendo: para dos circunferencias C1 , C2 ∈ C, es C1 R C2 cuando y s´ olo cuando C1 y C2 son tangentes. (4) En N, se define la relaci´ on de divisibilidad | poniendo: para m, n ∈ N, es m | n cuando y s´ olo cuando m divide a n (i.e., n es un m´ ultiplo de m). (5) An´alogamente se define la relaci´ on de divisibilidad en Z. (6) Dado un conjunto X, se define en ℘(X) la relaci´ on de inclusi´ on ⊆ poniendo: para A, B ∈ ℘(X), es A ⊆ B cuando y s´ olo cuando A es un subconjunto de B. Las propiedades m´as interesantes de las relaciones se recogen en la siguiente definici´on. Definici´ on 1.2.3. Sea R una relaci´ on (binaria) en un conjunto A. Diremos que R es • reflexiva si para todo a ∈ A es a R a; • sim´ etrica si siempre que para a, b ∈ A es a R b, tambi´en es b R a; • antisim´ etrica si para a, b ∈ A, que sea simult´ aneamente a R b y b R a obliga a que a = b; • transitiva si siempre que para a, b, c ∈ A es a R b y b R c, tambi´en es a R c. Ejercicio. ¿Cu´ales de estas propiedades, y cu´ales no, tienen las relaciones que hemos definido anteriormente?

1.2.2.

Relaciones de equivalencia y particiones. Conjunto cociente.

Definici´ on 1.2.4. Una relaci´ on de equivalencia en un conjunto A es una relaci´ on (binaria) en A que tiene las propiedades reflexiva, sim´ etrica y transitiva. Ejemplos. 1.- El prototipo es la relaci´on de igualdad en cualquier conjunto: a R b cuando a = b. 2.- La relaci´on de paralelismo entre rectas es la u ´nica relaci´on de equivalencia de las seis que hab´ıamos definido en el apartado anterior. 3.- Dado un espacio vectorial E y un subespacio vectorial M de E, la relaci´on R definida por x R y si x, y ∈ E y y − x ∈ M es una relaci´on de equivalencia porque 0 = x − x ∈ M para todo x ∈ E, x − y = −(y − x) ∈ M siempre que y − x ∈ M , y z − x = (z − y) + (y − x) ∈ M cuando y − x, z − y ∈ M. 4.- Otro ejemplo importante de relaci´on de equivalencia, que estudiaremos con m´as detalle posteriormente, es la congruencia en Z m´ odulo m: fijado m ∈ N con m ≥ 2, diremos que dos enteros a, b ∈ Z son congruentes m´ odulo m, en s´ımbolos a ≡ b (m´od m), cuando m | (b−a) es decir, cuando exista un k ∈ Z tal que b − a = km. Puesto que a − a = 0 · m, b − a = km implica a − b = (−k)m, y de b − a = km, c − b = `m se sigue c − a = (c − b) + (b − a) = (` + k)m, vemos que esta relaci´ on tiene efectivamente las propiedades reflexiva, sim´etrica y transitiva. Las congruencias son hh las matem´aticas del tiempoii: la esfera del reloj marca las horas m´ odulo 12, los d´ıas de la semana van seg´ un congruencias m´odulo 7, los meses m´odulo 12 (el decimotercer mes vuelve a ser enero); pero tambi´en conocemos ejemplos de otro tipo: los cuentakil´ometros de los coches funcionan seg´ un congruencias m´odulo 100 000.

1.2. RELACIONES.

19

Como se indica en [D-H], “el inter´es de las relaciones de equivalencia est´a en el hecho de que constituyen una abstracci´on de los procesos ordinarios de clasificaci´on”: permiten repartir el conjunto en ‘bloques’ disjuntos, las llamadas clases de equivalencia. Pasemos a explicar este aspecto. Definici´ on 1.2.5. Sea R una relaci´ on de equivalencia en un conjunto A. Dado a ∈ A, la clase de equivalencia de a en la relaci´ on R es el conjunto [a] = {b ∈ A : a R b}. El conjunto cuyos elementos son las clases de equivalencia de R es el conjunto cociente de A por R , denotado por A/ R , con lo cual A/ R = {[a] : a ∈ A}, y as´ı A/ R ⊆ ℘(A). Notemos que siempre a ∈ [a], por la propiedad reflexiva de R . Ejemplos. Examinemos cu´ales son las clases de equivalencia en las relaciones que hemos visto anteriormente. 1.- Si a R b cu´ando y s´olo cuando a = b, [a] consta del u ´nico elemento a, es decir, [a] = {a} en este caso. El conjunto cociente es el conjunto de los subconjuntos unipuntuales de A (que no es lo mismo que A, aunque casi lo parezca). 2.- En la relaci´on de paralelismo, cada clase de equivalencia consta de una recta y todas sus paralelas (es lo que se llama un haz de rectas paralelas), todas las que tienen ‘la misma direcci´on’. Hay, pues, tantas clases de equivalencia como ‘direcciones’. 3.- Para cada x ∈ E, [x] = x + M = {y ∈ E : y = x + z para alg´ un z ∈ M } (comprobarlo). El ´ conjunto cociente se denota por E/M , y se denomina espacio vectorial cociente (se ver´a en Algebra lineal que realmente puede ser dotado de una estructura de espacio vectorial). Gr´aficamente, si E es un espacio vectorial real de dimensi´on dos (un plano) y M es un subespacio de dimensi´on uno (una recta que pasa por el origen) las clases de equivalencia son las rectas paralelas a M ; si E es un espacio vectorial real de dimensi´on tres (el espacio ordinario) y M es un subespacio de dimensi´on uno (una recta que pasa por el origen), las clases de equivalencia siguen siendo las rectas paralelas a M , mientras que si M es de dimensi´on dos (un plano que pasa por el origen), las clases de equivalencia son los planos paralelos a ´este. 4.- En la relaci´on de congruencia m´odulo m, para cada a ∈ Z es [a] = a + mZ = {b ∈ Z : b = a + km para alg´ un k ∈ Z}. Estas clases de equivalencia suelen denominarse clases de restos m´odulo m, porque dos enteros a y b est´an en la misma clase si y s´olo si dan el mismo resto al ser divididos por m, es decir, si y s´ olo si a = pm + r, b = qm + r para enteros adecuados p, q y r, con 0 ≤ r < m (comprobarlo). Para m = 2, encontramos dos clases de equivalencia: el conjunto de los enteros pares y el conjunto de los enteros impares. En general, el conjunto cociente, que se denota por Zm , ¿cu´antos elementos tiene? Tantos como restos encontramos al dividir por m: 0, 1, . . . m − 1; es decir, m elementos. Una relaci´on de equivalencia permite ‘separar en trozos’ el conjunto, tomando cada clase de equivalencia como uno de los trozos. Concretamente, se tiene: Proposici´ on 1.2.6. Sea R una relaci´ on de equivalencia en un conjunto no vac´ıo A. Entonces cada elemento de A est´ a en una y s´ olo una de las clases de equivalencia definidas por R . Para probarlo, nos apoyaremos en el siguiente

CAP´ITULO 1. CONJUNTOS

20

Lema 1.2.7. Sea R una relaci´ on de equivalencia en un conjunto no vac´ıo A. Dados b, c ∈ A es [b] = [c] si y s´ olo si b R c. Demostraci´ on. Suponiendo [b] = [c], como c ∈ [c] = [b], se sigue que b R c. Rec´ıprocamente, sea b R c. Si x ∈ [b], ser´ıa b R x, que con c R b (propiedad sim´etrica de R ) dar´ıa c R x por transitividad, o sea, x ∈ [c]; y an´alogamente, de x ∈ [c] obtenemos c R x, que con b R c da b R x y finalmente x ∈ [b]. Ahora podemos demostrar la proposici´on anterior.

Demostraci´ on de la proposici´ on 1.2.6. Obviamente, cada elemento de A est´ a al menos en una clase de equivalencia: a ∈ [a] para cada a ∈ A por ser R reflexiva. Y no puede estar en m´as de una: si a ∈ [b] y a ∈ [c], esto significar´ıa que b R a y c R a (por definici´on), luego a R c (propiedad sim´etrica de R ) y finalmente b R c (propiedad transitiva), con lo que aplicando el lema [b] = [c]. La ‘descomposici´on en bloques’ de un conjunto se denomina partici´on del conjunto. Definici´ on 1.2.8. Una partici´ on de un conjunto no vac´ıo A es una colecci´ on C de subconjuntos no vac´ıos de A (i.e., C ⊆ ℘(A) \ {∅}) tal que cada x ∈ A pertenece a uno y uno s´ olo de los S ∈ C. En otras palabras, C verifica que: 1.

S

2.

si S, T ∈ C y S 6= T , S ∩ T = ∅.

S∈C

S = A,

Puesto que cada clase de equivalencia [a] contiene al menos al elemento a, la proposici´on 1.2.6 nos dice que el conjunto cociente A/ R (el conjunto de clases de equivalencia) es una partici´ on de A. Que definir una relaci´on de equivalencia o definir una partici´on es ‘pr´acticamente lo mismo’ se prueba en el siguiente teorema. Teorema 1.2.9. Sea R una relaci´ on de equivalencia en un conjunto no vac´ıo A. Entonces, el conjunto de las clases de equivalencia es una partici´ on de A. Rec´ıprocamente, si C es una partici´ on de A, existe una relaci´ on de equivalencia R (y una sola) tal que las clases de eqivalencia de R son exactamente los conjuntos de la partici´ on C. Demostraci´ on. S´olo falta probar el rec´ıproco. Supongamos, pues, que tenemos una partici´on C de A. ‘Arrancando’ de C, hemos de llegar a construir una relaci´on de equivalencia R sobre A cuyas clases de equivalencia sean precisamente los conjuntos S ⊆ A que forman la partici´on C. Reflexionando sobre el lema 1.2.7, no es dif´ıcil pensar en la relaci´on siguiente: • pondremos a R b para dos elementos a, b ∈ A, si y s´olo si existe un S ∈ C tal que a ∈ S y b ∈ S. ¿Tenemos as´ı ciertamente una relaci´on de equivalencia? Dado a ∈ A, como C es una partici´ on, existe S ∈ C tal que a ∈ S, luego a R a cualquiera que sea a y as´ı R es reflexiva. De la propia definici´on se sigue que es sim´etrica. Para ver que es transitiva, observemos que si a R b existe un S ∈ C tal que a ∈ S y b ∈ S, y si b R c existe un T ∈ C tal que b ∈ T y c ∈ T ; pero entonces b ∈ S ∩ T , lo que por ser C una partici´on obliga a que S = T , deduci´endose que a, c ∈ S = T y a R c. ¿Son las clases de equivalencia de R exactamente los S ∈ C? Es decir: ¿cada clase de equivalencia de R est´a en C? ¿y cada S ∈ C es una clase de equivalencia de R ? Notemos que dados a ∈ A, S ∈ C, se tiene a ∈ S si y s´olo si [a] = S.

1.2. RELACIONES.

21

En efecto, trivialmente a ∈ [a] siempre, luego si [a] = S, a ∈ [a] = S Rec´ıprocamente, si a ∈ S, todo b ∈ S cumple a R b y por tanto b ∈ [a]; y al rev´es, si b ∈ [a], seg´ un la definici´on de R existe un T ∈ C tal que a, b ∈ T ; pero entonces a ∈ S ∩ T , luego S = T y b ∈ S. En consecuencia: Dado a ∈ A, es [a] ∈ C, pues como C es una partici´on de A, debe existir S ∈ C tal que a ∈ S, y as´ı [a] = S. Dado S ∈ C, S = [a] para alg´ un a ∈ A, pues S es no vac´ıo y habr´a al menos un a ∈ S, con lo cual S = [a] para este a. Finalmente, si queremos comprobar que la relaci´on R que hemos construido es la u ´nica que tiene estas clases de equivalencia, basta aplicar el lema 1.2.7. Ejemplos. 1. Sea A el conjunto de los n´ umeros enteros pares y B el conjunto de los n´ umeros enteros impares. Entonces {A, B} es una partici´on de Z, y la relaci´on de equivalencia que define es la congruencia m´odulo 2. 2. Poniendo A = {x ∈ R : x > 0}, B = {0}, C = {x ∈ R : x < 0}, {A, B, C} es una partici´ on de R. Si R es la relaci´on de equivalencia que define, es x R y si y s´olo si x = y = 0 o x 6= 0 6= y y x e y tienen el mismo signo. Ejercicio. Compr´ uebese, para cada una de las relaciones de equivalencia que hemos encontrado, que las clases forman una partici´on del correspondiente conjunto.

1.2.3.

Relaciones de orden.

Definici´ on 1.2.10. Una relaci´ on de orden en un conjunto A es una relaci´ on (binaria) en A que tiene las propiedades reflexiva, antisim´ etrica y transitiva. Ejemplos. 1.- El prototipo es la relaci´on de orden en cualquier subconjunto de R: a R b cuando a ≤ b. 2.- En todo conjunto se puede definir una relaci´on de orden trivial: la igualdad, a R b si y s´ olo si a = b. 3.- Dado un conjunto X, la inclusi´ on entre subconjuntos de X es una relaci´on de orden en ℘(X). 4.- La relaci´on de divisibilidad en N es una relaci´on de orden, pero no lo es la divisibilidad en Z (falla ‘por poco’ la propiedad antisim´etrica). 5.- En C puede definirse el orden lexicogr´ afico de la siguiente manera: para z1 , z2 ∈ C, es z1 ≤ z2 cuando y s´ olo cuando 0. Entonces b ∈ N, y b ≥ 1. Sea F = {z ∈ Z : zb ≤ a}. Este es un conjunto no vac´ıo, pues si a ≥ 0 contiene a 0 y si a < 0 contiene a a, porque de b ≥ 1, multiplicando por a (que es negativo) se sigue ab ≤ a. Adem´as, est´a acotado superiormente por |a|, puesto que si z ∈ F y z ≥ 0, de 1 ≤ b se pasa a z ≤ zb = a, y si z < 0 trivialmente z < 0 ≤ |a|. Aplicando el principio del m´aximo, existe c = m´ax F . As´ı c ∈ F y c + 1 ∈ / F (ver la construcci´ on gr´afica en la nota posterior); por tanto cb ≤ a,

(c + 1)b > a, o sea cb + b > a.

Tomando r = a − cb, se deduce de estas desigualdades que 0 ≤ r < b = |b| y a = cb + r. Para demostrar la unicidad del cociente y del resto, supongamos que hemos encontrado enteros c1 , c2 , r1 , r2 tales que c1 b + r1 = a = c2 b + r2 ,

0 ≤ r1 < |b| = b,

0 ≤ r1 < |b| = b.

De las dos igualdades se sigue que r2 − r1 = (c1 − c2 )b. Pero tambi´en resulta −b < −r1 ≤ r2 − r1 ≤ r2 < b, y as´ı −b < r2 − r1 = (c1 − c2 )b < b, lo cual s´olo es posible si c1 − c2 = 0 (¿por qu´e?) En definitiva, c1 = c2 y en consecuencia r1 = r2 , como quer´ıamos probar. El caso b < 0 se reduce al anterior sin m´as que observar que a = cb+r si y s´olo si a = (−c)(−b)+r.

48

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

Nota. Las figuras que siguen ilustran gr´aficamente la situaci´on. Para a ≥ 0, se ve que, simplemente, ‘estamos midiendo a con b como unidad de medida’, trasladando un segmento de longitud b hacia la derecha el n´ umero m´aximo de veces que podamos, sin llegar a sobrepasar a (por la derecha); para a < 0, trasladar´ıamos la unidad de medida hacia la izquierda, justo hasta igualar o sobrepasar a (por la izquierda).

Ejemplo. La divisi´on entera de 1 por 2 da cociente 0 y resto 1; la de −1 por 2 da cociente −1 y resto 1; la de 1 por −2, cociente 0 y resto 1, y la de −1 por −2, cociente 1 y resto 1. La divisi´ on entera en maple y Mathematica Los programas de c´alculo simb´olico, como maple y Mathematica , permiten obtener sin dificultad el cociente y el resto de una divisi´on entera cuando el dividendo y el divisor no son negativos. En caso contrario, las cosas se complican. • maple : — El cociente entero de un entero no negativo m por un entero no nulo n se obtiene escribiendo iquo(m,n) (‘integer quotient’ de m y n); — El resto de la divisi´on entera de un entero no negativo m por un entero no nulo n se obtiene escribiendo irem(m,n) (‘integer remainder’ de m y n); — si m es un entero negativo, iquo(m,n) e irem(m,n) dan los enteros q y r tales que m = n · q + r, |r| < |n| y r ≤ 0. ¿C´omo podremos entonces conseguir el cociente y el resto que hemos definido nosotros? Pi´enselo el lector. • Mathematica : — El cociente entero de un entero cualquiera m por un entero positivo n se obtiene escribiendo Quotient[m,n] — El resto de la divisi´on entera de un entero cualquiera m por un entero positivo n se obtiene escribiendo Mod[m,n] — si n es un entero negativo, Quotient[m,n] y Mod[m,n] dan los enteros q y r tales que m = n·q+r, |r| < |n| y r ≤ 0. En el ejemplo anteriormente comentado, resultar´ıa:

´ 2.2. NUMEROS ENTEROS.

m 1 −1 1 −1

n 2 2 −2 −2

cociente 0 −1 0 1

49

resto 1 1 1 1

maple iquo(m,n) irem(m,n) 0 1 0 −1 0 1 0 −1

Mathematica Quotient[m,n] Mod[m,n] 0 1 −1 1 −1 −1 0 −1

Ejercicios 2.1. Sea a un entero cualquiera y sean b y m enteros positivos. Si q es el cociente y r es el resto de la divisi´on entera de a por b, probar que q es el cociente y mr es el resto de la divisi´on entera de ma por mb. 2.2. Sean a, b, c enteros con b > 0, c > 0. Si q es el cociente de la divisi´on entera de a por b y q 0 es el cociente de la divisi´on entera de q por c, probar que q 0 es el cociente de la divisi´on entera de a por bc. 2.3. Demostrar, utilizando el algoritmo de la divisi´on, que si un n´ umero entero es a la vez un cuadrado y un cubo, entonces se puede escribir en la forma 7k o 7k + 1.

2.2.3.

Representaci´ on decimal y binaria. Bases de numeraci´ on

Cuando escribimos hh el n´ umero 1984 ii , estamos usando una notaci´on abreviada para el n´ umero 4 + 8 · 10 + 9 · 102 + 1 · 103 . Con el convenio subyacente, nos bastan las diez cifras o d´ıgitos decimales hh 0, 1, 2, 3, 4, 5, 6,7, 8, 9 ii para representar cualquier n´ umero entero no negativo (para representar un n´ umero entero negativo arbitrario, a˜ nadimos un signo hh − ii a la izquierda de la representaci´ on de su valor absoluto). Pero, ¿por qu´e utilizar esta representaci´on precisamente? El propio nombre d´ıgito sugiere la respuesta cl´asica: porque contamos con los dedos, y eso hace aparecer el 10 como un n´ umero base razonable. Sin embargo, nada impide intentar una representaci´on binaria en lugar de la decimal, es decir, que usemos los d´ıgitos binarios hh 0, 1 ii para reescribir 1984 = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n , con ck = 0 ´ o 1. Observando que N

= c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n = c0 + (c1 + c2 · 2 + · · · + cn · 2n−1 ) · 2 = c0 + (c1 + (c2 + · · · + cn · 2n−2 ) · 2) · 2 = · · · = c0 + (c1 + (c2 + (· · · + (cn · 2) · · · 2) · 2) · 2,

se vislumbra un procedimiento para ir obteniendo los ck : c0 es el resto de la divisi´on de N por 2; si N1 es el cociente, c1 es el resto de la divisi´on de N1 por 2; si N2 es el cociente resultante, c2 es el resto de la divisi´on de N2 por 2; si . . . etc., hasta cn−1 , mientras que cn es el u ´ltimo cociente. Por tanto, dividiendo por 2 sucesivamente, restos

1984 0

992 0

496 0

248 0

124 0

62 0

31 1

15 1

7 1

3 1

1

lo que deja 1984 = 0 + 0 · 2 + 0 · 22 + 0 · 23 + 0 · 24 + 0 · 25 + 1 · 26 + 1 · 27 + 1 · 28 + 1 · 29 , que por analog´ıa escribir´ıamos 11111000000(2 o con alguna notaci´on similar que destaque que se trata de una representaci´on binaria.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

50

¿Qu´e inter´es puede tener una representaci´on as´ı, disponiendo como disponemos de nuestra ‘confortable’ notaci´on decimal? El creador del sistema binario, Leibniz, lo ve´ıa, entre otras cosas, como una imagen del ‘misterio de la creaci´on’: el 1 representaba a Dios y el 0 la Nada, de la que todas las cosas fueron creadas. Trescientos a˜ nos m´as tarde, resulta que la mayor´ıa de los ordenadores actuales manejan los n´ umeros a trav´es de su representaci´on binaria, que luego convierten en decimal. La ventaja que esto ofrece es que cada n´ umero se registra en “bits” (binary digits) y cada bit se corresponde con uno de dos estados posibles (pasa corriente o no pasa). Estas dos condiciones corresponden a los valores 1 y 0, respectivamente. As´ı, un n´ umero representado por una sucesi´ on de 1 y 0 puede almacenarse en un ordenador como una cadena de bits. Pero la gran ventaja del sistema binario, que s´olo necesita dos caracteres, es a veces su gran inconveniente: incluso los n´ umeros peque˜ nos requieren muchas cifras en su escritura. Los n´ umeros en representaci´on binaria son, por tanto, muy largos y de manejo inc´omodo. Pese a ello, como los ordenadores est´an formados por dispositivos digitales que s´olo tienen dos estados estables posibles, asimilados a 0 y a 1, puede decirse que casi todos ellos ‘trabajan’ en sistema binario. Para paliar los inconvenientes del sistema binario hay distintas soluciones. Como comprobaremos inmediatamente, cualquier entero b mayor o igual que 2 puede tomarse como base de un sistema de numeraci´on. Si la base b es una potencia de 2, la ‘traducci´on’ del sistema binario a esta base es muy c´omoda. Por esto, algunos programas de ordenador, sobre todo cuando se trabaja en lenguajes de ensambladores o en lenguajes de alto nivel como C, emplean el sistema octal (base 8), con d´ıgitos hh 0, 1, 2, 3, 4, 5, 6, 7 ii, o el hexadecimal, usado tambi´ en en el mundo de la comunicaci´on (las cifras h h hexadecimales son 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F ii). Todas estas representaciones son ejemplos particulares de notaciones posicionales: un mismo s´ımbolo (un d´ıgito) tiene distinto valor seg´ un la posici´on que ocupe. Cada ‘lugar’ tiene un ‘peso’, que en nuestro caso corresponde a las potencias sucesivas 1 = b0 , b = b1 , b2 , b3 , . . . , de la base b. 2 Que es posible usar cualquier entero b mayor o igual que 2 como base de un sistema de numeraci´on se sigue de una aplicaci´on reiterada de la divisi´on entera. Proposici´ on 2.2.4 (Teorema fundamental de la numeraci´ on). Dado un entero b ≥ 2, todo entero positivo n se escribe de manera u ´nica en la forma n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 ,

(2.1)

con cj ∈ Z, 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0. Para indicar esta igualdad escribiremos n = (ck ck−1 . . . c1 c0 )b , ´ o tambi´en

n = ck ck−1 . . . c1 c0 (b ,

y diremos que ´esta es la representaci´on de n en la base b. Demostraci´ on. Probaremos la existencia de representaci´on mediante el principio de inducci´on completa. Llamemos Pn al enunciado n admite una representaci´on del tipo (2.1). Entonces P1 es cierta, con k = 0 y c0 = 1. Supongamos cierta Pm para todo m ≤ n, y demostremos que es cierta Pn+1 . Dividiendo n + 1 por b, obtendremos n + 1 = mb + r, con 0 ≤ r < b y m ≥ 0. Pero forzosamente m ≤ n, ya que en caso contrario ser´ıa m > n, luego m ≥ n + 1, y en tal caso mb ≥ (n + 1)b > n + 1 (recordemos que b ≥ 2), con lo cual n + 1 = mb + r ≥ mb > n + 1, imposible. 2

El lector conoce representaciones que no son posicionales: la numeraci´ on romana, la ‘notaci´ on cient´ıfica’. Obs´ervese que todas representaciones son convencionales, y es la clase de uso y manipulaci´ on a la que est´ an destinadas la que marca su conveniencia y utilidad.

´ 2.2. NUMEROS ENTEROS.

51

As´ı pues, si m = 0, n + 1 = r con 0 < r < b, que es una representaci´on del tipo (2.1). Y si m 6= 0, por la hip´otesis de inducci´on tendremos m = ck bk + ck−1 bk−1 + · · · + c1 b + c0 , con 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0, luego n + 1 = mb + r = ck bk+1 + ck−1 bk + · · · + c1 b2 + c0 b + r, que nos da la representaci´on del tipo (2.1) que est´abamos buscando. Comprobada la existencia de representaci´on, demostremos su unicidad. Como n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 = (ck bk−1 + ck−1 bk−2 + · · · + c1 )b + c0 ,

0 ≤ c0 < b,

resulta que c0 es el resto de la divisi´on entera de n por b, determinado un´ıvocamente por n y b, luego c0 es u ´nico. A su vez, el cociente de esa divisi´on, un´ıvocamente determinado por n y b, es q = ck bk−1 + ck−1 bk−2 + · · · + c1 , y reiterando el argumento anterior vamos obteniendo que los c1 , . . . , ck−1 est´an un´ıvocamente determinados como restos de las sucesivas divisiones por b, y ck como cociente de la u ´ltima divisi´ on, que se produce cuando llegamos a un cociente < b. Esto prueba la unicidad. La demostraci´on anterior proporciona adem´as un algoritmo ‘te´orico’ para calcular los cj mediante divisiones sucesivas ‘en escalera’ por la base b; esquem´aticamente n c0

|b n1

|b

c1

n2

..

.

|b nk−1 ck−1

|b ck ck

|b 0

En direcci´on contraria, de la representaci´on de un n´ umero en base b podemos obtener el valor ‘te´orico’ directamente de la propia definici´on n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 o, con un menor n´ umero de operaciones, mediante el conocido algoritmo de Horner-Ruffini: ck b) ck

ck−1 ck−2 ··· 2 ck b ck b + ck−1 b ··· ck b + ck−1 ck b2 + ck−1 b + ck−2 · · ·

c1 c0 k ck + · · · + c2 b ck b + · · · + c1 b ck bk−1 + · · · + c1 ck bk + · · · + c1 b + c0 bk−1

Pero, en la pr´actica, los c´alculos ‘de verdad’ con n´ umeros ¡se realizan sobre sus representaciones! Eso supone disponer de buenos algoritmos para llevar a cabo las operaciones aritm´eticas (i.e., para sumar, restar, multiplicar, dividir). En base 10, sabemos c´omo efectuar estas operaciones, aunque quiz´a no nos hayamos preguntado el por qu´e de ese c´ omo. Ahora es buen momento. Si se tiene presente el significado de la representaci´on en base b, las ‘reglas tradicionales’ para efectuar las operaciones aritm´eticas en base 10 quedan perfectamente justificadas (sumar “llevando”, multiplicar por un n´ umero de varias cifras en filas sucesivas desplazadas un lugar a la izquierda, etc.) Y, lo que es a´ un mejor, vemos que las mismas reglas son adaptables para efectuar estas operaciones en cualquier base. Por ejemplo, como en base 2 es 0 + 0 = 0, 1 + 0 = 1, pero 1 + 1 = 10, si

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

52

sumamos dos n´ umeros de varias cifras a la manera tradicional, s´olo hemos de tener la precauci´ on de “llevar 1” cuando sumemos 1 + 1. Supongamos que se trata de calcular m + n, donde m = 100110(2 y n = 11011(2 ; entonces m + n = (1 · 25 + 0 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 0) + (1 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 1) = (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + (0 + 1) = (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + 1 = (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 · 2 + 0) · 21 + 1 = (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + (1 + 0)) · 22 + 0 · 21 + 1 = (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 · 2 + 0) · 22 + 0 · 21 + 1 = (1 + 0) · 25 + (0 + 1) · 24 + (1 + (0 + 1)) · 23 + 0 · 22 + 0 · 21 + 1 = etc., que es lo que que realmente queremos indicar cuando escribimos, prescindiendo del sub´ındice (2 por comodidad, “llevo” : +1 +1 +1 +1 +1 m: n: m+n:

1 1

0

0 1 0

0 1 0

1 0 0

1 0 1 1 0 1

An´alogamente se van adaptando las operaciones m´as complicadas. Cambios de base Establecida la existencia y unicidad de representaci´on en cualquier base b ≥ 2, la cuesti´ on que se suscita inmediatamente es: ¿c´omo pasar de la representaci´on de un n´ umero n en una base b a la representaci´on en una nueva base β? Cuando entre b y β no haya ninguna relaci´on ‘especial’, no podemos apelar a m´as recursos que los que hemos se˜ nalado en el apartado anterior. Por ejemplo, ya hemos visto c´omo expresar el n´ umero decimal 1984 en base 2, y si nos dan un n´ umero binario como 11010011(2 , su representaci´on decimal ser´ıa

2)

1 1 0 1 0 0 1 2 6 12 26 52 104 1 3 6 13 26 52 105

1 210 211

Pero en circunstancias especiales puede haber simplificaciones. Esto sucede, en particular, si una de las bases es una potencia de la otra, como es el caso cuando se considera b = 2 y β = 8 = 23 , o b = 2 y β = 16 = 24 . En la primera situaci´on, como n = c0 + c1 · 2 + c2 · 22 + c3 · 23 + c4 · 24 + c5 · 25 + c6 · 26 + c7 · 27 + c8 · 28 + c9 · 29 + · · · = (c0 + c1 · 2 + c2 · 22 ) + (c3 + c4 · 2 + c5 · 22 ) · 23 + (c6 + c7 · 2 + c8 · 22 ) · (23 )2 + · · · , con los cj = 0 o 1, es obvio que si n = d0 + d1 · 8 + d2 · 82 + · · · , con los dk enteros no negativos < 8, por la unicidad de representaci´on, necesariamente d0 = c0 + c1 · 2 + c2 · 22 ,

d1 = c3 + c4 · 2 + c5 · 22 ,

d2 = c6 + c7 · 2 + c8 · 22 ,

...

lo que nos lleva a la siguiente regla: para cambiar la representaci´on de un n´ umero en base 2 a base 8, se agrupan las cifras binarias de tres en tres, de derecha a izquierda, y se sustituye cada grupo por su expresi´on en base 8.

´ 2.2. NUMEROS ENTEROS.

53

Por ejemplo: 1100100101010(2 → [1][100][100][101][010] → 14452(8 . Y rec´ıprocamente, para cambiar la representaci´on de un n´ umero en base 8 a base 2, cada d´ıgito octal se sustituye por las tres cifras binarias que lo representan en base 2 (incluyendo ceros a la izquierda cuando sea preciso). Por ejemplo, 537264(8 → [101][011][111][010][110][100] → 101011111010110100(2 . Razonando an´alogamente, cuando b = 2, β = 16, se agrupan/sustituyen cifras en/por bloques de cuatro. Facilita las cosas disponer de una tabla de ‘equivalencias en binario’ de las cifras hexadecimales (D significa ‘decimal’, B ‘binario’, H ‘hexadecimal’): D B H

0 0 0

1 1 1

2 10 2

3 11 3

4 100 4

5 101 5

6 110 6

7 111 7

8 1000 8

9 1001 9

10 1010 A

11 1011 B

12 1100 C

13 1101 D

14 1110 E

15 1111 F

Recursos inform´ aticos Los programas de c´alculo permiten, por lo general, obtener las cifras de cualquier representaci´ on en una base dentro de tama˜ nos ‘no disparatados’. En maple , se dispone de la orden convert(n,base,β); donde n es un n´ umero decimal y β la nueva base, que da una lista con los d´ıgitos de la representaci´ on del n´ umero en base β. Por ejemplo, convert(17,base,3); da [2,2,1]. Otra opci´on es convert(`,base,α,β); donde ` es una lista de cifras en base α y β la nueva base, que devuelve una lista con los d´ıgitos en base β que representan el mismo n´ umero. Por ejemplo, convert([2,2,1],base,3,10); da [7,1]. En Mathematica , la orden IntegerDigits[n,b] da una lista de los d´ıgitos en base b del n´ umero decimal n, mientras que b^^n donde n es la representaci´on en base b de un n´ umero, da el valor decimal del n´ umero. Por ejemplo, IntegerDigits[10!] da {3, 6, 2, 8, 8, 0, 0}, IntegerDigits[10!,2] da {1,1,0,1,1,1,0,1,0,1,1,1,1,1,0,0,0,0,0,0,0,0}, y 16^^16c91a3 da 23892387. En la red es f´acil encontrar applets de Java que realizan conversiones de base interactivamente. P. ej., en la siguiente direcci´on puede pasarse ‘instant´aneamente’ de base decimal a base binaria y viceversa. http://www.vincesplace.com/TraditionalCourses/cis121/assignments/BinaryNum/BinaryNum.htm

Ejercicios 3.1. Convertir a sistema decimal y binario los n´ umeros hexadecimales ACABA y FE0. 3.2. En el sistema hexadecimal, ¿es cierto que B0B0 + A0A = BABA? 3.3. Sin pasar a representaci´on decimal, ¿c´omo efectuar´ıas en base 2 las sumas 1011(2 + 11(2 y 101110(2 + 100011(2 ?

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

54

Para debatir. Puesto que 2 + 2 = 11 en base 3 y 2 + 2 = 10 en base 4, ¿habr´a que cambiar la frase hecha hh esto es tan cierto como que dos y dos son cuatroii a hh esto es tan cierto como que dos y dos son cuatro . . . en base diezii? (Una buena discusi´on deber´ıa empezar con la distinci´on entre ‘s´ımbolo’ o ‘representaci´on’ y ‘cosa representada’.)

2.2.4.

M´ aximo com´ un divisor. Algoritmo de Euclides.

Definici´ on 2.2.5. Sean a, b ∈ Z. Decimos que a divide a b, o que a es un divisor de b, o que b es m´ ultiplo de a, escrito a|b, si existe c ∈ Z tal que b = ac; expresado de otra forma, si el resto de la divisi´ on de b por a es 0. Diremos entonces que c es el cociente exacto b/a. Proposici´ on 2.2.6. La divisibilidad tiene las siguientes propiedades: dados enteros arbitrarios a, b, d, m, n, (i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (xi) (xii)

n|n d|n y n|m implica d|m d|n y d|m implica d|(an + bm) d|n implica ad|an ad|an y a 6= 0 implica d|n 1|n, −1|n m|n ⇐⇒ −m|n ⇐⇒ m| − n n|0 0|n implica n = 0 d|n y n 6= 0 implica |d| ≤ |n| d|n y n|d implica |d| = |n| d|n y d 6= 0 implica (n/d)|n

(propiedad reflexiva) (propiedad transitiva) (propiedad de linealidad) (propiedad de multiplicaci´on) (ley de cancelaci´on) (1 y −1 dividen a cualquier entero) (y as´ı m|n ⇐⇒ |m|||n|) (todo entero divide a 0) (0 s´olo divide a 0) (propiedad de comparaci´on) (antisimetr´ıa ‘parcial’) (n/d se llama el divisor conjugado de d)

Demostraci´ on. Probemos, por ejemplo, (x). Si d|n y n 6= 0, |n| = |d| · m para alg´ un m ∈ Z; pero necesariamente m ≥ 0 y m 6= 0, luego m ≥ 1 y |n| ≥ |d|. M´ aximo com´ un divisor Si a, b, son n´ umeros enteros no nulos, existe m = m´ax F , donde F = {k ∈ Z : k|a, k|b} (1 y −1 ∈ F , y k ∈ F =⇒ k ≤ m´ın{|a|, |b|}, y podemos aplicar el principio del m´aximo). Adem´as, m ≥ 1 (1 ∈ F ), luego m ∈ N; de hecho, m = m´ax{k ∈ N : k|a, r|b}. Esto justifica la siguiente definici´on. Definici´ on 2.2.7. Sean a, b, n´ umeros enteros no nulos. Su m´ aximo com´ un divisor es el mayor n´ umero, natural siempre, que divide a a y b simult´ aneamente. Lo denotaremos por mcd(a, b). A veces se ampl´ıa la definici´on poniendo mcd(a, 0) = |a|, mcd(0, 0) = 0. Para calcular el m´aximo com´ un divisor de dos n´ umeros no hace falta m´as herramienta que la divisi´on entera, como justifican los siguientes resultados. Lema 2.2.8. Si a, b, son n´ umeros enteros no nulos tales que a = cb + r, se tiene que mcd(a, b) = mcd(b, r). Demostraci´ on. Si k es un divisor com´ un de a y b, como r = a − cb, por la propiedad (iii) de linealidad k es un divisor de r, y por tanto todo divisor com´ un de a y b es un divisor com´ un de b y r. Rec´ıprocamente, si k 0 es un divisor com´ un de b y r, como a = cb + r, nuevamente por la propiedad (iii) de linealidad k 0 es un divisor de a, y por tanto todo divisor com´ un de b y r es un divisor com´ un de a y b. En consecuencia, el conjunto de divisores comunes a a y b es el mismo que el de divisores comunes a b y r. Aplicando la definici´on, mcd(a, b) = mcd(b, r), como quer´ıamos probar.

´ 2.2. NUMEROS ENTEROS.

55

Lema 2.2.9. Si a, b, son n´ umeros enteros no nulos tales que b | a, entonces mcd(a, b) = |b|. Demostraci´ on. Ciertamente |b| es un divisor com´ un de b y a en estas circunstancias; y si k es un entero positivo que divide a b, k ≤ |b| seg´ un hemos se˜ nalado anteriormente, luego mcd(a, b) = |b|.

Supongamos ahora que tratamos de calcular el m´aximo com´ un divisor de dos n´ umeros de buen tama˜ no, 1769 y 551 por ejemplo. Haciendo la divisi´on entera, 1769 = 3×551+116, y seg´ un el primer lema, d = mcd(1769, 551) = mcd(551, 116). A su vez, 551 = 4 × 116 + 87, luego d = mcd(116, 87). Pero 116 = 87 + 29 y 87 = 3 × 29, con lo que finalmente d = mcd(87, 29) = 29 (segundo lema). ¿Hemos tenido suerte? Si reflexionamos un momento sobre el proceso seguido, vemos que puede aplicarse a enteros positivos arbitrarios a y b: pues tomando como a el mayor y b el menor (si son iguales no necesitamos hacer cuentas), al efectuar la divisi´on entera de a por b obtenemos un resto no negativo r1 estrictamente menor que b; si r1 = 0, ya tenemos el m´aximo com´ un divisor de a y b (= b, segundo lema); si no, d = mcd(a, b) = mcd(b, r1 ), con la ventaja de que hemos pasado a n´ umeros m´ as peque˜ nos, y dividiendo b por r1 pasar´ıamos a d = mcd(a, b) = mcd(r1 , r2 ), donde r2 es el resto de la divisi´on de b por r1 , estrictamente menor que r1 . Reiterando, puesto que en el peor de los casos ir´a disminuyendo al menos en 1 el valor de los restos, al cabo de un n´ umero finito de pasos hemos de llegar a resto 0, y podemos aplicar el segundo lema para concluir que el divisor actual (resto del paso anterior) es el m´aximo com´ un divisor. Formalizando este proceso, conocido ya por Euclides, tenemos (ver [C-C-S]): Definici´ on 2.2.10. Algoritmo de Euclides. • Input: dos enteros positivos a y b. • Output: el m´ aximo com´ un divisor de a y b. Paso 1: Reemplazar (simult´ aneamente)  a por b, y  b por el resto de la divisi´ on de a por b. Paso 2: Repetir el Paso 1 hasta que b sea 0. Paso 3: Devolver a. Podemos esquematizarlo de la siguiente manera: restos & dividendos ← divisores cocientes

a

r1 b c1

r2 r1 c2

r3 r2 c3

······ ······ ······

rn−1 rn−2 cn−1

0 rn−1 = d cn

y entonces d = mcd(a, b) como hemos probado anteriormente. Proposici´ on 2.2.11. Algoritmo de Euclides. Dados dos n´ umeros enteros positivos a y b con a > b, obtenemos su m´ aximo com´ un divisor d = mcd(a, b) procediendo por divisiones enteras sucesivas, como se ha indicado anteriormente, hasta obtener resto nulo. El m´ aximo com´ un divisor de a y b es entonces el u ´ltimo resto no nulo. La hip´otesis de que a y b sean enteros positivos no supone ninguna restricci´on esencial, dado que mcd(a, b) = mcd(|a|, |b|). Por tanto, el algoritmo de Euclides basta para poder calcular el m´aximo com´ un divisor de dos enteros no nulos arbitrarios. Hay adem´as una informaci´on importante contenida en ´el, que merece la pena destacar como se ver´a en aplicaciones posteriores: el m´aximo com´ un divisor de a y b es una “combinaci´on lineal de a y b con coeficientes enteros”.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

56

Proposici´ on 2.2.12. Identidad de B´ ezout. Sean a y b enteros no nulos, y d = mcd(a, b). Entonces existen enteros u, v tales que d = ua + vb. Demostraci´ on. Supongamos primero que a y b son positivos, y apliqu´emosles el algoritmo de Euclides, de modo que con la notaci´on previa r1 = a − c1 b,

r2 = b − c2 r1 ,

rk = rk−2 − ck rk−1

(3 ≤ k < n),

siendo precisamente d = rn−1 . Por tanto d = rn−1 = rn−3 − cn−1 rn−2 = un−1 rn−3 + vn−1 rn−2 = un−1 rn−3 + vn−1 (rn−4 − cn−1 rn−3 ) = un−2 rn−4 + vn−2 rn−3 = · · · = uk rk−2 + vk rk−1 = · · · = u1 a + v1 b, donde todos los uk , vk son enteros. Si a o b son negativos, recordemos que tambi´en d = mcd(|a|, |b|), y si p. ej. a < 0, b > 0, sabiendo que d = u|a| + v|b|, ser´a igualmente d = (−u)(−a) + vb. De la misma forma pueden resolverse los casos restantes. Nota. Los coeficientes u y v no son u ´nicos: obs´ervese, por ejemplo, que d = ua + vb = (u + nb)a + (v − na)b cualquiera que sea n ∈ Z. Una variante de la demostraci´on anterior, m´as farragosa, permite fabricar un algoritmo para el c´alculo de unos valores de u, v. Manteniendo la notaci´on a = 1 · a + 0 · b = x0 a + y0 b,

b = 0 · a + 1 · b = x1 a + y1 b,

r1 = 1 · a − c1 b = x2 a + y2 b,

r2 = −c2 a + (1 + c1 c2 )b = x3 a + y3 b, y, en general, si rk = xk+1 a + yk+1 b, rk+1 = xk+2 a + yk+2 b, tambi´en rk+2 = rk − ck+2 rk+1 = (xk+1 − ck+2 xk+2 )a + (yk+1 − ck+2 yk+2 )b = xk+3 a + yk+3 b si ponemos xk+3 = xk+1 − ck+2 xk+2 , yk+3 = yk+1 − ck+2 yk+2 . Para que intervengan s´olo dos ´ındices consecutivos, introducimos uk = xk+1 , vk = yk+1 , con lo que queda uk+2 = xk+1 − ck+2 uk+1 , vk+2 = yk+1 − ck+2 vk+1 , y finalmente d = rn−1 = un−1 a + vn−1 b. Ordenando el proceso anterior se obtiene el siguiente algoritmo: Definici´ on 2.2.13. Algoritmo de Euclides extendido (Euclides-B´ ezout). • Input: dos enteros positivos a y b. • Output: dos enteros x e y tales que mcd(a, b) = xa + yb. Paso 1: Hacer x = v = 1 e y = u = 0. Paso 2: Determinar c y r tales que a = cb + r y 0 ≤ r < b. Reemplazar (simult´ aneamente)  a por b, y b por r,

´ 2.2. NUMEROS ENTEROS.

57

 x por u e y por v,  u por x − cu y v por y − cv. Paso 3: Repetir el Paso 2 hasta que b sea 0. Paso 4: Devolver x e y. Visualizado en forma de tabla: restos & dividendos ← divisores cocientes c xk+1 =uk yk+1 =vk uk+1 =xk −ck+1 uk vk+1 =yk −ck+1 vk

a 1 0 0 1

r1 b c1 0 1 1 −c1

r2 r1 c2 1 −c1 −c2 1 + c1 c2

r3 r2 c3 ··· ··· ··· ···

······ ······ ······ ······ ······ ······ ······

rn−1 rn−2 cn−1 xn−1 yn−1 un−1 = x vn−1 =y

0 rn−1 = d cn x y

Ejemplo. Apliquemos este algoritmo a los n´ umeros considerados anteriormente, a = 1769, b = 551, para los que ya hemos visto que mcd(a, b) = 29 (volveremos a obtenerlo). restos & dividendos ← divisores cocientes c xk+1 =uk yk+1 =vk uk+1 =xk −ck+1 uk vk+1 =yk −ck+1 vk

1769 1 0 0 1

116 551 3 0 1 1 −3

87 116 4 1 −3 −4 13

29 87 1 −4 13 5 -16

0 29 3 5 -16 — —

Efectivamente, 29 = 5 · 1769 − 16 · 551. El rec´ıproco de la proposici´on 2.2.12 no es cierto en general: por ejemplo, 441 − 18 · 24 = 9, mientras que mcd(441, 24) = 3. Sin embargo, lo es en una situaci´on especial. Definici´ on 2.2.14. Dos n´ umeros enteros no nulos a y b se dicen relativamente primos o primos entre s´ı si no tienen m´ as divisores comunes que 1 y −1, es decir, si mcd(a, b) = 1. Corolario 2.2.15. Dos n´ umeros enteros no nulos a y b son relativamente primos si y s´ olo si existen dos n´ umeros enteros u y v tales que ua + vb = 1. Demostraci´ on. Si a y b son relativamente primos, la igualdad del enunciado es un caso particular de la identidad de B´ezout. Supongamos ahora que tenemos enteros u y v para los que se verifica ua + vb = 1. Si k es un divisor com´ un de a y b, por linealidad k es un divisor de 1 y por tanto |k| = 1 y mcd(a, b) = 1. Ejemplo. Puesto que para todo entero positivo k es −3(5k + 3) + 5(3k + 2) = 1, se sigue que 5k + 3 y 3k + 2 son relativamente primos. Ejercicio. Dados dos n´ umeros enteros no nulos a y b relativamente primos, probar que el m´aximo com´ un divisor de a + b y a − b es 1 o 2. Respuesta. Existen u, v ∈ Z tales que ua + vb = 1. Si k es un divisor com´ un de a + b y a − b, por linealidad k divide a (a + b) + (a − b) = 2a y a (a + b) − (a − b) = 2b; nuevamente por linealidad, dividir´a a 2au + 2bv = 2. Por tanto |k| = 1 o |k| = 2, de donde se sigue que mcd(a + b, a − b) = 1 o mcd(a + b, a − b) = 2.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

58 Ecuaciones diof´ anticas lineales

Una aplicaci´on importante de la identidad de B´ezout es el estudio de las soluciones de las ecuaciones (lineales) diof´ anticas, es decir, ecuaciones en las que se buscan solamente soluciones enteras, que aparecen en contextos m´as serios pero tambi´en en acertijos como el siguiente: hh ¿Puede llenarse exactamente un dep´ osito de agua de 56 l. transport´andola con un cubo de 6 l. y otro de 9 l.? ¿Y un dep´osito de 57 l.? En caso afirmativo, ¿cu´al es el n´ umero m´ınimo de viajes que hay que realizar con los cubos para llenar el dep´osito? ii Planteamiento: ¿6x + 9y = 56 tiene soluciones x, y ∈ N0 ? ¿6x + 9y = 57 tiene soluciones x, y ∈ N0 ? ¿cu´ales? Para responder en general, comenzamos por un lema. Lema 2.2.16. Sean a, b, d, m, p, q n´ umeros enteros, ab 6= 0. (i) si d = mcd(a, b), a = pd, b = qd, entonces mcd(p, q) = 1 (es decir, p y q son relativamente primos). (ii) si mcd(p, q) = 1 y p | qm, entonces p | m. Demostraci´ on. (i) Existen u, v ∈ Z tales que ua + vb = d, luego d(up + vq) = d; cancelando d se deduce que up + vq = 1, y por tanto que mcd(p, q) = 1. (ii) Existen u, v ∈ Z tales que up + vq = 1, con lo cual upm + vqm = m. A su vez, existe n ∈ Z tal que pn = qm. Sustituyendo qm por pn y sacando factor com´ un p resulta p(um + vn) = m, es decir, p divide a m como quer´ıamos demostrar. Corolario 2.2.17 (Resolubilidad de ecuaciones diof´ anticas). Sean a 6= 0, b 6= 0, c, tres n´ umeros enteros y d = mcd(a, b). La ecuaci´ on ax + by = c tiene soluciones enteras si y s´ olo si d|c. Demostraci´ on. Sea ax + by = c para ciertos enteros x, y. Como d|a y d|b, por la propiedad (iii) de linealidad, d|c. Rec´ıprocamente, supongamos que d|c, es decir, c = kd para alg´ un k ∈ Z. Puesto que existen enteros u, v, para los que d = ua + vb, multiplicando por k obtenemos c = kd = kua + kvb, es decir, x = ku, y = kv nos da una soluci´on de la ecuaci´on propuesta. N´otese que la segunda parte de la demostraci´on nos proporciona una soluci´on concreta mediante la identidad de B´ezout. ¿Habr´a otras? Vamos a comprobar que o bien no existe soluci´on o bien hay infinitas, que se pueden construir a partir de una cualquiera de ellas. Proposici´ on 2.2.18. Sean a 6= 0, b 6= 0, c, tres n´ umeros enteros; si el par (x0 , y0 ) ∈ Z × Z constituye una soluci´ on particular de la ecuaci´ on diof´ antica ax + by = c, todas las soluciones enteras de esta ecuaci´ on son de la forma x = x0 + (b/d)n,

y = y0 − (a/d)n,

n ∈ Z,

donde d = mcd(a, b). Demostraci´ on. Pongamos p = a/d, q = b/d. Si ax0 + by0 = c, los x, y del enunciado son soluciones de la ecuaci´on, es decir, si x = x0 + qn e y = y0 − pn para alg´ un entero n, ax + by = a(x0 + qn) + b(y0 − pn) = (ax0 + by0 ) + aqn − bpn = c + (pd)qn − (qd)pn = c.

´ 2.2. NUMEROS ENTEROS.

59

Rec´ıprocamente, si x, y son soluciones enteras de la ecuaci´on, son de la forma especificada en el enunciado. En efecto: de ax0 + by0 = c, ax + by = c, se sigue a(x − x0 ) + b(y − y0 ) = 0; por tanto, dividiendo por d = mcd(a, b), podemos reescribir la u ´ltima igualdad como p(x − x0 ) = q(y0 − y).

[∗]

As´ı, p divide a q(y0 − y). Pero, aplicando las dos partes del lema, mcd(p, q) = 1 y en consecuencia p divide a y0 − y. Existe, pues, un n ∈ Z tal que y0 − y = pn, es decir, y = y0 − pn. Sustituyendo este valor de y en la ecuaci´on [∗], resulta finalmente x = x0 + qn, como quer´ıamos probar. Ejemplo. De las ecuaciones que hab´ıamos dejado planteadas, 6x + 9y = 56 no tendr´a soluci´ on y 6x + 9y = 57 s´ı, puesto que mcd(6, 9) = 3. Como 57 = 19 · 3, 9 = 6 + 3, (−1)6 + 9 = 3, se sigue que (−19)6 + 19 · 9 = 57, lo que da como u ´nicas soluciones con coeficientes positivos n x = −19 + 3n y = 19 − 2n

7 2 5

8 5 3

9 8 1

La primera combinaci´on es la que requiere menor n´ umero de viajes. Nota. Sistematizando el proceso desarrollado en las p´aginas anteriores, obtenemos (v. [C-C-S], pp. 5–6) el siguiente Algoritmo de resoluci´ on de ecuaciones diof´ anticas lineales • Input: enteros a, b, c, con a y b no ambos nulos. • Output: todas las soluciones enteras x, y de la ecuaci´ on xa + yb = c. Paso 1: Encontrar, usando el algoritmo de Euclides extendido, enteros x0 , y 0 tales que d := mcd(a, b) = x0 a + y 0 b. ´ Paso 2: Si d no divide a c, devolver ‘NO HAY SOLUCIONES DE LA ECUACION’. Paso 3: Si d divide a c, devolver entonces x = (x0 c − nb)/d y y = (y 0 c + na)/d, con n ∈ Z. M´ınimo com´ un m´ ultiplo Emparejado con el concepto de m´aximo com´ un divisor suele ir el de m´ınimo com´ un m´ ultiplo. Dados a, b ∈ Z \ {0}, siempre hay enteros positivos que son m´ ultiplos simult´aneamente de a y b: por ejemplo, |ab|. El conjunto F = {z ∈ N : a|z, b|z} es, pues, no vac´ıo; por el principio de buena ordenaci´on, existe m = m´ın F , por lo que podemos enunciar la definici´on siguiente. Definici´ on 2.2.19. Sean a, b, n´ umeros enteros no nulos. Su m´ınimo com´ un m´ ultiplo es el menor n´ umero entero positivo que es m´ ultiplo de a y b simult´ aneamente. Se escribe mcm(a, b). (Si ab = 0, se pone a veces mcm(a, b) = 0.) Si ab 6= 0 y a < 0 o b < 0, podemos reducir el c´alculo de su m´ınimo com´ un m´ ultiplo al de los n´ umeros positivos |a|, |b|; y cuando a y b son positivos, podemos hallar su m´ınimo com´ un m´ ultiplo conociendo el m´aximo com´ un divisor, gracias a: Proposici´ on 2.2.20. Sean a, b, n´ umeros enteros positivos. Entonces mcm(a, b) · mcd(a, b) = ab.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

60

Demostraci´ on. Sea d = mcd(a, b), a = pd, b = qd, con lo cual mcd(p, q) = 1. Si n = p0 a = q 0 b es cualquier m´ ultiplo (positivo) com´ un de a y b, ser´a n = p0 pd = q 0 qd, de donde p0 p = q 0 q, luego p|q 0 q siendo p y q relativamente primos, y en consecuencia p|q 0 . Entonces q 0 = cp para alg´ un c y sustituyendo, n = cpb = c(ab/d), con lo que (ab/d) ≤ n. Como (ab/d) = pb = qa es un m´ ultiplo com´ un de a y b, se sigue que mcm(a, b) = (ab/d). Ejemplo. mcm(1769, 551) =

1769 × 551 = 61 × 551 = 33611. 29

C´ alculos con maple y Mathematica Finalizamos este apartado indicando una serie de recursos de maple y Mathematica que generalmente sustituyen con ventaja el c´alculo ‘a mano’ de los objetos encontrados a lo largo del mismo. Esto hace innecesario insistir en los ejercicios que se reducen a un mero c´alculo, pero todo matem´atico debe estar en condiciones de resolverlos incluso cuando falla el suministro el´ectrico, por lo que recomendamos ejercitarse manualmente (sin exagerar) en los algoritmos que hemos ido exponiendo, y utilizar el ordenador para comprobar los resultados. La explicaci´on detallada del funcionamiento de las ´ordenes aqu´ı recogidas se encuentra en los manuales o en la ayuda de los propios programas. • maple (a, b, c,. . . datos) entrada igcd(a,b,...); ilcm(a,b,...); igcdex(a,b,’s’,’t’);s;t;

isolve(a*x+b*y=c,x,y);

salida

comentario

mcd(a, b, . . . ) mcm(a, b, . . . ) mcd(a, b) s t

mcd(a, b) = sa + tb

{x = x0 − b0 Z1, y = y0 + a0 Z1}

(x0 , y0 ) soluci´on particular, b0 = b/d, a0 = a/d, (d = mcd(a, b)), Z1 entero arbitrario

• Matematica (a, b, c,. . . datos) entrada GCD[a,b,...] LCM[a,b,...] {g,{r,s}}=ExtendedGCD[n=a,m=b,...] Solve[a*x==c && Modulus==b,x] Solve[b*y==c && Modulus==a,y]

salida mcd(a, b, . . . ) mcm(a, b, . . . ) g, r, s (ver ejemplo) (ver ejemplo)

comentario

g = mcd(a, b) = ra + sb algunos x soluciones de ax + by = c algunos y soluciones de ax + by = c

Ejemplos. (1) Identidad de B´ezout con maple : igcdex(1027,712,’s’,’t’);s;t; 1 -165 238 (2) Identidad de B´ezout con Mathematica : In[1]:=

{g, {r, s}} = ExtendedGCD[n = 1027, m = 712]

Out[1]=

{1, {-165, 238}}

´ 2.2. NUMEROS ENTEROS.

61

(3) Ecuaciones diof´anticas lineales con maple : isolve(8*x+12*y=20); {x = 1 - 3 _Z1, y = 1 + 2 _Z1} (4) Ecuaciones diof´anticas lineales con Mathematica : In[1]:= Solve[8 x == 20 && Modulus == 12, x ] Out[1]= {{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4}, {Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}} In[2]:= Solve[12 y == 20 && Modulus == 8, y ] Out[2]= {{Modulus -> 8, y -> 1}, {Modulus -> 8, y -> 3}, {Modulus -> 8, y -> 5}, {Modulus -> 8, y -> 7}}

Ejercicios 4.1. Probar que c|a, c|b =⇒ c| mcd(a, b); a|c, b|c =⇒ mcm(a, b)|c. (N.B. Estas propiedades no est´an incluidas en las definiciones: hablamos en ellas de m´aximo y m´ınimo para la relaci´on de orden, y lo que se pide aqu´ı es probar que son igualmente m´aximo y m´ınimo para la relaci´on de divisibilidad en N) 4.2. Calcular d = mcd(1320, 714) y escribir d = 1320x + 714y con x, y ∈ Z. 4.3. Calcular mcd(a, b) y encontrar todas las soluciones de ax + by = mcd(a, b) en los siguientes casos: (1) a = 63, b = 49; (2) a = 619, b = 93; (3) a = 521, b = 2187. 4.4. Hallar todas las soluciones enteras de las ecuaciones (1) 2x + 3y = 7;

(2) 21x − 35y = −14.

4.5. Definir el m´aximo com´ un divisor y el m´ınimo com´ un m´ ultipo de tres n´ umeros, mcd(a, b, c) y mcm(a, b, c). Hallar mcd(1485, 71148, 7882875), mcm(1485, 71148, 7882875). 4.6. Calcular d = mcd(60, 126, 44) y encontrar enteros x, y, z que verifiquen d = 60x + 126y + 44z. 4.7. Para cada entero positivo n, calcular mcd(n, n + 1) y mcd(n, n + 2). 4.8. Demostrar que 3m + 11 y 2m + 7 son relativamente primos cualquiera que sea m ∈ N. 4.9. Sean a y b dos enteros positivos. Probar que si m = mcm(a, b), entonces mcd(m/a, m/b) = 1. 4.10. Dados a, b ∈ N, si d = mcd(a, b), probar que {ax + by : x, y ∈ Z} = {dz : z ∈ Z}. (Este u ´ltimo conjunto suele denotarse por dZ.) 4.11. Si a, b son enteros relativamente primos, ¿qui´en es mcm(a, b)? ¿Por qu´e?

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

62

4.12. Si a, b son enteros relativamente primos y c es un entero tal que a|c y b|c, probar que ab|c. ¿Qu´e sucede si a, b no son relativamente primos? ¿por qu´e? 4.13. Una persona desea comprar 430 d´olares en cheques de viaje. Estos solamente existen en cheques de 20 y 50 d´olares. ¿Cu´antos cheques de cada cantidad deber´a adquirir? 4.14. ¿De cu´antas formas posibles se pueden tener 325 pesetas repartidas en monedas de 10 y de 25 pesetas? 4.15. Un tren sale de Par´ıs a Niza cada 7 horas, a una hora en punto. Probar que algunos d´ıas es posible tomar este tren a las 9 de la ma˜ nana. Siempre que hay un tren a las 9 de la ma˜ nana, Pierre lo coge para ir a visitar a su t´ıa Marie. ¿Cada cu´anto tiempo ve Marie a su sobrino? Discutir el mismo problema con el tren a Burdeos, que sale de Par´ıs cada 14 horas. 4.16. Demostrar que un cajero autom´atico cargado de billetes de veinte y de cincuenta euros puede dispensar cualquier cantidad de euros m´ ultiplo de 10 que sea superior o igual a 40 euros. Sugerencia: puede probarse por inducci´on, teniendo en cuenta que 2(−2) + 5 = 1 = 2 · 3 − 5. 4.17. El problema de los cocos. Cinco marineros suspicaces emplean el d´ıa en recoger un mont´ on de cocos. Agotados, posponen el reparto del mont´on hasta la ma˜ nana siguiente. Desconfiados, cada uno decide coger su parte durante la noche. El primer marinero divide el mont´on en cinco partes iguales m´as un coco extra, que da a un mono. Coge un mont´on y deja el resto en un u ´nico mont´ on. M´as tarde, el segundo marinero hace lo mismo; y, de nuevo, el mono recibe un coco sobrante. El tercero, cuarto y quinto marineros tambi´en lo hacen; todas las veces queda un coco, que recibe el mono. Por la ma˜ nana, dividen los cocos restantes en cinco montones iguales, y cada marinero recibe su “parte”. (Cada marinero sabe que faltan algunos, pero nadie protesta, porque ¡todos son culpables!) ¿Cu´al es el menor n´ umero posible de cocos en el mont´on original? (Este problema apareci´o en el Saturday Evening Post el 9 de octubre de 1926.) Y para (que disfruten) los m´as atrevidos: 4.18. Consideremos la sucesi´on de Fibonacci, definida por recurrencia mediante las f´ormulas φ0 = 0,

φ1 = 1,

φn = φn−1 + φn−2 ,

n ≥ 2.

Probar que: (i) mcd(φn , φn+1 ) = 1 para todo n ≥ 1; (ii) φn+m = φn−1 φm + φn φm+1 para todo n ≥ 1, m ≥ 0; (iii) si r > 0, φn |φnr para todo n ≥ 1; (iv) si mcd(m, n) = d, entonces mcd(φm , φn ) = φd . 4.19. Sea mcd(a, b) = 1. Probar que mcd(a + b, a2 − ab + b2 ) es 1 o 3. 4.20. Consid´erese una diana para dardos con dos regiones, una que vale a puntos y la otra b puntos, donde a y b son enteros positivos sin factores comunes. ¿Cu´al es la mayor puntuaci´on total que no puede obtenerse lanzando dardos a la diana? 4.21. Sean a, b enteros positivos primos entre s´ı. Pobar que cualquier entero c ≥ (a − 1)(b − 1) tiene la forma ax + by, donde x e y son enteros no negativos. Probar que el entero ab − a − b no tiene esta forma. (Teorema de Sylvester, v. [D’A-W] pp. 98 y ss.)

´ 2.2. NUMEROS ENTEROS.

2.2.5.

63

N´ umeros primos y factorizaci´ on. Teorema fundamental de la Aritm´ etica.

Definici´ on 2.2.21. Un n´ umero entero positivo p distinto de 1 se dice primo si no tiene m´ as divisores positivos que ´el mismo y la unidad; en caso contrario diremos que es compuesto . Dicho de otra forma, p es primo si p ∈ N \ {1} y a ∈ N, a|p, implica a = 1 o a = p. Que un n´ umero n sea compuesto significa, seg´ un la definici´on, que admite al menos un divisor positivo a tal que 1 < a < n. Lema 2.2.22. Para todo entero n ≥ 2 existe un n´ umero primo p tal que p|n. (Se dice entonces que p es un factor primo de n.) Demostraci´ on. Ya lo probamos por inducci´on. Veamos c´omo podr´ıa formularse la demostraci´ on con otra apariencia. Si n es primo, basta tomar p = n. Si no lo es, admite un divisor positivo a1 tal que 1 < a1 < n. Si a1 es primo, basta tomar p = a1 . Si no lo es, admite un divisor positivo a2 tal que 1 < a2 < a1 , que a su vez ser´a divisor de n. Si a2 es primo, basta tomar p = a2 . Si no lo es, podemos continuar el proceso: pero como cada vez vamos obteniendo divisores ak tales que 1 < ak < ak−1 , es decir, cada uno estrictamente menor que el anterior, al cabo de un n´ umero finito de pasos encontraremos un divisor primo (= 2, en el peor de los casos). Teorema 2.2.23 (Euclides). El conjunto de los n´ umeros primos es infinito. Demostraci´ on. Supongamos, por el contrario, que fuese finito, y que p1 , p2 , . . . , pn fuesen todos los diferentes n´ umeros primos (n ∈ N). El n´ umero N = p1 p2 · · · pn + 1 no figura en esa lista, pues es estrictamente mayor que cada uno de sus elementos (¿por qu´e?), y tendr´ıa que ser divisible por alguno de ellos seg´ un el lema anterior. Pero N = pk (p1 p2 · · · pk−1 pk+1 · · · pn ) + 1 da resto 1 al dividirlo por cada pk , y no resto 0, luego N no tendr´ıa factores primos, contradicci´ on. Un procedimiento c´asico para hallar los n´ umero primos menores o iguales que un entero positivo n es la criba de Erat´ ostenes, que consiste en ir suprimiendo de la lista de los n primeros n´ umeros naturales los que son m´ ultiplos de 2, luego los que son m´ ultiplos de 3, de 5, etc. (v. [D-H], p. 34.) Lo presentamos aqu´ı en forma de algoritmo. Definici´ on 2.2.24. Algoritmo: La criba de Erat´ ostenes. • Input: un entero positivo n. • Output: la lista de primos menores o iguales que n. Paso 1: Construir la lista L := [2, . . . , n] y la lista vac´ıa M . Paso 2: Sea m el menor elemento de L.  A˜ nadir m a M .  Suprimir de L todos los m´ ultiplos de m. Paso 3: Repetir el Paso 2 hasta que L est´e vac´ıa. Paso 4: Devolver M .

64

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

En Internet abundan los applets de Java que ejecutan este proceso interactivamente. Por ejemplo, ver estas direcciones: http://www.win.tue.nl/~ida/demo/c1s4ja.html http://www.faust.fr.bw.schule.de/mhb/eratosiv.htm http://www.shodor.org/succeedhi/succeedhi/sieve/model.html Lema 2.2.25. Sean a y b n´ umeros enteros no nulos y p un n´ umero primo tal que p|ab. Entonces p|a o p|b. Demostraci´ on. Puesto que p es primo, no tiene m´as divisores positivos que 1 y p. Por tanto, si p 6 |a, mcd(p, a) = 1. Podemos entonces aplicar la parte (ii) del lema 2.2.16 para concluir que p|b.

Teorema 2.2.26 (Teorema fundamental de la aritm´ etica). Todo n´ umero entero positivo distinto de 1 puede descomponerse como producto de factores primos de manera u ´nica, salvo el orden de dichos factores. Demostraci´ on. Comencemos probando la existencia de la factorizaci´on. (Una presentaci´on alternativa se encuentra en [D-H], p. 35.) Notemos que si p es primo, admite la factorizaci´on trivial p = p. Sea Pn el enunciado hh n ≥ 2 y los n´ umeros enteros desde 2 hasta n admiten una descomposici´ on en factores primos ii. Puesto que 2 es primo, P2 es cierta. Supongamos ahora que es cierta para un n ≥ 2. Si n + 1 es primo, Pn+1 es cierta; si no lo es, podremos descomponerlo en n + 1 = n1 n2 con 1 < n1 < n + 1, 1 < n2 < n+1. Pero entonces 2 ≤ n1 ≤ n, 2 ≤ n2 ≤ n, y por la hip´otesis de inducci´on n1 = p1 · · · pj , n2 = pj+1 · · · pk , con p1 ,. . . , pj , pj+1 , . . . , pk primos. Por tanto n + 1 = p1 · · · pj pj+1 · · · pk es una factorizaci´on de n + 1 como producto de primos, es decir, Pn+1 es cierta. Pasemos a probar la unicidad. (Tambi´en podr´ıa hacerse por inducci´on). Supongamos que n = p 1 p 2 · · · pj = q 1 q 2 · · · q k son dos descomposiciones de n en factores primos. Entonces p1 |q1 (q2 · · · qk ) luego por el lema previo, p1 |q1 o p1 |(q2 · · · qk ): en el primer caso, como p1 y q1 son primos, necesariamente p1 = q1 ; en el segundo caso p1 |q2 o p1 |(q3 · · · qk ). Repitiendo el argumento anterior, en k pasos a lo sumo encontraremos un factor qk1 igual a p1 . Lo mismo podemos hacer con p2 , . . . , pk , que nos llevar´ an a factores qk2 = p2 , . . . , qkj = pj . Si no hubi´esemos obtenido as´ı todos los factores de la segunda descomposici´on, podr´ıamos cancelar los factores comunes y quedar´ıa 1 = q10 · · · q`0 , lo que es imposible. Por tanto, las dos factorizaciones coinciden, salvo quiz´a en el orden. El lector habr´a obtenido ya anteriormente factorizaciones de numerosos ejemplos, por lo que no insistimos en este punto. Adem´as, nada nuevo podemos a˜ nadir a lo que ya conoce: no hay un algoritmo general para factorizar n´ umeros que sea realmente efectivo, por lo que seguiremos recurriendo a la divisi´on por los primeros primos 2, 3, 5, etc., aliviada ligeramente si se aplican criterios de divisibilidad (hablaremos de ellos m´as adelante). Dejamos como ejercicio la comprobaci´on de que la descomposici´on en factores primos permite obtener el m´aximo com´ un divisor y el m´ınimo com´ un m´ ultiplo de la forma ya sabida.

´ 2.2. NUMEROS ENTEROS.

65

Ejercicio. Sean a = pr11 · · · prkk , b = ps11 · · · pskk las descomposiciones en factores primos distintos de a y b, “arregladas” para que aparezcan los mismos factores tomando, si es necesario, exponentes nulos. Pongamos mj = m´ın{rj , sj }, Mj = m´ax{rj , sj }. Demostrar que mk 1 mcd(a, b) = pm 1 · · · pk ,

Mk 1 mcm(a, b) = pM 1 · · · pk ,

es decir, el m´aximo com´ un divisor de a y b se obtiene hh multiplicando los factores primos comunes elevados al menor exponenteii, y el m´ınimo com´ un m´ ultiplo de a y b se obtiene hh multiplicando los factores primos comunes y no comunes elevados al mayor exponenteii. Factorizaci´ on con ordenador Existen diferentes algoritmos para hallar los factores primos de un n´ umero. Si el n´ umero no es demasiado grande, se usa la “b´ usqueda directa”, haciendo sucesivamente la divisi´on por los primeros n´ umeros primos, como lo hacemos sin ordenador. Para n´ umeros m´as grandes, hay distintos algoritmos (ninguno de car´acter ‘general’) que aprovechan las caracter´ısticas especiales del n´ umero que se intenta factorizar, usando Teor´ıa de N´ umeros avanzada. Hay m´as informaci´on en [5]. En maple se obtienen los factores primos de un n´ umero con las ´ordenes ifactor e ifactors, y en Mathematica , con FactorInteger o con FactorIntegerECM (requiere cargar el paquete ‘FactorIntegerECM‘). Su sintaxis precisa y las diferentes opciones disponibles pueden consultarse en los manuales o en la ayuda de los programas. Como cabe suponer, tambi´en en este punto abundan en Internet applets de Java que realizan la factorizaci´on. Por ejemplo, en espa˜ nol, el ‘alpertron’ del argentino Dar´ıo Alpern [4], descrito as´ı: hh

Applet capaz de encontrar factores de 20 ´o 30 d´ıgitos de n´ umeros o expresiones num´ericas de hasta 1000 d´ıgitos. Calcula adem´as la cantidad y suma de los divisores, el indicador de Euler y la funci´on Moebius del n´ umero y su descomposici´on como suma de hasta cuatro cuadrados perfectos. ii

Lectura: Conjetura de Goldbach. Uno de los aspectos m´as fascinantes de la Teor´ıa de N´ umeros —enteros— es que abunda en problemas sencillos de enunciar que, sin embargo, son tremendamente dif´ıciles de resolver, hasta el punto de que algunos de ellos llevan planteados varios siglos y a´ un no han sido resueltos. Por ejemplo, Christian Goldbach (1690–1764) envi´o en 1742 una carta a su amigo Euler, en la que, tras comprobar unos pocos casos particulares, afirmaba: todo n´ umero natural par distinto de 2 es suma de dos n´ umeros primos. Todav´ıa no se sabe si esta afirmaci´on es cierta o falsa. Una excelente novela de Apostolos Doxiadis, El t´ıo Petros y la conjetura de Goldbach, refleja (entre otras cosas) los esfuerzos para probarla. Y, para animar a quien tenga buenas ideas sobre esta cuesti´on, las editoriales de la novela, Bloomsbury Publishing Company (Estados Unidos) y Faber and Faber Limited (Gran Breta˜ na), ofrec´ıan un premio de un mill´on de d´olares a quien obtuviese una soluci´on antes de marzo de 2002. Ignoro si la oferta sigue en pie, aunque creo que no ha sido renovada. Lectura: Conjetura de Fermat/Teorema de Wiles. Quiz´a el problema m´as famoso en este terreno es el llamado “´ ultimo teorema de Fermat”. Pierre de Fermat, contempor´aneo de Descartes y tan buen o mejor matem´atico que ´el, estudiaba hacia 1637 un ejemplar de la edici´on de G. C. Bachet de la Arithmetica de Diofanto, y ten´ıa por costumbre incluir comentarios propios en el margen del libro. En una p´agina escribi´o: Descomponer un cubo en suma de otros dos cubos, una cuarta potencia, o en general cualquier potencia en suma de dos potencias del mismo orden mientras sea mayor al segundo, es imposible, y ciertamente he encontrado una demostraci´ on magn´ıfica de esto, pero el margen es demasiado estrecho para contenerla.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

66

¿Era un farol? Algunas otras de sus afirmaciones conten´ıan las ideas de las demostraciones, todas ellas de gran originalidad. Lo cierto es que s´olo pudieron darse respuestas parciales para valores particulares del exponente (hay abundantes referencias sobre ellas: una reciente, el cap´ıtulo 5 de [Casti]). En junio de 1993, el matem´atico ingl´es Andrew Wiles present´o en una conferencia en Cambridge la demostraci´on de un resultado —la conjetura de Shimura-Taniyama-Weil— que implicar´ıa que la afirmaci´on de Fermat era cierta. La comunidad matem´atica vivi´o una etapa de ‘suspense’ cuando se descubri´o un fallo que Wiles no pudo solucionar hasta 1994, publicando junto con Richard Taylor en 1995 un art´ıculo de m´as de 130 p´aginas, que parece haber vencido finalmente todas las dificultades. El teorema de Fermat tambi´en ha sido fuente de inspiraci´on literaria: una novela de Denis Guedj, El teorema del loro, da un repaso a la historia de las matem´aticas mientras desarrolla una intriga montada alrededor del loro de un hipot´etico ‘demostrador’ del teorema.

Ejercicios 5.1. Demostrar que si n ≥ 2 y n no es primo, entonces debe existir un primo p tal que p|n y p2 ≤ n. ¿Qu´e inter´es tiene este resultado en relaci´on con la criba de Erat´ostenes? 5.2. Demostrar que todo n´ umero primo mayor que 3 es de la forma 6n + 1 o 6n + 5. 5.3. Demostrar que un entero de la forma 4n + 3 admite un divisor primo de esa forma y deducir que existen infinitos n´ umeros primos de la forma 4n + 3. 5.4. Probar que cualquier n´ umero primo p 6= 3 es de la forma 3q + 1 ´o 3q + 2 para alg´ un entero q. Probar que existen infinitos primos de la forma 3q + 2. 5.5. Si p es primo, probar que p divide al coeficiente bin´omico   p , 1 ≤ k ≤ p − 1. k Encontrar un contraejemplo para el caso de que p no sea primo. 5.6. Sean p, a, n ∈ Z. Demostrar que si p es primo y n es positivo y se verifica que p|an , entonces p|a y, por tanto, pn |an . ¿Vale tambi´en si p es compuesto? 5.7. Si mcd(a, b) = 1 y a2 − b2 es un cuadrado perfecto, probar que a + b y a − b son ambos cuadrados perfectos o bien dobles de cuadrados perfectos. 5.8. ¿Cu´al es la relaci´on entre el n´ umero de ceros en que termina la expresi´on decimal de un entero n y su descomposici´on en factores primos? 5.9. Probar que si 2n − 1 es primo, entonces n es primo. (Los primos de la forma 2n − 1 se llaman primos de Mersenne ; se conocen 35 primos as´ı.) Sugerencia: ¿qu´e sucede si n no es primo?

2.2.6.

Congruencias. Aritm´ etica modular.

Volvemos sobre una importante relaci´on que hab´ıamos introducido anteriormente. Definici´ on 2.2.27. Fijado un entero m ≥ 2, dos n´ umeros enteros a y b son congruentes m´ odulo m, a ≡ b (m´od m), si m|(b − a). Equivalentemente, a ≡ b (m´od m) si y s´olo si a y b dan el mismo resto al dividirlos por m: pues si a = pm + r, b = qm + r, 0 ≤ r < m, resulta b − a = (q − p)m; y rec´ıprocamente, si a ≡ b (m´od m), para alg´ un entero k es b − a = km, luego si a = pm + r, 0 ≤ r < m, entonces b = a + km = (p + k)m + r, 0 ≤ r < m, y as´ı r es igualmente el resto de dividir b por m (estamos usando la unicidad del resto en la divisi´on entera).

´ 2.2. NUMEROS ENTEROS.

67

Proposici´ on 2.2.28. Para cada entero m ≥ 2, la relaci´ on de congruencia es una relaci´ on de equivalencia en Z. Demostraci´ on. Ya lo hemos probado en el cap´ıtulo anterior. Por consiguiente, fijado m, Z queda ‘partido’ en una colecci´on disjunta de clases de equivalencia [a] = {b ∈ Z : a ≡ b (m´od m)}, que se denominan clases de restos m´ odulo m. Si representamos en un sistema cartesiano la relaci´on de congruencia, es decir, el conjunto de los puntos (a, b) del ret´ıculo Z × Z tales que a ≡ b (m´od m) para m = 3, por ejemplo, comprobamos que aparecen exactamente los puntos de coordenadas enteras que est´an sobre las rectas de pendiente 1 que cortan al eje OX en los valores enteros m´ ultiplos de 3, o sea, sobre las rectas y = x + 3n, n ∈ Z. Para representar ‘horizontalmente’ la clase [a0 ] correspondiente a un a0 ∈ Z, aprovecharemos que, por simetr´ıa, [a0 ] = {x ∈ Z : x ≡ a (m´od m)}, y as´ı tenemos que buscar los puntos (x, a0 ), que aparecen sobre la recta y = a0 paralela al eje OX, distanciados consecutivamente en 3 unidades (ver figura anterior); sus proyecciones sobre el eje OX son los puntos x de la clase de equivalencia [a0 ] (figura adjunta). Como se puede observar, hay tan s´olo tres clases distintas: • las proyecciones de los puntos marcados con cuadrados (los m´ ultiplos de 3), • las de los puntos marcados con c´ırculos (los anteriores m´as 1 unidad) y • las de los puntos marcados con tri´angulos (los primeros m´as 2 unidades). La situaci´on general es similar: Proposici´ on 2.2.29. Para cada entero m ≥ 2, dado a ∈ Z, la clase de restos de a m´ odulo m es [a] = {a + mz : z ∈ Z} = a + mZ. Demostraci´ on. Evidentemente, si b = a + mz, z ∈ Z, es a ≡ b (m´od m) por la definici´ on de congruencia. Y si a ≡ b (m´od m), por lo mismo debe existir un z ∈ Z tal que b − a = mz, es decir, b = a + mz. Definici´ on 2.2.30. Fijado m ≥ 2, el conjunto de las clases de restos m´ odulo m se denota por Zm o Z/mZ. Se trata, pues, del conjunto cociente de Z respecto de la relaci´on de congruencia m´odulo m. Proposici´ on 2.2.31. Dado m ≥ 2, Zm = {[0], [1], . . . , [m − 1]}.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

68

Demostraci´ on. Para cada a ∈ Z, [a] = [r] para uno y un solo entero r tal que 0 ≤ r < m: el resto de la divisi´on entera de a por m, seg´ un hemos comentado previamente. Adem´as del inter´es de las clases de restos en muchos usos de la vida cotidiana (la esfera del reloj, los meses, los d´ıas de la semana, los cuentakil´ometros de los coches) y de sus aplicaciones en cuestiones relacionadas con la divisibilidad, los conjuntos Zm son importantes porque pueden dotarse de una estructura algebraica (de una suma y un producto). Esta estructura es suficientemente similar a la de Z como para que nos sintamos c´omodos operando en ella, y suficientemente distinta como para proporcionar ejemplos sencillos de situaciones insospechadas: fallos a veces en la propiedad cancelativa, con la existencia de ‘divisores de cero’, frente a la existencia, en otras ocasiones, de inverso para el producto como en Q, R y C. La definici´on de suma y producto de clases de restos es completamente natural: [a] + [b], [a] · [b], ‘deben ser’ [a + b], [a · b]. Pero un momento de reflexi´on basta para darse cuenta que necesitamos un ajuste previo. Si a0 es otro representante de [a] y b0 es otro representante de [b], de modo que [a] = [a0 ], [b] = [b0 ], ¿llegamos al mismo resultado si tomamos [a0 + b0 ], [a0 · b0 ]? El objetivo del siguiente lema es comprobar que la respuesta es afirmativa. Lema 2.2.32. Dado m ≥ 2, sean a ≡ a0 (m´od m), b ≡ b0 (m´od m). Entonces a + b ≡ a0 + b0 (m´od m),

ab ≡ a0 b0 (m´od m).

Demostraci´ on. Que a ≡ a0 (m´od m), b ≡ b0 (m´od m), significa que existen p, q ∈ Z tales que a0 − a = pm, b0 − b = qm. En consecuencia (a0 + b0 ) − (a + b) = a0 − a + b0 − b = (p − q)m, y as´ı a + b ≡ a0 + b0 (m´od m). An´alogamente, a0 b0 = (a + pm)(b + qm) = ab + (aq + pb + pqm)m, de donde ab ≡ a0 b0 (m´od m). Definici´ on 2.2.33. Dado m ≥ 2, sean [a], [b] ∈ Zm . Definimos [a] + [b] = [a + b], [a] · [b] = [a · b] Notemos que seg´ un el lema previo, la aplicaci´on suma (respectivamente, producto) de Zm × Zm en Zm que hace corresponder a ([a], [b]) ∈ Zm × Zm la clase [a + b] (respectivamente, [ab]) est´ a bien definida. Proposici´ on 2.2.34. Con la suma y el producto que acabamos de definir, Zm es un anillo conmutativo con unidad. Demostraci´ on. Que Zm es un anillo conmutativo con unidad significa que se cumple, cualesquiera que sean las clases [a], [b], [c] ∈ Zm , 1. Propiedad asociativa de la suma. ([a] + [b]) + [c] = [a] + ([b] + [c]). (Cierto: ambas son la clase [a + b + c].) 2. Propiedad conmutativa de la suma. [a] + [b] = [b] + [a]. (Puesto que a + b = b + a.) 3. Existencia de elemento neutro (cero) para la suma. Hay una clase, [0] concretamente, tal que [0] + [a] = [a] + [0] = [a]. (Puesto que 0 + a = a + 0 = a.) 4. Existencia de elemento opuesto para la suma. para cada [a] ∈ Z hay una clase (y una s´ola), la clase [−a], tal que [−a] + [a] = [a] + [−a] = [0]. (Evidente.)

´ 2.2. NUMEROS ENTEROS.

69

5. Propiedad asociativa del producto. ([a] [b]) [c] = [a] ([b] [c]). (Ambas son la clase [abc].) 6. Propiedad conmutativa del producto. [a] [b] = [b] [a]. (Inmediato.) 7. Existencia de elemento neutro (identidad) para el producto. Hay una clase, concretamente [1], tal que [1] · [a] = [a] · [1] = [a]. (Inmediato.) 8. Propiedad distributiva del producto respecto de la suma. [a] ([b] + [c]) = [a] [b] + [a] [c]. (Ambas son la clase [a(b + c)] = [ab + ac].) Ejemplos. Veamos las tablas completas de sumar y multiplicar para m = 6 y m = 7 (en el interior de la tabla, por comodidad, hemos representado las clases sin los corchetes [ , ].) + [0] [1] [2] [3] [4] [5]

[0] 0 1 2 3 4 5

[1] 1 2 3 4 5 0

[2] 2 3 4 5 0 1

[3] 3 4 5 0 1 2

[4] 4 5 0 1 2 3

[5] 5 0 1 2 3 4

+ [0] [1] [2] [3] [4] [5] [6]

[0] 0 1 2 3 4 5 6

[1] 1 2 3 4 5 6 0

[2] 2 3 4 5 6 0 1

[3] 3 4 5 6 0 1 2

[4] 4 5 6 0 1 2 3

[5] 5 6 0 1 2 3 4

Suma y producto m´ odulo 6

[6] 6 0 1 2 3 4 5

Suma y producto m´ odulo 7

× [0] [1] [2] [3] [4] [5] [6]

× [0] [1] [2] [3] [4] [5]

[0] 0 0 0 0 0 0

[1] 0 1 2 3 4 5

[2] 0 2 4 0 2 4

[3] 0 3 0 3 0 3

[4] 0 4 2 0 4 2

[5] 0 5 4 3 2 1

[0] 0 0 0 0 0 0 0

[1] 0 1 2 3 4 5 6

[2] 0 2 4 6 1 3 5

[3] 0 3 6 2 5 1 4

[4] 0 4 1 5 2 6 3

[5] 0 5 3 1 6 4 2

[6] 0 6 5 4 3 2 1

Se observar´a que entre las tablas de sumar hay bastantes analog´ıas: son sim´etricas respecto a la diagonal principal, por ejemplo (¿debido a qu´e?), y en cada fila y cada columna aparece una permutaci´on de Zm (est´an todas las clases sin excepci´on, una sola vez, en ordenaciones diferentes: ¿hay alguna causa?). En las tablas de multiplicar hay mayores discrepancias, e incluso “fen´omenos extra˜ nos”. Descontando la anomal´ıa que siempre introduce el [0] en la multiplicaci´on, la tabla de multiplicaci´on m´odulo 7 mantiene las caracter´ısticas anteriores; por el contrario, en Z6 hay “aberraciones” tales como que el producto de dos clases no nulas, [2] por [3] y otras, ¡es la clase nula! Sin embargo, la multiplicaci´on por [5] produce una permutaci´on en Z6 como en la suma, e incluso “tiene inversa”, la propia clase [5], de modo que [5]2 = [1] (lo cual es menos chocante si se piensa que [5] = [−1]). La explicaci´on de estos hechos est´a en los resultados que vienen a continuaci´on. Lema 2.2.35. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la congruencia lineal ax ≡ b (m´od m)

(Ξ)

tiene soluci´ on si, y s´ olo si, d|b. Cuando d divida a b, si x0 es una soluci´ on, la soluci´ on general viene dada por x = x0 + (m/d)n,

n∈Z

En particular, las soluciones forman, exactamente, d clases de restos m´ odulo m, con representantes x0 , x0 + (m/d), x0 + 2(m/d), . . . , x0 + (d − 1)(m/d).

70

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

Demostraci´ on. Un x ∈ Z es soluci´on de la ecuaci´on (Ξ) si y s´olo si m divide a b − ax, lo cual a su vez equivale a que exista un y ∈ Z tal que b − ax = my, o sea, ax + my = b : en otras palabras, x es soluci´on de (Ξ) si y s´olo si es soluci´on (junto con alg´ un y) de la ecuaci´on diof´antica ax + my = b. Como ya sabemos, existe tal soluci´on si y s´olo si d = mcd(a, m)|b, y si hay soluci´on, las infinitas soluciones se deducen de una de ellas x0 (con su pareja y0 ) a trav´es de las f´ormulas x = x0 +(m/d)n (con y = y0 − (a/d)n), n ∈ Z. La u ´nica novedad en el enunciado es, por tanto, la afirmaci´on final. Para probarla, observemos primero que cada n´ umero x0 + k(m/d), 0 ≤ k ≤ d − 1 est´a en una clase de restos distinta, pues x0 + j(m/d) ≡ x0 + k(m/d) (m´od m) con 0 ≤ j < k ≤ d − 1 implicar´ıa que m|(k − j)(m/d), siendo 0 ≤ (k − j)(m/d) ≤ k(m/d) < m, lo cual es imposible. Por u ´ltimo, dada una soluci´on cualquiera x = x0 + (m/d)n, n ∈ Z, dividiendo n por d resulta n = qd + r, q ∈ Z, 0 ≤ r ≤ d − 1, y as´ı x0 + (m/d)n = x0 + qm + r(m/d) ≡ x0 + r(m/d) (m´od m).

Corolario 2.2.36. Sean a, b, m enteros y m ≥ 2. Si a y m son relativamente primos, entonces la congruencia lineal ax ≡ b (m´od m) (Ξ) tiene una y una sola soluci´ on m´ odulo m. Demostraci´ on. Basta aplicar el lema anterior teniendo en cuenta que, por hip´otesis, mcd(a, m) = 1.

Corolario 2.2.37. Sean a, m enteros y m ≥ 2. La congruencia ax ≡ 1 (m´od m) tiene soluci´ on si, y s´ olo si, mcd(a, m) = 1, en cuyo caso, hay una s´ ola soluci´ on m´ odulo m. Formulando los resultados anteriores dentro de Zm , encontramos las causas de los fen´omenos observados en las tablas de multiplicar en Z6 y Z7 . Corolario 2.2.38. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la ecuaci´ on en Zm [a] · x = [b] tiene soluci´ on x en Zm si, y s´ olo si, d|b. Cuando d divida a b, hay exactamente d soluciones distintas en Zm , y si x0 ∈ Zm es una de ellas, dichas soluciones son x0 , x0 + [(m/d)], x0 + [2(m/d)], . . . , x0 + [(d − 1)(m/d)]. Demostraci´ on. Es otra forma de enunciar el lema 2.2.35. Corolario 2.2.39. Sean a y m enteros relativamente primos, y m ≥ 2. Entonces la aplicaci´ on M : Zm → Zm dada por M (x) = [a] · x (la multiplicaci´on por [a]) es una biyecci´ on. Demostraci´ on. Seg´ un el corolario anterior, para cada [b] ∈ Zm existe un x ∈ Zm y uno s´olo tal que [a] · x = [b], es decir, tal que M (x) = [b], y por tanto M es biyectiva. Esto explica las ‘permutaciones’. Los ceros ‘an´omalos’ provienen de lo siguiente: Corolario 2.2.40. Sean a y m enteros tales que m ≥ 2 y [a] 6= [0] en Zm . Si d = mcd(a, m) ≥ 2, existe x ∈ Zm \ {[0]} tal que [a] · x = [0]. (Decimos entonces que [a] y x son divisores de cero en Zm : su producto es nulo, pese a que ambos son distintos de cero.)

´ 2.2. NUMEROS ENTEROS.

71

Demostraci´ on. Tomando b = 0 y x0 = [0] en el corolario 2.2.38, vemos que la ecuaci´on [a] · x = [0] tiene d − 1 (≥ 1) soluciones distintas de x0 = [0], que son [(m/d)], [2(m/d)], . . . , [(d − 1)(m/d)].

Si en un anillo con unidad A todo elemento no nulo tiene inverso (o sea, hay un elemento que multiplicado por ´el da la unidad), se dice que A es un cuerpo. Teorema 2.2.41. Sea m un entero mayor o igual que 2. Entonces Zm es un cuerpo si y s´ olo si m es primo. Demostraci´ on. Que una clase [a] 6= [0] tenga inverso quiere decir que existe x ∈ Zm tal que [a] · x = [1]. Pero si m es primo, como m 6 | a ya que [a] 6= [0], se sigue que mcd(a, m) = 1 y la ecuaci´ on [a] · x = [1] tiene soluci´on Zm (´ unica, adem´as). En cambio, si m es compuesto, m = ab con 1 < a < m, 1 < b < m, por lo cual tiene que ser [a] 6= [0] 6= [b]; y sin embargo [a] no tiene inverso, pues mcd(a, m) = a 6= 1 (m´as todav´ıa: [a] y [b] son divisores de cero, ya que [a][b] = [0], aunque [a] y [b] sean los dos distintos de [0], y esto es imposible cuando [a] tiene inverso). Nota.  En losanillos  de matrices  1 0 0 0 0 ,B= , AB = 1 0 1 1 0

tambi´  en se encuentran divisores de cero. Por ejemplo, si A = 0 sin que ninguno de los factores se anule. 0

Resoluci´ on de ecuaciones en congruencias con ordenador En maple se dispone de msolve(eqns,m), donde eqns es una ecuaci´on (no necesariamente tan sencilla como las que hemos estudiado) o un conjunto de ecuaciones. La respuesta es una lista de valores enteros no negativos, cada uno en una clase de restos m´odulo m, que dan hh todas las soluciones m´ odulo mii de la ecuaci´on. Ejemplo: msolve(8*x=20,12); {x = 1}, {x = 4}, {x = 7}, {x = 10} En Mathematica hab´ıamos encontrado ya la orden Solve[a*x==c && Modulus==b,x], cuya respuesta (ahora lo vemos) es similar a la de maple . Ejemplo: In[1]:= Solve[8 x == 20 && Modulus == 12, x ] Out[1]= {{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4}, {Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

72 APLICACIONES

Criterios de divisibilidad. Algunas aplicaciones de las congruencias nos son familiares desde bastantes a˜ nos atr´as. hh Un n´ umero es divisible por 2 cuando termina en 0 o cifra par. ii hh Un n´ umero es divisible por 5 cuando termina en 0 o en 5. ii ¿Suena conocido? hh Un n´ umero es divisible por 3 cuando la suma de sus cifras es m´ ultiplo de 3. ii hh Un n´ umero es divisible por 9 cuando la suma de sus cifras es m´ ultiplo de 9. ii La raz´on de estas reglas es ahora muy evidente. Partimos de un n´ umero N escrito cn cn−1 . . . c1 c0 en base decimal, de manera que N = c0 + c1 · 10 + · · · + cn−1 · 10n−1 + cn · 10n ,

cn 6= 0.

Que sea divisible por m equivale a que sea congruente con 0 (m´od m). Observando que 10 ≡ 0, 10 ≡ 0, 10 ≡ 1, 10 ≡ 1,

102 ≡ 0, 2

10 ≡ 0, 2

10 ≡ 1, 2

10 ≡ 1,

..., ..., ..., ...,

10n ≡ 0,

...

(m´od 2),

n

...

(m´od 5),

n

...

(m´od 3),

n

...

(m´od 9),

10 ≡ 0, 10 ≡ 1, 10 ≡ 1,

se deduce N ≡ c0 (m´od 2),

N ≡ c0 (m´od 5),

N ≡ c0 +c1 +c2 +· · · (m´od 3),

N ≡ c0 +c1 +c2 +· · · (m´ od 9),

y de aqu´ı los criterios de divisibilidad que hemos recordado. Tambi´en se justifica as´ı la olvidada “prueba del nueve” para la divisi´on: al efectuar ‘a mano’ la divisi´on entera entre n´ umeros grandes a y b, es f´acil cometer errores tanto de c´alculo como de escritura. Una prueba c´omoda (¡aunque no infalible!) para detectarlos, si hemos obtenido un cociente c y un resto r, consiste en trazar un aspa como en la figura, y poner en a0 el resultado de sumar las cifras de a. Si esta es mayor que 9, sustituimos a0 por la suma de sus cifras, y si es 9 ponemos un cero; repitiendo este proceso si es necesario, llegaremos en unos cuantos pasos a un valor menor que 9 que pondremos en la casilla de a0 (el valor final es, obviamente, el u ´nico n´ umero entre 0 y 8 congruente con a m´odulo 9; por ejemplo, para a = 87462371, ir´ıamos obteniendo 8 + 7 + 4 + 6 + 2 + 3 + 7 + 1 = 38, 3 + 8 = 11, 1 + 1 = 2 —o m´as f´ acil, 8 + 7 + 4 + 6 + 2 + 3 + 7 + 1 = (8 + 1) + (7 + 2) + 4 + (6 + 3) + 7 ≡ 4 + 7 = 11). Con el mismo m´etodo de ‘reducci´ on’ sumando cifras, ponemos en b0 el u ´nico n´ umero entre 0 y 8 congruente con a m´odulo 9, en c0 el ‘reducido’ de c, en r0 el ‘reducido’ de r. Multiplicamos c0 por b0 , ‘reducimos’ el resultado, y lo sumamos con r0 ; el n´ umero obtenido debe ‘reducirse’ a a0 . Si no es as´ı, hay un error con toda seguridad; pero si coinciden, podr´ıa haber todav´ıa un error, aunque sea ‘un poco menos probable’. La raz´on: lo que se comprueba es si de a ≡ a0 , b ≡ b0 , c ≡ c0 , r ≡ r0 (m´od 9), y a = cb + r, se sigue a0 ≡ c0 b0 + r0 (m´od 9). Si no es as´ı, por supuesto debe haber un error en los n´ umeros, porque de la igualdad se sigue la equivalencia; pero si se da la equivalencia, no est´a garantizada la igualdad. Ejercicio. Probar que un n´ umero es divisible por 11 si y s´olo si la suma de las cifras de lugar par menos la suma de las cifras de lugar impar es m´ ultiplo de 11. Sugerencia: 10 ≡ −1 (m´od 11). Ejercicio. Probar que un n´ umero es divisible por 25 si y s´olo si termina en 00, 25, 50 o 75. Ejercicio. ¿Por qu´e nunca se enuncia un criterio sencillo de divisibilidad por 7, similar a los que hemos considerado?

´ 2.2. NUMEROS ENTEROS.

73

D´ıgitos de control. Las congruencias inciden en nuestra vida diaria de forma invisible, pero constante, y en las situaciones m´as insospechadas. As´ı lo explica el prof. M. Gasca ([G]): hh

Se dice que estamos en la Era de la Informaci´on. Veamos algunas de las cuestiones surgidas en torno a ella y que en el fondo son problemas matem´aticos m´as o menos intrincados. Se usan mucho los c´odigos de barras para identificar un producto. Se trata de barras blancas y negras que al ser le´ıdas r´apidamente por l´aser se traducen en ceros y unos, sistema binario, que a su vez se traducen a numeraci´on decimal. En el caso del C´odigo Universal de Productos, el m´as frecuente, son unos 12 d´ıgitos decimales, de los que uno advierte del grupo de productos de que se trata, el grupo siguiente identifica al fabricante, otro grupo da idea del producto concreto, a veces de su tama˜ no, etc., y el u ´ltimo d´ıgito es de control. Si han observado los n´ umeros de sus cuentas bancarias de 20 d´ıgitos, los 4 primeros son la entidad, 4 para la Agencia, 2 de control y luego 10 para su cuenta personal. Observar´an que en ambos casos hablamos de d´ıgitos de control. Es muy f´acil al transmitir tantos n´ umeros bailar su orden o confundir una cifra. Mediante un algoritmo matem´atico muy simple el ordenador detecta el error. Se entender´a mejor con el NIF. Hacienda ten´ıa graves problemas con la gente que daba, intencionadamente, un n´ umero err´oneo de DNI, sin poder demostrar la intencionalidad del error. Un algoritmo muy simple asigna a cada n´ umero de DNI una letra, dando lugar al NIF. Para ello, Hacienda seleccion´o 23 letras del alfabeto eliminando i, n ˜, o y u por causar confusiones, y les asign´o un n´ umero aleatorio entre 0 y 22: la A tiene el 3, la W el 2, etc. Dividiendo el n´ umero del DNI entre 23, prescindiendo de decimales en el cociente y volviendo a multiplicar por 23, se obtiene un n´ umero igual o menor que el del DNI. La diferencia entre el DNI y ese nuevo n´ umero es el que decide la letra. Si ahora Vd. cambiara algo en su n´ umero de DNI, como bailar dos d´ıgitos, es sumamente probable que la letra final no saldr´ıa la misma y el ordenador avisar´a del error. Entendiendo el proceso ser´ıa facil´ısimo cambiar el n´ umero y a la vez cambiar la letra para que concuerden y el ordenador no detecte el error, pero si posteriormente se descubre, ya hay manifiesta mala fe. En el caso de la cuenta bancaria, los d´ıgitos son 2 porque se usa uno para el grupo de cifras Banco-Agencia y otro para el n´ umero de la cuenta. ii

Por supuesto, podemos a˜ nadir otros ejemplos (ver [C-C-S], pp. 46 y ss.): • ISBN El ISBN es el International Standard Book Number, el NIF de los libros podr´ıamos decir. Es un c´odigo que se asigna a cada publicaci´on que lo solicita, que permite identificarla r´apidamente. Consiste en 9 d´ıgitos, seguidos de un d´ecimo s´ımbolo que puede ser otro d´ıgito (de 0 a 9) o una X. Los nueve primeros d´ıgitos dan la informaci´on del libro, como el a˜ no y el lugar de publicaci´on, y el s´ımbolo final es de control. Si el ISBN de un libro es a1 a2 . . . a9 b, se elige b de manera que a1 + 2a2 + · · · + 9a9 ≡ b (m´od 11), correspondiendo X al resto 10. En este caso hay posibilidad de corregir peque˜ nos errores: si en el n-´esimo s´ımbolo hay un error de +1 o −1, entonces a1 + 2a2 + · · · + 9a9 + 10b (m´od 11) es igual a +n o −n, respectivamente. • M´ usica digitalizada En los CD’s, la m´ usica se almacena codificada en listas de ceros y unos. Usando un rayo laser, el lector de CD’s lee la informaci´on del disco y la convierte en la se˜ nal que termina transformada en sonido en los altavoces. Hay muchas causas que pueden originar errores de lectura: rayas, suciedad o polvo en la superficie del disco, el rayo laser deja de apuntar al lugar adecuado, etc. El almacenamiento de la informaci´on ha de hacerse de manera que el lector pueda detectar y corregir esos errores.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

74 • Comunicaciones

En todos los canales de comunicaci´on hay que contar con el ‘ruido’, alteraciones de todo tipo que hacen que la se˜ nal recibida no sea igual que la emitida: transmisiones de televisi´ on o telefon´ıa por sat´elite, l´ıneas de tel´efono, fax, e-mails, televisi´on, etc. mediante cable,. . . Para crear c´odigos que permitan corregir errores, se han utilizado ¡espacios vectoriales sobre cuerpos Zp ! (ver Los c´ odigos correctores, de G. Lachaud-S. Vladut y La doble correcci´ on, de C. Berrou y cols., en [MC1]). En [COMAP], pp. 586 y ss., pueden verse tambi´en algunos detalles sobre correcci´on de errores y compresi´ on de datos. El peque˜ no teorema de Fermat Otra aplicaci´on importante de las congruencias es que ciertos resultados permiten responder afirmativamente a la pregunta: ¿es posible probar que un n´ umero no es primo sin conocer sus factores? Veamos c´omo (criterios de primalidad). Teorema 2.2.42 (El peque˜ no teorema de Fermat). Dado un n´ umero primo p, sea a ∈ N tal p−1 que p no divide a a. Entonces a ≡ 1 (m´od p). Demostraci´ on. Aplicando el corolario 2.2.39, Zp = {[0], [1], . . . , [p − 1]} = {[0 · a], [1 · a], . . . , [(p − 1) · a]}. Por tanto 0 6≡ 1 · 2 · · · (p − 1) ≡ a · 2a · · · (p − 1)a ≡ 1 · 2 · · · (p − 1)ap−1 (m´od p) y cancelando 1 ≡ ap−1 (m´od p). Corolario 2.2.43. Dado un n´ umero primo p, para cualquier a ∈ N es ap ≡ a (m´od p). Demostraci´ on. Si p|a, ap ≡ 0 ≡ a (m´od p). En caso contrario, basta multiplicar por a ambos t´erminos de la equivalencia ap−1 ≡ 1 (m´od p). Por tanto, si encontramos valores de a para los que no se cumplen las equivalencias anteriores, p NO podr´a ser primo. Ejemplos. 1. 63 no es primo: si lo fuera, 262 ≡ 1 (m´od 63), y sin embargo 262 = 260 · 22 = (26 )10 · 22 = (64)10 · 22 ≡ 4 (m´od 63). 2. 341 no es primo: si lo fuese, como 73 = 343 ≡ 2 (m´od 341) y 210 = 1024 ≡ 1 (m´od 341), se verificar´ıa 7340 = 73·113+1 ≡ 2113 7 ≡ 2110+3 7 ≡ 8·7 ≡ 56 (m´od 341). Como 56 6≡ 1 (m´od 341), 341 no puede ser primo. Ver comentarios en [D’A-W], p. 114. La congruencia de Fermat tambi´en sirve, obviamente, para hallar restos. Ejemplo. Como 31 es primo, 1130 ≡ 1 (m´od 31), y as´ı 11902 = 1130·30+2 = (1130 )30 · 112 ≡ 130 · 112 ≡ 121 ≡ 28 (m´od 31). Criptograf´ıa. El peque˜ no teorema de Fermat, o sus generalizaciones como el teorema de Euler, est´an en la base de algunos sistemas modernos de criptograf´ıa.

´ 2.2. NUMEROS ENTEROS. hh

75

¿C´omo transmitir mensajes secretos asegur´andose que no ser´an comprendidos por un eventual enemigo? Tal es el objetivo de la criptograf´ıa. En principio, el mensaje a transmitir tiene que codificarse previamente por medio de una clave que el emisor y el receptor mantienen en secreto. En general, esta clave puede ser f´acilmente hh invertidaii, por lo que sirve tanto para cifrar el mensaje inicial como para descifrar el mensaje cifrado. En tal caso, que es el cl´asico, el emisor y el receptor comparten un mismo secreto, la clave que sirve para cifrar y descifrar. El principio de la criptograf´ıa de clave p´ ublica, inventado en 1976 por Whitfield Diffie y Martin Hellman, de la Universidad de Stanford, es muy distinto. El m´etodo supone que la clave del cifrado no puede ser f´acilmente invertida para hallar la clave del desciframiento. La primera puede ser p´ ublica, mientras que s´olo el receptor puede conocer la segunda. La seguridad es entonces mucho mayor. Supongamos que Alicia quiere enviar a Bernardo un mensaje secreto por medio de una clave p´ ublica. En tal caso, Bernardo tiene que comunicar a Alicia una clave de cifrado que puede ser conocida por todo el mundo (es la clave p´ ublica). Alicia la utiliza para cifrar su mensaje, que luego env´ıa a Bernardo. Para descifrar el mensaje en clave, Bernardo utiliza su clave privada, que es el u ´nico en conocer. El sistema de cifrado de clave p´ ublica m´as conocido y utilizado es probablemente el sistema RSA, inventado en 1978 por Ronald Rivest, Adi Shamir y Leonard Adelman, del MIT (Massachusetts Institute of Technology, Estados Unidos). ii [· · · ] Desde aproximadamente 1980, es bastante f´acil averiguar si un n´ umero, aunque sea muy grande, es o no primo. En cambio, es mucho m´as dif´ıcil descomponer un n´ umero grande en factores primos. En esta diferencia de dificultad se basan precisamente los modernos m´etodos de criptograf´ıa. Muy esquem´aticamente, la idea consiste en construir la clave del cifrado (no secreta) por medio de un n´ umero N producto p × q de dos n´ umeros primos grandes. El desciframiento, en cambio, requiere el conocimiento de p y q por separado, unos valores que s´olo se comunican a las personas autorizadas. Para descifrar un mensaje en clave, un esp´ıa tendr´ıa que encontrar, conociendo N , sus dos factores primos p y q. Ahora bien, para N lo bastante grande (digamos que del orden de 150 cifras) y convenientemente elegido, es imposible realizar esta operaci´on inversa en un tiempo aceptable. ii hh

[· · · ] La importancia de la teor´ıa de n´ umeros en criptograf´ıa es tal que los matem´aticos se ven confrontados a problemas deontol´ogicos. Por ejemplo, si uno de ellos descubre un m´etodo de factorizaci´on num´erica mucho m´ as eficaz que los precedentes, ¿qu´e debe hacer? ¿Comunicarlo al primer ministro, exponerlo p´ ublicamente en una conferencia internacional para que nadie pueda aprovecharse de ´el a expensas de otros o venderlo al mejor postor? Afortunadamente, hasta d´onde se sabe, las mejoras encontradas por los matem´aticos no son lo bastante revolucionarias como para que el problema se plantee en toda su acuidad. ii hh

(fragmentos del art´ıculo La intriga de los n´ umeros primos, de Henri Cohen, publicado en [MC1].) En [C-C-S], pp. 15–16, se da la siguiente descripci´on simplificada, a modo de receta culinaria, del sistema RSA. ingredientes necesarios: dos n´ umeros primos p y q un n´ umero de codificaci´ on v y otro de descodificaci´ on w tales que vw ≡ 1 (m´od (p − 1)(q − 1)). Los primos p y q y el n´ umero de descodificaci´on w son secretos. El n´ umero de codificaci´ on v y el m´ odulo m = p · q no hace falta que sean secretos, pueden ser p´ ublicos.

´ CAP´ITULO 2. NUMEROS NATURALES Y ENTEROS

76

Codificar un n´ umero x transform´andolo en otro y mediante y ≡ xv (m´od m). Descodificar y recuperando x mediante x ≡ y w (m´od m). ¿Qu´e justifica la u ´ltima afirmaci´on? Se supone que p y q son muy grandes, y que x es menor que q−1 ellos. Por eso (x )p−1 ≡ 1 (m´od p), (xp−1 )q−1 ≡ 1 (m´od q), de donde x(p−1)(q−1) ≡ 1 (m´od pq) (¿por qu´e?), y as´ı y w ≡ xvw ≡ xa(p−1)(q−1)+1 ≡ (x(p−1)(q−1) )a · x ≡ x (m´od m). Ver otra descripci´on ‘aproximada’ en [COMAP], pp. 580–584. Para mayor precisi´on, consultar en la direcci´on [1] los apuntes de Fco. Javier Cobos Gavala, Universidad de Sevilla.

Ejercicios 6.1. Demostrar, utilizando congruencias, que si un n´ umero entero es a la vez un cuadrado y un cubo, entonces se puede escribir en la forma 7k o 7k + 1. 6.2. Probar que las seis primeras potencias de 10 pertenecen a distintas clases de congruencias m´odulo 7. (Comentario: Gauss pregunt´o si las potencias de 10 dan n − 1 clases de congruencias distintas m´ odulo n para infinitos n; la pregunta sigue sin contestar. Los m´odulos 5 y 13 fallan, a pesar incluso de que son primos.) 6.3. Sea k un n´ umero impar. Probar que k 2 ≡ 1 (m´od 8). 6.4. ¿Hay alg´ un cuadrado perfecto (entero de la forma k 2 , k ∈ Z), que sea congruente con 2 m´ odulo 3? ¿Por qu´e? 6.5. Si x2 + y 2 = z 2 , demostrar: (i) al menos uno de los valores x, y o z es divisible por 3; (ii) xyz es un m´ ultiplo de 4; (iii) al menos uno de los valores x, y o z es divisible por 5; (iv) xyz es un m´ ultiplo de 60. (Los enteros x, y, z que cumplen la ecuaci´on dada se llaman, por razones obvias, ternas pitag´ oricas .) 6.6. Dado un entero n ≥ 2, probar que en cada clase de restos m´odulo n hay exactamente un entero r que cumple −n/2 < r ≤ n/2. (Estos n´ umeros se llaman menores restos absolutos m´odulo n; cuando n es impar, son 0, ±1, ±2, . . . , ±(n − 1)/2; cuando n es par, 0, ±1, ±2, . . . , ±(n − 2)/2, n/2.) 6.7. Usando el problema anterior, hallar el menor resto no negativo de 28 × 33 (m´od 35). 6.8. Decimos que k es un cuadrado m´odulo n si k ≡ j 2 (m´od n) para alg´ un j. Supongamos que n = m2 + 1 para alg´ un m ∈ N. Probar que si k es un cuadrado m´odulo n, tambi´en −k es un cuadrado m´odulo n. 6.9. Si p es un primo, probar por inducci´on en n que np ≡ n (m´od p). Deducir el peque˜ no teorema de Fermat. 6.10. Calcular 132231 (m´od 7), 246218 (m´od 11), 145197 (m´od 13). 6.11. Hallar los inversos de 13 en Z21 y Z31 . 6.12. Hallar los inversos de 4 y 12 en Z19 .

Bibliograf´ıa [Casti] J. L. Casti: Mathematical Mountaintops: The Five Most Famous Problems of All Time. Oxford U. P., 2001. Citado en la(s) p´agina(s) 66 [C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an exciting way). Springer, Berlin, 1999. Citado en la(s) p´agina(s) 55, 59, 73, 75 [COMAP] COMAP: Principles and Practice of Mathematics. Springer, New York, 1997. Citado en la(s) p´agina(s) 74, 76 [D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs. Prentice-Hall, Upper Saddle River, NJ, 1997. Citado en la(s) p´agina(s) 62, 74 [Ddk]

Dedekind, R.: ¿Qu´e son y para qu´e sirven los n´ umeros?. (edici´on e introducci´on de J. Ferreir´os) Alianza Editorial, Madrid, 1998. Citado en la(s) p´agina(s) 42

[D-H]

Dorronsoro, J.; Hern´ andez, E.: N´ umeros, grupos y anillos. Addison-Wesley/UAM, Madrid, 1996. Citado en la(s) p´agina(s) 41, 63, 64

[G]

Gasca, M.: Las Matem´aticas en la vida del a˜ no 2000, Monograf´ıas de la Academia de Ciencias de Zaragoza 19 (37–44) 1996. Citado en la(s) p´agina(s) 73

[Ham]

Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge Univ. Press, 1982. Citado en la(s) p´agina(s) 42

[Lieb]

Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca Raton, 2000. Citado en la(s) p´agina(s)

[MC1]

Mundo Cient´ıfico: El universo de los n´ umeros: Matem´ aticas para interpretar el mundo. Extra n´ um. 1, s.f.. Citado en la(s) p´agina(s) 74, 75

[Peano] Peano, G.: Arithmetices principia nova methodo exposita. Bocca, Romæ-Florentiæ, 1889.. Citado en la(s) p´agina(s) 42 [S-T]

Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977. Citado en la(s) p´agina(s) 41, 42 Un libro de problemas resueltos muy interesante con muchos ejercicios accesibles, pero que en buena parte requiere un mayor conocimiento en Teor´ıa de N´ umeros, es

[Si]

Sierpinski, W.: 250 Problems in Elementary Number Theory. Elsevier, New York; PWN, Warszawa, 1970. Documentos en Internet [1] F. J. Cobos: Curso de Introducci´ on a la Matem´ atica Discreta. Universidad de Sevilla, 2002-2003. Citado en la(s) p´agina(s) 76 http://www.ma1.us.es/Docencia/apuntes/ap imd.PDF 77

BIBLIOGRAF´IA

78 [2] Axiomas de Peano. Citado en la(s) p´agina(s) 41, 42

http://www.unizar.es/analisis matematico/numyconj/axpeano.pdf [3] Fundamentos de la aritm´etica, The Oxford Companion to Philosophy. Citado en la(s) p´agina(s) 41 http://www.xrefer.com/entry/551320 [4] D. Alpern, Factorizaci´ on usando curvas el´ıpticas. Citado en la(s) p´agina(s) 65 http://www.alpertron.com.ar/ECMC.HTM [5] MathWorld, Prime Factorization Algorithms. Citado en la(s) p´agina(s) 65 http://mathworld.wolfram.com/PrimeFactorizationAlgorithms.html

Cap´ıtulo 3

N´ umeros racionales. Polinomios. Sobre los n´ umeros racionales y su construcci´on seguimos fundamentalmente el texto [D’A-W]. Sobre polinomios, ver [Pest]. Si bien [D-H] trata en detalle los polinomios, lo hace a un nivel m´ as elevado del que corresponde a este curso. En cada momento daremos las referencias complementarias que sean pertinentes.

3.1.

N´ umeros racionales.

La idea y el manejo de los n´ umeros racionales, y m´as concretamente de las fracciones, nos es sobradamente familiar. Lo que pretendemos ahora es reflexionar sobre el significado de las fracciones apoyados en la base conjuntista que poseemos actualmente, explicando el sentido de las manipulaciones que hemos aprendido ‘por decreto’ y sentando las bases para construcciones similares en contextos m´as generales, que se utilizar´an en otras asignaturas.

3.1.1.

Insuficiencia de Z. Fracciones.

Consideremos los dos problemas siguientes: (a) Hay que repartir veinte abrigos equitativamente, en igual n´ umero, entre seis familias. ¿Cu´antos hay que dar a cada una? (b) Se dividen veinte metros de tela a partes iguales entre seis sastres. ¿Cu´anta tela tendr´a cada uno? Ambos problemas se traducen matem´aticamente en: ‘Hallar x tal que 6x = 20’. ¿Vale para ambos la misma respuesta? Evidentemente, no. En el primer caso, daremos tres abrigos a cada familia (y sobrar´an dos, no hay ‘soluci´on exacta’); en el segundo, no podemos expresar la respuesta satisfactoriamente con valores enteros, Z resulta insuficiente en estas y otras situaciones en las que hay que resolver exactamente ecuaciones de la forma ax = b, a 6= 0. Lo que hacemos es ‘sacar de la nada’ una soluci´on, la ‘fracci´ on’ que representamos por hh b/aii. Para otra ecuaci´ on 0 0 0 0 a y = b tendr´ıamos la soluci´on y = b /a . ¿Habr´a, pues, tantas soluciones distintas como ecuaciones distintas? Volviendo sobre el ejemplo de la tela, la experiencia nos dice que si se repartieran diez metros entre s´olo tres sastres, cada uno recibir´ıa la misma cantidad que antes, y lo mismo suceder´ıa repartiendo treinta metros entre nueve, etc. Para reflejar fielmente esta situaci´on, habr´a que ‘igualar’ soluciones id´enticas aunque que provengan de ecuaciones distintas. ¿Bajo qu´e criterio? Si los nuevos entes van a comportarse de manera coherente con los viejos n´ umeros enteros, como x = b/a significa que ax = b e y = b0 /a0 significa a0 y = b0 , tambi´en ser´ıa a0 ax = a0 b, aa0 y = ab0 , y as´ı x = y debe corresponderse justamente con ba0 = b0 a. Llamamos fracciones equivalentes a las que verifican esta relaci´on, y decimos que definen el mismo n´ umero racional. ¿Qu´e estamos haciendo, desde nuestra perspectiva actual? Descorriendo todos los velos, en esto queda el misterio de las fracciones: tomamos pares ordenados (m, n) ∈ Z × (Z \ {0}) y establecemos 79

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

80

una ‘equivalencia’: (m, n) ∼ (p, q) si mq = np; si es una verdadera relaci´on de equivalencia, la identificaci´on posterior no supone otra cosa que el paso a las clases de equivalencia (un n´ umero racional = una clase de equivalencia de fracciones) y al conjunto cociente (este ser´ıa Q). La manera de operar con los nuevos objetos est´a completamente determinada si no queremos romper nuestras c´omodas leyes. Para sumar fracciones, recurrimos al ‘arreglo’ anterior: x = b/a, y = b0 /a0 lleva a a0 ax = a0 b, aa0 y = ab0 , y esto fuerza que aa0 (x + y) = a0 b + b0 a, es decir, x + y = (ba0 + b0 a)/(aa0 ). El producto es m´as directo: de ax = b y a0 y = b0 se pasa, multiplicando, a aa0 xy = bb0 , que deja xy = bb0 /aa0 . ¿“Pasan” estas operaciones a las clases de equivalencia, como suced´ıa en el caso de las congruencias? Habr´a que comprobar, igual que entonces, que sumando fracciones equivalentes se obtienen sumas equivalentes, y que multiplicando fracciones equivalentes se obtienen productos equivalentes. Enseguida nos ocuparemos de ello. Para complementar esta visi´on ‘algebraica’ de los n´ umeros racionales, puede verse una interpretaci´on geom´etrica como pendientes de rectas, en [D’A-W] pp. 123–124, por ejemplo.

3.1.2.

Construcci´ on de Q

Formalicemos las consideraciones anteriores. Lema 3.1.1. Sea F = Z × (Z \ {0}), y ∼ la relaci´ on en F dada por (m, n) ∼ (p, q) cuando y s´ olo cuando mq = pn. Entonces ∼ es una relaci´ on de equivalencia en F . Demostraci´ on. La relaci´on ∼ es: Reflexiva, pues (m, n) ∼ (m, n) cualquiera que sea (m, n) ∈ F , ya que trivialmente mn = mn Sim´etrica, siempre que (m, n) ∼ (p, q) resulta (p, q) ∼ (m, n) porque lo primero significa que mq = pn y lo segundo que pn = mq. Transitiva, de (m, n) ∼ (p, q) y (p, q) ∼ (r, s) se sigue (m, n) ∼ (r, s), porque si mq = pn y ps = rq, tambi´en mqps = pnrq. Si p 6= 0, como q 6= 0, cancelando pq ya queda ms = nr; mientras que si p = 0, forzosamente m = 0 y r = 0, y en este caso ms = 0 = nr. A los elementos de F los denominaremos fracciones . Definici´ on 3.1.2. El conjunto de los n´ umeros racionales es el conjunto cociente Q = F/ ∼. Sus elementos, los n´ umeros racionales , son por tanto las clases de equivalencia [(m, n)]. Nota. Evitando arrastrar las poco intuitivas notaciones (m, n) para lo que siempre hemos escrito m m ´o m/n, y [(m, n)] para lo que estamos acostumbrados a representar igualmente por ´o m/n, de n n aqu´ı en adelante volvemos a la notaci´on cl´asica. No obstante, no hay que perder de vista entonces que tenemos una misma notaci´on para dos objetos distintos: la fracci´ on (m, n) y el n´ umero racional [(m, n)] del cual la fracci´on anterior es un representante. En cualquier caso, lo que no ha originado confusi´on hasta ahora no deber´ıa causarla tampoco de ahora en adelante. Cuando sea necesario, indicaremos expl´ıcitamente si nos estamos refiriendo a una fracci´on o a un n´ umero racional. Por ejemplo: Definici´ on 3.1.3. Una fracci´ on m/n se dice irreducible si n > 0 y mcd(m, n) = 1. Ejercicio. Probar que toda fracci´ on es equivalente a una y una s´ola fracci´ on irreducible; dicho de otro modo, que todo n´ umero racional admite un u ´nico representante que sea una fracci´ on irreducible.

´ 3.1. NUMEROS RACIONALES.

81

Definici´ on 3.1.4. Dadas dos fracciones

m p , llamaremos suma de ambas a la fracci´ on n q

m p mq + pn + = n q nq y producto a la fracci´ on

mp mp = n q nq

Para definir la suma y el producto en Q dependemos del siguiente lema. Lema 3.1.5. Dadas fracciones

m m0 p p0 m m0 p p0 , 0 , , 0 tales que ∼ 0 , ∼ 0 , se verifica n n q q n n q q

m p m0 p0 + ∼ 0 + 0, n q n q

mp m0 p0 ∼ 0 0. n q n q

Demostraci´ on. Por hip´otesis, mn0 = m0 n, pq 0 = p0 q. Por definici´on m p mq + pn + = , n q nq

m0 p0 m0 q 0 + p0 n0 + = , n0 q0 n0 q 0

luego (mq + pn)(n0 q 0 ) = mqn0 q 0 + pnn0 q 0 = (mn0 )(qq 0 ) + (pq 0 )(nn0 ), (m0 q 0 + p0 n0 )(nq) = m0 q 0 nq + p0 n0 nq = (m0 n)(qq 0 ) + (p0 q)(nn0 ) son iguales, que es lo que necesit´abamos probar. Para el producto la demostraci´on se deja como ejercicio. Definici´ on 3.1.6. Dados dos n´ umeros racionales n´ umero racional

y producto al n´ umero racional

m p , ∈ Q, llamaremos suma de ambos al n q

m p mq + pn + = n q nq mp mp = n q nq

Notemos que seg´ un el lema  previo,  la aplicaci´on suma (respectivamente, producto) de Q × Q en mp m p mq + np Q que hace corresponder a , ∈ Q × Q el n´ umero racional (respectivamente, ) n q nq nq est´a bien definida. Proposici´ on 3.1.7. Con la suma y el producto que hemos definido, Q es un cuerpo conmutativo. Demostraci´ on. Enunciamos las propiedadesa comprobar, esbozando   las demostraciones.  p r m p r m 1. Propiedad asociativa de la suma. + + = + + . n q s n q s mqs + nps + nqr (Cierto: ambas operaciones dan como resultado .) nqs m p p m 2. Propiedad conmutativa de la suma. + = + . n q q n (Inmediato.) 3. Existencia de elemento neutro (cero) para la suma. Hay un n´ umero racional, que m m m denotamos provisionalmente por [0], tal que [0] + = + [0] = . n n n (Vale tomar [0] = 0/1.)

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

82

m 4. Existencia de elemento opuesto para la suma. Para cada ∈ Q hay un n´ umero racional n −m −m m m −m (y uno s´olo), el n´ umero racional , tal que + = + = [0]. n n n n n (Evidente.)     m pr mp r = . 5. Propiedad asociativa del producto. n q s n q s mpr .) (Ambos son el n´ umero racional nqs mp pm 6. Propiedad conmutativa del producto. = . n q q n (Inmediato.) 7. Existencia de elemento neutro (identidad) para el producto. Hay un n´ umero racional, m m m denotado provisionalmente por [1], tal que [1] · = · [1] = . n n n (Tomar [1] = 1/1.) m 4. Existencia de elemento inverso para el producto. Para cada ∈ Q\{0} hay un elemento n n n m m n (y uno s´olo) en Q, el n´ umero racional , tal que = = [1]. m m n n m (Tiene sentido porque m 6= 0.)   m p r mp mr 8. Propiedad distributiva del producto respecto de la suma. + = + . n q s n q n s m(ps + qr) mpns + mrnq (Ambos son iguales a = .) nqs nqns Los enteros como racionales. ¿Es inevitable la distinci´on entre hh el cero de Qii, [0], y hh el cero de Zii, 0? ¿o entre hh el uno de Q y hh el uno de Zii? ¿No hemos cre´ıdo siempre que los n´ umeros enteros estaban inclu´ıdos en los racionales? ¿Qui´en no pondr´ıa 6/3=2? Sin embargo, nos estamos refiriendo a objetos de naturaleza distinta: un n´ umero racional es nada menos que un conjunto de pares de n´ umeros enteros. Pero desde que aprendimos las fracciones hemos ‘identificado’ 0/1 con 0; 1/1 con 1 o, en general, m/1 con m cualquiera que sea m ∈ Z. ¿Es incorrecto matem´aticamente? No: hay una buena raz´on para hacerlo, que se basa en el siguiente resultado. ii

Proposici´ on 3.1.8. La aplicaci´ on h : Z → Q dada por h(m) = m/1 ∈ Q,

m ∈ Z,

tiene las siguiente propiedades: (i) es inyectiva, h(m) 6= h(n) si m 6= n; (ii) transforma sumas en sumas, h(m + n) = h(m) + h(n); (iii) transforma productos en productos, h(m n) = h(m) h(n). Demostraci´ on. Ejercicio. Es decir, h es un isomorfismo entre Z y h(Z), lo que significa que para todo lo referido a operaciones algebraicas (con sumas, restas, productos, potencias) Z y h(Z) son indistinguibles: toda ‘operaci´on’ en uno de estos sistemas puede ser reproducida fielmente en el otro, lo que hace innecesario a estos efectos diferenciar m de h(m). Por ello, desde este momento, consideramos Z⊆Q

y

m = m/1 para todo m ∈ Z.

´ 3.1. NUMEROS RACIONALES.

83

La idea de isomorfismo, “sumergir un sistema en otro manteniendo las formas (de operar)”, es muy importante y est´a por todas partes en Matem´aticas. Uno y otro sistema puede verse como un ‘modelo’ distinto de un mismo ‘sistema abstracto’, dos caras de una misma moneda.(*) Nota. Si se revisan cuidadosamente las demostraciones anteriores, se observar´a que, de entre todas las propiedades de Z, s´olo hemos necesitado las propiedades de la suma y el producto que hacen de Z un dominio de integridad. Por tanto, la idea de sumergir un dominio de integridad en un ‘cuerpo de fracciones’ es reutilizable en toda situaci´on similar (por ejemplo, al tratar con polinomios). La relaci´on de orden en Z se puede extender a una relaci´on de orden en Q. Lema 3.1.9. Sean m/n, m0 /n0 fracciones equivalentes. Entonces mn > 0 si y s´ olo si m0 n0 > 0. Demostraci´ on. Por hip´otesis mn0 = m0 n, luego mnn0 = m0 n2 ; como n2 > 0, si mn > 0 se sigue que 0 0 m y n son ambos positivos o ambos negativos (no pueden ser nulos —¿por qu´e?), y en cualquier caso m0 n0 > 0. Definici´ on 3.1.10. Sea m/n ∈ Q. Diremos que m/n es positivo si mn > 0. Dados m/n, p/q ∈ Q, diremos que m/n es menor o igual que p/q, escrito m/n ≤ p/q, si p/q − m/n es positivo o 0. Obs´ervese que el concepto de n´ umero racional positivo est´a bien definido, en virtud del lema anterior. Tambi´en, que un n´ umero racional m/n es positivo si y s´olo si m/n > 0 (o sea, 0 ≤ m/n y 0 6= m/n). Proposici´ on 3.1.11. La relaci´ on ≤ es una relaci´ on de orden en Q, y es un orden total. Demostraci´ on. La manera m´as c´omoda de comprobarlo pasa por examinar previamente algunas propiedades del conjunto de los n´ umeros racionales positivos, que denotaremos aqu´ı por P (la notaci´on habitual es Q+ , demasiado complicada). ∗ Primero, veamos que para todo n´ umero racional m/n se verifica una y s´olo una de estas tres alternativas: m/n = 0, m/n ∈ P , −m/n ∈ P (ley de tricotom´ıa). En efecto, si no es m/n = 0, tendremos que o bien mn > 0 (en cuyo caso m/n ∈ P ), o bien mn < 0, en cuyo caso (−m)n > 0 y −m/n ∈ P ; y las alternativas son claramente excluyentes. Despu´es, P es estable o cerrado para la suma, es decir, si m/n, p/q ∈ P , tambi´en m/n+p/q ∈ P . Supongamos m > 0, n > 0, p > 0, q > 0 (si no es as´ı, basta sustituir la fracci´on m/n por la fracci´ on equivalente mn/n2 , o p/q por pq/q 2 ). Entonces m/n + p/q = (mq + pn)/pq ∈ P claramente, pues (mq + pn)pq es un producto de enteros positivos. Con esto, la relaci´on ≤ es: Reflexiva, pues m/n ≤ m/n cualquiera que sea m/n ∈ Q, ya que trivialmente m/n−m/n = 0. Antisim´etrica, siempre que m/n ≤ p/q y p/q ≤ m/n simult´aneamente, ha de ser m/n = p/q, porque en caso contrario, p/q − m/n y su opuesto m/n − p/q deber´ıan ser simult´aneamente positivos, imposible. (*)

Generalmente se identifican ambos modelos, como hemos hecho aqu´ı. Pero en algunas ocasiones, disponer de varios ‘modelos’ sirve para ‘transferir intuici´ on’ de uno a otro. La ventaja es obvia: si dos juegos distintos obedecen a las mismas reglas, ganaremos con mayor facilidad jugando el que tenga la estrategia m´ as evidente. Hay un ejemplo precioso de ello en M. Gardner: Inspiraci´ on ¡aj´ a!. Labor, Barcelona, 1981 (reed. 1992)., pp. 116 y ss. Un feriante tiene un mostrador con casillas numeradas del 1 al 9, y el juego consiste en ir poniendo monedas por turno (de 50 pesetas el feriante, de 5 pesetas el otro jugador); se lleva todo el dinero de la mesa el que primero ocupe tres casillas distintas cuyos n´ umeros sumen 15. El feriante gana siempre que quiere, porque sabe que, disponiendo los n´ umeros en un cuadrado m´ agico, el juego resulta isomorfo al ‘tres en raya’, sencill´ısimo de jugar (merece la pena leer la exposici´ on original y los comentarios del maestro Martin Gardner).

84

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS. Transitiva, de m/n ≤ p/q y p/q ≤ r/s se sigue m/n ≤ r/s; esto es evidente si m/n = p/q o p/q = r/s. Si no es este el caso, tendremos r/s − m/n = (r/s − p/q) + (p/q − m/n), suma de dos racionales positivos, luego positivo. Un orden total, pues dados m/n, p/q ∈ Q, o p/q − m/n es 0 (con lo cual m/n = p/q), o es positivo (y as´ı m/n ≤ p/q) o −(p/q − m/n) = m/n − p/q es positivo (lo que da p/q ≤ m/n)

Nota. ¿Se respeta el orden antiguo en Z? Puesto que hemos identificado m ∈ Z con m/1 ∈ Q, dados m y n ∈ Z disponemos de dos ‘criterios’ para escribir m ≤ n. Pero en la nueva definici´ on, m ≤ n significa literalmente m/1 ≤ n/1, o sea, que n/1 − m/1 = (n − m)/1 es 0 (en cuyo caso n − m = 0, i.e. n = m) o es un n´ umero racional positivo, es decir, que (n − m) · 1 > 0, i.e., n > m; en cualquier caso, m ≤ n en la relaci´on de orden de Z. En consecuencia, la aplicaci´on h : Z → Q que permit´ıa identificar Z con h(Z) conserva tambi´en las desigualdades, por lo que Z y h(Z) son as´ı mismo ‘indistinguibles’ (isomorfos) por lo que respecta a las propiedades de orden. Es importante saber c´omo “se suman y multiplican desigualdades”. Las reglas fundamentales son las siguientes. Proposici´ on 3.1.12. Dados m/n, p/q, r/s ∈ Q, se tiene: (Compatibilidad del orden con la suma) si m/n ≤ p/q, entonces m/n + r/s ≤ p/q + r/s; (Compatibilidad del orden con el producto por elementos no negativos) si m/n ≤ p/q, y adem´ as r/s ≥ 0, entonces m/n · r/s ≤ p/q · r/s. En particular, de m/n ≥ 0 y p/q ≥ 0 se sigue m/n p/q ≥ 0. Demostraci´ on. Para la suma basta tener en cuenta que (p/q + r/s) − (m/n + r/s) = p/q − m/n y aplicar la definici´on. Para el producto, notemos primero que si a/b y c/d son n´ umeros racionales positivos, tambi´en a/b · c/d = ac/bd es positivo, ya que (ac)(bd) = (ab)(cd) > 0. Por tanto, si m/n ≤ p/q, y r/s ≥ 0, como p/q · r/s − m/n · r/s = (p/q − m/n) · r/s, el segundo t´ermino es un producto de factores positivos o nulos, y por lo anterior es positivo o nulo.

Un cuerpo en el que se ha definido un orden total que tenga las dos propiedades anteriores se llama cuerpo conmutativo totalmente ordenado . Podemos resumir entonces las propiedades vistas diciendo Q es un cuerpo conmutativo totalmente ordenado. El proceso diagonal de Cantor hizo plausible la existencia de una aplicaci´on biyectiva entre N y Q (i. e., que Q es numerable). Sin embargo, aunque en este sentido N y Q tienen ‘la misma cantidad de elementos’, los tienen ‘repartidos’ de manera totalmente distinta, como muestran los siguientes resultados. Proposici´ on 3.1.13. Entre dos n´ umeros racionales hay otro n´ umero racional. Demostraci´ on. Dados a, b ∈ Q, si a < b es a
0, 2 2 2 2

´ 3.1. NUMEROS RACIONALES.

85

ya que b − a > 0 por hip´otesis y 1/2 > 0 (¿por qu´e?). An´alogamente b−

2b − (a + b) b−a a+b = = > 0. 2 2 2

Proposici´ on 3.1.14. En Q no se cumplen los principios del m´ aximo ni del m´ınimo. Demostraci´ on. Por ejemplo, A = {x ∈ Q : 0 < x < 1} es un conjunto no vac´ıo (¿por qu´e?) acotado superiormente por 1 e inferiormente por 0. Pero no tiene elemento m´aximo ni elemento m´ınimo: si fuese M = m´ax A, ser´ıa M ∈ A y por tanto 0 < M < 1; pero seg´ un acabamos de probar, existir´ıa x ∈ Q entre M y 1, con lo cual 0 < M < x < 1, es decir, x ∈ M y x > M , por lo que M no puede ser el m´aximo de A. An´alogamente se prueba con el m´ınimo.

Ejercicios 1.1. Hallar las fracciones irreducibles equivalentes a 36/50, 444/33, 231 107/999 999 989. 1.2. Sean a/m y b/n fracciones irreducibles. Probar que (an + bm)/(mn) es irreducible si y s´ olo si m y n son relativamente primos. 1.3. Probar que en todo cuerpo K totalmente ordenado (en particular, en Q) se verifica: (i) x2 ≥ 0 para cada x ∈ K, y x2 = 0 si y s´olo si x = 0. (ii) 1 > 0 (unidad y cero de K). (iii) Para 2 = 1 + 1 (en K) y 1/2 = inverso de 2 en K, 0 < 1/2 < 1. 1.4. Sean m, n, p, q enteros positivos tales que m ≤ p ≤ q y p/q ≤ m/n. Probar que n − m ≤ q − p. Comprobar que esta conclusi´on no siempre es cierta si m ≤ q < p y p/q ≤ m/n. 1.5. Sean m, n, p, q enteros positivos tales que m/n < p/q. Probar que m/n < (m + p)/(n + q) < p/q. 1.6. Paradoja de Simpson. En un curso hay dos grupos, el grupo de la ma˜ nana y el grupo de la tarde. En el grupo de la ma˜ nana hay A chicas y B chicos, y en el de la tarde hay C chicas y D chicos. En el primer examen aprueban a chicas y b chicos del grupo de la ma˜ nana, y en el de la tarde aprueban c chicas y d chicos. Tanto en el grupo de la ma˜ nana como en el de la tarde el porcentaje de chicas aprobadas es menor que el de chicos aprobados. ¿Podemos afirmar que el porcentaje global de aprobados ser´a menor para las chicas que para los chicos? Examinar el caso A = 14, B = 6, C = 6, D = 19, a = 11, b = 5, c = 2, d = 7. ¿C´omo se explica esto? (Ver [D’A-W], pp. 129–130, y [1].)

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

86

3.2.

Polinomios

Ya es de sobras conocido que las expresiones tales como x2 + 1,

−x3 − (5/2)x + 1,

(47/8)x6 − 3x2 + (6/5)x + 2, . . .

y, en general, an xn + an−1 xn−1 + · · · + a1 x + a0 , donde n ∈ N, a0 ,. . . , an ∈ Q, reciben el nombre de polinomios sobre Q o polinomios con coeficientes racionales. Pero el nombre ‘polinomio’ encubre, en realidad, dos conceptos diferentes: el de polinomio formal o polinomio en sentido estricto y el de funci´ on polin´ omica. En el primer sentido, manejamos los polinomios como ‘f´ormulas’ o ‘expresiones simb´olicas’, sin darle a x ning´ un contenido determinado —dejando la x ‘indeterminada’— y operando con ella, por as´ı decir, como un objeto ‘que no se mezcla’ con los coeficientes.(**) En el segundo sentido, se piensa en la funci´ on que a cada x de un cierto conjunto de n´ umeros (u otros objetos: clases de restos, matrices, . . . ) hace corresponder el n´ umero (o . . . ) que resulta al calcular an xn + an−1 xn−1 + · · · + a1 x + a0 . Distinguiremos, pues, entre estos conceptos, reservando el nombre de polinomio para el primero y llamando funci´ on polin´ omica al segundo. A lo largo del curso, en esta y otras asignaturas, se manejar´an no solamente polinomios con coeficientes en Q, sino tambi´en polinomios con coeficientes reales y complejos. Muchas de las propiedades de los polinomios son comunes en todos estos casos, dependen u ´nicamente de que los coeficientes pertenezcan a un cuerpo. Para dejarlo m´as claramente de manifiesto, trataremos por ello inicialmente con polinomios sobre un cuerpo conmutativo arbitrario K, que podr´a ser en su momento Q, R o C (sin olvidar los cuerpos Zp , tan importantes en aplicaciones). Cuando sea oportuno, iremos estudiando algunas propiedades espec´ıficas de los polinomios con coeficientes racionales. Mientras no se indique lo contrario, de aqu´ı en adelante K representa un cuerpo conmutativo cualquiera y X una indeterminada.

3.2.1.

Definiciones. Suma y producto de polinomios.

Definici´ on 3.2.1. Un polinomio sobre K en la indeterminada X es una expresi´ on de la forma p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n , donde n ∈ N, a0 ,. . . , an ∈ K. Para 1 ≤ k ≤ n, el elemento ak se llama coeficiente de X k en p = p(X); a0 es el t´ ermino independiente o constante de p (puede verse como el coeficiente de X 0 ); si k > n, se entiende (cuando sea conveniente) que el coeficiente de X k en p es 0. Cuando ak = 1 s´olo se pone X k , y −X k si ak = −1; cuando ak = 0 el t´ermino +0 · X k suele omitirse (as´ı, para cada a ∈ K, a puede entenderse tambi´en como el polinomio ‘constante’ a + 0 · X + 0 · X 2 + 0 · X 3 + · · · ). El polinomio nulo o cero es aqu´el cuyos coeficientes son todos cero; se denotar´a por 0. Dados dos polinomios p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n ,

q(X) = b0 + b1 X + · · · + bm−1 X m−1 + am X m ,

que p(X) y q(X) sean iguales significa que a0 = b0 , a1 = b1 y, en general, ak = bk para todo k ∈ N, teniendo en cuenta el convenio anterior de que ak = 0 si k > n y bk = 0 si k > m. (**)

Es posible dar un sentido preciso a estas nociones un tanto vagas de expresiones simb´ olicas o formales y de indeterminada; nosotros nos conformaremos con la idea intuitiva, remitiendo para una definici´ on m´ as rigurosa p. ej. al libro de Godement, R.: Cours d’alg´ebre. Hermann, Paris, 1963., p. 353.

3.2. POLINOMIOS

87

Al conjunto de los polinomios sobre K en la indeterminada X (tambi´en llamados polinomios con coeficientes en K) lo denotaremos por K[X]. Definici´ on 3.2.2. Si un polinomio p(X) no tiene todos los coeficientes nulos, su grado es el m´ aximo n tal que an 6= 0, y este coeficiente an recibe entonces el nombre de coeficiente director . Si el coeficiente director es igual a 1, se dice que p(X) es un polinomio m´ onico . El grado de un polinomio p suele denotarse por deg p. Observemos que al polinomio nulo no le asignamos ning´ un grado (en algunos textos se considera deg 0 = −∞). Los polinomios de grado cero o constantes se corresponden con los elementos no nulos de K. La suma de polinomios se define sumando ordenadamente los coeficientes correspondientes a la misma potencia de X. Concretamente, Definici´ on 3.2.3. Dados dos polinomios en K[X], p = a0 + a1 X + a2 X 2 + · · · + an X n ,

q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,

su suma es el polinomio p + q = (a0 + b0 ) + (a1 + b1 )X + (a2 + b2 )X 2 + · · · (se entiende ak = 0 o bk = 0 donde sea necesario). Nota. Es c´omodo disponer de una cierta flexibilidad a la hora de escribir polinomios, sin tener que estar sujetos a la rigidez de la forma p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n que exige en principio nuestra definici´on. Tras la introducci´on de la suma, es claro que el polinomio p(X) podr´a escribirse igualmente como p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0 por ejemplo, sin m´as que interpretar el segundo t´ermino como el polinomio suma de los polinomios an X n , an−1 X n−1 , . . . , a1 X, a0 . Lo mismo puede decirse si los sumandos aparecen en cualquier otro orden. Aprovechando esta situaci´on, en lo sucesivo emplearemos el siguiente convenio: cuando escribamos un polinomio no nulo p 6= 0 en la forma an X n + an−1 X n−1 + · · · + a1 X + a0 , sobreentenderemos que an es su coeficiente director, es decir, que n es su grado y que an 6= 0. Ejercicio. Si p, q, p + q ∈ K[X] \ {0}, y p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0 ,

q(x) = bm X m + bm−1 X m−1 + · · · + b1 X + b0 ,

probar que el grado de p + q es menor o igual que m´ax{n, m}, siendo el menor estricto solamente cuando p y q tienen el mismo grado (n = m) y sus coeficientes directores son opuestos, i.e., an + bn = 0. El producto de polinomios se define por la ley ai X i · bj X j = ai bj X i+j , y buscando que sea distributivo. Concretamente,

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

88

Definici´ on 3.2.4. Dados dos polinomios en K[X], p = a0 + a1 X + a2 X 2 + · · · + an X n ,

q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,

su producto es el polinomio p · q = c0 + c1 X + c2 X 2 + · · · + cn+m X n+m , P donde ck = i+j=k ai bj , es decir, que si 0 ≤ k ≤ n + m, ck = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 , conviniendo como antes que si alguno de los coeficientes ai , bj no aparecen en p o en q, los tomamos iguales a cero. Obs´ervese que p · 0 = 0 = 0 · p y que si p y q no son nulos, el coeficiente director de pq es el producto del coeficiente director de p por el coeficiente director de q (as´ı que tambi´en pq 6= 0) y el grado de pq es la suma del grado de p m´as el grado de q, deg(pq) = deg p + deg q. Proposici´ on 3.2.5. Con las operaciones suma y producto anteriores, K[X] es un dominio de integridad. Demostraci´ on. Se deja como ejercicio el comprobar las diferentes propiedades. Por ejemplo, el polinomio nulo es el elemento neutro para la suma; el polinomio constante 1 es la identidad para el producto. La propiedad cancelativa se sigue de que pr = qr es lo mismo que (p − q)r = 0, y este producto s´olo puede ser 0 si r = 0 o p − q = 0. El espacio vectorial K[X]. En K[X] tenemos definida una suma, y disponemos adem´as de un producto por escalares ‘natural’: dados a ∈ K, p ∈ K[X], podemos definir a · p como el producto del polinomio constante a por p. Es f´acil comprobar que con esta suma y este producto por escalares, K[X] es un espacio vectorial sobre K. En cierto sentido, es “el menor espacio vectorial sobre K de dimensi´on infinita”: una base obvia est´a formada por la sucesi´ on de polinomios 1, X, X 2 , . . . , X n , . . .

3.2.2.

Divisi´ on de polinomios.

Proposici´ on 3.2.6 (Divisi´ on eucl´ıdea). Dados p, q ∈ K[X] con q no nulo, existen dos polinomios c y r tales que p = cq + r,

con r nulo ´o de grado estrictamente menor que q.

Con esta condici´ on, los polinomios c y r, denominados respectivamente cociente y resto de la divisi´ on de p por q, son u ´nicos. Demostraci´ on. Existencia. Si p = 0 o el grado de p es estrictamente menor que el de q, claramente p = 0 · q + p, y se sigue lo pedido. Suponiendo, pues, deg p ≥ deg q, procedemos por inducci´on sobre el grado de p. Si deg p = 0 (y en consecuencia deg q = 0), tendr´ıamos p = a0 , q = b0 6= 0, p = a0 b−1 0 q + 0. Si el enunciado es cierto cuando el grado del dividendo es menor o igual que n − 1, n ∈ N, veamos que tambi´en lo es cuando deg p = n. Sean an y bm los coeficientes directores de p y q n−m q tiene obviamente grado estrictamente menor respectivamente. El polinomio p1 = p − an b−1 m X n−m , r = p resuelve la cuesti´ al de p. Si p1 = 0 o deg p1 < deg q, tomar c = an b−1 on; y 1 m X si deg p1 ≥ deg q, por la hip´otesis de inducci´on el resultado es cierto para p1 , luego existen c1 , r ∈ K[X] tales que p1 = c1 q + r con r = 0 ´o con r de grado estrictamente menor que el de q. n−m +c . Entonces p = cq +r, siendo r = 0 ´ Denotemos por c = an b−1 o de grado estrictamente 1 m X menor que el de q, como quer´ıamos.

3.2. POLINOMIOS

89

Unicidad. Sean c, c, r, r ∈ K[X] tales que cq + r = p = cq + r con r = 0 ´o deg r < deg q, y r = 0 ´o deg r < deg q. Entonces r − r = (c − c)q, y si r − r 6= 0, por las propiedades de los grados anteriormente se˜ naladas deber´ıa ser deg q ≤ deg(c − c) + deg q = deg((c − c)q) = deg(r − r) ≤ m´ax{deg r, deg r} < deg q, imposible. Por lo tanto r = r, y as´ı (c − c)q = 0; pero q 6= 0, luego c = c. N´otese que el grado proporciona, para la divisi´on de polinomios, el control del tama˜ no del resto que para los enteros nos daba la condici´on 0 ≤ r < |q|. La propia demostraci´on sugiere el m´etodo habitual para efectuar la divisi´on, obteniendo sucesivamente los t´erminos del cociente de mayor a menor grado. Ejemplos. Dividir p(X) por q(X) en los siguientes casos: • p(X) = −6X 4 + 4X 2 + X − 5, q(X) = 2X 2 − 1; • p(X) = X 6 + 2X 5 + 5X 4 + 7X 3 + X 2 + 3X + 5, q(X) = X 3 + 5X + 3; • p(X) = X 7 + 1, q(X) = X + 1.

3.2.3.

M´ aximo com´ un divisor. Algoritmo de Euclides.

Definici´ on 3.2.7. Sean p, q ∈ K[X]. Decimos que p divide a q, o que p es un divisor de q, o que q es m´ ultiplo de p, escrito p|q, si existe c ∈ K[X] tal que q = pc; expresado de otra forma, si el resto de la divisi´ on de q por p es 0. Diremos entonces que c es el cociente exacto q/p. Observaciones. Como consecuencias inmediatas de la definici´on, se obtienen: dados polinomios arbitrarios p, q, r, s, t ∈ K[X], y a ∈ K[X] de grado 0 (i.e., constante y no nulo) (i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x)

p|p p|q y q|r implica p|r p|q y p|r implica p|(sq + tr) p|q implica pr|qr pr|qr y r 6= 0 implica p|q p|0 0|p implica p = 0 p|q y q 6= 0 implica deg p ≤ deg q a|p siempre que deg a = 0 p|q y q|p si y s´olo si p = aq

(propiedad reflexiva) (propiedad transitiva) (propiedad de linealidad) (propiedad de multiplicaci´on) (ley de cancelaci´on) (todo polinomio divide a 0) (0 s´olo divide a 0) (propiedad de comparaci´on) (los polinomios de grado 0 dividen a cualquier polinomio) para alg´ un a de grado 0.

La situaci´on reflejada en (x) se corresponde, en Z, con el hecho de que p|q y q|p simult´aneamente si y s´olo si p = aq para a = 1 o a = −1. Con polinomios encontramos un mayor n´ umero de posibilidades, lo que provoca una cierta ambig¨ uedad en la definici´on de conceptos tales como el de m´aximo com´ un divisor o m´ınimo com´ un m´ ultiplo. Definici´ on 3.2.8. Dados p, q ∈ K[X], diremos que d ∈ K[X] es un m´ aximo com´ un divisor de p y q si d|p, d|q, y si d0 ∈ K[X] tambi´en cumple d0 |p, d0 |q, entonces d0 |d (en palabras, si d es un divisor com´ un de p y q que a su vez es m´ ultiplo de todos los divisores comunes de p y q). Obs´ervese que hemos definido un m´aximo com´ un divisor, y no el m´aximo comun divisor, porque si d cumple la condici´on del enunciado, tambi´en la cumple ad para cualquier a de grado 0, dado que d|ad y ad|d. Para seleccionar entre todos ellos un u ´nico polinomio, basta exigir ‘en condiciones normales’ que sea m´onico (con coeficiente director 1).

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

90

Lema 3.2.9. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, si d, d ∈ K[X] son m´ aximos comunes divisores de p y q, existe a ∈ K[X] de grado 0 (i.e., un polinomio constante no nulo) tal que d = ad. Por tanto, si d y d son m´ onicos, entonces d = d. Demostraci´ on. Aplicando la definici´on, necesariamente d 6= 0, d 6= 0, d|d y d|d. Por tanto, d = ad para alg´ un a de grado 0, y deg d = deg d; si estos polinomios son de grado n, y ambos fuesen m´onicos, tendr´ıamos d = X n + bn−1 X n−1 + · · · = ad = a(X n + cn−1 X n−1 + · · · ) = aX n + acn−1 X n−1 + · · · , y forzosamente a = 1, d = d. Examinando el caso excluido, p = q = 0, vemos que la definici´on dejar´ıa como m´aximo com´ un divisor de p y q tan s´olo al 0. Definici´ on 3.2.10. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, pondremos mcd(p, q) = d si d es un (el) m´ aximo com´ un divisor m´ onico de p y q. Para p = q = 0, pondremos mcd(p, q) = 0. Atenci´on: la existencia de alg´ un m´aximo com´ un divisor no est´a garantizada todav´ıa; la demostraci´on que hicimos en Z no es traspasable sin m´as a los polinomios. Afortunadamente, el algoritmo de Euclides sigue siendo aplicable con el mismo esquema. Lema 3.2.11. Si p, q, r, c ∈ K[X] son tales que p = cq + r, se tiene que mcd(p, q) = mcd(q, r). Demostraci´ on. El caso q = 0 es trivial. Si q 6= 0, bastar´a ver que p y q tienen los mismos divisores comunes que q y r, lo cual es cierto por la propiedad de linealidad. Lema 3.2.12. Dados p, q ∈ K[X] tales que q|p, q es un m´ aximo com´ un divisor de p y q. En particular, q es un m´ aximo com´ un divisor de q y 0. Demostraci´ on. Consecuencia trivial de la definici´on. Definici´ on 3.2.13. Algoritmo de Euclides para polinomios. • Input: dos polinomios a y b. • Output: un m´ aximo com´ un divisor de a y b. Paso 1: Reemplazar (simult´ aneamente)  a por b, y  b por el resto de la divisi´ on de a por b. Paso 2: Repetir el Paso 1 hasta que b sea 0. Paso 3: Devolver a. Proposici´ on 3.2.14. Algoritmo de Euclides. Dados dos polinomios no nulos a y b con deg a ≥ deg b, obtenemos un m´ aximo com´ un divisor procediendo por divisiones enteras sucesivas, como se ha indicado anteriormente, hasta obtener resto nulo. El u ´ltimo resto no nulo es un m´ aximo com´ un divisor de a y b. Demostraci´ on. Aplicar los lemas. El caso de polinomios nulos ya lo hemos comentado. Por las mismas razones que en Z se tiene una ‘identidad de B´ezout’ (repasar las demostraciones). Proposici´ on 3.2.15. Identidad de B´ ezout. Sean p y q ∈ K[X] no nulos, y d = mcd(p, q). Entonces existen polinomios u, v tales que d = up + vq.

3.2. POLINOMIOS

91

Tenemos igualmente: Definici´ on 3.2.16. Algoritmo de Euclides extendido (Euclides-B´ ezout) para polinomios. • Input: dos polinomios a y b. • Output: dos polinomios x e y tales que, salvo constantes, mcd(a, b) = xa + yb. Paso 1: Hacer x = v = 1 e y = u = 0. Paso 2: Determinar c y r tales que a = cb + r y 0 ≤ r < b. Reemplazar (simult´ aneamente)  a por b, y b por r,  x por u e y por v,  u por x − cu y v por y − cv. Paso 3: Repetir el Paso 2 hasta que b sea 0. Paso 4: Devolver x e y. Visualizado en forma de tabla: restos & dividendos ← divisores cocientes c xk+1 =uk yk+1 =vk uk+1 =xk −ck+1 uk vk+1 =yk −ck+1 vk

a 1 0 0 1

r1 b c1 0 1 1 −c1

r2 r1 c2 1 −c1 −c2 1 + c1 c2

r3 r2 c3 ··· ··· ··· ···

······ ······ ······ ······ ······ ······ ······

rn−1 rn−2 cn−1 xn−1 yn−1 un−1 = x vn−1 =y

0 rn−1 = d cn x y

Ejercicios. Aplicar el algoritmo de Euclides-B´ezout a los polinomios • p(X) = X 6 − 2X 5 + 3X 4 − 4X 3 + 3X 2 − 2X + 1, q(X) = 3X 5 − 5X 4 + 6X 3 − 6X 2 + 3X − 1; • p(X) = X 5 + X 4 + 2X 3 − 2X + 3, q(X) = X 4 + 3X 3 + 7X 2 + 8X + 6. Midiendo el tama˜ no de los polinomios por el grado, tambi´en los m´aximos comunes divisores son ‘m´aximos’ en este sentido. Proposici´ on 3.2.17. Sean p, q, r ∈ K[X]. Si pq 6= 0 y r es un divisor com´ un de p y q de grado m´ aximo, entonces r es un m´ aximo com´ un divisor de p y q. Demostraci´ on. Sea d = mcd(p, q). Seg´ un la definici´on, r|d, y en consecuencia deg r ≤ deg d. Pero por hip´otesis deg d ≤ deg r, luego r = ad para alg´ un a de grado 0 y r es un m´aximo com´ un divisor de p y q. Los resultados sobre enteros que obtuvimos como consecuencia de la identidad de B´ezout pueden probarse para polinomios adaptando las demostraciones (comprobarlo). Definici´ on 3.2.18. Dos polinomios no nulos p y q se dicen relativamente primos o primos entre s´ı si no tienen m´ as divisores comunes que los polinomios de grado 0, es decir, si mcd(p, q) = 1. Corolario 3.2.19. Dos polinomios no nulos p y q son relativamente primos si y s´ olo si existen dos polinomios u y v tales que up + vq = 1. Tambi´en:

92

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

Proposici´ on 3.2.20. Sean p, q, d, r, s, t ∈ K[X], pq 6= 0. (i) si d = mcd(p, q), p = dr, q = ds, entonces mcd(r, s) = 1 (es decir, r y s son relativamente primos). (ii) si mcd(r, s) = 1 y r | st, entonces r | t. El concepto de m´aximo com´ un divisor es aplicable a un n´ umero finito arbitrario de polinomios. Definici´ on 3.2.21. Sea {p1 , p2 , . . . , pm } una familia finita de polinomios de K[X] no nulos. Diremos que un polinomio p ∈ K[X] es un m´ aximo com´ un divisor de la familia {p1 , p2 , . . . , pm } si verifica: (i) p divide a pi para i = 1, 2, . . . , m, y (ii) si q ∈ K[X] divide a pi , para todo i = 1, 2, . . . , m, entonces q divide p. As´ı p es el “mayor” de los divisores comunes de todos los pi . Igual que en Z, para hallar un m´aximo com´ un divisor de una familia {p1 , p2 , . . . , pm } basta ir obteniendo un m´aximo com´ un divisor q1 de p1 y p2 , un m´aximo com´ un divisor q2 de q1 y p3 , un m´aximo com´ un divisor q3 de q2 y p4 , . . . Se puede probar: Proposici´ on 3.2.22. En K[X] existe un m´ aximo com´ un divisor de cualquier familia finita de polinomios no nulos {p1 , p2 , . . . , pm }. Adem´ as podemos elegir un tal m´ aximo com´ un divisor que sea m´ onico, y entonces es u ´nico. Proposici´ on 3.2.23 (Identidad de B´ ezout general). . Si p es un m´ aximo com´ un divisor de la familia {p1 , p2 , . . . , pm }, entonces existen g1 , . . . , gm ∈ K[X] tales que p = g1 p1 + · · · + gm pm . Como en Z, en K[X] puede definirse tambi´en el m´ınimo com´ un m´ ultiplo de dos polinomios (o de una familia finita). Definici´ on 3.2.24. Un polinomio m se dice que es un m´ınimo com´ un m´ ultiplo de la familia finita de polinomios no nulos {p1 , p2 , . . . , pr } si verifica: 1.

pi divide a m para i = 1, 2, . . . , r, y

2.

si q ∈ K[X] verifica que pi divide a q, (i = 1, 2, . . . , r), entonces m divide q.

As´ı, m es el “menor” de los m´ ultiplos comunes de todos los pi . Proposici´ on 3.2.25. En K[X] existe un m´ınimo com´ un m´ ultiplo de cualquier familia finita de polinomios no nulos {p1 , p2 , . . . , pr }. Adem´ as entre todos ellos existe uno y s´ olo uno que es m´ onico. Ejercicio. Dados p, q ∈ K[X] tales que pq 6= 0, ¿es cierto que mcm(p, q) · mcd(p, q) = pq? En caso negativo, ¿qu´e relaci´on es cierta?

3.2. POLINOMIOS

3.2.4.

93

Funciones polin´ omicas. Ra´ıces de polinomios.

Definici´ on 3.2.26. Sea p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X] un polinomio y a un elemento de K. La evaluaci´ on o el valor de p(X) en a es el elemento de K, denotado por p(a), dado por p(a) = a0 + a1 a + a2 a2 + · · · + an an (obtenido ‘sustituyendo la indeterminada X por el elemento a en la expresi´on del polinomio’). La aplicaci´ on de K en K que a cada x ∈ K hace corresponder el valor de p(X) en x es la funci´ on polin´ omica correspondiente al polinomio p, y suele denotarse igualmente con p si no es motivo de confusi´ on. Un elemento c ∈ K se dice que es un cero o una ra´ız del polinomio p si p(c) = 0. Notas. • La suma y el producto de polinomios est´an definidos justamente para que, cualesquiera que sean p, q ∈ K[X], a ∈ K, se obtenga (p + q)(a) = p(a) + q(a),

(pq)(a) = p(a) q(a).

• En general, la funci´on polin´omica no determina el polinomio que la define: dos polinomios distintos pueden dar lugar a la misma funci´on (y esta es una raz´on m´as para distinguir ambos conceptos). Por ejemplo, para K = Zp , p entero primo, el peque˜ no teorema de Fermat nos dice que las funciones polin´omicas corespondientes a los polinomios X p y X son iguales, o que la asociada al polinomio no nulo X p − X es la funci´on nula. • El valor de un polinomio en un a ∈ K se halla mediante el conocido algoritmo de Horner/Ruffini, habida cuenta que p(a) = a0 + a1 a + a2 a2 + · · · + an an = a0 + a(a1 + a(a2 + a(· · · + a(an−1 + aan ) · · · ))). Los c´alculos se disponen seg´ un el esquema an a) an

an−1 a an bn−1

... ... ...

ak a bk+1 bk

... ... ...

a1 a b2 b1

a0 a b1 ( b0

donde bk = a bk+1 + ak y b0 = a0 + a b1 = a0 + a (a1 + a b2 ) = a0 + a (a1 + a (a2 + a b3 )) = . . . = p(a). As´ı se efect´ uan solamente n multiplicaciones y n sumas, mientras que el c´alculo directo supone n(n + 1)/2 multiplicaciones y n sumas; este algoritmo es f´acil de programar y es muy estable num´ericamente (‘peque˜ nos errores en los datos producen errores peque˜ nos en el resultado’). Teorema 3.2.27 (Teorema del resto). Sea p(X) ∈ K[X], a ∈ K. El resto de dividir p por X − a es p(a). Consecuentemente, a es ra´ız de p si y s´ olo si X − a divide a p. Demostraci´ on. Por el algoritmo de la divisi´on, existen c, r ∈ K[X] tales que p(X) = c(X)(X − a) + r(X), con r = 0 ´o deg r < deg(X − a) = 1, y as´ı r tiene que ser constante . Por tanto p(a) = c(a)(a − a) + r = r, de donde se sigue lo pedido. Nota. El cociente es an X n−1 + bn−1 X n−2 + · · · + bk X k−1 + · · · + b1 con los bk del algoritmo de Horner/Ruffini (comprobarlo multiplicando este polinomio por X − a). Ejemplo. Sean p(X) = 7 − 9X + 4X 3 − 8X 4 , q(X) = 2X − 3. Para hallar el cociente y el resto de la divisi´on de p por q, tendremos en cuenta que q(X) = 2(X − 3/2) y p = cq + r si y s´ olo si 1 p = 2c · q + r, luego usando el algoritmo de Horner/Ruffini 2

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

94

−8 3/2) −8

4 −12 −8

0 −12 −12

−9 −18 −27

7 −81/2 (−67/2

con lo cual r = −67/2, 2c = −8X 3 − 8X 2 − 12X − 27, c = −4X 3 − 4X 2 − 6X − 27/2. Ejercicios. 1. Sean p, q ∈ Q[X] dados por p(X) = X 4 − 6X 3 + 2X 2 + 3X − 4, q(X) = X 2 − X − 2 = (X + 1)(X − 2). Probar que q no divide a p sin efectuar la divisi´on. 2. Si se divide un cierto polinomio p por X − 1 el resto es −2; si lo dividimos por X + 2 el resto es 79. ¿Cu´al es el resto que se obtiene al dividirlo por (X − 1)(X + 2)? Corolario 3.2.28. Un polinomio de grado n puede tener a lo m´ as n ra´ıces distintas. Demostraci´ on. Puesto que si c1 , . . . , ck son ra´ıces distintas de un polinomio p, ´este es divisible por (X − c1 ) · · · (X − ck ), y por tanto debe tener grado mayor o igual que k. Corolario 3.2.29. Sean p, q ∈ K[X] de la forma p(X) = a0 + a1 X + · · · + an X n ,

q(X) = b0 + b1 X + · · · + bn X n ,

y supongamos que K tiene por lo menos n + 1 elementos distintos. Entonces: (i) p es el polinomio nulo si y s´ olo si la funci´ on polin´ omica p se anula en n + 1 puntos distintos. (ii) los polinomios p y q son iguales si y s´ olo si las funciones polin´ omicas p y q toman el mismo valor en n + 1 puntos distintos. Demostraci´ on. (i) Si no fuese p = 0 tendr´ıamos un polinomio de grado menor o igual que n con n + 1 ra´ıces distintas. (ii) La funci´on polin´omica p − q se anula en n + 1 puntos distintos. Las funciones polin´omicas (especialmente sobre R y C) son muy u ´tiles en las aplicaciones, debido sobre todo a que es f´acil calcular con ellas, y adem´as sirven para aproximar funciones m´as complicadas. Por ejemplo, siempre es posible encontrar expl´ıcitamente un polinomio que tome valores arbitrarios en puntos prescritos de antemano, como muestra el siguiente resultado. Proposici´ on 3.2.30 (Teorema de interpolaci´ on de Lagrange). Dados n elementos distintos x1 , . . . , xn ∈ K y n valores arbitrarios y1 , . . . , yn ∈ K (n ∈ N), existe un polinomio p ∈ K[X] nulo o de grado n − 1 a lo m´ as, y uno s´ olo, tal que p(x1 ) = y1 , . . . , p(xn ) = yn . Dicho polinomio viene dado por la f´ ormula de interpolaci´ on de Lagrange (X − x2 ) · · · (X − xn ) (X − x1 ) · · · (X − xk−1 )(X − xk+1 ) · · · (X − xn ) + · · · + yk (x1 − x2 ) · · · (x1 − xn ) (xk − x1 ) · · · (xk − xk−1 )(xk − xk+1 ) · · · (xk − xn ) (X − x1 ) · · · (X − xn−1 ) + · · · + yn . (xn − x1 ) · · · (xn − xn−1 )

p(X) = y1

Demostraci´ on. El polinomio del enunciado es de grado n − 1 a lo m´as (o nulo si los yk son todos nulos), y para cada k, 1 ≤ k ≤ n, cumple que f (xk ) = yk (todos los sumandos son nulos salvo el k-´esimo, que es yk · 1). La unicidad es consecuencia del corolario anterior. Ejercicio. ¿Qu´e valores han de tener a, b, c ∈ Q para que p(X) = aX 2 + bX + c cumpla p(−1) = 1, p(−2) = 2, p(−3) = 7?

3.2. POLINOMIOS

95

Ra´ıces m´ ultiples. Sea c una ra´ız de un polinomio no nulo p ∈ K[X]. Seg´ un hemos probado, tendremos p = (X − c)p1 para alg´ un p1 ∈ K[X]. Si c fuese tambi´en ra´ız de p1 , an´alogamente p1 = (X − c)p2 y p = (X − c)2 p2 . Reiterando, llegaremos a encontrar un m ∈ N tal que p = (X − c)m pm y c ya NO es ra´ız de pm (va incluida la posibilidad de que pm sea constante). Definici´ on 3.2.31. Sea c una ra´ız de un polinomio p ∈ K[X]. Diremos que c es una ra´ız de multiplicidad m si p = (X − c)m q para alg´ un q ∈ K[X] tal que q(c) 6= 0; dicho de otro modo, si m es el mayor n´ umero natural tal que (X − c)m |p. Cuando m = 1, suele decirse que a es una ra´ız simple ; cuando m = 2, que es una ra´ız doble ; cuando m = 3, que es una ra´ız triple , etc. Diremos que a es una ra´ız m´ ultiple para indicar que su multiplicidad es mayor o igual que 2 (o sea, que no es simple). Se sigue inmediatamente que para un polinomio p cuyas ra´ıces sean c1 , . . . , ck , con multiplicidades respectivas m1 . . . , mk , hay una factorizaci´on p = (X − c1 )m1 · · · (X − ck )mk q,

donde q es un polinomio que no tiene ra´ıces en K.

(cuando K = C, esto obliga a que q sea constante, como comentaremos posteriormente.) Una herramienta importante en el estudio de las ra´ıces m´ ultiples es la derivaci´ on de polinomios, que puede definirse ‘formalmente’ para cualquier polinomio sin necesidad del concepto de l´ımite, y que obedece a las reglas conocidas para la derivaci´on de los polinomios reales. Definici´ on 3.2.32. Dado un polinomio p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X], su polinomio derivado es p0 (X) = a1 + 2a2 X + 3a3 X 2 + · · · + nan X n−1 ∈ K[X]. El polinomio derivado de p0 es el segundo derivado p00 de p, y reiterando se obtienen los sucesivos derivados p000 , . . . , p(k) , . . . Las funciones polin´omicas asociadas a estos polinomios son la derivada primera de la funci´ on polin´omica p, la derivada segunda, . . . , la derivada k-´esima, . . . Lema 3.2.33. Dados p, q, a ∈ K[X], se tiene (i) (p + q)0 = p0 + q 0 ; (ii) (pq)0 = p0 q + q 0 p; (iii) si a constante, a0 = 0 y (ap)0 = ap0 . Demostraci´ on. Basta aplicar (con paciencia) la definici´on. Proposici´ on 3.2.34. Sea K un cuerpo conmutativo que contiene a Q. Dado p ∈ K[X] no nulo, (i) las ra´ıces m´ ultiples de p, con multiplicidad m, son ra´ıces de p0 con multiplicidad m − 1; (ii) las ra´ıces m´ ultiples de p son exactamente las ra´ıces del m´ aximo com´ un divisor de p y p0 ; (iii) c ∈ K es una ra´ız de p de orden m ≥ 1 si y s´ olo si la primera derivada no nula de p en c es la de orden m: p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

96 Demostraci´ on.

(i) c ∈ K es una ra´ız de p de orden m ≥ 1 si y s´olo si p = (X − c)m q con q(c) 6= 0; pero entonces, cuando m ≥ 2, p0 = m(X −c)m−1 q +(X −c)m q 0 = (X −c)m−1 [mq +(X −c)q 0 ] = (X −c)m−1 q1 y q1 (c) = mq(c) + 0 · q 0 (c) = mq(c) 6= 0 ya que m 6= 0, con lo cual c es una ra´ız de p0 de multiplicidad m − 1. (ii) Si c ∈ K es una ra´ız m´ ultiple de p, es ra´ız de p0 seg´ un acabamos de probar, y X − c divide por 0 tanto a p y a p , luego X − c tambi´en divide a mcd(p, p0 ), es decir, c es una ra´ız de mcd(p, p0 ). Rec´ıprocamente, si c es una ra´ız de d = mcd(p, p0 ), X − c divide a d y por tanto divide a p y a p0 , o sea, c es ra´ız de p y p0 . Por el apartado anterior, c es una ra´ız de multiplicidad m ≥ 2. (iii) Si c ∈ K es una ra´ız de p de orden m, aplicando reiteradamente (i), es una ra´ız de orden m − 1 de p0 , de orden m − 2 de p00 , . . . , de orden 1 de p(m−1) . En consecuencia, p(m−1) (c) = 0, p(m) (c) 6= 0. Supongamos ahora que p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0. Recorriendo a la inversa el camino anterior, c es una ra´ız de p(m−1) necesariamente simple, una ra´ız de p(m−2) forzosamente doble, . . . , una ra´ız de p obligatoriamente de multiplicidad m. N´otese que p0 puede tener ra´ıces que no son ra´ıces de p: por ejemplo, si p = X 2 − 1, p0 = 2X. Ejercicio. Hallar todas las ra´ıces m´ ultiples de X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1. Ra´ıces en Q. El estudio y localizaci´on (exacta o aproximada) de los ceros de los polinomios es de gran importancia en numerosos ´ambitos de las Matem´aticas, como ir´a comprobando el lector a lo largo de sus estudios. La determinaci´on de los valores que alcanzan las funciones polin´omicas es tambi´en, esencialmente, un problema de ceros, puesto que p(x) = y ∈ K para alg´ un x ∈ K si y s´ olo si p(x) − y = 0, i.e., si x es un cero del polinomio p(X) − y. En estos tipos de cuestiones intervienen de manera decisiva las propiedades espec´ıficas del cuerpo que se considera. Por ejemplo, en cualquier cuerpo totalmente ordenado (Q, R, . . . ) se tiene para todo x ∈ K que x2 ≥ 0, x2 + 1 ≥ 1 > 0, luego X 2 + 1 no tiene ning´ un cero en estos cuerpos. Tampoco X 2 − 2 tiene ceros en Q (¿por qu´e?), aunque los tiene en R como sabemos. No hay, en general, f´ormulas ‘razonables’ que permitan expresar las ra´ıces de un polinomio en funci´on de sus coeficientes (la b´ usqueda de tales f´ormulas ha desempe˜ nado un papel important´ısimo en la historia de las Matem´aticas, ver p. ej. [2], [3], [4], [5]). En este apartado expondremos algunos criterios muy sencillos que permiten limitar la b´ usqueda de las ra´ıces de los polinomios en Q. La herramienta b´asica es la divisibilidad de n´ umeros enteros, dado que podemos conocer las ra´ıces de un polinomio en Q hallando las de un polinomio con coeficientes en Z. En efecto, si tenemos un polinomio p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ Q[X], y los coeficientes a0 , . . . , an se expresan como fracciones bk /m con un denominador com´ un m, lo cual siempre es posible, ser´a p(c) = 0 si y s´olo si q(c) = 0, donde q(X) = b0 + b1 X + · · · + bn X n , con coeficientes b0 , . . . , bn ∈ Z.

3.2. POLINOMIOS

97

Proposici´ on 3.2.35. Sea q(X) = bn X n + bn−1 X n−1 + · · · + b1 X + b0 un polinomio con coeficientes b0 , . . . , bn ∈ Z, de grado n ≥ 1. Los ceros enteros de q son divisores del t´ermino independiente b0 . Si c = a/b ∈ Q es un cero de q escrito en forma irreducible [es decir, a, b ∈ Z y mcd(a, b) = 1], el numerador a divide al t´ermino independiente b0 , y el denominador b divide al coeficiente director bn . Demostraci´ on. Si c ∈ Z es tal que q(c) = 0, se deduce que b0 = c(−bn cn−1 − · · · − b1 ) y por tanto c divide a b0 . Si q(c) = 0 para c = a/b, a, b ∈ Z y mcd(a, b) = 1, sustituyendo y multiplicando por bn resulta 0 = bn an + bn−1 an−1 b + · · · + b1 abn−1 + b0 bn = a(bn an−1 + bn−1 an−2 b + · · · + b1 bn−1 ) + b0 bn , luego a divide a b0 bn , lo que s´olo es posible si a divide a b0 ; y an´alogamente b divide a bn an , luego a bn . Las ra´ıces enteras deben cumplir otras condiciones f´aciles de comprobar. Proposici´ on 3.2.36. Sea q(X) = bn X n + bn−1 X n−1 + · · · + b1 X + b0 un polinomio con coeficientes b0 , . . . , bn ∈ Z, de grado n. Si c ∈ Z es un cero de q, necesariamente (c − 1)|q(1) y (c + 1)|q(−1). Demostraci´ on. Aplicando el teorema del resto, q(X) = (X − c)q1 (X), lo que implica q(1) = (1 − c)q1 (1) = (c − 1)(−q1 (1)) y (c − 1)|q(1). An´alogamente q(−1) = (−1 − c)q1 (−1) = (c + 1)(−q1 (−1)) y (c + 1)|q(−1). Corolario 3.2.37. En Q hay polinomios sin ra´ıces de grado arbitrario (≥ 2). Demostraci´ on. Aplicar lo anterior a los polinomios X n − 2, por ejemplo. Ejercicio. Hallar las ra´ıces de 18X 3 + 3X 2 − 4X − 1.

3.2.5.

Factorizaci´ on de polinomios.

El papel jugado en Z por los n´ umeros primos lo desempe˜ nan en K[X] los polinomios irreducibles. Definici´ on 3.2.38. Diremos que un polinomio p no constante es irreducible si cuando p = rs para polinomios r, s, necesariamente deg r = 0 o deg s = 0. Dicho de otra forma, p es irreducible si es no constante y para cada polinomio no constante q, q|p implica que p/q es constante. Obviamente, los polinomios de grado 1 (polinomios lineales) son irreducibles. Los polinomios que no son irreducibles deben admitir una factorizaci´on como producto de polinomios de grado mayor o igual que 1. Corolario 3.2.39. Dado p ∈ K[X], (i) si p es un polinomio cuadr´atico (de grado 2), entonces p es irreducible si y s´ olo si no tiene ra´ıces en K; (ii) si p es un polinomio c´ ubico (de grado 3), entonces p es irreducible si y s´ olo si no tiene ra´ıces en K; (iii) si p es de grado mayor o igual que 4, entonces para que p sea irreducible es condici´ on necesaria, pero no suficiente, que p no tenga ra´ıces en K.

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

98 Demostraci´ on. Ejercicio.

–—o0o—– La naturaleza de los polinomios irreducibles es muy variable, dependiendo del cuerpo particular que se considere, y en general no se sabe c´omo son los polinomios irreducibles sobre un cuerpo cualquiera. No es ´este el lugar para un estudio amplio del tema: por lo que a nosotros respecta, la informaci´on fundamental es que en C[X] los polinomios irreducibles son los lineales (de grado 1), debido al llamado Teorema fundamental del ´ algebra (D’Alembert-Gauss): Todo polinomio no constante con coeficientes complejos posee una ra´ız en C. Como consecuencia, se puede afirmar: [1] Todos los polinomios irreducibles de C[X] son de grado uno. Este hecho se indica diciendo que C es algebr´ aicamente cerrado. En particular, los polinomios m´onicos irreducibles de C[X] son de la forma X − t con t ∈ C. [2] Los polinomios m´onicos irreducibles de R[X] son de dos formas: • de grado uno, de la forma X − t con t ∈ R. • de grado dos, de la forma (X − t)2 + r2 con t, r ∈ R, r 6= 0. [3] En Q[X] hay polinomios irreducibles del grado que se desee.

–—o0o—– Sobre el esquema empleado en Z, puede probarse la existencia (con los ajustes pertinentes) de descomposici´on de un polinomio en producto de factores irreducibles. Lema 3.2.40. Un polinomio p no constante es irreducible si y s´ olo si cuando p|rs, necesariamente p|r o p|s (en palabras, cuando divide a un producto de polinomios tiene que dividir al menos a uno de los factores) Demostraci´ on. Si p es irreducible y divide a rs, o bien mcd(p, r) = 1 (y entonces p|s seg´ un la 1 Proposici´on 3.2.20), o bien mcd(p, r) = d 6= 1, con lo cual p = ad, a constante no nula, y d = p; a   1 1 entonces, para alg´ un q, r = qd = q p = q p, es decir, p|r. a a Rec´ıprocamente, si p cumple la condici´on del enunciado tiene que ser irreducible, pues de p = rs se sigue que p|rs, luego o bien p|r (y como r|p es deg r = 0) o bien p|s (y an´alogamente deg s = 0).

Corolario 3.2.41. Sean p, q ∈ K[X] m´ onicos e irreducibles tales que p divide a q. Entonces p = q. Demostraci´ on. Puesto que p es irreducible, no es una constante, luego q = ap donde forzosamente deg a = 0, puesto que q es irreducible. Como p y q son m´onicos, necesariamente a = 1 y p = q. Correspondiendo al teorema fundamental de la Aritm´etica tenemos el siguiente, que podr´ıa llamarse ‘teorema fundamental de la aritm´etica de polinomios’.

3.2. POLINOMIOS

99

Teorema 3.2.42 (de factorizaci´ on u ´ nica). Para todo polinomio p ∈ K[X] no constante existen a constante y q1 , . . . , qm ∈ K[X] m´ onicos e irreducibles tales que p = aq1 · · · qm . Adem´ as, a y los qj son u ´nicos para cada p. En palabras, p puede descomponerse como producto de una constante por factores m´ onicos irreducibles de manera u ´nica, salvo el orden de dichos factores. (Esto se expresa diciendo que el dominio de integridad K[X] es de factorizaci´ on u ´nica .) Demostraci´ on. Sea a el coeficiente director de p, entonces p = a−1 p es m´onico y p = ap. Veamos que todo polinomio m´onico no constante p se puede expresar como producto de polinomios m´ onicos irreducibles. Para ello procedamos por inducci´on sobre el grado deg p ≥ 1, Si deg p = 1, es claro que p es irreducible. Supongamos que deg p > 1, y que el resultado es cierto para todo polinomio m´onico de grado inferior al de p. Si p es irreducible, se sigue lo pedido. En caso contrario, se puede expresar p = g1 g2 con g1 , g2 ∈ K[X] no constantes, esto es, de grado no inferior a 1. Adem´as podemos elegirlos m´onicos pues el producto de los coeficientes directores de ambos polinomios vale 1. Puesto que deg g1 , deg g2 < deg p, por hip´otesis de inducci´on g1 y g2 se pueden expresar como producto de polinomios m´onicos irreducibles, luego lo mismo sucede con p = g1 g2 . Veamos la unicidad: sean aq1 q2 · · · qm = p = bp1 p2 · · · pr dos descomposiciones como las del enunciado, donde qi , pj ∈ K[X] m´onicos e irreducibles, a, b ∈ K. Puesto que el producto de polinomios m´onicos es m´onico se sigue que a = b es el coeficiente director de p. Por tanto q1 q2 · · · qm = p1 p2 · · · pr . Ahora q1 divide p1 p2 · · · pr , y como q1 es irreducible, divide a alg´ un pj . Cambiando la numeraci´on, si es preciso, podemos suponer que q1 divide p1 , y como p1 y q1 son m´ onicos, por la consecuencia anterior se sigue que p1 = q1 . Simplificando nos queda q2 · · · qm = p2 · · · pr . Procediendo an´alogamente con q2 y reiterando el proceso se sigue que m = r y salvo el orden es p2 = q 2 , p 3 = q 3 , . . . , p m = q m . Ejemplo. Factoricemos p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 en Q[X]. Buscamos primero sus ra´ıces enteras, que pueden ser ±1, ±2, ±3, ±5, ±6, ±10, ±15, ±30; pero p(1) = 40, p(−1) = 550 (utilizar el algoritmo de Ruffini), luego s´olo −3 es una posible ra´ız; de nuevo mediante el algoritmo de Ruffini comprobamos que p(−3) = 0 y que q(X) = p(X)/(X + 3) = 14X 4 − 67X 3 + 116X 2 − 63X + 10, polinomio que ya no puede tener ra´ıces enteras y cuyas posibles ra´ıces fraccionarias son ±1/2, ±5/2, ±1/7, ±2/7, etc. Afortunadamente, probando primero 1/2 resulta q(1/2) = 0, r(X) = q(X)/(X − 1/2) = 14X 3 − 60X 2 + 86X − 20 = 2(7X 3 − 30X 2 + 43X − 10), que s´olo puede tener ra´ıces fraccionarias entre ±1/7, ±2/7, etc. Probando nuevamente se obtiene r(2/7) = 0, (1/2)r(X)/(X − 2/7) = 7X 2 − 28X + 35 = 7(X 2 − 4X + 5) = 7[(X − 2)2 + 1], que ya no puede tener ra´ıces en Q (¿por qu´e?) y por tanto es irreducible (¿por qu´e?). Finalmente, pues, 2 1 p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 = 14(X + 3)(X − )(X − )(X 2 − 4X + 5). 2 7 Corolario 3.2.43. Sean p1 , . . . , pm ∈ K[X] no nulos, factorizados como potencias de polinomios m m m´ onicos irreducibles (distintos): pj = tj q1j1j · · · qrj rj y tj ∈ K. Entonces: (i) El mcm(p1 , . . . pm ) es el producto de los factores comunes y no comunes con mayor exponente.

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

100

(ii) El mcd(p1 , . . . pm ) es el producto de los factores comunes con menor exponente. Demostraci´ on. Es una comprobaci´on directa utilizando las definiciones y la unicidad de la factorizaci´on. Ejemplo. Sean p, q ∈ Q[X] los polinomios: p(X) = X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1,

q(X) = X 6 + X 4 − X 2 − 1.

Determinemos mcd(p, q), mcm(p, q) a partir de su factorizaci´on. Procediendo como antes es f´ acil ver que p(X) = (X + 1)3 (X 2 + 1), q(X) = (X + 1)(X − 1)(X 2 + 1)2 , y as´ı mcd(p, q) = (X + 1)(X 2 + 1),

mcm(p, q) = (X + 1)3 (X − 1)(X 2 + 1)2 .

Ejercicios En los ejercicios siguientes, si no se especifica nada sobre K se supone K = Q. 2.1. Sea p ∈ Q[X] tal que p(1) = 1, p(2) = 4. Sea q(X) = X 2 − 3X + 2. Determinar el resto de la divisi´on de p por q. 2.2. Hallar el cociente y el resto de la divisi´on de X 2 , X 3 , X 4 y X 5 por el polinomio q(X) = X 3 − 2X 2 + 3X − 1. 2.3. Determinar polinomios u y v tales que X 3 u(X) + (1 − X)2 v(X) = 1 (i) utilizando el algoritmo de Euclides-B´ezout; (ii) desarrollando (X + (1 − X))4 por la f´ormula del binomio de Newton. 2.4. ¿Cu´ales son las ra´ıces del polinomio p(X) = 1 −

1 1 1 X + X(X − 1) + · · · + (−1)n X(X − 1) · · · (X − n + 1) 1! 2! n!

para cada n ∈ N? Indicaci´ on : ¿Qui´en es (1 − t)m ? 2.5. Demostrar que si c/d es una fracci´on irreducible que representa uno de los ceros del polinomio de coeficientes enteros p(X) = an X n + · · · + a1 X + a0 , entonces c − md es un divisor de p(m) para todo entero m. Determinar los ceros racionales del polinomio p(X) = X 4 − 2X 3 − 8X 2 + 13X − 24. 2.6. Hallar un polinomio de grado 3 que al dividirlo por X − 1, X − 2 y X + 5 da, respectivamente, restos 2, 1, 8. ¿Hay m´as de una soluci´on? 2.7. ¿Puede ser un polinomio divisible por su derivada? Justificar la respuesta. 2.8. Sean p(X) = X 5 + 2X 3 − 5X − 3, q(X) = X 2 − 2X − 12. Hallar el cociente y el resto de la divisi´on de p por q, y deducir que p y q son relativamente primos.

3.2. POLINOMIOS

101

2.9. Hallar el m´aximo com´ un divisor y el m´ınimo com´ un m´ ultiplo de los polinomios p(X) = 2X 4 + X 3 − 8X 2 − X + 6,

q(X) = 2X 3 − 7X 2 + 8X − 3.

¿Cu´ales son las ra´ıces de p y q? 2.10. (1) Expresar el polinomio p(X) = 3X 4 − 5X 3 + 6X 2 + 7X − 5 como combinaci´on lineal de potencias de X − 2. (Indicaci´ on : Dividir sucesivamente por X − 2.) (2) ¿Cu´anto valen p(2), p0 (2), p00 (2), p000 (2), p(iv) (2)? 2.11. F´ ormula de Taylor. Sea p ∈ Q(X) un polinomio de grado n y a ∈ Q. Probar que p(X) =

n X p(k) (a) k=0

k!

(X − a)k .

2.12. Derivada n-´ esima de un producto (Leibniz). Sea K un cuerpo cualquiera y p, q ∈ K[X]. Probar por inducci´on que n   X n (k) (n−k) (n) (pq) = p q . k k=0

2.13. Sea K un cuerpo cualquiera. Demostrar que si an X n + an−1 X n−1 + · · · + a1 X + a0 ∈ K[X] es irreducible, tambi´en lo es an + an−1 X + · · · + a1 X n−1 + a0 X n . 2.14. Descomponer el polinomio X 4 − 5X 2 + 6 en factores irreducibles en Q[X]. 2.15. Probar que p(X) = X 4 + 4 no tiene ra´ıces en Q y que puede factorizarse (en Q[X]) como producto de dos polinomios de grado 2.

3.2.6.

Polinomios, maple y Mathematica

Los polinomios aparecen en casi todas las ´areas de la Matem´atica en una o varias de sus m´ ultiples facetas. Son tambi´en de fundamental importancia en numeros´ısimas aplicaciones a las dem´as ciencias. Por tanto, no es de extra˜ nar que los programas de c´alculo simb´olico dispongan de una amplia cantidad de recursos para su manipulaci´on. Como se˜ nala D. Duval en [Duval], hh los polinomios constituyen elementos b´asicos para el c´alculo formal; [· · · ] figuran expl´ıcita o impl´ıcitamente en todos los c´alculos, por lo que es imprescindible saber manejarlos lo m´as eficazmente posible.ii Es imposible dar una descripci´on breve de las ´ordenes de maple y Mathematica que se encargan del manejo de los polinomios, y menos de los matices que admiten muchas de ellas. En consecuencia, rese˜ naremos las m´as b´asicas y nos remitimos a los manuales o al men´ u de ayuda de cada programa para m´as informaci´on. En lo que sigue, A, B, etc., indican polinomios en una indeterminada x. Diferentes representaciones de un polinomio

maple collect(A,x);

expand(A); ? ? simplify(A);

Matematica Collect[A,x]

RESULTADO Reorganiza el polinomio de manera que x sea “la indeterminada dominante”, aunque haya otros “par´ametros variables”. Expand[A] Desarrolla productos y potencias. FactorTerms[A] Si lo hay, saca factor com´ un num´erico. FactorTerms[A,x] Si lo hay, saca factor com´ un que no dependa de x. Simplify[A] “Simplifica” (a veces) la expresi´on de A.

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

102 Ejemplos: maple collect(x + collect[x + expand((2 + simplify((x

(1 + 5 y) x + 4 y (4 + 5 x) y + x 52 x3 − 28 x2 + 12 x − 4 + 64 x5 − 64 x4 + 16 x7 − 48 x6 x2 + 2 x + 1

4*y + 5*x*y, x); 4 y + 5 x y, y]; 4*x^2)^2*(x - 1)^3); - 1)^2 + 4*x);

Ejemplos: Matematica Collect[x + 4 Collect[x + 4 Expand[(2 + 4 FactorTerms[2 FactorTerms[2 Simplify[(x -

y + 5 x y, x] y + 5 x y, y] x^2)^2 (x - 1)^3] + 4 x^2] a b + 4 a x^2, x] 1)^2 + 4 x]

4y + x(1 + 5y) x + (4 + 5x)y −4 + 12 x − 28 x2 + 52 x3 − 64 x4 + 64 x5 − 48 x6 + 16 x7 2 (1 + 2x2 ) 2 a (b + 2x2 ) (1 + x)2

Divisi´ on, mcd, mcm, identidad de B´ ezout. Derivaci´ on.

maple quo(A,B,x); rem(A,B,x); gcd(A,B); lcm(A,B); gcdex(A,B,’s’,’t’); s,t;

Matematica PolynomialQuotient[A,B,x] PolynomialRemainder[A,B,x] PolynomialGCD[A;B] PolynomialLCM[A,x] ?

diff(A, x)

D[A, x]

RESULTADO Cociente de la divisi´on de A por B. Resto de la divisi´on de A por B. M´aximo com´ un divisor de A y B. M´ınimo com´ un m´ ultiplo de A y B. M´aximo com´ un divisor de A y B y coeficientes de la identidad de B´ezout. A0 , polinomio derivado de A.

Ejemplos: maple collect(x + 4*y + 5*x*y, x); collect[x + 4 y + 5 x y, y]; expand((2 + 4*x^2)^2*(x - 1)^3); simplify((x - 1)^2 + 4*x); diff((x + 1)^2*(x - 1)^3,x); diff(expand((x + 1)^2*(x - 1)^3),x); expand(diff((x + 1)^2*(x - 1)^3,x));

(1 + 5 y) x + 4 y (4 + 5 x) y + x 52 x3 − 28 x2 + 12 x − 4 + 64 x5 − 64 x4 + 16 x7 − 48 x6 x2 + 2 x + 1 2(x + 1)(x − 1)3 + 3(x + 1)2 (x − 1)2 5x4 − 4x3 − 6 x2 + 4 x + 1 5x4 − 4x3 − 6 x2 + 4 x + 1

Ejemplos: Matematica Collect[x + 4 y + 5 x y, x] Collect[x + 4 y + 5 x y, y] Expand[(2 + 4 x^2)^2 (x - 1)^3] FactorTerms[2 + 4 x^2] FactorTerms[2 a b + 4 a x^2, x] Simplify[(x - 1)^2 + 4 x] D[(x + 1)^2*(x - 1)^3,x] D[Expand[(x + 1)^2*(x - 1)^3],x] Expand[D[(x + 1)^2*(x - 1)^3,x]]

4y + x(1 + 5y) x + (4 + 5x)y −4+12 x−28 x2 +52 x3 −64 x4 +64 x5 −48 x6 +16 x7 2 (1 + 2x2 ) 2 a (b + 2x2 ) (1 + x)2 2 (−1 + x)3 (1 + x) + 3 (−1 + x)2 (1 + x)2 1 + 4 x − 6 x2 − 4x3 + 5x4 1 + 4 x − 6 x2 − 4x3 + 5x4

3.2. POLINOMIOS

103

Ra´ıces Aqu´ı aumenta la complicaci´on de manera considerable. Ambos programas permiten distintos tipos de b´ usqueda de ra´ıces, sea en diferentes cuerpos, sea proporcionando valores num´ericos aproximados si no hay o no interesan valores simb´olicos ‘exactos’. Nos limitamos, por ello, a recoger las ´ordenes m´as simples.

maple roots(A,x);

Matematica

Roots[A == 0, x] solve(A=0,x);

Solve[A == 0, x]

fsolve(A=0,x);

NSolve[A == 0, x]

RESULTADO Da las ra´ıces (racionales) y su multiplicidad. Puede omitirse la variable si es la ‘evidente’. Ver ejemplos. Puede omitirse la variable si es la ‘evidente’. Ver ejemplos. Puede omitirse la variable si no hay ambig¨ uedad. (Puede omitirse la x si es la variable ‘evidente’.) Busca soluciones aproximadas usando aritm´etica de punto flotante, con diferentes opciones.

Ejemplos: maple roots(x^3 + x^2 - 12); solve(x^3 + x^2 - 12=0); fsolve(x^3 + x^2 - 12=0); fsolve(x^3 + x^2 - 12=0,x,complex);

[[2, 1]] 3 1 √ 3 1 √ 2, − + I 15, − − I 15 2 2 2 2 2. −1,500000000 − 1,936491673 I, −1,500000000 + 1,936491673 I, 2.

Ejemplos: Matematica Roots[x^3 + x^2 - 12 == 0] Solve[x^3 + x^2 - 12 == 0] NSolve[x^3 + x^2 - 12 == 0]

√ √ 1 1 x == (−3 − ı˙ı 15)|| x == (−3 + ı˙ı 15)|| x == 2 2 2      √ √ 1 1 {x → 2}, x → (−3 − ı˙ı 15) , x → (−3 + ı˙ı 15) 2 2 {{x → −1,5 − 1,93649 ı˙ı}, {x → −1,5 + 1,93649 ı˙ı}, x → 2.}

Factorizaci´ on Como las ra´ıces, la factorizaci´on de polinomios depende del cuerpo en el que se toman los coeficientes. La cantidad de situaciones posibles es inmensa, y s´olo podemos dar idea somera de algunas de ellas mediante ejemplos.

maple factor(A);

Matematica

Factor[A] irreduc(A);

RESULTADO Factoriza respecto al menor cuerpo que contiene a los coeficientes. Admite opciones. hh Factoriza sobre los enterosii, dice el manual. Ver ejemplos. true si A es irreducible sobre el menor cuerpo que contiene a los coeficientes, false si es reducible. Admite opciones.

´ CAP´ITULO 3. NUMEROS RACIONALES. POLINOMIOS.

104 Ejemplos: maple factor(4*x^2-1);

(2x − 1)(2x + 1) factor(x^2 - 2*sqrt(2)*x + 2); √ (x − 2)2 factor(x^6-12*x^4+44*x^2-48); (x − 2)(x + 2)(x2 − 6)(x2 − 2) factor(sqrt(2)*(x^6-12*x^4+44*x^2-48)); √ √ √ 2 (x2 − 6)(x + 2)(x − 2)(x + 2)(x − 2) factor(sqrt(2)*sqrt(3)*(x^6-12*x^4+44*x^2-48)); √ √ √ √ √ √ √ √ 3 2 (x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2) factor(x^6-12*x^4+44*x^2-48,{sqrt(2),sqrt(3)}); (m´ as ‘ortodoxo’) √ √ √ √ √ √ (x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2) irreduc(x^3+5); true irreduc(x^3+5,5^(1/3)); false factor(x^3+5,5^(1/3)); (x2 − x 5(1/3) + 5(2/3) ) (x + 5(1/3) ) Ejemplos: Mathematica Factor[4 x^2 + 1] (−1 + 2 x) (1 + 2 x) Factor[x^2 - 2 Sqrt[2] x + 2] 2 − 2 x + x2 Factor[x^2 - 2 Sqrt[2] x + 2, Extension -> Sqrt[2]] √ ( 2 − x)2 Factor[x^6 - 12 x^4 + 44 x^2 - 48] (−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 ) Factor[Sqrt[2] (x^6 - 12 x^4 + 44 x^2 - 48)] √ 2 (−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 ) Factor[x^6 - 12 x^4 + 44 x^2 - 48, Extension -> {Sqrt[2],Sqrt[3]}] √ √ √ √ √ √ ( 2−x) ( 6−x) (−2+x) (2+x) ( 2+x) ( 6+x) (x+ 2)(x− 2)(x+2)(x−2)

Bibliograf´ıa [C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an exciting way). Springer, Berlin, 1999. Citado en la(s) p´agina(s) [D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs. Prentice-Hall, Upper Saddle River, NJ, 1997. Citado en la(s) p´agina(s) 79, 80, 85 [D-H]

Dorronsoro, J.; Hern´ andez, E.: N´ umeros, grupos y anillos. Addison-Wesley/UAM, Madrid, 1996. Citado en la(s) p´agina(s) 79

[Duval] Duval, D.: C´ alculo simb´ olico y automatizaci´ on. Mundo cient´ıfico, Extra 1: El universo de los n´ umeros, pp. 78–86. Citado en la(s) p´agina(s) 101 [Pest]

Pestana, D. & al.: Curso pr´ actico de C´ alculo y Prec´ alculo. Ariel, Barcelona, 2000. Citado en la(s) p´agina(s) 79 El apartado sobre factorizaci´on de polinomios est´a en su mayor parte tomado de

[Bern] Bernal, E.: Algebra Lineal. Apuntes de la asignatura, Zaragoza, 1998–99. Documentos en Internet [1] M. Conthe: La paradoja de Simpson. Expansi´on, 08/10/2002. Citado en la(s) p´agina(s) 85 http://www.expansiondirecto.com/edicion/componentes/noticia/ VersionImprimirExp cmp/0,3240,184488,00.html http://www.expansiondirecto.com/edicion/componentes/noticia/ VersionImprimirExp cmp/0,3240,192294,00.html (Cada una de las direcciones debe ir escrita en una sola l´ınea.) [2] J. M. Albaig` es, Abel-Galois: dos vidas, un destino. Citado en la(s) p´agina(s) 96 http://www.grijalvo.com/Albaig%E8s/b JMAiO ABEL GALOIS.htm [3] The MacTutor History of Mathematics archive: Quadratic, cubic and quartic equations. Citado en la(s) p´agina(s) 96 http://www-history.mcs.st-and.ac.uk/history/HistTopics/Quadratic etc equations.html

[4] The MacTutor History of Mathematics archive: The development of group theory. Citado en la(s) p´agina(s) 96 http://www-history.mcs.st-and.ac.uk/history/HistTopics/Development group theory.html

[5] E. T. Bell, Los grandes matem´ aticos: Abel. Citado en la(s) p´agina(s) 96 http://www.geocities.com/grandesmatematicos/cap17.html

105

Cap´ıtulo 4

N´ umeros reales En En la asignatura de de An´ alisis matem´ atico I se aasicas n´ meros la asignatura An´ alisis matem´ atico I sehan hantratado tratadolas laspropiedades propiedades b´ b´ sicas de los n´ uumeros reales desde desde un un planteamiento axiom´atico m´as o menos expl´ıcito. Aqu´ Aqu´ nos limitaremos, limitaremos, por por tanto, tanto, reales ıı nos describir aa grandes grandes rasgos rasgos las las distintas distintas construcciones construcciones de de R R aa partir partir de de Q Q yy la la caracterizaci´ caracterizaci´ aa describir oonn axiom´ tica de de R, R, yy estudiaremos estudiaremos brevemente brevemente la la representaci´ representaci´ decimal (y (y otras) otras) de de los los n´ n´ meros axiom´ aatica oonn decimal uumeros reales. La La bibliograf´ bibliograf´ ıa oportuna oportuna se se ir´ ir´ citando aa lo lo largo largo de de la la exposici´ exposici´ n. reales. ıa aa citando oon.

4.1 LECTURA: uumeros 4.1. LECTURA: Construcciones Construcciones de de los los n´ n´ meros reales. reales. 4.1.1 Insuficiencia 4.1.1. Insuficiencia de de Q Q Ya Ya hemos visto queque desde el el punto uumeros racionales es es hemos visto desde puntodedevista vistaalgebraico, algebraico,elelsistema sistema de de los los n´ n´ meros racionales bastante incompleto: incompleto: sisi bien bien en en Q Q es es posible posible resolver resolver siempre siempre ecuaciones ecuaciones del del tipo tipo ax ax + + bb = = 0, 0, con con bastante 2 = 2 que no tienen soluci´ 2 a =  0, hay ecuaciones tan simples como x o n. Esto fue descubierto ya a 6= 0, hay ecuaciones tan simples como x = 2 que no tienen soluci´on. Esto fue descubierto ya por los pitag´ o ricos en el siglo V antes de nuestra era, en su formulaci´ o n geom´ e trica, en t´ e rminos por los pitag´oricos en el siglo V antes de nuestra era, en su formulaci´on geom´etrica, en t´erminos de conmensurabilidad conmensurabilidad ee inconmensurabilidad inconmensurabilidad de de longitudes longitudes (ver (ver notas notas hist´ ooricas 2; de hist´ ricas en en [[Ebb Ebb], ], cap. cap. 2; tambi´ e n, [ Kl1 ], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si pueden tambi´en, [Kl1], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si pueden ser ser medidos exactamente unidad de longitud com´ es decir, si un hayn´ un n´ umero “exacto” medidos exactamente con con una una unidad de longitud com´ un u,unesu,decir, si hay umero “exacto”m ∈ m ∈ N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismo N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismo un n´ n´ mero nn de de sementos sementos para para CD; CD; la la raz´ raz´ proporci´ entre las las longitudes longitudes de de los los segmentos segmentos un uumero oonn oo proporci´ oonn entre AB yy CD CD es es la la misma misma que que la la raz´ raz´ (el cociente) cociente) entre entre los los n´ n´ umeros meros m m yy n. n. En En caso caso contrario, contrario, son son AB oonn (el u inconmensurables. inconmensurables.

Q A s C

?

t P 0 1/5 2/5 3/5 4/5 1 Figura Figura 11

X

u

?

BDst Figura Figura 22

Figura Figura 33

Fijado aacil aangulos Fijado un un segmento segmento cualquiera, cualquiera, es es f´ f´ cil construir construir por por semejanza semejanza de de tri´ tri´ ngulos un un nuevo nuevo segmento segmento cuya oonn con cuya raz´ raz´ con el el primero primero sea sea igual igual aa un un valor valor m/n m/n arbitrariamente arbitrariamente dado dado (en (en la la figura figura 11 se se muestra muestra 107 107

´ CAP´ITULO 4. NUMEROS REALES

108

la construcci´ on de un segmento de longitud 1/5: la recta OP Q y el segmento OP son arbitrarios; el punto Q se obtiene trasladando OP cinco veces a lo largo de dicha recta; la paralela por P al segmento que une Q con 1 corta a la recta OX en un punto a distancia 1/5 de O). En sentido contrario, no es descabellado pensar que dos segmentos cualesquiera siempre son conmensurables: el algoritmo de Euclides, con la divisi´on interpretada como “sustracci´on repetida de segmentos iguales”, lleva gr´aficamente a una unidad de medida com´ un —hasta donde el ojo puede apreciar, al menos. Por ejemplo, en la figura 2, quitando a AB un segmento de longitud igual a CD queda un segmento s, de longitud menor que CD; quitando a CD dos segmentos de longitud igual a s, queda un segmento t, de longitud menor que s; quitando a s un segmento de longitud igual a t, queda un segmento u tal que la longitud de t es exactamente tres veces la longitud de u (en t encajan perfectamente tres segmentos de longitud u). Por tanto, u ‘mide’ a AB y CD (en el lenguaje cl´ asico, u es una parte al´ıcuota com´ un de AB y CD): la longitud de AB es 15 veces la longitud de u y la longitud de CD es 11 veces la longitud de u; la proporci´on entre las longitudes de los segmentos AB y CD es, en este caso, de 15 a 11. Sin embargo, la intuici´on que el ojo sugiere es desmentida por la raz´on, y como es bien sabido, el teorema de Pit´agoras obliga a descartar la hip´otesis de ‘conmensurabilidad universal’: la diagonal del cuadrado (figura 3), de la que no dudamos que tenga una longitud, resulta inconmensurable con el lado, pues si ´este tiene una longitud m respecto de cualquier unidad, la diagonal ha de tener una longitud n tal que n2 = m2 + m2 = 2m2 , lo cual lleva a un absurdo tras eliminar sucesivamente factores 2 en m y n. (Ver la discusi´on sobre Aritm´etica y Geometr´ıa en [A-K], p. 43). Hizo falta mucho talento para solucionar este inconveniente (lo logr´o Eudoxo, contempor´ aneo de Plat´on, con su teor´ıa de las proporciones). Mucho m´as tarde, cuando la fiabilidad de la intuici´ on geom´etrica fue puesta en cuesti´on nuevamente tras el asentamiento de las geometr´ıas no eucl´ıdeas y la crisis subsiguiente, se hizo necesaria una fundamentaci´ on del continuo, i.e., del conjunto de los n´ umeros reales (v. [Dur], pp. 70 y ss; [Kl3], cap. 41, pp. 1292 y ss.; [Ebb], cap. 2, pp. 34 y ss.). No es este el lugar para recorrer la largu´ısima evoluci´on hist´orica del concepto de n´ umero (real) hasta las ideas actuales, por lo dem´as excelentemente expuesta en [Dur], pp. 60 y ss, o [Ebb], pp. 24 y ss, por ejemplo. Nos limitaremos en lo que sigue a se˜ nalar los principales puntos que subyacen a una presentaci´on rigurosa de los n´ umeros reales, que quedan abiertos para tratar en una asignatura posterior sobre Fundamentos de An´ alisis matem´ atico.

4.1.2.

Construcciones de R a partir de Q.

En la ampliaci´on de un sistema num´erico para llegar a otro mayor que subsane alguna deficiencia, la idea directriz es ‘a˜ nadir lo m´ınimo que le falta’. As´ı, para construir Z a partir de N ‘se a˜ naden’ los opuestos de los n´ umeros naturales (y el 0, si no est´a incluido en N); para construir Q a partir de Z, ‘se a˜ naden’ los cocientes de enteros (con denominador no nulo). Para construir R a partir de Q, hay dos procedimientos destacados: • m´ etodo de Cantor-Meray de las sucesiones fundamentales. Trata de suplir la inexistencia de l´ımite de algunas sucesiones de Cauchy de n´ umeros racionales no convergentes en Q, identificando las sucesiones de Cauchy que “deber´ıan converger a un mismo valor”, porque sus diferencias convergen a 0, con ese “valor”. Se define as´ı una relaci´on de equivalencia en el conjunto de las sucesiones de Cauchy de n´ umeros racionales: son equivalentes aquellas cuya diferencia tenga l´ımite 0, de manera que R es el conjunto cociente y un n´ umero real es una clase de equivalencia (que va a jugar el papel de ‘l´ımite’ de todas las sucesiones de la clase). Las operaciones de suma y producto en R se definen a partir de las operaciones de suma y producto de sucesiones, y se demuestra que con ellas R es un cuerpo. Hay que definir as´ı mismo una relaci´on de orden entre las sucesiones de Cauchy de Q, que permite luego definir una ordenaci´on en R con la cual resulta ser un cuerpo totalmente ordenado completo (en el sentido de que todo conjunto no vac´ıo acotado superiormente posee supremo). El desarrollo en detalle de este proceso se entiende mejor cuando se ha estudiado teor´ıa de anillos e ideales.

´ 4.2. AXIOMATICA DE R

109

Puede verse, por ejemplo, en [Ebb], [Ham], [S-T] (aqu´ı hay adem´as un interesante apartado sobre la ‘conexi´on con la intuici´on’, p. 204). Este es el m´etodo m´as empleado generalmente, sobre todo porque permite usar construcciones parecidas en otras situaciones (compleci´on de espacios m´etricos en Topolog´ıa, por ejemplo.) • m´ etodo de Dedekind de las cortaduras. Se dirige a conseguir que se cumpla ‘el axioma del supremo’, no v´alido en Q. Se parte de las cortaduras en Q, que son pares (A, B) de subconjuntos de Q tales que: • A y B son complementarios, A ∪ B = Q y A ∩ B = ∅; • A= 6 ∅= 6 B; • cada elemento de A es menor que cada elemento de B. Cada cortadura est´a determinada por A o por B (v. comentarios en [Ebb]), de modo que podemos quedarnos, por ejemplo, con el conjunto A, y decir como en [Spv], que un n´ umero real es un conjunto A de n´ umeros racionales con las propiedades siguientes: • si x ∈ A e y ∈ Q es tal que y < x, entonces tambi´en y ∈ A; • ∅= 6 A 6= Q; • no hay un elemento m´aximo en A, de manera que si x ∈ A, existe alg´ un y ∈ A tal que y > x. De qu´e modo se definen la suma, el producto y la ordenaci´on en el conjunto R de los n´ umeros reales puede verse en [Spv], pp. 811 y ss.; ver tambi´en [Ebb], pp. 36 y ss. • otros m´ etodos. ¿Por qu´e no usar “los decimales” para construir R? Es posible, pero tiene m´as inconvenientes ‘t´ecnicos’ que los m´etodos anteriores. La manera de hacerlo est´a indicada en [Spv], pp. 826–827, ejercicio 2. Tambi´en se han empleado intervalos encajados o, equivalentemente, pares de sucesiones mon´otonas —los extremos de los intervalos— (v. [Ebb], especialmente el comentario final, p. 46).

4.2.

LECTURA: Axiom´ atica de R.

No se plante´o expl´ıcitamente un ‘sistema axiom´atico para los n´ umeros reales’ hasta que fue formulado esencialmente por Hilbert hacia 1900, en su obra Grundlagen der Geometrie (Fundamentos de Geometr´ıa). Actualmente, la descripci´on axiom´atica de R se resume en: • R es un cuerpo conmutativo totalmente ordenado completo, es decir, tal que todo conjunto no vac´ıo acotado superiormente tiene supremo. As´ı se introduce R en la mayor´ıa de los textos de An´alisis matem´atico, para comenzar a estudiar sus propiedades de manera inmediata. Una buena muestra es [Ap]. Unicidad y minimalidad de R. En las sucesivas ampliaciones de los n´ umeros se busca siempre, como hemos se˜ nalado anteriormente, solucionar alg´ un defecto, pero con una propiedad de minimalidad. As´ı, en los contenidos N ⊂ Z ⊂ Q, Z es el menor grupo que contiene a N y Q es el menor cuerpo que contiene a Z; ahora, R no s´olo es el menor cuerpo completo que contiene a Q, sino que es el u ´ nico salvo isomorfismos. Una explicaci´on detallada de este hecho puede verse en [Spv], cap. 29, y en [Ebb], p. 50; tambi´en, en [S-T], cap. 10.

´ CAP´ITULO 4. NUMEROS REALES

110

4.3.

Representaci´ on decimal de los n´ umeros reales

Estudiaremos el significado de la representaci´on decimal de los n´ umeros reales, justificando algunos de los resultados que son conocidos desde la ense˜ nanza secundaria. En toda esta secci´on, cuando no se especifica lo contrario, hh n´ umeroii significa n´ umero real.

4.3.1.

Aperitivo.

Lee atentamente estos enunciados: (1) 0, 999 . . . es el n´ umero inmediatamente anterior a 1. (2) 0.333 · · · = 1/3. (3) Sea x = 0, 999 . . . Entonces 10x = 9, 999 . . ., de modo que 10x − x = 9, 999 . . . − 0, 999 . . . = 9 9 y de aqu´ı 9x = 9, luego x = = 1, es decir, 1 = 0, 999 . . . 9 Responde ahora cuidadosamente a estas cuestiones: (i) ¿Es cierto (1)? ´ t S´I u t NO u t NO SE u (ii) ¿Es cierto (2)? Si lo es, ¿por qu´e? ´ u S´I u t NO u t NO SE t (iii) ¿Es cierto el resultado de (3)? ´ u S´I u t NO u t NO SE t ¿Qu´e consecuencias sacas? Con los n´ umeros decimales no valen las mismas reglas de operaci´on que con los dem´as n´ umeros t u ´ Los n´ umeros reales no pueden manejarse como las letras en el Algebra t u Otras (explicarlas) u t

4.3.2.

Representaci´ on decimal can´ onica

Las preguntas del apartado anterior tienen por objeto hacernos reflexionar, para que nos planteemos la necesidad de aclarar esta cuesti´on: ¿en qu´e consiste la representaci´on decimal de un n´ umero real? Cuando el n´ umero real, en particular, es un entero, la cuesti´on qued´o completamente dilucidada. Pasar de los enteros a los racionales a/b (*) con a ∈ N y b = 10n para alg´ un n ∈ N es ‘casi autom´atico’: por ejemplo, 5 6 7 8 9 123456789 = 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 + + + + + 105 10 102 103 104 105 consta de una ‘parte entera’ 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 , que hemos convenido en representar por 1234, y de una ‘parte fraccionaria’ 5 · 10−1 + 6 · 10−2 + 7 · 10−3 + 8 · 10−4 + 9 · 10−5 , que parece l´ ogico escribir a continuaci´on de lo anterior como 56789, con alg´ un “separador” en medio que indique que (*)

a/b es una fracci´ on decimal, no necesariamente irreducible, como en 25/100.

´ DECIMAL 4.3. REPRESENTACION

111

ahora las cifras son los coeficientes de las potencias negativas decrecientes de 10. En la tipograf´ıa latina el separador tradicional es una coma, y en la anglosajona un punto; bajo la influencia de los ordenadores se ha extendido el uso de este u ´ltimo y ser´a el que (a rega˜ nadientes) adoptaremos aqu´ı. As´ı pues, la representaci´on decimal del n´ umero inicial ser´a hh 1234.56789 ii. Al igual que para los enteros, hh −1234.56789 ii representar´a el n´ umero opuesto del anterior, −123456789/10−5 . Mantenemos, pues, una notaci´on posicional, en la que cada cifra va multiplicada seg´ un su posici´on por un factor (un peso), que en el caso de los enteros es una potencia positiva o nula de 1 10, admiti´endose ahora pesos fraccionarios del tipo n = 10−n (i.e., potencias negativas de 10). 10 Pero as´ı se escriben s´olo algunos n´ umeros reales muy especiales: en general, una representaci´ on decimal finita em em−1 . . . e1 e0 .d1 d2 . . . dn (m entero no negativo, n ∈ N, con ek , dj entre 0 y 9 para 0 ≤ k ≤ m, 1 ≤ j ≤ n), corresponde a em · 10m + · · · + e1 · 10 + e0 + =

d1 d2 dn + + ··· + n 10 102 10

em · 10n+m + · · · + e1 · 10n+1 + e0 · 10n + d1 · 10n−1 + d2 · 10n−2 + · · · + dn . 10n

(an´alogo para hh −em etc. ii tomando los opuestos). Se trata, por supuesto, de n´ umeros racionales; sin embargo, no todos n´ umeros racionales tendr´an una representaci´on decimal finita: esto es cierto tan s´olo para los que puedan expresarse como cociente de un entero por una potencia de 10. Notemos, de paso, que cuando em em−1 . . . e1 e0 .d1 d2 . . . dn sea la expresi´on decimal de un n´ umero x, entonces em em−1 . . . e1 e0 d1 d2 . . . dn (sin punto decimal) es justamente la representaci´on en base 10 del n´ umero entero 10n x. La etapa siguiente, inevitable como vemos, es pasar a “decimales infinitos”. Ahora bien: resulta √ 3 m´as complicado aclarar qu´e queremos decir, por ejemplo, cuando escribimos 2 = 1.2599210499 . . . . √ ¿Qu´e significan los puntos suspensivos? ¿Por qu´e no es 3 2 = 9.9401299521 . . . o cualquier otra expresi´on similar? ¿Con qu´e criterio se han elegido las cifras? √ Recapacitando un momento, hemos comenzado escribiendo ‘la parte entera’ de 3 2, que es 1; √ luego hemos a˜ nadido la mayor cifra decimal, 2, tal que√1.2 no sobrepasa a 3 2; despu´es a˜ nadimos la mayor cifra decimal, 5, tal que 1.25 no sobrepasa a 3 2; y as´ı continuamos a˜ nadiendo cifras: √ √ √ 3 3 3 1≤√ 2 0 con a, b ∈ N (para simplificar). Efectuando la divisi´on entera de a por b, obtendr´ıamos a = N b + r0 con 0 ≤ r0 < b. Entonces N = ba/bc, porque de la condici´on sobre r0 se deduce que N b ≤ a < N b + N = (N + 1)b y de aqu´ı que N ≤ a/b < N + 1. Para continuar, “bajamos un cero” que a˜ nadimos al resto r0 , y dividimos por b: es decir, efectuamos la divisi´on entera de 10r0 por b, 10r0 = d1 b + r1 , 0 ≤ r1 < b. Como antes, d1 b ≤ 10r0 < d1 b + b = (d1 + 1)b, y puesto que r0 = a − N b, esto da d1 b ≤ 10a − 10N b < (d1 + 1)b, 10N b + d1 b ≤ 10a < 10N b + (d1 + 1)b, 10N + d1 ≤ 10(a/b) < 10N + d1 + 1, y dividiendo or 10, a d1 1 d1 ≤ N . (Cf. [Lieb], p. 19.)

´ DECIMAL 4.3. REPRESENTACION

115

Una aplicaci´on de la representaci´on decimal (‘can´onica’) es la demostraci´on cl´asica de Cantor de la no numerabilidad de R. Proposici´ on 4.3.5. R no es numerable. Demostraci´ on. Ya vimos que si I es un intervalo en R, card I = card R. Basta, pues, probar que [0, 1) no es numerable. Supongamos lo contrario, es decir, que existe una biyecci´on entre N y [0, 1), o sea, que hay una sucesi´on (xn ) sin t´erminos repetidos cuya imagen es [0, 1). Escribamos sus expresiones decimales, x1 = 0.d1,1 d1,2 d1,3 . . . x2 = 0.d2,1 d2,2 d2,3 . . . x3 = 0.d3,1 d3,2 d3,3 . . . .. .. . . y definamos entonces ( 1 dn = 0

si dn,n = 0 en caso contrario.

La sucesi´on (qn ) definida por dn d1 + · · · + n , n ∈ N, 10 10 es una sucesi´on mon´otona no decreciente (¿qui´en es qn+1 − qn y qu´e signo tiene?) acotada superiormente por   1 1 1 sup + ··· + n : n ∈ N = , 10 10 9 qn =

luego convergente. Sea x = l´ım qn . n

Como 0 ≤ qn ≤ 1/9, tambi´en 0 ≤ x ≤ 1/9, y as´ı x ∈ [0, 1), por lo que x debe estar en la lista de los xn . Pero la n-´esima cifra decimal de x es dn (¿por qu´e?), y la n-´esima cifra decimal de xn es dn,n 6= dn por construcci´on, luego x 6= xn cualquiera que sea n y la aplicaci´on de partida entre N y [0, 1) no es suprayectiva, contra lo supuesto.

4.3.3.

Decimales peri´ odicos

¿Existe alg´ un criterio para decidir si un n´ umero real es o no racional a partir de su desarrollo decimal? La respuesta es conocida: veamos ahora la explicaci´on. Definici´ on 4.3.6. Un decimal peri´ odico es una expresi´ on decimal de la forma ±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk p1 p2 . . . pk . . . p1 p2 . . . pk . . . en la que hay un grupo de cifras decimales p1 p2 . . . pk que se repite siempre desde un determinado lugar. El grupo p1 p2 . . . pk es el periodo , y d1 d2 . . . dj es la parte no peri´ odica , bien entendido que el periodo se toma de tama˜ no m´ınimo y que no coincide con el final de la parte no peri´odica. Suele abreviarse esta expresi´ on poniendo ±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk . 233 Ejemplo. = 10.5909090909 · · · = 10.5 90 tiene parte entera 10, parte no peri´odica 5 y parte 22 peri´odica 90. Proposici´ on 4.3.7. La representaci´ on decimal de cada n´ umero racional es peri´ odica. Rec´ıprocamente, cada decimal peri´ odico es la representaci´ on decimal de un n´ umero racional.

´ CAP´ITULO 4. NUMEROS REALES

116

Demostraci´ on. Sea x ∈ Q. Como 0 = 0.0 es peri´odico y el caso x < 0 se reduce de manera obvia al caso −x (> 0), podemos suponer que x = a/b, a, b ∈ N. Como ya sabemos, podemos hallar las cifras decimales de x mediante divisiones enteras sucesivas. Dividiendo a por b obtendremos un cociente N ≥ 0 y un resto r0 con 0 ≤ r0 < n. Si r0 = 0, la expresi´on decimal de a/b ser´a em em−1 . . . e1 e0 .0, donde em em−1 . . . e1 e0 es la representaci´on decimal de N . En caso contrario, si fuese r0 6= 0, sea 10r0 = d1 q + r1 , 0 ≤ r1 < b. Si r1 = 0, a/b = em em−1 . . . e1 e0 .a1 0; si r1 6= 0, 10r1 = d1 q + r2 , y seguimos el proceso inductivamente si no aparece ning´ un resto 0. En tal caso, cada resto (no nulo) r0 , r1 , . . . , rk , . . . , debe ser uno de los b − 1 enteros de que disponemos entre 1 y b − 1. Por tanto, inevitablemente aparecer´a en alg´ un momento un resto (en el peor de los casos, rb−1 ) que ya haya aparecido previamente. Las cifras decimales obtenidas entre estas dos apariciones se repetir´an ya indefinidamente, es decir, si j y k son los menores enteros tales que rj = rk (j < k), dj+1 . . . dk ser´a el periodo. Partamos ahora de un decimal peri´odico em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk (lo suponemos positivo por comodidad). Construyamos como ya hemos hecho anteriormente un n´ umero real x cuyo desarrollo decimal coincida con el dado, y consideremos r = em 10m + · · · + e1 10 + e0 +

dj d1 + · · · + j ∈ Q, 10 10

s=

p1 pk + · · · + j+k ∈ Q. j+1 10 10

Entonces 

1 1 1 x = l´ım r + s + s k + s 2k + · · · + s nk n 10 10 10

 =r+

s ∈ Q, 1 − (1/10k )

como quer´ıamos probar. Pero adem´as x=r+

s (10k − 1)r + 10k s 10k (r + s) − r 10j+k (r + s) − 10j r = = = 1 − (1/10k ) 10k − 1 10k − 1 (10k − 1)10j

que examinado atentamente contiene la regla de conversi´ on de los decimales peri´ odicos en fracciones: ‘se forma el numerador escribiendo primero la parte entera seguida de la parte no peri´ odica y luego la parte peri´odica, restando despu´es la parte entera seguida de la parte no peri´odica, y el denominador escribiendo tantos nueves como cifras tiene la parte peri´odica seguido de tantos ceros como cifras tiene la parte no peri´odica’.(***)

Ejercicios 1.1. ¿Puede expresarse



2 como decimal peri´odico? ¿Por qu´e?

1.2. Expresar 1/7 y 2/19 como decimales peri´odicos. 1.3. Encontrar el n´ umero racional representado por los decimales peri´odicos 1.25 137 y 37.14 653.

Y para los que tengan tiempo libre: (***)

Pues 10j+k (r + s) = em 10m+j+k + · · · + e0 10j+k + d1 10j+k−1 + · · · + dj 10k + p1 10k−1 + · · · + pk , 10j r = em 10m+j + · · · + e0 10j + d1 10j−1 + · · · + dj , 10k − 1 = 9 · 10k−1 + · · · + 9 · 10 + 9.

´ EN OTRAS BASES 4.4. REPRESENTACION

117

1.4. ([Lieb], p. 22.) El cr´ıtico cinematogr´afico Ivor Pocoseso est´a viendo la pel´ıcula ‘11.9 Hombres sin Piedad’. Pero se aburre, y empieza a preguntarse exactamente qu´e n´ umeros racionales tienen expresiones decimales que acaban en 000 . . . (o sea, en ceros repetidos indefinidamente). Nota que este es el caso si el denominador es 2, 4, 5, 8, 10, y se plantea si habr´a una regla general sencilla que diga qu´e racionales tienen esta propiedad. Ayuda a Ivor demostrando que un n´ umero racional m/n (en forma irreducible) tiene expresi´ on decimal que acaba en ceros repetidos indefinidamente si y s´olo si el denominador n es de la forma 2p 5q , donde p y q son enteros no negativos.

4.4.

Representaci´ on en otras bases

Al igual que en la representaci´on de los n´ umeros enteros, es necesario contemplar la representaci´on de los n´ umeros reales en bases distintas de 10.

4.4.1.

Representaci´ on binaria

Como cabe suponer, si en vez de usar potencias enteras de 10 se utilizan potencias enteras de 2, se obtiene la representaci´ on binaria de los n´ umeros reales de una manera totalmente an´aloga. Para buscarla gr´aficamente, si bxc = N , el intervalo [N, N + 1) se dividir´a ahora en dos subintervalos [N, N + 12 ), [N + 12 , N + 1), aqu´el de ellos en el que est´e x en otros dos de longitud 1 , etc., lleg´andose as´ı a una representaci´on para los x ≥ 0 de la forma 22 am am−1 . . . a1 a0 .b1 b2 . . . bn . . . en la que bxc = am 2m + · · · + a1 2 + a0 , ai ∈ {0, 1} (0 ≤ i ≤ m), am 6= 0 si bxc 6= 0, y bn ∈ {0, 1} (n-´ esima cifra binaria de x) viene dada por bn = b2n xc − 2b2n−1 xc, de modo que si qn = bxc +

bn b1 + ··· + n, 2 2

se verifica q n ≤ x < qn +

n ∈ N,

1 , 2n

y x = sup{qn : n ∈ N} = l´ım qn . n

Igual que en el caso decimal, x es racional si y s´olo si su representaci´on binaria es peri´ odica. Pero los racionales cuya representaci´on binaria tiene nulas todas las cifras a partir de un cierto lugar no son exactamente los mismos que gozan de esta propiedad en su desarrollo decimal: por ejemplo, 3 = 0.6 0(10 = 0.1001(2 . 5 Nota. Ya vimos c´omo expresar los n´ umeros enteros en base 2, mediante divisiones sucesivas por 2. Para hallar ahora el desarrollo binario de x − bxc a partir de su desarrolo decimal, basta ir multiplicando por 2 retirando la parte entera del producto; en el ejemplo anterior, ´ NUMERO DECIMAL 2 ∗ resto resto CIFRAS BINARIAS

0.6000 . . . 1.2 0.4 0.8 0.2 0.4 0.8 1 0 0

1.6 0.6 1

1.2 0.2 1

0.4 0.4 0

... ... ...

y observamos c´omo ya se va repitiendo obligadamente el bloque ‘1001’, de modo que (Para los m´as atrevidos: ¿cu´al es la justificaci´on de este procedimiento?)

3 = 0.1001. 5

resto CIFRAS BINARIAS

0.2 1

0.4 0

0.8 0

0.6 1

0.2 1

0.4 0

... ...

3 y observamos c´omo ya se va repitiendo obligadamente el bloque ´‘1001’, de modo 0.1001. ´ que 5 = 118 CAPITULO 4. NUMEROS REALES (Para los m´ as atrevidos: ¿cu´ al es la justificaci´ on de este procedimiento?) Tambi´ eennpodr´ ıamos Tambi´ podr´ ıamosllegar llegaral al mismo mismo resultado resultado dividiendo dividiendo 33 por por 55 en en base base 2, 2, lo loque quese sehace hacecomo como en base decimal, con la precauci´ o n de que ahora 1 + en base decimal, con la precauci´on de que ahora 1 +11= = 110 0000… | 101 10. ıaıa por 10. Por Porejemplo, ejemplo,33==11 11(2(2 se sedividir´ dividir´ por 55= =101 101(2(2como como 001000 0.10011... muestra muestra la la figura, figura, teniendo teniendo en en cuenta cuenta que que en en base base 22 es es 00110 101 + 11 = 110, 101 + 11 = 1000; ponemos ceros en elel 101 + = 110, 101 + 11 = 1000; ponemos ceros en 001 cociente cociente yy ‘bajamos ‘bajamos ceros ceros del del dividendo’ dividendo’ en en la la manera manera :::::: acostumbrada. acostumbrada. A la inversa, si partimos de la expresi´on binaria ±am am−1 . . . a1 a0 .b1 b2 . . . bn . . . de un n´ umero x, tendremos que hallar (expresando los n´ umeros en base 10)   b1 bn m ± l´ım am 2 + · · · + a1 2 + a0 + + ··· + n . n 2 2

.

Cuando x sea racional, y por tanto su desarrollo sea peri´odico, podemos calcular este l´ımite como hicimos en la demostraci´on de que todo decimal peri´odico es el desarrollo de un n´ umero racional. Por ejemplo, si x = −1010.0010 101(2 , escribiendo todos los n´ umeros ahora en base 10,          1 1 1 1 1 1 1 1 1 x = − l´ım 23 + 21 + 3 + + + + + + + + + ··· n 2 25 27 28 210 211 213 214 216   1 1 ··· + + 23n+5 23n+7          1 1 1 1 1 1 1 1 1 1 1 1 = − l´ım 8 + 2 + + + + + + + + + + ··· n 8 25 27 23 25 27 26 25 27 29 25 27   1 1 1 · · · + 3n + 2 25 27     1 1 1 1 1 1 1 = − l´ım 8 + 2 + + + 1 + 3 + 6 + 9 + · · · + 3n n 8 25 27 2 2 2 2     1     1 − 3n+1  81 81 5 1 1 5 1   81  2   = − + = − + + l´ ım = − + 8 1  n 8 24 · 7 8 25 27 27 23 − 1  1− 3 2 23 1139 81 · 14 + 5 = − =− . 16 · 7 112

Ejercicios 2.1. Hallar la representaci´on binaria de los n´ umeros cuya expresi´on decimal es: (i) 2.0078125 (ii) 0.8 6 (iii) 3.141592654 . . . 2.2. Hallar la representaci´on decimal de los n´ umeros cuya expresi´on binaria es: (i) 11.01 (ii) 1.0 10 (iii) 0.100011101 . . .

4.4.2.

Representaciones en bases distintas de 10 y 2

Por las mismas razones expuestas al hablar de las bases de numeraci´on para representar n´ umeros enteros, se emplean a veces el sistema octal (base 8) y el sistema hexadecimal (base 16). Nada especial hay que a˜ nadir sobre la representaci´on de n´ umeros reales en estos sistemas. Son una vez m´as, como el decimal y el binario, sistemas posicionales: el valor de cada cifra depende de su posici´on. Para buscar la expresi´on de un n´ umero real en estos sistemas, o para pasar las representaciones de un n´ umero de una base a otra, basta adaptar las ideas que hemos empleado anteriormente.

Bibliograf´ıa [A-K]

Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matem´ atica: su contenido, m´etodos y significado (vol. I). Alianza Editorial, Madrid, 1973. Citado en la(s) p´agina(s) 108

[Ap]

Apostol, T.M.: An´ alisis Matem´ atico (segunda edici´on). Revert´e, Barcelona, 1991. Citado en la(s) p´agina(s) 109

[B-S]

Bartle, R. G.- Sherbert, D. R.: Introducci´ on al An´ alisis Matem´ atico de una Variable. Limusa, M´exico, 1990. Citado en la(s) p´agina(s) 114

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs. Prentice-Hall, Upper Saddle River, NJ, 1997. Citado en la(s) p´agina(s) 114 [Dur]

Dur´ an, A. J.: Historia, con personajes, de los conceptos del c´ alculo. Alianza, Madrid, 1996. Citado en la(s) p´agina(s) 108

[Ebb]

Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991. Citado en la(s) p´agina(s) 107, 108, 109

[Ham]

Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge Univ. Press, 1982. Citado en la(s) p´agina(s) 109

[Kl1]

Kline, M.: El pensamiento matem´ atico de la Antig¨ uedad a nuestros d´ıas, I. Alianza Editorial, Madrid, 1992. Citado en la(s) p´agina(s) 107

[Kl3]

Kline, M.: El pensamiento matem´ atico de la Antig¨ uedad a nuestros d´ıas, III. Alianza Editorial, Madrid, 1992. Citado en la(s) p´agina(s) 108

[Lieb]

Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca Raton, 2000. Citado en la(s) p´agina(s) 114, 117

[Pest]

Pestana, D. & al.: Curso pr´ actico de C´ alculo y Prec´ alculo. Ariel, Barcelona, 2000. Citado en la(s) p´agina(s)

[Spv]

Spivak, M.: Calculus. C´ alculo Infinitesimal. (segunda edici´on) Revert´e, Barcelona, 1990. Citado en la(s) p´agina(s) 109

[S-T]

Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977. Citado en la(s) p´agina(s) 109 Documentos en Internet [1] Curso de An´ alisis matem´ atico I. Cap´ıtulo 1: N´ umeros reales. Univ. de Zaragoza. Citado en la(s) p´agina(s) 112 http://www.unizar.es/analisis matematico/analisis1/apuntes/01-reales.pdf

119

Cap´ıtulo 4

N´ umeros reales y complejos. Sobre los n´ umeros reales nos limitaremos a hacer una serie de comentarios que complementan algunos aspectos que no han sido tratados en la asignatura de An´ alisis matem´atico I. En un cap´ıtulo posterior estudiaremos la representaci´on decimal de los n´ umeros reales y la ‘aritm´etica de los ordenadores’. La bibliograf´ıa oportuna se ir´ a citando a lo largo de la exposici´ on. Nuestra presentaci´on de los n´ umeros complejos es b´asicamente la del texto [Ap], completado con [ApC]. V´ease tambi´en [Her], cap. 4. Para ejercicios (resueltos y propuestos) son u ´tiles [Spg], [Wil]. Las referencias adicionales que sean necesarias se citar´an en su contexto.

4.1

N´ umeros reales.

Ya hemos visto que desde el punto de vista algebraico, el sistema de los n´ umeros racionales es bastante incompleto: si bien en Q es posible resolver siempre ecuaciones del tipo ax + b = 0, con on. Esto fue descubierto ya a = 0, hay ecuaciones tan simples como x2 = 2 que no tienen soluci´ por los pitag´ oricos en el siglo V antes de nuestra era, en su formulaci´ on geom´etrica, en t´erminos de conmensurabilidad e inconmensurabilidad de longitudes (ver notas hist´ oricas en [Ebb], cap. 2). Dos segmentos AB y CD son conmensurables si pueden ser medidos exactamente con una unidad de longitud com´ un u, es decir, si hay un n´ umero “exacto” m ∈ N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismo un n´ umero n de sementos para CD; la raz´ on entre las longitudes de los segmentos AB y CD es la misma que la raz´on (el cociente) entre los n´ umeros m y n. En caso contrario, son inconmensurables.

Q

A C

? P u 0 1/5 2/5 3/5 4/5 1

BD

?

Fijado un segmento cualquiera, es f´ acil construir por semejanza de tri´ angulos un nuevo segmento cuya raz´ on con el primero sea igual a un valor m/n arbitrariamente dado (en la figura se muestra la construcci´on de un segmento de longitud 1/5: la recta OP Q y el segmento OP son arbitrarios; el 85

´ CAP´ITULO 4. NUMEROS REALES Y COMPLEJOS.

86

punto Q se obtiene trasladando OP cinco veces a lo largo de dicha recta). No es descabellado pensar que siempre hay conmensurabilidad: el algoritmo de Euclides, con la divisi´ on interpretada como “sustracci´on repetida de segmentos iguales”, lleva gr´ aficamente a una unidad de medida com´ un —hasta donde el ojo puede apreciar. Sin embargo, la raz´ on desmiente a la intuici´ on, y como es bien sabido, el teorema de Pit´ agoras obliga a descartar esta hip´ otesis: la diagonal del cuadrado, de la que no dudamos que tenga una longitud, resulta inconmensurable con el lado, pues si ´este tiene una longitud m respecto de cualquier unidad, la diagonal ha de tener una longitud n tal que n2 = m2 + m2 = 2m2 , lo cual lleva a un absurdo tras eliminar sucesivamente factores 2 en m y n. (Ver la discusi´ on sobre Aritm´etica y Geometr´ıa en [A-K], pp. 43). Hizo falta mucho talento para solucionar este inconveniente (lo logr´ o Eudoxo, contempor´ aneo de Plat´ on, con su teor´ıa de las proporciones). Mucho m´ as tarde, cuando la fiabilidad de la intuici´ on geom´etrica fue puesta en cuesti´on tras el asentamiento de las geometr´ıas no eucl´ıdeas y la crisis subsiguiente, se hizo necesaria una fundamentaci´ on del continuo (el conjunto de los n´ umeros reales). No es este el lugar para seguir la largu´ısima evoluci´on hist´ orica del concepto de n´ umero hasta las ideas actuales, por lo que nos limitaremos en lo que sigue a se˜ nalar los principales puntos que subyacen en una presentaci´ on rigurosa de los n´ umeros reales, que quedan abiertos para tratar en una asignatura posterior sobre Fundamentos de An´ alisis matem´ atico.

4.1.1

Construcciones de R a partir de Q.

En la ampliaci´ on de un sistema num´erico para llegar a otro mayor que subsane alguna deficiencia, la idea directriz es ‘a˜ nadir lo m´ınimo que le falta’. As´ı, para construir Z a partir de N ‘se a˜ naden’ los opuestos de los n´ umeros naturales (y el 0 en su caso); para construir Q a partir de Z, ‘se a˜ naden’ los cocientes de enteros (con denominador no nulo). Para construir R a partir de Q, hay dos procedimientos destacados: • m´ etodo de Cantor-Meray de las sucesiones fundamentales. Trata de ‘evitar’ que aparezcan sucesiones de Cauchy no convergentes, como sucede en Q. Se define entonces una relaci´on de equivalencia en el conjunto de las sucesiones de Cauchy de n´ umeros racionales (cada clase va a jugar el papel de ‘l´ımite’ de todas ellas), de manera que R es el conjunto cociente y un n´ umero real es una clase de equivalencia. Las operaciones de suma y producto en R se definen a partir de las operaciones de suma y producto de sucesiones, y se demuestra que con ellas R es un cuerpo. Hay que definir as´ı mismo una relaci´ on de orden entre las sucesiones de Cauchy de Q, que permite luego definir una ordenaci´ on en R con la cual resulta ser un cuerpo totalmente ordenado completo (en el sentido de que todo conjunto no vac´ıo acotado superiormente posee supremo). El desarrollo en detalle de este proceso se entiende mejor cuando se ha estudiado teor´ıa de anillos e ideales. Puede verse, por ejemplo, en [Ebb], [Ham], [S-T] (aqu´ı hay adem´ as un interesante apartado sobre la ‘conexi´ on con la intuici´ on’, p. 204). Este es el m´etodo m´as empleado generalmente, sobre todo porque permite usar construcciones parecidas en otras situaciones (compleci´on de espacios m´etricos en Topolog´ıa, por ejemplo.) • m´ etodo de Dedekind de las cortaduras. Se dirige a conseguir que se cumpla ‘el axioma del supremo’, no v´ alido en Q. Se parte de las cortaduras en Q, que son pares (A, B) de subconjuntos de Q tales que: – A y B son complementarios, A ∪ B = Q y A ∩ B = ∅; – A = ∅ = B; – cada elemento de A es menor que cada elemento de B. Cada cortadura est´ a determinada por A o por B (v. comentarios en [Ebb]), de modo que podemos quedarnos, por ejemplo, con el conjunto A, y decir como en [Spv], que

4.2. EL CUERPO COMPLEJO.

87

un n´ umero real es un conjunto A de n´ umeros racionales con las propiedades siguientes: – si x ∈ A e y ∈ Q es tal que y < x, entonces tambi´en y ∈ A; – ∅ = A = Q; – no hay un elemento m´ aximo en A, de manera que si x ∈ A, existe alg´ un y ∈ A tal que y > x. umeros De qu´e modo se definen la suma, el producto y la ordenaci´ on en el conjunto R de los n´ reales puede verse en [Spv], pp. 811 y ss.; ver tambi´en [Ebb], pp. 36 y ss. • otros m´ etodos. ¿Por qu´e no usar “los decimales” para construir R? Es posible, pero tiene m´as inconvenientes ‘t´ecnicos’ que los m´etodos anteriores. La manera de hacerlo est´a indicada en [Spv], pp. 826–827, ejercicio 2. Tambi´en se han empleado intervalos encajados o, equivalentemente, pares de sucesiones mon´ otonas —los extremos de los intervalos (v. [Ebb], especialmente el comentario final, p. 46).

4.1.2

Axiom´ atica de R.

No se plante´o expl´ıcitamente un ‘sistema axiom´atico para los n´ umeros reales’ hasta que fue formulado esencialmente por Hilbert hacia 1900, en su obra Grundlagen der Geometrie (Fundamentos de Geometr´ıa). Actualmente, la descripci´ on axiom´ atica de R se resume en: • R es un cuerpo conmutativo totalmente ordenado completo, es decir, tal que todo conjunto no vac´ıo acotado superiormente tiene supremo. As´ı se introduce R en la mayor´ıa de los textos de An´alisis matem´atico, para comenzar a estudiar sus propiedades de manera inmediata. Una buena muestra es [Ap].

4.1.3

Unicidad y minimalidad de R.

En las sucesivas ampliaciones de los n´ umeros se busca siempre, como hemos se˜ nalado anteriormente, solucionar alg´ un defecto, pero con una propiedad de minimalidad. As´ı, en los contenidos

N ⊂ Z ⊂ Q, Z es el menor grupo que contiene a N y Q es el menor cuerpo que contiene a Z; ahora, R no s´olo es el menor cuerpo completo que contiene a Q, sino que es el u ´ nico salvo isomorfismos. Una explicaci´ on detallada de este hecho puede verse en [Spv], cap. 29, y en [Ebb], p. 50; tambi´en, en [S-T], cap. 10. unicidad.

4.2

El cuerpo complejo.

Como se˜ nala [Her], p. 195,  las sucesivas ampliaciones de los sistemas de n´ umeros se han realizado para acomodar resultados sorprendentes en los sistemas de n´ umeros conocidos. Estos resultados sorprendentes provienen, en la mayor parte de los casos, de la resoluci´ on de ecuaciones algebraicas. Por ejemplo, la ecuaci´ on x + 7 = 5, en la que solamente aparecen n´ umeros naturales, no posee ning´ un n´ umero natural como soluci´ on; su soluci´ on es el n´ umero negativo −2. Los n´ umeros naturales, junto con los n´ umeros negativos, forman el sistema de los n´ umeros enteros. Este sistema de n´ umeros es insuficiente para resolver todas las ecuaciones algebraicas; la ecuaci´on 3x = 5 no posee como soluci´on ning´ un n´ umero entero; su soluci´ on es el n´ umero fraccionario 5/3. Los n´ umeros enteros, junto con los n´ umeros fraccionarios, forman el conjunto de los n´ umeros racionales. Estos n´ umeros resultan insuficientes para resolver ecuaciones cuadr´ aticas; por ejemplo, la ecuaci´on x2 = 2

´ CAP´ITULO 4. NUMEROS REALES Y COMPLEJOS.

88

√ √ no tiene un n´ umero racional como soluci´on; sus soluciones son los n´ umeros irracionales 2 y − 2. Los n´ umeros racionales, junto con los irracionales, forman el sistema de los n´ umeros reales. Entre los n´ umeros irracionales hay, incluso, muchos que no son ra´ıces de polinomios con coeficientes racionales. Pese a ello, R no es ‘suficientemente completo’ desde el punto de vista algebraico: un polinomio tan sencillo como X 2 + 1 sigue sin tener ra´ıces en R. En pleno Renacimiento, los algebristas italianos del siglo XVI (Tartaglia, Cardano, Bombelli: v. [Ebb], cap. 3), en su b´ usqueda de ra´ıces reales de ecuaciones c´ ubicas (de polinomios de grado 3), comenzaron un c´ alculo formal con expresiones ‘imaginarias’, ‘ficticias’, en las que aparec´ıan ra´ıces cuadradas de n´ umeros negativos, comprobando que, aunque ignoraban qu´e significado atribuir a dichas expresiones, los resultados que obten´ıan a partir de ellas eran consistentes y satisfactorios, resolviendo as´ı problemas de ra´ıces de ecuaciones de segundo y tercer grado en R. La ‘inevitabilidad’ de estas expresiones llevar´ıa, tras periodos de discusi´ on y desconfianza sobre su naturaleza, a la introducci´ on y aceptaci´ on final de los n´ umeros complejos.

umeros complejos es el conjunto Definici´ on 4.2.1 El cuerpo de los n´ C = {(a, b) : a, b ∈ R} dotado de las operaciones • suma: • producto:

(a, b) + (c, d) = (a + c, b + d) (a, b) (c, d) = (ac − bd, bc + ad).

Los elementos de C reciben el nombre de n´ umeros complejos . Como conjunto, pues, C es simplemente R2 = R × R, que conocemos como espacio vectorial sobre R, con la misma suma que acabamos de definir. La novedad (absolutamente trascendente como veremos) est´a en la introducci´ on de un producto ‘interno’, que aplica C × C en C (en R2 tenemos el producto por escalares ‘externos’, que aplica R × R2 en R2 ). Veamos que est´a justificado llamar a C el cuerpo de los n´ umeros complejos. Proposici´ on 4.2.2 Con la suma y el producto que hemos definido, C es un cuerpo conmutativo. Demostraci´ on. Una vez m´as, enunciamos las propiedades a comprobar, si bien dejamos las demostraciones como ejercicio. (Ver [ApC], pp. 438 y ss.) 1. Propiedad asociativa de la suma. ((a1 , b1 ) + (a2 , b2 )) + (a3 , b3 ) = (a1 , b1 ) + ((a2 , b2 ) + (a3 , b3 )). 2. Propiedad conmutativa de la suma. (a1 , b1 ) + (a2 , b2 ) = (a2 , b2 ) + (a1 , b1 ). 3. Existencia de elemento neutro (cero) para la suma. Hay un n´ umero complejo, el (0, 0), tal que para todo (a, b) ∈ C, (0, 0) + (a, b) = (a, b) + (0, 0) = (a, b). 4. Existencia de elemento opuesto para la suma. Para cada (a, b) ∈ C hay un n´ umero complejo (y uno s´ olo), el n´ umero complejo (−a, −b), tal que (−a, −b) + (a, b) = (a, b) + (−a, −b) = (0, 0). 5. Propiedad asociativa del producto. ((a1 , b1 ) (a2 , b2 )) (a3 , b3 ) = (a1 , b1 ) ((a2 , b2 ) (a3 , b3 )). 6. Propiedad conmutativa del producto. (a1 , b1 ) (a2 , b2 ) = (a2 , b2 ) (a1 , b1 ). 7. Existencia de elemento neutro (identidad) para el producto. Hay un n´ umero complejo, el (1, 0), tal que para todo (a, b) ∈ C es (1, 0) (a, b) = (a, b) (1, 0) = (a, b). 8. Existencia de elemento inverso para el producto. Para cada (a, b) ∈ C \ {0} hay un   a −b elemento (y uno s´olo) en C, el n´ umero complejo , , tal que a2 + b2 a2 + b2 a −b a −b ( 2 , 2 ) (a, b) = (a, b) ( 2 , 2 ) = (1, 0). 2 2 2 a +b a +b a + b a + b2

4.2. EL CUERPO COMPLEJO.

89

(Tiene sentido porque a = 0 o b = 0.) 9. Propiedad distributiva del producto respecto de la suma. (a1 , b1 ) (a2 , b2 ) + (a1 , b1 ) (a3 , b3 ).

(a1 , b1 ) ((a2 , b2 ) + (a3 , b3 )) =

El cuerpo C contiene un subconjunto que es ‘una copia isomorfa’ al cuerpo R, que identificaremos con R. Precisemos esta afirmaci´on: Proposici´ on 4.2.3 La aplicaci´ on h : R → C dada por h(a) = (a, 0),

a ∈ R,

es inyectiva y para cualesquiera a, b ∈ R cumple • h(a + b) = h(a) + h(b); • h(a b) = h(a) h(b) Demostraci´ on. Ejercicio. Procedemos, pues, a la identificaci´ on de a ∈ R con h(a) ∈ C, lo que nos permite usar la notaci´ on simplificada a = (a, 0). Observando que todo elemento (a, b) ∈ C se puede escribir en la forma (a, b) = (a, 0) + (b, 0)(0, 1), si definimos la unidad imaginaria i como i = (0, 1), con esta nueva notaci´ on tenemos (a, b) = a + ib. Esta manera de escribir un n´ umero complejo (forma bin´ omica ) se corresponde con la representaci´on del vector (a, b) de R2 en la base can´onica {(1, 0), (0, 1)}. Por tanto, si a + ib = a + ib con ay b reales, necesariamente a = a y b = b . Como es sabido, la primera componente a del n´ umero complejo z = (a, b) = a + ib se denomina la parte real de z, en s´ımbolos a = e z, y la segunda componente b se denomina la parte imaginaria de z, en s´ımbolos b = m z. As´ı, tanto la parte real como la parte imaginaria son n´ umeros reales. on Los n´ umeros reales est´an, pues, caracterizados como los z ∈ C tales que m z = 0. La condici´ umeros imaginarios (imaginarios puros, en algunos textos). e z = 0 caracteriza a los llamados n´ Una ventaja de expresar los n´ umeros complejos en forma bin´ omica es que se hace m´as facil la multiplicaci´ on. En efecto, teniendo en cuenta que i2 = (0, 1)(0, 1) = (−1, 0) = −1 comprobamos que la ‘extra˜ na f´ ormula’ (a, b) (c, d) = (ac − bd, bc + ad) se traduce en la m´as ‘natural’ (a + ib)(c + id) = ac − bd + i(bc + ad), donde para hacer esta operaci´ on s´ olo hace falta usar las reglas habituales de la multiplicaci´ on y las identificaciones anteriormente expuestas. De pasada, hemos comprobado que el n´ umero complejo i es una ra´ız de X 2 + 1 en C (‘la otra’ es −i). Ninguna de las relaciones de orden que pueden definirse en C hacen de ´el un cuerpo totalmente ordenado: no hay posibilidad niguna de que se mantengan las mismas propiedades que en Q y en R ligan la ordenaci´on con la suma y el producto. (En efecto: en todo cuerpo totalmente ordenado es x2 + 1 > 0 para cualquier elemento x, mientras que en C tenemos i2 + 1 = 0.)

´ CAP´ITULO 4. NUMEROS REALES Y COMPLEJOS.

90

Conjugaci´ on. M´ odulo de un complejo. Un instrumento muy importante en el manejo de los n´ umeros complejos es la conjugaci´ on. a Definici´ on 4.2.4 Dado un n´ umero complejo z, su complejo conjugado , denotado por z, est´ dado por z = e z − i m z. umero complejo su conjugado, Proposici´ on 4.2.5 La aplicaci´ on de C en C que asocia a cada n´ llamada conjugaci´ on , tiene las siguientes propiedades. (i) Es un isomorfismo de cuerpo, es decir, es inyectiva y para cualesquiera z, w ∈ C se verifica • z+w =z+w • zw = z w (ii) Es una involuci´ on, o sea, aplicada dos veces vuelve al elemento de partida: z = z para todo z ∈ C. (iii) Deja fijos exactamente los n´ umeros reales: z = z si y solo si z ∈ R. Demostraci´ on. Son consecuencias directas de la definici´on (comprobarlo). Mediante el conjugado se puede expresar algebraicamente la parte real y la parte imaginaria de cada z ∈ C, z+z z−z e z = , m z = . 2 2i Tambi´en permite expresar algebraicamente su m´ odulo, que pasamos a definir, lo que facilita muchas de las operaciones que deberemos efectuar con los n´ umeros complejos.

odulo de un n´ umero complejo z es el n´ umero real no negativo Definici´ on 4.2.6 El m´ |z| =





zz =

(e z)2 + (m z)2 .

otese as´ı mismo que |z| = |z|. Por tanto, |z|2 = z z. N´ Ejercicio. Para z = 0, probar que su inverso es

z e z m z = −i . |z|2 |z|2 |z|2

Las propiedades m´ as importantes del m´odulo, que comparte con el valor absoluto en R, son las siguientes: Proposici´ on 4.2.7 Dados z, w ∈ C, (i) |z| ≥ 0 siempre, y |z| = 0 si y s´ olo si z = 0. (ii) |zw| = |z||w|. (iii) |z + w| ≤ |z| + |w| (desigualdad triangular). Demostraci´ on. (i) Por la propia definici´ on, |z| ≥ 0 para todo z ∈ C y |0| = 0. Si ahora z = a + ib (a, b ∈ R) es tal que |z| = 0, es a2 + b2 = |z|2 = 0, y puesto que 0 ≤ a2 ≤ a2 + b2 = 0, a2 = 0 y a = 0 (sim´etricamente, b = 0).

4.2. EL CUERPO COMPLEJO.

91

(ii) |zw|2 = (zw)(zw) = (zw)(z w) = z z w w = |z|2 |w|2 = (|z||w|)2 , y como |zw| y |z||w| son n´ umeros reales no negativos, forzosamente |zw| = |z||w|. (iii) |z + w|2 = (z + w)(z + w) = (z + w)(z + w) = z z + z w + w z + w w = |z|2 + z w + z w + |w|2 = |z|2 + 2e (z w) + |w|2 , mientras que (|z| + |w|)2 = |z|2 + 2|z||w| + |w|2 = |z|2 + 2|z w| + |w|2 , y como (ver lema siguiente) e (z w) ≤ |e (z w)| ≤ |z w|, se obtiene la desigualdad buscada. En la demostraci´ on de la desigualdad triangular hemos necesitado: Lema 4.2.8 Para cada z ∈ C, e z ≤ |e z| ≤ |z|,

m z ≤ |m z| ≤ |z|.

Demostraci´ on. Pongamos a = e z, b = m z. De a2 ≤ a2 + b2 = |z|2 ,

b2 ≤ a2 + b2 = |z|2 ,

se sigue |a| ≤ |z|, |b| ≤ |z|, y finalmente a ≤ |a| ≤ |z|,

b ≤ |b| ≤ |z|.

Como en R, se prueba: Corolario 4.2.9 (desigualdad triangular inversa) Dados z, w ∈ C, |z − w| ≥ ||z| − |w||. Demostraci´ on. Ejercicio.

Ejercicios 13.1. Expresar los siguientes n´ umeros complejos en la forma a + ib, con a, b ∈ R: 2 + 3i i4 + i9 + i16 ; d) ; c) a) (1 + i) ; b) 3 − 4i 2 − i5 + i10 − i15 3

13.2. Calcular

 4n   1−i m m=1

1+i



1+i √ 2

5

.

.

Indicaci´ on. Calcular primero (1−i)/(1+i) y recordar que (1−w)(1+w+w2 +· · ·+wN ) = 1−wN +1 . 13.3. Dado z = el valor de z.

3 − 2ai , con a ∈ R, determinar el valor de a para que z ∈ R y calcular entonces 4 − 3i

13.4. Calcular dos complejos cuya suma sea 1 + 4i, cuyo cociente sea imaginario y de manera que la parte real de uno de ellos sea −1. 13.5. Hallar x, y ∈ R tales que z = x+iy sea una ra´ız cuadrada de 2−5i, es decir, (x+iy)2 = 2−5i. En general, dados a, b ∈ R, si z = x + iy es una ra´ız cuadrada de a + bi, es decir, (x + iy)2 = a + bi, expresar x e y en funci´ on de a, b.

´ CAP´ITULO 4. NUMEROS REALES Y COMPLEJOS.

92

1+z es imaginario si y s´olo si |z| = 1. 1−z z−a con 0 < a < 1. Probar que |w| < 1 si y s´olo si |z| < 1. 13.7. Sean w, z ∈ C tales que w = az − 1    a−b    = 1. ¿Qu´ e excepci´on debe hacerse si 13.8. Probar que si |a| = 1 o |b| = 1, entonces  1 − ab  |a| = |b| = 1? 13.6. Sea z ∈ C con z = 1. Probar que

13.9. Sea w =

1+z con w = u + iv y z = x + iy (x, y, u, v ∈ R). Probar que 1−z x=

u2 + v 2 − 1 2v ; y= . 2 2 (u + 1) + v (u + 1)2 + v 2

13.10. Sea z = a + ib (a, b ∈ R). Demostrar que existen p, m y n independientes de z (z = 0, −1) tales que (a2 + b2 )(a2 + b2 + 2a + 1) = p + mz + nz 2 . a2 − b2 + a − (1 + 2a)bi Hallar p, m y n.

4.3

El plano complejo

Para abordar este apartado utilizaremos frecuentemente un lenguaje geom´etrico meramente intuitivo, sin atenernos estrictamente al estilo m´as deductivo del planteamiento del resto del curso. As´ı, por ejemplo, hablaremos de ´ angulos, o daremos por bueno que las funciones seno y coseno del An´ alisis matem´atico se corresponden con las funciones definidas gr´ aficamente en Trigonometr´ıa, aunque para ello no tengamos ninguna justificaci´ on rigurosa. Si hemos de ser totalmente honestos, ni siquiera tenemos hasta ahora una definici´ on rigurosa de las funciones seno y coseno: nos hemos conformado con admitir su existencia y propiedades. Es tarea de cursos superiores la construcci´ on y el estudio de estas y otras funciones elementales b´asicas, por lo que seguiremos us´andolas como hasta ahora. La idea de partida en esta secci´on es que todo n´ umero complejo z = a+ib (a, b ∈ R) lo podemos representar en el plano como el punto de coordenadas (a, b), su afijo .(∗) Esto supone que tenemos fijado en el plano un sistema cartesiano de ejes coordenados. Los puntos del eje de abscisas ser´an los complejos (x, 0), o sea, los n´ umeros reales, por lo que llamaremos a este eje el eje real . An´ alogamente, el eje de ordenadas estar´a formado por los puntos (0, y), los n´ umeros imaginarios puros iy, y denominaremos a este eje el eje imaginario . Nos referiremos a este sistema con el nombre de diagrama de Argand. En este contexto, la distancia eucl´ıdea en el plano, por ejemplo, permitir´ a definir la distancia entre dos complejos z y w, que vendr´ a dada por d(z, w) = |z − w|, ya que si z = x+iy, w = u+iv, (x, y, u, v ∈ R), ambas cantidades son iguales a En particular, para cada z ∈ C, su m´odulo mide la distancia de z a 0.



(x − u)2 + (y − v)2 .

(∗) Esta observaci´ on fue hecha repetidamente por matem´ aticos que no lograron eco suficiente en la comunidad matem´ atica (entre ellos Argand, a cuyo nombre ha quedado asociada), hasta que fue adoptada por Gauss en 1831 y m´ as tarde por Cauchy, zanjando as´ı la pol´emica sobre la legitimidad de los n´ umeros complejos (ver [DD-P], pp. 254 y ss.)

4.3. EL PLANO COMPLEJO

93

An´ alogamente, puesto que todo punto del plano z = 0 queda un´ıvocamente determinado por sus coordenadas polares, es decir, su distancia al origen (i.e., su m´ odulo) y por el a´ngulo polar (el que forma el segmento de extremos 0 y z con el eje real), podremos utilizar para tales z la llamada representaci´ on polar o m´ odulo-argumental. La medida del a´ngulo polar (en radianes) es lo que llamaremos argumento de z.

=(a,b ) |z |

φ O

a = Re z

= Im z

Pongamos en orden estos conceptos. Observando la figura, tenemos las igualdades e z = |z| cos φ, m z = |z| sen φ, de donde z = |z|(cos φ + i sen φ). Como siempre sucede con la medida de ´angulos, hay aqu´ı una ambig¨ uedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo papel de cara a las igualdades anteriores. Esto nos hace abordar las siguientes precisiones sobre la definici´on de argumento.

Definici´ on 4.3.1 (Argumentos) Dado z ∈ C \ {0}, un argumento de z es cualquier φ tal que z = |z| cos φ,

z = |z| sen φ.

El conjunto de los argumentos de z lo denotaremos por arg z, es decir, arg z = {φ ∈ R : cos φ = e z/|z|, sen φ = m z/|z|}. Entonces, arg z es un conjunto! Pero ‘es obvio’ que si para dos valores φ0 , φ ∈ R, se cumple cosφ = cos φ0 ,

sen φ = sen φ0 ,

debe existir un k ∈ Z de manera que φ = φ0 + 2kπ; en otras palabras, el conjunto arg z puede describirse, conocido uno cualquiera de sus elementos, de la siguiente manera: {φ0 + 2kπ : φ0 ∈ arg z, k ∈ Z} = φ0 + 2π Z. De esta forma, en cualquier intervalo semiabierto de longitud 2π, por ejemplo (−π, π], existe un u ´nico elemento perteneciente al conjunto arg z. A este elemento se le denota por Arg z, on: en algunos textos se llama argumento principal y se le llama argumento principal (precauci´ al que est´a en el intervalo [0, 2π)). Por tanto, para nosotros: Definici´ on 4.3.2 (Argumento principal) Dado z ∈ C \ {0}, Arg z = φ si y s´olo si φ ∈ (−π, π] y cos φ = e z/|z|, sen φ = m z/|z|.

on polar o m´ odulo-argumental de un n´ umero complejo no Definici´ on 4.3.3 La representaci´ nulo viene dada por su m´ odulo y uno cualquiera de sus argumentos. Para presentarla de una manera m´ as compacta, introducimos la siguiente notaci´ on.

´ CAP´ITULO 4. NUMEROS REALES Y COMPLEJOS.

94

Definici´ on 4.3.4 Dado φ ∈ R, pondremos eiφ = cos φ + i sen φ. a Por tanto, dado z ∈ C \ {0}, si φ ∈ arg z ser´ z = |z| eiφ (representaci´ on exponencial de un n´ umero complejo). N´otese que para z = 0 se tiene z = |z| eiφ cualquiera que sea φ ∈ R. Ejercicio. Para cada φ ∈ R, |eiφ | = 1. Rec´ıprocamente, para todo z ∈ C con |z| = 1 existe φ ∈ R tal que z = eiφ . Ejercicio. Si φ ∈ R, entonces eiφ = 1 si y s´olo si existe k ∈ Z tal que φ = 2kπ. ormula de Euler Ejercicio. Comprobar la f´ eiπ + 1 = 0. (Se ha dicho que esta es una de las m´as bellas f´ormulas de las Matem´aticas, porque liga los n´ umeros ´ fundamentales del Algebra, la Geometr´ıa y el An´ alisis). Proposici´ on 4.3.5 (Representaci´ on exponencial del producto de dos n´ umeros complejos.) Dados z1 , z2 ∈ C, si z1 = |z1 | eiφ1 , z2 = |z2 | eiφ2 , con φ1 , φ2 ∈ R, se tiene z1 z2 = |z1 z2 | ei(φ1 +φ2 ) = |z1 | |z2 | ei(φ1 +φ2 ) . Demostraci´ on. Ya probamos que |z1 z2 | = |z1 | |z2 |. Operando eiφ1 eiφ2

= (cos φ1 + i sen φ1 ) (cos φ2 + i sen φ2 ) = cos φ1 cos φ2 − sen φ1 sen φ2 + i(cos φ1 sen φ2 + sen φ1 cos φ2 ) = cos(φ1 + φ2 ) + i sen(φ1 + φ2 ) = ei(φ1 +φ2 ) ,

y queda finalmente z1 z2 = |z1 | |z2 | ei(φ1 +φ2 ) = |z1 z2 | ei(φ1 +φ2 ) .

z +w w w-z z 0

Por tanto, mientras que la suma y la resta de n´ umeros complejos no son otra cosa que la suma y la resta de vectores en el plano, que no necesita gr´aficamente m´as que la traslaci´on de segmentos, la construcci´on gr´ afica del producto de dos vectores es un poco m´as complicada:

z-w z .w uz

u1 0

1

w z

Dados z, w = |w| eiφ ∈ C, para construir z · w hemos de girar z un a´ngulo φ (con centro de giro en el origen) y efectuar una homotecia que multiplique el m´ odulo de z por el de w. Como se muestra en la figura, para llevar esto a cabo basta girar el tri´ angulo de v´ertices 0, 1, z hasta que el segmento de extremos 0 y 1 tenga la direcci´ on del segmento de extremos 0 y w, obteni´endose as´ı el tri´ angulo de v´ertices 0, u1 , uz ; z · w es el punto de corte de la recta que pasa por 0 y uz con la paralela por w a la recta que pasa por u1 y uz (¿por qu´e?).

4.3. EL PLANO COMPLEJO

95

Corolario 4.3.6 (Representaci´ on exponencial del cociente de dos n´ umeros complejos.) Dados z1 , z2 ∈ C, si z1 = |z1 | eiφ1 , z2 = |z2 | eiφ2 = 0, se tiene z1 |z1 | i(φ1 −φ2 ) = . e z2 |z2 | Demostraci´ on. Basta tener en cuenta que, seg´ un lo que acabamos de probar, |z1 | |z1 | i(φ1 −φ2 ) z2 = e |z2 | ei(φ1 −φ2 +φ2 ) = |z1 | eiφ1 = z1 . |z2 | |z2 | Nota. La expresi´on eiφ , φ ∈ R, comparte propiedades algebraicas de la exponencial real: eiφ eiψ = ei(φ+ψ) , φ, ψ ∈ R, (eiφ )−1 = ei(−φ) , φ ∈ R.

Ejercicios 14.1. Hallar los m´ odulos y los argumentos umeros complejos: −2x (x ∈ R \ {0}), iy √ √ de los n´ (y ∈ R \ {0}), 1 + i, −1 − i, (1 + i)(1 + i 3)( 3 − i), 2 + 5i, 2 − 5i, −2 + 5i, −2 − 5i (estos u ´ltimos, en funci´ on del arc tg(5/2)). ¿Cu´ al es el argumento principal? 14.2. Si φ, ψ ∈ R, entonces eiφ = eiψ si y s´olo si existe k ∈ Z tal que φ − ψ = 2kπ. 14.3. Hallar el m´ odulo y el argumento principal de 1 + cos φ + i sen φ, donde −π ≤ φ ≤ π. 14.4. Hallar la parte real y la imaginaria, el m´ odulo y un argumento de

1 + cos x + i sen x . 1 + cos y + i sen y

1 on de a. 14.5. Sean α ∈ R y a ∈ C tales que 2 cos α = a + . Obtener 2 cos nα en funci´  a   1 Indicaci´ on. ¿Qu´e vale eiα − a eiα − ? a 14.6. Si x + iy = (2 + cos α + i sen α)−1 con α, x, y ∈ R, hallar x e y en funci´ on de α y probar que el punto (x, y) est´a siempre en la circunferencia de di´ ametro el segmento que une los puntos ( 13 , 0) y (1, 0). 14.7. Sean z1 , z2 , z3 ∈ C distintos dos a dos. Explicar el significado geom´etrico de las relaciones: (i) m

z3 − z1 =0; z2 − z1

(ii) e

z3 − z1 =0. z2 − z 1

z2 es imaginario si y s´olo si |z1 + z2 | = |z1 − z2 |. z1 Deducir que un paralelogramo tiene sus diagonales iguales si y s´ olo si es un rect´angulo. 14.8. Sean z1 , z2 ∈ C con z1 = 0. Probar que

14.9. Demostrar que |z1 − z2 |2 + |z1 + z2 |2 = 2|z1 |2 + 2|z2 |2 . Deducir que “un cuadril´ atero es un paralelogramo si y s´ olo si la suma de los cuadrados de las longitudes de sus diagonales es igual a la suma de los cuadrados de las longitudes de todos sus lados” (ley del paralelogramo). 14.10. Demostrar que el tri´ angulo cuyos v´ertices son los puntos z1 , z2 , z3 sobre el diagrama de Argand es equil´ atero si y s´olo si z12 + z22 + z32 = z1 z2 + z2 z3 + z3 z1 . 14.11. ¿Cu´ al es el lugar geom´etrico de los puntos del plano complejo tales que |z + 16| = 4|z + 1|?

´ CAP´ITULO 4. NUMEROS REALES Y COMPLEJOS.

96

Polinomios en C y en R.

4.4

Reflexionando sobre lo que hemos hecho hasta ahora, parece que nuestros logros son m´ as bien modestos. Hemos a˜ nadido a R b´ asicamente un n´ umero, i, que nos genera ‘linealmente’ C, y que es una ra´ız del polinomio concreto X 2 + 1. ¿Qu´e suceder´a con los dem´as polinomios? Esto lo expone estupendamente el premio Nobel de F´ısica, Richard Feynman, en un cap´ıtulo llamado Algebra (de lectura absolutamente recomendada en su totalidad) de su libro [Fey], p. 22-10: 

Ahora ustedes dir´ an: “¡Esto puede seguir indefinidamente! Hemos definido las potencias de los imaginarios y todo lo dem´ as y cuando estamos listos, viene alguien con otra ecuaci´on que no puede ser resuelta como x6 + 3x2 = −2. ¡Entonces tenemos que generalizar todo de nuevo!” Pero resulta que con esta invenci´ on adicional que es simplemente la ra´ız cuadrada de −1, ¡toda ecuaci´ on algebraica puede ser resuelta! Este es un hecho fant´ astico que debemos dejar que lo demuestre el Departamento de Matem´aticas. Las demostraciones son hermosas y muy interesantes, pero ciertamente no son evidentes por s´ı mismas. De hecho, la suposici´on m´as evidente es que vamos a tener que inventar de nuevo, de nuevo y de nuevo. Pero el milagro m´ as grande es que no tenemos que hacerlo. Esta es la u ´ltima invenci´ on. Despu´es de esta invenci´on de los n´ umeros complejos, encontramos que las reglas siguen funcionando con los n´ umeros complejos y hemos terminado de inventar cosas nuevas. Podemos encontrar la potencia compleja de cualquier n´ umero complejo, podemos resolver cualquier ecuaci´on escrita algebraicamente en t´erminos de un n´ umero finito de esos s´ımbolos. No encontramos   m´as n´ umeros nuevos.

4.4.1

Potencias y ra´ıces de un n´ umero complejo

Comenzaremos construyendo las ra´ıces de unos polinomios muy particulares, los de la forma X n −z para un z cualquiera de C. Nuestro desarrollo de esta parte es, esencialmente, el de [Ap], pp. 26–28. Definici´ on 4.4.1 Dados z ∈ C y n ∈ Z, se define

0 z = 1, z n+1 = z n z  −1 −n n

z = z

si n ≥ 0, si n < 0 y z = 0.

Corolario 4.4.2 (F´ ormula de De Moivre.) Dado φ ∈ R, para todo n ∈ N es (cos φ + i sen φ)n = cos(nφ) + i sen(nφ). Demostraci´ on. Escrita en forma exponencial, (eiφ )n = einφ , se obtiene c´omodamente por inducci´ on. Para n = 1 es trivialmente cierta, y si es cierta para un n, entonces (eiφ )n+1 = (eiφ )n eiφ = einφ eiφ = einφ+iφ = ei(n+1)φ .

Ejercicio. ¿Qu´e ocurre con la f´ ormula de De Moivre para n ∈ Z? Proposici´ on 4.4.3 Dados dos enteros m y n, tenemos, siempre que est´en definidas las potencias, z m z n = z m+n ,

(z1 z2 )n = z1n z2n .

Demostraci´ on. Para n ≥ 0, es un ejercicio de inducci´ on (hacerlo). Para n < 0, recu´erdese la definici´ on (v. [Ap], Teorema 1.50).

4.4. POLINOMIOS EN C Y EN R.

97

Teorema 4.4.4 Si z = 0 y n ∈ N, existen exactamente n n´ umeros complejos distintos z0 , z1 , . . . , zn−1 (llamados ra´ıces n-´ esimas de z), tales que zkn = z para cada k = 0, 1, . . . , n − 1. Adem´ as, si α es un argumento de z, estas ra´ıces est´ an dadas por las f´ ormulas zk = r eiϕk , donde r = |z|1/n ,

ϕk =

k = 0, 1, . . . , n − 1,

α 2kπ + n n

(k = 0, 1, . . . , n − 1).

ags 27–28) Demostraci´ on. (Cf. [Ap], p´ Los n n´ umeros complejos r eiϕk , k = 0, 1, . . . , n − 1, son distintos entre s´ı: pues si tomamos enteros k, j, con 0 ≤ k ≤ n − 1, 0 ≤ j ≤ n − 1, de r eiϕk = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r = 0 y basta multiplicar por (1/r) e−iϕj ] y de aqu´ı ϕk − ϕj = 2mπ para alg´ un m ∈ Z; pero entonces α 2kπ α 2jπ k−j + − − = 2mπ, es decir, = m es un entero, y dado que n n n n n −1
b. Responde ahora cuidadosamente a estas cuestiones: (i) ¿C´omo se explica el resultado de (1)? (ii) ¿Son correctas las operaciones de (2)? ´ u S´I u t NO u t NO SE t (iii) En (2), lo cierto es que: a>bu t

a=bu t

a 0} = β emax (1 − β −p ) := m´ın{y ∈ FN : y > 0} = β emin −1

Llamaremos rango de F al conjunto [−f max, −f minN ] ∪ {0} ∪ [f minN , f max] (que contiene a F estrictamente). N´otese que ahora la mantisa m de un n´ umero y = 0.d1 d2 . . . dp × β e de FN es el entero d1 d2 . . . dp (escritos en base β). Llamaremos a d1 el d´ıgito m´ as significativo y a dp el d´ıgito menos significativo de y. En la norma LIA-1, los par´ametros β y p han de satisfacer β ≥ 2 y p ≥ 2, y β tiene que ser par. As´ı mismo, “para que haya bastantes elementos en F ”, los par´ametros emin , emax y p han de satisfacer p − 2 ≤ −emin ≤ β p − 1, p ≤ emax ≤ β p − 1. En IEEE 754 y 854 se consideran cuatro formatos distintos: precisi´on simple, precisi´on doble, precisi´on simple extendida, precisi´on doble extendida, con valores para los par´ametros (ver [Hig], p. 41): formato IEEE simple IEEE doble IEEE simple extendida IEEE doble extendida (reajustados a la normalizaci´on hh 0.d1 . . .ii).

β 2 2 2 2

p 24 53 ≥ 32 ≥ 64

emin −125 −1021 ≤ −1021 ≤ −16381

emax 128 1024 ≥ 1024 ≥ 16384

´ EN PUNTO FLOTANTE 6.2. REPRESENTACION

145

Ejemplos 1.- Si β = 2, p = 5 [= 22 + 1], y = 11/2 = 22 + 1 + 1/2 = 23 (2−1 + 2−3 + 2−4 ), tendr´ıamos (con mantisa y exponente en base 2, escrito el cero como O y el uno como I para distinguir) y = O.IOIIO × 2II = IOIIO × 2II−IOI ; la mantisa m es IOIIO y el exponente e es II. 2.- ‘Minimodelo’ con β = 2, p = 3, emin = −1, emax = 3. Los n´ umeros no negativos de F ser´ıan (en escritura decimal) el 0 y 1/2 0.25 0.5 1.0 2.0 4.0

1/2 + 1/8 0.3125 0.625 1.25 2.5 5.0

fracci´ on 1/2 + 1/4 0.3750 0.750 1.50 3.0 6.0

1/2 + 1/4 + 1/8 0.4375 0.875 1.75 3.5 7.0

exponente × 2−1 × 20 × 21 × 22 × 23

que se distribuyen gr´aficamente as´ı:

0 0.25 0.5

1.0

2.0

3.0

4.0

5.0

6.0

7.0

Junto con sus opuestos (los sim´etricos respecto del origen) forman el sistema F = F (2, 3, −1, 3). Este ejemplo ilustra c´omo el espaciado de los n´ umeros de F salta un factor 2 (= β) con cada potencia de 2 (= β).

6.2.2.

Aproximaci´ on por redondeo

Elegido un determinado sistema num´erico en punto flotante para implementar en el ordenador, el resto de los n´ umeros reales (¡casi todos!) no existen para ´el. Esta situaci´on no es nueva en absoluto: cada vez que hemos usado un valor num´erico de π, hemos puesto π = 3.14, o π = 3.1416, o π = 3.141592654 (cuando disponemos de calculadora); no hemos podido manejar su ‘valor exacto’, que, como dec´ıa el matem´atico, ‘es π’. La realidad fuerza inevitablemente a tomar aproximaciones, por lo que, si no podemos evitar los errores que generan, tratemos al menos de minimizarlos. Eso hacemos cuando ponemos π = 3.1416 (aproximaci´on por exceso) y no π = 3.1415 (aproximaci´on por defecto o por corte): tomamos el valor m´as pr´oximo a π entre los que tienen cinco cifras decimales. Para simplificar(*) , definiremos: Definici´ on 6.2.2 (Redondeo y desbordamiento.). Dado F = F (β, p, emin , emax ), el redondeo ( respecto de F ) es la aplicaci´ on f l : R → F ∪ {overflow, underflow} dada por f l(x) = overflow si |x| > f max = m´ax F (hay un desbordamiento por exceso ) f l(x) = underflow si 0 < |x| < f minN = m´ın{|y| : y ∈ F, y 6= 0} (hay un desbordamiento por defecto ). f l(x) = elemento de F m´as pr´oximo a x si x est´ a en el rango de F . Cuando haya dos n´ umeros en F a la misma distancia de x, convendremos en tomar como f l(x) el que tenga el u ´ltimo d´ıgito dp par. (*)

La norma IEEE 754 contempla distintos modos de redondeo: redondeo hacia +∞ (round down), redondeo hacia −∞ (round up), redondeo hacia 0 (round towards zero) y redondeo al m´ as pr´ oximo (round to nearest). Ver [Gold]

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

146

Ejercicio. Para x, y en el rango de F , (i) x ≤ y implica f l(x) ≤ f l(y); (ii) f l(−x) = − f l(x); (iii) f l(β n · x) = β n · f l(x) (supuesto β n · x en el rango de F ). Ejemplos. (1) En nuestro ‘minimodelo’ con β = 2, p = 3, emin = −1, emax = 3, se produce desbordamiento por exceso siempre que |x| > 7, y por defecto si 0 < |x| < 0.25. underflow 0 0.25 0.5

overflow 1.0

2.0

3.0

4.0

5.0

6.0

7.0

Para x = 4.5, ser´ıa f l(x) = 4; para x = 5.5, ser´ıa f l(x) = 6 (¿por qu´e?). (2) Para β = 10, p = 6: a = 0.31415926525 . . . × 101 b = −0.81412781 c = 0.112399972 d = 0.999999721

f l(a) = 0.314159 × 101 f l(b) = −0.814128 × 100 f l(c) = 0.124000 × 100 f l(d) = 0.100000 × 101

Obs´ervese c´omo el u ´ltimo d´ıgito de la mantisa de b ha sido modificado. El cambio puede afectar incluso a varios d´ıgitos (como en c) y a veces hasta al exponente, como en el ejemplo d. Medidas del error de redondeo Al redondear un n´ umero, es decir, al sustituir un x ∈ R por f l(x) como valor aproximado, cometemos un error cuyo tama˜ no conviene saber controlar. Puesto que cada x en el rango de F que no pertenezca a F estar´a en un intervalo (y1 , y2 ) con extremos en F y uno s´olo, y f l(x) ser´a precisamente uno de esos extremos, y1 —————————————— y2 x el valor de | f l(x) − x| = m´ın{|x − y| : y ∈ F } ser´a, en el peor de los casos, la mitad de la longitud y2 − y1 del intervalo. Basta, por tanto, controlar el espaciado entre los n´ umeros de F . En general, se observa que el espaciado es uniforme entre potencias consecutivas de β, y que se multiplica por β al saltar a una nueva potencia de β. Para concretar m´as, se utiliza el ´epsilon de la m´ aquina, que es la distancia M desde 1.0 al siguiente n´ umero de F m´as grande que ´el. Por tanto,

´ Definici´ on 6.2.3. Epsilon de la m´ aquina . Para un sistema num´erico en punto flotante F = F (β, p, emin , emax ), el ´ epsilon de la m´ aquina es el n´ umero M = β 1−p , Por tanto, M es el espaciado de los n´ umeros en punto flotante entre 1.0 y β, mientras que el espaciado de los n´ umeros entre 1.0 y 1/β es β −p = M /β. En general, Lema 6.2.4. La distancia entre un n´ umero en punto flotante normalizado y y otro n´ umero en punto flotante normalizado adyacente a y es como m´ınimo β −1 M |y| y como m´ aximo M |y| (salvo que uno de ellos sea cero). Demostraci´ on. Ver [Hig], pp. 41.

´ EN PUNTO FLOTANTE 6.2. REPRESENTACION

147

Pero seg´ un dice [Hig], ‘la cantidad m´as u ´til asociada con F , que est´a por todas partes en el mundo del an´alisis de los errores de redondeo’, es la llamada unidad de redondeo, que no es otra cosa que la mitad del ´epsilon de la m´aquina. Definici´ on 6.2.5. Dado un sistema num´erico en punto flotante F = F (β, p, emin , emax ), el n´ umero 1 1−p 1 = M se llama unidad de redondeo del sistema F . u= β 2 2 En el est´andar IEEE con simple precisi´on se tiene u = 2−24 ≈ 5.96 × 10−8 ; en doble precisi´ on, −53 −16 u=2 ≈ 1.11 × 10 . A partir del lema anterior, se obtiene: Proposici´ on 6.2.6. Si x ∈ R est´ a en el rango de F , entonces 1 | f l(x) − x| ≤ u |x| = β 1−p |x|; 2 precisando m´ as, f l(x) = x(1 + δ),

1 |δ| < u = β 1−p . 2

Demostraci´ on. Ver [Hig], p. 42, Th. 2.2. Esta proposici´on nos da cotas superiores del error absoluto y del error relativo en la aproximaci´on de x por f l(x). Recordamos la definici´on de estos conceptos. Definici´ on 6.2.7. Sea x un n´ umero real. Si x e es otro n´ umero real, que tomamos como una aproximaci´ on de x, se llama error absoluto (de la aproximaci´ on) a la diferencia Ea (x) = |x − x e|, y error relativo (cuando x 6= 0) al cociente Ea (x) |x − x e| x e x e Er (x) = = = 1 − = − 1 . |x| |x| x x As´ı x e = x + α con |α| = Ea (x); y para x 6= 0, x e = x(1 + ρ) con |ρ| = Er (x). La proposici´on 6.2.6 significa, por tanto, que el error relativo del redondeo es siempre estrictamente menor que la unidad de redondeo. Nota. En algunos textos, el error se expresa en t´erminos de la unidad en el u ´ltimo lugar, que se define para un y ∈ F por ulp(y) = ulp(±0.d1 d2 . . . dp × β e ) = 0.00 . . . 01 × β e = β e−p (ulp: unity in the last place). As´ı, por ejemplo, si F corresponde a β = 10 y p = 3, y se redondea .0314159 a .314 × 10−1 , entonces hay un error de .159 unidades en el u ´ltimo lugar. Dada la distribuci´on de los elementos de F , es preferible usar el error relativo, m´as preciso; mientras que para x = 0.9994999999 tendr´ıamos f l(x) = 0.999 × 100 , con ulp(f l(x)) = 10−3 y un error de 0.4999999 ulp ≈ 0.5 ulp, el error relativo es 0.0005002502252 ≈ 0.1u, y sin embargo para x = 1.005 ser´ıa f l(x) = 0.100 × 101 , con ulp(f l(x)) = 10−2 , un error de 0.5 ulp igualmente, pero el error relativo correspondiente ser´ıa 0.004975124378 ≈ u, aproximadamente diez veces mayor que el anterior (este es el fen´omeno llamado wobbling precision, ‘precisi´on bamboleante’ u ‘oscilante’).

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

148

6.3.

Aritm´ etica ‘aproximada’

Pr´acticamente en todas las operaciones que realiza un ordenador los datos llegan inevitablemente afectados de errores, o se generan errores de redondeo en el curso de los c´alculos. Al efectuar las operaciones m´as elementales, las aritm´eticas (sumas, restas, multiplicaciones, divisiones) los errores de los resultados ¿son del mismo orden que los iniciales o, por el contrario, se produce un aumento significativo en los mismos? ¿son las propias operaciones una nueva fuente de error, se realicen como se realicen? Responder con precisi´on a esta pregunta es una tarea ciertamente complicada, y es el objeto de estudios espec´ıficos fuera de lugar en esta asignatura. Pero podemos hacernos una idea de las dificultades y los problemas que se suscitan examinando qu´e sucede en nuestro modelo de sistemas de n´ umeros en punto flotante. Para empezar, ¿c´omo se propagan los errores en una suma? Lema 6.3.1. Sean x, y, αx , αy , εa (x), εa (y), n´ umeros reales tales que |αx | ≤ εa (x), |αy | ≤ εa (y), y sean  x e = x + αx . Entonces Ea = |(x + y) − (e x + ye)| ≤ |αx | + |αy |, ye = y + αy pudiendo tomar Ea cualquier valor desde Ea = 0 hasta Ea = εa (x) + εa (y). An´ alogamente, si x + y 6= 0, y para ρx , ρy , es  |x ρx + y ρy | |(x + y) − (e x + ye)| x e = x(1 + ρx ) , entonces Er = = , ye = y(1 + ρy ) |x + y| |x + y| y nada puede decirse en general: Er puede tomar cualquier valor en [0, +∞). Demostraci´ on. Por la desigualdad triangular Ea = |(x + y) − (e x + ye)| = | − (αx + αy )| ≤ |αx | + |αy |. Como cualquier valor r ∈ [0, εa (x) + εa (y)] puede ponerse en la forma r = s + t con 0 ≤ s ≤ εa (x), 0 ≤ t ≤ εa (y) (¿por qu´e?), Ea puede alcanzar el valor r. En cuanto a Er , sustituyendo x e y ye por su expresi´on en t´erminos de x e y aparece la igualdad del enunciado. Que Er puede alcanzar cualquier valor no negativo es claro: tomemos, por ejemplo, x > 0, h > 0 cualesquiera, y = −x + h, ρx ≥ 0 arbitrario, ρy = 0; as´ı x + y = h y Er =

xρx , h

que puede tomar tanto el valor Er = 0 para ρx = 0 como cualquier valor positivo R (basta que sea xρx ρx > 0, h = ). R Vemos, pues, que aunque el error absoluto de los sumandos est´e acotado por un cierto εa , el de la suma puede llegar a ser 2εa , y al cabo de N sumas, N εa , y que el error relativo queda descontrolado. Como generalmente lo que importa es el error relativo, afinaremos el resultado anterior. Proposici´ on 6.3.2. Sean x, y, ρx , ρy , εr (x), εr (y), n´ umeros reales tales que x + y 6= 0 y |ρx | ≤ εr (x), |ρy | ≤ εr (y), y sean  x e = x(1 + ρx ) . ye = y(1 + ρy ) Si x e y tienen el mismo signo, Er ≤ m´ax{|ρx |, |ρy |}, pudiendo tomar Er cualquier valor desde Er = 0 hasta Er = m´ax{εr (x), εr (y)}.

´ 6.3. ARITMETICA ‘APROXIMADA’

149

Demostraci´ on. Cuando x e y tienen el mismo signo, |x + y| = |x| + |y| (¿por qu´e?). Poniendo m´ax{|ρx |, |ρy |} = ρ, aplicando la igualdad previa y la desigualdad triangular Er =

|x| |ρx | + |y| |ρy | |x ρx + y ρy | |x| ρ + |y| ρ ≤ ≤ = ρ. |x| + |y| |x| + |y| |x| + |y|

Para concluir, tomando x = y 6= 0, ρx = ρy = ρ con ρ ∈ [0, m´ax{εr (x), εr (y)}] arbitrario, se obtiene Er = ρ. En este caso, vemos que el error de la suma de datos err´oneos no supera el error de los sumandos. Por contra, con x e y de signos opuestos el desastre es total. Proposici´ on 6.3.3. Sean x, y, ρx , ρy , n´ umeros reales tales que x + y 6= 0 y x e = x(1 + ρx ) ye = y(1 + ρy )

 .

Si x e y tienen signos opuestos, y no hay circunstancias especiales en los valores de los datos, Er puede tomar cualquier valor no negativo, por grande que este sea. Demostraci´ on. Revisar la demostraci´on del lema 6.3.1. Esta es una causa de error insalvable, ‘intr´ınseca’ a la operaci´on, que ning´ un ordenador ni programa alguno pueden evitar. Obs´ervese la disparidad del comportamiento cuando los sumandos ‘se a˜ naden o refuerzan’ (tienen el mismo signo) o ‘se oponen’ (tienen signos opuestos). En el primer caso el error relativo de la suma es, como mucho, el del ‘peor’ de los sumandos; en el segundo caso, el error relativo de la suma se dispara cuando la suma es ‘casi cero’, a´ un con peque˜ n´ısmos errores relativos en los sumandos (suele llamarse a este fen´omeno cancelaci´ on catastr´ ofica). Para empeorar un poco m´as las cosas, cuando manejamos un sistema F de n´ umeros en punto flotante, y es x e = f l(x), ye = f l(y), no siempre resulta x e + ye ∈ F (el resultado exacto de la suma de dos n´ umeros de F no siempre est´a en F ), con lo cual necesitar´a ser redondeado, y lo mejor que la m´aquina podr´a ofrecer como suma de estos n´ umeros, ser´a f l(e x + ye) (la situaci´on real puede ser m´as complicada). En la construcci´on ‘m´as favorable’ de la ‘suma de m´aquina’, tendr´ıamos, pues, x ⊕ y = f l(f l(x) + f l(y)), a˜ nadiendo otro error al que puede achacarse exclusivamente al redondeo de x e y (y suponiendo que no haya desbordamiento). Similarmente, la ‘mejor versi´on’ en este planteamiento de las restantes operaciones aritm´eticas(**) , corresponder´ıa a x y = f l(f l(x) − f l(y)) x y = f l(f l(x) · f l(y)) x y = f l(f l(x)/ f l(y)) (Para que tengan sentido, se supone que todos los n´ umeros que intervienen est´an en el rango de F : es trivial dar ejemplos en los que x, y cumplen esta condici´on, mientras que x  y da overflow o underflow para  = alguna de las operaciones anteriores.) (**) En la aritm´etica de punto flotante del est´ andar IEEE se estipula que, al menos para elementos de F , hh cada operaci´ on debe ser efectuada como si produjese primero un resultado intermedio correcto en precisi´ on infinita y con rango no acotado, y luego se ajustase este resultado intermedio a la precisi´ on destinada ii, de modo que finalmente se obtenga la respuesta exacta correctamente redondeada.

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

150

Veamos algunos ejemplos de los errores que se originan al realizar estas operaciones. Con base 10 y precisi´ on p = 5, tomamos y = 5/7 u = 0.714251 v = 98765.9 w = 0.111111×10−4

f l(y) = 0.71428×100 f l(u) = 0.71425×100 f l(v) = 0.98765×105 f l(w) = 0.11111×10−4

Calculando, resulta: Operaci´on Resultado Error absoluto Error relativo −4 y u 0.30000 × 10 0.472 × 10−5 0.136 1 (y u) w 0.27000 × 10 0.425 0.136 1 (y u) w 0.29629 × 10 0.466 0.136 u⊕v 0.98766 × 105 0.162 × 101 0.164 × 10−4 y w 0.64286 × 105 0.779 0.122×10−4 Se observa que el comportamiento es bastante desigual. Adem´as, con estas nuevas operaciones se pierden algunas de las buen´ısimas propiedades algebraicas y estructurales de R. Comprob´emoslo. Siguiendo con base 10 y precisi´on p = 5, prescindiendo del 0 previo al punto por comodidad de escritura, tomamos x = 1000000 f l(x) = .10000 × 107 y = −1000000 f l(y) = −.10000 × 107 z=1 f l(z) = .10000 × 101 Calculando, resulta: x+y x⊕y y+z y⊕z x+y+z (x ⊕ y) ⊕ z x ⊕ (y ⊕ z) 0 7 1 0 .00000 × 10 −999999 −.10000 × 10 1 .10000 × 10 (= 1) .00000 × 100 (= 0) ¡No hay asociatividad para la ‘suma flotante’ ⊕! Ni funciona tampoco la propiedad cancelativa: en este mismo ejemplo, y ⊕ z = y ⊕ 0 6=⇒ z = 0. Tambi´en podemos observar que para x = 3 × 107 , por ejemplo, f l(1/x) = .33333 × 10−7 ,

x (1/x) = f l((.30000 × 108 )(.33333 × 10−7 )) = .99999,

mientras que si y = .33334 × 10−7 , z = .33335 × 10−7 , x y = y x = x z = z x = .10000 × 101 = 1. Esto implica que tampoco el producto es asociativo: para estos valores, z (x y) = z 1 = z 6= y = 1 y = (z x) y. Adem´as, x tiene dos inversos, y y z, ninguno de los cuales coincide, por cierto, con f l(1/x).

´ 6.3. ARITMETICA ‘APROXIMADA’

151

Comparando, en general, con las propiedades fundamentales de R, encontramos: PROPIEDADES de cuerpo Suma cerrada Suma asociativa Suma conmutativa Elemento neutro Elemento opuesto

VALIDEZ NO NO SI SI SI

Puede haber underflow/overflow a veces (a ⊕ b) ⊕ c 6= a ⊕ (b ⊕ c) siempre a ⊕ b = b ⊕ a siempre 0 ∈ F y a ⊕ 0 = 0 ⊕ a = a para todo a siempre −a ∈ F y a ⊕ (−a) = (−a) ⊕ a = 0

Producto cerrado Producto asociativo Producto conmutativo Elemento unidad Elemento inverso

NO NO SI SI ??

Puede haber underflow/overflow a veces (a b) c 6= a (b c) siempre a b = b a siempre 1 ∈ F y 1 a = a 1 = a para todo a ???

Distributiva de cuerpo ordenado Reflexiva Sim´etrica Transitiva Invariancia por traslaci´on Invariancia por escalado Completitud Arquimediana Densidad topol´ ogicas Conexi´on

NO

a veces a (b ⊕ c) 6= (a b) ⊕ (a c)

SI SI SI SI SI SI SI NO

siempre a ≤ a siempre a ≤ b y b ≤ a implica a = b (a, b ∈ F ) siempre a ≤ b, b ≤ c implica a ≤ c siempre a ≤ b implica a ⊕ b ≤ b ⊕ c siempre a ≤ b, 0 ≤ c implica a c ≤ b c trivial: F es finito trivial: F es acotado F es finito

NO

todos los puntos son aislados

Revisemos ahora el funcionamiento de estas operaciones y el error cometido al tomarlas como aproximaciones de las operaciones exactas. Errores en sumas y restas Estudiaremos solamente x ⊕ y y x y cuando x y y son elementos positivos del rango de F , porque todos los dem´as casos puede reducirse a ´este teniendo en cuenta que f l(−x) = − f l(x), x y = x ⊕ (−y), etc. Proposici´ on 6.3.4. Dados x, y ≥ f minN , tales que x ⊕ y ∈ F , si f l(x) = x(1 + ρx )

(|ρx | < u),

f l(y) = y(1 + ρy )

(|ρy | < u),

se tiene Er =

|(x + y) − (x ⊕ y)| < 2u + u2 , |x + y|

y as´ı x ⊕ y = (x + y)(1 + ρ),

|ρ| < 2u + u2 ≈ M .

Demostraci´ on. Si z = f l(x) + f l(y) = x + y + xρx + yρy , x ⊕ y = f l(z) = z(1 + ρz ) = z + zρz (|ρz | < u), ser´a x ⊕ y − (x + y) = x ⊕ y − z + z − (x + y) = zρz + xρx + yρy = (x + y + xρx + yρy )ρz + xρx + yρy = (x + y)ρz + (xρx + yρy )(ρz + 1),

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

152 de donde Er =

xρx + yρy |(x ⊕ y) − (x + y)| = ρz + (1 + ρz ) ≤ |ρz | + m´ax{|ρx |, |ρy |}(1 + |ρz |) |x + y| x+y

< u + u(1 + u) = 2u + u2 ≈ 2u = M

(u2 ≈ 0).

Esta es una estimaci´on ‘pesimista’ del error, que puede mejorarse en circunstancias especiales. As´ı, cuando x, y ∈ FN ( ⇐⇒ ρx = ρy = 0), Er = |ρz | < u; o si ρz = 0 (i.e., si f l(x) + f l(y) ∈ FN ), Er ≤ m´ax{|ρx |, |ρy |} < u. Sin embargo, en otras circunstancias, el error puede superar a u. Ejemplos. 1.- Para β = 10, p = 5, x = y = 1.00005, Er = .4999750012 × 10−4 ≈ u. 2.- Para β = 2, p = 3 (cf. ‘minimodelo’), x ligeramente mayor que 1.125 (con lo cual f l(x) = 1.25), y ligeramente mayor que 4.5 (con lo cual f l(y) = 5), x + y ‘ligeramente mayor’ que 5.625, x ⊕ y = 7, queda Er ≈ 0.244 ≈ 2u = M = 0.25 En la sustracci´on habr´a que imponer restricciones adicionales, si hemos de evitar cancelaciones catastr´oficas. Si x, y ∈ F , obviamente s´olo hay error de redondeo y el error relativo de x y estar´a acotado por u. Pero, en general, el resultado puede presentar un error relativo desmesuradamente grande: si a = f max = β emax (1 − β −p ), d = β emax −p es la distancia de a al anterior elemento a+b de F , b = a − d es tal elemento, c = el punto medio del segmento[b, a], 2 b —————————————— a y c x tomando cualquier h > 0 menor que d/2, para x = c +

h h , y = c − , ser´ıa (ver figura) 2 2

x − y = h, f l(x) = a, f l(y) = b, x y = f l(d) = d, y por tanto Er =

|(x − y) − (x y)| |h − d| d = = − 1, |x − y| |h| h

que tiende a +∞ cuando h tiende a 0+ (el argumento puede trasladarse a otros intervalos de F ). Vemos as´ı que la cancelaci´ on catastr´ ofica es insalvable cuando se manejan datos aproximados, por ejemplo datos que sean resultados redondeados (aproximados) de una operaci´on anterior. N´otese que incluso si x e y (distintos) son ‘suficientemente pr´oximos’ y est´an ‘adecuadamente situados’ para que f l(x) = f l(y), con lo cual x y = 0, el error relativo alcanza un desastroso 100 %: Er = 1 en este caso. En general, cuando (x + y)/(|x − y|) no es ‘demasiado grande’, hay cancelaci´ on benigna, que no aumenta exageradamente el error previo, puesto que, conservando la notaci´on anterior y procediendo de la forma acostumbrada, x y xρx − yρy x+y Er = − 1 = ρz + (1 + ρz ) ≤ |ρz | + m´ax{|ρx |, |ρy |} (1 + |ρz |) x−y x−y |x − y| x+y x+y < u+ u(1 + u) = u + (u + u2 ). |x − y| |x − y| Errores en productos y cocientes La notaci´on en punto flotante est´a mejor adaptada al producto que a la suma, en cierto sentido, y jugando con los exponentes es m´as f´acil evitar el desbordamiento. Pero hemos de pensar que incluso partiendo de n´ umeros de F su producto exacto tiene ‘demasiadas cifras’, y casi siempre ser´a necesario el redondeo. Analicemos el tama˜ no del error relativo que introduce la operaci´ on .

´ 6.3. ARITMETICA ‘APROXIMADA’

153

Proposici´ on 6.3.5. Dados n´ umeros reales no nulos x e y, tales que x y ∈ F , si f l(x) = x(1 + ρx )

(|ρx | < u),

f l(y) = y(1 + ρy )

(|ρy | < u),

se tiene Er =

|(x y) − (x y)| < 3u + 3u2 + u3 , |x y|

o sea x y = (x y)(1 + ρ),

|ρ| < 3u + 3u2 + u3 ≈ 3u.

Demostraci´ on. Poniendo z = f l(x) f l(y) = xy(1 + ρx )(1 + ρy ), x y = f l(z) = z(1 + ρz ) (|ρz | < u), queda x y = xy(1 + ρx )(1 + ρy )(1 + ρz ), y as´ı |(x y) − (x y)| = |(1 + ρx )(1 + ρy )(1 + ρz ) − 1| |x y| = |ρx + ρy + ρz + ρx ρy + ρx ρz + ρy ρz + ρx ρy ρz |

Er =

< 3u + 3u2 + u3 ≈ 3u, suponiendo 3u2 + u3 ≈ 0. An´alogamente, para la operaci´on : Proposici´ on 6.3.6. Dados n´ umeros reales x e y, tales que x y ∈ F , si f l(x) = x(1 + ρx )

(|ρx | < u),

f l(y) = y(1 + ρy )

(|ρy | < u),

se tiene Er =

3u + u2 |(x/y) − (x y)| < , |x/y| 1−u

o sea x y = (x/y)(1 + ρ),

Demostraci´ on. Poniendo z = f l(x)/ f l(y) = (x/y) queda x y = (x/y)

Er

|ρ|
1 − u > 0, 1 + ρy |(x y) − (x/y)| (1 + ρx )(1 + ρz ) = = − 1 |x/y| 1 + ρy (1 + ρx )(1 + ρz ) − (1 + ρy ) ρx + ρz − ρy + ρx ρz = = 1 + ρy 1 + ρy 3u + u2 < ≈ 3u 1−u

suponiendo 4u2 /(1 − u) ≈ 0.

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

154

6.4.

Estrategias de c´ alculo para reducir los errores de redondeo La computaci´on en punto flotante es inexacta por naturaleza, y no es dif´ıcil utilizarla mal de modo que las respuestas computadas consistan casi enteramente en ‘ruido’. Uno de los principales problemas del an´alisis num´erico es determinar c´omo ser´ an de exactos los resultados de ciertos m´etodos num´ericos; aqu´ı est´a involucrado un problema de ‘salto de credibilidad’: no sabemos cu´antas respuestas del ordenador creer. Los usuarios novatos del ordenador resuelven este problema confiando impl´ıcitamente en el ordenador como autoridad infalible; tienden a creer que todos los d´ıgitos de una respuesta impresa son significativos. Los usuarios desilusionados del ordenador mantienen justamente la actitud opuesta, constantemente temen que sus respuestas carezcan casi de sentido. (D. E. Knuth)

El an´alisis elemental de las operaciones que acabamos de efectuar muestra que es necesario un estudio previo a cualquier proceso de c´alculo con ordenador, para evitar una acumulaci´on exagerada de errores, especialmente cuando haya que realizar operaciones consecutivas (a veces en gran n´ umero) con el ordenador. Hay tarea para personas con ingenio hasta en los casos m´as simples, como se˜ nala J. M. Muller en su art´ıculo Ordenadores en busca de aritm´etica [MC1, pp. 92–99], altamente recomendable: hh . . . Si el lector deduce que no hay que depositar jam´as una confianza ciega en los resultados facilitados por un ordenador y que la implantaci´on r´apida de una operaci´on tan elemental como la suma compete todav´ıa al campo de la investigaci´on, me dar´e por absolutamente satisfecho. ii Los ejemplos siguientes ilustran algunas de las dificultades y muestran caminos para paliar sus consecuencias.

6.4.1.

Reformulaci´ on del problema: Ejemplos

C´ alculo de una diferencia de cuadrados Consideremos la evaluaci´on de x2 − y 2 cuando x = 1.21, y = 1.20 en un sistema con β = 10 y p = 3. Resulta x y x2 y2 x2 − y 2 Error relativo Valor exacto 1.21 1.20 1.4641 1.4400 0.0241 Redondeo 0.121 × 10 0.120 × 10 0.146 0.144 0.200 × 10−1 0, 170 . . . ≈ 34u 1 −2 10 = 0.005. 2 Pero x2 − y 2 = (x − y)(x + y). ¿Qu´e sucede si rehacemos el c´alculo usando la segunda expresi´ on?

ya que en este caso u =

x y x−y x+y (x − y)(x + y) Error relativo Valor exacto 1.21 1.20 0.01 2.41 0.0241 Redondeo 0.121 × 10 0.120 × 10 0.1 × 10−1 0.241 × 10 0.241 × 10−1 0 ¡El resultado es exacto! Todas las cantidades x, y, x + y, x − y, (x + y)(x − y) son ‘n´ umeros de m´aquina’ y no hemos introducido ning´ un error, mientras que al calcular x x ha sido necesario el redondeo y x x − y y ha originado una cancelaci´on con los dos u ´ltimos d´ıgitos falsos. Si bien el ejemplo es un poco ‘tramposo’, incluso cuando x e y deban redondearse la segunda expresi´ on es preferible para el c´alculo, puesto que si f l(x) y f l(y) tienen varias cifras iniciales coincidentes, sus cuadrados tendr´an iguales doble n´ umero de d´ıgitos, y la cancelaci´on es ‘a´ un m´as catastr´ofica’.

´ 6.4. ESTRATEGIAS DE CALCULO

155

Ra´ıces de una ecuaci´ on de segundo grado Para resolver una ecuaci´on de segundo grado con ra´ıces reales ax2 + bx + c = 0, a, b, c ∈ R, a 6= 0, b2 − 4ac ≥ 0, disponemos de las conocid´ısimas f´ormulas √ √ −b + b2 − 4ac −b − b2 − 4ac x1 = , x2 = . 2a 2a ¿Qu´e problemas podr´a haber en el c´alculo efectivo con unas f´ormulas tan familiares? Comenzando 2 y 4ac por el discriminante b2 − 4ac, vemos la amenaza de una ‘cancelaci´on catastr´ofica’√cuando b√ tengan valores parecidos. ¿La salvaremos como antes, reescribiendo b2 −4ac = (b− 4ac)(b+ 4ac)? Los resultados no son muy halag¨ ue˜ nos. Incluso ignorando el problema del c´alculo de una ra´ız cuadrada aproximada, los resultados en ambos casos pueden ser muy mediocres. Siguiendo con β = 10, p = 3 como antes, veamos qu´e sucede en el siguiente ejemplo:

V.E. P.F.

a 1.22 0.122 × 10

b 3.34 0.334 × 10

c 2.28 0.228 × 10

b2 11.1556 0.112 × 102

4ac 11.1264 0.111 × 102

b2 − 4ac 0.0292 0.100

Error relativo 485u

(en la primera fila est´an los valores exactos, en la segunda los resultados en punto flotante). An´ alogamente √ 4ac S ≈ 4ac b−S b+S (b − S)(b + S) V.E. 11.1264 3.335625878 0.004374122 6.675625878 0.02920000202 P.F. 0.111 × 102 0.333 × 10 0.1 × 10−1 0.667 × 10 0.667 × 10−1 ¡No coincide ni la primera cifra significativa! (aunque al menos ha disminuido el error a 257u, aproximadamente). Queda√otra cancelaci´on catastr´ofica al acecho. ¿Qu´e sucede si b2 es mucho mayor que 4ac? Entonces b2 − 4ac ≈ |b|, con lo cual, si b > 0, podemos tener dificultades con la f´ormula para x1 , y si b < 0, con la f´ormula para x2 . Afortunadamente, este √ problema es m´as sencillo de solventar. Supongamos, por ejemplo, que b > 0. Entonces D = b + b2 − 4ac es una suma de cantidades positivas, con lo que el error no superar´a al error de los datos en mucho m´as de 2u, y pasaremos a calcular x2 = −D/2a. Para el c´alculo de x1 disponemos de otras f´ormulas m´as adecuadas: x1 =

c −2c √ = . ax2 b + b2 − 4ac

Cuando b < 0, basta usar la f´ormula tradicional para x1 y hallar x2 a partir de x2 =

c 2c √ = . ax1 −b + b2 − 4ac

Sumas en cadena Los errores en una sola operaci´on (no ‘catastr´ofica’) en punto flotante se amplifican seg´ un se van encadenando m´as y m´as operaciones, si bien el aumento es en general tan peque˜ no que hace falta un n´ umero muy grande de operaciones inexactas para llegar a errores visibles. No obstante, puesto que no hay asociatividad, incluso en sumas de varios sumandos positivos no es indiferente la manera de llevar a cabo las operaciones: el orden y la manera de agrupar puede inicidir en que el error final sea m´as grande o m´as peque˜ no.

156

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

Veamos una ilustraci´on clara (muy simplificada). Con precisi´on p = 3 y base 10, y sumandos 100, 0.9, 0.9, 0.9, podemos proceder as´ı: (((100 ⊕ 0.9) ⊕ 0.9) ⊕ 0.9 (100 ⊕ 0.9) ⊕ (0.9 ⊕ 0.9) ((0.9 ⊕ 0.9) ⊕ 0.9) ⊕ 100 valor exacto: 100 + 0.9 + 0.9 + 0.9

= (100 ⊕ 0.9) ⊕ 0.9 = 100 ⊕ 0.9 = 100 ⊕ 1.8 = (1.8 ⊕ 0.9) ⊕ 100 = 2.7 ⊕ 100 = 100.9 + 0.9 + 0.9 = 101.8 + 0.9

= = = =

100 102 103 102.7

En las evaluaciones primera y tercera hemos procedido recurrentemente: en cada etapa sumamos la suma parcial previa con el sumando siguiente. En la segunda hemos emparejado los sumandos, reduciendo el n´ umero de operaciones. Observamos que el primer procedimiento da mayor error, el segundo es ‘menos costoso’, y que el tercero da el valor redondeado del resultado exacto, el mejor valor posible. La causa del ´exito final es aqu´ı muy aparente: al sumar n´ umeros de tama˜ no muy distinto, hay que tener precauci´on de que ‘el pez grande no se coma al chico’, como sucede en la evaluaci´ on 100 ⊕ 0.9 = 100. Parece conveniente ordenar los sumandos de menor a mayor para homogeneizar tama˜ nos en la medida de lo posible, permitiendo as´ı que la adici´on de los sumandos peque˜ nos lleve a un valor que no desaparezca cuando lleguen los sumandos ‘grandes’. (Esta es una peque˜ na muestra de las dificultades que tienen que superar los programadores incluso en situaciones que no parecen a priori tan complicadas). Adem´as, los dos primeros sumandos est´a involucrados en n − 1 operaciones y el u ´ltimo en una s´ola, con lo que el error absoluto final es menor. Por otra parte, cuando la rapidez de c´alculo es importante, la opci´on del emparejamiento parece ventajosa. Adem´as, al disminuir el n´ umero de operaciones efecuadas, cabe suponer que disminuir´ a el crecimiento de los errores (con datos de magnitudes similares, al menos). N´otese que en una suma de n = 2k sumandos, cada sumando estar´ıa ahora involucrado en k = log2 (n) operaciones, lo que lleva a un error absoluto del orden de n log2 (n) veces el m´aximo de los errores de los sumandos, ver [1] p. 15. Sobre las dificultades de la implementaci´on de algoritmos eficaces en la adici´on de muchos sumandos, ver m´as detalles en [3], Floating point summation, y [4], as´ı c´omo en el art´ıculo de J. P. Muller ya citado [MC1]. En [Brz], pp. 10–11, hay un ejemplo de ‘correcci´on de la aritm´etica’ para efectuar sumas. Costo operativo y eficiencia: Evaluaci´ on de polinomios hh

Un mismo problema suele poder resolverse por diversos m´etodos num´ericos. ¿C´omo decidirse por uno? El tama˜ no de los errores es ciertamente un criterio u ´til: podr´ıamos elegir el m´etodo que diese menores errores. No obstante hay un criterio mejor: nos quedaremos con el m´etodo que, dando errores dentro de unos l´ımites predeterminados, necesite el menor trabajo. Esta preocupaci´on por estudiar la eficiencia de los diversos m´etodos es un rasgo distintivo del an´alisis num´erico. La eficiencia depende tanto del tama˜ no de los errores como del costo operativo del m´etodo. Aquellas tareas para las que, en un momento hist´orico dado, no se dispone de un m´etodo aceptablemente eficiente no se pueden llevar a cabo. Ejemplo. M´etodo de Horner (1744–1834) para evaluar polinomios. Supongamos que deseamos hallar el valor de un polinomio cu´artico a0 + a1 x + a2 x2 + a3 x3 + a4 x4 (los ai son n´ umeros reales conocidos) para un valor dado de x0 de la variable x. El m´etodo m´as ingenuo halla sucesivamente los productos x20 = x0 ∗ x0 , x30 = x20 ∗ x0 , x40 = x30 ∗ x0 con un coste operativo de tres multiplicaciones, luego los productos ai ∗ xi0 (otras cuatro multiplicaciones), y finalmente hace las cuatro sumas/restas. (Que sean efectivamente sumas o restas depende del signo concreto que vayan teniendo los sumandos; para sumar 48 y -27 hay que restar.) En total cuatro sumas/restas y siete multiplicaciones. Sin embargo haciendo las operaciones en orden  h i a0 + x0 ∗ a1 + x0 ∗ a2 + x0 ∗ [a3 + x0 ∗ a4 ] (1.6)

´ 6.4. ESTRATEGIAS DE CALCULO

157

s´olo son precisas cuatro sumas/restas y cuatro multiplicaciones. Para un polinomio de grado N el m´etodo ingenuo requiere N sumas/restas y 2N − 1 multiplicaciones, el m´etodo (1.6) llamado de Horner o de multiplicaci´on encajada usa N sumas/restas y N multiplicaciones. Como ninguno de los dos m´etodos genera errores —excepto los derivados de usar mantisa de longitud finita— el de Horner, que tiene menor costo operativo es m´as eficiente. Si s´olo se va a evaluar una vez un polinomio y se usa un ordenador no hay diferencia entre usar uno u otro m´etodo. Si, como a veces ocurre, dentro de un programa grande hay que evaluar millones de veces, usar uno u otro m´etodo puede significar tener que esperar el resultado dos horas o s´ olo una. Si calculamos con papel y l´apiz en un examen usar un mal m´etodo puede implicar no tener el resultado a tiempo. ii ([S-S], pp. 13 y 14.)

6.4.2.

Refinamientos en la representaci´ on y en la precisi´ on

Dos recursos que permiten mejorar la exactitud de los c´alculos son el uso de n´ umeros desnormalizados y de precisi´ on m´ ultiple. N´ umeros desnormalizados Para paliar los problemas que ocasiona el redondeo de n´ umeros ‘cercanos al cero’, se ampl´ıa a veces el sistema F de n´ umeros en punto flotante incluyendo los n´ umeros desnormalizados (tambi´en llamados subnormales en ingl´es). Tanto los est´andares IEEE 754 y 854 como LIA-1 y unas cuantas implementaciones ‘no-IEEE’ incluyen n´ umeros desnormalizados. Siguiendo con la notaci´ on habitual, un n´ umero en punto flotante desnormalizado es un n´ umero real de la forma y = ±m × β emin −p donde m es un entero del intervalo [1, β p−1 − 1]. La fracci´on correspondiente g queda en el intervalo [β −p , 1/β −β −p ]; su d´ıgito m´as significativo es 0, y su exponente emin . Los n´ umeros desnormalizados rellenan parcialmente los “huecos de subdesbordamiento” que se producen entre ±β emin −1 y 0. Tomados juntos, componen el conjunto que en LIA-1 se denota FD . La admisi´on o no de n´ umeros desnormalizados se controla mediante el par´ametro booleano denorm, que toma el valor true o false seg´ un se permitan n´ umeros desnormalizados o no. En el primer caso, se redefine F = {0}∪FN ∪FD ; en el segundo, se mantiene la definici´on previa. El m´ınimo n´ umero positivo en punto flotante desnormalizado es β emin −p = f minN · εM . Los valores de FD est´an igualmente espaciados, con el mismo espacio que el de los n´ umeros de F entre e −p e −1 e min min min β yβ , que es β = f minN · εM . Volviendo al ejemplo con β = 2, p = 3, emin = −1, emax = 3, la representaci´on gr´afica de F con los n´ umeros desnormalizados incluidos (2−4 = 0.0625, −4 −4 2 × 2 = 0.125, 3 × 2 = 0.1875) ser´ıa 0.0625 ↓ 0 0.25 0.5

1.0

2.0

3.0

4.0

5.0

6.0

7.0

Los valores de FD tienen un m´aximo absoluto de error de representaci´on de β emin −p . Sin embargo, como los n´ umeros desnormalizados tienen menos de p d´ıgitos de precisi´on, el error relativo de representaci´on puede variar ampliamente. Este error relativo va desde M = β 1−p en el extremo superior de FD hasta 1 en el extremo inferior de FD . Cerca de 0, el error relativo crece sin tope. Siempre que una adici´on o sustracci´on de n´ umeros de F produce un resultado en FD , dicho resultado es exacto, el error relativo es cero. Un ejemplo trivial: en el modelo anterior, 1 0.875 = 0.125 con n´ umeros desnormalizados incluidos, 1 0.875 = 0 en caso contrario.

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

158

hh Incluso para una “sustracci´ on efectiva” no se pierde exactitud, porque la disminuci´ on del n´ umero de d´ıgitos significativos es exactamente la misma que el n´ umero de d´ıgitos cancelados en la sustracci´on. Para la multiplicaci´on, divisi´on, escalado, y algunas conversiones, los d´ıgitos significativos (y por tanto la exactitud) pueden perderse si el resultado est´a en FD . ii ([LIA-1], p. 33.)

La ventaja fundamental que proporcionan los n´ umeros desnormalizados es la siguiente: Incluyendo en F los n´ umeros desnormalizados, si x, y ∈ F , para que x y = 0 es necesario y suficiente que x = y. Obviamente, esto no es cierto cuando F no contiene a FD . Mayor precisi´ on Mientras que habitualmente es posible disponer de d´ıgitos extra en una computaci´on (aumentando la precisi´on p, pasando por ejemplo de precisi´on simple a doble precisi´on), esto siempre es costoso en tiempo y en espacio. Adem´as, aunque intuitivamente al aumentar la precisi´on parece l´ogico esperar que la exactitud aumente, esto no siempre es as´ı. En muchos casos el error estimado de un algoritmo es efectivamente proporcional a la precisi´on, como hemos visto en casi todas las operaciones aritm´eticas; pero como las cotas del error no siempre se alcanzan, no hay garant´ıa de que un resultado concreto calculado con precisi´on p sea m´as exacto que el calculado con precisi´ on p + q mayor (v. [Hig], pp. 19–20). No obstante, es una t´ecnica frecuente en la estimaci´on de la exactitud recalcular (al menos en la ‘etapa de ensayo’ de un algoritmo) aumentando la precisi´ on y observar cu´antos d´ıgitos de la respuesta as´ı obtenida coinciden con la original. D´ıgitos de seguridad (Guard digits) Cuando se entra en los pormenores de la implementaci´on efectiva de las operaciones en punto flotante, las complicaciones aumentan tremendamente. Por ejemplo, contra lo que cabr´ıa suponer, la suma es mucho m´as complicada que la multiplicaci´on y la divisi´on. Para empezar, no se conoce a priori el exponente del resultado, y hay que proceder a redondeos y reescalados para determinarlos; b´asicamente, el ordenador procede como nosotros, reescalando las mantisas para poder ‘alinearlas’y sumarlas a continuaci´on; el resultado puede tener una mantisa que comience por 0 (perdiendo la normalizaci´on) y/o m´as de p cifras. Se ve la necesidad de a˜ nadir cifras extras en las etapas intermedias para disminuir errores. As´ı se describe el proceso en [Brz], pp. 33 y ss.: hh

Cada operaci´on aritm´etica efectuada con el ordenador est´a igualmente manchada por un error de afectaci´on. Es decir, que se tiene: |(a  b) − f l(a  b)| ≤ 5|(a  b)|10−p , donde  designa una de las cuatro operaciones aritm´eticas (suma, resta, multiplicaci´on, divisi´on). Este resultado da la diferencia m´axima que puede existir entre el resultado exacto de una operaci´on aritm´etica y el resultado encontrado por el ordenador. As´ı, para un ordenador que trabaje con mantisas de ocho d´ıgitos, el error relativo es inferior a 5 · 10−8 . Se puede pensar que este es un error muy d´ebil, despreciable incluso, y sin embargo vamos a ver que sus consecuencias puede ser catastr´oficas (no siempre, afortunadamente para nosotros). Para comprender bien lo que pasa, hay que saber que las operaciones aritm´eticas se efect´ uan en memorias especiales, el acumulador , cuyas mantisas comportan al menos p + 1 d´ıgitos. Se completan los operandos con ceros a la derecha, se efect´ ua la operaci´on en el acumulador, y despu´es se reenv´ıa el resultado a la memoria redonde´andolo. Este error de redondeo es preponderante sobre el que se hace en el acumulador, lo que explica que cada operaci´ on

´ 6.4. ESTRATEGIAS DE CALCULO

159

est´e manchada solamente con un error de afectaci´on. Demos un ejemplo para ilustrar nuestro prop´osito: calculemos a = b × c memoria acumulador b 0.842345 → 0.8423450 c 0.516287 · 10−2 → 0.5162870 · 10−2 a 0.434892 · 10−2 ← 0.4348917 · 10−2 Para una suma, tras la transferencia de los operandos al acumulador, el ordenador comienza por modificar el exponente del operando menor (en valor absoluto) para que tenga el mismo valor que el de el m´as grande; de hecho, el ordenador alinea como nosotros las cifras de las potencias id´enticas de 10, unas sobre otras: memoria acumulador b 0.842345 → 0.8423450 c 0.516287 · 10−2 → 0.0051629 a 0.847508 ← 0.8475079 Y lo mismo, evidentemente, para una sustracci´on.

ii

Extra˜ namente, hay fabricantes (como cray) que construyen algunas de sus m´aquinas sin aumentar los bits disponibles para los datos intermedios, limit´andose a recortar ´estos al tama˜ no correspondiente a la precisi´on, lo que puede suponer un error relativo a˜ nadido hasta de β − 1, es decir, del 100 % cuando β = 2 y del 900 % cuando β = 10. En efecto: [Gold] Con sumandos en F : Proposici´ on 6.4.1. Usando un formato de punto flotante con par´ ametros β y p, y computando diferencias usando p d´ıgitos, el error relativo del resultado puede llegar a ser β − 1. 1 α α = 0.10 · · · 0 × 100 , α = β − 1, y = 2 + · · · + p+1 = 0.αα · · · α × 10−1 β β β resulta x − y = β −p−1 , x y = β −p , Er = β − 1.

Demostraci´ on. Para x =

En cambio: Proposici´ on 6.4.2. Si x e y son n´ umeros en punto flotante en un formato con par´ ametros β y p, y si la sustracci´ on se hace con p + 1 d´ıgitos (i.e., con un d´ıgito ‘de seguridad’) entonces el error relativo de redondeo del resultado es menor que 2, donde  es el ´epsilon de la m´ aquina. (La adici´on est´a incluida en el teorema anterior ya que x e y pueden ser positivos o negativos.) Para m´ aquinas que trabajan sin d´ıgitos extras hay muchos algoritmos que dejan de funcionar correctamente, como lo hacen en caso contrario. Existen adem´as resultados como el siguiente, v´alidos cuando se opera con digitos ‘de seguridad’ (v. [Hig], p. 50): Teorema 6.4.3 (Sterbenz). Sean x e y n´ umeros en punto flotante con y/2 ≤ x ≤ 2y. Si la sustracci´ on se realiza con un d´ıgito de seguridad, entonces x − y es computado exactamente (suponiendo que |x − y| ≥ f minN .)

6.4.3. hh

Buscar algoritmos estables

Se puede oir a veces el siguiente argumento ingenuo: ¿Por q´ ue perder el tiempo con todos esos peque˜ nos errores de punto flotante? Incluso IEEE en precisi´on simple nos da 7 d´ıgitos significativos por lo menos, y seguro que esto es suficiente para la mayor´ıa de las aplicaciones, y adem´as est´a la precisi´on doble, y seguramente esta tiene que bastar.

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

160

Un contraargumento es que los errores pueden propagarse y crecer r´apidamente, y como son inevitables “peque˜ nos” errores de redondeo, existe siempre el peligro de que nuestras computaciones produzcan basura. Los problemas que tienen una tendencia inherente a la “amplificaci´on de errores” se llaman mal condicionados; requieren usar paquetes de aritm´etica multiprecisi´on y un estrecho control de errores. Un ejemplo cl´asico de problema mal condicionado es cierto polinomio de grado 20; tras multiplicar uno de sus coeficientes (el que multiplica a la potencia 19) por un factor 1.0000000005, la localizaci´on de la mayor parte de las ra´ıces cambia completamente. En el anterior ejemplo, simplemente entrar los datos (los coeficientes del polinomio) en el ordenador puede ser suficiente para estropear todo el c´alculo, por cuanto la conversi´ on de la representaci´on decimal externa a la interna, binaria, puede introducir errores demasiado grandes. Un problema bien condicionado puede tener un algoritmo que amplifique los errores: tal algoritmo se dice que es inestable. En t´erminos sencillos, un algoritmo inestable transforma un “peque˜ no” cambio en las cantidades de entrada en un cambio “grande” en las cantidades i de salida. i ([4], § 4-7.) La estabilidad de un algoritmo es una de sus propiedades m´as importantes, pero no es sencilla de definir con precisi´on. En [1], p. 13, se describe as´ı: hh Supongamos que g(x) es la soluci´ on exacta de un problema con inputs x, y g ∗ (x) es el valor calculado por un algoritmo particular. La soluci´on calculada g ∗ (x) puede ser pensada a menudo como la soluci´on exacta de un problema perturbado con inputs x e, esto es, g ∗ (x) = g(e x). Si siempre ∗ hay un x e cercano a x tal que g (x) = g(e x), entonces el algoritmo se dice estable . Si no, el algoritmo es inestable . ii N´otese que la estabilidad es una propiedad relativa al algoritmo empleado para resolver un problema, mientras que el condicionamiento se refiere al propio problema: un problema de computaci´ on se dice mal condicionado si peque˜ nas perturbaciones en el problema producen perturbaciones grandes en la soluci´ on exacta. Adem´as del ejemplo anteriormente se˜ nalado sobre c´alculo de ra´ıces de un polinomio, otro problema t´ıpico mal condicionado es el de la resoluci´on de un sistema lineal cuando la matriz de los coeficientes es casi singular: peque˜ nos cambios en dichos coeficientes o en los t´erminos independientes pueden llevar a soluciones exactas muy diferentes; como al almacenar los datos en la m´aquina se producen errores de redondeo, es sustancialmente imposible dar soluciones precisas a los problemas mal condicionados con cualquier algoritmo que se utilice. Por contra, a veces un algoritmo inestable puede modificarse convenientemente para lograr uno estable. Estos son los consejos a los programadores de un experto ([Hig], pp. 30 y 31): hh

Dise˜ no de algoritmos estables

No hay una receta simple para dise˜ nar algoritmos num´ericamente estables. Mientras que esto ayuda a mantener a los analistas num´ericos en el negocio (¡incluso probando que los algoritmos de los dem´as son inestables!) no es una buena noticia para los cient´ıficos computacionales en general. El mejor consejo es ser consciente de la necesidad de la estabillidad num´erica cuando se designa un algoritmo y no concentrarse exclusivamente en otros aspectos, tales como el costo computacional y la paralelizabilidad. Se pueden dar unas pocas pautas. 1. Intentar evitar restar cantidades contaminadas de error (aunque tales restas pueden ser inevitables).

´ 6.4. ESTRATEGIAS DE CALCULO

161

2. Minimizar el tama˜ no de las cantidades intermedias en relaci´on a la soluci´on final. La raz´ on es que si las cantidades intermedias son muy grandes, entonces la respuesta final puede ser el resultado de cancelaci´on sustractiva da˜ nina. Mir´andolo de otra manera, los n´ umeros intermedios grandes arrollan los datos iniciales, con el resultado de p´erdida de informaci´ on. El ejemplo cl´asico de algoritmo en el que esta consideraci´on es importante es la eliminaci´ on gaussiana, pero un ejemplo a´ un m´as simple es la sumaci´on recursiva. 3. Buscar diferentes formulaciones de una computaci´on que sean matem´aticamente pero no num´ericamente equivalentes. Por ejemplo, el m´etodo cl´asico de Gram-Schmidt es inestable, pero una modificaci´on trivial produce el m´etodo de Gram-Schmidt estable modificado (MGS). Hay dos maneras de usar el m´etodo MGS para resolver un problema de m´ınimos cuadrados, el m´as obvio de los cuales es inestable. 4. Es ventajoso expresar la actualizaci´on de f´ormulas como valor nuevo = valor viejo + peque˜ na correcci´on si la peque˜ na correcci´on puede calcularse con muchas cifras significativas correctas. Los m´etodos num´ericos a menudo est´an expresados de manera natural en esta forma; los ejemplos incluyen m´etodos para resolver ecuaciones diferenciales ordinarias, donde la correcci´ on es proporcional al tama˜ no de paso, y el m´etodo de Newton para resolver un sistema no lineal. Un ejemplo cl´asico del uso de esta estrategia de actualizaci´on es el refinamiento iterativo para mejorar la soluci´on calculada de un sistema lineal Ax = b, en el que calculando residuos r = b − Ay en precisi´on extendida y resolviendo ecuaciones actualizadas que tienen los residuos como t´erminos independientes es posible calcular una soluci´on con un alto grado de exactitud. Para otro ejemplo (en el que la correcci´on no es necesariamente peque˜ na), ver el Problema . . . 5. Usar s´olo transformaciones bien condicionadas del problema. En c´alculos matriciales, esto viene a ser multiplicar por matrices ortogonales donde sea posible, en vez de no ortogonales, y posiblemente, matrices mal condicionadas. Ver §6.2 para una explicaci´on simple de este consejo en t´erminos de normas. 6. Tomar precauciones para evitar desbordamientos innecesarios. Concerniente al segundo punto, una buena recomendaci´on es mirar los n´ umeros generados durante una computaci´on. Esto era pr´actica com´ un en los primeros tiempos del c´alculo electr´ onico. ¡En algunas m´aquinas era inevitable, porque los contenidos almacenados se mostraban como luces o monitores! Wilkinson gan´o en penetraci´on sobre la estabilidad num´erica inspeccionando el progreso de un algoritmo, y alterando a veces su curso (para un proceso iterativo con par´ametros) . . . ii hh

Concepciones equivocadas

Algunos mitos y concepciones equivocadas comunes han sido se˜ nalados en este cap´ıtulo (ninguno de ellos por vez primera—ver notas y referencias). Los destacamos en la siguiente lista. 1. La cancelaci´on en la sustracci´on de dos n´ umeros casi iguales es siempre una mala cosa. 2. Los errores de redondeo pueden cargarse una computaci´on s´olo si se acumulan un vasto n´ umero de ellos. 3. Una computaci´on corta libre de cancelaci´on y desbordamiento tiene que ser exacta. 4. Aumentar la precisi´on con la que se efect´ ua una computaci´on aumenta la exactitud de la respuesta.

´ CAP´ITULO 6. ARITMETICA DE PUNTO FLOTANTE.

162

5. La respuesta final calculada a partir de un algoritmo no puede ser m´as exacta que ninguna de las cantidades intermedias, esto es, los errores no pueden cancelarse. 6. Los errores de redondeo s´olo pueden estorbar, no ayudar, al ´exito de un c´alculo.

ii

De marcado car´acter pr´actico son tambi´en las recomendaciones y consejos que se encuentran a lo largo del manual [4], dirigidas espec´ıficamente a los usuarios de FORTRAN.

6.4.4.

Compensaciones estad´ısticas

Hemos buscado hasta aqu´ı las situaciones m´as desfavorables, para poner de manifiesto los problemas que puede originar la computaci´on con ordenadores. hh Afortunadamente, en numerosos casos pr´acticos, los errores se compensan de una operaci´on a otra. ii ([Brz]) Suele hacerse la hip´ otesis de que los errores relativos en cada operaci´on aritm´etica en punto flotante se distribuyen ‘uniformemente’ desde el punto de vista estad´ıstico en el intervalo (−M , M ), y que los errores son independientes, lo que lleva a una distribuci´ on normal que sugiere un error t´ıpico en N operaciones de tama˜ no N 1/2 M —la desviaci´on est´andar—, muy inferior al tama˜ no N 2 M de las estimaciones ‘m´as pesimistas’. Sin embargo, los errores no tienden a ser independientes, y la estimaci´on N 1/2 M es, en general, demasiado ‘optimista’. En todo caso, los siguientes p´arrafos parecen dejar las cosas en el punto justo: [Hig], p. 16: hh Desde que se desarrollaron las primeras computadoras electr´onicas en los 1940s, se ha hecho a menudo comentarios del tipo siguiente: “La enorme velocidad de las m´aquinas actuales significa que en un problema t´ıpico se efect´ uan muchos millones de operaciones en punto flotante. Esto significa a su vez que los errores de redondeo pueden acumularse potencialmente de manera desatrosa”. Este sentimiento es cierto, pero enga˜ noso. Las m´as de las veces, la inestabilidad no est´a causada por la acumulaci´on de millones de errores de redondeo, sino por el crecimiento insidioso de tan s´olo unos pocos errores de redondeo. ii [Hig], pp. 21–22: hh No es inusual que los errores de redondeo se cancelen en algoritmos estables, con el resultado de que la respuesta final computada es mucho m´as exacta que las cantidades intermedias. Este fen´omeno no es apreciado universalmente, quiz´as porque tendemos a mirar los n´ umeros intermedios en un algoritmo s´olo cuando algo va mal, no cuando la respuesta computada es satisfactoria. ii [Hig], p. 29: hh Los errores de redondeo, y su efecto acumulado en una computaci´on, no son aleatorios. Este hecho subyace en el ´exito de muchas computaciones, [· · · ] Aqu´ı daremos simplemente un ejemplo num´erico revelador (debido a W. Kahan). Def´ınase la funci´on racional r(x) =

622 − x(751 − x(324 − x(59 − 4x))) , 112 − x(151 − x(72 − x(14 − x)))

que est´a expresada en una forma que corresponde a la evaluaci´on de los polinomios cu´ articos del numerador y el denominador mediante la regla de Horner. Hemos calculado r(x) mediante la regla de Horner en aritm´etica de doble precisi´on para 361 n´ umeros en punto flotante consecutivos comenzando con a = 1.606, o sea x = a + (k − 1)2−52 , k = 1 : 361; la funci´on r(x) es virtualmente constante en este intervalo. La figura 1.6 dibuja los valores computados de la funci´on junto con una aproximaci´on mucho m´as exacta a r(x) (calculada a partir de una representaci´on en fracci´ on continua). El patr´on sorprendente formado por los valores calculados mediante la regla de Horner muestra claramente que los errores de redondeo en este ejemplo no son aleatorios. ii (Ver tambi´en [Hig], p. 52–53).

Bibliograf´ıa [Brz]

Brezinski, C.: Introduction ` a la pratique du calcul num´erique. Dunod/Bordas, Paris, 1988. Citado en la(s) p´agina(s) 156, 158, 162

[Hig]

Higham, N.: Accuracy and Stability of Numerical Algorithms. SIAM, Philadelphia, 1996. Citado en la(s) p´agina(s) 143, 144, 146, 147, 158, 159, 160, 162

[MC1]

Mundo Cient´ıfico: El universo de los n´ umeros: Matem´ aticas para interpretar el mundo. Extra n´ um. 1, s.f.. Citado en la(s) p´agina(s) 154, 156

[S-S]

Sanz-Serna, J. M.: Diez lecciones de C´ alculo Num´erico. Universidad de Valladolid, 1998. Citado en la(s) p´agina(s) 157 Documentos en Internet

[Gold] Goldberg, D.: What Every Computer Scientist Should Know About Floating-Point Arithmetic. Computing Surveys, 1991. Citado en la(s) p´agina(s) 145, 159 http://docs.sun.com/source/806-3568/ncg goldberg.htm La referencia universal. [LIA-1] ISO/IEC: Information technology – language independent arithmetic. Part 1: Integer and floating point arithmetic, 1994. ISO/IEC 10967-1:1994(E). Citado en la(s) p´agina(s) 143, 158 ftp://crl.dec.com/pub/misc/lia-1-is.ps.Z. –—oOo—– [1] Gray, R.: Advanced Statistical Computing. Course Notes, 2002. Citado en la(s) p´agina(s) 156, 160 http://biowww.dfci.harvard.edu/~gray/248-02/report.pdf [2] IEEE-754 Floating-Point Conversion: From Decimal Floating-Point To 32-bit and 64-bit Hexadecimal Representations Along with Their Binary Equivalents (1998) Citado en la(s) p´agina(s) 143 http://babbage.cs.qc.edu/courses/cs341/IEEE-754.html [3] Moore, D.: Introduction to Computacional Science. CAAM 420, Lecture Notes, 2000. Citado en la(s) p´agina(s) 156 http://www.owlnet.rice.edu/˜caam420/lectures [4] UNFP: User Notes on Fortran Programming. (An open cooperative practical guide), 1998. Citado en la(s) p´agina(s) 156, 160, 162 http://www.ibiblio.org/pub/languages/fortran/ch4-6.html

163

1

Los axiomas originales de Peano. Reproducimos la primera p´agina de la versi´on publicada en “su” lat´ın por G. Peano en 1895 en la Rivista di matematica. N0 vale ‘ numero ’, et es nomen commune de 0,1,2, etc. 0 ’ ‘ zero ’. + ’ ‘ plus ’. Si a es numero, a+ indica ‘ numero sequente a ’ . Quæstione, si nos pote defini N0 , significa si nos pote scribe æqualitate de forma N0 = expressione composito per signos noto _ ^ − . . . ı, quod non es facile. Ergo nos sume tres idea N0 , 0, + ut idea primitivo, per que nos defini omni symbolo de Arithmetica. Nos determina valore de symbolo non definito N0 , 0, + per systema de propositio primitivo sequente. *

1. .0 .1 .2 .3 .4 .5

Pp N0 ε Cls 0 ε N0 a ε N0 .⊃. a+ ε N0 s ε Cls .0εs : aεs .⊃a . a+ εs :⊃. N0 ⊃ s a.bε N0 . a+ = b+ .⊃. a = b a ε N0 .⊃. a+ -= 0

Induct

Lege: .0

N0 es classe, vel ‘ numero ’ es nomen commune.

.1

Zero es numero.

.2

Si a es numero, tunc suo successivo es numero.

.3

N0 es classe minimo, que satisfac ad conditione . 0. 1. 2:

(Fin de p´ agina) En esencia, lo anterior puede parafrasearse as´ı: hay tres ‘ideas primitivas’, cero (0), n´ umero (N0 ) y sucesor o siguiente (+), m´as la noci´on de clase (Cls), que en Peano es casi sin´onimo de ‘propiedad’, y cinco ‘proposiciones primitivas’ (Pp), m´as una previa, que especifica que ‘N0 es una clase, aunque ‘ n´ umero ’ es un nombre com´ un.’ Los postulados vienen a decir que: — el cero es un n´ umero, — el sucesor (el siguiente) de un n´ umero es un n´ umero, — si el cero pertenece a una clase (= cumple una propiedad) tal que el sucesor de todo n´ umero que pertenece a la misma (= que cumple la propiedad) tambi´en pertenece (= la cumple), entonces todos los n´ umeros pertenecen a la clase (= cumplen la propiedad); o como ´el comenta, N0 es la m´ınima clase que satisface . 0, . 1, . 2., — dos n´ umeros s´olo pueden tener el mismo sucesor si son iguales, y — el cero no es sucesor de ning´ un n´ umero.

2 En el lenguaje conjuntista actual, se resumir´ıan en: Existe un conjunto N, una aplicaci´on sgt : N → N, y un elemento 0 ∈ N tales que sgt es inyectiva, 0∈ / sgt(N), y si S ⊆ N es tal que 0 ∈ S y sgt(S) ⊆ S, entonces S = N. Peano elabor´o sus axiomas en un momento (finales del siglo XIX) en el que la b´ usqueda de una fundamentaci´on s´olida para todas y cada una de las partes de las Matem´aticas se sent´ıa como una necesidad inaplazable. Diversas crisis de la intuici´on (la demostraci´on de Beltrami de que las geometr´ıas no eucl´ıdeas eran tan firmes como la eucl´ıdea, la creaci´on de la teor´ıa de conjuntos por Cantor) hicieron a los matem´aticos tremendamente desconfiados hacia lo que, hasta entonces, hab´ıa sido tenido por indudable. Esta desconfianza en la intuici´on llev´o a un reforzamiento del rigor y a una revisi´on de todo lo que se daba por evidente, intentando reducir ‘lo evidente’ a la m´ınima expresi´on. Esta actitud hipercr´ıtica se ha mantenido como base esencial de las Matem´aticas, aunque los propios matem´aticos sepan tom´arsela a broma. As´ı lo hace I. Stewart en Conceptos de matem´ atica moderna, (Alianza Editorial, Madrid, 1977), pp. 322 y ss.: ‘Se cuenta que un astr´onomo, un f´ısico y un matem´atico estaban de vacaciones en Escocia. Al echar una ojeada por la ventanilla del tren, vieron una oveja negra en medio de un campo. “¡Qu´e interesante!”, observ´o el astr´onomo, “todas las ovejas escocesas son negras!”. A lo que respondi´o el f´ısico, “¡No, no!¡Algunas ovejas escocesas son negras!” El matem´atico alz´o suplicante la mirada al cielo y enton´o, “En Escocia existe al menos un campo, que contiene al menos una oveja, uno de cuyos lados, al menos, es negro”. Los matem´aticos (cuando est´an en forma) tienden a la prudencia. Un teorema podr´ıa ser cierto. El matem´atico recuerda las muchas ocasiones en las que lo “obvio” result´o ser err´oneo, y se estremece. En una materia en donde se pueden construir 17-´agonos regulares, pero no 19-´agonos; donde a la esfera se la puede introducir en su propio interior; donde hay el mismo n´ umero de racionales que de enteros, ¿c´omo se le puede reprochar esa actitud? Y as´ı, el matem´atico decide suspender el juicio hasta que el teorema es demostrado. A˜ nadamos que no todos los matem´aticos despliegan tal prudencia, y algunos de los m´as grandes del mundo (vivos o muertos), mucho menos. Pero incluso aquellos que por lo general no son tan cautos se dan cuenta de cu´ando pisan terreno peligroso. Y debe notarse que hay un abismo entre suspender el juicio sobre un teorema e ignorarlo. Todo aquel que estudie matem´aticas debe estar dispuesto a decir “No me dejo enga˜ nar, aunque por el momento siga el enga˜ no, y vea ad´onde conduce”. A menudo es retrospectivamente como las dificultades son m´as f´aciles de comprender. Una persona que insista en comprender cada paso antes de pasar al siguienteest´a expuesta a ensimismarse tanto en sus pies que no se d´e cuenta de que est´a caminando en la direcci´on equivocada. Durante el primer recorrido est´a permitido ignorar las dificultades; de esta manera puede llegarse a un plan de ataque b´asico. Luego, si todo parece marchar bien, puede procederse a pulir los detalles. Pues bien, ha llegado el momento de pulir algunos detalles de nuestra labor anterior. Una oveja que por un lado es negra y por el otro blanca constituye una curiosidad notable; y la importancia de si una oveja dada es o no como parece al principio es poca. Pero los matem´aticos tienen una inquietante tendencia a apilar deducciones unas sobre otras, un poco como los desdichados castillos de naipes. Quitemos una de las cartas, y toda la estructura se desploma. Al comienzo del programa espacial americano, un cohete que cost´o varios millones de d´olares hizo explosi´on nada m´as separarse. Se hab´ıa omitido un punto y coma en la cinta que controlaba su sistema de direcci´on. Cuanto m´as compleja es una estructura, tanto m´as desastroso es el menor fallo. A finales de siglo [XIX], los matem´aticos comenzaron a tener dudas sobre los fundamentos de su ciencia. Est´a de moda hablar de organizaciones “piramidales”. Las ma-

3 tem´aticas se asemejan a una pir´ amide invertida. Casi todos sus resultados reposan, en u ´ltimo t´ermino, sobre un peque˜ no n´ umero de hip´otesis. Es una cuesti´on de prudencia elemental el echar una ojeada de cerca a esos supuestos, y hacer de ellos una base lo m´as s´olida posible.’ En este mismo libro hay un cap´ıtulo muy interesante dedicado a los sistemas axiom´aticos y su papel en las matem´aticas (cap. 8). M´as sobre el tema: http://www.unizar.es/analisis matematico/numyconj/axiomatica.html.