Carlos Ivorra Castillo


  ´           ´
ANALISIS MATEMATICO
Si una cantidad no negativa fuera tan peque˜a n
que resultara menor que cualquier otra dada, cier-
tamente no podr´ ser sino cero. A quienes pregun-
                  ıa
tan qu´ es una cantidad infinitamente peque˜a en
       e                                        n
matem´ticas, nosotros respondemos que es, de he-
       a
cho, cero. As´ pues, no hay tantos misterios ocultos
              ı
en este concepto como se suele creer. Esos supues-
tos misterios han convertido el c´lculo de lo infinita-
                                 a
mente peque˜o en algo sospechoso para mucha gente.
             n
Las dudas que puedan quedar las resolveremos por
completo en las p´ginas siguientes, donde explicare-
                   a
mos este c´lculo.
           a
                                  Leonhard Euler
´
Indice General

Introducci´n
          o                                                                                                             ix

Cap´
   ıtulo I: Topolog´ıa                                                                                                   1
  1.1 Espacios topol´gicos . . . . . .
                     o                     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .     1
  1.2 Bases y subbases . . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .     8
  1.3 Productos y subespacios . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    11
  1.4 Algunos conceptos topol´gicos .
                               o           .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    15
  1.5 Continuidad . . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    20
  1.6 L´ımites de funciones . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    34
  1.7 Convergencia de sucesiones . .       .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    43
  1.8 Sucesiones y series num´ricas .
                              e            .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .    48

Cap´
   ıtulo II: Compacidad, conexi´n y completitud
                                    o                                                                                  59
  2.1 Espacios compactos . . . . . . . . . . . . . . . . .                         .   .   .   .   .   .   .   .   .   59
  2.2 Espacios conexos . . . . . . . . . . . . . . . . . .                         .   .   .   .   .   .   .   .   .   67
  2.3 Espacios completos . . . . . . . . . . . . . . . . .                         .   .   .   .   .   .   .   .   .   79
  2.4 Espacios de Hilbert . . . . . . . . . . . . . . . . .                        .   .   .   .   .   .   .   .   .   83
  2.5 Aplicaciones a las series num´ricas . . . . . . . .
                                    e                                              .   .   .   .   .   .   .   .   .   86
  2.6 Espacios de funciones . . . . . . . . . . . . . . .                          .   .   .   .   .   .   .   .   .   92
  2.7 Ap´ndice: El teorema de Baire . . . . . . . . . .
          e                                                                        .   .   .   .   .   .   .   .   .   96

Cap´
   ıtulo III: C´lculo diferencial de una variable
               a                                                                                                       101
  3.1 Derivaci´n . . . . . . . . . . . . . . . . . . . . .
               o                                                               .   .   .   .   .   .   .   .   .   .   101
  3.2 C´lculo de derivadas . . . . . . . . . . . . . . .
        a                                                                      .   .   .   .   .   .   .   .   .   .   104
  3.3 Propiedades de las funciones derivables . . . . .                        .   .   .   .   .   .   .   .   .   .   108
  3.4 La diferencial de una funci´n . . . . . . . . . .
                                  o                                            .   .   .   .   .   .   .   .   .   .   115
  3.5 El teorema de Taylor . . . . . . . . . . . . . . .                       .   .   .   .   .   .   .   .   .   .   118
  3.6 Series de potencias . . . . . . . . . . . . . . . .                      .   .   .   .   .   .   .   .   .   .   123
  3.7 La funci´n exponencial . . . . . . . . . . . . . .
               o                                                               .   .   .   .   .   .   .   .   .   .   127
  3.8 Las funciones trigonom´tricas . . . . . . . . . .
                              e                                                .   .   .   .   .   .   .   .   .   .   133
  3.9 Primitivas . . . . . . . . . . . . . . . . . . . . .                     .   .   .   .   .   .   .   .   .   .   144
  3.10 Ap´ndice: La trascendencia de e y π . . . . . .
          e                                                                    .   .   .   .   .   .   .   .   .   .   148

                                       v
vi                                                                                 ´
                                                                                   INDICE GENERAL

Cap´
   ıtulo IV: C´lculo diferencial de varias variables
              a                                                                157
  4.1 Diferenciaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
                  o
  4.2 Propiedades de las funciones diferenciables . . . . . . . . . . . . . 164
  4.3 Curvas parametrizables . . . . . . . . . . . . . . . . . . . . . . . 175

Cap´
   ıtulo V: Introducci´n a las variedades diferenciables
                        o                                                                                              195
  5.1 Variedades . . . . . . . . . . . . . . . . . . . . . . . . . .                               .   .   .   .   .   196
  5.2 Espacios tangentes, diferenciales . . . . . . . . . . . . .                                  .   .   .   .   .   203
  5.3 La m´trica de una variedad . . . . . . . . . . . . . . . .
           e                                                                                       .   .   .   .   .   210
  5.4 Geod´sicas . . . . . . . . . . . . . . . . . . . . . . . . .
            e                                                                                      .   .   .   .   .   215
  5.5 Superficies . . . . . . . . . . . . . . . . . . . . . . . . . .                               .   .   .   .   .   220
  5.6 La curvatura de Gauss . . . . . . . . . . . . . . . . . . .                                  .   .   .   .   .   223

Cap´
   ıtulo VI: Ecuaciones diferenciales ordinarias                           231
  6.1 La integral de Riemann . . . . . . . . . . . . . . . . . . . . . . . 232
  6.2 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . 238
  6.3 Ecuaciones diferenciales de orden superior . . . . . . . . . . . . . 246

Cap´
   ıtulo VII: Teor´ de la medida
                   ıa                                                                                                  253
  7.1 Medidas positivas . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   254
  7.2 Funciones medibles . . . . . . .     .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   258
  7.3 La integral de Lebesgue . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   261
  7.4 El teorema de Riesz . . . . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   270
  7.5 La medida de Lebesgue . . . .        .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   278

Cap´
   ıtulo VIII: Teor´ de la medida II
                    ıa                                                                                                 287
  8.1 Producto de medidas . . . . . . . .          .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   287
  8.2 Espacios Lp . . . . . . . . . . . . .        .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   295
  8.3 Medidas signadas . . . . . . . . . .         .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   299
  8.4 Derivaci´n de medidas . . . . . . .
              o                                    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   309
  8.5 El teorema de cambio de variable .           .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   313

Cap´
   ıtulo IX: Formas diferenciales                                                                                      321
  9.1 Integraci´n en variedades . . . . . . .
               o                                           .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   321
  9.2 El ´lgebra exterior . . . . . . . . . . .
          a                                                .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   330
  9.3 El ´lgebra de Grassmann . . . . . . .
          a                                                .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   337
  9.4 Algunos conceptos del c´lculo vectorial
                              a                            .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   348

Cap´
   ıtulo X: El teorema de Stokes                                                                                       359
  10.1 Variedades con frontera . . . . . . . . .               .   .   .   .   .   .   .   .   .   .   .   .   .   .   359
  10.2 La diferencial exterior . . . . . . . . . .             .   .   .   .   .   .   .   .   .   .   .   .   .   .   365
  10.3 El teorema de Stokes . . . . . . . . . . .              .   .   .   .   .   .   .   .   .   .   .   .   .   .   369
  10.4 Aplicaciones del teorema de Stokes . . .                .   .   .   .   .   .   .   .   .   .   .   .   .   .   376
  10.5 Las f´rmulas de Green . . . . . . . . . .
            o                                                  .   .   .   .   .   .   .   .   .   .   .   .   .   .   387
  10.6 El teorema de Stokes con singularidades                 .   .   .   .   .   .   .   .   .   .   .   .   .   .   390
  10.7 Ap´ndice: Algunas f´rmulas vectoriales
          e                 o                                  .   .   .   .   .   .   .   .   .   .   .   .   .   .   395
´
INDICE GENERAL                                                                                                    vii

Cap´
   ıtulo XI: Cohomolog´ de De Rham
                           ıa                                                                                    399
  11.1 Grupos de cohomolog´ . . . . . . .
                              ıa                 .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   399
  11.2 Homotop´ . . . . . . . . . . . . . .
                ıas                              .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   402
  11.3 Sucesiones exactas . . . . . . . . . .    .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   408
  11.4 Aplicaciones al c´lculo vectorial . . .
                        a                        .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   .   415

Cap´
   ıtulo XII: Funciones Harm´nicas
                                 o                                                                               419
  12.1 El problema de Dirichlet sobre una     bola       .   .   .   .   .   .   .   .   .   .   .   .   .   .   420
  12.2 Funciones holomorfas . . . . . . . .   . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   423
  12.3 Funciones subharm´nicas . . . . .
                         o                    . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   438
  12.4 El problema de Dirichlet . . . . . .   . . .      .   .   .   .   .   .   .   .   .   .   .   .   .   .   441

Cap´
   ıtulo XIII: Aplicaciones al electromagnetismo                                                                 447
  13.1 Electrost´tica . . . . . . . . . . . . . . . . . . . .
                a                                                            .   .   .   .   .   .   .   .   .   447
  13.2 Magnetost´tica . . . . . . . . . . . . . . . . . . .
                  a                                                          .   .   .   .   .   .   .   .   .   450
  13.3 Las ecuaciones de Maxwell . . . . . . . . . . . . .                   .   .   .   .   .   .   .   .   .   455
  13.4 La ecuaci´n de ondas . . . . . . . . . . . . . . . .
                o                                                            .   .   .   .   .   .   .   .   .   461
  13.5 Soluciones de las ecuaciones de Maxwell . . . . .                     .   .   .   .   .   .   .   .   .   470

Bibliograf´
          ıa                                                                                                     477
´
Indice de Materias                                                                                               478
Introducci´n
          o

     En el siglo XVII Newton y Leibniz descubren independientemente el an´lisisa
matem´tico o c´lculo infinitesimal, una potent´
         a         a                            ısima herramienta que revolucion´   o
el tratamiento matem´tico de la f´
                        a          ısica y la geometr´ y que m´s tarde impreg-
                                                      ıa,         a
nar´ las m´s diversas ramas de la matem´tica, como la estad´
     ıa        a                             a                    ıstica o la teor´ıa
de n´meros.
      u
     Esencialmente, el c´lculo infinitesimal consist´ por una parte en analizar
                          a                         ıa
o descomponer la dependencia entre varias magnitudes estudiando el compor-
tamiento de unas al variar o diferenciar levemente otras (lo que constitu´ el   ıa
c´lculo diferencial) y por otra parte en integrar los resultados diferenciales para
  a
obtener de nuevo resultados globales sobre las magnitudes en consideraci´n (elo
llamado c´lculo integral).
             a
     Es dif´ que un lector que no tenga ya algunas nociones de c´lculo pueda
            ıcil                                                       a
entender cabalmente el p´rrafo anterior, pero las nuevas ideas eran a´n m´s
                             a                                              u      a
dif´ıciles de entender de la pluma de sus descubridores. El primer libro de texto
que se public´ con el fin de explicarlas sistem´ticamente fue el “An´lisis” del
                 o                                a                      a
marqu´s de l’Hˆpital. Veamos algunos pasajes:
         e         o
      La parte infinitamente peque˜a en que una cantidad variable es au-
                                 n
      mentada o disminuida de manera continua, se llama la diferencial
      de esta cantidad.
    Siguiendo la notaci´n leibniziana, L’Hˆpital explica que la letra d se usa para
                       o                  o
representar uno de estos incrementos infinitamente peque˜os de una magnitud,
                                                           n
de modo que dx representa un incremento diferencial de la variable x, etc.
    En ning´n momento se precisa qu´ debemos entender por un aumento infi-
            u                          e
nitamente peque˜o de una cantidad, pero en compensaci´n se presentan varias
                 n                                         o
reglas para tratar con diferenciales. Por ejemplo:
      Post´lese que dos cantidades cuya diferencia es una cantidad infini-
          u
      tamente peque˜a pueden intercambiarse una por la otra; o bien (lo
                    n
      que es lo mismo) que una cantidad que est´ incrementada o dismi-
                                                 a
      nuida solamente en una cantidad infinitamente menor, puede consi-
      derarse que permanece constante.
   As´ por ejemplo, si analizamos el incremento infinitesimal que experimenta
     ı,
un producto xy cuando incrementamos sus factores, obtenemos
      d(xy) = (x + dx)(y + dy) − xy = x dy + y dx + dxdy = x dy + y dx,

                                         ix
x                                                                   Introducci´n
                                                                              o

donde hemos despreciado el infinit´simo doble dxdy porque es infinitamente
                                     e
menor que los infinit´simos simples x dy e y dx.
                     e
   Es f´cil imaginar que estos razonamientos infinitesimales despertaron sospe-
       a
chas y pol´micas. Baste citar el t´
          e                       ıtulo del panfleto que en 1734 public´ el obispo
                                                                      o
de Berkeley:

     El analista, o discurso dirigido a un matem´tico infiel, donde se
                                                     a
     examina si los objetos, principios e inferencias del an´lisis moderno
                                                            a
     est´n formulados de manera m´s clara, o deducidos de manera m´s
        a                            a                                  a
     evidente, que los misterios religiosos y los asuntos de la fe.

   En esta fecha el c´lculo infinitesimal ten´ ya m´s de medio siglo de historia.
                     a                      ıa     a
La raz´n por la que sobrevivi´ inmune a estas cr´
      o                        o                  ıticas y a la vaguedad de sus
fundamentos es que muchos de sus razonamientos infinitesimales terminaban en
afirmaciones que no involucraban infinit´simos en absoluto, y que eran confir-
                                          e
mados por la f´
              ısica y la geometr´ Por ejemplo, consideremos la circunferencia
                                 ıa.
formada por los puntos que satisfacen la ecuaci´n
                                               o

                                  x2 + y 2 = 25.

    Aplicando la regla del producto que hemos “demostrado” antes al caso en que
los dos factores son iguales obtenemos que dx2 = 2x dx e igualmente ser´ dy 2 =
                                                                         a
2y dy. Por otra parte, d25 = 0, pues al incrementar la variable x la constante
25 no se ve incrementada en absoluto. Si a esto a˜adimos que la diferencial de
                                                  n
una suma es la suma de las diferenciales resulta la ecuaci´n diferencial
                                                          o

                               2x dx + 2y dy = 0,

de donde a su vez
                                   dy   x
                                      =− .
                                   dx   y
    Esto significa que si tomamos, por ejemplo, el punto (3, 4) de la circun-
ferencia e incrementamos infinitesimalmente su coordenada x, la coordenada y
disminuir´ en 3/4 dx. Notemos que esto es falso para cualquier incremento finito
          a
de la variable x, por peque˜o que sea, pues si valiera para incrementos suficien-
                            n
temente peque˜os resultar´ que la circunferencia contendr´ un segmento de la
                 n         ıa                                ıa
recta
                                           3
                               y − 4 = − (x − 3),
                                           4
lo cual no es el caso. Vemos que ´sta se comporta igual que la circunferencia para
                                 e
variaciones infinitesimales de sus variables alrededor del punto (3, 4), aunque
difiere de ella para cualquier variaci´n finita. La interpretaci´n geom´trica es
                                       o                         o       e
que se trata de la recta tangente a la circunferencia por el punto (3, 4).
    El argumento ser´ nebuloso y discutible, pero lo aplastante del caso es que
                       a
nos proporciona un m´todo sencillo para calcular la tangente a una circunferen-
                        e
cia por uno cualquiera de sus puntos. De hecho el m´todo se aplica a cualquier
                                                      e
curva que pueda expresarse mediante una f´rmula algebraica razonable, lo que
                                             o
xi

supera con creces a las t´cnicas con las que contaba la geometr´ anal´
                         e                                     ıa    ıtica antes
del c´lculo infinitesimal.
     a
    A lo largo del siglo XIX la matem´tica emprendi´ un proceso de funda-
                                         a               o
mentaci´n que termin´ con una teor´ formal donde todos los conceptos est´n
         o             o              ıa                                      a
perfectamente definidos a partir de unos conceptos b´sicos, los cuales a su vez
                                                       a
est´n completamente gobernados por unos axiomas precisos. Las ambig¨edades
   a                                                                    u
del c´lculo infinitesimal fueron el motor principal de este proceso. En los a˜os
     a                                                                       n
sesenta del siglo XX se descubri´ que una delicada teor´ l´gica, conocida como
                                 o                       ıa o
an´lisis no est´ndar permite definir rigurosamente cantidades infinitesimales
   a             a
con las que fundamentar el c´lculo a la manera de Leibniz y L’Hˆpital, pero no
                              a                                   o
es ´se el camino habitual ni el que nosotros vamos a seguir. Lo normal es erra-
   e
dicar los infinit´simos de la teor´ pero no as´ el formalismo infinitesimal. En
                 e                ıa,           ı
ocasiones los s´ımbolos dy, dx aparecen en ciertas definiciones “en bloque”, sin
que se les pueda atribuir un significado independiente, como cuando se define
la derivada de una funci´n y = y(x) mediante
                         o
                         dy       y(x + ∆x) − y(x)
                            = l´
                               ım                  .
                         dx ∆x→0        ∆x
   De este modo, el cociente de diferenciales tiene el mismo significado que
para Leibniz, en el sentido de que al calcularlo obtenemos el mismo n´mero o
                                                                      u
la misma funci´n que ´l obten´ pero con la diferencia de que ya no se trata de
              o       e        ıa,
un cociente de diferenciales, no es un cociente de nada. La definici´n anterior
                                                                   o
nos permite hablar de dy/dx, pero no de dy o de dx.
   No obstante se puede ir m´s lejos y dar una definici´n adecuada de dx y dy
                              a                        o
de modo que se pueda probar la equivalencia
                       dy
                          = f (x)   ⇐⇒      dy = f (x) dx.
                       dx
    Es algo parecido al paso de una relaci´n algebraica como xy 2 = x + 4y 3 ,
                                            o
donde x e y son, digamos, n´meros reales indeterminados, a la misma expresi´n
                             u                                                o
entendida como una igualdad de polinomios, donde ahora x e y son indetermina-
das en un sentido matem´tico muy preciso. Por ejemplo, seg´n una definici´n
                           a                                   u              o
habitual del anillo de polinomios R[x, y], la indeterminada x es la aplicaci´no
de los pares de n´meros naturales en R dada por x(1, 0) = 1 y x(i, j) = 0
                   u
para cualquier otro par, es decir, algo que en nada recuerda a “un n´mero real
                                                                     u
indeterminado”.
    Al introducir las formas diferenciales muchos libros modernos insisten en
recalcar que los objetos como dx son “puramente formales” —como las indeter-
minadas en un anillo de polinomios—, que no tienen un singificado intr´    ınseco,
sino que simplemente son objetos dise˜ados para que se comporten seg´n ciertas
                                       n                              u
reglas que se adaptan a las propiedades de las derivadas e integrales. Llegan
incluso a perdir disculpas por lo excesivamente vac´ y abstracta que resulta la
                                                    ıa
teor´ en torno a ellos. Explican que, pese a ello, merece la pena el esfuerzo de
    ıa
familiarizarse con ella porque al final se ve su gran (y sorprendente) utilidad.
    En este libro insistiremos en todo momento en que las diferenciales tienen
un significado intr´ınseco muy concreto e intuitivo, y trataremos de evidenciarlo
xii                                                                          Introducci´n
                                                                                       o

desde el primer momento, de modo que —sin desmerecer la profundidad de la
teor´ıa— su utilidad y buen comportamiento no resulta sorprendente en absoluto.
Su interpretaci´n no ser´, naturalmente la de incrementos infinitesimales, sino
                o          a
la de aproximaciones lineales, aceptables —al menos— en los alrededores de los
puntos. Esta interpretaci´n los mantiene en todo momento muy cerca de los
                             o
hipot´ticos infinit´simos en los que est´n inspirados.
       e           e                     a
    Muchos libros de f´ ısica contin´an trabajando con razonamientos infinitesi-
                                    u
males al estilo antiguo, los cuales les permiten llegar r´pidamente y con fluidez
                                                         a
a resultados importantes a cambio de sacrificar el rigor l´gico. Aqu´ adopta-
                                                             o         ı
remos una posici´n intermedia entre los dos extremos: seremos rigurosos, pero
                  o
no formalistas, daremos pruebas sin saltos l´gicos, pero llegaremos a resultados
                                              o
enunciados de tal modo que resulten “transparentes” en la pr´ctica, emulando
                                                                 a
as´ la fluidez de los razonamientos infinitesimales.
  ı
    Hay un caso en que los razonamientos infinitesimales est´n plenamente jus-
                                                               a
tificados, y es cuando se trata de motivar una definici´n. Por ejemplo, a partir
                                                         o
de la ley de gravitaci´n de Newton para dos masas puntuales puede “deducirse”
                      o
que el campo gravitatorio generado por una distribuci´n continua de masa con-
                                                         o
tenida en un volumen V con densidad ρ viene dado por
                                    Z
                                          ρ(y)
                        E(x) = −G                (x − y) dy.
                                      V kx − yk3
    La deducci´n no puede considerarse una demostraci´n matem´tica, pues
               o                                           o        a
la f´rmula anterior tiene el status l´gico de una definici´n, luego es un sin-
    o                                o                      o
sentido tratar de demostrarla. En todo caso se podr´ complicar la definici´n
                                                      ıa                    o
sustituy´ndola por otra que mostrara claramente su conexi´n con las masas
        e                                                     o
puntuales y despu´s probar que tal definici´n es equivalente a la anterior. La
                    e                       o
prueba se basar´ en la posibilidad de aproximar integrales por sumas finitas
                 ıa
y con toda seguridad ser´ bastante prolija. Esta opci´n ser´ absurda tanto
                          ıa                             o     ıa
desde el punto de vista formal (¿para qu´ sustituir una definici´n sencilla por
                                          e                       o
otra complicada?) como desde el punto de vista f´   ısico (¿para qu´ entrar en
                                                                    e
disquisiciones ≤–δ que acabar´n donde todos sabemos que tienen que acabar?).
                              a
En cambio, un argumento en t´rminos de infinit´simos convence a cualquiera
                                 e                e
de que esta definici´n es justamente la que tiene que ser.1
                     o
    Del mismo modo podemos convencernos de que el potencial gravitatorio
determinado por una distribuci´n de masa ρ debe ser
                                o
                                       Z
                                            ρ(y)
                           V (x) = −G             dy.
                                        V kx − yk
    Ahora bien, de aceptar ambos hechos tendr´ıamos como consecuencia la re-
laci´n E = −∇V , pues el potencial de un campo de fuerzas es por definici´n
    o                                                                       o
la funci´n que cumple esto. Sin embargo esto ya no es una definici´n, sino una
        o                                                         o
afirmaci´n sobre dos funciones que podr´ ser falsa en principio y que, por con-
         o                             ıa
siguiente, requiere una demostraci´n. Muchos libros de f´
                                  o                     ısica dan por sentado
      1A
       cualquiera menos a un formalista puro, quien no le encontrar´ sentido, pero es que,
                                                                      a
como alguien dijo, “un formalista es alguien incapaz de entender algo a menos que carezca de
significado.”
xiii

este hecho, incurriendo as´ en una laguna l´gica que nosotros cubriremos. As´
                            ı                o                              ı
pues, cuando el lector encuentre en las p´ginas que siguen un razonamiento en
                                           a
t´rminos de diferenciales deber´ observar que o bien desemboca en una defi-
 e                                a
nici´n o bien est´ completamente avalado por teoremas previos que justifican
    o             a
las manipulaciones de diferenciales.
    Este libro ha sido escrito siguiendo cuatro gu´ principales:
                                                  ıas
   • Presentar los resultados m´s importantes del an´lisis matem´tico real.
                                  a                       a            a
     Concretamente abordamos el c´lculo diferencial e integral de una y va-
                                      a
     rias variables reales, las ecuaciones diferenciales ordinarias y, aunque no
     hay ning´n cap´
               u      ıtulo dedicado espec´ıficamente a ellas, estudiamos varias
     ecuaciones en derivadas parciales: la ecuaci´n de Lagrange, la de Poisson,
                                                  o
     la ecuaci´n de ondas y las ecuaciones de Maxwell. Tambi´n planteamos
              o                                                    e
     la ecuaci´n del calor, si bien no entramos en su estudio. Aunque, como
              o
     ya hemos dicho, nos centramos en el an´lisis real, estudiamos las series
                                                a
     de potencias complejas, introduciendo en particular la exponencial y las
     funciones trigonom´tricas complejas, y a partir de la teor´ de funciones
                          e                                       ıa
     harm´nicas y el teorema de Stokes demostramos algunos de los resultados
           o
     fundamentales sobre las funciones holomorfas (esencialmente el teorema
     de los residuos).
   • Justificar todas las definiciones, sin caer en la falacia formalista de que
     la l´gica nos da derecho a definir lo que queramos como queramos sin
         o
     tener que dar explicaciones. Pensemos, por ejemplo, en la definici´n de
                                                                          o
     a
     ´rea de una superficie. Muchos libros se limitan a definirla mediante una
     f´rmula en t´rminos de expresiones coordenadas, sin m´s justificaci´n que
      o          e                                           a           o
     la demostraci´n de su consistencia (de que no depende del sistema de
                   o
     coordenadas elegido). Otros aceptan como “motivaci´n” el teorema de
                                                             o
     cambio de variables, considerando que es natural tomar como definici´n   o
     de cambio de variables entre un abierto de Rn y un abierto en una variedad
     lo que entre dos abiertos de Rn es un teorema nada trivial. No podemos
     resumir nuestro enfoque en pocas l´  ıneas, pero invitamos al lector a que
     preste atenci´n a la justificaci´n de ´ste y muchos otros conceptos.
                  o                 o     e
   • Mostrar la fundamentaci´n del c´lculo infinitesimal cl´sico, en lugar de
                               o         a                    a
     sustituirlo por otro c´lculo moderno mucho m´s r´
                           a                          a ıgido y abstracto. Por
     ejemplo, a la hora de desarrollar una teor´ de integraci´n potente es
                                                   ıa              o
     imprescindible introducir la teor´ de la medida abstracta y sus resultados
                                       ıa
     m´s importantes. A ello dedicamos los cap´
       a                                            ıtulos VII y VIII, pero tras
     ello, en el cap´
                    ıtulo siguiente, envolvemos toda esta teor´ abstracta en
                                                                 ıa
     otra mucho m´s el´stica y natural, la teor´ de formas diferenciales, que
                    a a                          ıa
     requiere a la anterior como fundamento, pero que termina por ocultarla,
     de modo que a partir de cierto punto es muy rara la ocasi´n en que se
                                                                    o
     hace necesario trabajar expl´ıcitamente con las medidas y sus propiedades.
   • Mostrar la aplicaci´n y la utilidad de los resultados te´ricos que presen-
                        o                                    o
     tamos. Las primeras aplicaciones tienen que ver con la geometr´ pero
                                                                        ıa,
     paulatinamente van siendo desplazadas por aplicaciones a la f´   ısica. En
xiv                                                                   Introducci´n
                                                                                o

      la medida de lo posible hemos evitado presentar las aplicaciones como
      animales enjaulados en un zool´gico, es decir, desvinculadas de sus con-
                                         o
      textos naturales, de manera que den m´s la impresi´n de an´cdotas que
                                                a            o        e
      de verdaderos ´xitos del c´lculo infinitesimal. En el caso de la f´
                        e          a                                     ısica va-
      mos introduciendo los conceptos fundamentales (velocidad, aceleraci´n,    o
      fuerza, energ´ etc.) seg´n van siendo necesarios, de modo que de estas
                      ıa,        u
      p´ginas podr´ extraerse una sucinta introducci´n a la f´
        a             ıa                                o        ısica. En lo to-
      cante a la geometr´ por los motivos explicados en el segundo punto nos
                           ıa,
      hemos restringido a trabajar con subvariedades de Rn , es decir, hemos evi-
      tado la definici´n abstracta de variedad para tener as´ una interpretaci´n
                        o                                     ı                  o
      natural de los espacios tangentes y su relaci´n con la variedad. En algu-
                                                     o
      nos ejemplos concretos necesitamos que el lector est´ familiarizado con la
                                                            e
      geometr´ proyectiva, la teor´ de las secciones c´nicas y otros puntos de
                ıa                   ıa                 o
      la geometr´ pre-diferencial. Los hemos marcado con un asterisco. Nin-
                   ıa
      guno de estos ejemplos es necesario para seguir el resto del libro. Uno de
      ellos, el del plano proyectivo, lo usamos de forma no rigurosa para ilustrar
      la necesidad de una definici´n m´s general de variedad, mostrando que
                                     o     a
      muchos de los conceptos que definimos para una subvariedad de R3 son
      aplicables formalmente al caso del plano proyectivo, si bien la teor´ de
                                                                             ıa
      que disponemos no nos permite justificar esta aplicaci´n. o
    De los puntos anteriores no debe leerse entre l´ ıneas una cierta aversi´n hacia
                                                                            o
el an´lisis abstracto. Al contrario, creemos que este libro puede ser continuado
      a
de forma natural en muchas direcciones: la teor´ espectral, la teor´ de distri-
                                                    ıa                  ıa
buciones, el an´lisis de Fourier, el c´lculo variacional, la teor´ de funciones de
                a                      a                          ıa
variable compleja, la geometr´ diferencial y la topolog´ general.
                               ıa                           ıa
    Por citar algunos ejemplos, nosotros probamos que el problema de Dirichlet
tiene soluci´n en una familia muy amplia de abiertos para unas condiciones de
             o
frontera dadas, pero la resoluci´n expl´
                                  o        ıcita en casos concretos requiere de la
transformada de Fourier, que en general se aplica a muchas otras ecuaciones
en derivadas parciales. Por otra parte, la transformada de Fourier permite des-
componer una onda en su espectro continuo de frecuencias. Cuando se estudia
la soluci´n de la ecuaci´n de ondas en abiertos distintos de todo R3 aparecen
         o                o
las ondas estacionarias, que llevan al an´lisis espectral y, en casos particulares,
                                           a
a la teor´ de series de Fourier o de las funciones de Bessel entre otras. Los
          ıa
problemas de gravitaci´n o electromagnetismo que involucran masas y cargas
                         o
puntuales o corrientes el´ctricas unidimensionales pueden unificarse con los pro-
                          e
blemas que suponen distribuciones continuas de masas, cargas y corrientes a
trav´s de la teor´ de distribuciones.
     e            ıa
    Tampoco nos gustar´ que las comparaciones que hemos hecho con otros
                           ıa
libros se interpreten a modo de cr´ıtica. Tan s´lo queremos hacer hincapi´ en que
                                                o                           e
nuestros objetivos son distintos a los de muchos otros libros. Somos conscientes
de que nuestro prop´sito de justificar las definiciones m´s all´ de una motivaci´n
                     o                                     a   a                 o
m´s o menos dudosa nos ha llevado a seguir caminos mucho m´s profundos y
  a                                                                  a
laboriosos que los habituales, por lo que, a pesar de su car´cter autocontenido
                                                               a
en lo tocante a topolog´ y an´lisis, es muy dif´ que este libro sea de utilidad
                         ıa     a                 ıcil
a un lector que no cuente ya con una cierta familiaridad con la materia. Por ello
xv

es obvio que un libro cuya finalidad principal sea did´ctica, o bien que quiera
                                                       a
profundizar m´s que nosotros en f´
               a                  ısica o geometr´ diferencial, deber´ pasar por
                                                 ıa                   a
alto muchas sutilezas en las que nosotros nos hemos detenido.
    Comentamos, para terminar, que al lector se le supone unicamente unos cier-
                                                           ´
tos conocimientos de ´lgebra, especialmente de ´lgebra lineal, y algunas nociones
                     a                         a
elementales de geometr´ (salvo para los ejemplos marcados con un asterisco).
                        ıa
Espor´dicamente ser´n necesarios conocimientos m´s profundos, como para la
       a             a                               a
prueba de la trascendencia de e y π, sobre todo en la de π, o al estudiar el
concepto de orientaci´n, donde para interpretar el signo del determinante de
                      o
una biyecci´n af´ usamos que el grupo especial lineal de Rn est´ generado por
           o     ın                                                a
las transvecciones. Ninguno de estos hechos se necesita despu´s.e
Cap´
   ıtulo I

Topolog´
       ıa

     La topolog´ puede considerarse como la forma m´s abstracta de la geo-
                ıa                                       a
metr´ ıa. El concepto principal que puede definirse a partir de la estructura
topol´gica es el de aplicaci´n continua, que viene a ser una transformaci´n rea-
       o                    o                                            o
lizada sin cortes o saltos bruscos o, dicho de otro modo, que transforma puntos
pr´ximos en puntos pr´ximos. Los resultados topol´gicos son aplicables tanto a
   o                    o                            o
la geometr´ propiamente dicha como a la descripci´n de otros muchos objetos
             ıa                                       o
m´s cercanos a la teor´ de conjuntos general, si bien aqu´ nos centraremos en
   a                    ıa                                  ı
la vertiente geom´trica. Al combinarla con el ´lgebra obtendremos el c´lculo
                   e                              a                       a
diferencial, que constituye la herramienta m´s potente para el estudio de la
                                                a
geometr´ ıa.


1.1     Espacios topol´gicos
                      o
    Seg´n acabamos de comentar, una aplicaci´n continua es una aplicaci´n que
        u                                     o                         o
transforma puntos pr´ximos en puntos pr´ximos. Nuestro objetivo ahora es
                      o                    o
definir una estructura matem´tica en la que esta afirmaci´n pueda convertirse
                              a                           o
en una definici´n rigurosa. En primer lugar conviene reformularla as´ una apli-
              o                                                     ı:
caci´n continua es una aplicaci´n que transforma los puntos de alrededor de un
    o                          o
punto dado en puntos de alrededor de su imagen. En efecto, si cortamos una cir-
cunferencia por un punto P para convertirla en un segmento, la transformaci´no
no es continua, pues los puntos de alrededor de P se transforman unos en los
puntos de un extremo del segmento y otros en los puntos del otro extremo, luego
no quedan todos alrededor del mismo punto. En cambio, podemos transformar
continuamente (aunque no biyectivamente) una circunferencia en un segmento
sin m´s que aplastarla.
      a




                                       1
2                                                          Cap´
                                                              ıtulo 1. Topolog´
                                                                              ıa

    Una forma de dar rigor al concepto de “puntos de alrededor” de un punto
dado es a trav´s de una distancia. Veremos que no es lo suficientemente general,
               e
pero s´ muy representativa. La formalizaci´n algebraica de la geometr´ eucl´
       ı                                    o                           ıa     ıdea
se lleva a cabo a trav´s de Rn . Su estructura vectorial permite definir los puntos,
                      e
rectas, planos, etc. y a ´sta hay que a˜adirle la estructura m´trica derivada del
                         e              n                       e
producto escalar:
                                         Xn
                                   xy =     xi yi .
                                          i=1
    A partir de ´l se definen los dos conceptos fundamentales de la geometr´
                e                                                            ıa
m´trica: la longitud de un vector y el ´ngulo entre dos vectores. En efecto, la
  e                                    a
longitud de un vector es la norma
                                          v
                                          u n
                                  √       uX
                            kxk = xx = t        x2 ,
                                                 i
                                                   i=1

y el ´ngulo α que forman dos vectores no nulos x, y viene dado por
     a
                                         xy
                              cos α =         .
                                      kxk kyk
    Estas estructuras son demasiado particulares y restrictivas desde el punto
de vista topol´gico. La medida de ´ngulos es un sinsentido en topolog´ y la de
              o                   a                                  ıa,
longitudes tiene un inter´s secundario, pues no importan las medidas concretas
                         e
sino tan s´lo la noci´n de proximidad. En primer lugar generalizaremos el
           o          o
concepto de producto escalar para admitir como tal a cualquier aplicaci´n que
                                                                         o
cumpla unas m´  ınimas propiedades:
Definici´n 1.1 Usaremos la letra K para referirnos indistintamente al cuerpo
          o
R de los n´meros reales o al cuerpo C de los n´meros complejos. Si α ∈ K,
            u                                  u
la notaci´n α representar´ al conjugado de α si K = C o simplemente α = α
          o ¯            a                                           ¯
si K = R. Si H es un K-espacio vectorial, un producto escalar en H es una
aplicaci´n · : H × H −→ K que cumple las propiedades siguientes:
        o
    a) x · y = y · x,
    b) (x + y) · z = x · z + y · z,
    c) (αx) · y = α(x · y),
    d) x · x ≥ 0 y x · x = 0 si y s´lo si x = 0,
                                   o
       para todo x, y, z ∈ H y todo α ∈ K.
     Notar que a) y b) implican tambi´n la propiedad distributiva por la derecha:
                                     e
x · (y + z) = x · y + x · z.
    Un espacio prehilbertiano es un par (H, ·), donde H es un K-espacio vectorial
y · es un producto escalar en H. En la pr´ctica escribiremos simplemente H en
                                          a
lugar de (H, ·).
    Si H es un espacio prehilbertiano, definimos su norma asociada como la
                                         √
aplicaci´n k k : H −→ R dada por kxk = x · x.
        o
1.1. Espacios topol´gicos
                   o                                                           3

Ejemplo Un producto escalar en el espacio Kn viene dado por

                       x · y = x1 y1 + · · · + xn yn .
                                   ¯              ¯
                      p
   De este modo, kxk = |x1 |2 + · · · + |xn |2 .

Teorema 1.2 Sea H un espacio prehilbertiano y sean x, y ∈ H. Entonces

  a) (desigualdad de Schwarz) |x · y| ≤ kxk kyk.

  b) (desigualdad triangular) kx + yk ≤ kxk + kyk.

   Demostracion: a) Sean A = kxk2 , B = |x · y| y C = kyk2 . Existe un
               ´
n´mero complejo α tal que |α| = 1 y α(y · x) = B. Para todo n´mero real r se
 u                                                           u
cumple

       0 ≤ (x − rαy) · (x − rαy) = x · x − rα(y · x) − rα(x · y) + r2 y · y.
                                                        ¯

                          ¯
    Notar que α(x · y) = B = B, luego A − 2Br + Cr2 ≥ 0. Si C = 0 ha de
              ¯
ser B = 0, o de lo contrario la desigualdad ser´ falsa para r grande. Si C > 0
                                               ıa
tomamos r = B/C y obtenemos B 2 ≤ AC.
   b) Por el apartado anterior:

          kx + yk2    = (x + y) · (x + y) = x · x + x · y + y · x + y · y
                      ≤ kxk2 + 2kxk kyk + kyk2 = (kxk + kyk)2 .

Notar que x · y + y · x es un n´mero real, luego
                               u

                  x · y + y · x ≤ |x · y + y · x| ≤ |x · y| + |y · x|.



    La norma permite definir una distancia entre puntos con la que formalizar
el concepto de proximidad que nos interesa, pero para ello no es necesario que
la norma provenga de un producto escalar. Conviene aislar las propiedades de
la norma que realmente nos hacen falta para admitir como tales a otras muchas
aplicaciones:

Definici´n 1.3 Si E es un espacio vectorial sobre K, una norma en E es una
          o
aplicaci´n k k : E −→ [0, +∞[ que cumpla las propiedades siguientes:
        o

  a) kvk = 0 si y s´lo si v = 0.
                   o

  b) kv + wk ≤ kvk + kwk.

  c) kα vk = |α| kvk,

para v, w ∈ E y todo α ∈ K.
4                                                       Cap´
                                                           ıtulo 1. Topolog´
                                                                           ıa

    Un espacio normado es un par (E, k k) en estas condiciones. En la pr´ctica
                                                                        a
escribiremos E, sin indicar expl´
                                ıcitamente la norma.
   Es inmediato comprobar que la norma de un espacio prehilbertiano es una
norma en el sentido general de la definici´n anterior. En particular Kn es un
                                          o
espacio normado con la norma del ejemplo anterior, que recibe el nombre de
norma eucl´ıdea. El teorema siguiente nos da otras dos normas alternativas. La
prueba es elemental.

Teorema 1.4 Kn es un espacio normado con cualquiera de estas normas:
                         v
         n               u n
         X               uX                       ©     Ø                 ™
  kxk1 =   |xi |, kxk2 = t    |xi |2 , kxk∞ = m´x |xi | Ø i = 1, . . . , n .
                                               a
           i=1                    i=1


    Notar que para n = 1 las tres normas coinciden con el valor absoluto. El
hecho de que estas tres aplicaciones sean normas permite obtener un resultado
m´s general:
  a

Teorema 1.5 Sean E1 , . . . , En espacios normados. Entonces las aplicaciones
siguientes son normas en E = E1 × · · · × En .
                            v
           n                u n
          X                 uX                        ©     Ø                 ™
  kxk1 =     kxi k, kxk2 = t      kxi k2 , kxk∞ = m´x kxi k Ø i = 1, . . . , n .
                                                    a
         i=1                      i=1


Adem´s se cumplen las relaciones: kxk∞ ≤ kxk2 ≤ kxk1 ≤ nkxk∞ .
    a

                ´
   Demostracion: Tenemos kxki = k(kx1 k, . . . , kxn k)ki para i = 1, 2, ∞.
Usando el teorema anterior se ve inmediatamente que son normas.
                      v                      v
                      u n                    uX
            p         uX                     u n            X
   kxk∞ = kxk2 ≤ t∞          kxi k2 = kxk2 ≤ t   kxi k2 + 2   kxi k kxj k
                            i=1                   i=1         i<j

                   v√       !2
                   u n
                   u X                  n
                                        X
                 = t   kxi k   = kxk1 ≤   kxk∞ = nkxk∞ .
                      i=1                   i=1



   Notemos tambi´n que las normas del teorema 1.4 coinciden con las construi-
                  e
das mediante este ultimo teorema a partir del valor absoluto en K.
                  ´
                                                      Ø         Ø
Ejercicio: Probar que en un espacio normado se cumple Økxk − kykØ ≤ kx − yk.

    Como ya hemos comentado, desde un punto de vista topol´gico el unico
                                                                  o        ´
inter´s de las normas es que permiten definir la distancia entre dos puntos como
     e
d(x, y) = kx − yk. Sin embargo, a efectos topol´gicos no es necesario que una
                                                 o
distancia est´ definida de este modo.
              e
1.1. Espacios topol´gicos
                   o                                                            5

Definici´n 1.6 Una distancia o m´trica en un conjunto M es una aplicaci´n
        o                      e                                      o
d : M × M −→ [0, +∞[ que cumpla las propiedades siguientes

  a) d(x, y) = 0 si y s´lo si x = y,
                       o

  b) d(x, y) = d(y, x),

  c) d(x, z) ≤ d(x, y) + d(y, z),

para todos los x, y, z ∈ M .

   Un espacio m´trico es un par (M, d) donde M es un conjunto y d una dis-
                e
tancia en M . Como en el caso de espacios normados escribiremos M en lugar
de (M, d).
   Todo espacio normado E es un espacio m´trico con la distancia definida
                                                  e
por d(x, y) = kx − yk. Las propiedades de la definici´n de norma implican
                                                        o
inmediatamente las de la definici´n de distancia. En particular en Kn tenemos
                                 o
definidas tres distancias:
                                                    v
                          n                         u n
                         X                          uX
             d1 (x, y) =    |xi − yi |, d2 (x, y) = t (xi − yi )2 ,
                          i=1                            i=1

                                   ©           Ø          ™
                    d∞ (x, y) = m´x |xi − yi | Ø 1 ≤ i ≤ n .
                                 a
   M´s en general, estas f´rmulas permiten definir distancias en cualquier pro-
      a                     o
ducto finito de espacios m´tricos. La prueba del teorema siguiente es muy
                              e
sencilla a partir de los teoremas 1.4 y 1.5.

Teorema 1.7 Sean M1 , . . . , Mn espacios m´tricos. Sea M = M1 × · · · × Mn .
                                              e
Entonces las aplicaciones d1 , d2 , d∞ : M × M −→ [0, +∞[ definidas como sigue
son distancias en M :
                                    n
                                    X
                    d1 (x, y) =           d(xi , yi ),
                                    i=1
                                v
                                u n
                                uX
                    d2 (x, y) = t   d(xi , yi )2 ,
                                       i=1

                   d∞ (x, y) = m´x{d(xi , yi ) | 1 ≤ i ≤ n}.
                                a

Adem´s se cumplen las relaciones d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ≤ n d∞ (x, y).
    a

Definici´n 1.8 Sea M un espacio m´trico, x ∈ M y ≤ > 0 (en estos casos
        o                          e
sobreentenderemos ≤ ∈ R). Definimos

   B≤ (x) = {y ∈ M | d(x, y) < ≤} (Bola abierta de centro x y radio ≤).
    0
   B≤ (x) = {y ∈ M | d(x, y) ≤ ≤} (Bola cerrada de centro x y radio ≤).
6                                                        Cap´
                                                            ıtulo 1. Topolog´
                                                                            ıa

   La figura muestra las bolas de centro (0, 0) y radio 1 para las tres m´tricas
                                                                        e
que hemos definido en R2 .



                   d2                     d1                      d∞




    Las bolas con otros centros son trasladadas de ´stas, y las bolas de otros
                                                       e
radios son homot´ticas. Las bolas abiertas se diferencian de las cerradas en que
                  e
las primeras no contienen los puntos del borde. El inter´s de las bolas reside
                                                            e
en que una bola de centro un punto P contiene todos los puntos de alrededor
de P , por peque˜o que sea su radio. Observar que el concepto de “puntos de
                 n
alrededor” es un tanto escurridizo: Seg´n lo que acabamos de decir, ning´n
                                           u                                   u
punto en particular (distinto de P ) est´ alrededor de P , pues siempre podemos
                                         a
tomar una bola suficientemente peque˜a como para que deje fuera a dicho punto.
                                       n
Esto significa que no podemos dar sentido a la afirmaci´n “Q es un punto de
                                                           o
alrededor de P ”, pero lo importante es que s´ tiene sentido decir “El conjunto A
                                              ı
contiene a todos los puntos de alrededor de P ”. Esto sucede cuando A contiene
una bola cualquiera de centro P , y entonces diremos que A es un entorno de P .
Aunque el concepto de entorno podr´ tomarse como concepto topol´gico b´sico,
                                     ıa                              o      a
lo cierto es que es m´s c´modo partir de un concepto “m´s regular”: diremos
                      a o                                    a
que un conjunto es abierto si es un entorno de todos sus puntos. Los conjuntos
abiertos tienen las propiedades que recoge la definici´n siguiente:
                                                       o

Definici´n 1.9 Una topolog´ en un conjunto X es una familia T de subconjun-
         o                   ıa
tos de X a cuyos elementos llamaremos abiertos, tal que cumpla las propiedades
siguientes:
    a) ∅ y X son abiertos.
    b) La uni´n de cualquier familia de abiertos es un abierto.
             o
    c) La intersecci´n de dos abiertos es un abierto.
                    o
Un espacio topol´gico es un par (X, T), donde X es un conjunto y T es una
                o
topolog´ en X. En la pr´ctica escribiremos simplemente X en lugar de (X, T).
       ıa               a

    Sea M un espacio m´trico. Diremos que un conjunto G ⊂ M es abierto si
                        e
para todo x ∈ G existe un ≤ > 0 tal que B≤ (x) ⊂ G. Es inmediato comprobar
que los conjuntos abiertos as´ definidos forman una topolog´ en M , a la que
                             ı                              ıa
llamaremos topolog´ inducida por la m´trica. En lo sucesivo consideraremos
                   ıa                   e
siempre a los espacios m´tricos como espacios topol´gicos con esta topolog´
                        e                          o                      ıa.
   En el p´rrafo previo a la definici´n de topolog´ hemos definido “abierto”
          a                         o            ıa
como un conjunto que es entorno de todos sus puntos. Puesto que formalmente
1.1. Espacios topol´gicos
                   o                                                            7

hemos definido los espacios topol´gicos a partir del concepto de abierto, ahora
                                o
hemos de definir el concepto de entorno.
   Si X es un espacio topol´gico, U ⊂ X y x ∈ U , diremos que U es un entorno
                            o
de x si existe un abierto G tal que x ∈ G ⊂ U .
    Es inmediato comprobar que en un espacio m´trico U es entorno de x si y
                                                  e
s´lo si existe un ≤ > 0 tal que B≤ (x) ⊂ U , es decir, si y s´lo si U contiene a
 o                                                           o
todos los puntos de alrededor de x, tal y como hab´ ıamos afirmado.

Ejemplo El intervalo I = [0, 1], visto como subconjunto de R, es entorno de
todos sus puntos excepto de sus extremos 0 y 1, pues si 0 < x < 1 siempre
podemos tomar ≤ = m´   ın{x, 1 − x} y entonces B≤ (x) = ]x − ≤, x + ≤[ ⊂ I. En
cambio, I no contiene todos los puntos de alrededor de 1, pues toda bola de
centro 1 contiene puntos a la derecha de 1 y ninguno de ellos est´ en I. El caso
                                                                 a
del 0 es similar. En particular I no es abierto.
   El teorema siguiente recoge las propiedades b´sicas de los entornos. La
                                                a
prueba es inmediata.

Teorema 1.10 Sea X un espacio topol´gico, x ∈ X y Ex la familia de todos
                                   o
los entornos de x.

a) Un conjunto G ⊂ X es abierto si y s´lo si es un entorno de todos sus puntos.
                                      o

b1) X ∈ Ex .

b2) Si U ∈ Ex y U ⊂ V ⊂ X entonces V ∈ Ex .

b3) Si U , V ∈ Ex entonces U ∩ V ∈ Ex .

    Puesto que los abiertos pueden definirse a partir de los entornos, es obvio que
si dos topolog´ sobre un mismo conjunto tienen los mismos entornos entonces
              ıas
son iguales. Las desigualdades del teorema 1.7 implican que una bola para
una de las tres distancias definidas en el producto M contiene otra bola del
mismo centro para cualquiera de las otras distancias. De aqu´ se sigue que
                                                                   ı
un subconjunto de M es entorno de un punto para una distancia si y s´lo        o
si lo es para las dem´s, y de aqu´ a su vez que las tres distancias definen la
                      a            ı
misma topolog´ en el producto. En particular, las tres distancias que tenemos
               ıa
definidas sobre Kn definen la misma topolog´ a la que llamaremos topolog´
                                              ıa,                               ıa
usual o topolog´ eucl´
               ıa     ıdea en Kn .
    ´
    Esta es una primera muestra del car´cter auxiliar de las distancias en topo-
                                       a
log´ Cuando queramos probar un resultado puramente topol´gico sobre Rn
   ıa.                                                           o
podremos apoyarnos en la distancia que resulte m´s conveniente, sin que ello su-
                                                 a
ponga una p´rdida de generalidad. La distancia d2 es la distancia eucl´
             e                                                        ıdea y por
lo tanto la m´s natural desde un punto de vista geom´trico, pero las distancias
              a                                       e
d1 y d∞ son formalmente m´s sencillas y a menudo resultan m´s adecuadas.
                            a                                   a
8                                                         Cap´
                                                             ıtulo 1. Topolog´
                                                                             ıa

Ejemplo Es f´cil definir una distancia en Kn que induzca una topolog´ dis-
                 a                                                      ıa
tinta de la usual. De hecho, si X es un conjunto cualquiera podemos considerar
la distancia d : X × X −→ R dada por
                                     Ω
                                        1 si x 6= y,
                           d(x, y) =
                                        0 si x = y

Es f´cil ver que efectivamente es una distancia y para todo punto x se cumple
     a
que B1 (x) = {x}, luego {x} es un entorno de x, luego es un abierto y, como
toda uni´n de abiertos es abierta, de hecho todo subconjunto de X es abierto.
         o
La m´trica d recibe el nombre de m´trica discreta y la topolog´ que induce es
       e                            e                         ıa
la topolog´ discreta. Un espacio topol´gico cuya topolog´ sea la discreta es un
          ıa                          o                  ıa
espacio discreto.
    En un espacio discreto un punto no tiene m´s punto a su alrededor que ´l
                                                a                             e
mismo. Esta topolog´ es la m´s adecuada para conjuntos como N o Z, pues,
                      ıa        a
efectivamente, un n´mero entero no tiene alrededor a ning´n otro.
                    u                                       u
    Las bolas abiertas de un espacio m´trico son abiertas. Esto es f´cil de ver
                                      e                             a
intuitivamente, pero el mero hecho de que las hayamos llamado as´ no justifica
                                                                  ı
que lo sean:

Teorema 1.11 Las bolas abiertas de un espacio m´trico son conjuntos abiertos.
                                               e

                  ´
   Demostracion: Sea B≤ (x) una bola abierta y sea y ∈ B≤ (x). Entonces
d(x, y) < ≤. Sea 0 < δ < ≤ − d(x, y). Basta probar que Bδ (y) ⊂ B≤ (x). Ahora
bien, si z ∈ Bδ (y), entonces d(z, x) ≤ d(z, y) + d(y, x) < δ + d(x, y) < ≤, luego
en efecto z ∈ B≤ (x).


1.2     Bases y subbases
   Hemos visto que la topolog´ en un espacio m´trico se define a partir de las
                               ıa               e
bolas abiertas. El concepto de “bola abierta” no tiene sentido en un espacio
topol´gico arbitrario en el que no tengamos dada una distancia, sin embargo
     o
hay otras familias de conjuntos que pueden representar un papel similar.

Definici´n 1.12 Sea X un espacio topol´gico. Diremos que una familia B de
         o                               o
abiertos de X (a los que llamaremos abiertos b´sicos) es una base de X si para
                                              a
todo abierto G de X y todo punto x ∈ G existe un abierto B ∈ B tal que
x ∈ B ⊂ G.
    Si x ∈ X diremos que una familia E de entornos (abiertos) de x (a los que
llamaremos entornos b´sicos de x) es una base de entornos (abiertos) de x si
                      a
todo entorno de x contiene un elemento de E.

    En estos t´rminos la propia definici´n de los abiertos m´tricos (junto con el
              e                        o                   e
hecho de que las bolas abiertas son realmente conjuntos abiertos) prueba que
las bolas abiertas son una base de la topolog´ m´trica, y tambi´n es claro que
                                             ıa e                e
1.2. Bases y subbases                                                           9

las bolas abiertas de centro un punto x forman una base de entornos abiertos
de x. Pero estos conceptos son mucho m´s generales. Pensemos por ejemplo que
                                         a
otras bases de un espacio m´trico son las bolas abiertas de radio menor que 1, las
                            e
bolas abiertas de radio racional, etc. Cualquier base determina completamente
la topolog´ y en cada ocasi´n puede convenir trabajar con una base distinta.
          ıa                 o

Teorema 1.13 Sea X un espacio topol´gico.
                                   o
  a) Una familia de abiertos B es una base de X si y s´lo si todo abierto de X
                                                      o
     es uni´n de abiertos de B.
           o
  b) Si B es una base de X y x ∈ X entonces Bx = {B ∈ B | x ∈ B} es una
     base de entornos abiertos de X.
  c) Si para cada punto xS X el conjunto Ex es una base de entornos abiertos
                         ∈
     de x entonces B =     Ex es una base de X.
                         x∈X

                 ´
    Demostracion: a) Si B es una base de X y G es un abierto es claro que
G es la uni´n de todos los abiertos de B contenidos en G, pues una inclusi´n es
           o                                                              o
obvia y si x ∈ G existe un B ∈ B tal que x ∈ B ⊂ G, luego x est´ en la uni´n
                                                                 a          o
considerada. El rec´
                   ıproco es obvio.
    b) Los elementos de Bx son obviamente entornos de x y si U es un entorno
de x entonces existe un abierto G tal que x ∈ G ⊂U, y a su vez existe B ∈ B
tal que x ∈ B ⊂ G, luego B ∈ Bx y B ⊂ U . Esto prueba que Bx es una base
de entornos abiertos de x.
    c) Si G es un abierto de X y x ∈ G, entonces G es un entorno de x, luego
existe un entorno b´sico B ∈ Ex tal que x ∈ B ⊂ G y ciertamente B ∈ B. Como
                   a
adem´s los elementos de B son abiertos, tenemos que B es una base de X.
      a
    Una forma habitual de definir una topolog´ en un conjunto es especificar una
                                            ıa
base o una base de entornos abiertos de cada punto. Por ejemplo, la topolog´ ıa
m´trica puede definirse como la topolog´ que tiene por base a las bolas abiertas
  e                                    ıa
o como base de entornos de cada punto x a las bolas abiertas de centro x. No
obstante, para que una familia de conjuntos pueda ser base de una topolog´   ıa
ha de cumplir unas propiedades muy simples que es necesario comprobar. El
teorema siguiente da cuenta de ellas.

Teorema 1.14 Sea X un conjunto y B una familia de subconjuntos de X que
cumpla las propiedades siguientes:
           S
  a) X =       B,
           B∈B

  b) Si U , V ∈ B y x ∈ U ∩ V entonces existe W ∈ B tal que x ∈ W ⊂ U ∩ V .
Entonces existe una unica topolog´ en X para la cual B es una base.
                    ´            ıa

                 ´
    Demostracion: Definimos los abiertos de X como las uniones de elementos
de B. Basta comprobar que estos abiertos forman realmente una topolog´ pues
                                                                     ıa,
ciertamente en tal caso B ser´ una base y la topolog´ ser´ unica.
                             a                      ıa   a´
10                                                         Cap´
                                                              ıtulo 1. Topolog´
                                                                              ıa

     El conjunto vac´ es abierto trivialmente (o si se prefiere, por definici´n). El
                    ıo                                                     o
conjunto X es abierto por la propiedad a).
     La uni´n de abiertos es obviamente abierta (una uni´n de uniones de ele-
            o                                               o
mentos de B es al fin y al cabo una uni´n de elementos de B).
                                         o
     Sean G1 y G2 abiertos y supongamos que x ∈ G1 ∩G2 . Como G1 es uni´n de o
elementos de B existe un U ∈ B tal que x ∈ U ⊂ G1 . Similarmente x ∈ V ⊂ G2
con V ∈ B. Por la propiedad b) existe W ∈ B tal que x ∈ W ⊂ U ∩V ⊂ G1 ∩G2 .
As´ pues, x est´ en la uni´n de los conjuntos W ∈ B tales que W ⊂ G1 ∩ G2 , y
   ı            a          o
la otra inclusi´n es obvia, luego G1 ∩ G2 es uni´n de elementos de B.
               o                                 o
   El teorema siguiente nos da las condiciones que hemos de comprobar para
definir una topolog´ a partir de una familia de bases de entornos abiertos.
                  ıa

Teorema 1.15 Sea X un conjunto y para cada x ∈ X sea Bx una familia no
vac´ de subconjuntos de X tal que:
   ıa

     a) Si U ∈ Bx , entonces x ∈ U .

     b) Si U , V ∈ Bx , existe un W ∈ Bx tal que W ⊂ U ∩ V .

     c) Si x ∈ U ∈ By , existe un V ∈ Bx tal que V ⊂ U .

Entonces existe una unica topolog´ para la cual cada Bx es una base de entornos
                    ´            ıa
abiertos de x.
                                  S
               ´
     Demostracion: Sea B =             Bx . Veamos que B cumple las condiciones
                                 x∈X
del teorema anterior para ser base de una topolog´ en X. Por la condici´n a)
                   S                             ıa                    o
tenemos que X =       B.
                    B∈B
    Si U , V ∈ B y x ∈ U ∩ V , entonces U ∈ By y V ∈ Bz para ciertos y, z.
Existen U 0 , V 0 ∈ Bz tales que U 0 ⊂ U y V 0 ⊂ V (por la condici´n c). Existe
                                                                   o
W ∈ Bx tal que W ⊂ U 0 ∩ V 0 (por la condici´n b). As´ x ∈ W ⊂ U ∩ V con
                                                o         ı
W ∈ B.
    Por lo tanto B es la base de una topolog´ en X para la que los elementos
                                              ıa
de cada Bx son abiertos y, en particular, entornos de x. Si A es un entorno de x
para dicha topolog´ existe un U ∈ B tal que x ∈ U ⊂ A. Por definici´n de B,
                    ıa,                                                 o
existe un y ∈ X tal que U ∈ By , y por c) existe un V ∈ Bx tal que V ⊂ U ⊂ A.
Esto prueba que Bx es una base de entornos de x.
    Las bases de entornos determinan los entornos y por tanto la topolog´ es
                                                                           ıa,
decir, se da la unicidad.


Ejemplo Como aplicaci´n de este teorema vamos a convertir en espacio to-
                          o
pol´gico al conjunto R = R ∪ {−∞, +∞}. Para ello definimos como base de
   o
entornos abiertos de cada n´mero real x al conjunto los entornos abiertos de x
                            u
en R con la topolog´ usual, la base de entornos abiertos de +∞ est´ formada
                     ıa                                             a
por los intervalos ]x, +∞], donde x var´ en R, y la base de entornos abiertos
                                       ıa
de −∞ la forman los intervalos [−∞, x[, donde x var´ en R. Con esto estamos
                                                   ıa
1.3. Productos y subespacios                                                    11

diciendo que un conjunto contiene a los alrededores de +∞ si contiene a todos
los n´meros reales a partir de uno dado, y an´logamente para −∞.
     u                                       a
    Es f´cil comprobar que las familias consideradas cumplen las propiedades
        a
del teorema anterior, luego definen una topolog´ en R.
                                               ıa
    Teniendo en cuenta que hemos definido los entornos abiertos de los n´meros
                                                                       u
reales como los entornos abiertos que ya tienen en la topolog´ usual, es inme-
                                                             ıa
diato que un subconjunto de R es abierto en la topolog´ usual de R si y s´lo si
                                                       ıa                 o
lo es en la topolog´ que hemos definido en R.
                   ıa
    Hay un concepto an´logo a los de base y base de entornos que es menos
                       a
intuitivo, pero mucho m´s pr´ctico a la hora de definir topolog´ Se trata del
                       a    a                                 ıas.
concepto de subbase:

Definici´n 1.16 Sea X un espacio topol´gico. Una familia de abiertos S es
        o                                   o
una subbase de X si las intersecciones finitas de elementos de S forman una base
de X.

    Por ejemplo, es f´cil ver que los intervalos abiertos ]a, b[ forman una base de
                     a
R (son las bolas abiertas). Por consiguiente, los intervalos de la forma ]−∞, a[
y ]a, +∞[ forman una subbase de R, pues son abiertos y entre sus interseccio-
nes finitas se encuentran todos los intervalos ]a, b[ (notar adem´s que cualquier
                                                                    a
familia de abiertos que contenga a una base es una base).
   La ventaja de las subbases consiste en que una familia no ha de cumplir
ninguna propiedad en especial para ser subbase de una topolog´
                                                             ıa:

Teorema 1.17 Sea X un conjunto y S una familia de subconjuntos de X.
Entonces existe una unica topolog´ en X de la cual S es subbase.
                    ´            ıa

               ´
   Demostracion: Sea B la familia de las intersecciones finitas de elementos
                   T
de S. Entonces X =   G ∈ B y obviamente la intersecci´n de dos intersec-
                                                         o
                       G∈∅
ciones finitas de elementos de S es una intersecci´n finita de elementos de S;
                                                 o
luego si U , V ∈ B tambi´n U ∩ V ∈ B, de donde se sigue que B es la base de
                         e
una topolog´ en X, de la cual S es subbase. Claramente es unica, pues B es
             ıa                                             ´
base de cualquier topolog´ de la que S sea subbase.
                         ıa



1.3     Productos y subespacios
    Hemos visto que el producto de una familia finita de espacios m´tricos es
                                                                      e
de nuevo un espacio m´trico de forma natural (o mejor dicho, de tres formas
                        e
distintas pero equivalentes desde un punto de vista topol´gico). Ahora veremos
                                                         o
que la topolog´ del producto se puede definir directamente a partir de las
                ıa
topolog´ de los factores sin necesidad de considerar las distancias. M´s a´n,
        ıas                                                             a u
podemos definir el producto de cualquier familia de espacios topol´gicos, no
                                                                     o
necesariamente finita.
12                                                       Cap´
                                                            ıtulo 1. Topolog´
                                                                            ıa

Definici´n 1.18 Sean {Xi }i∈I espacios topol´gicos. Consideremos su pro-
        o            Q                     o
ducto cartesiano X =   Xi y las proyecciones pi : X −→ Xi que asignan
                        i∈I
a cada punto su coordenada i-´sima. Llamaremos topolog´ producto en X a la
                               e                          ıa
que tiene por subbase a los conjuntos p−1 [G], donde i ∈ I y G es abierto en Xi .
                                       i


 T Una base de la topolog´ producto la forman los conjuntos de la forma
                             ıa
    p−1 [Gi ], donde F es un subconjunto finito de I y Gi es abierto en Xi .
     i
i∈F                                                          Q
    Equivalentemente, la base est´ formada por los conjuntos
                                 a                              Gi , donde cada
                                                              i∈I
Gi es abierto en Xi y Gi = Xi salvo para un n´mero finito Q ´
                                                    u            de ındices. Al
conjunto de estos ´
                  ındices se le llama soporte del abierto b´sico
                                                           a       Gi .
                                                                i∈I
    Si el n´mero de factores es finito la restricci´n se vuelve vac´ de modo que
           u                                      o               ıa,
un abierto b´sico en un producto X1 × · · · × Xn es simplemente un conjunto de
             a
la forma G1 × · · · × Gn , donde cada Gi es abierto en Xi .
   En lo sucesivo “casi todo i” querr´ decir “todo ´
                                     a             ındice i salvo un n´mero
                                                                      u
finito de ellos”.

Teorema 1.19 Sean {Xi }i∈I espacios topol´gicos, para cada i sea Bi una base
                                            o
                                            Q
de Xi . Entonces los conjuntos de la forma     Gi , donde cada Gi est´ en Bi o
                                                                     a
                                           i∈I  Q
es Xi (y casi todos son Xi ) forman una base de      Xi .
                                                 i∈I

                 ´
    Demostracion: Consideremos la topolog´ T en el producto que tiene
                                                 ıa
por subbase a los conjuntos p−1 [Gi ] con Gi en Bi (y, por consiguiente, tieen
                                i
por base a los abiertos del enunciado). Como ciertamente estos conjuntos son
abiertos para la topolog´ producto, tenemos que todo abierto de T lo es de
                          ıa
la topolog´ producto. Rec´
          ıa                 ıprocamente, un abierto subb´sico de la topolog´
                                                           a S               ıa
producto es p−1 [Gi ], con Gi abierto en Xi . Entonces Gi =
             i                                                  B, donde cada
                                                          SB∈Ai
Ai es un subconjunto de Bi . Por lo tanto p−1 [Gi ] =
                                               i             p−1 [B] es abierto
                                                              i
                                                         B∈Ai
de T. Por consiguiente todo abierto de la topolog´ producto lo es de T y as´
                                                 ıa                        ı
ambas topolog´ coinciden.
             ıas
    En lo sucesivo, a pesar de que en el producto se puedan considerar otras
bases, cuando digamos “abiertos b´sicos” nos referiremos a los abiertos indicados
                                  a
en el teorema anterior tomando como bases de los factores las propias topolog´ıas
salvo que se est´ considerando alguna base en concreto.
                e
    Tal y como anunci´bamos, el producto de espacios topol´gicos generaliza al
                      a                                      o
producto de espacios m´tricos (o de espacios normados). El teorema siguiente
                         e
lo prueba.

Teorema 1.20 Si M1 , . . . , Mn son espacios m´tricos, entonces la topolog´ in-
                                              e                           ıa
ducida por las m´tricas de 1.7 en M = M1 × · · · × Mn es la topolog´ producto.
                e                                                   ıa

                  ´
    Demostracion: Como las tres m´tricas inducen la misma topolog´ s´lo
                                         e                               ıa o
es necesario considerar una de ellas, pero para la m´trica d∞ se cumple B≤ (x) =
                                                    e
1.3. Productos y subespacios                                                       13

B≤ (x1 )×· · ·×B≤ (xn ), luego la base inducida por la m´trica es base de la topolog´
                                                        e                           ıa
producto.
   La definici´n de topolog´ producto es sin duda razonable para un n´mero
              o             ıa                                          u
finito de factores. Sin embargo cuando tenemos infinitos factores hemos exigido
una condici´nQ finitud que no hemos justificado. En principio podr´
            o de                                                   Q     ıamos
considerar en    Xi la topolog´ que tiene por base a los productos
                               ıa                                    Gi con Gi
              i∈I                                                      i∈I
abierto en Xi (sin ninguna restricci´n de finitud). Ciertamente estos conjuntos
                                    o
son base de una topolog´ a la que se le llama topolog´ de cajas, y el teorema
                        ıa                            ıa
siguiente muestra que no coincide con la topolog´ producto que hemos definido.
                                                ıa
La topolog´ producto resulta ser mucho m´s util que la topolog´ de cajas.
           ıa                               a ´                 ıa
Teorema 1.21 Sea {Xi }i∈I una familia de espacios topol´gicos. Los unicos
            Q                Q                           o             ´
abiertos en   Xi de la forma   Gi 6= ∅ son los abiertos b´sicos, es decir, los
                                                         a
            i∈I                     i∈I
que adem´s cumplen que cada Gi es abierto y Gi = Xi para casi todo i.
         a
                                        Q
               ´
    Demostracion: Supongamos que            Gi es un abierto no vac´ıo. Con-
                           Q           i∈I                      Q
sideremos un punto x ∈        Gi . Existir´ un abierto b´sico
                                          a              a         Hi tal que
     Q      Q             i∈I                                  i∈I
x∈     Hi ⊂   Gi , luego para cada ´
                                   ındice i se cumplir´ xi ∈ Hi ⊂ Gi , y como
                                                      a
    i∈I       i∈I
casi todo Hi es igual a Xi , tenemos que Gi = Xi para casi todo i. Adem´s tene-
                                                                          a
mos que Gi es un entorno de xi , pero dado cualquier elemento a ∈ Gi siempre
                         Q
podemos formar un x ∈         Gi tal que xi = a, luego en realidad tenemos que Gi
                          i∈I
es un entorno de todos sus puntos, o sea, es abierto.
    Nos ocupamos ahora de los subespacios de un espacio topol´gico. Es evidente
                                                             o
que todo subconjunto N de un espacio m´trico M es tambi´n un espacio m´trico
                                         e                e               e
con la misma distancia restringida a N ×N . Por lo tanto tenemos una topolog´ıa
en M y otra en N . Vamos a ver que podemos obtener la topolog´ de N    ıa
directamente a partir de la de M , sin pasar por la m´trica.
                                                     e
Teorema 1.22 Sea X un espacio topol´gico (con topolog´ T) y A ⊂ X. De-
                                       o                ıa
finimos TA = {G ∩ A | G ∈ T}. Entonces TA es una topolog´ en A llamada
                                                            ıa
topolog´ relativa a X (o topolog´ inducida por X) en A. En lo sucesivo so-
        ıa                       ıa
breentenderemos siempre que la topolog´ de un subconjunto de un espacio X es
                                      ıa
la topolog´ relativa.
           ıa
   Demostracion: A = X ∩ A ∈ TA , ∅ = ∅ ∩ A ∈ TA .
                ´
   Sea C ⊂ TA . Para cada G ∈ C sea UG = {U ∈ T | U ∩ A = G} 6= ∅ y sea
VG la uni´n de todos los abiertos de UG .
         o
   De este modo VG es un abierto en X y VG ∩ A = G.
            [        [                [
                G=       VG ∩ A, y        VG ∈ T, luego G ∈ TA .
            G∈C       G∈C                 G∈C

   Si U , V ∈ TA , U = U ∩ A y V = V 0 ∩ A con U 0 , V 0 ∈ T. Entonces
                                0

U ∩ V = U 0 ∩ V 0 ∩ A ∈ TA , pues U 0 ∩ V 0 ∈ T. As´ TA es una topolog´ en A.
                                                   ı                  ıa
14                                                         Cap´
                                                              ıtulo 1. Topolog´
                                                                              ıa

Ejemplo Consideremos I = [0, 1] ⊂ R. Resulta que ]1/2, 1] es abierto en I,
pues ]1/2, 1] = ]1/2, 2[ ∩ I y ]1/2, 2[ es abierto en R. Sin embargo ]1/2, 1] no es
abierto en R porque no es entorno de 1. Intuitivamente, ]1/2, 1] no contiene a
todos los puntos de alrededor de 1 en R (faltan los que est´n a la derecha de 1),
                                                              a
pero s´ contiene a todos los puntos de alrededor de 1 en I.
      ı
    La relaci´n entre espacios y subespacios viene perfilada por los teoremas
             o
siguientes. El primero garantiza que la topolog´ relativa no depende del espacio
                                               ıa
desde el que relativicemos.
Teorema 1.23 Si X es un espacio topol´gico (con topolog´ T) y A ⊂ B ⊂ X,
                                     o                 ıa
entonces TA = (TB )A .
                ´
   Demostracion: Si U es abierto en TA , entonces U = V ∩ A con V ∈ T,
luego V ∩ B ∈ TB y U = V ∩ A = (V ∩ B) ∩ A ∈ (TB )A .
   Si U ∈ (TB )A , entonces U = V ∩ A con V ∈ TB , luego V = W ∩ B con
W ∈ T. As´ pues, U = W ∩ B ∩ A = W ∩ A ∈ TA . Por lo tanto TA = (TB )A .
           ı


Teorema 1.24 Si B es una base de un espacio X y A ⊂ X, entonces el con-
junto {B ∩ A | B ∈ B} es una base de A.
               ´
   Demostracion: Sea U un abierto en A y x ∈ U . Existe un V abierto
en X tal que U = V ∩ A. Existe un B ∈ B tal que x ∈ B ⊂ V , luego
x ∈ B ∩ A ⊂ V ∩ A = U . Por lo tanto la familia referida es base de A.
     Similarmente se demuestra:
Teorema 1.25 Si Bx es una base de entornos (abiertos) de un punto x de un
espacio X y x ∈ A ⊂ X, entonces {B ∩ A | B ∈ Bx } es una base de entornos
(abiertos) de x en A.
Teorema 1.26 Sea M un espacio m´trico y sea A ⊂ M . Entonces d0 = d|A×A
                                     e
es una distancia en A y la topolog´ que induce es la topolog´ relativa.
                                  ıa                        ıa
                ´
    Demostracion: Una base para la topolog´ inducida por la m´trica de A
                                          ıa                 e
ser´ la formada por las bolas
   ıa
       0
     B≤ (x) = {a ∈ A | d0 (x, a) < ≤} = {a ∈ X | d(x, a) < ≤} ∩ A = B≤ (x) ∩ A,
      d                                                              d


pero ´stas son una base para la topolog´ relativa por el teorema 1.24.
     e                                 ıa

Teorema 1.27 Sea {Xi }i∈I una familia de espacios topol´gicos y para cada i
                                               Q       oQ
sea Yi ⊂ Xi . Entonces la topolog´ inducida en
                                 ıa              Yi por    Xi es la misma
                                                    i∈I       i∈I
que la topolog´ producto de los {Yi }i∈I .
              ıa
   (La base obtenida por el teorema 1.24 a partir de la base usual de la topolog´
                                                                                ıa
producto es claramente la base usual de la topolog´ producto.)
                                                    ıa
Ejercicio: Probar que la topolog´ que hemos definido en R induce en R la topolog´
                                ıa                                             ıa
eucl´
    ıdea.
1.4. Algunos conceptos topol´gicos
                            o                                                         15

1.4      Algunos conceptos topol´gicos
                                o
   Dedicamos esta secci´n a desarrollar el lenguaje topol´gico, es decir, a intro-
                          o                              o
ducir las caracter´
                  ısticas de un espacio y sus subconjuntos que pueden definirse
a partir de su topolog´ Hasta ahora hemos visto unicamente los conceptos de
                       ıa.                         ´
abierto y entorno. Otro concepto importante es el dual conjuntista de “abierto”:

Definici´n 1.28 Diremos que un subconjunto de un espacio topol´gico es ce-
         o                                                   o
rrado si su complementario es abierto.

    Por ejemplo, un semiplano (sin su recta frontera) es un conjunto abierto,
mientras que un semiplano con su frontera es cerrado, pues su complementario
es el semiplano opuesto sin su borde, luego es abierto. Pronto veremos que la
diferencia entre los conjuntos abiertos y los cerrados es precisamente que los
primeros no contienen a los puntos de su borde y los segundos contienen todos
los puntos de su borde. En importante notar que un conjunto no tiene por qu´ e
ser ni abierto ni cerrado. Baste pensar en el intervalo [0, 1[.
Ejercicio: Sea X = [0, 1] ∪ ]3, 4]. Probar que ]3, 4] es a la vez abierto y cerrado en X.
   Las propiedades de los cerrados se deducen inmediatamente de las de los
abiertos:

Teorema 1.29 Sea X un espacio topol´gico. Entonces:
                                   o
  a) ∅ y X son cerrados.
  b) La intersecci´n de cualquier familia de cerrados es un cerrado.
                  o
  c) La uni´n de dos cerrados es un cerrado.
           o

   Puesto que la uni´n de abiertos es abierta, al unir todos los abiertos con-
                      o
tenidos en un conjunto dado obtenemos el mayor abierto contenido en ´l. Si-
                                                                        e
milarmente, al intersecar todos los cerrados que contienen a un conjunto dado
obtenemos el menor cerrado que lo contiene:

Definici´n 1.30 Sea X un espacio topol´gico. Llamaremos interior de un
         o                                o
conjunto A ⊂ X al mayor abierto contenido en A. Lo representaremos por
        ◦
int A o A. Llamaremos clausura de A al menor cerrado que contiene a A. Lo
                                             ◦
representaremos por cl A o A. Los puntos de A se llaman puntos interiores de
A, mientras que los de A se llaman puntos adherentes de A.
                                                         ◦
   As´ pues, para todo conjunto A tenemos que A⊂ A ⊂ A. El concepto de
      ı
punto interior es claro: un punto x es interior a un conjunto A si y s´lo si A es
                                                                      o
un entorno de x. Por ejemplo, en un semiplano cerrado, los puntos interiores
son los que no est´n en el borde. El teorema siguiente nos caracteriza los puntos
                  a
adherentes.

Teorema 1.31 Sea X un espacio topol´gico y A un subconjunto de X. Un
                                         o
punto x es adherente a A si y s´lo si todo entorno de x corta a A.
                               o
16                                                        Cap´
                                                             ıtulo 1. Topolog´
                                                                             ıa

                 ´
   Demostracion: Supongamos que x es adherente a A. Sea U un entorno
de x. Existe un abierto G tal que x ∈ G ⊂ U . Basta probar que G ∩ A 6= ∅.
Ahora bien, en caso contrario X  G ser´ un cerrado que contiene a A, luego
                                       ıa
A ⊂ X  G, mientras que x ∈ A ∩ G.
   Rec´ıprocamente, si x tiene esta propiedad entonces x ∈ A, ya que de lo
contrario X  A ser´ un entorno de x que no corta a A.
                   ıa
   Vemos, pues, que, como su nombre indica, los puntos adherentes a un con-
junto A son los que “est´n pegados” a A, en el sentido de que tienen alrededor
                        a
puntos de A. Por ejemplo, es f´cil ver que los puntos adherentes a un semi-
                                a
plano abierto son sus propios puntos m´s los de su borde. Veamos ahora que el
                                      a
concepto de borde corresponde a una noci´n topol´gica general:
                                          o       o

Definici´n 1.32 Sea X un espacio topol´gico y A ⊂ X. Llamaremos frontera
         o                           o
de A al conjunto ∂A = A ∩ X  A.

    As´ los puntos frontera de un conjunto son aquellos que tienen alrededor
      ı,
puntos que est´n en A y puntos que no est´n en A. Esto es claramente una
                a                            a
definici´n general del “borde” de un conjunto. Por ejemplo, la frontera de un
        o
tri´ngulo la forman los puntos de sus lados.
   a

Teorema 1.33 Sea X un espacio topol´gico. Se cumple:
                                   o
                            ◦                    ◦
     a) Si A ⊂ X entonces A⊂ A ⊂ A, adem´s A es abierto y A es cerrado.
                                        a
                                                     ◦
     b) Si A ⊂ B ⊂ X y A es abierto entonces A ⊂B .

     c) Si A ⊂ B ⊂ X y B es cerrado entonces A ⊂ B.
                                 ◦       ◦
     d) Si A ⊂ B ⊂ X entonces A⊂B y A ⊂ B.

     e) Si A, B ⊂ X, entonces int (A ∩ B) = int A ∩ int B, A ∪ B = A ∪ B.
                                             ◦
     f ) A ⊂ X es abierto si y s´lo si A =A, y es cerrado si y s´lo si A = A.
                                o                               o
                                     B       X
     g) Si A ⊂ B ⊂ X, entonces A = A ∩ B.

     h) Si A ⊂ X, entonces int (X  A) = X  cl A y cl (X  A) = X  int A.

                 ´
    Demostracion: Muchas de estas propiedades son inmediatas. Probaremos
s´lo algunas.
 o
    e) Claramente A ∪ B ⊂ A ∪ B, y el segundo conjunto es cerrado, luego
A ∪ B ⊂ A ∪ B. Por otra parte es claro que A ⊂ A ∪ B y B ⊂ A ∪ B, luego
tenemos la otra inclusi´n. La prueba con interiores es id´ntica.
                       o                                 e
    g) Observemos en primer lugar que los cerrados de B son exactamente las
intersecciones con B de los cerrados de X. En efecto, si C es cerrado en X
entonces X  C es abierto en X, luego B ∩ (X  C) = B  C es abierto en B,
luego B  (B  C) = B ∩ C es cerrado en B. El rec´ ıproco es similar.
1.4. Algunos conceptos topol´gicos
                            o                                                17

                    X
    Por definici´n, A es la intersecci´n de todos los cerrados en X que contienen
               o                     o
              X
a A, luego A ∩ B es la intersecci´n de todas las intersecciones con B de los
                                   o
cerrados en X que contienen a A, pero estos son precisamente los cerrados de
                              X                          B
B que contienen a A, o sea, A ∩ B es exactamente A .
    h) Tenemos que A ⊂ cl A, luego X  cl A ⊂ X  A y el primero es abierto,
luego X  cl A ⊂ int (X  A).
    Por otra parte int (X  A) ⊂ X  A, luego A ⊂ X  int (X  A), y ´ste es
                                                                          e
cerrado, luego A ⊂ X  int (X  A) y int (X  A) ⊂ X  A.
   En la prueba de la propiedad g) hemos visto lo siguiente:

Teorema 1.34 Si X es un espacio topol´gico y A ⊂ X, los cerrados en la
                                           o
topolog´ relativa de A son las intersecciones con A de los cerrados de X.
       ıa

    Conviene observar que el an´logo a g) para interiores es falso. Es decir, no
                               a
                           ◦     ◦
se cumple en general que A B =A ∩B. Por ejemplo, es f´cil ver que en R se
                                                          a
        ◦             ◦                         ◦
                                                  Z
cumple N = ∅, luego N ∩ Z = ∅, mientras que N = N.
    Vamos a refinar el concepto de punto adherente. Hemos visto que los puntos
adherentes a un conjunto A son aquellos que tienen alrededor puntos de A.
Sucede entonces que todo punto x ∈ A es trivialmente adherente, porque x es
un punto de alrededor de x y est´ en A. Cuando eliminamos esta posibilidad
                                 a
trivial tenemos el concepto de punto de acumulaci´n:
                                                 o

Definici´n 1.35 Sea X un espacio topol´gico y A ⊂ X. Diremos que un
        o                                o
punto x ∈ X es un punto de acumulaci´n de A si todo entorno U de x cumple
                                       o
(U {x})∩A 6= ∅. El conjunto de puntos de acumulaci´n de A se llama conjunto
                                                   o
derivado de A y se representa por A0 .

                                         ©                  ™
Ejemplo Consideremos el conjunto A = 1/n | n ∈ N  {0} ⊂ R. Es f´cil    a
ver que A = A ∪ {0}. Sin embargo, A0 = {0}. En efecto, en general se cumple
que A0 ⊂ A, pero ning´n punto 1/n ∈ A es de acumulaci´n, pues
                     u                               o
                          ∏                    ∑
                            1    1   1      1
                              −     , +
                            n n+1 n n+1

es un entorno de 1/n que no corta a A salvo en este mismo punto.
   Como ya hemos dicho, siempre es cierto que A0 ⊂ A. Tambi´n es claro que
                                                               e
un punto adherente que no est´ en A ha de ser un punto de acumulaci´n de A.
                              e                                       o
En otras palabras, A = A ∪ A0 . Los puntos de A pueden ser de acumulaci´n o
                                                                          o
no serlo. Por ejemplo, todos los puntos de [0, 1] son de acumulaci´n, mientras
                                                                  o
que los puntos del ejemplo anterior no lo eran.

Definici´n 1.36 Sea X un espacio topol´gico y A ⊂ X. Los puntos de A  A0
        o                            o
se llaman puntos aislados de A.
18                                                         Cap´
                                                              ıtulo 1. Topolog´
                                                                              ıa

    Un punto x ∈ A es aislado si y s´lo si tiene un entorno U tal que U ∩A = {x}.
                                     o
El entorno lo podemos tomar abierto, y entonces vemos que los puntos aislados
de A son los puntos que son abiertos en la topolog´ relativa. Vemos, pues, que
                                                     ıa
un espacio es discreto si y s´lo si todos sus puntos son aislados. Es el caso del
                             o
ejemplo anterior.

Definici´n 1.37 Un subconjunto A de un espacio topol´gico X es denso si
       o                                           o
A = X.

    Aplicando la propiedad h) de 1.33 vemos que A es denso en X si y s´lo si
                                                                          o
X  A tiene interior vac´ es decir, si y s´lo si todo abierto de X corta a A.
                         ıo,               o
Esto significa que los puntos de A est´n “en todas partes”. Por ejemplo, puesto
                                     a
que todo intervalo de n´meros reales contiene n´meros racionales e irracionales,
                       u                       u
es claro que Q y R  Q son densos en R. De aqu´ se sigue f´cilmente que Qn y
                                                 ı         a
(R  Q)n son densos en Rn .
Ejercicio: Probar que si A es abierto en un espacio X y D es denso en X entonces
A ∩ D es denso en A.

    Hay una propiedad que no cumplen todos los espacios topol´gicos, pero s´
                                                             o             ı
la pr´ctica totalidad de espacios de inter´s.
     a                                    e

Definici´n 1.38 Diremos que un espacio topol´gico X es un espacio de Haus-
         o                                       o
dorff si para todo par de puntos distintos x, y ∈ X existen abiertos disjuntos U
y V tales que x ∈ U , y ∈ V (se dice que los abiertos U y V separan a x e y).

    Por ejemplo, si en un conjunto X con m´s de un punto consideramos la
                                              a
topolog´ formada unicamente por los abiertos ∅ y X (topolog´ trivial) obte-
        ıa         ´                                           ıa
nemos un espacio que no es de Hausdorff. Se trata de un espacio patol´gico o
donde todo punto est´ alrededor de cualquier otro. Aunque la topolog´ trivial
                      a                                                ıa
es ciertamente la m´s patol´gica posible, lo cierto es que todas las topolog´
                    a      o                                                ıas
no de Hausdorff comparten con ella su patolog´ y rara vez resultan de inter´s.
                                              ıa,                           e
Veamos las propiedades de los espacios de Hausdorff:

Teorema 1.39 Se cumplen las propiedades siguientes:

     a) En un espacio de Hausdorff, todo conjunto finito es cerrado.

     b) Todo espacio de Hausdorff finito es discreto.

     c) Todo subespacio de un espacio de Hausdorff es un espacio de Hausdorff.

     d) El producto de una familia de espacios de Hausdorff es un espacio de
        Hausdorff.

     e) Todo espacio m´trico es un espacio de Hausdorff.
                      e

     f ) Un espacio X es de Hausdorff si y s´lo si la diagonal ∆ = {(x, x) | x ∈ X}
                                           o
         es cerrada en X × X.
1.4. Algunos conceptos topol´gicos
                            o                                                   19

                  ´
    Demostracion: a) Basta probar que todo punto {x} en un espacio de
Hausdorff X es cerrado. Ahora bien, dado y ∈ X {x}, existen abiertos disjuntos
U , V tales que x ∈ U , y ∈ V , luego y ∈ V ⊂ X  {x}, lo que prueba que X  {x}
es entorno de todos sus puntos, luego {x} es cerrado.
   b) En un espacio de Hausdorff finito todo subconjunto es cerrado, luego todo
subconjunto es abierto, luego es discreto.
    c) Si X es un espacio de Hausdorff y A ⊂ X, dados dos puntos x, y ∈ A,
existen abiertos disjuntos U , V en X que separan a x e y, luego U ∩ A, V ∩ A
son abiertos disjuntos en A que separan a x e y.
                                                            Q
    d) Consideremos un producto de espacios de Hausdorff        Xi y dos de sus
                                                              i∈I
puntos x, y. Sea i0 un ´ındice tal que xi0 6= yi0 . Existen abiertos U , V en Xi0
que separan a xi0 e yi0 . Entonces p−1 (U ) y p−1 (V ) son abiertos subb´sicos
                                      i0           i0                       a
disjuntos en el producto que separan a x e y.
    e) Si X es un espacio m´trico, dos de sus puntos x, y est´n separados por
                             e                               a
las bolas de centros x, y y radio d(x, y)/2.
    f) La diagonal ∆ es cerrada si y s´lo si su complementario es abierto, si y
                                      o
s´lo si para todo par (x, y) ∈ X × X con x 6= y existe un abierto b´sico U × V
 o                                                                 a
en X × X tal que (x, y) ∈ U × V ⊂ X × X  ∆. Ahora bien, la condici´n       o
U × V ⊂ X × X  ∆ equivale a U ∩ V = ∅, luego la diagonal es cerrada si y s´lo
                                                                            o
si X es Hausdorff.

Ejercicio: Probar que si un producto de espacios topol´gicos es un espacio de Haus-
                                                      o
dorff no vac´ entonces cada uno de los factores es un espacio de Hausdorff.
           ıo,
   Terminamos la secci´n con algunas propiedades m´tricas, no topol´gicas, es
                       o                              e               o
decir propiedades definidas a partir de la distancia en un espacio m´trico y que
                                                                   e
no se pueden expresar en t´rminos de su topolog´
                          e                      ıa.

Definici´n 1.40 Un subconjunto A de un espacio m´trico es acotado si existe
        o                                         e
un M > 0 tal que para todo par de puntos x, y ∈ A se cumple d(x, y) ≤ M .
El di´metro de un conjunto acotado A es el supremo de las distancias d(x, y)
     a
cuando (x, y) var´ en A × A.
                 ıa

    Es f´cil probar que todo subconjunto de un conjunto acotado es acotado,
        a
as´ como que la uni´n finita de conjuntos acotados est´ acotada. Sin embargo
  ı                  o                                    a
hemos de tener presente el hecho siguiente: dado un espacio m´trico M , podemos
                       ©        ™                              e
definir d0 (x, y) = m´ 1, d(x, y) . Es f´cil ver que d0 es una distancia en M y las
                    ın                 a
bolas de radio menor que 1 para d0 coinciden con las bolas respecto a d. Como
estas bolas forman una base de las respectivas topolog´ m´tricas concluimos
                                                          ıas e
que ambas distancias definen la misma topolog´ Sin embargo, respecto a d0
                                                  ıa.
todos los conjuntos est´n acotados. Esto prueba que el concepto de acotaci´n
                         a                                                     o
no es topol´gico.
            o
Ejercicio: Calcular el di´metro de una bola abierta en Rn y en un espacio con la
                         a
m´trica discreta.
 e
20                                                            Cap´
                                                                 ıtulo 1. Topolog´
                                                                                 ıa

Definici´n 1.41 Si M es un espacio m´trico, A 6= ∅ un subconjunto de M y
         o                             e
x ∈ M , definimos la distancia de x a A como d(x, A) = ´
                                                      ınf{d(x, y) | y ∈ A}.

   Es evidente que si x ∈ A entonces d(x, A) = 0, pues entre las distancias cuyo
´
ınfimo determinan d(x, A) se encuentra d(x, x) = 0. Sin embargo los puntos que
cumplen d(x, A) = 0 no est´n necesariamente en A.
                           a

Teorema 1.42 Si M es un espacio m´trico y A ⊂ M , entonces un punto x
                                        e
cumple d(x, A) = 0 si y s´lo si x es adherente a A.
                         o

                 ´
    Demostracion: Si d(x, A) = 0, para probar que es adherente basta ver que
toda bola abierta de centro x corta a A. Dado ≤ > 0 tenemos que d(x, A) < ≤,
lo que significa que existe un y ∈ A tal que d(x, y) < ≤, es decir, y ∈ B≤ (x) ∩ A.
El rec´
      ıproco se prueba igualmente.
   En el caso de espacios normados podemos hacer algunas afirmaciones adi-
cionales. La prueba del teorema siguiente es inmediata.

Teorema 1.43 Sea E un espacio normado y A ⊂ E. Las afirmaciones siguien-
tes son equivalentes:
     a) A es acotado.
     b) Existe un M > 0 tal que kxk ≤ M para todo x ∈ A.
     c) Existe un M > 0 tal que A ⊂ BM (0).

Ejercicio: Probar que en un espacio normado la clausura de una bola abierta es la
bola cerrada del mismo radio y el interior de una bola cerrada es la bola abierta. ¿Cu´l
                                                                                      a
es la frontera de ambas? Dar ejemplos que muestren la falsedad de estos hechos en un
espacio m´trico arbitrario.
           e



1.5       Continuidad
   Finalmente estamos en condiciones de formalizar la idea de funci´n continua
                                                                      o
como funci´n f que env´ los alrededores de un punto a los alrededores de su
           o            ıa
imagen. No exigimos que las im´genes de los puntos de alrededor de un punto x
                                a
sean todos los puntos de alrededor de f (x). Por ejemplo, sea S la circunferencia
unidad en R2 y f la aplicaci´n dada por
                             o

                           [0, 1] −→ S
                             x     7→ (cos 2πx, sen 2πx)

Lo que hace f es “pegar” los extremos del intervalo en un mismo punto (1, 0).
Queremos que esta aplicaci´n sea continua, y vemos que [0, 1/4] es un entorno
                             o
de 0 que se transforma en “medio” entorno de (1, 0), en los puntos de alrededor
de (1, 0) contenidos en el semiplano y > 0. Esto no debe ser, pues, un obst´culo
                                                                           a
a la continuidad.
1.5. Continuidad                                                               21

    Pedir que los puntos de alrededor de x sean enviados a puntos de alrededor de
f (x) (no necesariamente todos) es pedir que todo entorno U de f (x) contenga
a las im´genes de los puntos de alrededor de x, es decir, las im´genes de un
         a                                                          a
entorno de x, es decir, que f −1 [U ] contenga un entorno de x, pero esto equivale
a que ´l mismo lo sea. As´ pues:
       e                   ı

Definici´n 1.44 Una aplicaci´n f : X −→ Y entre dos espacios topol´gicos
           o                   o                                       o
es continua en un punto x ∈ X si para todo entorno U de f (x) se cumple que
f −1 [U ] es un entorno de x. Diremos que f es continua si lo es en todos los
puntos de x.

    Observar que en esta definici´n podemos sustituir “entorno” por “entorno
                                  o
b´sico”. En un espacio m´trico podemos considerar concretamente bolas abier-
 a                        e
tas, y entonces la definici´n se particulariza como sigue:
                          o

Teorema 1.45 Una aplicaci´n f : M −→ N entre dos espacios m´tricos es
                                o                                    e
continua en un punto x ∈°M si y s´lo si para todo ≤ > 0 existe un δ > 0 tal que
                                       o ¢
si d(x, x0 ) < δ entonces d f (x), f (x0 ) < ≤.

   Veamos varias caracterizaciones de la continuidad.

Teorema 1.46 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos. Las
                                         o                     o
afirmaciones siguientes son equivalentes:

  a) f es continua.

  b) Para todo abierto (b´sico) G de Y se cumple que f −1 [G] es abierto en X.
                         a

  c) Para todo cerrado C de Y se cumple que f −1 [C] es cerrado en X.

  d) Para todo A ⊂ X se cumple f [A] ⊂ f [A].

  e) Para todo B ⊂ Y se cumple f −1 [B] ⊂ f −1 [B].

  f ) Para todo B ⊂ Y se cumple f −1 [int B] ⊂ int f −1 [B].

   Demostracion: a) ↔ b). Si f es continua y x ∈ f −1 [G] entonces f (x) ∈ G,
                 ´
luego G es un entorno de f (x), luego por definici´n de continuidad f −1 [G] es
                                                    o
un entorno de x, luego f −1 [G] es abierto. Es claro que b) → a).
   Evidentemente b) ↔ c).
   a) → d). Si x ∈ f [A] entonces x = f (y), con y ∈ A. Si E es un entorno de x,
por definici´n de continuidad f −1 [E] es un entorno de y, luego f −1 [E] ∩ A 6= ∅,
            o
de donde E ∩ f [A] 6= ∅, lo que prueba que x ∈ f [A].
                                                   £       §      £        §
   d) → e). Tenemos que f −1 [B] ⊂ X, luego f f −1 [B] ⊂ f f −1 [B] ⊂ B,
luego f −1 [B] ⊂ f −1 [B].
22                                                             Cap´
                                                                  ıtulo 1. Topolog´
                                                                                  ıa

     e) → f). En efecto:
                         £               §
      f −1 [int B] = f −1 Y  (Y  int B) = X  f −1 [Y  int B]
                   = X  f −1 [Y  B] ⊂ X  f −1 [Y  B] = X  X  f −1 [B]
                   = X  (X  int f −1 [B]) = int f −1 [B].

     f) → b). Si B es abierto en Y , entonces

                   f −1 [B] = f −1 [int B] ⊂ int f −1 [B] ⊂ f −1 [B],

luego f −1 [B] = int f −1 [B] que es, por lo tanto, abierto.
   Ahora vamos a probar una serie de resultados generales que nos permitir´n
                                                                           a
reconocer en muchos casos la continuidad de una aplicaci´n de forma inmediata.
                                                        o
De la propia definici´n de continuidad se sigue inmediatamente:
                    o

Teorema 1.47 Si f : X −→ Y es continua en un punto x y g : Y −→ Z es
continua en f (x), entonces f ◦g es continua en x. En particular, la composici´n
                                                                              o
de aplicaciones continuas es una aplicaci´n continua.
                                          o

   Otro hecho b´sico es que la continuidad depende s´lo de la topolog´ en la
                a                                   o                ıa
imagen y no de la del espacio de llegada.

Teorema 1.48 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos.
                                              o                   o
Entonces f es continua en un punto x ∈ X como aplicaci´n f : X −→ Y si y
                                                      o
s´lo si lo es como aplicaci´n f : X −→ f [X].
 o                         o

                  ´
   Demostracion: Un entorno de f (x) en f [X] es U ∩ f [X], donde U es un
entorno de f (x) en Y , pero f −1 [U ∩ A] = f −1 [U ], luego es indistinto considerar
entornos en f [X] o en Y .
   Teniendo en cuenta que la aplicaci´n identidad en un conjunto es obviamente
                                     o
continua, de los teoremas anteriores se deduce inmediatamente el que sigue:

Teorema 1.49 Si X es un espacio topol´gico y A ⊂ X, entonces la inclusi´n
                                          o                               o
i : A −→ X dada por i(x) = x es continua. Por tanto, si f : X −→ Y es
continua en un punto x ∈ A, la restricci´n f |A = i ◦ f es continua en x.
                                        o

   En particular la restricci´n de una aplicaci´n continua a un subconjunto es
                             o                 o
tambi´n continua. El rec´
     e                   ıproco no es cierto, pero se cumple lo siguiente:

Teorema 1.50 Dada una aplicaci´n f : X −→ Y , si A es un entorno de un
                                  o
punto x ∈ X y f |A es continua en x, entonces f es continua en x.

   Demostracion: Si U es un entorno de f (x) en Y , entonces (f |A )−1 [U ] =
                ´
 −1
f [U ] ∩ A es un entorno de x en A, luego existe un entorno G de x en X de
manera que x ∈ G ∩ A = f −1 [U ] ∩ A, luego en particular x ∈ G ∩ A ⊂ f −1 [U ],
y G ∩ A es un entorno de x en X, luego f −1 [U ] tambi´n lo es.
                                                      e
1.5. Continuidad                                                                              23

    Esto significa que la continuidad es una propiedad local, es decir, el que una
funci´n sea continua o no en un punto es un hecho que s´lo depende del compor-
     o                                                   o
tamiento de la funci´n en un entorno del punto. En particular, si cubrimos un
                    o
espacio topol´gico por una familia de abiertos, para probar que una aplicaci´n
              o                                                                o
es continua basta ver que lo es su restricci´n a cada uno de los abiertos. Esto es
                                            o
cierto tambi´n si cubrimos el espacio con cerrados a condici´n de que sean un
             e                                                 o
n´mero finito.
 u

Teorema 1.51 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos.
                                                  o                     o
Sean C1 , . . . , Cn subconjuntos cerrados de X tales que X = C1 ∪ · · · ∪ Cn .
Entonces f es continua si y s´lo si cada f |Ci es continua.
                                o

                 ´
   Demostracion: Una implicaci´n es obvia. Si las restricciones son conti-
                                  o
nuas, entonces dado un cerrado C de Y , se cumple que

f −1 [C] = (f −1 [C] ∩ C1 ) ∪ · · · ∪ (f −1 [C] ∩ Cn ) = (f |C1 )−1 [C] ∪ · · · ∪ (f |Cn )−1 [C].

    Ahora, cada (f |Ci )−1 [C] es cerrado en Ci , luego es la intersecci´n con Ci de
                                                                        o
un cerrado de X, luego es la intersecci´n de dos cerrados en X, luego es cerrado
                                        o
en X. As´ pues, f −1 [C] es la uni´n de un n´mero finito de cerrados de X, luego
         ı                         o         u
es cerrado en X. Esto prueba que f es continua.

Teorema 1.52 Si {Xi }i∈I es una familia de espacios topol´gicos, las proyec-
            Q                                            o
ciones pi :   Xi −→ Xi son funciones continuas.
             i∈I

              ´
    Demostracion: Las antiim´genes de abiertos en Xi son abiertos b´sicos
                            a                                      a
del producto.

Ejercicio: Probar que la topolog´ producto es la menor topolog´ que hace continuas
                                ıa                            ıa
a las proyecciones.


Teorema 1.53 Si {Xi }i∈I es una familia de espacios Q ogicos y X es un
                                                     topol´
espacio topol´gico, entonces una aplicaci´n f : X −→ Xi es continua si y
              o                            o
s´lo si lo son todas las funciones fi = f ◦ pi .
 o                                                  i∈I


                       ´
    Demostracion: Si f es continua las funciones f ◦ pi tambi´n lo son por ser
                                                                      e
composici´n de funciones continuas. Q
           o
    Si cada f ◦ pi es continua, sea A =           Ai un abierto b´sico del producto.
                                                                 a
                                              i∈I                         £         §
                             ındices tales que Aij 6= Xij . Entonces f −1 p−1 [Aij ] =
    Sean i1 , . . . , in los ´                                              ij
(f ◦ pij )−1 [Aij ] es abierto en X, pero
                        n
                                                             n
                                                                       £          §
                   A=         p−1 [Aij ]
                               ij          y f   −1
                                                      [A] =         f −1 p−1 [Aij ]
                                                                          ij
                        j=1                                   j=1

es abierto en X.
24                                                          Cap´
                                                               ıtulo 1. Topolog´
                                                                               ıa

    As´ por ejemplo, para probar que la aplicaci´n f : R −→ R2 dada por
       ı,                                          o
f (x) = (x + 1, x2 ) es continua, basta probar que lo son las aplicaciones x + 1
y x2 .

Definici´n 1.54 Sean E y F espacios normados. Una aplicaci´n f : E −→ F
          o                                                       o
tiene la propiedad de Lipschitz si existe un M > 0 tal que para todos los vectores
v, w ∈ E se cumple que kf (v) − f (w)k ≤ M kv − wk.

Teorema 1.55 Las aplicaciones con la propiedad de Lipschitz son continuas.
                ´
   Demostracion: Sea f : E −→ F una aplicaci´n con la propiedad de
                                                   o
Lipschitz con constante M . Vamos a aplicar el teorema 1.45. Dado ≤ > 0
tomamos δ = ≤/M . As´ si kv−wk < δ, entonces kf (v)−f (w)k ≤ M kv−wk < ≤.
                     ı,

   Por ejemplo, es f´cil ver que si E es un espacio normado entonces la norma
                    a
k k : E −→ R tiene la propiedad de Lipschitz con constante M = 1, luego es
una aplicaci´n continua. Un ejemplo menos trivial es el de la suma:
            o

Teorema 1.56 Sea E un espacio normado. Entonces la suma + : E ×E −→ E
tiene la propiedad de Lipschitz, luego es continua.
                ´
   Demostracion: Consideraremos a E × E como espacio normado con la
norma k k1 . Entonces, si (u, v), (a, b) ∈ E × E, tenemos que

        k(u + v) − (a + b)k = k(u − a) + (v − b)k ≤ ku − ak + kv − bk
                            = k(u − a, v − b)k1 = k(u, v) − (a, b)k1 .


     El producto no cumple la propiedad de Lipschitz, pero aun as´ es continuo.
                                                                 ı

Teorema 1.57 Sea E un espacio normado. El producto · : K × E −→ E es
una aplicaci´n continua.
            o
              ´
   Demostracion: Veamos que el producto es continuo en un punto (λ, x) de
K × E. Usaremos la norma k k∞ en K × E. Dado ≤ > 0, sea (λ0 , x0 ) ∈ K × E.

      kλ0 x0 − λxk = kλ0 (x0 − x) + (λ0 − λ)xk ≤ |λ0 | kx0 − xk + |λ0 − λ| kxk.

     Tomemos ahora 0 < δ < 1 que cumpla adem´s
                                            a
                                          ≤
                              δ<                 < ≤.
                                   |λ| + kxk + 1
   As´ si k(λ0 , x0 ) − (λ, x)k∞ < δ, entonces |λ0 − λ| < δ y kx0 − xk < δ. En
      ı
particular |λ0 | ≤ |λ| + δ < |λ| + 1. As´
                                        ı
                                      |λ0 |≤        kxk ≤
                kλ0 x0 − λxk <                +              < ≤.
                                 |λ| + kxk + 1 |λ| + kxk + 1
1.5. Continuidad                                                                    25

Definici´n 1.58 Un espacio vectorial topol´gico es un par (V, T), donde V es
         o                                   o
un espacio vectorial sobre K y T es una topolog´ de Hausdorff sobre V de modo
                                               ıa
que las aplicaciones + : V × V −→ V y · : K × V −→ V son continuas.

   Hemos demostrado que todo espacio normado es un espacio vectorial to-
pol´gico.
   o
   En general, si X es un conjunto y V es un espacio vectorial sobre un cuerpo
K, el conjunto V X de todas las aplicaciones de X en V es un espacio vectorial
con las operaciones dadas por (f + g)(x) = f (x) + g(x) y (αf )(x) = αf (x).
    Si X e Y son espacios topol´gicos, llamaremos C(X, Y ) al conjunto de todas
                               o
las aplicaciones continuas de X en Y .
    Si X es un espacio topol´gico y V un espacio vectorial topol´gico, entonces
                             o                                   o
C(X, V ) resulta ser un subespacio de V X , pues la suma de dos funciones conti-
nuas f y g puede °obtenerse como composici´n de la aplicaci´n h : X −→ V × V
                             ¢               o              o
dada por h(x) = f (x), g(x) , que es continua, y la suma en V , que tambi´n lo
                                                                           e
es, luego f + g es continua.
    Similarmente se prueba que si α ∈ K y f ∈ C(X, V ), entonces αf ∈ C(X, V ).
    El espacio KX tiene tambi´n estructura de anillo conmutativo y unitario con
                              e
el producto dado por (f g)(x) = f (x)g(x). Como el producto · : K × K −→ K es
continuo (tomando E = K en el teorema anterior), resulta que C(X, K) es un
subanillo de KX .
    En general, una cu´drupla (A, +, ·, ◦), donde la terna (A, +, ·) es un espacio
                       a
vectorial sobre un cuerpo K, la terna (A, +, ◦) es un anillo unitario y adem´s  a
α(ab) = (αa)b = a(αb) para todo α ∈ K, y todos los a, b ∈ A, se llama una
K-´lgebra.
   a
    Tenemos, pues, que si X es un espacio topol´gico, entonces C(X, K) es una
                                                 o
K-´lgebra de funciones. El espacio C(X, K) contiene un subcuerpo isomorfo a
   a
K, a saber, el espacio de las funciones constantes. Cuando no haya confusi´n   o
identificaremos las funciones constantes con los elementos de K, de modo que 2
representar´ a la funci´n que toma el valor 2 sobre todos los puntos de X.
            a          o
    M´s a´n, si p(x1 , . . . , xn ) ∈ K[x1 , . . . , xn ], el polinomio p determina una
      a u
unica funci´n evaluaci´n p : Kn −→ K, de modo que los polinomios constan-
´           o          o
tes se corresponden con las funciones constantes y la indeterminada xi con la
proyecci´n en la i-´sima coordenada. Como todo polinomio es combinaci´n de
        o          e                                                              o
sumas y productos de constantes e indeterminadas, tenemos que K[x1 , . . . , xn ] ⊂
C(Kn , K).
    Por ejemplo, la aplicaci´n f : R3 −→ R2 dada por f (x, y, z) = (3x−2yz, xyz)
                            o
es claramente continua.

Teorema 1.59 La aplicaci´n h : K  {0} −→ K dada por h(x) = 1/x es conti-
                        o
nua.

    DemostracioØ Sea x ∈ K  {0}. Sea δ = |x|/2. Si y ∈ Bδ (x) entonces
                  ´ n:              Ø
| − x − (y − x)| ≥ Ø| − x| − |y − x|Ø, o sea, |y| ≥ |x| − δ = δ.
26                                                                   Cap´
                                                                        ıtulo 1. Topolog´
                                                                                        ıa

     Dado ≤ > 0, sea δ 0 < 1, δ 0 < δ|x|≤. As´ si |y − x| < δ 0 tenemos
                                              ı,
                          Ø        Ø
                          Ø1       Ø
                          Ø − 1 Ø = |y − x| < δ|x|≤ = ≤.
                          Øy xØ         |y| |x|    δ|x|


    Consecuentemente, si f ∈ C(X, K) y f no se anula en X, podemos definir
la funci´n 1/f ∈ C(X, K) mediante (1/f )(x) = 1/f (x).
        o
     Por ejemplo, la funci´n f : R  {1} −→ R dada por
                          o
                                                  x2
                                       f (x) =
                                                 x−1
es obviamente continua.
                                  √
Teorema 1.60 La funci´n
                     o                : [0, +∞[ −→ [0, +∞[ es continua.
                 ´
   Demostracion: Basta notar que
           √                  √                                §     £
             x ∈ ]a, b[ ↔ a < x < b ↔ a2 < x < b2 ↔ x ∈ a2 , b2 .
                                                                    §       £
Esto significa que la antiimagen del intervalo ]a, b[ es el intervalo a2 , b2 . Simi-
                                                                           £ 2£
larmente se ve que la antiimagen de un intervalo [0, b[ es el intervalo 0, b y,
                                                                         √
como estos intervalos constituyen una base de [0, +∞[, tenemos que            es una
funci´n continua.
     o

Teorema 1.61 Sea M un espacio m´trico y A 6= ∅ un subconjunto de M .
                                     e
Entonces las aplicaciones d : M × M −→ R y d( , A) : M −→ R son continuas.
                      ´
    Demostracion: Consideremos en M × M la distancia d∞ . Dado un par
(x, y) ∈ M × M , y un ≤ > 0, basta probar que si (x0 , y 0 ) dista de (x, y) menos
de ≤/2, es decir, si se cumple d(x, x0 ) < ≤/2 y d(y, y 0 ) < ≤/2, entonces tenemos
|d(x, y) − d(x0 , y 0 )| < ≤. En efecto, en tal caso
               d(x, y) ≤ d(x, x0 ) + d(x0 , y 0 ) + d(y 0 , y) < d(x0 , y 0 ) + ≤,
luego d(x, y) − d(x0 , y 0 ) < ≤, e igualmente se llega a d(x0 , y 0 ) − d(x, y) < ≤, luego
efectivamente |d(x, y) − d(x0 , y 0 )| < ≤.
     Para probar la continuidad de d( , A) en un punto x observamos que
                              |d(x, A) − d(y, A)| ≤ d(x, y).
En efecto, para todo z ∈ A se cumple d(x, z) ≤ d(x, y) + d(y, z). De aqu´ se    ı
sigue claramente d(x, A) ≤ d(x, y) + d(y, z), y tomando el ´ ınfimo en z vemos que
d(x, A) ≤ d(x, y) + d(y, A). Similarmente se prueba d(y, A) ≤ d(x, y) + d(x, A),
de donde se sigue la relaci´n con valores absolutos. A su vez esta relaci´n implica
                           o                                             o
que si d(x, y) < ≤, entonces |d(x, A) − d(y, A)| < ≤, lo que expresa la continuidad
de la aplicaci´n.
              o
   Para terminar con las propiedades generales de las aplicaciones continuas
probaremos un hecho de inter´s te´rico:
                            e    o
1.5. Continuidad                                                                 27

Teorema 1.62 Sean f, g : X −→ Y aplicaciones continuas, D ⊂ X un con-
junto denso tal que f |D = g|D y supongamos que Y es un espacio de Hausdorff.
Entonces f = g.
                                                                 °         ¢
                 ´
   Demostracion: Sea h : X −→ Y × Y dada por h(x) = f (x), g(x) .
Claramente es continua y h[D] ⊂ ∆, donde ∆ = {(y, y) | y ∈ Y } es un cerrado
en Y × Y (por 1.39). Por lo tanto h[X] = h[D] ⊂ h[D] ⊂ ∆, de donde f = g.


Definici´n 1.63 Una aplicaci´n biyectiva f : X −→ Y entre dos espacios
         o                    o
topol´gicos es un homeomorfismo si f y su inversa son ambas continuas. Dos
     o
espacios topol´gicos son homeomorfos si existe un homeomorfismo entre ellos.
              o

    Un homeomorfismo induce una biyecci´n entre los abiertos de los dos es-
                                        o
pacios, por lo que ambos son topol´gicamente indistinguibles. Es claro que
                                   o
cualquier propiedad definida exclusivamente a partir de la topolog´ se con-
                                                                 ıa
serva por homeomorfismos, luego dos espacios homeomorfos tienen las mismas
propiedades topol´gicas.
                 o
    Es importante notar que no toda biyecci´n continua es un homeomorfismo.
                                           o
Por ejemplo, la identidad I : R −→ R, cuando en el primer espacio consideramos
la topolog´ discreta y en el segundo la eucl´
          ıa                                ıdea es biyectiva y continua, pero
no un homeomorfismo. Veamos un ejemplo m´s intuitivo:
                                              a
                                                   2
Ejemplo Sea f : [0, 1] ∪ ]2, 3] −→ [0, 2] la
aplicaci´n dada por
        o
                Ω                                  1
                  x     si 0 ≤ x ≤ 1
        f (x) =
                  x − 1 si 2 < x ≤ 3
                                                    0
     Es f´cil ver que f es biyectiva, y es continua
         a
porque sus restricciones a los abiertos [0, 1] y          0       1      2      3
]2, 3] de su dominio son ambas continuas (son polinomios). Sin embargo no
es un homeomorfismo. La aplicaci´n f −1 es continua en todos los puntos de
                                        o
[0, 2] excepto en x = 1. En efecto, [0, 1] es un entorno de f −1 (1) = 1, pero la
antiimagen de este intervalo es el mismo [0, 1], que no es un entorno de 1 en
[0, 2]. En los dem´s puntos es continua, pues f −1 restringida a los abiertos de
                     a
su dominio [0, 1[ y ]1, 2] es polin´mica.
                                    o
     Lo que sucede es que, a pesar de ser biyectiva, f est´ “pegando” los intervalos
                                                           a
[0, 1] y ]2, 3] en el intervalo [0, 2], por lo que f −1 “corta” ´ste por el punto 1.
                                                                e
En general, si una aplicaci´n continua es una aplicaci´n que no corta, aunque
                               o                            o
puede pegar, un homeomorfismo es una aplicaci´n que no corta ni pega. Para
                                                      o
que no pegue ha de ser biyectiva, pero acabamos de ver que esto no es suficiente.
El ejemplo de la topolog´ discreta se interpreta igual: los puntos de R con la
                            ıa
topolog´ discreta est´n todos “separados” entre s´ luego al pasar a R con la
         ıa              a                              ı,
topolog´ eucl´
         ıa      ıdea los estamos “pegando”, aunque no identifiquemos puntos.
28                                                                Cap´
                                                                     ıtulo 1. Topolog´
                                                                                     ıa

Definici´n 1.64 Una aplicaci´n f : X −→ Y entre dos espacios topol´gicos es
         o                     o                                       o
abierta si para todo abierto A de X, se cumple que f [A] es abierto en Y .

   De este modo, un homeomorfismo es una biyecci´n continua y abierta. La
                                                    o
propiedad de ser abierta no es muy intuitiva y tampoco es muy frecuente (salvo
en el caso de los homeomorfismos). Sin embargo es de destacar el hecho si-
guiente:

Teorema 1.65 Las proyecciones de un espacio producto en cada uno de sus
factores son aplicaciones abiertas.

                  ´
   Demostracion: Basta ver que la proyecci´n de un abierto b´sico es un
                                                 o                   a
abierto, pero los abiertos b´sicos son productos de abiertos, y las proyecciones
                            a
son sus factores.

Definici´n 1.66 La gr´fica de una aplicaci´n f : X −→ Y es el conjunto1
       o            a                   o
                     n°        ¢                o
                       x, f (x) ∈ X × Y | x ∈ X .

    En los casos de funciones f : A ⊂ Rm −→ Rn , donde m + n ≤ 3 la gr´fica de
                                                                           a
f tiene una interpretaci´n en el plano o espacio eucl´
                        o                            ıdeo intuitivos, y esta repre-
sentaci´n permite reconocer r´pidamente las caracter´
       o                       a                       ısticas de f . El resultado
m´s importante por lo que a la continuidad se refiere es el siguiente:
  a

Teorema 1.67 Si f : X −→ Y es una aplicaci´n continua, entonces la apli-
           °        ¢                       o
caci´n x 7→ x, f (x) es un homeomorfismo entre X y la gr´fica de f .
    o                                                  a

                  ´
   Demostracion: La aplicaci´n es obviamente biyectiva y continua. Su
                                   o
inversa es la restricci´n a la gr´fica de la proyecci´n sobre el primer factor de
                       o         a                  o
X × Y , luego tambi´n es continua.
                     e


Ejemplo La gr´fica del polinomio x3 − x es la siguiente:
             a
                                            2


                                          1.5


                                            1


                                          0.5



                           -2      -1                1        2

                                         -0.5


                                           -1


                                         -1.5


                                           -2

     1 Observar
              que desde el punto de vista de la teor´ de conjuntos la gr´fica de una funci´n
                                                    ıa                  a                o
f es la propia funci´n f como conjunto.
                    o
1.5. Continuidad                                                                29

    El lector deber´ preguntarse c´mo se sabe que la gr´fica de f tiene esta
                      ıa               o                     a
forma y no otra. M´s adelante veremos c´mo determinar anal´
                         a                     o                    ıticamente las
caracter´ ısticas de la gr´fica de una funci´n, pero de momento nos bastar´ con
                           a                 o                              a
lo siguiente:
    Para obtener una figura como la anterior, basta programar a un ordenador
para que calcule la funci´n considerada sobre los suficientes n´meros racionales,
                             o                                   u
digamos sobre los n´meros de la forma k/100, donde k var´ entre −200 y 200,
                       u                            °      ¢  ıa
y dibuje un peque˜o cuadrado con coordenadas x, f (x) . El resultado es una
                     n
gr´fica como la que hemos mostrado. El proceso s´lo involucra la aritm´tica de
  a                                                  o                    e
los n´meros racionales, que no tiene ninguna dificultad.
      u
    Vemos que la gr´fica de f es una l´
                        a                   ınea ondulada. Podemos considerarla
como una imagen “t´     ıpica” de espacio homeomorfo a R. Se obtiene deformando
la recta “el´sticamente”, sin cortarla ni pegarla. La aplicaci´n f no es un
               a                                                   o
homeomorfismo, la gr´fica muestra c´mo transforma a R en su imagen: ´sta
                          a               o                                   e
resulta de “aplastar” la curva sobre el eje vertical, con lo que R se “pliega”
sobre s´ mismo, de modo que parte de sus puntos se superponen tres a tres.
        ı

   Veamos ahora un ejemplo de gr´fica de una funci´n discontinua.
                                a                o

Ejemplo Consideremos la funci´n f
                             o          : R −→ [0, 1] dada por
                            
                             1          si x ≤ 0
                    f (x) =    x         si 0 < x < 1
                            
                               1         si x ≥ 1

   Su gr´fica es la siguiente:
        a




     Es claro que f es continua en todo punto distinto de 0. En efecto, su res-
tricci´n al abierto ]−∞, 0[ es constante, luego continua, su restricci´n al abierto
       o                                                              o
]0, +∞[ tambi´n es continua, pues este abierto es a su vez uni´n de dos cerrados,
               e                                               o
]0, 1] y [1, +∞[, en los cuales f es continua, pues en el primero es el polinomio
x y en el segundo es constante. Es f´cil ver que f no es continua en 0.
                                       a
     La gr´fica de f no es homeomorfa a R. No estamos en condiciones de pro-
           a                        °       ¢
barlo ahora. Es f´cil ver que x 7→ x, f (x) no es un homeomorfismo, pero esto
                   a
no prueba que no exista otra biyecci´n que s´ lo sea. De todos modos, intui-
                                         o      ı
tivamente vemos que la gr´fica est´ formada por dos piezas, por lo que para
                             a        a
transformar R en la gr´fica es necesario “cortar” por alg´n punto.
                         a                                 u


Ejemplo Los homeomorfismos no pueden “cortar” ni “pegar”, pero s´ “esti- ı
rar” arbitrariamente un conjunto. Por ejemplo, la homotecia f (x) = ax, donde
a > 0 transforma el intervalo [−1, 1] en el intervalo [−a, a]. Las traslaciones
30                                                           Cap´
                                                                ıtulo 1. Topolog´
                                                                                ıa

x 7→ x + b son claramente homeomorfismos de R, luego combinando homote-
cias y traslaciones podemos construir un homeomorfismo entre cualquier par de
intervalos cerrados de la forma [a, b]. Tambi´n es claro que cualquier par de
                                                    e
intervalos abiertos ]a, b[ son homeomorfos entre s´ al igual que cualquier par de
                                                      ı,
intervalos semiabiertos [a, b[ y ]a, b]. En la secci´n siguiente veremos que tambi´n
                                                    o                             e
es posible “estirar infinitamente” un intervalo, de modo que, por ejemplo, ]0, 1[
es homeomorfo a R.


La topolog´ eucl´
            ıa       ıdea Notemos que toda aplicaci´n lineal f : Kn −→ Km es
                                                         o
continua, pues es cada una de sus funciones coordenadas es un polinomio. En
particular todo automorfismo de Kn es un homeomorfismo. Si V es cualquier
K-espacio vectorial de dimensi´n finita n, existe un isomorfismo f : V −→ Kn .
                                 o
Podemos considerar la topolog´ en V formada por los conjuntos f −1 [G], donde
                                 ıa
G es abierto en Kn para la topolog´ eucl´
                                     ıa     ıdea. Es claro que V es as´ un espacio
                                                                          ı
topol´gico homeomorfo a Kn . Adem´s, la topolog´ en V no depende de la
      o                                  a              ıa
elecci´n de f , pues si g : V −→ Kn £ cualquier §otro isomorfismo y G es un
      o                                 es
abierto en Kn , entonces g −1 [G] = f −1 (g −1 ◦ f )[G] y (g −1 ◦ f )[G] es un abierto
en Kn , porque g −1 ◦ f es un isomorfismo y por consiguiente un homeomorfismo.
    M´s a´n, la aplicaci´n k k : V −→ R dada por kvk = kf (v)k es claramente
      a u                o
una norma en V que induce la topolog´ que acabamos de definir. Esto justifica
                                        ıa
las definiciones siguientes:

Definici´n 1.68 Un isomorfismo topol´gico entre dos espacios vectoriales to-
          o                              o
pol´gicos es una aplicaci´n entre ambos que sea a la vez isomorfismo y homeo-
   o                     o
morfismo. Si V es un K-espacio vectorial de dimensi´n finita n, llamaremos
                                                       o
topolog´ eucl´
       ıa     ıdea en V a la unica topolog´ respecto a la cual todos los isomor-
                             ´             ıa
fismos de V en Kn son topol´gicos.
                             o

    Si h : V −→ W es una aplicaci´n lineal entre dos espacios vectoriales de
                                      o
dimensi´n finita, entonces es continua, pues considerando isomorfismos (to-
         o
pol´gicos) f : V −→ Km y g : W −→ Kn tenemos que la aplicaci´n h0 =
   o                                                                       o
f −1 ◦ h ◦ g : Km −→ Kn es lineal, luego continua, luego h = f ◦ h0 ◦ g −1 tambi´n
                                                                                e
es continua.
    Si W es un subespacio de V , entonces la restricci´n a W de la topolog´
                                                         o                    ıa
eucl´
    ıdea en V es la topolog´ eucl´
                              ıa    ıdea. Para probarlo descomponemos V =
W ⊕ W 0 y observamos que la identidad de W con la topolog´ eucl´
                                                            ıa     ıdea a W con
la topolog´ inducida es continua por ser lineal y su inversa es continua por ser
           ıa
la restricci´n de la proyecci´n de V en W , que tambi´n es lineal. Por lo tanto
            o                o                         e
se trata de un homeomorfismo y ambas topolog´ coinciden.
                                                ıas
   Similarmente se prueba que la topolog´ eucl´
                                          ıa    ıdea en un producto de espacios
vectoriales coincide con el producto de las topolog´ eucl´
                                                   ıas    ıdeas.
   Todo subespacio W de un espacio vectorial de dimensi´n finita V es cerrado.
                                                         o
Para probarlo observamos que W puede expresarse como el n´cleo de una apli-
                                                              u
caci´n lineal de W en Kn , es decir, como la antiimagen de 0 por una aplicaci´n
    o                                                                        o
continua y, como {0} es cerrado, su antiimagen tambi´n.
                                                      e
1.5. Continuidad                                                               31

   Todos estos hechos se trasladan sin dificultad a los espacios afines sobre
K. Se define la topolog´ eucl´
                       ıa      ıdea en un espacio af´ de modo que todas las
                                                    ın
afinidades son continuas y las variedades afines son cerradas.

*Ejemplo: La topolog´ proyectiva Un espacio proyectivo sobre K es de
                          ıa
la forma X = P(V ), donde V es un K-espacio vectorial de dimensi´n n + 1.
                                                                       o
Consideremos la aplicaci´n P : V  {~ −→ X dada por P (~ ) = h~ i. Vamos
                          o            0}                     v      v
a considerar en X la menor topolog´ que hace continua a P , es decir, los
                                       ıa
abiertos de X ser´n los conjuntos G ⊂ X tales que P −1 [G] es abierto en V
                   a
(respecto a la topolog´ eucl´
                       ıa    ıdea). Es f´cil ver que los conjuntos as´ definidos
                                          a                          ı
determinan realmente una topolog´ en X. En lo sucesivo consideraremos a
                                    ıa
todos los espacios proyectivos como espacios topol´gicos con esta topolog´ La
                                                  o                      ıa.
llamaremos topolog´ proyectiva. Vamos a probar algunos hechos en torno a
                    ıa
ella:

     La proyecci´n P : V  {~ −→ X es continua, abierta y suprayectiva.
                o           0}

   S´lo hemos de comprobar que es abierta. Sea G un abierto en V {~ Hemos
    o                 £   §                                         0}.
de ver que G0 = P −1 P [G] es abierto en V  {~ Es claro que G ⊂ G0 . Sea
                                               0}.
~ ∈ G. Esto significa que existe un w ∈ G tal que P (~ ) = P (w), luego ~ = αw,
v                                  ~                 v       ~         v      ~
para un α ∈ K. La homotecia h(~ ) = α~ es un homeomorfismo que transforma
                                x     x
G en un entorno de ~ . Adem´s h[G] ⊂ h[G0 ] = G0 , luego G0 es entorno de ~ .
                    v       a                                             v

     Las homograf´ entre espacios proyectivos son homeomorfismos.
                 ıas

     Dada una homograf´ H : X −→ Y , sea h : V −→ W el isomorfismo que
                         ıa
la induce, que de hecho es un homeomorfismo. Sean P : V  {~ −→ X y  0}
P 0 : W  {~ −→ Y las proyecciones que definen la topolog´ Entonces, si G es
           0}                                                ıa.    £         §
abierto en Y , por definici´n P 0−1 [G] es abierto en W {~ luego h−1 P 0−1 [G] es
                          o                              0},
                                                                       £ −1 §
abierto en V {~ pero es f´cil ver que este conjunto coincide con P −1 H [G] ,
                0},         a
luego H −1 [G] es abierto, y el mismo razonamiento se aplica a la homograf´     ıa
inversa.

     Si E es un hiperplano de V que no pasa por ~ entonces P [E] es
                                                 0,
     abierto en X y P |E : E −→ P [E] es un homeomorfismo.

    Claramente P |E es inyectiva y continua. Basta£probar que si A es abierto
                                                           §
en E entonces P [A] es abierto en X. Sea B = P −1 P [A] . Basta ver que B es
abierto en V  {~ Es claro que B = {α~ | α ∈ K  {0}, ~ ∈ A}.
                0}.                       v               v
    Escogiendo una base adecuada ~1 , . . . , ~n+1 en V podemos suponer que E
                                    v         v
est´ formado por los vectores con ultima coordenada es xn+1 = 1. Para cada
   a                               ´
~ ∈ V sea α(~ ) su ultima coordenada. La aplicaci´n α es continua. Sea G el
v            v      ´                                 o
conjunto de vectores de V §
                       £   con α(~ ) 6= 0. Tenemos que G es abierto, pues su
                                  v
complementario es α−1 {0} . La aplicaci´n G −→ E dada por ~ 7→ α(~ )−1 ~ es
                                          o                    v      v    v
continua y B es la antiimagen de A por esta aplicaci´n, luego es abierto en G,
                                                        o
luego en V  {~
              0}.

     Las subvariedades proyectivas de X son cerradas.
32                                                          Cap´
                                                               ıtulo 1. Topolog´
                                                                               ıa

    Dado un hiperplano E en V que no pase por 0, tenemos que el comple-
mentario de P [E] es un hiperplano de X y, seg´n lo que acabamos de probar,
                                                u
es cerrado. Como existe una homograf´ que transforma un hiperplano en otro
                                       ıa
cualquiera, concluimos que todos los hiperplanos son cerrados y, como toda sub-
variedad proyectiva es intersecci´n de un n´mero finito de hiperplanos, resulta
                                 o         u
que todas las subvariedades de X son cerradas.

      La topolog´ inducida por X en una subvariedad proyectiva Y es la
                ıa
      topolog´ proyectiva de Y .
             ıa

    Sea Y = P(W ). Tomemos un punto y ∈ Y . Sea Π un hiperplano en X que
no contenga a y, sea Π0 = Y ∩ Π. Entonces una base de entornos de y para
las topolog´ de X e Y son los abiertos que contienen a y y est´n contenidos
            ıas                                                  a
en X  Π e Y  Π0 respectivamente. Las topolog´ de estos espacios son las
                                                  ıas
eucl´
    ıdeas, luego una es la inducida por la otra, luego los entornos b´sicos de
                                                                     a
y en Y son las intersecciones con Y de los entornos b´sicos de y en X. Por
                                                       a
consiguiente, la topolog´ proyectiva y la topolog´ inducida tienen una misma
                        ıa                       ıa
base de entornos de cada punto, luego son iguales.
   Para terminar describiremos la topolog´ de la recta proyectiva compleja.
                                            ıa
Tenemos que P1 (C) = C ∪ {∞}. La topolog´ en C es la eucl´
                                               ıa               ıdea. S´lo falta
                                                                       o
determinar los entornos de ∞. Como la aplicaci´n 1/z es un homeomorfismo,
                                                  o
una base de entornos de ∞ la forman las im´genes por 1/z de los elementos de
                                             a
una base de entornos de 0, por ejemplo las bolas abiertas eucl´
                                                              ıdeas de centro 0.
Pero la imagen de B≤ (0) est´ formada por ∞ y los puntos z ∈ C tales que |z| >
                            a
1/≤, luego una base de entornos abiertos de ∞ la forman los complementarios
de las bolas cerradas de centro 0. Es f´cil ver entonces que un conjunto U es
                                       a
un entorno de ∞ si y s´lo si ∞ ∈ U y U  {∞} est´ acotado. Esta misma
                         o                             a
descripci´n vale para los entornos de ∞ en P1 (R).
         o
Ejercicio: Probar que las homograf´ entre c´nicas y rectas son homeomorfismos.
                                  ıas      o

Ejemplo: La proyecci´n estereogr´fica Consideremos la esfera de centro
                           o               a
(0, 0, 0) y radio 1, es decir, el conjunto S = {(x, y, z) ∈ R3 | x2 + y 2 + z 2 = 1}.
Sea N = (0, 0, 1) el “polo norte” de S.
    La proyecci´n estereogr´fica es la biyecci´n entre S  {N } y R2 que a cada
                 o             a               o
punto P de S le asigna el punto donde la recta N P corta al plano z = 0 (que
podemos identificar con R2 ). Si P tiene coordenadas (x, y, z), la recta N P
est´ formada por los puntos (0, 0, 1) + λ(x, y, x − 1), con λ ∈ R. El valor de
   a
λ que anula la tercera coordenada es el que cumple 1 + λ(z − 1) = 0, o sea,
λ = 1/(1 − z), luego la proyecci´n de P es el punto
                                    o
                                          µ            ∂
                                             x    y
                            f (x, y, z) =      ,          .
                                            1−z 1−z

Similarmente se calcula la proyecci´n inversa, que es
                                   o
                       µ                                         ∂
                              2u           2v       u2 + v 2 − 1
             g(u, v) =               ,            ,                .
                         u2 + v 2 + 1 u2 + v 2 + 1 u2 + v 2 + 1
1.5. Continuidad                                                                         33

    Es evidente que tanto f como g son continuas, luego la proyecci´n este-
                                                                          o
reogr´fica es un homeomorfismo. As´ pues, el plano es homeomorfo a una esfera
     a                                  ı
menos un punto.
    Equivalentemente, podemos decir que la esfera es homeomorfa al plano m´s     a
un punto (extendiendo adecuadamente la topolog´       ıa). Conviene identificar el
plano con el cuerpo complejo C. A˜adamos a C un punto cualquiera que repre-
                                      n
sentaremos por ∞, con lo que formamos el conjunto C∞ = C ∪ {∞}. Podemos
extender la proyecci´n estereogr´fica a una biyecci´n f : S −→ C∞ sin m´s que
                     o            a                  o                      a
asignar f (N ) = ∞. Es obvio que si tomamos como abiertos en C∞ las im´genesa
por f de los abiertos de S obtendremos una topolog´ en C∞ que induce en
                                                          ıa
C la topolog´ eucl´
              ıa    ıdea. Vamos a dar una descripci´n directa de una base de
                                                        o
entornos de ∞.
    Para ello consideramos una base de entornos de N en S, concretamente la
formada por las bolas de radio menor que 1. p entorno b´sico de N est´
                                                  Un             a                a
formado por los puntos (x, y, x) ∈ S tales que x2 + y 2 + (z − 1)2 < ≤ < 1, y
como x2 +y 2 +z 2 = 1, esto equivale a z > 1−≤2 /2. Puesto que ≤ es arbitrario, los
entornos b´sicos est´n formados por los puntos (x, y, z) ∈ S tales que 1 − z < ≤,
           a         a
para ≤ > 0. Calculemos la imagen de uno de estos entornos.
    Para ello notamos que si (x, y, z) 6= N ,
                                              r
                                                1+z
                              |f (x, y, z)| =       ,
                                                1−z
y que si z < z 0 entonces z − zz 0 < z 0 − zz 0 , luego
                        r                 r                   r           r
       z         z0             2z                  2z 0          1+z         1 + z0
            <        ,     1+         < 1+                ,           <              .
     1−z       1−z             1−z                 1 − z0         1−z         1 − z0
    En otras palabras, cuanto mayor es z, mayor es la distancia a 0 de f (x, y, z).
Por consiguiente, los puntos tales que z > 1 − ≤ se corresponden con los puntos
tales que                                                r
                                                           2
                     |f (x, y, z)| > |f (x, y, 1 − ≤)| =     − 1.
                                                           ≤
    Ahora bien, cualquier M > 0 es de esta forma para alg´n ´psilon, concre-
                                                                   u e
tamente ≤ = 2/(M 2 + 1). Concluimos que los entornos b´sicos de ∞ son los
                                                                  a
conjuntos de la forma
                             {z ∈ C | |z| > M } ∪ {∞}.
Esto significa que un punto del plano est´ m´s cerca de infinito cuanto m´s
                                            a a                               a
lejos est´ de 0 (de hecho, cuanto m´s lejos est´ de cualquier punto concreto del
         a                         a           a
plano).
*Nota Obviamente C∞ es la recta proyectiva compleja con la topolog´ pro-    ıa
yectiva. Otra forma de llegar al mismo resultado es la siguiente: Si consi-
deramos la proyecci´n estereogr´fica entre S y la recta proyectiva compleja,
                      o             a
podemos expresarla como f (x, y, z) = h(x, y, 1 − z)i, es decir, como la compo-
sici´n de la aplicaci´n continua (x, y, z) 7→ (x, y, 1 − z) con la aplicaci´n con-
    o                 o                                                    o
tinua (x, y, z) 7→ h(x, y, z)i, luego es continua. Podr´ıamos probar tambi´n que
                                                                            e
34                                                        Cap´
                                                             ıtulo 1. Topolog´
                                                                             ıa

la inversa es continua, pero no merece la pena el esfuerzo, pues en el cap´ıtulo
siguiente (ver 2.12) ser´ evidente a partir de lo que ya hemos probado. La con-
                         a
clusi´n es, pues, que la proyecci´n estereogr´fica es un homeomorfismo entre la
     o                           o            a
esfera con la topolog´ eucl´
                      ıa    ıdea y la recta compleja con la topolog´ proyectiva.
                                                                   ıa
    De aqu´ se sigue f´cilmente que si dotamos al plano hiperb´lico de la topo-
           ı           a                                          o
log´ relativa (es decir, si dotamos al plano de Klein con la topolog´ eucl´
   ıa                                                                 ıa     ıdea)
entonces la topolog´ correspondiente en el c´
                    ıa                       ırculo y en el semiplano de Poincar´e
es tambi´n la eucl´
         e         ıdea. Teniendo en cuenta que los c´   ırculos de centro 0 en el
plano de Klein coinciden con los eucl´ıdeos (y que las isometr´ son obviamente
                                                               ıas
homeomorfismos) es claro que la esta topolog´ es la inducida por la m´trica
                                                ıa                          e
hiperb´lica.
      o


1.6     L´
         ımites de funciones
   El concepto de l´ımite es, junto al de continuidad, uno de los conceptos m´s
                                                                             a
importantes a los que la estructura topol´gica sirve de©
                                         o             soporte. Para comprender
                                                            ™
su contenido podemos considerar la funci´n f : R2  (0, 0) −→ R dada por
                                           o
                                      √                !
                                             2
                         f (x, y) = x2 p           −1 .
                                          x2 + y 2

   Esta expresi´n no tiene sentido cuando (x, y) = (0, 0), por lo que es natural
                o
preguntarse si la gr´fica de f mostrar´ alguna particularidad que explique por
                    a                a
qu´ no puede ser calculada en este punto. He aqu´ dicha gr´fica:
  e                                              ı          a




    Su aspecto es el de una superficie homeomorfa a R2 , pero sabemos que no
est´ definida en (0, 0). De hecho la gr´fica hace pensar que f (0, 0) = 0. La
   a                                       a
explicaci´n es que la funci´n f : R2 −→ R definida mediante
         o                  o
                              µ             ∂
                           2 √ 2
                             x             −1  si (x, y) 6= (0, 0),
               f (x, y) =          x2 +y 2
                          
                             0                 si (x, y) = (0, 0)

es continua, aunque esto no es evidente y, de hecho, no estamos en condiciones de
probarlo ahora. Si queremos expresar la situaci´n en t´rminos de la expresi´n
                                                  o       e                    o
original de f , no definida en (0, 0), habremos de decir que f transforma los
1.6. L´
      ımites de funciones                                                         35

puntos de alrededor de (0, 0) en puntos de alrededor de 0, o tambi´n, que los
                                                                  e
valores que toma f son m´s cercanos a 0 cuanto m´s cercanos a (0, 0) son los
                          a                       a
puntos que consideramos. Todo esto tiene sentido aunque la funci´n f no est´
                                                                o           e
definida en (0, 0).
    Comenzamos introduciendo el concepto topol´gico que permite expresar con
                                               o
rigor las ideas que acabamos de introducir:

Definici´n 1.69 Sean X, Y espacios topol´gicos, A ⊂ X y f : A −→ Y . Sea
         o                                 o
a ∈ A0 y b ∈ Y . Diremos que f converge a b cuando x tiende a a si para todo
entorno V de b existe un entorno U de a tal que si x ∈ U ∩ A y x 6= a, entonces
f (x) ∈ V .

   La interpretaci´n es clara: los puntos f (x) est´n alrededor de b [= en un
                   o                               a
entorno arbitrario V de b] siempre que x est´ alrededor de a [= en un entorno
                                            a
adecuado U de a, que depender´ de V ], o m´s simplemente: si f env´ los puntos
                               a          a                       ıa
de alrededor de a a los alrededores de b.
    Si Y es un espacio de Hausdorff, una funci´n converge a lo sumo a un unico b
                                              o                              ´
para cada punto a. En efecto, si f converge a dos puntos b y b0 cuando x tiende a
a, podr´ıamos tomar entornos disjuntos V y V 0 de b y b0 , para los cuales existir´
                                                                                  ıan
entornos U y U 0 de a de modo que si x ∈ U ∩ U 0 ∩ A, entonces f (x) ∈ V ∩ V 0 ,
contradicci´n.
            o
   Por ello, si se da la convergencia, diremos que b es el l´
                                                            ımite cuando x tiende
a a de f (x), y lo representaremos por

                                   b = l´ f (x).
                                        ım
                                       x→a

   No exigimos que la funci´n f est´ definida en a. Tan s´lo que a sea un punto
                             o       e                   o
de acumulaci´n del dominio de f o, de lo contrario, no existir´ puntos x a los
              o                                               ıan
que aplicar la definici´n y f converger´ trivialmente a todos los puntos de Y .
                      o                ıa
   En estos t´rminos, lo que afirm´bamos antes es que existe
              e                     a
                                    √               !
                                          2
                          l´
                           ım     x2 p           − 1 = 0,
                      (x,y)→(0,0)       x2 + y 2

de modo que los valores que toma esta expresi´n se acercan m´s a 0 cuanto m´s
                                               o            a              a
se acercan las variables al punto (0, 0). Todav´ no podemos probarlo.
                                               ıa
   Por supuesto es posible que la funci´n f est´ definida en a, pero esto es irrele-
                                         o       e
vante, pues en la definici´n de l´
                          o      ımite aparecen s´lo puntos x 6= a, lo que significa
                                                  o
que el l´
        ımite es independiente de f (a). En otras palabras, si modific´ramos el
                                                                          a
valor de f (a), la existencia del l´
                                   ımite y su valor concreto no se alterar´ıan.
   Tambi´n es obvio que la existencia o no de l´
          e                                        ımite s´lo depende del compor-
                                                          o
tamiento de la funci´n en un entorno del punto. En otras palabras, que si dos
                      o
funciones coinciden en un entorno de un punto a (salvo quiz´ en a) entonces
                                                                  a
ambas tienen l´ ımite en a o ninguna lo tiene y, si lo tienen, ´stos coinciden.
                                                               e
   La relaci´n entre los l´
            o             ımites y la continuidad es la siguiente:
36                                                                     Cap´
                                                                          ıtulo 1. Topolog´
                                                                                          ıa

Teorema 1.70 Sean X, Y espacios topol´gicos y f : X −→ Y . Sea a ∈ X 0 .
                                           o
Entonces f es continua en a si y s´lo si existe l´ f (x) = f (a).
                                  o              ım
                                                            x→a

                 ´
    Demostracion: Si el l´  ımite vale f (a), entonces la definici´n de l´
                                                                 o      ımite se
cumple trivialmente cuando x = a y lo que queda es la definici´n de conti-
                                                                   o
nuidad en a. Rec´ ıprocamente, la definici´n de continuidad de f en a implica
                                           o
trivialmente la definici´n de l´
                       o      ımite con b = f (a).
   Mediante este teorema podemos deducir las propiedades algebraicas de los
l´
 ımites a partir de las propiedades correspondientes de las funciones continuas.
Teorema 1.71 Sean f , g : A ⊂ X −→ K dos funciones definidas sobre un
espacio topol´gico X y sea a ∈ A0 . Si existen
             o
                                   l´ f (x)
                                    ım           y    l´ g(x)
                                                       ım
                                   x→a                x→a

entonces tambi´n existen
              e
                   °          ¢
               l´ f (x) + g(x) =
                ım                    l´ f (x) + l´ g(x),
                                       ım         ım
                 x→a                             x→a
                                                 x→a
                                      ≥         ¥≥        ¥
                       l´ f (x)g(x) =
                        ım              l´ f (x)
                                         ım        l´ g(x) ,
                                                    ım
                       x→a                           x→a          x→a

                                   f (x)         l´ f (x)
                                                  ım
                                                 x→a
                             l´
                              ım            =                ,
                             x→a   g(x)          l´ g(x)
                                                  ım
                                                 x→a

(suponiendo, adem´s, en el tercer caso que l´ g(x) 6= 0.)
                 a                          ım
                                                       x→a

                  ´
    Demostracion: La prueba es la misma en todos los casos. Veamos la
primera. Consideramos la funci´n f 0 que coincide con f en todos los puntos
                                  o
salvo en a, donde toma el valor del l´ımite. Definimos igualmente g 0 . Entonces
el teorema anterior implica que f y g 0 son continuas en a, luego f 0 + g 0 tambi´n
                                  0
                                                                                 e
lo es, luego por el teorema anterior existe
                             °          ¢
                         l´ f (x) + g(x) = f 0 (a) + g 0 (a),
                          ım
                         x→a
             0    0
                                                   ımite de f 0 + g 0 coincide con
pero como f + g coincide con f + g salvo en a, el l´
el de f + g, y tenemos la relaci´n buscada.
                                o
    Es claro que el resultado sobre suma de l´ ımites es v´lido cuando las funciones
                                                          a
toman valores en cualquier espacio vectorial topol´gico. Adem´s en tal caso al
                                                      o            a
multiplicar una funci´n por un escalar el l´
                       o                     ımite se multiplica por el mismo (para
el caso de K esto es un caso particular de la segunda igualdad). La misma t´cnica
                                                                              e
nos da inmediatamente:
Teorema 1.72 Sea f : A ⊂ X −→ X1 × ·° · × Xn una aplicaci´n entre espacios
                                          ·                       ¢ o
topol´gicos, que ser´ de la forma f (x) = f1 (x1 ), . . . , fn (x) , para ciertas fun-
     o              a
ciones fi : X −→ Xi . Sea a ∈ A0 . Entonces existe l´ f (x) si y s´lo si existen
                                                        ım              o
                                                                 x→a
todos los l´
           ımites l´ fi (x) y en tal caso
                   ım
                  x→a
                                ≥                           ¥
                     l´ f (x) = l´ f1 (x), . . . , l´ fn (x) .
                      ım           ım               ım
                       x→a                 x→a              x→a
1.6. L´
      ımites de funciones                                                     37

    Para calcular el l´
                      ımite que tenemos pendiente necesitamos un hecho que
a menudo resulta util. Diremos que una funci´n f con valores en un espacio
                   ´                          o
m´trico est´ acotada si su imagen es un conjunto acotado.
  e        a
Teorema 1.73 Sean f , g : A ⊂ X −→ E dos funciones definidas de un espacio
topol´gico X en un espacio normado E y sea a ∈ A0 . Si existe l´ f (x) = 0 y
     o                                                         ım
                                                                   x→a
g est´ acotada, entonces existe l´ f (x)g(x) = 0.
     a                           ım
                                    x→a

                 ´
    Demostracion: Si g est´ acotada, existe un M > 0 tal que kg(x)k ≤ M
                              a
para todo x ∈ A. Entonces kf (x)g(x)k ≤ M kf (x)k. El hecho de que f tienda
a 0, sustituyendo los entornos en E de la definici´n general por bolas abiertas,
                                                 o
queda as´ı:
   Para todo ≤ > 0 existe un entorno U de a tal que si x ∈ U ∩ A y x 6= a,
entonces kf (x)k < ≤.
    Tomamos ahora ≤ > 0 y aplicamos este hecho a ≤/M , con lo que si x ∈ U ∩ A
y x 6= a, tenemos que kf (x)g(x)k ≤ M kf (x)k < ≤, y esto significa que f g tiende
a 0.
Ejemplo Se cumple
                                         √              !
                                     2          2
                         l´
                          ım        x        p         −1   = 0,
                      (x,y)→(0,0)             x2 + y 2
   En efecto, basta probar que
                                          2x2
                               l´
                                ım      p         = 0,
                            (x,y)→(0,0)  x2 + y 2
pues el otro sumando, x2 tiende obviamente a 0, por continuidad. Factorizamos
                                           2x
                                        xp         .
                                          x2 + y 2
    El primer factor tiende a 0 y el segundo est´ acotado, pues se comprueba
                                                 a
f´cilmente que
 a
                                        x
                             −1 ≤ p            ≤ 1.
                                      x2 + y 2
Ahora basta aplicar el teorema anterior.
   El hecho de que la composici´n de funciones continuas es continua se traduce
                               o
ahora en el hecho siguiente:
Teorema 1.74 Sea f : X −→ Y y g : Y −→ Z, sea a ∈ X 0 y supongamos que
existe
                            l´ f (x) = b
                             ım
                                     x→a
y que g es continua en b. Entonces
                          ≥        ¥      °     ¢
                         g l´ f (x) = l´ g f (x) .
                            ım         ım
                             x→a                x→a
38                                                              Cap´
                                                                   ıtulo 1. Topolog´
                                                                                   ıa

    Demostracion: Sea U un entorno de g(b). Entonces g −1 [U ] es un entorno
                  ´
de b. Existe un entorno V de a tal que si x ∈ V , x 6= a, entonces f (x) in g −1 [U ],
luego g(f (x)) ∈ U . Por lo tanto se cumple la definici´n de l´
                                                       o      ımite.
     Por ejemplo, la continuidad de la ra´ cuadrada implica que
                                         ız
                                       s
                                             2
                            l´
                             ım     |x| p          − 1 = 0.
                        (x,y)→(0,0)       x 2 + y2


Ejercicio: Dar un ejemplo que muestre la falsedad de la afirmaci´n siguiente: Dadas
                                                               o
dos funciones f , g : R −→ R, si existen l´ f (x) = b, l´ g(x) = c entonces existe
                                          ım            ım
                                          x→a             x→b
tambi´n l´ g(f (x)) = c. Probar que es cierta si f (x) 6= b para x 6= a.
     e ım
         x→a



Limites restringidos El l´   ımite de una funci´n en un punto depende del do-
                                               o
minio de ´sta, por eso es importante lo que ocurre al restringir una funci´n a
         e                                                                o
dominios menores. Por ejemplo pensemos en la funci´n f : R −→ R dada por
                                                     o
                                   Ω
                                      −1 si x < 0
                           f (x) =
                                       1 si x ≥ 0
     Es claro que no tiene l´
                            ımite en 0, pero s´ lo tienen las funciones f |]−∞,0[ y
                                                ı
f |]0,+∞[ . Si consideramos s´lo la parte de la izquierda de la funci´n, resulta que
                             o                                       o
es constante igual a −1, de donde su l´   ımite es −1. Igualmente el l´  ımite de la
parte derecha es 1. Por ello definimos:
Definici´n 1.75 Sea f : A ⊂ X −→ Y , B ⊂ A y a ∈ B 0 . Definimos
       o
                               l´ f (x) = l´ f |B (x).
                                ım
                              x→a
                                           ım
                                           x→a
                               B

     Para el caso de funciones definidas sobre subconjuntos de R se define
                l´ f (x) = x→a f (x),
                 ım        l´
                            ım                l´ f (x) = x→a f (x),
                                               ım        l´
                                                          ım
               x→a−                          x→a+
                             ]−∞,a[                        ]a,+∞[

y se llaman, respectivamente, l´
                               ımite por la izquierda y l´
                                                         ımite por la derecha de
f en a. Tambi´n se les llama l´
               e               ımites laterales. Su utilidad se debe al teorema
siguiente:
Teorema 1.76 Sea A un subconjunto de un espacio X y f : A −→ Y . Supon-
gamos que A = B1 ∪ · · · ∪ Bn y que a es un punto de acumulaci´n de todos estos
                                                                 o
conjuntos. Entonces existe l´ f (x) si y s´lo si existen los l´
                             ım           o                   ımites x→a f (x) para
                                                                     l´
                                                                      ım
                              x→a
                                                                           Bi
i = 1, . . . , n y todos coinciden. En tal caso f (x) es igual al l´
                                                                   ımite com´n.
                                                                            u
                   ´
    Demostracion: Si existen tales l´    ımites y todos valen L, sea V un entorno
de L. Por definici´n existen entornos Ui de a tales que si x ∈ Ui ∩ (A ∩ Bi ) y
                    o
x 6= a, entonces f (x) ∈ V . Si U es la intersecci´n de los conjuntos Ui , entonces
                                                  o
U es un entorno de a y si x ∈ U ∩ A, x 6= a, existir´ un i tal que x ∈ Bi , luego
                                                      a
f (x) ∈ V , es decir, l´ f (x) = L. El rec´
                       ım                  ıproco es m´s sencillo.
                                                       a
                      x→a
1.6. L´
      ımites de funciones                                                                 39

Ejemplo Se cumple
                                               s
                                                      2
                                 l´
                                  ım       x       p        − 1 = 0.
                             (x,y)→(0,0)            x2 + y2


   Para comprobarlo calculamos los l´
                                    ımites
                  s                                  s
                      2                                  2
         l´
          ım     x p        −1=−          l´
                                           ım     |x| p        − 1 = 0,
     (x,y)→(0,0)    x2 + y2           (x,y)→(0,0)      x2 + y2
         x≤0                                           x≤0

                        s                                         s
                                2                                        2
          l´
           ım       x       p         −1=     l´
                                               ım     |x|             p        − 1 = 0,
      (x,y)→(0,0)            x2 + y 2     (x,y)→(0,0)                  x2 + y2
          x≥0                                         x≥0

y aplicamos el teorema anterior.


Ejemplo: la proyecci´n c´nica Veamos ahora un caso en el que nos aparece
                       o o
de forma natural el c´lculo de un l´
                     a             ımite.
   Consideremos de nuevo la esfera S y el cono
C formado al unir el polo sur (0, 0 − 1) con los
puntos del ecuador de S. La figura muestra un
corte transversal de S y C. Vamos a probar
que S  {N } es homeomorfo a una porci´n de C
                                        o
mediante la aplicaci´n que traslada radialmente
                    o
cada punto.
   Un punto (x, y, z) de C est´ en el segmento que une el punto (0, 0, −1) con
                               a
un punto (a, b, 0), donde a2 + b2 = 1. Por tanto ser´ de la forma
                                                    a

                (x, y, z) = (0, 0, −1) + λ(a, b, −1),             con λ ∈ R.

   Entonces λ = z + 1, luego x = a(z + 1), y = b(z + 1). De aqu´ se sigue que
                                                               ı
                                      p
                            z + 1 = ± x2 + y 2 .

    Rec´ıprocamente, si un punto cumple esta ecuaci´n, si z = −1 ha de ser
                                                        o
(0, 0, −1), que est´ en C, y si z 6= −1, entonces los valores
                   a
                                                     x             y
                            λ = z + 1,     a=           ,    b=       ,
                                                    z+1           z+1
permiten expresar a (x, y, z) en la forma param´trica anterior, luego se trata de
                                               e
un punto de C. Nos interesa s´lo la porci´n de C formada por los puntos con
                                o          o
altura entre −1 y 1, por lo que definimos
                 ©                         p                      ™
             C = (x, y, z) ∈ R3 | z + 1 = x2 + y 2 , −1 ≤ z < 1 .
40                                                               Cap´
                                                                    ıtulo 1. Topolog´
                                                                                    ıa

   Notar que los puntos con z = 1 no est´n en C. El homeomorfismo que bus-
                                         a
camos ha de transformar cada punto (x, y, z) de S {N } en un punto (λx, λy, z),
donde λ ≥ 0 es el adecuado para llegar a C. La condici´n es
                                                       o
                          p
                            (λx)2 + (λy)2 = z + 1
                                                                   p          √
y, teniendo en cuenta que los puntos de la esfera cumplen           x2 + y 2 = 1 − z 2 ,
                                                  r
                                   1+z                  1+z
                               λ= p         =               .
                                   x2 + y 2             1−z

     Por lo tanto f : S  {N } −→ C ser´ la aplicaci´n dada por
                                       a            o
                                        √r            r           !
                                             1+z          1+z
                        f (x, y, z) =            x,           y, z .
                                             1−z          1−z

     La inversa se calcula sin dificultad a partir de esta expresi´n:
                                                                 o
                      √r           r          !
                          1−z        1−z
         g(x, y, z) =           x,        y, z , si (x, y, z) 6= (0, 0, −1),
                          1+z        1+z

y por supuesto g(0, 0, −1) = (0, 0, −1).
    Obviamente f es continua. Lo mismo vale para g en todos los puntos salvo en
(0, 0, −1).pPara probar la continuidad en este punto hacemos uso de la igualdad
1 + z = x2 + y 2 , que cumplen todos los puntos de C, la cual nos permite
expresar g como
                        √ s                     s                  !
                                   2                  2
            g(x, y, z) = x p              − 1, y p           − 1, z .
                                 x2 + y 2           x2 + y 2

     Basta probar que
                   √ s                           s                       !
                                  2                        2
           l´
            ım          x    p         − 1, y         p         − 1, z       = (0, 0, −1),
     (x,y,z)→(0,0,−1)         x2 + y 2                 x2 + y 2

pero los dos primeros l´
                       ımites son el que hemos calculado como ejemplo a lo largo
de la secci´n.
           o
    As´ pues, f es un homeomorfismo entre S  {N } y C. Ahora bien, es in-
        ı
mediato comprobar que la proyecci´n sobre el plano XY es un homeomor-
                                       o
fismo entre C y la bola abierta de centro 0 y radio 2 (la aplicaci´n inversa es
                     p                                               o
(x, y) 7→ (x, y, −1 + x2 + y 2 ), claramente continua), con lo que la composici´n
                                                                               o
                                        √r             r        !
                                             1+z           1+z
                         h(x, y, z) =            x,            y .
                                             1−z           1−z
1.6. L´
      ımites de funciones                                                       41

es un homeomorfismo entre S  {N } y dicha bola. M´s a´n, si componemos
                                                        a u
la inversa de la proyecci´n estereogr´fica con esta aplicaci´n obtenemos un ho-
                          o          a                     o
meomorfismo entre R2 y el disco abierto. Es f´cil ver que la composici´n es
                                              a                       o
                              √ p               p         !
                               2x x2 + y 2 2y x2 + y 2
                    t(x, y) =               ,                .
                                x2 + y 2 + 1 x2 + y 2 + 1

    Si quitamos los doses obtenemos un homeomorfismo t : R2 −→ D, donde D
es la bola abierta (eucl´
                        ıdea) de centro 0 y radio 1. Concretamente:
                               √ p             p           !
                                 x x2 + y 2 y x2 + y 2
                     t(x, y) =               ,               .
                                 x2 + y 2 + 1 x2 + y 2 + 1

   Si restringimos esta aplicaci´n a R, es decir, a los puntos (x, 0) obtenemos
                                o
un homeomorfismo entre R y el intervalo ]−1, 1[. Concretamente
                                           x|x|
                                 t(x) =          .
                                          x2 + 1
He aqu´ su gr´fica:
      ı      a
                                       0.75
                                        0.5
                                       0.25
            -2            -1                            1             2
                                    -0.25
                                     -0.5
                                    -0.75

   Si lo restringimos a ]0, +∞[ obtenemos un homeomorfismo entre este inter-
valo y ]0, 1[. A saber:
                                             x2
                                   t(x) = 2      .
                                           x +1
   A partir de aqu´ es f´cil ver que dos intervalos abiertos cualesquiera (acotados
                    ı   a
o no) son homeomorfos.


L´
 ımites infinitos Consideremos ahora l´    ımites de funciones con valores en
R = R ∪ {−∞, +∞} o en C∞ = C ∪ {∞}. Recordando que los entornos b´sicos
                                                                      a
de +∞ son los intervalos ]M, +∞], es claro que
                                 l´ f (x) = +∞
                                  ım
                                 x→a

significa que para todo M > 0 existe un entorno U de a tal que si x ∈ U , x 6= a
est´ en el dominio de f , entonces f (x) > M . Similarmente ocurre con −∞.
   a
Que el l´
        ımite valga ∞ significa que para todo M > 0 existe un entorno U de a
tal que si x ∈ U , x 6= a est´ en el dominio de f , entonces |f (x)| > M .
                             a
    Es f´cil probar que los teoremas del estilo de “el l´
        a                                               ımite de la suma es la suma
de los l´
        ımites” etc. valen tambi´n en los casos siguientes:
                                 e
                  +∞ + (+∞) = +∞,             −∞ + (−∞) = −∞,
42                                                     Cap´
                                                          ıtulo 1. Topolog´
                                                                          ıa

                +∞ + a = +∞,     −∞ + a = −∞,      ∞ + a = ∞,
             (+∞)(+∞) = +∞,       (−∞)(−∞) = +∞,       ∞ ∞ = ∞.
                  si a > 0,   (+∞)a = +∞,     (−∞)a = −∞;
                  si a < 0,   (+∞)a = −∞, (−∞)a = +∞.
                                       a   a      a
               Si a 6= 0,   ∞ a = ∞,     =   = 0,   = ∞.
                                      ±∞   ∞      0

    Por ejemplo, la igualdad +∞ + (+∞) = +∞ es una forma de expresar que
la suma de dos funciones f , g : A ⊂ X −→ R que tienden a +∞ en un punto
a ∈ A0 , tiende tambi´n a +∞. La prueba es sencilla: dado un M > 0 existen
                      e
entornos U y V de a tales que si x ∈ U ∩A0 entonces f (x) > M/2 y si x ∈ V ∩A0
entonces g(x) > M/2, con lo que si x ∈ U ∩ V ∩ A entonces f (x) + g(x) > M ,
luego se cumple la definici´n de l´
                            o       ımite. Similarmente se prueban todas las
dem´s.
     a

C´lculo de l´
 a          ımites Estudiamos ahora los l´   ımites m´s simples y frecuentes.
                                                     a
Comencemos con los l´
                    ımites en infinito de los polinomios. Obviamente

                                 l´
                                  ım x = ±∞.
                                x→±∞

Aplicando n veces la regla (+∞)(+∞) = +∞ vemos que si n > 0 entonces

                                  ım xn = +∞.
                                 l´
                               x→+∞

    ımite en −∞ ser´ obviamente (−1)n ∞. Si n < 0 usamos la regla 1/±∞ = 0
El l´              a
y si n = 0 tenemos que x0 es la constante 1, luego en total:
                                   
                                    +∞ si n > 0,
                         ım xn =
                        l´              1     si n = 0,
                       x→+∞        
                                        0     si n < 0.

   El l´
       ımite en −∞ difiere s´lo en el primer caso, de forma obvia.
                            o
   Para calcular el l´
                     ımite de un polinomio multiplicamos y dividimos por la
potencia de x de mayor grado:
                                           µ                        ∂
                                                 3     1   2      5
   ım 8x5 − 3x4 + x3 + 2x − 5 = l´
  l´                                ım x5 8 − + 2 + 4 − 5 = +∞.
 x→+∞                            x→+∞            x x       x    x

     En general, si p(x) ∈ R[x] no es constante, se cumple   l´
                                                              ım P (x) = ±∞,
                                                             x→±∞
donde el signo depende en forma obvia del signo del coeficiente director de P
y de la paridad del grado si tendemos a −∞. En C∞ todos los polinomios no
constantes tienen l´
                   ımite ∞.
   En particular vemos que, a diferencia de casos como 1/∞ o +∞ + ∞, no
hay una regla general para calcular un l´
                                        ımite de la forma +∞ − ∞. En efecto,
1.7. Convergencia de sucesiones                                                   43

los tres l´
          ımites siguientes son de este tipo y cada uno da un resultado distinto.
Por ello se dice que +∞ − ∞ es una indeterminaci´n.  o

   ım x5 − x2 = +∞,
  l´                          ım x2 − x5 = −∞,
                             l´                            l´ (x + 2) − (x + 1) = 1.
                                                            ım
 x→+∞                        x→+∞                        x→+∞

   Nos ocupamos ahora de los l´  ımites de fracciones algebraicas (cocientes de
polinomios). El ejemplo siguiente ilustra el caso general:
                                          3   1    1
              6x4 − 3x3 + x + 1       6 − x + x3 + x4  6
          l´
           ım                   = l´
                                   ım                 = = 3.
         x→+∞ 2x4 + x2 − 2x + 2  x→+∞ 2 + 1 − 2 + 2    2
                                          x2  x3   x4

    Es claro que el l´
                     ımite en ±∞ del cociente de dos polinomios del mismo grado
es el cociente de los t´rminos directores. Si los grados son distintos, al dividir
                       e
entre la potencia de mayor grado obtenemos 0 si el grado del denominador es
mayor y ±∞ si es mayor el del numerador, donde el signo se calcula de forma
                                                                 ımites en C∞ .
obvia. Esto vale igualmente (salvo lo dicho de los signos) para l´
    Vemos, pues que el caso ∞/∞ es tambi´n una indeterminaci´n.
                                            e                     o
   Por ejemplo, antes hemos probado que la funci´n
                                                o

                                              x|x|
                                    t(x) =
                                             x2 + 1
es un homeomorfismo entre R y el intervalo ]−1, 1[. Ahora es claro que

                                      l´
                                       ım = ±1,
                                    x→±∞


luego si definimos t(±∞) = ±1 tenemos una biyecci´n continua t : R −→ [−1, 1].
                                                 o
En el cap´ıtulo siguiente veremos que es un homeomorfismo.
Ejercicio: Calcular t−1 y probar que es continua.



1.7     Convergencia de sucesiones
   Si los l´
           ımites de funciones tienen especial inter´s en el c´lculo diferencial, en
                                                    e         a
topolog´ son m´s importantes los l´
        ıa       a                   ımites de sucesiones, que en realidad son un
caso particular de los primeros.

Definici´n 1.77 Una sucesi´n en un conjunto X es una aplicaci´n a : N −→ X.
         o                   o                              o
Se suele representar {an }∞ o, m´s gr´ficamente:
                          n=0   a    a

                      a0 ,   a1 ,   a2 ,   a3 ,   ...   an ,   ...

   En realidad, lo unico que nos interesa de una sucesi´n es el orden en el
                    ´                                    o
que se suceden sus elementos, y no la numeraci´n que ´stos reciben. Por ello
                                              o       e
en la pr´ctica admitiremos sucesiones que comiencen en ´
        a                                               ındices mayores de 0.
Por ejemplo, la sucesi´n {n}∞ y la sucesi´n {n − 7}∞ son conjuntistamente
                      o     n=0           o        n=0
44                                                                  Cap´
                                                                       ıtulo 1. Topolog´
                                                                                       ıa

distintas, pero para nosotros ser´n la misma sucesi´n, la sucesi´n de los n´meros
                                 a                 o            o          u
naturales.
    Por simplicidad, en teor´ hablaremos siempre de sucesiones {an }∞ , aun-
                            ıa                                           n=0
que en la pr´ctica comenzaremos a partir del ´
             a                                 ındice que m´s convenga.
                                                              a
    La raz´n por la que estas diferencias no nos van a afectar es que s´lo nos van
           o                                                           o
a interesar las propiedades finales de las sucesiones. Diremos que una sucesi´n  o
{an }∞ cumple finalmente una propiedad si existe un n0 ∈ N tal que an cumple
     n=0
la propiedad para todo n ≥ n0 .
    Por ejemplo, una sucesi´n es constante si todos sus t´rminos son iguales a
                            o                               e
un cierto elemento x. Una sucesi´n es finalmente constante si es constante a
                                    o
partir de un t´rmino. La sucesi´n siguiente es finalmente igual a 5:
               e                 o
               3,   1,   −2,     8,    5,       5,   5,   5,   5,   5,   ...
    Una subsucesi´n de {an }∞ es una sucesi´n de la forma {ank }∞ , donde
                   o            n=0            o                   k=0
{nk }∞ es una sucesi´n estrictamente creciente de n´meros naturales, es decir,
     k=0               o                             u
si k < k0 , entonces nk < nk0 .
    Una observaci´n util es que en estas condiciones siempre se cumple k ≤ nk .
                   o ´
Se prueba f´cilmente por inducci´n sobre k.
             a                      o
Definici´n 1.78 Sea X un espacio topol´gico, l ∈ X y {an }∞ una sucesi´n
          o                               o                   n=0          o
en X. Diremos que an converge a l si est´ finalmente en todo entorno de l, o
                                          a
sea, si para cada entorno V de l existe un n0 ∈ N tal que an ∈ V para n ≥ n0 .
    As´ pues, una sucesi´n converge a un punto l si est´ finalmente alrededor
       ı                  o                               a
de l, es decir, si todos sus t´rminos salvo un n´mero finito est´n en cualquier
                              e                  u               a
entorno de l prefijado.
    Si X es un espacio de Hausdorff y {an }∞ converge en X, entonces el punto
                                           n=0
al cual converge es unico, pues puntos distintos tienen entornos disjuntos, y una
                     ´
sucesi´n no puede estar finalmente en dos conjuntos disjuntos. Representaremos
       o
por
                                      l´ an
                                       ım
                                            n

al unico l´
   ´      ımite de la sucesi´n
                            o    {an }∞
                                      n=0       en un espacio de Hausdorff, cuando ´ste
                                                                                  e
exista.
    Veamos ahora que esta noci´n de l´
                                  o       ımite es un caso particular del que hemos
estudiado en la secci´n anterior. Consideremos N∞ = N ∪ {∞} con la topolog´
                      o                                                          ıa
inducida desde C∞ . Es f´cil ver que la topolog´ en N es la discreta y una base
                           a                       ıa
de entornos de ∞ la forman los conjuntos {n ∈ N | n ≥ n0 } ∪ {∞}. En estos
t´rminos, una sucesi´n {an }∞ converge a un punto l si y s´lo si para todo
 e                     o        n=0                                o
entorno U de l existe un entorno V de ∞ tal que si n ∈ V , n 6= ∞ entonces
an ∈ U , es decir, si y s´lo si la sucesi´n, vista como funci´n N −→ X converge
                         o               o                    o
a l cuando n tiende a ∞. En tal caso
                                  l´ an = l´ an .
                                   ım      ım
                                   n             n→∞

   Sabiendo esto, todos los resultados generales para l´
                                                       ımites de funciones valen
para sucesiones, por ejemplo, el l´
                                  ımite de la suma de dos sucesiones de n´meros
                                                                         u
1.7. Convergencia de sucesiones                                                   45

reales es la suma de los l´
                          ımites, etc. Veamos ahora algunos hechos espec´
                                                                        ıficos
sobre sucesiones:

      Una sucesi´n converge si y s´lo si converge finalmente, es decir,
                 o                   o
      {an }∞ converge a l si y s´lo si la sucesi´n {an }∞ converge a l.
           n=0                    o             o       n=k
      En particular, las sucesiones finalmente constantes convergen.

   (Esto es consecuencia de que el l´
                                    ımite de una funci´n en un punto — el
                                                      o
punto ∞ en este caso— depende s´lo del comportamiento de la funci´n en un
                                o                                o
entorno del punto).

      Si A ⊂ X, {an }∞ ⊂ A y l ∈ A, entonces {an }∞ converge a l en
                       n=0                        n=0
      A si y s´lo si converge a l en X.
              o

    (Pues los entornos de l en A son las intersecciones con A de los entornos de
l en X y, como la sucesi´n est´ en A, es equivalente que est´ finalmente en un
                         o     a                             e
entorno de l en A o que est´ finalmente en un entorno de l en X.)
                            e
    Este hecho nos dice que la convergencia depende exclusivamente de la su-
cesi´n y de su l´
    o           ımite, y no del espacio en el que los consideremos (siempre que no
cambiemos de topolog´ claro est´). Sin embargo, tambi´n de aqu´ se desprende
                        ıa,        a                        e         ı
que una sucesi´n convergente deja de serlo si eliminamos su l´
               o                                                ımite. Por ejemplo,
la sucesi´n {1/n}∞ no converge en el espacio ]0, 1], pues si convergiera a un
         o         n=0
punto l, tendr´ıamos que en R deber´ converger a la vez a l y a 0.
                                      ıa

      Si una sucesi´n converge a un punto l, entonces todas sus subsuce-
                   o
      siones convergen a l.

   Pues si {an }∞ converge a l y {ank }∞ es una subsucesi´n, para todo
                n=0                        k=0                   o
entorno U de l existe un n0 tal que si n ≥ n0 se cumple an ∈ U , pero si k ≥ n0
entonces nk ≥ k ≥ n0 , luego ank ∈ U .
Ejercicio: Demostrar que una sucesi´n {xn }∞ converge en un espacio producto
Q                                       o        n=0
   Xi a un punto x si y s´lo si las sucesiones {xn }∞ convergen a xi para todo i ∈ I.
                         o                       i n=0
i∈I
   No podemos continuar nuestro estudio de las sucesiones sin introducir un
nuevo concepto. Sucede que las sucesiones no se comportan adecuadamente en
todos los espacios topol´gicos, sino s´lo en aquellos que cumplen la siguiente
                        o             o
propiedad adicional, por lo dem´s muy frecuente:
                                a

Definici´n 1.79 Un espacio X cumple el primer axioma de numerabilidad
         o
(1AN) si para todo punto x ∈ X existe una base de entornos de x de la forma
{Vn }∞ .
     n=0


    Esta propiedad la tienen todos los espacios m´tricos, pues si x es un punto
                                                 e
de un espacio m´trico, una base de entornos de x la forman los conjuntos
                 e
{B1/n (x)}∞ . As´ pues, todos los espacios que manejamos cumplen 1AN. En
          n=1     ı
el caso de C∞ , en lugar de considerar la m´trica inducida desde la esfera, es
                                             e
46                                                          Cap´
                                                               ıtulo 1. Topolog´
                                                                               ıa

m´s f´cil considerar directamente la base de entornos de ∞ formada por los
  a a
conjuntos siguientes:
                            Ø
              En = {z ∈ C Ø |z| > n} ∪ {∞}, para n = 1, 2, . . .
                                        ©       ™
   En R, una base de entornos de +∞ es ]n, +∞] }∞ y una base de entornos
          ©         ™ ∞                            n=0
de −∞ es [−∞, n[ }n=0 , luego este espacio tambi´n cumple 1AN.
                                                 e
   Observemos que si X es un espacio que cumple 1AN y x ∈ X, podemos
tomar una base de entornos de x de la forma {Vn }∞ que cumpla adem´s
                                                 n=0              a

                   V0     ⊃    V1    ⊃    V2   ⊃     V3   ⊃ ...

   Si una base dada {Wn }∞ no lo cumple, tomamos Vn = W0 ∩ · · · ∩ Wn y as´
                           n=0                                               ı
tenemos las inclusiones indicadas. Todas las bases de entornos de los ejemplos
que acabamos de dar son decrecientes en este sentido.
     Consideremos ahora esta sucesi´n:
                                   o

       1,   −1,   1,    −1,   1,    −1,   1,   −1,   1,   −1,   1,   −1,   ...

    Es obvio que no es convergente, pero sin duda hay dos puntos “especiales”
para esta sucesi´n, el 1 y el −1. Quiz´ el lector se sienta tentado de afirmar que
                o                     a
se trata de una sucesi´n con dos l´
                        o           ımites, pero nuestra definici´n de l´
                                                                  o       ımite no
admite esa posibilidad. Vamos a dar una definici´n que describa esta situaci´n.
                                                   o                           o

Definici´n 1.80 Un punto x de un espacio topol´gico X es un punto adherente
         o                                     o
de una sucesi´n {an }∞ en X si para cada entorno V de x y cada n´mero
              o       n=0                                           u
natural n existe un n´mero natural m ≥ n tal que am ∈ V .
                     u

   Es decir, si la sucesi´n contiene puntos arbitrariamente lejanos en cualquier
                         o
entorno de x o, si se prefiere, si la sucesi´n contiene infinitos puntos en cada
                                           o
entorno de x.
    En estos t´rminos, la sucesi´n {(−1)n }∞ que hemos puesto como ejemplo
              e                 o          n=0
tiene exactamente dos puntos adherentes, 1 y −1.

Teorema 1.81 Sea X un espacio 1AN. Un punto x ∈ X es un punto adherente
de una sucesi´n {an }∞ si y s´lo si ´sta contiene una subsucesi´n que converge
             o       n=0     o      e                          o
a x.

    Demostracion: Si x es un punto adherente de la sucesi´n, sea {Vn }∞
                 ´                                               o            n=0
una base decreciente de entornos de x. Existe un punto an0 ∈ V0 . Existe un
natural n1 ≥ n0 + 1 tal que an1 ∈ V1 . Existe un natural n2 ≥ n1 + 1 tal que
an2 ∈ V2 . De este modo obtenemos una subsucesi´n {ank }∞ tal que cada
                                                     o          k=0
ank ∈ Vk y, como la sucesi´n de entornos es decreciente, en realidad Vk contiene
                          o
todos los t´rminos de la subsucesi´n posteriores a ank , luego la subsucesi´n que
           e                      o                                        o
hemos obtenido est´ finalmente en cada entorno Vk , es decir, converge a x.
                   a
    Rec´
       ıprocamente, si hay una subsucesi´n que converge a x, dicha subsucesi´n
                                         o                                     o
est´ finalmente en cualquier entorno de x, luego dicho entorno contiene infinitos
   a
t´rminos de la sucesi´n dada.
 e                   o
1.7. Convergencia de sucesiones                                                47

   En particular vemos que una sucesi´n convergente no tiene m´s punto ad-
                                     o                        a
herente que su l´
                ımite.
     La continuidad de funciones puede caracterizarse en t´rminos de sucesiones:
                                                          e

Teorema 1.82 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos y
                                           o                    o
supongamos que X cumple 1AN. Sea x ∈ X. Entonces f es continua en x
si y s´lo si para cada sucesi´n {an }∞ ⊂ X tal que l´ an = x, se cumple
      o                      o       n=0            ım
                                                           n
l´ f (an ) = f (x).
 ım
 n

                    ´
    Demostracion: Supongamos que f es continua en x. Sea V un entorno de
f (x). Entonces f −1 [V ] es un entorno de x y la sucesi´n {an }∞ est´ finalmente
                                                        o       n=0   a
en f −1 [V ], luego {f (an )}∞ est´ finalmente en V , o sea, l´ f (an ) = f (x).
                             n=0   a                           ım
                                                               n
    Rec´ıprocamente, supongamos que f no es continua en x. Entonces existe
un entorno V de f (x) tal que f −1 [V ] no es entorno de x. Sea {Vn }∞ una
                                                                     n=0
base decreciente de entornos de x. Para cada natural n, no puede ocurrir que
Vn ⊂ f −1 [V ], luego existe un punto an ∈ Vn tal que f (an ) ∈ V .
                                                              /
    Como la base es decreciente, todos los t´rminos posteriores a an est´n en
                                              e                         a
Vn , luego la sucesi´n {an }∞ est´ finalmente en cada Vn , con lo que converge
                    o        n=0   a
a x. Sin embargo la sucesi´n {f (an )}∞ no tiene ning´n t´rmino en V , luego
                             o         n=0                u e
no converge a f (x).
     Los puntos adherentes se caracterizan por sucesiones:

Teorema 1.83 Sea X un espacio topol´gico que cumpla 1AN. Sea A ⊂ X. En-
                                       o
tonces A est´ formado por los l´
            a                  ımites de las sucesiones convergentes contenidas
en A.

                 ´
    Demostracion: Si l es el l´
                              ımite de una sucesi´n contenida en A, entonces
                                                  o
todo entorno de l contiene puntos de la sucesi´n, es decir, puntos de A, luego
                                              o
l ∈ A.
       ıprocamente, si x ∈ A, tomamos una base decreciente {Vn }∞ de en-
    Rec´                                                            n=0
tornos abiertos de x. Como Vn ∩ A 6= ∅, existe un an ∈ Vn ∩ A y la sucesi´n o
{an }∞ as´ construida converge a x, y est´ contenida en A.
     n=0   ı                             a
   En particular, un conjunto A es cerrado si y s´lo s´ el l´
                                                 o ı        ımite de toda sucesi´n
                                                                                o
convergente contenida en A, est´ en A, es decir, si no es posible “salir” de A
                               a
mediante sucesiones.
   Veamos c´mo puede aplicarse este hecho: supongamos que una sucesi´n de
            o                                                       o
n´meros reales cumple l´ an = l y an ≤ 5 para todo n. Entonces la sucesi´n
 u                     ım                                               o
                          n
est´ contenida en el intervalo cerrado ]−∞, 5], luego su l´
   a                                                      ımite tambi´n, es decir,
                                                                     e
podemos concluir que l ≤ 5.
Ejercicio: Probar que si dos sucesiones convergentes de n´meros reales cumplen
                                                         u
an ≤ bn para todo n, entonces l´ an ≤ l´ bn .
                               ım      ım
                               n       n
48                                                        Cap´
                                                             ıtulo 1. Topolog´
                                                                             ıa

1.8       Sucesiones y series num´ricas
                                 e
                                                 ımites de sucesiones en K.
    Vamos a estudiar algunos casos concretos de l´
Consideremos en primer lugar la sucesi´n {rn }∞ , donde r ∈ R. Vamos a
                                       o      n=0
calcular su l´
             ımite.
    Supongamos primero que r > 1. Sea s = r − 1 > 0. Entonces r = 1 + s y
por el teorema del binomio de Newton
                                           X µn∂
                                           n
                     n         n
                    r = (1 + s) = 1 + ns +        sk > ns.
                                               k
                                             k=2

     Sabemos que l´ ns = +∞. Del hecho de que {ns}∞ est´ finalmente en
                  ım                              n=0  e
                    n
cada entorno b´sico de +∞, de la forma ]M, +∞], se sigue claramente que lo
               a
mismo le sucede a {rn }∞ , luego si r > 1 concluimos que l´ rn = +∞.
                       n=0                                ım
                                                           n
                             n
   Si r = 1 es obvio que l´ r = 1.
                          ım
                           n
   Si 0 < r < 1 entonces
                                           1     1
                          l´ rn = l´
                           ım      ım        n
                                               =   = 0.
                           n        n   (1/r)    ∞

   Si r = 0 es obvio que l´ rn = 0.
                          ım
                           n
   En lugar de analizar ahora el caso r < 0 consideraremos en general r ∈ K.
   Si |r| > 1, entonces l´ |rn | = l´ |r|n = +∞, de donde es f´cil deducir a
                         ım         ım                          a
                          n          n
                                         n
partir de las meras definiciones que l´ r = ∞.
                                      ım
                                        n
     Si |r| < 1, entonces l´ |rn | = 0, de donde tambi´n se sigue que l´ rn = 0.
                           ım                         e                ım
                         n                                            n
    Puede probarse que si |r| = 1 el l´
                                      ımite no existe salvo en el caso r = 1. Por
ejemplo, ya hemos visto que l´ (−1)n no existe, pues se trata de la sucesi´n
                               ım                                              o
                                n
1, −1, 1, −1, 1, −1, . . .

Definici´n 1.84 Una sucesi´n {an }∞ es mon´tona creciente si m < n implica
         o                   o      n=0      o
am ≤ an . La sucesi´n es estrictamente creciente si cuando m < n entonces
                     o
am < an . Igualmente se definen las sucesiones mon´tonas decrecientes y las
                                                    o
sucesiones estrictamente decrecientes. Una sucesi´n es mon´tona si cumple
                                                 o         o
cualquiera de estas cuatro propiedades.

    El inter´s de las sucesiones mon´tonas estriba en que podemos probar que
            e                         o
son convergentes sin necesidad de calcular su l´ ımite. Esta clase de resultados
de convergencia proporcionan la t´cnica m´s importante para definir n´meros
                                    e        a                           u
reales, expres´ndolos como l´
              a               ımites de sucesiones sencillas.

Teorema 1.85 Toda sucesi´n mon´tona creciente converge a su supremo en
                          o       o
R, y toda sucesi´n mon´tona decreciente converge a su ´
                o     o                               ınfimo en R.

   Demostracion: Por supremo de una sucesi´n {an }∞ entendemos el su-
                ´                             o      n=0
premo del conjunto {an | n ∈ N}. Sea s este supremo y supongamos que es
finito. Entonces un entorno b´sico de s es de la forma ]s − ≤, s + ≤[, para un
                            a
1.8. Sucesiones y series num´ricas
                            e                                                            49

≤ > 0. Como s − ≤ no es una cota superior de la sucesi´n, existe un natural m
                                                        o
tal que s − ≤ < am ≤ s y, por la monoton´ s − ≤ < an ≤ s para todo n ≥ m,
                                          ıa,
es decir, que la sucesi´n est´ finalmente en el entorno. Una ligera modificaci´n
                       o     a                                              o
nos da el mismo resultado si s = +∞ o si la sucesi´n es decreciente.
                                                   o
    Prestaremos ahora atenci´n a un tipo especial de sucesiones de particular
                              o
inter´s. Se trata de las llamadas series num´ricas.
     e                                      e

Definici´n 1.86 Llamaremos serie determinada por una sucesi´n {an }∞ en
        o                                                 o       n=0
                Ω k    æ∞
                 P                                 P
                                                   ∞
K a la sucesi´n
             o      an    . La representaremos por    an o, m´s gr´fica-
                                                              a    a
                     n=0       k=0                                n=0
mente, por

         a0    +      a1   +     a2   +    a3     +   a4      +   a5     +      ···

               P
               k
Los t´rminos
     e               an se llaman sumas parciales de la serie. Si es convergente, su
               n=0
                                                                        P
                                                                        ∞
l´
 ımite se llama suma de la serie y se representa tambi´n por
                                                      e                      an . Esto nunca
                                                                       n=0
lleva a confusi´n.
               o

    As´ pues, una serie es una suma con infinitos sumandos. Una serie de
       ı
t´rminos positivos es, como su nombre indica, una serie en R tal que todos los
 e
t´rminos an son positivos. Vista como sucesi´n, una serie de t´rminos positivos
 e                                           o                e
es estrictamente creciente, luego converge en R. De todos modos es costumbre
llamar divergente a una serie cuya suma sea +∞.
    Una progresi´n geom´trica es una sucesi´n en la que cada t´rmino se obtiene
                o        e                 o                   e
del anterior multiplic´ndolo por un n´mero fijo llamado raz´n. Por lo tanto,
                      a               u                       o
si el primer t´rmino de una progresi´n geom´trica es a0 y la raz´n es r, los
              e                      o        e                        o
t´rminos siguientes ser´n a1 = a0 r, a2 = a0 r2 , a3 = a0 r3 , . . . y, en general,
 e                      a
an = a0 rn .
    Una serie geom´trica es una serie asociada a una progresi´n geom´trica, o
                    e                                        o      e
                           P n
                           ∞
sea, una serie de la forma   ar .
                               n=0

   Una suma parcial es de la forma

                               a(1 + r + r2 + · · · + rn ).

Es conocida la identidad

                      rn − 1 = (r − 1)(1 + r + r2 + · · · + rn−1 ),

luego si r 6= 1 tenemos que

                                                arn+1 − a   a − arn+1
               a(1 + r + r2 + · · · + rn ) =              =           ,
                                                  r−1         1−r
50                                                                     Cap´
                                                                          ıtulo 1. Topolog´
                                                                                          ıa

y de aqu´
        ı,
                                 ∞
                                 X                   a − arn+1
                                       arn = l´
                                              ım               .
                                 n=1
                                                 n     1−r

     Si |r| > 1 sabemos que l´ arn+1 = ∞, de donde se sigue que la serie diverge.
                             ım
                                 n
Por otro lado, si |r| < 1, entonces l´ arn+1 = 0, luego
                                     ım
                                             n

                                       ∞
                                       X              a
                                             arn =       .
                                       n=1
                                                     1−r

     Por ejemplo:
                                           1
                      1 1 1  1   1
                       + + +   +   + ··· = 2                       1   = 1.
                      2 4 8 16 32         1−                       2

  As´ pues, las series geom´tricas convergen cuando la raz´n tiene m´dulo
     ı                       e                               o          o
menor que 1, y su suma es el primer t´rmino dividido entre 1 menos la raz´n.
                                     e                                    o

Ejemplo: expansiones decimales Es conocido que todo n´mero natural n
                                                                  u
                                 P
                                 r
                                        i
puede expresarse de la forma n =   ai 10 , donde a0 , a1 , . . . , ar son n´meros
                                                                           u
                                             i=1
naturales menores que 10. Adem´s, para n 6= 0 la expresi´n es unica si exigimos
                                 a                          o     ´
ar 6= 0. De hecho usamos esta expresi´n para nombrar a cada n´mero natural,
                                       o                            u
por ejemplo
                  4.275 = 4 · 103 + 2 · 102 + 7 · 101 + 5 · 100 .
   M´s en general, dado un n´mero natural k ≥ 2, todo n´mero natural puede
     a                       u                                   u
                       P
                       r
                             i
expresarse en la forma   ai k , donde a0 , a1 , . . . , ar son n´meros naturales me-
                                                                u
                           i=0
nores que k.
   Vamos a extender esta notaci´n para nombrar a ciertos n´meros racionales.
                                o                           u
En lo sucesivo, una expresi´n como ´sta: 23, 472 representar´ al n´mero
                           o       e                        a     u

                    2 · 101 + 3 · 100 + 4 · 10−1 + 7 · 10−2 + 2 · 10−3 .

   Es decir, del mismo modo que el 2 se interpreta multiplicado por 10, el
primer n´mero a la derecha de la coma se considerar´ dividido entre 10, el
        u                                          a
segundo entre 100, etc. De este modo, los n´meros
                                           u

             0 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 1

dividen al intervalo unidad en 10 partes iguales. Cada una de estas partes se
divide a su vez en 10 partes a˜adiendo una cifra m´s, por ejemplo:
                              n                   a

      0, 3 0, 31 0, 32 0, 33 0, 34 0, 35 0, 36 0, 37 0, 38 0, 39 0, 4

es una divisi´n del intervalo [0, 3 , 0, 4] en 10 partes iguales.
             o
1.8. Sucesiones y series num´ricas
                            e                                                                    51

   Por supuesto podemos usar otras bases diferentes de 10. Por ejemplo, en
base 10 tenemos que 1/2 = 5/10 = 0, 5. En base dos, en cambio, 1/2 = 0, 1.
   Los n´meros racionales expresables de esta forma se llaman n´meros deci-
         u                                                      u
males exactos.
   Tomemos ahora un n´mero natural k ≥ 2 y sea {an }∞ una sucesi´n de
                        u                                n=1           o
n´meros naturales menores que k. Entonces
 u
     r
     X                         r
                               X                        ∞
                                                        X                         1
           an k−n ≤ (k − 1)          k−n < (k − 1)             k−n = (k − 1)      k
                                                                                      1   = 1.
     n=1                       n=1                      n=1
                                                                                1−    k

                                                                         P
                                                                         ∞
   Por lo tanto, el supremo de las sumas parciales de                         an k−n es menor o
                                                                        n=1
                          P
                          ∞
igual que 1, luego 0 ≤         an k−n ≤ 1.
                         n=1
   Esto nos permite extender nuestros desarrollos decimales hasta admitir un
n´mero infinito de cifras. Por ejemplo: 532, 11111. . . representa al n´mero
 u                                                                    u
    5 · 102 + 3 · 101 + 2 · 100 + 1 · 10−1 + 1 · 10−2 + 1 · 10−3 + 1 · 10−4 + · · ·
           P
           ∞
   Como          10−n = 1/9, tenemos que 532, 11111. . . = 532 + 1/9.
           n=1
   Notar que las sucesiones finalmente nulas nos dan los decimales exactos:
                                 3, 67 = 3, 6700000. . .
   El inter´s de usar infinitas cifras decimales es que todo n´mero real positivo
           e                                                 u
es expresable mediante uno de estos desarrollos, es decir, si k es un n´mero
                                                                          u
natural mayor o igual que 2, todo n´mero real positivo x se puede escribir como
                                    u
                                     r
                                     X               ∞
                                                     X
                               x=          bn kn +         an k−n ,
                                     n=0             n=1

donde los coeficientes son n´meros naturales menores que k.
                           u            √
    Vamos a probarlo para k = 10 y x = 2, aunque el procedimiento es com-
                               Pr
pletamente general. La parte      bn kn del desarrollo buscado no es sino el
                                      n=0
desarrollo decimal de la parte entera de x. En nuestro caso, como 1 < 2 < 4,
                √
resulta que 1 < 2 < 2, luego la parte entera es 1.
   Dividimos el intervalo [n, n + 1] en el que se encuentra x en 10 partes, que
en nuestro caso son
             1 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1, 7 1, 8 1, 9 2
   Nuestro n´mero x debe
            u                   estar en uno de los 10 intervalos. En nuestro caso,
como
                  (1, 0)2        =     1             (1, 5)2    =     2, 25
                  (1, 1)2        =     1, 21         (1, 6)2    =     2, 56
                  (1, 2)2        =     1, 44         (1, 7)2    =     2, 89
                  (1, 3)2        =     1, 69         (1, 8)2    =     3, 24
                  (1, 4)2        =     1, 96         (1, 9)2    =     3, 61
52                                                                  Cap´
                                                                       ıtulo 1. Topolog´
                                                                                       ıa
                                                √
resulta que (1, 4)2 < 2 < (1, 5)2 , luego 1, 4 < 2 < 1, 5. Procediendo del mismo
modo podemos ir obteniendo las desigualdades siguientes:
                                         √
                                   1 < √2 < 2
                                1, 4 < √2 < 1, 5
                               1, 41 < √2 < 1, 42
                             1, 414 < 2 < 1, 415
                                 ···      ···    ···
    En general, la n-sima cifra se obtiene como la m´xima que hace que el
                                                       a
decimal exacto correspondiente sea menor o igual que x. Ahora probemos que
la sucesi´n as´ obtenida converge a x, es decir, probemos que
         o    ı
                    √
                      2 = 1, 4142135623730950488016887. . .

     No olvidemos que S = 1, 4142135623730950488016887. . . es por definici´n la
                                                                          o
suma de una serie cuyas sumas parciales son 1; 1, 4; 1, √ 1, 414. . .
                                                         41;
     Por construcci´n cada suma parcial es menor que √ 2, luego la suma de la
                    o
serie, que es el supremo de dichas sumas, cumple S ≤ 2.
                                          √                           √
     Ahora bien, tenemos que 1 ≤ S √ 2 ≤ 2, luego √ distancia | 2 − S| ≤
                                        ≤                la
|2 − 1| = 1. Igualmente 1, 4 ≤ S ≤ 2 ≤ 1, 5, luego | 2 − S| ≤ |1,√ − 1, 4| =
                                                  √                   5
0, 1 = 1/10 y, del mismo modo, 1, 41 ≤ S ≤ 2 ≤ 1, 42, luego | 2 − S| ≤
|1, 42 − 1, 41| = 0, 01 = 1/100.      √
     En general concluimos que 0 ≤ | 2 − S| ≤ 10−n para todo n´mero natural
                                                                √ u
n. Como la sucesi´n 10−n tiende a 0 concluimos que 0 ≤ | 2 √ S| ≤ ≤ para
                     o                  √                         −
todo ≤ > 0, lo cual s´lo es posible si | 2 − S| = 0, o sea, si S = 2.
                       o
     Esto prueba tambi´n que al truncar un n´mero real (es decir, al quedarnos
                         e                     u
con un n´mero finito de sus decimales) obtenemos una aproximaci´n tanto mejor
         u                                                        o
cuantas m´s cifras conservemos. Por ejemplo, el n´mero racional 1, 4142 no es
√           a                 √                      u
  2, pero se diferencia de 2 en menos de 1/10000. Su cuadrado no es 2,
obviamente, pero es 1, 99996164, que dista de 2 menos de 1/10000. En muchas
ocasiones y a efectos pr´cticos esto es m´s que suficiente.
                           a              a
    Es importante notar que los desarrollos no son unicos, pues por ejemplo es
                                                   ´
claro que

           1 = 0, 99999. . . ;   0, 1 = 0, 099999. . . ;    0, 01 = 0, 0099999. . .

   En general, si una sucesi´n {an }∞ es finalmente igual a k − 1 (digamos a
                            o       n=1
partir de an ), entonces

       0, a1 a2 . . . an−1 (k − 1)(k − 1)(k − 1). . . = 0, a1 a2 . . . an−2 (an−1 + 1),

pues
                                                                                 ∞
                                                                                X k−1
       0, a1 a2 . . . an−1 (k − 1)(k − 1)(k − 1). . . = 0, a1 a2 . . . an−1 +
                                                                                r=n
                                                                                    kr

                                           1
               = 0, a1 a2 . . . an−1 +        = 0, a1 a2 . . . an−2 (an−1 + 1).
                                         kn−1
1.8. Sucesiones y series num´ricas
                            e                                                                 53

   O sea, toda expresi´n finalmente igual a k − 1 admite una expresi´n exacta
                      o                                             o
sumando 1 a la cifra anterior al primer k − 1 de la cola constante.
    Si no admitimos sucesiones finalmente iguales a k − 1 el desarrollo es unico.´
En efecto, supongamos que 0, a1 a2 . . . = 0, b1 b2 . . . Sea an 6= bn la primera cifra
diferente. Digamos que an < bn . Tenemos que
                                    ∞
                                    X                                        ∞
                                                                             X
            0, a1 a2 . . . an−1 +         br k−r = 0, a1 a2 . . . an − 1 +         ar k−r ,
                                    r=n                                      r=n

luego

        X∞                 X∞                 X∞
 bn                  an                 an                    an   1
   n
     +       br k−r = n +       ar k−r < n +      (k − 1)k−r = n + n .
 k     r=n+1
                     k    r=n+1
                                        k    r=n+1
                                                              k   k

    Notar que la desigualdad es estricta porque no todos los ar son iguales a k−1
(no aceptamos desarrollos finalmente iguales a k − 1). Por lo tanto bn < an + 1,
o sea, bn ≤ an , contradicci´n.
                            o
    El algoritmo de Euclides para dividir n´meros naturales es v´lido para calcu-
                                           u                    a
lar el desarrollo decimal de cualquier n´mero racional:
                                        u

                                    1, 0 0 0 0 0 0 7
                                    1 0            0, 1 4 2 8 4
                                       30
                                         20
                                           60
                                             30
                                               2

    As´ pues, 1/7 = 0, 1428428428428. . . La raz´n por la que el algoritmo es
      ı                                          o
v´lido es que los c´lculos que realizamos pueden expresarse de un modo menos
 a                 a
pr´ctico, pero conceptualmente m´s claro, de la forma siguiente:
  a                                a
                                             µ        ∂
      1           1         1 10          1         3         1     1 30
          = 0+ =0+             ·   =0+      · 1+        =0+      ·     ·
      7           7        10 7          10         7         10 100 7
                             µ      ∂
                   1    1         2          1    1         1      20
          = 0+        ·    · 4+       =0+      ·      ·4+       ·     = ···
                  10 100          7         10 100        1.000 7

    Una consecuencia importante es que, como los restos posibles son un n´mero
                                                                           u
finito, tras un n´mero finito de pasos hemos de obtener un resto ya obtenido
                 u
previamente, y como cada cifra del cociente depende exclusivamente del ultimo
                                                                           ´
resto, resulta que las cifras se repiten c´
                                          ıclicamente. En el caso de 1/7 el grupo
de cifras que se repite es 428. Para indicar esto se suele usar la notaci´n 1/7 =
                                                                         o
        _
0, 14 428.
    El bloque 428 se suele llamar per´ıodo del n´mero. El bloque de cifras deci-
                                                u
males previas al per´ıodo (que puede no existir) se llama anteper´
                                                                 ıodo (1 en este
caso), luego en la expresi´n decimal de un n´mero racional podemos distinguir
                          o                   u
la parte entera, el anteper´
                           ıodo y el per´
                                        ıodo.
54                                                              Cap´
                                                                   ıtulo 1. Topolog´
                                                                                   ıa

    Rec´
       ıprocamente, todo n´mero cuya expresi´n decimal sea de esta forma es
                            u                  o
                                                                 _
un n´mero racional. Ve´moslo con un ejemplo. r = 37, 195 513. Vamos a
     u                   a
encontrar una fracci´n igual a r. El m´todo es general. Multiplicamos por un
                    o                  e
1 seguido de tantos ceros como cifras hay en el per´
                                                   ıodo m´s el anteper´
                                                         a            ıodo:
                                                            _
                             (100.000)r = 3.719.513, 513 .

Le restamos r multiplicado por un 1 seguido de tantos ceros como cifras hay en
el anteper´
          ıodo:
                                                      _             _
     (1.000.000)r − (1.000)r = 3.719.513 + 0, 513 −3.719 − 0, 513= 3.715.794.

Por consiguiente
                                              3.715.794
                                         r=             .
                                               999.000

   Un problema que surge a menudo es el de determinar si una serie dada an es
o no convergente. Lo m´s elemental que puede decirse al respecto es que para
                        a
que una serie converja su t´rmino general ha de tender a 0. En efecto:
                           e
                                                                     P
                                                                     ∞
Teorema 1.87 Sea {an }∞ una sucesi´n en K. Si la serie
                      n=0         o                                        an es conver-
                                                                     n=0
gente, entonces l´ an = 0.
                 ım
                   n

                                          P
                                          k
               ´
     Demostracion: Sea Sk =                    an . Que la serie converja a un n´mero
                                                                                u
                                         n=0
L significa por definici´n que existe l´ Sk = L. En tal caso tambi´n existe
                      o              ım                         e
                                                k
l´ Sk−1 = L, pues es el l´
 ım                      ımite de una subsucesi´n, y entonces
                                               o
 k

                       l´ ak = l´ (Sk − Sk−1 ) = L − L = 0.
                        ım      ım
                        k            k



   As´ si no sumamos cada vez cantidades m´s peque˜as la serie no puede
      ı,                                         a       n
converger. El rec´
                 ıproco es tentador, pero falso. Basta considerar la serie deter-
minada por la m´s sencilla de las sucesiones que tienden a 0:
                 a

                       P
                       ∞
                             1
Ejemplo La serie             n   es divergente.
                       n=1
     En efecto, observemos que

            S1   = 1,
                       1
            S2   = 1+ ,
                       2
                         1 1    2     1 1
            S4   = S2 + + > S2 + = 1 + + ,
                         3 4    4     2 2
                         1 1 1 1      4    1 1 1
            S8   = S4 + + + + > S4 + > 1 + + + .
                         5 6 7 8      8    2 2 2
1.8. Sucesiones y series num´ricas
                            e                                                              55

   En general S2n > 1 + n , y esta sucesi´n tiende a +∞, luego las sumas
                            2                o
parciales no est´n acotadas y la serie diverge.
                a
   Se conocen muchos criterios para determinar el car´cter convergente o di-
                                                          a
vergente de una serie. Por ejemplo, el siguiente es aplicable a series de t´rminos
                                                                           e
positivos.
Teorema 1.88 (Criterio de D’Alembert) Sea {an }∞ una sucesi´n de n´-
                                                      n=0       o u
meros reales positivos tal que exista l´ aan = L ∈ R. Entonces:
                                       ım n+1
                                                  n
  a) Si L < 1 la serie         {an }∞
                                    n=0    es convergente.
  b) Si L > 1 la serie         {an }∞
                                    n=0    es divergente.
                ´
   Demostracion: a) Sea ≤ > 0 tal que L+≤ < 1. Entonces ]−∞, L + ≤[ es un
entorno de L, y por definici´n de l´
                           o      ımite existe un natural n0 tal que si n ≥ n0
entonces aan < L + ≤ o, lo que es lo mismo, an+1 < an (L + ≤). As´ pues,
          n+1
                                                                  ı
                          an0 +1   < an0 (L + ≤),
                          an0 +2   < an0 +1 (L + ≤) < an0 (L + ≤)2 ,
                          an0 +3   < an0 +2 (L + ≤) < an0 (L + ≤)3 , . . .
    En general, si n ≥ n0 , se cumple que
                                                          an0
                          an < an0 (L + ≤)n−n0 =                 (L + ≤)n .
                                                       (L + ≤)n0
    De aqu´ que si k > n0 ,
          ı
k
X            k
             X                           k
                                         X                                ∞
                                                                          X
                             an0                                an0
      an ≤         an +                      (L + ≤)n <                         (L + ≤)n < +∞,
n=0          n=0
                          (L + ≤)n0   n=n0 +1
                                                             (L + ≤)n0   n=n0 +1

donde la ultima serie converge porque es geom´trica de raz´n L + ≤ < 1. La
           ´                                     e             o
      P∞
serie     an es de t´rminos positivos y sus sumas parciales est´n acotadas, luego
                    e                                          a
      n=0
converge.
   b) Sea ahora ≤ > 0 tal que 1 < L − ≤. Igual que en el apartado anterior existe
un natural n0 tal que si n ≥ n0 entonces an+1 > an (L − ≤), de donde se deduce
igualmente que si n ≥ n0 entonces
                                    an0
                            an >           (L − e)n ,
                                 (L − ≤)n0
y por consiguiente, para k > n0 ,
                      k
                      X             n0
                                    X                         k
                                                              X
                                                    an0
                             an ≥         an +                     (L − ≤)n ,
                      n=0           n=0
                                                 (L − ≤)n0   n=n0 +1

pero ahora la ultima serie diverge, pues es geom´trica de raz´n mayor que 1,
               ´                                  e            o
luego sus sumas parciales no est´n acotadas, y las de la primera serie tampoco.
                                a
As´ pues, ´sta es divergente.
   ı      e
   En el caso de que el l´ımite L exista y valga 1 no es posible asegurar nada,
hay casos en los que esto ocurre y la serie converge y casos en los que diverge.
56                                                          Cap´
                                                               ıtulo 1. Topolog´
                                                                               ıa

                                 P
                                 ∞
                                       Mn
Ejemplo Si M > 0, la serie             n!   es convergente, pues por el criterio de
                                 n=0
D’Alembert,
                            M n+1 M n         M
                 L = l´
                      ım           :   = l´
                                          ım     = 0 < 1.
                       n   (n + 1)! n!     n n+1
                                                       n
   Incidentalmente, esto prueba tambi´n que l´ M = 0.
                                        e      ım n!
                                                n
   Notar que hemos determinado el car´cter de la serie, pero no hemos dicho
                                          a
nada sobre el c´lculo efectivo de su l´
               a                      ımite. La raz´n es que no hay nada que
                                                   o
decir. Por ejemplo, en el caso m´s simple, M = 1, el n´mero
                                a                     u
                                         ∞
                                        X 1
                                   e=
                                        n=0
                                            n!

es un n´mero “nuevo”, en el sentido de que no es racional, ni la ra´ cuadrada
       u                                                           ız
de un n´mero racional, ni en general expresable en t´rminos de otros n´meros
       u                                            e                  u
ya conocidos. M´s adelante demostraremos que de hecho se trata de un n´mero
                a                                                       u
trascendente sobre Q. El unico sentido en que podemos “calcularlo” es en el de
                         ´
obtener aproximaciones racionales sumando t´rminos de la serie. El resultado
                                             e
es
                    e = 2, 7182818284590452353602874. . .


    Para acabar demostraremos un criterio v´lido para las llamadas series alter-
                                             a
nadas, es decir, para series de n´meros reales en las que los t´rminos sucesivos
                                 u                             e
tienen signos opuestos:

Teorema 1.89 (Criterio de Leibniz) Sea {an }∞ una sucesi´n de n´meros
                                                   n=0            o    u
                                                                  P
                                                                  ∞
reales positivos decreciente y convergente a 0. Entonces la serie   (−1)n an es
                                                                    n=0
convergente.
             ´
   Demostracion: Consideremos primero las sumas parciales pares. Por
ejemplo:
             S6 = (a0 − a1 ) + (a2 − a3 ) + (a4 − a5 ) + a6 .
   Teniendo en cuenta que la sucesi´n es decreciente, los sumandos as´ agrupa-
                                   o                                 ı
dos son todos mayores o iguales que 0, luego en general S2n ≥ 0.
   Por otra parte, S8 = S6 + (−a7 + a8) ≤ S6 , luego la sucesi´n {S2n }∞ es
                                                               o        n=0
mon´tona decreciente y acotada inferiormente por 0. Por lo tanto converge a
    o
un n´mero L.
     u
   Ahora, S2n+1 = S2n + a2n+1 , luego existe l´ S2n+1 = L + 0.
                                              ım
                                                  n
   Es f´cil comprobar que si las dos subsucesiones {S2n }∞ y {S2n+1 }∞
        a                                                   n=0          n=0
convergen a un mismo n´mero L, entonces toda la sucesi´n {Sn }∞ converge
                           u                              o      n=0
a L, es decir, la serie converge.
                             P
                             ∞
                                       1
   Por ejemplo, la serie       (−1)n+1 n es convergente. De nuevo no tenemos
                           n=1
m´s medio para calcular su l´
 a                          ımite que aproximarlo por una suma parcial. En
1.8. Sucesiones y series num´ricas
                            e                                                     57

realidad, cuando hacemos esto necesitamos saber cu´l es el error cometido, para
                                                  a
determinar el n´mero de cifras decimales correctas. Por ejemplo, las primeras
               u
sumas parciales de esta serie son:

            1   1          11   0, 73654   21   0, 71639   31   0, 70901
            2   0, 50000   12   0, 65321   22   0, 67093   32   0, 67776
            3   0, 83333   13   0, 73013   23   0, 71441   33   0, 70806
            4   0, 58333   14   0, 65870   24   0, 67274   34   0, 67865
            5   0, 78333   15   0, 72537   25   0, 71274   35   0, 70722
            6   0, 61666   16   0, 66287   26   0, 67428   36   0, 67945
            7   0, 75952   17   0, 72169   27   0, 71132   37   0, 70647
            8   0, 63452   18   0, 66613   28   0, 67560   38   0, 68016
            9   0, 74563   19   0, 71877   29   0, 71009   39   0, 70580
           10   0, 64563   20   0, 66877   30   0, 67675   40   0, 68080
    El l´
        ımite vale 0, 6931471805599453094172321. . . Por lo tanto, si al calcular
la d´cima suma afirm´ramos que el l´
    e                  a              ımite vale 0, 6456. . . estar´
                                                                   ıamos cometiendo
un grave error. En realidad s´lo la primera cifra decimal es exacta (se dice que
                               o
un n´mero decimal finito aproxima a otro con n cifras exactas si las n primeras
     u
cifras de ambos n´meros coinciden). En general, al aproximar una serie por
                   u
una suma parcial, o al aproximar cualquier l´   ımite de una sucesi´n por uno de
                                                                      o
sus t´rminos, no sabemos cu´l es el error cometido, ni en particular cu´ntas
      e                         a                                             a
de las cifras de la aproximaci´n son exactas. Sin embargo, en el caso de las
                                 o
series alternadas es f´cil saberlo pues, seg´n hemos visto, las sumas pares son
                       a                    u
decrecientes (siempre est´n sobre el l´
                          a           ımite) y las impares son crecientes (siempre
est´n bajo el l´
   a           ımite), luego las ultimas sumas de la tabla nos dicen que el l´
                                  ´                                           ımite
se encuentra entre 0,68 y 0,71 y por lo tanto no sabemos ninguna de sus cifras
con exactitud (salvo el 0). Yendo m´s lejos tenemos:
                                      a

                     S1000 = 0, 69264 y S1001 = 0, 69364,

lo que nos permite afirmar que el l´ ımite est´ entre 0, 692 y 0, 694, es decir, es de
                                             a
la forma 0, 69. . . y ya tenemos dos cifras exactas.
    En la pr´ctica ignoraremos el problema t´cnico de determinar las cifras
             a                                    e
exactas que nos proporciona una aproximaci´n dada, y consideraremos que un
                                               o
n´mero es “conocido” si tenemos una sucesi´n que converge a ´l. Todas las
  u                                             o                     e
aproximaciones que daremos (calculadas con ordenador con t´cnicas de an´lisis
                                                                 e              a
num´rico) tendr´n todas sus cifras exactas.
     e             a
Cap´
   ıtulo II

Compacidad, conexi´n y
                  o
completitud

    Finalmente tenemos los suficientes elementos de topolog´ como para que
                                                             ıa
´sta se convierta en una herramienta eficaz. En los temas anteriores apenas he-
e
mos extra´ las consecuencias m´s elementales de las definiciones de topolog´
          ıdo                    a                                         ıa,
continuidad, etc. Los resultados que veremos ahora van mucho m´s lejos y dan
                                                                 a
una primera muestra de las posibilidades de las t´cnicas topol´gicas.
                                                 e            o


2.1     Espacios compactos
   La compacidad es en topolog´ una propiedad similar a la “dimensi´n finita”
                                 ıa                                   o
en ´lgebra lineal. Los espacios compactos no son necesariamente finitos, pero se
   a
comportan en muchos aspectos como si lo fueran. Por ejemplo, es obvio que en
un espacio finito toda sucesi´n ha de tomar infinitas veces un mismo valor, luego
                            o
toda sucesi´n contiene una subsucesi´n constante, en particular convergente. Lo
           o                        o
mismo ocurre en R, como se desprende del teorema siguiente.

Teorema 2.1 Toda sucesi´n en un conjunto totalmente ordenado contiene una
                       o
subsucesi´n mon´tona.
         o     o

    Demostracion: Sea {an }∞ una sucesi´n en un conjunto totalmente or-
                    ´            n=0            o
denado. Sea A el conjunto de las im´genes de la sucesi´n. Si A es finito es obvio
                                       a                 o
que A tiene una subsucesi´n constante, luego mon´tona. Supongamos que A es
                             o                       o
infinito.
    Si todo subconjunto no vac´ de A tiene m´
                                 ıo              ınimo podemos tomar x0 igual al
m´ınimo de A, luego x1 igual al m´   ınimo de A  {x0 }, luego x2 igual al m´ınimo
de A  {x0 , x1 }, y as´ obtenemos puntos x0 < x1 < x2 <. . ., es decir, obtenemos
                       ı
un subconjunto de A sin m´ximo.a
    As´ pues, o bien existe un subconjunto de A sin m´
       ı                                                   ınimo o bien existe un
subconjunto de A sin m´ximo. Los dos casos se tratan igual. Supongamos que
                           a
hay un subconjunto de A sin m´    ınimo. Llam´moslo B.
                                              e

                                       59
60                            Cap´
                                 ıtulo 2. Compacidad, conexi´n y completitud
                                                            o

    Sea an0 un elemento cualquiera de B. Como B no tiene m´         ınimo contiene
infinitos t´rminos de la sucesi´n bajo an0 , pero s´lo un n´mero finito de ellos
          e                      o                    o        u
tienen ´
       ındice anterior a n0 , luego existe un an1 en B tal que an1 < an0 y n0 < n1 .
Podemos repetir indefinidamente este proceso y obtener una subsucesi´n      o
                    an0 > an1 > an2 > an3 > an4 > an5 >. . .
mon´tona decreciente.
   o
    Como en R toda sucesi´n mon´tona converge a su supremo o a su ´
                           o       o                                    ınfimo,
esto prueba que en este espacio toda sucesi´n contiene una subsucesi´n conver-
                                           o                        o
gente, al igual que ocurre en los espacios finitos. Cualquier intervalo [a, b] es
homeomorfo a R, luego tambi´n cumple esto mismo.
                             e
    Por otro lado esto es falso en R. La sucesi´n de los n´meros naturales no con-
                                               o          u
tiene ninguna subsucesi´n convergente (ya que cualquier subsucesi´n converge
                          o                                           o
a +∞ en R, luego no converge en R).
    El espacio R y los intervalos [a, b] son ejemplos de espacios compactos. La
propiedad de las subsucesiones convergentes caracteriza la compacidad en espa-
cios m´tricos, pero para el caso general necesitamos otra definici´n m´s elabo-
       e                                                           o   a
rada.
Definici´n 2.2 Sea X un espacio topol´gico. Un cubrimiento abierto de X es
        o                               o         S
una familia {Ai }i∈I de abiertos de X tal que X =   Ai .
                                                      i∈I
   Un subcubrimiento del cubrimiento dado es un cubrimiento formado por
parte de los abiertos del primero.
   Un espacio de Hausdorff K es compacto si de todo cubrimiento abierto de
K se puede extraer un subcubrimiento finito.
   Es obvio que si X es un espacio finito, de todo cubrimiento abierto se puede
extraer un subcubrimiento finito. Basta tomar un abierto que contenga a cada
uno de los puntos del espacio. As´ pues, todo espacio de Hausdorff finito es
                                   ı
compacto.
    Observar que si B es una base de un espacio de Hausdorff K, se cumple que
K es compacto si y s´lo si todo cubrimiento de K por abiertos b´sicos admite
                      o                                         a
un subcubrimiento finito. En efecto, si {Ai }i∈I es un cubrimiento arbitrario,
para cada punto x ∈ K existe un ix ∈ I tal que x ∈ Aix y existe un Bx ∈ B
tal que x ∈ Bx ⊂ Aix . Entonces {Bx }x∈K es un cubrimiento de K formado por
abiertos b´sicos y tiene un subcubrimiento finito
          a
                 K = Bx1 ∪ · · · ∪ Bxn ⊂ Aix1 ∪ · · · ∪ Aixn ⊂ K.
   Una familia de abiertos forma un cubrimiento si y s´lo si la familia de sus
                                                       o
complementarios es una familia de cerrados con intersecci´n vac´ Por ello la
                                                         o      ıa.
compacidad puede caracterizarse as´ en t´rminos de familias de cerrados:
                                  ı     e
    Un espacio de Hausdorff K es compacto si y s´lo si toda familia de cerrados
                                                   o
{Ci }i∈I con la propiedad de que cualquier intersecci´n finita de ellos no es vac´
                                                     o                          ıa,
tiene intersecci´n total no vac´
                o              ıa.
2.1. Espacios compactos                                                      61

    La propiedad de que las intersecciones finitas sean no vac´ se llama pro-
                                                             ıas
piedad de la intersecci´n finita. Por lo tanto:
                       o

Teorema 2.3 Un espacio de Hausdorff K es compacto si y s´lo si toda familia
                                                              o
de cerrados de K con la propiedad de la intersecci´n finita tiene intersecci´n no
                                                  o                        o
vac´
   ıa.

    A menudo nos encontraremos con espacios que no son compactos pero tienen
subespacios compactos. Por ello resulta util caracterizar la compacidad de un
                                        ´
subespacio en t´rminos de la topolog´ de todo el espacio y no de la topolog´
               e                    ıa                                      ıa
relativa. Concretamente:

Teorema 2.4 Sea X un espacio de Hausdorff y K un subespacio de X. Enton-
ces K es compacto S y s´lo si para toda familia {Ai }i∈I de abiertos (b´sicos)
                  si    o                                              a
de X tal que K ⊂     Ai se puede extraer una subfamilia finita que cumpla lo
mismo.           i∈I


                 ´
    Demostracion: Supongamos que K es compacto. Entonces {Ai ∩ K}i∈I
es claramente un cubrimiento abierto de K, del que podemos extraer un subcu-
brimiento finito de modo que

                       K = (Ai1 ∩ K) ∪ · · · ∪ (Ain ∩ K),

luego K ⊂ Ai1 ∪ · · · ∪ Ain .
   Rec´ıprocamente, si K cumple esta propiedad y {Ai }i∈I es un cubrimiento
abierto de K, entonces para cadaS existe S abierto Bi de X tal que Ai =
                                 i       un
Bi ∩ K. Consecuentemente K =       Ai ⊂     Bi , luego por hip´tesis podemos
                                                              o
                                  i∈I      i∈I
tomar un n´mero finito de conjuntos de modo que K ⊂ Bi1 ∪ · · · ∪ Bin , luego
          u
K = (Bi1 ∩ K) ∪ · · · ∪ (Bin ∩ K) = Ai1 ∪ · · · ∪ Ain . As´ pues, K es compacto.
                                                          ı


   Si la uni´n de una familia de abiertos de un espacio X contiene a un subes-
            o
pacio K, diremos que forma un cubrimiento abierto de K en X. As´ pues, un
                                                                    ı
subespacio K de X es compacto si y s´lo si de todo cubrimiento abierto de K
                                       o
en X puede extraerse un subcubrimiento finito (en X tambi´n).e
   Aqu´ estamos considerando la topolog´ de X, pero deberemos tener siempre
        ı                                ıa
presente que la compacidad es una propiedad absoluta, y depende exclusiva-
mente de la topolog´ del propio espacio K.
                   ıa
   Los teoremas siguientes muestran la anunciada similitud entre los espacios
compactos y los espacios finitos. Por lo pronto, todo espacio finito es cerrado.
El an´logo con compactos es el siguiente:
     a

Teorema 2.5 Se cumplen las propiedades siguientes:

  a) Si X es un espacio de Hausdorff y K ⊂ X es compacto, entonces K es
     cerrado en X.

  b) Si K es un compacto y C ⊂ K es un cerrado, entonces C es compacto.
62                            Cap´
                                 ıtulo 2. Compacidad, conexi´n y completitud
                                                            o

     c) Si M es un espacio m´trico y K ⊂ M es compacto, entonces K est´
                            e                                         a
        acotado.

                   ´
    Demostracion: a) El argumento es el mismo que emplear´     ıamos si K fuera
finito. Veamos que X  K es abierto. Sea x ∈ X  K. Para cada punto u ∈ K
existen abiertos disjuntos Au y Bu tales que u ∈ Au y x ∈ Bu . Si K fuera
finito bastar´ tomar ahora la intersecci´n de los Bu y tendr´
            ıa                           o                   ıamos un entorno
de x contenido en X  K. Ahora aplicamos la compacidad de K. Los conjuntos
Au forman un cubrimiento abierto de K, luego existe un subcubrimiento finito:
                               T
                               n
K ⊂ Au1 ∪ · · · ∪ Aun . Ahora,   Bui es un entorno de x que no corta a K, luego
                               i=1
X  K es un entorno de x.
   b) Si {Ai }i∈I es un cubrimiento abierto de C, entonces {Ai }i∈I ∪ {K  C}es
un cubrimiento abierto de K, luego existe un subcubrimiento finito

                          K = Ai1 ∪ · · · ∪ Ain ∪ (K  C).

     Claramente entonces C ⊂ Ai1 ∪ · · · ∪ Ain , luego C es compacto.
  c) Sea x ∈ M un punto cualquiera. Para cada u ∈ K, sea ru = d(x, u) + 1.
                S
Obviamente K ⊂     Bru (x). Por compacidad podemos extraer un subcubri-
                   u∈K
miento finito de modo que K ⊂ Bru1 (x)∪· · ·∪Brun (x). Las bolas son conjuntos
acotados, una uni´n finita de acotados es acotada y todo subconjunto de un aco-
                 o
tado est´ acotado. Por tanto K est´ acotado.
        a                          a

Teorema 2.6 Si K es un espacio compacto, toda sucesi´n en K posee un punto
                                                    o
adherente. Por tanto si adem´s K cumple 1AN, toda sucesi´n en K tiene una
                            a                           o
subsucesi´n convergente.
         o

  Demostracion: Sea {an }∞ una sucesi´n en K. Sea An = {am | m ≥ n}.
            ´            n=0         o
Obviamente
                 A0 ⊃ A1 ⊃ A2 ⊃ A3 ⊃ A4 ⊃. . . ,
luego tambi´n
           e
                         A0 ⊃ A1 ⊃ A2 ⊃ A3 ⊃ A4 ⊃. . . ,
y as´ tenemos una familia de cerrados con la propiedad de la intersecci´n finita.
    ı                                                                  o
                                      T
                                      ∞
Por compacidad existe un punto x ∈       Ai . Obviamente x es un punto adhe-
                                        i=0
rente de la sucesi´n, pues si n es un natural y U es un entorno de x, entonces
                  o
x ∈ An , luego U ∩ An 6= ∅, es decir, existe un m ≥ n tal que am ∈ U .
   Como hab´ıamos anunciado, esta propiedad caracteriza a los espacios m´tri-
                                                                        e
cos compactos.

Teorema 2.7 Un espacio m´trico M es compacto si y s´lo si toda sucesi´n en
                           e                       o                 o
M tiene una subsucesi´n convergente.
                     o
2.1. Espacios compactos                                                        63

                ´
   Demostracion: Supongamos que M no fuera compacto. Entonces existir´ıa
                           S
un cubrimiento abierto M =   Ai que no admite subcubrimientos finitos.
                              i∈I
    Sea ≤ > 0 y x0 ∈ M . Si B≤ (x) 6= M , existe un punto x1 ∈ M tal que
d(x1 , x0 ) ≥ ≤. Si B≤ (x0 ) ∪ B≤ (x1 ) 6= M , existe un punto x2 ∈ M tal que
d(x2 , x0 ) ≥ ≤, d(x2 , x1 ) ≥ ≤.
    Si M no pudiera cubrirse por un n´mero finito de bolas de radio ≤, podr´
                                        u                                   ıamos
construir una sucesi´n {xn }∞ con la propiedad de que d(xi , xj ) ≥ ≤ para
                         o        n=0
todos los naturales i, j. Es claro que tal sucesi´n no puede tener subsucesiones
                                                  o
convergentes, pues una bola de centro el l´   ımite y radio ≤/2 deber´ contener
                                                                     ıa
infinitos t´rminos de la sucesi´n, que distar´ entre s´ menos de ≤.
            e                      o          ıan       ı
    Concluimos que para todo ≤ > 0 existen puntos x0 , . . . , xn ∈ M de modo
que M = B≤ (x0 ) ∪ · · · ∪ B≤ (xn ).
    Lo aplicamos a ≤ = 1 y obtenemos tales bolas. Si todas ellas pudieran
cubrirse con un n´mero finito de abiertos Ai tambi´n M podr´ luego al menos
                    u                                e         ıa,
una de ellas, digamos B1 (x0 ) no es cubrible por un n´mero finito de abiertos
                                                          u
del cubrimiento.
    Igualmente, con ≤ = 1/2 obtenemos una bola B1/2 (x1 ) no cubrible por un
n´mero finito de abiertos del cubrimiento. En general obtenemos una sucesi´n
 u                                                                             o
de bolas B1/(n+1) (xn ) con esta propiedad.
    Sea x un punto adherente de la sucesi´n {xn }∞ . Sea i ∈ I tal que x ∈ Ai .
                                           o        n=0
Como Ai es un abierto existe un n´mero natural k tal que B2/(k+1) (x) ⊂ Ai . Sea
                                      u
n > k tal que d(xn , x) < 1/(k + 1). Entonces B1/(n+1) (xn ) ⊂ B2/(k+1) (x) ⊂ Ai ,
en contradicci´n con que B1/(n+1) (xn ) no era cubrible con un n´mero finito de
                 o                                                 u
abiertos del cubrimiento.
   Seg´n lo visto al comienzo de la secci´n, R es compacto. Adem´s:
      u                                  o                      a

Teorema 2.8 Un subconjunto de R es compacto si y s´lo si es cerrado y aco-
                                                  o
tado.

   Demostracion: Por el teorema 2.5, todo compacto en R ha de ser cerrado
                ´
y acotado. Si C es un conjunto cerrado y acotado, toda sucesi´n en C tiene
                                                               o
una subsucesi´n convergente en R. Como C es acotado su l´
             o                                            ımite estar´ en R y
                                                                     a
como C es cerrado, su l´
                       ımite estar´ en C, luego toda sucesi´n en C tiene una
                                  a                        o
subsucesi´n convergente en C. Por el teorema anterior C es compacto.
         o
    Tambi´n se puede probar el teorema anterior viendo que los cerrados y aco-
          e
tados de R son precisamente los subconjuntos cerrados de R (o, si se prefiere,
esto es consecuencia inmediata del teorema anterior).

Ejemplo Vamos a usar la compacidad de [0, 1] para calcular el cardinal de R.
Si I = [a, b] es un intervalo cerrado, llamaremos
                        ∑            ∏         ∑           ∏
                                b−a                  b−a
                   I0 = a, a +          , I1 = a + 2     ,b ,
                                  3                   3

que son dos intervalos cerrados disjuntos contenidos en I.
64                             Cap´
                                  ıtulo 2. Compacidad, conexi´n y completitud
                                                             o

     De este modo, partiendo de I = [0, 1] podemos formar los intervalos I0 , I1 ,
I00 , I01 , I10 , I11 , etc. M´s exactamente, para cada aplicaci´n s : N −→ {0, 1}
                               a                                   o
y cada n ∈ N, si llamamos s|n = s0 . . . sn−1 , tenemos definidos los intervalos
Is|n (entendiendo que Is|0 = I), y es claro que forman una sucesi´n decreciente,
                                                                        o
es decir, si m ≤ n entonces Is|n ⊂ Is|m . Por lo tanto, {Is|n }∞ es una familia
                                                                    n=0
de cerrados en I con la propiedad de la intersecci´n finita. Por compacidad
                                                          o
                         T
                         ∞
tenemos que Is =            Is|n 6= ∅. M´s a´n, es claro que la longitud (el di´metro)
                                        a u                                    a
                   n=0
de Is|n es 1/3n , y como Is ⊂ Is|n , necesariamente el di´metro de Is ha de ser
                                                           a
menor o igual que 1/3n para todo n, es decir, ha de ser 0. Esto implica que Is
contiene un unico punto. Digamos Is = {xs }.
             ´
   Tambi´n es claro que si s 6= t entonces xs 6= xt . En efecto, si n es el primer
          e
natural tal que s|n+1 6= tn+1 , entonces Is|n = It|n y los intervalos Is|n+1 , It|n+1
son subconjuntos disjuntos. Como contienen a xs y xt respectivamente, ´stos     e
han de ser puntos distintos.
   Esto prueba que |I| ≥ |2N | = 2ℵ0 . Por otra parte, |R| ≤ 2ℵ0 , pues si a
cada r ∈ R le asignamos el conjunto de los n´meros racionales menores que r
                                               u
obtenemos una aplicaci´n inyectiva de R en las partes de Q. Por consiguiente
                        o
tenemos que |I| = |R| = 2ℵ0 .

Teorema 2.9 (Teorema de Tychonoff) El producto de espacios compactos
es compacto.
                          Q
              ´
    Demostracion: Sea K =   Ki un producto de espacios compactos. To-
                                  i∈I
memos una familia B de cerrados en K con la propiedad de la intersecci´n          o
finita. Hemos de probar que su intersecci´n es no vac´ El conjunto de todas
                                             o            ıa.
las familias de subconjuntos de K (no necesariamente cerrados) que contienen
a B y tienen la propiedad de la intersecci´n finita, parcialmente ordenado por
                                             o
la inclusi´n, satisface las hip´tesis del lema de Zorn, lo que nos permite tomar
          o                     o       T        T
una familia maximal U. Entonces             U⊂       B, luego basta probar que la
primera intersecci´n es no vac´
                     o            ıa. U ∈U     B∈B

    En primer lugar observamos que si un conjunto A ⊂ K corta a todos los
elementos de U entonces est´ en U, pues en caso contrario U ∪ {A} contradir´
                               a                                                   ıa
la maximalidad de U.
    Sea pi : K −→ Ki la proyecci´n en el factor i-´simo. Es f´cil ver que la
                                      o                e             a
familia {pi [U ] | U ∈ U} tiene la propiedad de la intersecci´n finita luego, por la
                                                              o
compacidad de Ki , existe un punto xi ∈ Ki tal que xi ∈ pi [U ] para T   todo U ∈ U.
Estos puntos determinan un punto x ∈ K. Basta probar que x ∈                U.
                                                                       U ∈U
                                                          T −1
    Fijemos un entorno b´sico de x, de la forma A =
                            a                                 pi [Gi ], donde F ⊂ I
                                                          i∈F
es finito y Gi es abierto en Ki . Para cada U ∈ U tenemos que xi ∈ pi [U ],
luego Gi ∩ pi [U ] 6= ∅, luego p−1 [Gi ] ∩ U 6= ∅. Como esto es cierto para todo
                                i
U ∈ U, seg´n hemos observado antes podemos concluir que p−1 [Gi ] ∈ U, para
           u                                                   i
todo i ∈ F . Como U tiene la propiedad de la intersecci´n finita, A ∈ U. De
                                                          o
aqu´ se sigue que A corta a todo U ∈ U y, como A es un entorno b´sico de x,
    ı                                                                 a
esto implica que x ∈ U para todo U ∈ U.
2.1. Espacios compactos                                                       65

   Ahora podemos probar:

Teorema 2.10 Un subconjunto de Kn , es compacto si y s´lo si es cerrado y
                                                      o
acotado.

                 ´
    Demostracion: La acotaci´n depende en principio de la distancia que
                                o
consideremos. Hemos de entender que se trata de la inducida por cualquiera de
las tres normas definidas en el cap´ıtulo I. Por el teorema 1.5, todas tienen los
mismos acotados. Trabajaremos concretamente con
                                    ©     Ø              ™
                      kxk∞ = m´x |xi | Ø i = 1, . . . , n .
                                 a

   Como Cn es homeomorfo a R2n (con los mismos conjuntos acotados), basta
probar el teorema para Rn . Ya hemos visto que un compacto ha de ser cerrado
y acotado. Supongamos que K es un subconjunto de Rn cerrado y acotado.
Esto significa que existe un M > 0 tal que para todo punto x ∈ C se cumple
kxk ≤ M , lo que significa que si x ∈ C, cada xi ∈ [−M, M ] o, de otro modo,
que C ⊂ [−M, M ]n .
   Pero por el teorema anterior [−M, M ]n es compacto y C es cerrado en ´l,
                                                                          e
luego C tambi´n es compacto.
               e
   Los espacios que nos van a interesar son fundamentalmente los subconjuntos
de Rn . Vemos, pues, que la compacidad es muy sencilla de reconocer. En
particular las bolas cerradas y las esferas son compactos. El espacio C∞ es
homeomorfo a una esfera, luego es compacto. Lo mismo ocurre con R∞ , que es
homeomorfo a una circunferencia.
   Una de las propiedades m´s importantes de la compacidad es que se conserva
                             a
por aplicaciones continuas (comp´rese con el hecho de que la imagen (continua)
                                 a
de un conjunto finito es finita).

Teorema 2.11 La imagen de un espacio compacto por una aplicaci´n continua
                                                                 o
es de nuevo un espacio compacto (supuesto que sea un espacio de Hausdorff).

                ´
   Demostracion: Sea f : K −→ X continua y suprayectiva. Supongamos
que K es compacto y que X es un espacio de Hausdorff. Si {Ai }i∈I es un
                                  ©          ™
cubrimiento abierto de X, entonces f −1 [Ai ] i∈I es un cubrimiento abierto
de K, luego admite un subcubrimiento finito K = f −1 [Ai1 ] ∪ · · · ∪ f −1 [Ain ].
Entonces X = Ai1 ∪ · · · ∪ Ain .
   Este hecho tiene muchas consecuencias.

Teorema 2.12 Si f : K −→ X es biyectiva y continua, K es compacto y X es
un espacio de Hausdorff, entonces f es un homeomorfismo.

                 ´
   Demostracion: Basta probar que la inversa en continua, o sea, que trans-
forma cerrados de K en cerrados de X, o equivalentemente, que si C es cerrado
en K, entonces f [C] es cerrado en X, pero es que C es compacto, luego f [C]
tambi´n lo es, luego es cerrado.
     e
66                                  Cap´
                                       ıtulo 2. Compacidad, conexi´n y completitud
                                                                  o

Ejemplo Una circunferencia es homeomorfa a un cuadrado.
   En efecto, si C es un cuadrado de centro (0, 0) en R2 , es claro que la apli-
caci´n de C en la circunferencia unidad dada por x 7→ x/kxk es biyectiva y
    o
continua y, como C es compacto, es un homeomorfismo.

*Ejemplo Los espacios proyectivos son compactos.
   En efecto, basta probar que Pn (K) es compacto, pero la restricci´n de la
                                                                      o
proyecci´n a la esfera unidad de Kn+1 es continua y suprayectiva y la esfera es
        o
compacta.
   Otro hecho obvio es que toda aplicaci´n continua de un compacto a un
                                           o
espacio m´trico est´ acotada. Para las funciones reales podemos decir m´s:
         e         a                                                   a

Teorema 2.13 Si f : K −→ R es continua y K es un compacto no vac´            ıo,
existen u, v ∈ K tales que para todo x ∈ K, se cumple f (u) ≤ f (x) ≤ f (v). Es
decir, que f alcanza un valor m´ınimo y un valor m´ximo.
                                                  a

                  ´
    Demostracion: Sea C = f [K]. Entonces C es cerrado y acotado. Sean m
y M su ´ ınfimo y su supremo, respectivamente. As´ para todo x ∈ K se cumple
                                                   ı
que m ≤ f (x) ≤ M . S´lo falta probar que m y M son im´genes de puntos de
                        o                                   a
K, o sea, que m, M ∈ C. Ve´moslo para M .
                              a
    Si ≤ > 0, entonces M − ≤ no es una cota superior de C, luego existe un punto
y ∈ C de modo que M − ≤ < y, es decir, que ]M − ≤, M + ≤[ ∩ C 6= ∅. Esto
significa que todo entorno (b´sico) de M corta a C, o sea, M ∈ C = C.
                              a
    Observar que este resultado es falso sin compacidad. Por ejemplo la funci´n
                                                                             o
f : ]0, 1[ −→ R dada por f (x) = x no tiene m´ximo ni m´
                                                a          ınimo. Veamos una
aplicaci´n del teorema anterior:
         o

Teorema 2.14 Todas las normas en Kn inducen la misma topolog´ Adem´s
                                                            ıa.   a
los subconjuntos acotados son los mismos para todas ellas.

   Demostracion: Sea k k : Kn −→ [0, +∞[ una norma cualquiera. Vamos
                ´
                                                          P
                                                          n
a ver que induce la misma topolog´ que la dada por kxk1 =
                                 ıa                         |xi | y que los
                                                                                i=1
acotados son los mismos para ambas. Esto probar´ el teorema.
                                               a
  Sea {e1 , . . . , en } la base can´nica de Kn . Si x ∈ Kn se puede expresar como
                                    o
   Pn
x=    xi ei , luego
     i=1

                   n
                   X                     n
                                         X                         n
                                                                   X
           kxk ≤         |xi | kei k ≤         kxk1 kei k = kxk1         kei k = Kkxk1 .
                   i=1                   i=1                       i=1
                                          Ø         Ø
   Por lo tanto, si x, y ∈ Kn , se cumple Økxk − kykØ ≤ kx − yk ≤ Kkx − yk1 ,
o sea que la aplicaci´n k k tiene la propiedad de Lipschitz, luego es continua
                     o
respecto a la topolog´ inducida por k k1 .
                     ıa
   Sea S = {x ∈ Kn | kxk1 = 1}. Se trata de una esfera, luego de un conjunto
compacto para lo topolog´ usual de Kn . Por lo tanto la aplicaci´n k k alcanza
                          ıa                                    o
2.2. Espacios conexos                                                             67

su m´ximo y su m´
     a            ınimo en S y as´ como no se anula, existen 0 < m ≤ M en R
                                  ı,
tales que para todo x ∈ S se tiene m ≤ kxk ≤ M .    ∞        ∞
    Si x ∈ Kn  {0}, entonces x/kxk1 ∈ S, luego m ≤ ∞x/kxk1 ∞ ≤ M , es decir,

                             mkxk1 ≤ kxk ≤ M kxk1 ,

o tambi´n,
       e
                              1
                         kxk1 ≤  kxk, kxk ≤ M kxk1 .
                              m
   Como 0 cumple esto trivialmente, en realidad vale para todo x ∈ Kn . De
aqu´ se sigue que toda bola de centro x con respecto a una norma contiene
   ı
a otra respecto a la otra norma, luego los acotados son los mismos. Adem´s
                                                                         a
todo entorno de un punto para una norma lo es para la otra norma, luego las
topolog´ inducidas son las mismas.
       ıas
    As´ pues, podemos hablar de acotados en Kn sin precisar la norma a la que
      ı
nos referimos. Sin embargo no hay que olvidar que los acotados pueden variar
si consideramos m´tricas que no provengan de normas. Por ejemplo la distancia
                  e

                            d(x, y) = m´
                                       ın{kx − yk, 1}.

   Tambi´n es claro que el teorema anterior es v´lido de hecho para cualquier
         e                                      a
K-espacio vectorial de dimensi´n finita.
                              o


2.2      Espacios conexos
    Pensemos en los espacios siguientes: [0, 1] y [0, 1] ∪ [2, 3]. Hay una diferencia
esencial entre ellos, y es que el primero est´ formado por “una sola pieza”
                                                   a
mientras que el segundo consta de “dos piezas”. La diferencia no es conjuntista,
pues tambi´n podemos dividir [0, 1] = [0, 1/2] ∪ ]1/2, 1], pero esto no son dos
             e
piezas en el mismo sentido que en el caso de [0, 1] ∪ [2, 3]. La diferencia es que
los intervalos [0, 1/2] y ]1/2, 1] est´n “pegados” mientras que los intervalos [0, 1]
                                      a
y [2, 3] est´n “separados”. Con m´s precisi´n, el punto 1/2 est´ s´lo en uno de
            a                         a        o                     a o
los intervalos, el [0, 1/2], pero aunque no est´ en el otro, est´ pegado a ´l, en el
                                                 a                a          e
sentido de que est´ en su clausura.
                    a
    En general, si un espacio X se expresa como X = U ∪ V , donde U y V
son disjuntos y no vac´   ıos, podemos decir que U y V son dos “piezas” en el
sentido que estamos considerando si U no contiene puntos de la clausura de V
y viceversa. Ahora bien, cualquier punto de V que no estuviera en V deber´         ıa
estar en U , luego la condici´n equivale a que V = V y U = U , o sea, a que
                                o
U y V sean cerrados. Por otra parte, dado que U y V son complementarios,
es lo mismo decir que son cerrados o que son abiertos. Con ello llegamos a la
definici´n de conexi´n:
         o             o

Definici´n 2.15 Un espacio topol´gico X es disconexo si existen subconjuntos
         o                      o
abiertos U y V en X tales que X = U ∪ V , U ∩ V = ∅ y U 6= ∅ 6= V . En caso
contrario X es conexo.
68                              Cap´
                                   ıtulo 2. Compacidad, conexi´n y completitud
                                                              o

   Seg´n hemos dicho, es indistinto exigir que U y V sean abiertos como que
       u
sean cerrados, pues de hecho si cumplen esto son a la vez abiertos y cerrados.
Por lo tanto, un espacio X es conexo si y s´lo si sus unicos subconjuntos que
                                            o         ´
son a la vez abiertos y cerrados son X y ∅.
     Es obvio que [0, 1] ∪ [2, 3], o incluso [0, 1/2[ ∪ ]1/2, 1] son ejemplos de espacios
disconexos. Notar que [0, 1/2[ no es cerrado en R, pero s´ lo es en el espacio
                                                                     ı
[0, 1/2[ ∪ ]1/2, 1] (su clausura en este espacio es la intersecci´n con ´l de su
                                                                         o       e
clausura en R, que es [0, 1/2], o sea, es [0, 1/2[).
   Es importante tener claro que los intervalos [0, 1/2[ y ]1/2, 1] est´n separados
                                                                       a
pese a que s´lo falta un punto entre ellos. La falta de ese punto es suficiente
            o
para que ambas partes no se puedan “comunicar”, en el sentido de que, por
ejemplo, ninguna sucesi´n contenida en una de las piezas puede converger a un
                        o
punto de la otra. Esto es suficiente para que ambas partes sean independientes
topol´gicamente. As´ la funci´n f : [0, 1/2[ ∪ ]1/2, 1] −→ R dada por
     o               ı,         o
                                  Ω
                                    1 si x ∈ [0, 1/2[ ,
                          f (x) =
                                    2 si x ∈ ]1/2, 1]
es continua, mientras que ser´ imposible definir una funci´n continua sobre
                                ıa                            o
[0, 1] que s´lo tomara los valores 1 y 2.
            o
     Si la desconexi´n de estos espacios es clara, no lo es tanto la conexi´n de
                    o                                                      o
espacios como [0, 1].
Ejercicio: Probar que el intervalo [0, 1] ⊂ Q es disconexo.

Teorema 2.16 Un subconjunto de R es conexo si y s´lo si es un intervalo.
                                                 o
    Demostracion: Sea C un subespacio conexo de R. Sean a y b su ´
                 ´                                                   ınfimo
y su supremo, respectivamente. Vamos a probar que C es uno de los cuatro
intervalos de extremos a y b. Para ello basta ver que si a < x < b entonces
x ∈ C. En caso contrario los conjuntos C ∩ [−∞, x[ y C ∩ ]x, +∞] son dos
abiertos disjuntos no vac´ de C cuya uni´n es C.
                         ıos             o
    Tomemos ahora un intervalo I y veamos que es conexo. Supongamos que
existen abiertos disjuntos no vac´ U y V en I de modo que I = U ∪ V .
                                    ıos
Tomemos x ∈ U e y ∈ V . Podemos suponer que x < y.
    Como I es un intervalo, [x, y] ⊂ I y U 0 = U ∩ [x, y], V 0 = V ∩ [x, y] son
abiertos disjuntos no vac´ en [x, y] de modo que [x, y] = U 0 ∪ V 0 .
                         ıos
    Sea s el supremo de U 0 . Entonces s ∈ U 0 ∩ [x, y] = U 0 , luego en particular
s < y. Claramente ]s, y] ⊂ V 0 , luego s ∈ V 0 ∩ [x, y] = V 0 , contradicci´n.
                                                                           o
    Una consecuencia de esto es que un intervalo [a, b[ no es homeomorfo a
uno de tipo ]c, d[. En efecto, si eliminamos un punto de un intervalo ]c, d[ nos
queda un espacio disconexo, mientras que en [a, b[ podemos eliminar el punto
a y obtenemos un conexo. (Si fueran homeomorfos, el espacio que resultara de
eliminar la imagen de a en ]c, d[ deber´ ser homeomorfo a ]a, b[).
                                        ıa
Ejercicio: Probar que dos intervalos (acotados o no acotados) son homeomorfos si y
s´lo si son del mismo tipo: abierto ]a, b[, cerrado [a, b] o semiabierto [a, b[.
 o
2.2. Espacios conexos                                                          69

   Los resultados siguientes permiten probar con facilidad la conexi´n de mu-
                                                                    o
chos espacios. El primero refleja el hecho de que las aplicaciones continuas
pueden pegar pero nunca cortar.

Teorema 2.17 Las im´genes continuas de los espacios conexos son conexas.
                   a

                 ´
    Demostracion: Si f : X −→ Y es una aplicaci´n continua y suprayectiva
                                                     o
pero Y no es conexo, entonces X tampoco puede serlo, pues si A es una abierto
cerrado no vac´ en Y y distinto de Y , entonces f −1 [A] cumple lo mismo en X.
              ıo



Teorema 2.18 Sea {Ai }i∈I unaS
          T                   familia de subespacios conexos de un espacio
X tal que   Ai 6= ∅. Entonces   Ai es conexo.
          i∈I                    i∈I
                                        S
             ´
   Demostracion: Supongamos que               Ai = U ∪V , donde U y V son abiertos
                                        i∈I
disjuntos. Entonces para un i cualquiera se tendr´ que Ai = (U ∩ Ai ) ∪ (V ∩ Ai ),
                                                  a
pero U ∩ Ai , V ∩ Ai son abiertos disjuntos en Ai , luego uno de ellos es vac´ y
                                                                             ıo,
as´ Ai ⊂ U o bien Ai ⊂ V .
  ı                                          T
    Pero si Ai ⊂ U , entonces U contiene a      Ai , luego U corta a todos los Ai
                                           Si∈I
y por conexi´n los contiene a todos. As´
             o                           ı    Ai = U , y V = ∅. Igualmente, si
                                              i∈I
Ai ⊂ V se deduce que U es vac´
                             ıo.


Ejemplo Las circunferencias son conexas.
    Sea°f :√ 1] −→ {(x, y) ∈ R2 | x2 + y 2 = 1, y ≥ 0} la aplicaci´n dada por
            [−1,    ¢                                             o
f (x) = x, 1 − x2 .
    Claramente f es continua y suprayectiva, lo que prueba que la semicircun-
ferencia es conexa. Igualmente se prueba que la semicircunferencia opuesta es
conexa, y como ambas se cortan en los puntos (±1, 0), su uni´n, es decir, la
                                                               o
circunferencia, es conexa.

Teorema 2.19 Si A es un subespacio conexo de un espacio X, entonces A es
conexo.

                 ´
    Demostracion: Supongamos que A = U ∪ V , donde U y V son abiertos
disjuntos en A. Entonces A = (U ∩ A) ∪ (V ∩ A), y U ∩ A, V ∩ A son abiertos
disjuntos en A. Por conexi´n uno es vac´ luego A ⊂ U o bien A ⊂ V . Digamos
                          o            ıo,
A ⊂ U ⊂ A.
    Pero U es cerrado en A, luego A ⊂ U = U , es decir, U = A y V = ∅. Esto
prueba que A es conexo.
   Hemos dicho que un espacio disconexo es un espacio formado por varias
“piezas” ahora podemos dar una definici´n rigurosa de lo que entendemos por
                                      o
una “pieza”.
70                            Cap´
                                 ıtulo 2. Compacidad, conexi´n y completitud
                                                            o

Definici´n 2.20 Sea X un espacio topol´gico y x ∈ X. Llamaremos compo-
        o                                o
nente conexa de x a la uni´n C(x) de todos los subconjuntos conexos de X que
                          o
contienen a x. Por el teorema 2.18, C(x) es un conexo, el mayor subespacio
conexo de X que contiene a x.

    Es obvio que si x, y ∈ X, entonces C(x) y C(y) son iguales o disjuntas. En
efecto, si tienen puntos en com´n, por el teorema 2.18 resulta que C(x) ∪ C(y)
                               u
es un conexo, luego C(x) ∪ C(y) ⊂ C(x) y C(x) ∪ C(y) ⊂ C(y), con lo que
C(x) = C(x) ∪ C(y) = C(y).
    En resumen, todo espacio X est´ dividido en componentes conexas disjuntas.
                                  a
Las componentes conexas son cerradas por el teorema 2.19. En efecto, C(x) es
un conexo que contiene a x, luego C(x) ⊂ C(x).
    Sin embargo las componentes conexas no siempre son abiertas. Si un espacio
tiene un n´mero finito de componentes conexas, ´stas ser´n abiertas y cerradas
           u                                     e     a
a la vez, evidentemente, pero si hay infinitas componentes ya no es necesario.
Por ejemplo, ning´n subconjunto de Q con m´s de un punto es conexo, porque
                  u                           a
no es un intervalo de R, luego las componentes conexas de Q son los puntos,
que no son abiertos.

    A la hora de probar que un espacio es conexo, resulta                    y
util el concepto de arco. Un arco en un espacio X es una
´
aplicaci´n continua a : [0, 1] −→ X. El espacio X es arco-
          o                                                      x
conexo si para todo par de puntos x, y ∈ X existe un arco
a : [0, 1] −→ X tal que a(0) = x, a(1) = y.
    Como entonces x e y est´n en la imagen del arco a, que es un conexo, resulta
                             a
que x e y est´n en la misma componente conexa de X, o sea, que X tiene una
              a
unica componente conexa: Los espacios arco-conexos son conexos. El rec´
´                                                                         ıproco
no es cierto, pero no vamos a dar un ejemplo.
    Dados dos puntos x, y ∈ Rn , el segmento que los une est´ formado por
                                                                   a
los puntos de la forma y + λ(x − y), con λ ∈ [0, 1]. Esto se puede definir en
cualquier K-espacio vectorial. Si V es un espacio vectorial topol´gico y x, y ∈ V ,
                                                                 o
entonces la aplicaci´n a : [0, 1] −→ V dada por a(λ) = λx + (1 − λ)y es un arco
                    o
(el segmento) que une x con y.
    Un subconjunto A de un K-espacio vectorial V es convexo si para todos los
puntos x, y ∈ A y todo λ ∈ [0, 1] se cumple λx + (1 − λ)y ∈ A, es decir, si
cuando A contiene a dos puntos, tambi´n contiene al segmento que los une.
                                        e
    Uniendo todo esto, resulta que en un espacio vectorial topol´gico, todo con-
                                                                  o
vexo es arco-conexo, luego conexo. En particular todo espacio vectorial to-
pol´gico es conexo. En particular Kn es conexo.
    o
Ejercicio: Probar que toda esfera de centro O en Rn es imagen continua de Rn  {0}.
Probar que Rn  {0} es conexo y deducir de aqu´ la conexi´n de la esfera.
                                               ı         o

Ejercicio: Probar que R2 no es homeomorfo a R.
   Los conjuntos convexos tienen una propiedad que en general no cumplen los
conexos, y es que, claramente, la intersecci´n de convexos es convexa.
                                            o
2.2. Espacios conexos                                                              71

Ejemplo Las bolas en los espacios normados son convexas.
   En efecto, si x, y ∈ B≤ (z), entonces kx − zk < ≤, ky − zk < ≤, luego para
todo λ ∈ [0, 1] se cumple

            kλx + (1 − λ)y − zk = kλx + (1 − λ)y − λz + (1 − λ)zk

≤ kλ(x − z)k + k(1 − λ)(y − z)k = λkx − zk + (1 − l)ky − zk < λ≤ + (1 − λ)≤ = ≤.
   Por lo tanto λx + (1 − λ)y ∈ B≤ (z).
   (Cambiando las desigualdades estrictas por desigualdades no estrictas se
prueba que las bolas cerradas son convexas.)
    Por esto se dice que los espacios normados son localmente convexos. En
general, un espacio vectorial topol´gico es localmente convexo si tiene una base
                                   o
formada por conjuntos convexos. Igualmente un espacio topol´gico es localmente
                                                             o
conexo o localmente arco-conexo si tiene una base formada por abiertos cone-
xos o arco-conexos, respectivamente. As´ los espacios localmente convexos son
                                         ı,
localmente arco-conexos y los espacios localmente arco-conexos son localmente
conexos.
    Un hecho importante es que si A es un abierto en un espacio localmente
conexo X, entonces las componentes conexas de A son abiertas y cerradas. En
efecto, si C es una componente conexa de A y x ∈ C, entonces existe un abierto
(b´sico) U de X tal que U es conexo y x ∈ U ⊂ A. Como C es la componente
  a
conexa de x, ha de ser U ⊂ C, luego C es un entorno de x, o sea, C es entorno
de todos sus puntos, luego es un abierto.
Ejercicio: Probar que todo abierto no vac´ en R es la uni´n disjunta de una cantidad
                                         ıo              o
numerable de intervalos abiertos.
   Veamos algunos hechos adicionales sobre arcos. Sean a y b dos arcos en un
espacio X de modo que a(1) = b(0).
   Entonces la aplicaci´n b1 : [1, 2] −→ X dada por b1 (t) = b(t − 1) es continua
                       o
y cumple que b1 (1) = b(0), b1 (2) = b(1) (se trata de la composici´n con b del
                                                                    o
homeomorfismo i : [1, 2] −→ [0, 1] dado por i(t) = t − 1).


                                       a(1) = b(0)




                           a(0)                      b(1)

    Ahora, la uni´n c = a∪b1 : [0, 2] −→ X, esto es, la aplicaci´n que restringida
                   o                                               o
a [0, 1] es a y restringida a [1, 2] es b1 , es continua (porque restringida a los dos
cerrados [0, 1] y [1, 2] lo es, y su imagen es la uni´n de las im´genes de a y b.
                                                       o           a
    Finalmente, llamamos a ∪ b : [0, 1] −→ X a la funci´n (a ∪ b)(t) = c(2t),
                                                       o
es decir, la composici´n de c con el homeomorfismo j : [0, 1] −→ [0, 2] definido
                      o
72                            Cap´
                                 ıtulo 2. Compacidad, conexi´n y completitud
                                                            o

mediante j(t) = 2t. Claramente a ∪ b es un arco cuya imagen es la uni´n de las
                                                                        o
im´genes de a y b. En particular (a ∪ b)(0) = a(0) y (a ∪ b)(1) = b(1).
  a
   Esto significa que si podemos unir un punto x con un punto y a trav´s de
                                                                     e
un arco a, y podemos unir un punto y con un punto z a trav´s de un arco b,
                                                          e
entonces podemos unir x con z mediante el arco a ∪ b.
    Por otra parte, si a es un arco en un espacio X, la aplicaci´n −a : [0, 1] −→ X
                                                                o
dada por (−a)(t) = a(1 − t) es un arco con la misma imagen pero de modo que
(−a)(0) = a(1) y (−a)(1) = a(0). Tambi´n es obvio que un arco constante une
                                            e
un punto consigo mismo.
    De todo esto se sigue que la relaci´n “x e y se pueden unir mediante un arco”
                                        o
es reflexiva, sim´trica y transitiva en todo espacio X.
                e

Teorema 2.21 Sea X un espacio localmente arco-conexo. Entonces un abierto
de X es conexo si y s´lo si es arco-conexo.
                     o

                    ´
    Demostracion: Obviamente los abiertos arco-conexos son conexos. Su-
pongamos que A es un abierto conexo no vac´ Sea x ∈ A. Sea U el conjunto
                                               ıo.
de todos los puntos de A que pueden ser unidos con x mediante un arco conte-
nido en A.
    Veamos que U es abierto (en X o en A, es lo mismo). Sea y ∈ U . Entonces
existe un arco a en A tal que a(0) = x, a(1) = y. Como X es localmente arco-
conexo existe un abierto arco-conexo V tal que y ∈ V ⊂ A. Si z ∈ V , entonces
hay un arco b en V (luego en A) que une y con z, luego a ∪ b es un arco en A
que une x con z, luego z ∈ U .
    Por lo tanto V ⊂ U y as´ U es un entorno de y. Tenemos, pues, que U es
                               ı
entorno de todos sus puntos, luego es un abierto.
    Ahora veamos que U es un cerrado en A, o lo que es lo mismo, que A  U
es abierto. Como U no es vac´ por conexi´n tendr´ que ser U = A, lo que
                                 ıo,           o       a
significa que A es arco-conexo.
    Si y ∈ A  U , entonces y no puede ser unido a x mediante un arco. Existe un
abierto arco-conexo V tal que y ∈ V ⊂ A, pero los puntos de V pueden unirse
a y mediante un arco. Si alguno de estos puntos z pudiera unirse a x mediante
un arco a, tendr´ ıamos un arco b que une a y con z y un arco a que une z con x,
luego y se podr´ unir con x. Por lo tanto ning´n punto de V puede unirse con
                 ıa                              u
x, es decir, V ⊂ A  U , luego A  U es abierto.
   Una poligonal es una uni´n de un n´mero finito de segmentos. Una peque˜a
                           o          u                                     n
modificaci´n del teorema anterior permite probar que en un espacio localmente
          o
convexo, un abierto es conexo si y s´lo se es conexo por poligonales, es decir,
                                    o
todo par de puntos se puede unir por una poligonal.
    Ahora vamos con las aplicaciones de la conexi´n. El resultado principal es
                                                 o
el siguiente hecho obvio:

Teorema 2.22 (Teorema de los valores intermedios) Si X es un espacio
conexo, f : X −→ R es una aplicaci´n continua, x, y son puntos de X y
                                        o
f (x) < α < f (y), entonces existe un punto z ∈ X tal que f (z) = α.
2.2. Espacios conexos                                                        73

                 ´
  Demostracion: Se cumple que f [X] es un conexo, luego un intervalo.
Como f (x) y f (y) est´n en f [X], a tambi´n ha de estar en f [X].
                      a                   e
   A pesar de su simplicidad, las consecuencias de este teorema son importantes.
Por ejemplo, no hay polinomios irreducibles de grado impar sobre R, salvo los
de grado 1:

Teorema 2.23 Todo polinomio p(x) ∈ R[x] de grado impar tiene al menos una
ra´ en R.
  ız
                ´
   Demostracion: Como p(x) tiene una ra´ si y s´lo si la tiene −p(x), po-
                                             ız       o
demos suponer que su coeficiente director es positivo.
   Entonces l´ım p(x) = +∞, mientras que l´     ım p(x) = −∞. En particular
             x→+∞                             x→−∞
existe un u ∈ R tal que p(u) < 0 y existe un v ∈ R tal que p(v) > 0. Por el
teorema de los valores intermedios tambi´n existe un a ∈ R tal que p(a) = 0.
                                        e

   Por supuesto el teorema es falso para polinomios de grado par. Basta pensar
en el caso x2 + 1.
   Si a > 0, el teorema de los valores intermedios aplicado al polinomio xn − a
nos permite concluir la existencia de un b > 0 tal que bn = a. Es claramente
unico, pues si bn = cn , entonces (b/c)n = 1, de donde b/c = ±1, luego si ambos
´
son positivos b = c.

Definici´n 2.24 Para cada natural n > 0 y cada n´mero real a > 0 definimos
        o                                         u
la ra´ n-sima de a como el unico n´mero b > 0 tal que bn = a. Lo representa-
     ız    √               ´      u
remos b = n a

    Unas comprobaciones rutinarias muestran que si m, n son n´meros enteros
                                             ° √ ¢m              u
n > 0 y a > 0 entonces el n´mero am/n = n a
                            u                        depende s´lo de la fracci´n
                                                               o              o
m/n, con lo que tenemos definida la exponencial ar para todo n´mero real
                                                                     u
positivo a y todo n´mero racional r y extiende a la exponencial entera. Tambi´n
                   u                                                          e
se comprueba que ar+s = ar as , (ar )r = ars .

*Afinidades directas e inversas Las isometr´ de un espacio af´ eucl´
                                                 ıas               ın    ıdeo
E se clasifican en movimientos y simetr´ seg´n que el determinante de la
                                           ıas   u
aplicaci´n lineal asociada sea igual a 1 o a −1. La topolog´ proporciona una
        o                                                  ıa
interpretaci´n geom´trica de esta distinci´n puramente algebraica. En efecto,
            o        e                     o
es conocido que todo movimiento (en dimensi´n mayor que 1) se descompone
                                               o
en composici´n de giros, y un giro es una aplicaci´n f que en un sistema de
              o                                     o
referencia af´ adecuado tiene la expresi´n:
             ın                          o

                         x01   = x1 cos α − x2 sen α,
                         x02   = x1 sen α + x2 cos α
                         x03   = x3 ,
                         ···     ···
                         x0
                          n    = xn
74                              Cap´
                                   ıtulo 2. Compacidad, conexi´n y completitud
                                                              o

    Vamos a admitir la continuidad de las funciones trigonom´tricas. La demos-
                                                                    e
traremos en el cap´   ıtulo III.
    Consideremos ahora la aplicaci´n f : [0, 1] × E −→ E tal que si el punto
                                        o
x tiene coordenadas (x1 , . . . , xn ) en el mismo sistema de referencia, entonces
ft (x) = f (t, x) es el punto de coordenadas (x0 , . . . , x0 ) dadas por
                                                 1          n

                          x01   = x1 cos tα − x2 sen tα,
                          x02   = x1 sen tα + x2 cos tα
                          x03   = x3 ,
                          ···     ···
                          x0
                           n    = xn

   Claramente entonces, para cada t ∈ [0, 1], la aplicaci´n ft es un giro de
                                                         o
a
´ngulo tα, de modo que f0 es la identidad y f1 = f . Adem´s la aplicaci´n f es
                                                         a             o
continua. Veamos que podemos obtener una aplicaci´n similar para movimientos
                                                   o
arbitrarios:

Teorema 2.25 Si f es un movimiento en un espacio af´ eucl´
                                                        ın      ıdeo E existe una
aplicaci´n continua f : [0, 1] × E −→ E tal que para todo t ∈ [0, 1], la aplicaci´n
        o                                                                        o
ft (x) = f (t, x) es un movimiento, f0 = 1 y f1 = f .

                 ´
   Demostracion: Lo probamos por inducci´n sobre el n´mero de giros en
                                                  o            u
que se descompone f . Ya lo tenemos probado cuando f es un giro. Basta probar
que si f cumple el teorema, g es un giro y h = f g entonces h cumple el teorema.
Tenemos, pues, las aplicaciones ft y gt . Sea h : [0, 1] × E −→ E dada por
                           Ω
                             f° x)
                               (2t,         ¢ si 0 ≤ t ≤ 1/2,
                 h(t, x) =
                             g 2t − 1, f (x) si 1/2 < t ≤ 1,

   La aplicaci´n h es claramente continua en el cerrado [0, 1/2] × E. Basta
               o                                                     °            ¢
observar que su restricci´n al cerrado [1/2, 1] × E viene dada por g 2t − 1, f (x) ,
                         o
pues entonces tambi´n ser´ continua en este cerrado y por consiguiente en todo
                     e      a
su dominio. Ahora bien, los unicos puntos donde esta igualdad no es cierta por
                              ´
definici´n son los de la forma (1/2, x), pero
       o
                                        °        ¢    °                   ¢
        h(1/2, x) = f (1, x) = f (x) = g 0, f (x) = g 2 · (1/2) − 1, f (x) .

El resto del teorema es obvio: para cada t la aplicaci´n ht es de la forma ft0 o
                                                      o
gt0 , luego es un movimiento, etc.
    Este teorema se interpreta como que los movimientos pueden efectuarse de
forma continua en el tiempo. El punto ft (x) se interpreta como la posici´n x en
                                                                          o
el instante t, de modo que para t = 0 tenemos la posici´n inicial x y para t = 1
                                                         o
tenemos la posici´n final f (x). El arco f (t, x), para un x fijo, es la trayectoria
                  o
que sigue x. El hecho de que cada ft sea un movimiento se interpreta como
que en cada instante t las distancias entre los puntos son las mismas que las
originales.
2.2. Espacios conexos                                                                  75


                                             f0,750 [H]
                      f0,250 [H]
                                     f0,500 [H]
                                                                             f1 [H]


    fο [H]                                                               f0,875 [H]

                                                         f0,625 [H]
              f0,125 [H]
                                      f0,375 [H]


   Ahora probamos que esta propiedad distingue a los movimientos de las se-
mejanzas.

Teorema 2.26 Si E es un espacio af´ eucl´
                                      ın      ıdeo y f : [0, 1] × E −→ E es una
aplicaci´n continua tal que para todo t ∈ [0, 1], la aplicaci´n ft (x) = f (t, x) es
        o                                                    o
una isometr´ y f0 = 1, entonces todas las aplicaciones ft son movimientos.
            ıa

                   ´
    Demostracion: Fijado un sistema de referencia af´ en E, la aplicaci´n
                                                              ın                       o
h : E −→ Rn que a cada punto le asigna sus coordenadas es un homeomorfismo.
La aplicaci´n g : [0, 1] × Rn −→ Rn dada por g(t, X) = h(f (t, h−1 (X)) es
              o
continua, y es de la forma g(t, X) = Pt + XAt , donde Pt ∈ Rn y At es una
matriz n × n de determinante ±1.
    La aplicaci´n g 0 (t, X) = g(t, X)−g(t, 0) = XAt tambi´n es continua. Si ei es
                o                                             e
el vector i-´simo de la base can´nica, la aplicaci´n gij (t) = g 0 (t, ei )ej es continua,
             e                   o                 o
y gij (t) es simplemente el coeficiente (i, j) de la matriz At . El determinante de
una matriz depende polin´micamente de sus coeficientes, por lo que la funci´n
                             o                                                         o
det ft = det At es continua.
    Ahora bien, si alguna ft fuera una simetr´ det f0 = det I = 1, mientras que
                                                ıa,
det ft = det At = −1. Tendr´mos, pues, una aplicaci´n continua y suprayectiva
                               a                          o
del espacio conexo [0, 1] en el espacio disconexo {−1, 1}, lo cual es imposible.

   Los mismos argumentos sirven para interpretar otros grupos de afinidades.
Por ejemplo:

Teorema 2.27 Si f es una biyecci´n af´ de determinante positivo en un espa-
                                        o     ın
cio af´ E existe una aplicaci´n continua f : [0, 1] × E −→ E tal que para todo
      ın                         o
t ∈ [0, 1], la aplicaci´n ft (x) = f (t, x) es una biyecci´n af´ f0 = 1 y f1 = f .
                       o                                  o    ın,

               ´
    Demostracion: Probaremos primero el teorema para automorfismos de
                                                     ~
determinante positivo del espacio vectorial asociado E. Cada uno de estos
automorfismos se puede expresar como composici´n de una homotecia lineal
                                                  o
de determinante positivo y un automorfismo de determinante 1. A su vez,
estos automorfismos se descomponen en producto de transvecciones, es decir,
76                            Cap´
                                 ıtulo 2. Compacidad, conexi´n y completitud
                                                            o

                                                         ~
de aplicaciones de la forma f (x) = x + u(x)h, donde u : E −→ R es una
aplicaci´n lineal y h es un vector del n´cleo de u.
        o                               u
    Para una transvecci´n definimos
                         o

                              f (t, x) = x + tu(x)h,

                                                                        ~     ~
que es una transvecci´n para todo t, es continua como aplicaci´n [0, 1]×E −→ E,
                      o                                       o
f0 = 1 y f1 = f .
     Una homotecia lineal es de la forma f (x) = rx. Definimos la aplicaci´n
           °           ¢                                                      o
f (t, x) = 1 + t(r − 1) x. Como 1 + t(r − 1) > 0 siempre que r > 0 y 0 ≤ t ≤ 1,
tenemos que ft es una homotecia lineal para todo t. Claramente se cumplen
tambi´n las otras propiedades.
       e
     Aplicando la misma t´cnica de composici´n que en el caso de los movimientos
                         e                    o
                                          ~
llegamos a que todo automorfismo de E de determinante positivo cumple el
teorema.
     Una biyecci´n af´ en E de determinante positivo es de la forma
                o    ın
                                                −
                                                −→
                                         v ~
                            f (P ) = O + ~ + f (OP ),

                                        ~                           ~
donde O es un punto arbitrario de E y f es un automorfismo de E de deter-
                                                    −
                                                    −→
                                            v ~
minante positivo. Definimos f (t, P ) = O + t~ + ft (OP ). Es f´cil ver que esta
                                                              a
aplicaci´n cumple lo pedido.
        o
    El teorema es falso para biyecciones afines de determinante negativo, pues
con el mismo argumento que hemos empleado para las simetr´ se llega a que
                                                                ıas
la aplicaci´n det ft es una aplicaci´n continua en el espacio conexo [0, 1] tal que
           o                        o
det f0 = 1, det f1 < 0 pero que nunca toma el valor 0, lo cual es imposible. Si
                       ~
un endomorfismo de E tiene determinante 0 su imagen tiene dimensi´n menor o
     ~ Por consiguiente, cualquier aplicaci´n que transforme continuamente un
que E.                                       o
conjunto en su imagen por una biyecci´n af´ de E de determinante negativo,
                                         o     ın
en un momento dado “aplanar´” el espacio en una variedad af´ de dimensi´n
                                 a                               ın              o
menor.


Orientaci´n Los resultados que acabamos de ver nos llevan a introducir un
          o
concepto de orientaci´n en un espacio vectorial (aunque casi todo el razona-
                      o
miento que sigue es independiente de lo anterior).

Definici´n 2.28 Diremos que dos bases ordenadas de un espacio vectorial real
        o
de dimensi´n finita V tienen la misma orientaci´n si el determinante de la matriz
          o                                   o
de cambio de base es positivo. Alternativamente, si existe un isomorfismo de
determinante positivo que transforma una en otra.

   Es inmediato comprobar que las bases de V se dividen en dos clases de
equivalencia, a las que llamaremos orientaciones de V . Si una base tiene una
determinada orientaci´n, al cambiar de signo uno cualquiera de sus vectores
                      o
pasamos a una base con la orientaci´n opuesta.
                                   o
2.2. Espacios conexos                                                                 77

    Un espacio vectorial orientado es un espacio vectorial real de dimensi´n     o
finita en el que hemos seleccionado una orientaci´n, a la que llamaremos positiva,
                                                 o
mientras que a la orientaci´n opuesta la llamaremos negativa. Consideraremos a
                           o
Rn como espacio orientado tomando como orientaci´n positiva a la que contiene
                                                     o
a la base can´nica.
              o
    Conviene notar que en otros espacios vectoriales, por ejemplo en los subespa-
cios de Rn , no hay ninguna base privilegiada que nos permita definir una orien-
taci´n, luego la elecci´n de una u otra como positiva es arbitraria. Lo mismo
    o                  o
sucede con el espacio vectorial asociado a un espacio af´ real, o con el espacio in-
                                                        ın
tuitivo, donde no tenemos bases can´nicas. Para determinar una orientaci´n en
                                      o                                       o
las representaciones gr´ficas hemos de recurrir a criterios no geom´tricos. Por
                        a                                              e
ejemplo, si representamos la recta horizontalmente, se suele considerar como
base positiva a la formada por el unico vector unitario que apunta hacia la dere-
                                   ´
cha. La distinci´n izquierda-derecha no tiene m´s fundamento que la anatom´
                 o                               a                                ıa
humana.
    Para adoptar criterios similares de orientaci´no
en el plano y el espacio debemos notar primero que,               e3
seg´n los resultados de la secci´n anterior, dos bases
    u                           o
ortonormales tienen la misma orientaci´n si y s´lo si
                                        o        o
podemos transformar una en otra mediante un movi-
miento continuo en el tiempo. As´ diremos que una
                                   ı,                                      e2
base del plano es positiva si cuando el dedo ´  ındice
derecho apunta en la direcci´n (y sentido) del primer e1
                             o
vector (con la palma hacia abajo) entonces el pulgar
(puesto en ´ngulo recto) apunta en la direcci´n del
            a                                   o
segundo vector. Si dos bases cumplen esto, el movimiento que transporta nues-
tra mano de una a la otra justifica que tienen la misma orientaci´n, y viceversa.
                                                                 o
Similarmente, consideraremos positivas a las bases ortonormales del espacio ta-
les que podemos disponer la mano derecha con el dedo medio apuntando en la
direcci´n del primer vector, el pulgar en la del segundo y el ´
       o                                                        ındice en la del
tercero. Una forma equivalente y m´s c´moda de esta regla es la siguiente: Una
                                      a o
base es positiva si cuando el ´ındice derecho arqueado marca el sentido de giro
que lleva del primer vector al segundo por el ´ngulo m´s corto, entonces el pul-
                                               a        a
gar apunta en la direcci´n del tercer vector. Una ligera modificaci´n de estas
                          o                                          o
reglas las hace v´lidas para bases cualesquiera, no necesariamente ortonormales.
                 a
   Si un vector v en un plano orientado tiene coordenadas (a, b) respecto a
una base ortonormal positiva, entonces es claro que el vector w de coordenadas
(−b, a) es ortogonal al primero, con el mismo m´dulo y la base (v, w) es positiva.
                                               o
Vamos a obtener un resultado an´logo en tres dimensiones.
                                   a
    Sean v y w dos vectores en un espacio tridimensional orientado V . Sean
(a1 , a2 , a3 ), (b1 , b2 , b3 ) sus coordenadas en una base (e1 , e2 , e3 ) ortonormal y
positiva. Definimos su producto vectorial v∧w como el vector cuyas coordenadas
en dicha base son
                             µØ          Ø Ø       Ø Ø        Ø∂
                               Ø a1 a3 Ø Ø a3 a1 Ø Ø a1 a2 Ø
                               Ø         Ø,Ø       Ø,Ø        Ø
                               Ø b2 b3 Ø Ø b3 b1 Ø Ø b1 b1 Ø .
78                           Cap´
                                ıtulo 2. Compacidad, conexi´n y completitud
                                                           o

     Como regla mnemot´cnica y de c´lculo podemos usar:
                      e             a
                                  Ø            Ø
                                  Ø e1 e2 e3 Ø
                                  Ø            Ø
                         v ∧ w = Ø a1 a2 a3 Ø .
                                  Ø            Ø
                                  Ø b1 b2 b3 Ø

   Hemos de probar que esta definici´n no depende de la elecci´n de la base,
                                       o                            o
siempre que sea positiva. Aunque con rigor el determinante anterior no tiene
sentido (pues tiene vectores en su primera fila), s´ hay una relaci´n sencilla
                                                    ı                   o
entre el producto vectorial y los determinantes que es util para deducir sus
                                                            ´
propiedades. Si x es un vector de coordenadas (x1 , x2 , x3 ), entonces
                                           Ø               Ø
                                           Ø x1 x2 x3 Ø
                                           Ø               Ø
                    (x, u, v) = x(v ∧ w) = Ø a1 a2 a3 Ø ,
                                           Ø               Ø
                                           Ø b1 b2 b3 Ø

donde este determinante s´ tiene sentido. El escalar (x, u, v) se llama producto
                           ı
mixto de los vectores x, u, v, y es claro que no depende de la base ortonormal
positivamente orientada que se escoja para calcularlo. Teniendo esto en cuenta
es f´cil probar hechos como que v ∧ w = −w ∧ v. En efecto, para todo x se
    a
cumple evidentemente x(v ∧ w) = −x(w ∧ v), y esto s´lo es posible si se da la
                                                       o
relaci´n indicada. Del mismo modo se prueban las relaciones
      o

     v ∧ (w + x) = v ∧ w + v ∧ x,   αv ∧ w = (αv) ∧ w = v ∧ (αw),      α ∈ R.

    Adem´s v ∧ w = 0 si y s´lo si v y w son linealmente dependientes. En
          a                     o
efecto, si son dependientes x(v ∧ w) = 0 para todo x, luego v ∧ w = 0. Si
son independientes entonces existe un x independiente de ambos, de modo que
x(v ∧ w) 6= 0, luego v ∧ w 6= 0.
   Si v y w son linealmente independientes, entonces v∧w es un vector ortogonal
a ambos. En efecto, v(v ∧ w) = w(v ∧ w) = 0. M´s a´n, en general se cumple
                                                 a u

                           kv ∧ wk = kvk kwk sen vw.
                                                 c

     Para probarlo basta comprobar la identidad

                        kv ∧ wk2 + (vw)2 = kvk2 kwk2 ,

que junto con vw = kvk kwk cos vw nos lleva a la relaci´n indicada.
                                    c                     o
    Por ultimo observamos que si v y w son linealmente independientes entonces
        ´
la base (v, w, v ∧ w) es positiva, pues el determinante de la matriz de cambio de
base respecto a e1 , e2 , e3 es
                   Ø           Ø  Ø         Ø    Ø        Ø
                   Ø a1 a3 Ø2 Ø a3 a1 Ø2 Ø a1 a2 Ø2
                   Ø           Ø +Ø         Ø +Ø          Ø
                   Ø b2 b3 Ø      Ø b3 b1 Ø      Ø b1 b1 Ø > 0.

    Estas propiedades muestran que v ∧ w es independiente de la base respecto
a la cual lo calculamos. Sea cual sea esta base, el producto vectorial resulta ser
2.3. Espacios completos                                                      79

el vector nulo si v y w son dependientes o bien el vector perpendicular a ambos
cuyo m´dulo es el que hemos calculado y cuyo sentido es el necesario para que
        o
la base (v, w, v ∧ w) sea positiva.
   Para terminar daremos una interpretaci´n intuitiva del m´dulo del producto
                                            o                o
vectorial de dos vectores u y v. Se trata claramente del ´rea del paralelogramo
                                                         a
que los tiene por lados:

                          kuk      kuk sen uv
                                           c


                                 kvk

2.3     Espacios completos
    La ultima propiedad que vamos a estudiar no es topol´gica, sino m´trica.
        ´                                                  o             e
La completitud garantiza la convergencia de ciertas sucesiones sin necesidad de
conocer su l´
            ımite de antemano. Ya hemos encontrado algunos casos, como el de
las sucesiones mon´tonas en R, o las mon´tonas y acotadas en R. Los criterios de
                   o                    o
este son muy utiles porque permiten definir nuevas funciones y constantes como
              ´
l´
 ımites de sucesiones. Comenzamos introduciendo una familia de sucesiones en
un espacio m´trico que incluye a todas las convergentes:
              e

Definici´n 2.29 Sea M un espacio m´trico. Una sucesi´n {an }∞ en M es
        o                             e                  o       n=0
una sucesi´n de Cauchy si para todo ≤ > 0 existe un natural n0 de modo que si
          o
m, n ≥ n0 , entonces d(am , an ) < ≤.

    O sea, una sucesi´n es de Cauchy si sus t´rminos est´n finalmente tan
                     o                          e           a
pr´ximos entre s´ como se desee. Esto le ocurre a toda sucesi´n convergente,
  o              ı                                             o
pues si {an }∞ converge a L, entonces dado ≤ > 0 existe un natural n0 de modo
             n=0
que para todo n ≥ n0 se cumple d(an , L) < ≤/2, luego si m, n ≥ n0 se cumple
                                                        ≤  ≤
                d(am , an ) ≤ d(am , L) + d(L, an ) <     + = ≤.
                                                        2 2
    As´ pues, toda sucesi´n convergente es de Cauchy, pero el rec´
       ı                   o                                      ıproco no es
cierto. Pensemos en la sucesi´n {1/n} en el espacio ]0, 1]. Como en R es
                                 o
convergente, es de Cauchy. Obviamente sigue siendo de Cauchy como sucesi´n   o
en ]0, 1], pero ya no es convergente.
    Por supuesto que el problema no est´ en la sucesi´n, sino en el espacio, al
                                        a            o
que en cierto sentido “le falta un punto”. Los espacios a los que no les faltan
puntos en este sentido se llaman completos:
   Un espacio m´trico M es completo si toda sucesi´n de Cauchy en M es
               e                                  o
convergente.
    La completitud de R es consecuencia de las siguientes propiedades obvias de
las sucesiones de Cauchy:

Teorema 2.30 Sea M un espacio m´trico y {an }∞ una sucesi´n de Cauchy.
                               e             n=0         o
80                             Cap´
                                  ıtulo 2. Compacidad, conexi´n y completitud
                                                             o

     a) Si {an }∞ tiene un punto adherente L, entonces converge a L.
                n=0

     b) La sucesi´n {an }∞ est´ acotada.
                 o       n=0  a

                   ´
    Demostracion: a) Dado ≤ > 0, existe un n´mero natural a partir del cual
                                                   u
d(am , an ) < ≤/2, y existe tambi´n un natural n0 , que podemos tomar mayor que
                                 e
el anterior, tal que d(an0 , L) < ≤/2. Por lo tanto si n ≥ n0 se cumple que
                                                            ≤  ≤
                  d(an , L) ≤ d(an , an0 ) + d(an0 , L) <     + = ≤.
                                                            2 2
Por consiguiente la sucesi´n converge a L.
                            o
    b) Existe un n0 tal que si n ≥ n0 , entonces d(an , an0 ) < 1, esto significa que
{an | n ≥ n0 } ⊂ B1 (an0 ), luego es un conjunto acotado, y la sucesi´n completa
                                                                        o
es la uni´n de este conjunto con el conjunto de los n0 primeros t´rminos, que es
         o                                                           e
finito, luego tambi´n est´ acotado. Por lo tanto la sucesi´n est´ acotada.
                   e      a                                  o     a


Teorema 2.31 Todo espacio normado de dimensi´n finita es completo.
                                            o

                 ´
   Demostracion: Una sucesi´n de Cauchy est´ acotada, luego est´ conte-
                                o               a                   a
nida en una bola cerrada, que es un conjunto compacto, luego tiene un punto
adherente, luego converge.
    En la sencilla prueba de este teorema se ve una relaci´n entre la compacidad
                                                          o
y la completitud. Con m´s detalle, la situaci´n es la siguiente:
                          a                   o

Teorema 2.32 Se cumple:

     a) Todo espacio m´trico compacto es completo.
                      e

     b) Todo cerrado en un espacio m´trico completo es completo.
                                    e

     c) Todo subespacio completo de un espacio m´trico es cerrado.
                                                e

                   ´
    Demostracion: a) Toda sucesi´n tiene una subsucesi´n convergente, luego
                                     o                    o
si es de Cauchy es convergente.
    b) Si M es un espacio m´trico completo y C es un cerrado en M , entonces
                              e
toda sucesi´n de Cauchy en C converge en M , y como C es cerrado su l´
            o                                                               ımite
estar´ en C, luego la sucesi´n converge en C.
      a                      o
    c) Si C es un subespacio completo de un espacio m´trico M , dado un punto x
                                                     e
en la clausura de C, existe una sucesi´n en C que converge a x, luego la sucesi´n
                                      o                                        o
es de Cauchy, luego converge en C, luego x est´ en C, luego C es cerrado.
                                               a
    Por supuesto no todo espacio completo es compacto. A veces es util conocer
                                                                  ´
lo que separa a un espacio completo de la compacidad:

Definici´n 2.33 Un espacio m´trico M es precompacto si para cada ≤ > 0
         o                          e
existen puntos x1 , . . . , xn en M tales que M = B≤ (x1 ) ∪ · · · ∪ B≤ (xn ).
2.3. Espacios completos                                                      81

    Obviamente todo espacio compacto es precompacto (basta extraer un sub-
cubrimiento finito del cubrimiento formado por todas las bolas de radio ≤).
    El teorema 2.7 contiene la demostraci´n de que un espacio precompacto y
                                         o
completo es compacto. En efecto partiendo de la hip´tesis sobre subsucesiones
                                                      o
convergentes, en primer lugar se prueba que el espacio es precompacto. Con
ayuda de la precompacidad se construye una sucesi´n de bolas B1/(n+1) (xn ) en
                                                   o
las que podemos exigir que cada una de ellas corte a la anterior. Esto garantiza
que la sucesi´n de los centros es de Cauchy, con lo que podemos garantizar su
             o
convergencia por la completitud y probamos la compacidad del espacio. As´      ı
pues:

Teorema 2.34 Un espacio m´trico es compacto si y s´lo si es precompacto y
                         e                        o
completo.

    Es muy importante tener claro que la completitud es una propiedad m´trica
                                                                          e
y no topol´gica. Por ejemplo, los espacios R y ]−1, 1[ son homeomorfos, pero
           o
uno es completo y el otro no. En particular una imagen continua de un espacio
completo no tiene por qu´ ser completo.
                         e
    Si analizamos lo que falla, vemos que en ]−1, 1[ hay sucesiones de Cauchy
no convergentes, por ejemplo las que convergen a 1 en R, pero cuando las trans-
formamos por el homeomorfismo entre ]−1, 1[ y R se convierten en sucesiones
que tienden a +∞, que ya no son de Cauchy, luego no violan la completitud de
R. El problema es que mientras una aplicaci´n continua transforma sucesiones
                                             o
convergentes en sucesiones convergentes, no transforma necesariamente sucesio-
nes de Cauchy en sucesiones de Cauchy. Y a su vez esto se debe a que si se
estira infinitamente una sucesi´n de Cauchy, ´sta deja de serlo. Esto nos lleva a
                               o             e
conjeturar que la completitud se conservar´ por aplicaciones continuas que no
                                           a
produzcan estiramientos infinitos. Vamos a definir este tipo de aplicaciones.

Definici´n 2.35 Una aplicaci´n f : M −→ N
          o                   o
entre espacios m´tricos es uniformemente conti-
                  e
nua si para todo ≤ > 0 existe un δ > 0 de modo
que si x, y ¢ M cumplen d(x, y) < δ, entonces
 °            ∈
d f (x), f (y) < ≤.

    Desde un punto de vista l´gico, la diferencia f (y)
                                o
entre aplicaci´n continua y uniformemente conti-
              o
nua es sutil. Conviene confrontarlas. Recorde-
mos que f es continua en un punto x si para todo
≤ > 0 existe un δ > 0°tal que si ¢y ∈ M cumple
d(x, y) < δ, entonces d f (x), f (y) < ≤.
    La diferencia es, pues, que cuando f es unifor-
memente continua el mismo δ verifica la definici´n f (x) ≤
                                                o
de continuidad para un ≤ dado simult´neamente
                                        a
en todos los puntos x. Por ejemplo, el homeomor-
fismo f entre ]−1, 1[ y R estira m´s los puntos
                                     a                             δ   δ
cuanto m´s pr´ximos est´n de ±1. Si tomamos
          a     o          a                          0            x   y     1
82                              Cap´
                                   ıtulo 2. Compacidad, conexi´n y completitud
                                                              o

un punto x y queremos garantizar que f (z) diste de f (x) menos que ≤, tendre-
mos que exigir que z diste de x menos que un cierto δ, pero si consideramos
los puntos que distan menos que δ de un punto y m´s cercano a 1, vemos que
                                                    a
muchos de ellos se transforman en puntos que distan de f (y) mucho m´s que
                                                                        a
≤, y que si queremos que no sobrepasen esta cota hemos de tomar un δ mucho
menor.

Teorema 2.36 Sea f : K −→ M una aplicaci´n continua entre espacios m´tri-
                                          o                          e
cos y supongamos que K es compacto. Entonces f es uniformemente continua.
                  ´
    Demostracion: Sea ≤ > 0. Para cada punto x ∈ K, como f es continua
                                                              °            ¢
en x, existe un δ(x) > 0 tal que si d(y, x) < δ(x), entonces d f (y), f (x) < ≤/2.
Cubramos el espacio K por todas las bolas abiertas de centro cada punto x y de
radio δ(x)/2 y tomemos un subcubrimiento finito. Digamos que las bolas que
forman este subcubrimiento tienen centros en los puntos x1 , . . . , xn . Sea δ > 0
el m´ınimo del conjunto {δ(x1 )/2, . . . , δ(xn )/2}.
    Si x, y son dos puntos cualesquiera de K tales que d(x, y) < δ, entonces x
estar´ en una de las bolas Bδ(xi )/2 (xi ). Entonces
      a

                                                   δ(xi ) δ(xi )
               d(y, xi ) ≤ d(y, x) + d(x, xi ) <         +       = δ(xi ).
                                                     2      2
     Por lo tanto x, y ∈ Bδ(xi ) (xi ), de donde
                  °              ¢ ≤           °              ¢ ≤
                 d f (x), f (xi ) < ,         d f (y), f (xi ) < .
                                   2                            2
                   °             ¢
Consecuentemente, d f (x), f (y) < ≤.
   La imagen de una sucesi´n de Cauchy por una aplicaci´n uniformemente
                             o                                 o
continua es una sucesi´n de Cauchy. En efecto, si {an }∞ es de Cauchy y
                      o                                      n=0
f es uniformemente continua, dado ≤ > 0 existe un δ > 0 de manera que si
                       °            ¢
d(x, y) < δ, entonces d f (x), f (y) < ° Existe un¢natural no tal que si n,
                                        ≤.
m ≥ n0 entonces d(am , an ) < δ, luego d f (am ), f (an ) < ≤. Esto prueba que la
sucesi´n {f (an )}∞ es de Cauchy.
      o           n=0

   Como consecuencia, si dos espacios m´tricos X e Y son uniformemente ho-
                                           e
meomorfos, esto es, si existe una biyecci´n uniformemente continua con inversa
                                         o
uniformemente continua entre ellos, uno es completo si y s´lo si lo es el otro.
                                                          o
   Es importante destacar que una imagen uniformemente continua de un es-
pacio completo no tiene por qu´ ser completa.
                              e
   Veamos ahora algunas propiedades de las aplicaciones lineales entre espacios
normados.

Teorema 2.37 Sea f : E −→ F una aplicaci´n lineal entre espacios normados.
                                             o
Las siguientes condiciones son equivalentes:
     a) f es continua en E.
     b) f es continua en 0.
2.4. Espacios de Hilbert                                                                 83

  c) f est´ acotada en B 1 (0).
          a
  d) Existe un M ≥ 0 tal que para todo x ∈ E se cumple kf (x)k ≤ M kxk.
  e) f es uniformemente continua en E.
                  ´
    Demostracion: a) → b) es obvio.
    b) → c), pues existe un δ > 0 tal que kx−0k ≤ δ, entonces kf (x)−f (0)k ≤ 1.
    Por lo tanto si kxk ≤ 1, se cumple kδ xk ≤ δ, kf (δ x)k ≤ 1, kf (x)k ≤ 1/δ, o
sea, que 1/δ es una cota de f en B 1 (0).
    c) → d), pues si M es una cota de f en B 1 (0), dado cualquier x 6= 0 se
cumple que x/kxk ∈ B 1 (0), luego kf (x/kxk)k ≤ M , de donde kf (x)k ≤ M kxk,
y esto tambi´n es cierto si x = 0.
             e
    d) → e), pues para todos los x, y en E:
                     kf (x) − f (y)k = kf (x − y)k ≤ M kx − yk,
luego dado ≤ > 0, si kx − yk < ≤/M , se cumple kf (x) − f (y)k < ≤.
   e) → a) es evidente.
    En particular, todo isomorfismo entre dos K-espacios vectoriales de dimen-
si´n finita es un homeomorfismo uniforme para cualquier par de normas.
  o
Definici´n 2.38 Un espacio de Banach es un espacio normado completo.
       o
   Hemos visto que todo espacio normado de dimensi´n finita es un espacio de
                                                  o
Banach.


2.4      Espacios de Hilbert
   En el cap´ıtulo I introdujimos los espacios prehilbertianos, que son los K-
espacios vectoriales dotados de un producto escalar.
Definici´n 2.39 Un espacio de Hilbert es un espacio prehilbertiano H que sea
        o
completo con la m´trica inducida por el producto escalar.
                 e
   Vamos a probar algunos hechos de inter´s sobre espacios de Hilbert. Los
                                            e
primeros son v´lidos en general sobre espacios prehilbertianos:
              a
Teorema 2.40 Si H es un espacio prehilbertiano, entonces el producto escalar
en H es una funci´n continua.
                 o
   Demostracion: Para todos los x, x0 , y, y 0 ∈ H se cumple
             ´
|x · y − x0 · y 0 | ≤ |(x − x0 ) · y| + |x0 · (y − y 0 )| ≤ kx − x0 k kyk + kx0 k ky − y 0 k
                    ≤ kx − x0 k kyk + kx0 − xk ky − y 0 k + kxk ky − y 0 k.
   As´ dado un par (x, y) ∈ H × H y un ≤ > 0, todo par (x0 , y 0 ) ∈ H × H que
     ı,
cumpla kx0 − xk, ky 0 − yk < ≤/3M , donde M > kxk, kyk, cumple tambi´n que
                                                                        e
                                           ≤     ≤2     ≤
                  |x · y − x0 · y 0 | <      M+      +    M < ≤.
                                          3M    9M 2   3M
84                             Cap´
                                  ıtulo 2. Compacidad, conexi´n y completitud
                                                             o

Definici´n 2.41 Si H es un espacio prehilbertiano, diremos que x, y ∈ H son
        o
ortogonales, y lo representaremos por x ⊥ y, si x · y = 0.

   Es conocido que la ortogonalidad en Rn coincide con el concepto geom´trico
                                                                       e
de perpendicularidad. Es f´cil generalizar el teorema de Pit´goras:
                          a                                 a
       Si x ⊥ y, entonces kx + yk2 = kxk2 + kyk2 .
   As´ mismo, las propiedades del producto escalar dan inmediatamente la
     ı
f´rmula conocida como identidad del paralelogramo:
 o

                       kx + yk2 + kx − yk2 = 2kxk2 + 2kyk2 .

     Para cada A ⊂ H, definimos

                      A⊥ = {x ∈ H | x ⊥ a para todo a ∈ A}.

    Es claro que A⊥ es un subespacio vectorial de H. M´s a´n, puesto que {a}⊥
                                                       a u
es la antiimagen de 0 por la aplicaci´n continua x 7→ a · x, se cumple que {a}⊥
                                     o
es cerrado, y como                     
                                A⊥ =      {a}⊥ ,
                                        a∈A
              ⊥
vemos que A       es un subespacio cerrado de H.
   Si V es un subespacio vectorial de H es claro que V ∩ V ⊥ = 0. Vamos a
probar que si V es cerrado entonces H = V ⊕ V ⊥ . Para ello necesitamos un
resultado previo:

Teorema 2.42 Sea M un subconjunto no vac´ cerrado y convexo de un espa-
                                           ıo,
cio de Hilbert H. Entonces M contiene un unico elemento de norma m´
                                         ´                        ınima.

                 ´
   Demostracion: Sea δ el ´    ınfimo de las normas de los elementos de M .
Aplicando la identidad del paralelogramo a 1 x, 1 y tenemos
                                           2    2
                                                ∞       ∞
                     1           1      1       ∞ x + y ∞2
                       kx − yk2 = kxk2 + kyk2 − ∞
                                                ∞ 2 ∞ .
                                                        ∞
                     4           2      2

     Si x, y ∈ M , por convexidad (x + y)/2 ∈ M , luego

                         kx − yk2 ≤ 2kxk2 + 2kyk2 − 4δ 2 .                (2.1)

    Si kxk = kyk = δ esto implica x = y, lo que nos da la unicidad. Es f´cil
                                                                         a
construir una sucesi´n {xn }∞ ⊂ M tal que l´ kxn k = δ. Aplicando 2.1 a xm
                    o       n=0              ım
                                              n
y xn concluimos f´cilmente que la sucesi´n es de Cauchy, luego converge a un
                  a                     o
punto x que, por continuidad de la norma, cumplir´ kxk = δ. Adem´s, como M
                                                 a               a
es cerrado, ha de ser x ∈ M y claramente su norma es la m´ınima en M .

Teorema 2.43 Sea V un subespacio cerrado de un espacio de Hilbert H. En-
tonces
2.4. Espacios de Hilbert                                                       85

  a) Todo x ∈ H se descompone de forma unica como x = P x + Qx, donde
                                       ´
     P x ∈ V , Qx ∈ V ⊥ .
  b) P x y Qx son los puntos de V y V ⊥ m´s pr´ximos a x.
                                         a    o
  c) Las aplicaciones P : H −→ V y Q : H −→ V ⊥ son lineales y continuas.
  d) kxk2 = kP xk2 + kQxk2 .
                 ´
   Demostracion: El conjunto x + V es cerrado y convexo, luego podemos
definir Qx como el elemento de norma m´   ınima en x + V . Definimos P x =
x − Qx. Obviamente P x ∈ V . Veamos que Qx ∈ V ⊥ . Para ello probaremos que
(Qx) · y = 0 para todo y ∈ V . No perdemos generalidad si suponemos kyk = 1.
Por definici´n de Qx tenemos que
            o
        (Qx) · (Qx) = kQxk2 ≤ kQx − αyk2 = (Qx − αy) · (Qx − αy),
para todo α ∈ K. Simplificando queda
                       0 ≤ −α(y · Qx) − α(Qx · y) + αα,
                                        ¯            ¯
y si hacemos α = (Qx) · y queda 0 ≤ −|(Qx) · y|2 , luego (Qx) · y = 0.
    Esto prueba la existencia de la descomposici´n de a). La unicidad se debe a
                                                o
que V ∩ V ⊥ = 0. En definitiva, H = V ⊕ V ⊥ .
   Ahora observamos que si y ∈ V entonces
             kx − yk2 = kQx + (P x − y)k2 = kQxk2 + kP x − yk2 ,
luego la m´
          ınima distancia entre x y un punto y ∈ V se alcanza cuando y = P x.
Esto prueba b). El apartado d) es el teorema de Pit´goras. La linealidad de
                                                     a
P y Q es obvia. La continuidad se debe a que por d) tenemos kP xk ≤ kxk,
kQxk ≤ kxk, y basta aplicar el teorema 2.37.
   Terminamos con un teorema que caracteriza las aplicaciones lineales conti-
nuas de un espacio de Hilbert en K.
Teorema 2.44 Sea H un espacio de Hilbert y f : H −→ K una aplicaci´n         o
lineal continua. Entonces existe un unico y ∈ H tal que f (x) = x · y para todo
                                    ´
x ∈ H.
                  ´
   Demostracion: Si f es la aplicaci´n nula tomamos y = 0. En otro caso
                                         o
sea V el n´cleo de f , que ser´ un subespacio cerrado propio de H. Por el
            u                   a
teorema anterior V ⊥ 6= 0, luego podemos tomar z ∈ V ⊥ con kzk = 1. Sea
u = f (x)z − f (z)x. Como f (u) = f (x)f (z) − f (z)f (x) = 0, tenemos que u ∈ V ,
luego u · z = 0. La definici´n de u implica
                           o
                        f (x) = f (x)(z · z) = f (z)(x · z).
Tomando y = f (z) z resulta f (x) = x · y.
   La unicidad es obvia, pues si dos puntos y, y 0 cumplen el teorema, entonces
y − y 0 es ortogonal a todo x ∈ H.
86                                 Cap´
                                      ıtulo 2. Compacidad, conexi´n y completitud
                                                                 o

2.5      Aplicaciones a las series num´ricas
                                      e
   La completitud de K tiene muchas consecuencias sobre las series num´ricas.
                                                                      e
En primer lugar, la condici´n de Cauchy para una serie en K puede expresarse
                           o
como sigue:
                                   P
                                   ∞
Teorema 2.45 Una serie          an en K es convergente si y s´lo si para todo
                                                               o
                                  n=0                      Ø p      Ø
                                                           ØP       Ø
                                                           Ø
≤ > 0 existe un natural n0 tal que si n0 ≤ m ≤ p, entonces Ø     an Ø < ≤.
                                                                    Ø       n=m

                                                                                         p
                                                                                         P
               ´
     Demostracion: Se trata de la condici´n de Cauchy, pues
                                         o                                                     an es la
                                                                                         n=m
diferencia entre la suma parcial p-´sima menos la suma parcial m − 1-sima, y
                                   e
su m´dulo es la distancia entre ambas.
     o
     De aqu´ se sigue un hecho important´
           ı                            ısimo.
                          P
                          ∞                                           P
                                                                      ∞
Teorema 2.46 Sea               an una serie en K. Si la serie               |an | es convergente,
                         n=0                                          n=0
                     P
                     ∞
entonces la serie         an tambi´n lo es.
                                  e
                    n=0

                  ´
    Demostracion: Dado ≤ > 0 existe un n´mero natural n0 de manera que
                                               u
                         Pp
si n0 ≤ m ≤ p, entonces     |an | < ≤.
                Ø p    Øn=m p
                ØP     Ø    P
    Ahora bien, Ø
                Ø   an Ø ≤
                       Ø        |an | < ≤, luego la serie sin m´dulos tambi´n es
                                                               o           e
                    n=m           n=m
de Cauchy, luego converge.

                              P∞
Definici´n 2.47 Una serie
          o                       an en K es absolutamente! convergente (serie)
            P
            ∞                 n=0
si la serie   |an | es convergente.
           n=0

   Hemos probado que toda serie absolutamente convergente es convergente.
Las series convergentes que no son absolutamente convergentes se llaman series
condicionalmente convergentes.
     Un ejemplo de serie condicionalmente convergente es
                    1 1 1 1 1 1 1
              1−     + − + − + − + · · · = 0, 693147 . . .
                    2 3 4 5 6 7 8
    La convergencia absoluta de una serie es esencial para ciertas cuestiones. Por
ejemplo, una consecuencia inmediata de las propiedades de las sumas finitas y
de los l´
        ımites de sucesiones es que
              ∞
              X            ∞
                           X            ∞
                                        X                     ∞
                                                              X            ∞
                                                                           X
                    an +         bn =       (an + bn ),   a         an =         aan ,
              n=0          n=0          n=0                   n=0          n=0
2.5. Aplicaciones a las series num´ricas
                                  e                                                                 87

entendiendo que si las series de la izquierda convergen, las de la derecha tambi´n
                                                                                e
lo hacen y se da la igualdad. Un resultado an´logo para producto de series ya
                                                 a
no es tan sencillo.
                         P∞         P∞
Definici´n 2.48 Sean
         o                   an y       bn dos series en K. Llamaremos producto
                         n=0        n=0   µ n            ∂
                                       P P
                                       ∞
de Cauchy de estas series a la serie            ak · bn−k .
                                              n=0      k=0

    La intenci´n es que la serie que acabamos de definir converja al producto de
               o
las dos series de partida, pero esto no ocurre necesariamente si al menos una de
ellas no converge absolutamente.
                     P∞        P
                               ∞
Teorema 2.49 Si          an y      bn son dos series convergentes en K al menos
                        n=0          n=0
una de las cuales converge absolutamente, entonces
                  ∞
                     √ n            ! √∞        !√ ∞ !
                  X X                    X         X
                           ak · bn−k =       an      bn .
                    n=0       k=0                      n=0           n=0

              ´
    Demostracion: Supongamos que la serie que converge absolutamente es
P
∞
      an y definamos
n=0
                  ∞
                  X                  ∞
                                     X                 n
                                                       X                          n
                                                                                  X
             A=         an , B =           bn , cn =         ak · bn−k , Cn =           ck ,
                  n=0                n=0               k=0                       k=0
                               n
                               X                 n
                                                 X
                      An =           ak , Bn =          bk , βn = Bn − B.
                               k=0               k=0
    Ahora,
    Cn    = c0 + · · · + cn = a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + · · · + an b0 )
          = a0 Bn + · · · + an B0 = a0 (B + βn ) + · · · + an (B + β0 )
          = An B + (a0 βn + · · · + an β0 )
    El teorema quedar´ probado si vemos que a0 βn + · · · + an β0 tiende a 0.
                     a
                        P∞                    ©               ™
    Sea ≤ > 0. Sea K =     |an |. Sea M = sup |βn | | n ≥ 0 (la sucesi´n βn
                                                                          o
                               n=0
tiende a 0, luego est´ acotada).
                     a
    Existe un n´mero natural n0 tal que si n ≥ n0 , entonces |βn | < ≤/2K y si
                u
                    Pq
k ≥ n0 , entonces        |ak | < ≤/2M . En consecuencia, si n ≥ 2n0 ,
                    k=n0 +1
                                n
                                X                      n0
                                                       X                      n
                                                                              X
 |a0 bn + · · · + an b0 | ≤           |ak βn−k | =           |ak βn−k | +              |ak βn−k |
                                k=0                    k=0                   k=n0 +1
                                       n                     n
                                     ≤ X                     X                ≤     ≤
                          <              |ak | + M                 |ak | ≤      K+    M = ≤.
                                    2K                                       2K    2M
                                       k=0               k=n0 +1
88                                Cap´
                                     ıtulo 2. Compacidad, conexi´n y completitud
                                                                o

   Si ninguna de las series converge absolutamente el resultado no tiene por
qu´ cumplirse.
  e

Ejemplo Consideremos la serie
                                          ∞
                                         X (−1)n
                                             √    .
                                         n=0
                                              n+1

    La serie converge por el criterio de Leibniz. El producto de Cauchy de esta
serie por s´ misma tiene t´rmino general
           ı              e
                                        n
                                        X           1
                       cn = (−1)n           p                   .
                                        k=0
                                             (n − k + 1)(k + 1)

     Cuando n ≥ k tenemos
                                        ≥n   ¥2 ≥ n   ¥2 ≥ n   ¥2
           (n − k + 1)(k + 1) =            +1 −     −k ≤     +1 ,
                                         2        2        2
luego
                              1                          1     2
                      p                   ≥          n      =     .
                       (n − k + 1)(k + 1)            2   +1   n+2
Por consiguiente
                                        n
                                        X      2    2(n + 1)
                              |cn | ≥             =          .
                                              n+2    n+1
                                        k=0

   Esta expresi´n converge a 2, luego cn no converge a 0 y el producto de
               o
Cauchy no converge.
   El teorema anterior prueba, pues, que la serie dada es condicionalmente
convergente.
   Otro punto en el que la convergencia absoluta resulta crucial es en el de la
reordenaci´n de los t´rminos de una serie.
          o          e
                                P
                                ∞
   Dada una serie convergente      an y una biyecci´n σ : N −→ N, podemos
                                                   o
                                        n=0
                      P
                      ∞
considerar la serie         aσ(n) y estudiar su convergencia. De nuevo el resultado
                      n=0
natural exige que la serie converja absolutamente:
                      P
                      ∞
Teorema 2.50 Si             an es una serie absolutamente convergente y σ : N −→ N
                      n=0
                                                      P
                                                      ∞
es una aplicaci´n biyectiva, entonces la serie
               o                                           aσ(n) es absolutamente conver-
                                                     n=0
gente y tiene la misma suma.

                 ´
   Demostracion: Una serie es absolutamente convergente si y s´lo si las
                                                                   o
sumas parciales de sus m´dulos forman un conjunto acotado. Toda suma parcial
                        o
de los m´dulos de la reordenaci´n est´ mayorada por una suma parcial de los
        o                       o    a
2.5. Aplicaciones a las series num´ricas
                                  e                                                           89

m´dulos de la serie original (tomando los sumandos necesarios para incluir todos
  o
los que aparecen en la suma dada). Por tanto las sumas parciales de los m´dulos
                                                                          o
de la reordenaci´n est´n acotadas y la serie converge absolutamente.
                o      a
    Sea ≤ > 0. Existe un n´mero natural n0 tal que si n ≥ n0
                            u
        Ø n              Ø Ø∞       Ø
        ØX        X Ø ØX Ø X
                  ∞                     ∞          ∞
                                                   X         n
                                                             X        ≤
        Ø                Ø Ø        Ø
        Ø   ak −      ak Ø = Ø   ak Ø ≤    |ak | =   |ak | −   |ak | < .
        Ø                Ø Ø        Ø                                 2
         k=0         k=0             k=n              k=n             k=0     k=0

   Sea m0 ≥ n0 tal que {0, 1, . . . , n0 } ⊂ {σ(0), σ(1), . . . , σ(m0 )}. Entonces si
n ≥ m0 ,
       Ø n              Ø        Ø n                   Ø Øn                   Ø
       ØX          X Ø
                   ∞             ØX             X Ø ØX
                                                n0              0       X Ø
                                                                         ∞
       Ø                Ø        Ø                     Ø Ø                    Ø
       Ø   aσ(k) −   ak Ø ≤ Ø           aσ(k) −     ak Ø + Ø       ak −    ak Ø
       Ø                Ø        Ø                     Ø Ø                    Ø
         k=0           k=0                     k=0              k=0         k=0      k=0
                                                ∞
                                                X               ≤
                                       <                 |ak | + < ≤.
                                                                2
                                               k=n0 +1

               P
               ∞                 P
                                 ∞
Por lo tanto         aσ(k) =           ak .
               k=0               k=0
    Como consecuencia, si I es cualquier conjunto infinito numerable y {ai }i∈I
                                                                           P
es cualquier familia de elementos de K con la propiedad de que las sumas      |ai |,
                                                            P             i∈F
con F ⊂ I finito est´n acotadas, tiene sentido la expresi´n
                     e                                   o     ai , definida como
                                                                              i∈I
la suma de la serie determinada por cualquier ordenaci´n del conjunto I, y es
                                                       o
un n´mero independiente de la ordenaci´n elegida. Obviamente la expresi´n
P     u                                  o                                o
    ai tiene tambi´n sentido cuando I es un conjunto finito.
                  e
i∈I
    Observar que si ≤ > 0,Ø existe un F0 ⊂ I finito tal que para todo F0 ⊂ F ⊂ I,
           Ø
           ØP          P Ø
se cumple Ø ai −
           Ø              ai Ø < ≤. En efecto, basta considerar una ordenaci´n de I
                             Ø                                              o
            i∈I       i∈F
y tomar como F0 los primeros t´rminos de la sucesi´n, de modo que el m´dulo
                                    e                   o                       o
de las colas con y sin m´dulos sea menor que ≤/2. Entonces
                           o
  Ø                Ø Ø                   Ø Ø                 Ø
  ØX       X Ø ØX                 X Ø ØX              X Ø ≤          X
  Ø                Ø Ø                   Ø Ø                 Ø
  Ø   ai −      ai Ø ≤ Ø    ai −      ai Ø + Ø   ai −     ai Ø < +        |ai | < ≤.
  Ø                Ø Ø                   Ø Ø                 Ø 2
  i∈I      i∈F             i∈I          i∈F0             i∈F0         i∈F           i∈F F0

    Las series absolutamente convergentes se pueden manipular exactamente
igual que si fueran sumas finitas. El siguiente teorema justifica cualquier ope-
raci´n razonable entre ellas.
    o
                                                                      S
                                                                      ∞
Teorema 2.51 Sea {ai }i∈I una familia de elementos de K. Sea I =         In una
                                            P                        n=0
divisi´n de I en partes disjuntas. Entonces
      o                                       ai es (absolutamente) convergente
                                                            i∈I
                                       P             P
                                                     ∞
si y s´lo si lo son las series
      o                                       ai y         |ai |. Adem´s en tal caso
                                                                      a
                                       i∈In          n=0

                                         X            ∞
                                                      XX
                                               ai =               ai .
                                         i∈I          n=0 i∈In
90                                     Cap´
                                          ıtulo 2. Compacidad, conexi´n y completitud
                                                                     o

                               P
               ´
     Demostracion: Si      ai es absolutamente convergente, sus sumas parciales
                               i∈I                                          P
en m´dulo est´n acotadas, pero toda suma parcial en m´dulo de cada
      o       a                                           o                     |ai |
                                                                           i∈In
                                                                            P
lo es tambi´n de la primera, luego ´stas est´n acotadas, o sea, las series
           e                       e        a                                   |ai |
                                                                                                  i∈In
convergen absolutamente. Dado cualquier natural k, tomamos para cada n ≤ k
                                  P         P
un conjunto finito Fn ⊂ In tal que   |ai | −    |ai | < 1/(k + 1). Entonces
                                               i∈In           i∈Fn

                    k
                    XX                     k
                                           XX                        X
                                |ai | <                |ai | + 1 ≤          |ai | + 1,
                    n=0 i∈In               n=0 i∈Fn                  i∈I


luego las sumas parciales est´n acotadas y as´ todas las series convergen abso-
                             a                 ı
lutamente.
                                     P           P P
                                                 ∞
    Supongamos ahora que las series      |ai | y       |ai | convergen absoluta-
                                                 i∈In          n=0 i∈In
mente. Si F ⊂ I es finito, para un cierto k suficientemente grande se cumple

              X               k
                              X X                      k
                                                       XX                   ∞
                                                                            XX
                    |ai | =                  |ai | ≤              |ai | ≤                |ai |,
              i∈F             n=0 i∈In ∩F              n=0 i∈In             n=0 i∈In

                                       P
luego las sumas parciales de               |ai | est´n acotadas y la serie converge absoluta-
                                                    a
                                     i∈I
mente.
    Ahora supongamos la convergencia de todas las series y probemos la igualdad
de las sumas. Notemos que la serie
                                              ∞
                                              XX
                                                         ai
                                              n=0 i∈In


es convergente porque es absolutamente convergente. Sea ≤ > 0. Existe un
n´mero natural n0 tal que
 u
                           Ø ∞           Ø
                           Ø X X Ø
                           Ø             Ø
                           Ø          ai Ø < ≤/4.
                           Ø             Ø
                                       n=n0 +1 i∈In


   Para cada n ≤ n0 existe un conjunto finito Fn ⊂ In tal que si Fn ⊂ F ⊂ In ,
entonces              Ø                 Ø
                      ØX         X Ø          ≤
                      Ø                 Ø
                      Ø     ai −     ai Ø <         .
                      Ø                 Ø 2(n0 + 1)
                                i∈In         i∈Fn

     Sea F un conjunto finito que contenga a todos los Fn y tal que
                            Ø              Ø
                            ØX       X Ø
                            Ø              Ø
                            Ø   ai −    ai Ø < ≤/4.
                            Ø              Ø
                                       i∈I       i∈F
2.5. Aplicaciones a las series num´ricas
                                  e                                             91

Entonces
 Ø∞                    Ø   Ø ∞               Ø Øn                       Ø
 ØX X           X Ø        Ø X X Ø ØX X             0            X Ø
 Ø                     Ø   Ø                 Ø Ø                        Ø
 Ø         ai −     ai Ø ≤ Ø              ai Ø + Ø         ai −      ai Ø
 Ø                     Ø   Ø                 Ø Ø                        Ø
  n=0 i∈In      i∈I         n=n0 +1 i∈In          n=0 i∈In       i∈F
                           Ø                  Ø
                           ØX         X Ø
                           Ø                  Ø
                         + Ø     ai −      ai Ø
                           Ø                  Ø
                             i∈F      i∈I
                                 Øn √                        !Ø
                            ≤ ØX X
                                 Ø
                                    0                 X        Ø ≤
                                                               Ø          ≤ ≤
                         <     +Ø             ai −         ai Ø + + + = ≤.
                           4 Øn=0                              Ø 4 2 4
                                            i∈In      i∈In ∩F


   Por lo tanto ambas sumas coinciden.


Ejemplo Consideremos la serie condicionalmente convergente
                                       ∞
                                      X (−1)n+1
                                S=              .
                                      n=1
                                           n

Entonces
                                 ∞
                                X (−1)n+1  S
                                          = .
                                n=1
                                    2n     2

                                    P
                                    ∞
   Ahora consideremos la serie            an cuyos t´rminos impares son ceros y sus
                                                    e
                                    n=1
t´rminos pares son los de la serie anterior, es decir, la serie
 e

                           1      1     1     1
                      0+     + 0 − + 0 + + 0 − + ···
                           2      4     6     8
Obviamente su suma es tambi´n S/2. La serie
                           e

                              X µ (−1)n+1
                              ∞                           ∂
                                                   + an
                              n=1
                                           n

converge a 3S/2. Sus primeros t´rminos son:
                               e

                           1 1 1     1 1 1
                 1+0+       − + + 0 + − + + 0 + ···
                           3 2 5     7 4 9
   Eliminando los ceros obtenemos la serie
                         1 1 1 1 1 1  1  1
                    1+    − + + − + +   − ···
                         3 2 5 7 4 9 11 6
Vemos que se trata de una reordenaci´n de la serie original, pero converge a
                                    o
3S/2.
92                           Cap´
                                ıtulo 2. Compacidad, conexi´n y completitud
                                                           o

2.6     Espacios de funciones
   Uno de los ´xitos de la topolog´ consiste en que sus t´cnicas, desarrolladas en
              e                   ıa                     e
principio para estudiar espacios “geom´tricos” como Kn , se aplican igualmente
                                        e
a objetos m´s abstractos, como son los conjuntos de funciones entre espacios
            a
topol´gicos. Las definiciones siguientes no corresponden en realidad a conceptos
     o
nuevos desde un punto de vista topol´gico:
                                      o

Definici´n 2.52 Sea Y un espacio topol´gico y X un conjunto cualquiera. Una
          o                               o
sucesi´n funcional de X en Y es una sucesi´n {fn }∞ en el espacio Y X de todas
      o                                     o      n=0
las aplicaciones de X en Y , es decir, para cada n se cumple fn : X −→ Y .

   Si Y es un espacio vectorial topol´gico (en especial si Y = K) cada sucesi´n
                                     o                                          o
                                                    P∞
funcional define la correspondiente serie funcional      fn , es decir, la sucesi´n
                                                                                o
                                                      n=0
                                        P
                                        n
cuyos t´rminos son las funciones Sn =
       e                                      fk : X −→ Y .
                                        k=0

    Diremos que una sucesi´n funcional {fn }∞ converge puntualmente a una
                          o                  n=0
funci´n f ∈ Y X si para todo x ∈ X se cumple l´ fn (x) = f (x). En tal caso
     o                                           ım
                                                  n
escribiremos l´ fn = f . Para series de funciones podemos definir de manera
              ım
               n
obvia la convergencia puntual absoluta y la convergencia puntual condicional.
    En realidad no estamos introduciendo un nuevo concepto de convergencia.
Notemos que Y X es el producto cartesiano del espacio Y por s´ mismo tantas
                                                               ı
veces como elementos tiene X, luego podemos considerarlo como espacio to-
pol´gico con la topolog´ producto. Las sucesiones convergen en esta topolog´
    o                  ıa                                                  ıa
si y s´lo si convergen coordenada a coordenada, o sea, si y s´lo si convergen
      o                                                      o
puntualmente. Por ello a la topolog´ producto en Y X se la llama tambi´n
                                     ıa                                    e
topolog´ de la convergencia puntual.
        ıa
   Sin embargo, la convergencia puntual no es la convergencia m´s natural que
                                                               a
puede definirse sobre las sucesiones funcionales. De hecho presenta grandes
inconvenientes.

Ejemplo Para cada n ≥ 1      sea fn : R −→ R la funci´n dada por
                                                     o
                 
                  0          si x ≤ 0
        fn (x) =   nx         si 0 ≤ x ≤ 1/n
                 
                   1          si 1/n ≤ x
                                                                       1/n

                        Si x ≤ 0 entonces fn (x) es constante igual a 0 y si
                     x > 1 entonces fn (x) es finalmente constante igual a 1,
                     luego esta sucesi´n funcional converge puntualmente a la
                                      o
                     funci´n f que muestra la figura de la izquierda. Tenemos,
                          o
pues, una sucesi´n de funciones continuas cuyo l´
                o                               ımite puntual no es continuo.
2.6. Espacios de funciones                                                         93


    En general el hecho de que una funci´n sea l´
                                            o           ımite
puntual de una sucesi´n de funciones aporta muy
                         o
poca informaci´n. La raz´n es que los entornos de
                o            o
la topolog´ puntual son muy grandes. En efecto, en
          ıa
el caso de RR no es dif´ ver que un entorno b´sico
                        ıcil                             a          x1   x2      x3
de una funci´n f es un conjunto de la forma
             o
     ©        Ø                                        ™
      g ∈ RR Ø |g(xi ) − f (xi )| < ≤, i = 1, . . . , n ,
donde ≤ > 0 y x1 , . . . , xn ∈ R, es decir, si una sucesi´n funcional tiende a f , lo
                                                          o
m´ximo que podemos garantizar tomando un ´
  a                                                ındice grande es que los t´rminos
                                                                             e
de la sucesi´n se parecer´n a f en un n´mero finito de puntos, pero dos funciones
            o               a             u
pueden parecerse en un n´mero finito de puntos y ser muy diferentes.
                              u
    Es mucho m´s natural considerar que dos funciones est´n pr´ximas cuando
                 a                                              a    o
distan menos de un ≤ en todos los puntos a la vez. Por ello, si Y es un espacio
m´trico, definimos la topolog´ de la convergencia uniforme en Y X como la que
  e                             ıa
tiene por base de entornos abiertos de una funci´n f a los conjuntos de la forma
                                                     o
                                X
                                     °           ¢
            B(f, ≤) = {g ∈ Y | d f (x), g(x) < ≤ para todo x ∈ X}.
    De este modo, cuando una funci´n g est´ en un entorno de f suficientemente
                                     o      a
peque˜o, ambas funciones se parecen realmente. Es f´cil comprobar que los
      n                                                 a
conjuntos B(f, ≤) cumplen las condiciones del teorema 1.14 y por tanto definen,
seg´n hemos dicho, una topolog´ en Y X .
    u                            ıa
    Es inmediato comprobar que una sucesi´n funcional {fn }∞ converge uni-
                                             o                n=0
formemente (es decir, en la topolog´ de la convergencia uniforme) a una funci´n
                                    ıa                                       o
f° si y s´lo si para todo ≤ > 0 existe un n0 tal que si n ≥ n0 , entonces
          o ¢
d fn (x), f (x) < ≤ para todo x ∈ X.
    La diferencia, pues, entre la convergencia uniforme y la convergencia puntual
es que cuando la convergencia es uniforme hay un n0 a partir del cual todos los
fn (x) distan de su l´
                     ımite menos de un ≤ dado, mientras que si la convergencia
es puntual cada punto x puede requerir un n0 mayor para acercarse a su l´      ımite
en menos de ≤, de manera que ning´n n0 sirva simult´neamente para todos los
                                      u                  a
puntos.
    Es obvio que si una sucesi´n funcional converge uniformemente a una fun-
                                o
ci´n, tambi´n converge puntualmente a dicha funci´n. Tanto la topolog´ de
  o          e                                         o                       ıa
la convergencia uniforme como la topolog´ de la convergencia puntual son de
                                            ıa
Hausdorff, luego los l´ ımites son unicos.
                                   ´
    Si en el espacio Y tomamos la distancia d0 (x, y) = m´  ın{1, d(x, y)}, los con-
juntos B(f, ≤) son los mismos cuando ≤ < 1, luego d0 induce la misma topolog´     ıa
de convergencia uniforme en Y X .
    La ventaja de esta m´trica es que no toma valores mayores que 1, por lo que
                          e
podemos definir
                                     © °          ¢Ø       ™
                      d(f, g) = sup d0 f (x), g(x) Ø x ∈ X ,
y es claro que esta d es una distancia en Y X para la cual B(f, ≤) es simplemente
la bola abierta de centro f y radio ≤. Esto convierte a Y X en un espacio m´trico
                                                                            e
cuya topolog´ es precisamente la de la convergencia uniforme.
              ıa
94                             Cap´
                                  ıtulo 2. Compacidad, conexi´n y completitud
                                                             o

Teorema 2.53 Sea X un espacio topol´gico e Y un espacio m´trico. Entonces
                                         o                     e
el conjunto C(X, Y ) de las aplicaciones continuas de X en Y es cerrado en Y X ,
cuando en ´ste consideramos la topolog´ de la convergencia uniforme.
           e                            ıa

    Demostracion: Sea {fn }∞ una sucesi´n de aplicaciones continuas que
                   ´               n=0            o
converja uniformemente a una funci´n f . Basta ver que f es continua. ¢
                                       o                        °
    Sea ≤ > 0. Sea n0 tal que si n ≥ n0 y x ∈ X, entonces d fn (x), f (x) < ≤/3.
    Sea x0 ∈ X (vamos a probar que f es continua en x0 ). Como fn0 es continua
                                                            °                 ¢
existe un entorno U de x0 tal que si x ∈ U , entonces d fn0 (x), fn0 (x0 ) < ≤/3.
Por lo tanto, si x ∈ U , se cumple que
  °              ¢   °              ¢   °                 ¢   °                  ¢
 d f (x), f (x0 ) ≤ d f (x), fn0 (x) + d fn0 (x), fn0 (xo) + d fn0 (x0 ), f (x0 ) < ≤.


   ´
   Este es un primer ejemplo del buen comportamiento de la convergencia uni-
forme. Veamos otros:

Teorema 2.54 Sea Y un espacio m´trico completo y X un conjunto. Entonces
                                    e
Y X es completo con la m´trica inducida a partir de la m´trica de Y . Por lo
                          e                               e
tanto si X es un espacio topol´gico, C(X, Y ) tambi´n es completo.
                              o                    e

                   ´
    Demostracion: Ante todo notemos que si Y es completo con su m´trica       e
d, tambi´n lo es con la m´trica d0 que resulta de tomar el m´
          e                  e                                   ınimo con 1, luego
podemos suponer que la m´trica en Y est´ acotada.
                               e              a
    Sea {fn }∞ una sucesi´n de Cauchy en Y X . Esto significa que para¢ todo
              n=0              o                                °
≤ > 0 existe un n0 tal que si m, n ≥ n0 y x ∈ X, entonces d fm (x), fn (x) < ≤.
    En particular esto implica que cada sucesi´n {fn (x)}∞ es de Cauchy en Y ,
                                                 o         n=0
luego converge a un cierto punto f (x). Con esto tenemos una funci´n f ∈ Y X
                                                                         o
a la cual {fn }∞ converge puntualmente. Basta ver que tambi´n converge
                 n=0                                                    e
uniformemente.
    Sea ≤ > °0 y tomemos un natural n0 como antes. As´ si n0 ≤ n ≤ m,
                             ¢                                 ı,
se cumple d fm (x), fn (x) < ≤, luego fm (x) est´ en la bola cerrada de centro
                                                     a
fn (x) y radio ¢ luego el l´
 °             ≤,          ımite f (x) estar´ en esta misma bola, o sea, se cumplir´
                                            a                                      a
d f (x), fn (x) ≤ ≤, y esto para todo n ≥ n0 y todo x ∈ X. Esto significa que la
sucesi´n converge uniformemente a f . La completitud de C(X, Y ) se sigue de
      o
que es un cerrado.
    En general no podemos convertir a Y X en un espacio normado aunque Y
lo sea. El problema es que no podemos transformar la norma en una norma
acotada. Lo unico que podemos hacer es definir (Y X )∗ como el espacio de
                ´
las funciones acotadas de X en Y , es decir, las funciones f tales que f [X]
est´ acotado. En este conjunto podemos definir la norma supremo dada por
   a          ©        Ø       ™
kf k∞ = sup kf (x)k Ø x ∈ X , que obviamente genera las bolas que definen
la topolog´ de la convergencia uniforme (restringida a (Y X )∗ ). As´ pues, si Y
           ıa                                                       ı
es un espacio normado, (Y X )∗ tambi´n lo es, y como es f´cil ver que el l´
                                      e                    a               ımite
uniforme de funciones acotadas est´ acotado, resulta que (Y X )∗ es cerrado en
                                    a
Y X , luego si Y es un espacio de Banach, (Y X )∗ tambi´n lo es.
                                                       e
2.6. Espacios de funciones                                                          95

    Si X es un espacio topol´gico e Y es un espacio normado, definimos C ∗ (X, Y )
                             o
como el espacio de las funciones continuas y acotadas de X en Y . Obviamente se
trata de la intersecci´n de dos cerrados, luego es cerrado, es un espacio normado
                      o
y si Y es un espacio de Banach, C ∗ (X, Y ) tambi´n lo es.
                                                    e
    En particular C ∗ (X, K) es un espacio de Banach. En general no podemos
dotar a C(X, K) de estructura de espacio normado. De hecho no es un espacio
vectorial topol´gico porque no es conexo. En efecto, es f´cil ver que C ∗ (X, K)
               o                                         a
es abierto y cerrado en C(X, K). La unica excepci´n es precisamente cuando
                                       ´           o
C(X, K) = C ∗ (X, K). Esto ocurre por ejemplo si X es un compacto. Es decir,
si X es compacto, entonces C(X, K) es un espacio de Banach con la norma
supremo y la topolog´ es la de la convergencia uniforme.
                      ıa
    Sea L(E, F ) el conjunto de las aplicaciones lineales continuas entre dos espa-
cios normados. Teniendo en cuenta 2.37, la aplicaci´n L(E, F ) −→ C ∗ (B1 (0), F )
                                                     o
definida por restricci´n es claramente lineal e inyectiva (pues B1 (0) contiene una
                      o
base de E). Si transportamos la norma de este segundo espacio al primero ob-
tenemos que, para cada aplicaci´n lineal y continua f : E −→ F , su norma es
                                  o
el supremo de f en B1 (0), y por lo tanto cumple kf (v)k ≤ kf k kvk para todo
v ∈ E.
Ejercicio: Probar que L(E, F ) es un subespacio cerrado de C ∗ (B1 (0), F ). Por consi-
guiente, si F es un espacio de Banach, L(E, F ) tambi´n lo es.
                                                     e

   Terminamos con un resultado importante sobre convergencia de series funcio-
                                                      P
                                                      ∞
nales. Previamente notemos lo siguiente: si una serie   fn converge absoluta
                                                            n=0
                                                        P∞
y uniformemente en un conjunto X, es decir, si la serie     |fn | converge uni-
                     P∞                                 n=0
formemente, entonces     fn converge uniformemente. La prueba es la misma
que la de 2.46.      n=0


                                                                           P
                                                                           ∞
Teorema 2.55 (Criterio de Mayoraci´n de Weierstrass) Sea
                                  o                                              fn una
                                                                           n=0
serie funcional en un espacio X y {Mn }∞ una sucesi´n en el intervalo [0, +∞[
                                       n=0            o
tal que para todo natural n y todo x ∈ X se cumpla |fn (x)| ≤ Mn . Si la
       P
       ∞
serie     Mn es convergente, entonces la serie fn es absoluta y uniformemente
      n=0
convergente en X.

                 ´
    Demostracion: La serie Mn es de Cauchy, luego dado ≤ > 0 existe un n0
                                p
                                P
tal que si n0 ≤ m ≤ p, entonces   Mn < ≤. As´
                                            ı
                                   n=m
                    Ø p          Ø
                    ØX           Ø   p
                                     X            Xp
                    Ø            Ø
                    Ø    |fn (x)|Ø =   |fn (x)| ≤     Mn < ≤
                    Øn=m         Ø n=m            n=m

                                                 P
                                                 ∞
para todo x ∈ X. Esto significa que la serie            |fn | es de Cauchy en C(X, K),
                                                 n=0
96                             Cap´
                                  ıtulo 2. Compacidad, conexi´n y completitud
                                                             o

                                                 P
                                                 ∞
luego (uniformemente) convergente, luego               fn es absoluta y uniformemente
                                                 n=0
convergente.



2.7       Ap´ndice: El teorema de Baire
            e
   Terminamos el cap´ ıtulo con un resultado que no nos va a hacer falta m´s
                                                                          a
adelante, pero que es util en algunos contextos m´s avanzados. Necesitamos
                      ´                           a
algunos resultados previos:

Definici´n 2.56 Si M es un espacio m´trico y C ⊂ M , se define el di´metro
        o                            e                            a
de C como
               d(C) = sup{d(x, y) | x, y ∈ C} ∈ [0, +∞].

     Es f´cil calcular el di´metro de una bola abierta:
         a                  a

                                  d(Br (x)) = 2r.

   Tambi´n se comprueba sin dificultad que el di´metro de un conjunto coincide
          e                                     a
con el de su clausura. Por ultimo, necesitamos el siguiente hecho elemental:
                           ´

Teorema 2.57 Sea M un espacio m´trico completo. Toda familia decreciente
                                  e
{Cn }n de cerrados en M no vac´ tal que l´ d(Cn ) = 0 tiene intersecci´n no
                              ıos        ım                           o
                                          n
vac´
   ıa.

                 ´
    Demostracion: Para cada n tomamos xn ∈ Cn . Como l´ n d(Cn ) = 0, es
                                                              ım
claro que la sucesi´n (xn )n es de Cauchy. Su l´
                   o                           ımite x est´ en cada Cn por ser
                                                          a
´ste cerrado y {Cn }n decreciente.
e


Teorema 2.58 (Teorema de Baire) En un espacio m´trico completo, la in-
                                                        e
tersecci´n de una familia numerable de abiertos densos es un conjunto denso.
        o

                                                                           T
                                                                           ∞
               ´
     Demostracion: Sea M un espacio m´trico completo y G =
                                     e                                          Gn una
                                                                          n=1
intersecci´n numerable de abiertos Gn densos en M . Basta probar que G corta
          o
a toda bola abierta Br (x). Como G1 es denso en M existe x1 ∈ G1 ∩ Br (x).
Como G1 ∩ Br (x) es abierto, existe un r1 > 0, que podemos tomar menor que
r/2, tal que B r1 (x1 ) ⊂ G1 ∩ Br (x).
                                                                       G2
    Inductivamente podemos construir una sucesi´n {xn }n
                                               o
de puntos de M y una sucesi´n {rn }n de n´meros reales
                               o          u                   r
positivos de modo que                                           x         x2
                                                                                 x1
                                                                               r1
               B rn (xn ) ⊂ Gn ∩ Brn−1 (xn−1 )             (2.2)
                                                                          G1
y rn < r/n para todo n.
2.7. Ap´ndice: El teorema de Baire
       e                                                                       97

                              T
                              ∞
   Por el teorema anterior,         B rn (xn ) 6= ∅, luego (2.2) implica que
                              n=1

                                    ∞
                                    
                  G ∩ Br (x) ⊃          (Gn ∩ Brn−1 (xn−1 )) 6= ∅.
                                    n=1



   Sin m´s que tener en cuenta que el complementario de un conjunto denso es
        a
un conjunto con interior vac´ tenemos una forma equivalente del teorema de
                            ıo
Baire:

Teorema 2.59 (Teorema de Baire) En un espacio m´trico completo, toda
                                                        e
uni´n numerable de cerrados de interior vac´ tiene interior vac´
   o                                       ıo                  ıo.

    Conviene observar que la tesis del teorema de Baire (en cualquiera de sus dos
formas equivalentes) se cumple tambi´n sobre espacios topol´gicos localmente
                                        e                      o
compactos, no necesariamente metrizables. La prueba es, de hecho, m´s sencilla,
                                                                      a
y se obtiene sustituyendo el teorema 2.57 por el hecho de que la intersecci´n de
                                                                            o
una familia decreciente de compactos no vac´ es no vac´
                                             ıos          ıa.
    Aunque, seg´n hemos indicado, no necesitaremos el teorema de Baire, vamos
                u
a tratar de explicar su inter´s. Para ello necesitamos algunas definiciones:
                             e

Definici´n 2.60 Sea X un espacio topol´gico. Un subconjunto A de X es
        o                                 o
diseminado si X  A contiene un abierto denso o, equivalentemente, si A est´
                                                                           a
contenido en un cerrado de interior vac´ o, tambi´n, si int A = ∅.
                                       ıo        e

    Informalmente, la idea es que un abierto denso (y cualquier conjunto que
lo contenga) es un conjunto “muy grande” desde el punto de vista topol´gico,
                                                                         o
pues todo abierto contiene un abierto contenido en tal conjunto; los conjuntos
diseminados son topol´gicamente “muy peque˜os”. Como todo conjunto que
                       o                      n
contenga a un conjunto que contenga a un abierto denso contiene un abierto
denso, tomando complementarios obtenemos que los subconjuntos de los conjun-
tos diseminados son diseminados. Esta noci´n de conjunto diseminado resulta
                                            o
ser muy restrictiva, esencialmente a causa de que no se conserva por uniones
numerables, por ello se definen los conjuntos de primera categor´
                                                               ıa:

Definici´n 2.61 Un subconjunto A de un espacio topol´gico X es de primera
         o                                          o
categor´ si es uni´n numerable de conjuntos diseminados. A es de segunda
       ıa          o
categor´ si no es de primera categor´
       ıa                           ıa.

    Es evidente que toda uni´n numerable de conjuntos de primera categor´
                              o                                            ıa
es de primera categor´ As´ los conjuntos de primera categor´ son conjun-
                      ıa.    ı,                                 ıa
tos topol´gicamente “peque˜os”, aunque no necesariamente “muy peque˜os”,
         o                  n                                           n
mientras que los conjuntos de segunda categor´ son los topol´gicamente “gran-
                                             ıa             o
des”.
   No obstante, estas nociones no sirven de nada sin el teorema de Baire, que
puede enunciarse en una tercera forma equivalente:
98                            Cap´
                                 ıtulo 2. Compacidad, conexi´n y completitud
                                                            o

Teorema 2.62 (Teorema de Baire) En un espacio m´trico completo, los con-
                                                  e
juntos de primera categor´ tienen interior vac´
                         ıa                   ıo.

             ´
   Demostracion: Consideremos un conjunto C de primera categor´ En-
                                                              ıa.
tonces
                          S      S
                      C = An ⊂ An = C 0 ,
                                   n         n

donde los conjuntos An son diseminados, luego sus clausuras son cerrados de
interior vac´ luego C 0 tiene interior vac´ (por la versi´n que ya hemos probado
            ıo,                           ıo             o
del teorema de Baire) y C tambi´n. e
   As´ pues, si probamos que un conjunto C es “peque˜o”, en el sentido de
      ı                                                 n
que es de primera categor´ el teorema de Baire nos da que todo abierto va a
                         ıa,
                          a        ´
contener puntos que no est´n en C. Este es esencialmente el inter´s del teorema
                                                                 e
de Baire.
    Terminaremos con una aplicaci´n del teorema de Baire, que no es de las m´s
                                    o                                       a
t´
 ıpicas, pero tal vez la m´s sencilla:
                          a

Ejemplo     Q no puede expresarse como una intersecci´n numerable de abiertos
                                                     o
de R.
   En efecto, en tal caso ser´ una intersecci´n numerable de abiertos densos,
                             ıa              o
luego R  Q ser´ una uni´n numerable de cerrados de interior vac´ al igual que
               ıa       o                                       ıo,
R = Q ∪ (R  Q). El teorema de Baire nos dar´ entonces que R tiene interior
                                               ıa
vac´ (en s´ mismo), lo cual es absurdo.
   ıo      ı
    Los conjuntos que pueden expresarse como intersecci´n numerable de abier-
                                                         o
tos se llaman conjuntos Gδ . El ejemplo anterior, junto con el teorema siguiente,
muestra que no puede existir una funci´n f : R −→ R continua en los puntos
                                         o
Q y discontinua en los de R  Q. (Si el lector cree que esto es evidente, deber´
                                                                               ıa
pensar en el ejercicio que sigue al teorema.)

Teorema 2.63 Sea M un espacio m´trico completo. El conjunto de puntos de
                                   e
continuidad de toda funci´n f : M −→ R es un Gδ .
                         o

               ´
     Demostracion: Para cada natural no nulo n definimos

     Gn = {x ∈ M | existe δ > 0 tal que sup f (y) − ´
                                                    ınf              f (y) < 1/n}.
                                             y∈Bδ (x)     y∈Bδ (x)


   Claramente los conjuntos Gn son abiertos. Basta probar que el conjunto de
                                  T
                                  ∞
puntos de continuidad de f es G =    Gn .
                                       n=1
    Si f es continua en x, dado un n > 0 existe un δ > 0 tal que si y ∈ Bδ (x)
entonces |f (x) − f (y)| < 1/(4n). Por lo tanto, si y, y 0 ∈ Bδ (x) se cumple que
|f (y) − f (y 0 )| < 1/(2n) y, tomando el supremo en y y el ´
                                                            ınfimo en y 0 , concluimos
que x ∈ Gn .
2.7. Ap´ndice: El teorema de Baire
       e                                                                           99

   Rec´
      ıprocamente, supongamos que x ∈ G. Dado ≤ > 0 tomamos n tal que
1/n < ≤. Como x ∈ Gn , existe δ > 0 tal que

                               sup f (y) − ´
                                           ınf            f (y) < 1/n.
                             y∈Bδ (x)          y∈Bδ (x)


Entonces si y ∈ Bδ (x) se tiene que

              |f (x) − f (y)| ≤         sup f (y) − ´
                                                    ınf         f (y) < 1/n < ≤,
                                    y∈Bδ (x)         y∈Bδ (x)

luego f es continua en x.

Ejercicio: Consideremos la funci´n f : R −→ R dada por
                                o
                        n
              f (x) =       1/q   si x = p/q con p, q ∈ Z, (p, q) = 1, q > 0,
                             0    en caso contrario.
Demostrar que l´ f (x) = 0 para todo x0 ∈ R. Deducir que f es continua en R  Q
               ım
               x→x0
y discontinua en Q.
Cap´
   ıtulo III

C´lculo diferencial de una
  a
variable

    En este cap´ıtulo estudiaremos una de las ideas m´s importantes y fruct´
                                                     a                     ıferas
que posee la matem´tica actual. Su n´cleo est´ en la observaci´n de que mu-
                      a                 u        a               o
chas curvas se parecen localmente a rectas. Por ejemplo, visto suficientemente
de cerca, un arco de circunferencia es indistinguible de un segmento de recta.
Una prueba de ello est´ en el horizonte que separa el cielo del mar en un d´
                         a                                                     ıa
despejado. Se trata de un arco de circunferencia, pero ¿se ve que es as´ı?
    La raz´n por la que el horizonte parece recto no es que la Tierra sea muy
           o
grande, sino que la vemos muy de cerca. Vista desde la Luna es claramente
esf´rica y cualquier circunferencia al microscopio parece una recta. Lo mismo
   e
sucede con muchas curvas, que si las vemos muy de cerca parecen rectas. Pero
esto no es cierto para todas. Pensemos en la curva de la figura.
   Vista de cerca podr´ pasar por una recta en un en-
                        ıa
torno de cualquiera de sus puntos excepto el se˜alado
                                                n
con el c´
        ırculo, donde tiene un “pico”. Por m´s que nos
                                            a
acerquemos nunca dejaremos de ver ese pico que delatar´
                                                      a
que no se trata de una recta. Vamos a estudiar las curvas que localmente se
parecen a rectas. Pero ¿qu´ es exactamente parecerse a una recta?
                           e


3.1     Derivaci´n
                o
    Consideremos una funci´n f definida en un entorno
                            o                                             r
de un punto a ∈ R y con imagen en R. Supongamos                               f
que su gr´fica se parece mucho a una recta en un en-
          a
torno del punto. La pregunta es ¿a qu´ recta se parece?
                                      e       °       ¢
Por lo pronto a una que pasa por el punto a, f (a) .
Las rectas que pasan por dicho punto (a excepci´n de
                                                  o               a
la vertical, que no nos va a interesar) son de la forma r(x) = m(x − a) + f (a),
donde m ∈ R.

                                      101
102                             Cap´
                                   ıtulo 3. C´lculo diferencial de una variable
                                             a

     La interpretaci´n geom´trica de m es sencilla. En general, si tenemos una
                    o         e
recta r(x) = mx + n, en un punto a tomar´ el valor r(a) = ma + n. Si nos
                                                a
trasladamos a un punto a + h con h 6= 0 obtendremos r(a + h) = ma + mh + n.
El incremento que ha experimentado la funci´n es r(a + h) − r(a) = mh, y si lo
                                                o
dividimos por el desplazamiento h obtenemos, independientemente de cu´l sea  a
h, el valor m. Es decir,
                                      r(a + h) − r(a)
                                m=                    .
                                             h
Geom´tricamente esto no es sino el teorema de Tales. En definitiva, m expresa lo
       e
que aumenta la funci´n por unidad de avance: si nos desplazamos h = 1 unidad,
                      o
la recta aumenta en m unidades, si avanzamos h = 2 unidades, la recta aumenta
2m, etc. Por lo tanto, si el valor de m es grande la recta subir´ muy r´pidamente,
                                                                a      a
ser´ una recta muy empinada. Si m = 0 la recta no sube, es constante. Si m
    a
es negativo la recta baja, m´s r´pidamente cuanto mayor sea m en m´dulo. El
                               a a                                        o
n´mero m se llama pendiente de la recta. Una recta viene determinada por
  u
dos de sus puntos o bien por uno de sus puntos y su pendiente (pues conocido
un punto (a, b) y la pendiente m conocemos m´s puntos: (a + 1, b + m), por
                                                    a
ejemplo).
   Volviendo a nuestro problema, tenemos la recta r(x) = m(x−a)+f (a), cuya
pendiente es m. Nos falta determinar m para que sea la recta que se parece a f .
Consideremos la expresi´n
                        o
                                     f (a + h) − f (a)
                            m(h) =                     .                     (3.1)
                                             h
    Esto no es una constante (salvo que f sea una recta), pero si ciertamente f
se parece a una recta r, esta expresi´n deber´ parecerse a la pendiente de r.
                                     o        ıa
Si f se parece m´s a r cuanto m´s de cerca la miramos, esto es, cuando consi-
                 a               a
deramos puntos m´s cercanos al punto a, el valor m(h) deber´ parecerse m´s
                   a                                          ıa             a
a la pendiente de r cuanto menor es h. Por ello definimos:

Definici´n 3.1 Sea f : A −→ R y a un punto interior de A. Diremos que f es
         o
derivable en a si existe (en R)
                                         f (a + h) − f (a)
                         f 0 (a) = l´
                                    ım                     .
                                  h→0            h
Cuando esto sucede, a la recta r(x) = f 0 (a)(x − a) + f (a) se le llama recta
                            °       ¢
tangente a f en el punto a, f (a) (o para abreviar, en el punto a). El n´mero
                                                                        u
f 0 (a) es la derivada de f en el punto a.

    Seg´n hemos dicho, una funci´n es derivable en un punto cuando su gr´fica
       u                         o                                         a
se confunde en un entorno de dicho punto con la de una recta, la recta tangente
a la funci´n en el punto. Esto no es exacto, pues en realidad hay funciones
          o
que se parecen a rectas en los alrededores de un punto y pese a ello no son
derivables. Esto ocurre cuando la recta tangente es vertical, con lo que su
pendiente es infinita y no existe (en R) el l´
                                   √        ımite que define la derivada. Un
ejemplo lo proporciona la funci´n 3 x en x = 0.
                               o
3.1. Derivaci´n
             o                                                              103

                                              1

                                             0.5


                       -2          -1                 1        2

                                            -0.5

                                             -1




   Observamos que el eje vertical es tangente a la funci´n en 0, pese a lo cual,
                                                        o
seg´n veremos, la funci´n no es derivable en 0.
   u                   o
    Diremos que una funci´n es derivable en un abierto A si es derivable en
                           o
todos los puntos de A. Una funci´n es derivable si su dominio es un abierto y
                                  o
es derivable en todos sus puntos.
   Si f : A −→ R es derivable, tenemos definida otra funci´n f 0 : A −→ R que
                                                          o
a cada punto a ∈ A le asigna su derivada f 0 (a). A esta funci´n la llamamos
                                                              o
(funci´n) derivada de f en A.
      o
    Teniendo en cuenta la motivaci´n que hemos dado para el concepto de de-
                                    o
rivada, es claro que toda recta no vertical, f (x) = mx + n es derivable en R
y su derivada es su pendiente, o sea, m. La raz´n es que, seg´n hemos visto,
                                                  o             u
el cociente (3.1) es en este caso constante igual a m, luego el l´
                                                                 ımite cuando h
tiende a 0 es igualmente m. En particular, la derivada de una funci´n constante,
                                                                   o
f (x) = a, es f 0 (x) = 0.

Ejemplo Calculemos la derivada de la funci´n f (x) = x2 .
                                          o

                (x + h)2 − x2       x2 + 2xh + h2 − x2
  f 0 (x) = l´
             ım               = l´
                                 ım                    = l´ 2x + h = 2x.
                                                          ım
            h→0       h         h→0         h            h→0




   Enseguida veremos que es muy f´cil reconocer las funciones derivables as´
                                    a                                         ı
como calcular sus derivadas. Primero demostremos un hecho b´sico. Obvia-
                                                                a
mente, lo primero que ha de hacer una funci´n para parecerse a una recta es ser
                                           o
continua.

Teorema 3.2 Si una funci´n es derivable en un punto a, entonces es continua
                        o
en a.

   Demostracion: Sea f : A −→ R derivable en a. Entonces existe
             ´

                                         f (a + h) − f (a)
                            f 0 (a) = l´
                                       ım                  .
                                     h→0         h
Como l´ h = 0, multiplicando obtenemos que
      ım
      h→0

                      l´ (f (a + h) − f (a)) = f 0 (a)0 = 0.
                       ım
                      h→0
104                               Cap´
                                     ıtulo 3. C´lculo diferencial de una variable
                                               a

Por lo tanto l´ f (a + h) = f (a). Teniendo en cuenta la definici´n de l´
              ım                                                o      ımite,
              h→0
es f´cil ver que esto equivale a que l´ f (x) = f (a). Esto significa que f es
    a                                 ım
                                     x→a
continua en a.

   En particular, las funciones derivables son continuas, pero no toda funci´n
                                                                            o
continua es derivable.

                             √
Ejemplos Ya hemos dicho que 3 x no es derivable en 0. Es f´cil probarlo. La
                                                          a
derivada en 0 ser´
                 ıa
                        √
                        3
                          h−0          1
                    l´
                     ım        = l´ √ = +∞.
                                  ım 3
                    h→0    h     h→0    h2
    Aqu´ la raz´n es que la pendiente de la funci´n se
        ı       o                                   o                      |x|
vuelve infinita en 0. Otra causa de no derivabilidad (a pe-
sar de la continuidad) es que la funci´n forme un “pico”.
                                      o
Por ejemplo f (x) = |x| en x = 0. La derivada ser´ıa

                     |h| − 0
                 l´
                  ım         = l´ sig h,
                                ım
                 h→0    h      h→0


pero es claro que el l´
                      ımite por la izquierda es −1 y el l´
                                                         ımite por la derecha es
+1, luego no existe tal l´
                         ımite.



3.2     C´lculo de derivadas
         a
    El teorema siguiente recoge las propiedades b´sicas que nos permiten derivar
                                                 a
las funciones m´s simples:
                a

Teorema 3.3 Sean f , g : A −→ R funciones derivables en un punto a ∈ A y
α ∈ R.

  a) f + g es derivable en a y (f + g)0 (a) = f 0 (a) + g 0 (a).

  b) α f es derivable en a y (α f )0 (a) = α f 0 (a).

  c) f g es derivable en a y (f g)0 (a) = f 0 (a)g(a) + f (a)g 0 (a).

  d) Si g(a) 6= 0, f /g es derivable en a y

                                           f 0 (a)g(a) − f (a)g 0 (a)
                           (f /g)0 (a) =                              .
                                                     g 2 (a)

En particular, las funciones derivables en A forman una sub´lgebra de C(A).
                                                           a
3.2. C´lculo de derivadas
      a                                                                         105

             ´
   Demostracion: Las propiedades a) y b) son muy sencillas. Veamos c).

                 g(a + h)g(a + h) − f (a)g(a)
(f g)0 (a) =    l´
                 ım
               h→0             h
                 f (a + h)g(a + h) − f (a)g(a + h) + f (a)g(a + h) − f (a)g(a)
           = l´
              ım
             h→0                                h
                 µ                                                    ∂
                   f (a + h) − f (a)                  g(a + h) − g(a)
           = l´
              ım                     g(a + h) + f (a)
             h→0           h                                 h
               0               0
           = f (a)g(a) + f (a)g (a),

donde hemos usado la continuidad de g en a al afirmar que l´ g(a + h) = g(a).
                                                          ım
                                                              h→0
   La prueba de d) es similar.
   Aplicando inductivamente la propiedad c) se obtiene que (xn )0 = nxn−1 ,
para todo natural n ≥ 1. Aplicando ahora d) resulta que esto es cierto para
todo entero n 6= 0. En particular todos los polinomios y fracciones algebraicas
son derivables en sus dominios.
   Por ejemplo, la derivada de 3x4 −2x3 +x2 +5x−3 es igual a 12x3 −6x2 +2x+5.
Observar que la derivada de un polinomio coincide con su derivada formal en el
sentido algebraico.
   La derivaci´n de las ra´
               o            ıces se√ seguir´ un resultado general sobre funciones
                                           a
inversas. Por ejemplo, la funci´n 3 x es la inversa de la funci´n x3 . Esto significa
                               o             √                 o
que un punto (x, y) est´ en la gr´fica de 3 x si y s´lo si el punto (y, x) est´ en
                        a          a                  o                         a
la de x3 . La gr´fica de una se obtiene de la de la otra cambiando x por y.
                 a
Geom´tricamente esto equivale a girar la gr´fica respecto a la diagonal:
      e                                        a
                                         2
                                               x3
                                       1.5


                                         1
                                                      √
                                                      3
                                                        x
                                       0.5



                         -2      -1              1       2

                                      -0.5


                                        -1


                                      -1.5


                                        -2



    Es claro geom´tricamente que si una funci´n tiene tangente en el punto
                    e                             o
(x, y), su inversa tendr´ tangente en el punto (y, x), y que la recta tangente a la
                        a
inversa resultar´ de girar respecto a la diagonal la recta tangente a la funci´n
                 a                                                              o
original. Ahora bien, ¿qu´ relaci´n hay entre la pendiente de una recta y la
                            e      o
pendiente de la recta que resulta de girarla respecto a la diagonal?. Si una recta
es y = mx + n (con pendiente m), girar respecto a la diagonal es cambiar y por
x, o sea, pasar a x = my + n. Despejando y obtenemos y = (1/m)x − n/m.
106                              Cap´
                                    ıtulo 3. C´lculo diferencial de una variable
                                              a

Por lo tanto la pendiente es 1/m. Si la recta original tiene pendiente 0 (es
horizontal), la recta girada es vertical, tiene pendiente infinita.
    Por lo tanto es de esperar que si una funci´n biyectiva f cumple f (a) = b y
                                                 o
tiene derivada m 6= 0 en a, entonces su inversa tiene derivada 1/m en b. Antes
de probarlo anal´ ıticamente damos un sencillo resultado t´cnico.
                                                            e

Definici´n 3.4 Sea A un intervalo y f : A −→ R, diremos que f es creciente en
         o
A si cuando x < y son dos puntos de A, se cumple f (x) ≤ f (y). Si de hecho se
cumple f (x) < f (y) diremos que f es estrictamente creciente en A. Se dice que
f es decreciente en A si cuando x < y son puntos de A, se cumple f (y) ≤ f (x).
Si se cumple f (y) < f (x) se dice que es estrictamente decreciente en A. La
funci´n f es (estrictamente) mon´tona en A si es (estrictamente) creciente o
     o                            o
decreciente en A.

   Por ejemplo, la funci´n x3 es estrictamente creciente en R.
                        o

Teorema 3.5 Sea A un intervalo y f : A −→ R una funci´n inyectiva y conti-
                                                     o
nua. Entonces f es estrictamente mon´tona en A.
                                    o

                    ´
     Demostracion: Sean a < b dos puntos cualesquiera de A. Supongamos que
f (a) < f (b). Entonces todo a < x < b ha de cumplir f (a) < f (x) < f (b), pues
si, por ejemplo, f (x) < f (a) < f (b), por el teorema de los valores intermedios, en
el intervalo ]x, b[ habr´ un punto cuya imagen ser´ f (a), y f no ser´ inyectiva.
                        ıa                             ıa                ıa
     De aqu´ se sigue que f es creciente en [a, b], pues si a ≤ x < y ≤ b, hemos
            ı
visto que f (a) < f (x) < f (b), y aplicando lo mismo a los puntos x, b, resulta
que f (x) < f (y) < f (b). Igualmente, de f (b) < f (a) llegar´    ıamos a que f es
decreciente en [a, b]. Por lo tanto f es mon´tona en cualquier intervalo [a, b]
                                                  o
contenido en A.
     Pero si f no fuera mon´tona en A existir´ puntos u < v y r < s tales
                              o                     ıan
que f (u) < f (v) y f (s) < f (r). Tomando el m´        ınimo y el m´ximo de estos
                                                                      a
cuatro puntos obtendr´   ıamos los extremos de un intervalo en el que f no ser´    ıa
mon´tona.
      o

Teorema 3.6 (Teorema de la funci´n inversa) Sea A un intervalo abierto
                                     o
y f : A −→ R una funci´n inyectiva y derivable en A tal que f 0 no se anule en
                      o
ning´n punto de A. Entonces
     u

  a) B = f [A] es un intervalo abierto.

  b) La funci´n inversa g = f −1 : B −→ A es derivable en B.
             o

  c) Para todo a ∈ A, si f (a) = b, se cumple que g 0 (b) = 1/f 0 (a).

                 ´
    Demostracion: Por el teorema anterior sabemos que f es estrictamente
mon´tona. Digamos que es mon´tona creciente. Si a < b son dos puntos de
     o             £     §          o
A, por conexi´n£ f ]a,§b[ ha de ser un intervalo, y de la monoton´ se sigue
              o                                                  ıa
f´cilmente que f ]a, b[ = ]f (a), f (b)[.
 a
3.2. C´lculo de derivadas
      a                                                                          107

   Dado a ∈ A, podemos tomar un ≤ > 0 tal que [a − ≤, a + ≤] ⊂ A, con lo que
                                               £              §
             f (a) ∈ ]f (a − ≤), f (a − ≤)[ = f ]a − ≤, a + ≤[ ⊂ B.

   As´ pues B es un entorno de f (a) para todo a ∈ A, o sea, para todos los
      ı
puntos de B. Por lo tanto B es abierto. Por conexi´n es un intervalo. Adem´s
                                                     o                          a
hemos visto que f env´ abiertos b´sicos ]a, b[ a abiertos b´sicos, y esto significa
                       ıa           a                      a
que g es continua.
   Sea ahora f (a) = b. Por la monoton´ si h 6= 0, entonces g(b + h) 6= g(b).
                                        ıa,
Sea k = g(b + h) − g(b) 6= 0. As´ g(b + h) = k + a, luego b + h = f (k + a), y
                                  ı
h = f (k + a) − f (a). Por lo tanto
                          g(b + h) − g(b)              1
                                          =      f (a+k)−f (a)
                                 h
                                                       k

   Ahora, k es una funci´n de h y, como g es continua, l´ k(h) = 0. La
                        o                               ım
                                                                  h→0
derivabilidad de f en el punto a nos da que
                                      g(b + h) − g(b)    1
                      g 0 (b) = l´
                                 ım                   = 0 .
                                h→0          h         f (a)



Ejemplo Sea n un n´mero natural no nulo y consideremos f (x) = xn definida
                       u
en ]0, +∞[. Sabemos que es inyectiva y derivable. Su derivada es nxn−1 , que
                                                                  √
no se anula en ]0, +∞[. Por lo tanto su inversa, que es g(x) = n x, es derivable
                                           √
en su dominio y si y n = x (con lo que y = n x), entonces g 0 (x) = 1/f 0 (y), o sea,
                     √           1             1    1
                   ( n x)0 =            =    √ n−1 = x−1+1/n .
                               ny n−1       n x
                                             n
                                                    n
As´ pues, tenemos probado que la regla de derivaci´n xr 7→ rxr−1 es v´lida
   ı                                                o                    a
cuando r es entero o de la forma 1/n, donde n es un n´mero natural no nulo.
                                                       u
Aplicando la regla del producto se concluye por inducci´n que vale de hecho
                                                         o
para todo n´mero racional r.
            u
                                                                     √
     Con todo lo anterior, todav´ no sabemos derivar funciones como x2 + 1.
                                ıa
Con el teorema siguiente estaremos en condiciones de derivar cualquiera de las
funciones que podemos construir a partir de polinomios y ra´
                                                           ıces.

Teorema 3.7 (regla de la cadena) Sean f : A −→ R y g : B −→ R. Sea un
punto a ∈ A tal que f sea derivable en a y g sea derivable en f (a). Entonces la
funci´n compuesta f ◦ g es derivable en a y (f ◦ g)0 (a) = g 0 (f (a))f 0 (a).
     o
                   ´
    Demostracion: Notemos que B es un entorno de f (a) y f es continua en
a, luego f −1 [B] es un entorno de a sobre el que est´ definida f ◦ g.
                                                     a
    Sea b = f (a). Para k 6= 0, llamemos
                                     g(b + k) − g(b)
                         G(k) =                      − g 0 (b).
                                            k
108                                 Cap´
                                       ıtulo 3. C´lculo diferencial de una variable
                                                 a

    La funci´n G est´ definida para los puntos k tales que b + k ∈ B. Como B
            o        a
es abierto, G est´ definida al menos para h en un intervalo ]−≤, ≤[  {0}. Como
                 a
g es derivable en b, existe l´ G(k) = 0, luego si definimos G(0) = 0 tenemos
                             ım
                              k→0
que G es continua en un entorno de 0. Claramente adem´s a
                                       ° 0          ¢
                      g(b + k) − g(b) = g (b) + G(k) k.
    Ahora tomamos h 6= 0 tal que a + h ∈ A y k = f (a + h) − f (a), con lo que
se cumple f (a + h) = b + k, luego b + k ∈ B y est´ definido G(k). Entonces
                                                  a
        °         ¢    °     ¢      ° 0              ¢
       g f (a + h) − g f (a) = g (f (a)) + G(k) k
                                    °                ¢°               ¢
                                = g 0 (f (a)) + G(k) f (a + h) − f (a) .
    En consecuencia
(f ◦ g)(a + h) − (f ◦ g)(a) ° 0                                    ¢ f (a + h) − f (a)
                           = g (f (a)) + G(f (a + h) − f (a))                          .
             h                                                               h
    Usando la continuidad de f en a y la de G en 0, tomamos el l´         ımite cuando
h tiende a 0 y queda que existe (f ◦ g)0 (a) = g 0 (f (a))f 0 (a).

                              √
Ejemplo La funci´n h(x) = x2 + 1 es derivable en R, pues es la composici´n
                    o                             √                       o
del polinomio f (x) = x2 + 1 con la funci´n g(x) = x, y ambas funciones son
                                         o                           √
derivables en sus dominios. Sabemos que f 0 (x) = 2x y g 0 (x) = 1/(2 x). La
regla de la cadena nos da que
                                                  2x       x
                 h0 (x) = g 0 (x2 + 1)f 0 (x) = √       =√       .
                                               2 x2 + 1   x2 + 1

    El lector que no est´ familiarizado con el c´lculo de derivadas deber´ prac-
                        e                       a                        ıa
ticar hasta que la derivaci´n le resultara un acto mec´nico. Hay muchos libros
                            o                           a
adecuados para ello, por lo que en adelante dejaremos de justificar los c´lculos
                                                                          a
de derivadas.


3.3      Propiedades de las funciones derivables
   La derivada de una funci´n contiene mucha informaci´n sobre ´sta. Consi-
                           o                          o        e
deremos por ejemplo
                              x5    x3                  x4    3
                    f (x) =      −     + 2, f 0 (x) =        − x2 .
                              10     2                   2    2
    La figura de la p´gina siguiente muestra las gr´ficas. Fij´monos en el signo
                       a                                a         e
de la derivada. Es f´cil ver que f 0 tiene una ra´ doble en 0 y dos ra´ √ £
            √          a                             ız                § ıces sim-
ples en ± 3. La restricci´n de f 0 a cada uno de los intervalos −∞, − 3 ,
                               o
§ √ £ § √ £ §√                   £
 − 3, 0 , 0, 3 y           3, +∞ es una funci´n continua que no se anula, luego
                                                o
por el teorema de los valores intermedios f 0 tiene signo constante en cada uno
de ellos. Es f´cil ver entonces que el signo de f 0 var´ como indica la gr´fica, es
               a                                          ıa                a
decir, f 0 es positiva en los dos intervalos no acotados y negativa en los acotados.
3.3. Propiedades de las funciones derivables                                   109


                        f 0 (x)
                                         7.5


                                           5


                                         2.5


                   -4             -2                  2     4

                                        -2.5


                                          -5

                   f (x)
                                        -7.5

    En los puntos donde f 0 es positiva la tangente a f tiene pendiente positiva,
y vemos en la gr´fica que esto se traduce en que f es creciente. Por el contrario,
                 a
en los intervalos donde f 0 es negativa la funci´n f es decreciente.
                                                o                           √
    En los puntos donde f 0 se anula la tangente a f es horizontal. En − 3, la
derivada pasa de ser positiva a ser negativa, luego f pasa de ser creciente a ser
decreciente, y por ello el punto es un m´ximo relativo, en el sentido de que f
            √                              a
toma en − 3 un valor mayor que en los puntos de alrededor. En cambio, en
√
  3 la derivada pasa de negativa a positiva, f pasa de decreciente a creciente y
el punto es un m´ ınimo relativo. El caso del 0 es distinto, pues f 0 es negativa a
la izquierda, toca el 0 y vuelve a bajar, con lo que sigue siendo negativa. Por
ello f es creciente en 0 y no tiene ni un m´ximo ni un m´
                                             a             ınimo en 0.
    Vemos as´ que conociendo la derivada podemos formarnos una idea de la
              ı
funci´n: d´nde crece, d´nde decrece, d´nde tiene m´ximos y m´
      o     o            o                o            a            ınimos, y m´sa
cosas de las que no hemos hablado. Vamos a desarrollar todas estas ideas.
Definici´n 3.8 Sea f : A ⊂ R −→ R. Diremos que f tiene un m´ximo relativo
          o                                                        a
en un punto a ∈ A si existe un entorno V de a contenido en A de modo que para
todo x ∈ V se cumple f (x) ≤ f (a). Diremos que f tiene un m´   ınimo relativo en
a si existe un entorno V de a contenido en A tal que para todo x ∈ V se cumple
f (a) ≤ f (x). La funci´n f tiene un extremo relativo en a si tiene un m´ximo o
                       o                                                 a
un m´ ınimo relativo en a.
Teorema 3.9 Si f : A −→ R es una funci´n derivable en un punto a ∈ A y f
                                             o
tiene un extremo relativo en a, entonces f 0 (a) = 0.
     Demostracion: Supongamos, por reducci´n al absurdo, que f 0 (a) > 0.
                   ´                             o
(El caso f 0 (a) < 0 se razona an´logamente.) Entonces ]0, +∞[ es un entorno de
                                 a
f 0 (a), luego por definici´n de l´
                           o     ımite y de derivada existe un ≤ > 0 de manera
que ]a − ≤, a + ≤[ ⊂ A y si 0 < |h| < ≤ entonces
                                   f (a + h) − f (a)
                                                     > 0.
                                           h
110                              Cap´
                                    ıtulo 3. C´lculo diferencial de una variable
                                              a

    Esto se traduce en que f (a + h) > f (a) si h > 0 y f (a + h) < f (a) si h < 0,
lo que contradice que f tenga un extremo relativo en a.
   La funci´n del ejemplo anterior muestra que f 0 (a) = 0 no implica que a
           o
sea un extremo relativo. M´s adelante volveremos sobre este punto. Ahora
                           a
probemos una consecuencia sencilla de este teorema:

Teorema 3.10 (Teorema de Rolle) Sea f : [a, b] −→ R una funci´n conti-   o
nua en [a, b] y derivable en ]a, b[. Si f (a) = f (b), entonces existe un c ∈ ]a, b[
tal que f 0 (c) = 0.

                   ´
    Demostracion: Como [a, b] es compacto, la funci´n f alcanza un valor
                                                           o
m´ınimo m y un valor m´ximo M . Si se cumpliera que m = M = f (a) = f (b),
                          a
entonces f ser´ constante y su derivada ser´ nula, luego cualquier c ∈ ]a, b[
                ıa                             ıa
cumplir´ el teorema.
        ıa
    Supongamos que m < M . Entonces, o bien m 6= f (a) o bien M 6= f (a).
Digamos por ejemplo M 6= f (a). Sea c ∈ [a, b] el punto donde f (c) = M . Como
M 6= f (a) = f (b), ha de ser a < b < c, y como f toma en c su valor m´ximo, en
                                                                        a
particular c es un m´ximo relativo de f , luego por el teorema anterior f 0 (c) = 0.
                     a


   Como aplicaci´n podemos relacionar la derivabilidad y el crecimiento global
                o
de una funci´n.
            o

Teorema 3.11 Sea A un intervalo abierto y f : A −→ R una funci´n derivable
                                                               o
en A tal que f 0 no se anule. Entonces f es estrictamente mon´tona en A y
                                                             o
adem´s se da uno de estos dos casos:
    a

  a) o bien f 0 (x) > 0 para todo x ∈ A, y entonces f es estrictamente creciente
     en A,

  b) o bien f 0 (x) < 0 para todo x ∈ A, y entonces f es mon´tona decreciente
                                                            o
     en A.

                   ´
      Demostracion: En primer lugar, f es inyectiva, pues si a < b son dos
puntos de A tales que f (a) = f (b), entonces existe un c ∈ ]a, b[ ⊂ A tal que
f 0 (c) = 0, en contra de la hip´tesis.
                                 o
      Por el teorema 3.5, f es estrictamente mon´tona en A. Si es mon´tona decre-
                                                o                    o
ciente, la prueba del teorema 3.9 muestra que no puede ser f 0 (a) > 0 en ning´n
                                                                              u
punto a ∈ A, luego ha de ser f 0 (a) < 0 en todos los puntos. An´logamente, si
                                                                   a
f es mon´tona creciente ha de ser f 0 (a) > 0 en toco a ∈ A.
            o
   Veamos ahora un resultado t´cnico:
                              e

Teorema 3.12 (Teorema de Cauchy) Sean f , g : [a, b] −→ R funciones
continuas en [a, b] y derivables en ]a, b[. Entonces existe un c ∈ ]a, b[ tal que
                            °             ¢         °           ¢
                     g 0 (c) f (b) − f (a) = f 0 (c) g(b) − g(a) .
3.3. Propiedades de las funciones derivables                                         111

             ´
   Demostracion: Consideremos la funci´n dada por
                                      o
                        °           ¢      °             ¢
            h(x) = f (x) g(b) − g(a) − g(x) f (b) − f (a) .

     Se cumple que h(a) = h(b) = f (a)g(b) − g(a)f (b). Adem´s h es continua en
                                                                  a
[a, b] y derivable en ]a, b[. Por el °
                                     teorema de ¢Rolle existe un punto¢ c ∈ ]a, b[ tal
                                                           °
que h0 (c) = 0, pero h0 (x) = f 0 (x) g(b) − g(a) − g 0 (x) f (b) − f (a) , luego
                           °           ¢         °             ¢
                    f 0 (c) g(b) − g(a) − g 0 (c) f (b) − f (a) = 0



    M´s adelante tendremos ocasi´n de usar este resultado en toda su genera-
      a                         o
lidad, pero de momento nos basta con el caso particular que resulta de tomar
como funci´n g la dada por g(x) = x. Entonces tenemos:
           o

Teorema 3.13 (Teorema del valor medio) Sea f : [a, b] −→ R una funci´n          o
continua en [a, b] y derivable en ]a, b[. Entonces existe un c ∈ ]a, b[ tal que

                             f (b) − f (a) = f 0 (c)(b − a).

  Notar que el teorema de Rolle es un caso particular del teorema del valor
medio. Este teorema tiene una interpretaci´n geom´trica. La expresi´n
                                          o      e                 o

                                      f (b) − f (a)
                                          b−a

puede interpretarse como la “pendiente media” de f en [a, b], es decir, es el
cociente de lo que aumenta f cuando la variable x pasa de a a b dividido entre
lo que ha aumentado la variable. Lo que dice el teorema del valor medio es
que hay un punto en el intervalo donde la funci´n toma el valor medio de su
                                                o
pendiente.
    La importancia de este teorema es que nos relaciona una magnitud global,
la pendiente media, con una magnitud local, la derivada en un punto. Las
consecuencias son muchas. Una aplicaci´n t´
                                      o ıpica es el siguiente refinamiento del
teorema 3.11:

Teorema 3.14 Si f : [a, b] −→ R es continua en [a, b], derivable en ]a, b[ y su
derivada es positiva (negativa) en ]a, b[, entonces f es estrictamente creciente
(decreciente) en [a, b].

                    ´
    Demostracion: El teorema 3.11 nos da que f es estrictamente mon´tona          o
en ]a, b[. S´lo falta probar que es creciente o decreciente en a y en b.
            o
    Si x ∈ ]a, b[, entonces f (x) − f (a) = f 0 (c)(x − a), para cierto punto c ∈ ]a, x[.
Por lo tanto, si f 0 es positiva, f (x) − f (a) > 0 para todo x ∈ ]a, b[, e igualmente
se prueba que f (b) − f (x) > 0 para todo x ∈ ]a, b[, luego f es creciente en [a, b].
112                                Cap´
                                      ıtulo 3. C´lculo diferencial de una variable
                                                a

   Sabemos que las funciones constantes tienen derivada nula. El teorema del
valor medio nos da el rec´
                         ıproco:

Teorema 3.15 Si una funci´n tiene derivada nula en todos los puntos de un
                              o
intervalo abierto, entonces es constante.

                    ´
      Demostracion: Sea f una funci´n derivable en un intervalo A con derivada
                                       o
nula. Sean a < b dos puntos cualesquiera de A. Entonces f (b) − f (a) =
f 0 (c)(b − a) = 0, donde c es un punto de ]a, b[. Por lo tanto f es constante.
   Una consecuencia inmediata es el teorema siguiente, que afirma que una
funci´n derivable est´ un´
     o               a ıvocamente determinada por su derivada y su valor en
un punto cualquiera.

Teorema 3.16 Si f y g son funciones derivables en un intervalo abierto y
f 0 = g 0 , entonces existe un k ∈ R tal que f = g + k.

             ´
   Demostracion: La funci´n f − g tiene derivada nula, luego f − g = k.
                         o

    Las derivadas proporcionan un teorema muy util para el c´lculo de l´
                                                ´             a          ımites.
De momento no podemos estimar su valor porque los l´    ımites de las funciones
que conocemos (polinomios, fracciones algebraicas. etc.) son f´ciles de calcular
                                                              a
directamente, pero m´s adelante tendremos ocasi´n de aprovecharlo.
                     a                          o

Teorema 3.17 (Regla de L’Hˆpital) Sean f , g : ]a, b[ −→ R funciones de-
                                 o
rivables tales que l´ f (x) = l´ g(x) = 0 y de modo que g y g 0 no se anulen
                    ım         ım
                       x→a       x→a
en ]a, b[. Si existe
                                       f 0 (x)
                                    l´
                                     ım        = L,
                                   x→a g 0 (x)

entonces tambi´n existe
              e
                                          f (x)
                                    l´
                                     ım         = L.
                                    x→a   g(x)

                  ´
    Demostracion: Extendamos f y g al intervalo [a, b[ estableciendo que
f (a) = g(a) = 0. As´ siguen siendo continuas.
                     ı
    Si a < x < b, por el teorema de Cauchy existe un punto c ∈ ]a, x[ tal que
                    °              ¢         °           ¢
                      f (x) − f (a) g 0 (c) = g(x) − g(a) f 0 (c),

o sea, f (x)g 0 (c) = g(x)f 0 (c), y como g(x) 6= 0 6= g 0 (c), podemos escribir

                                    f (x)  f 0 (c)
                                          = 0 .                                    (3.2)
                                    g(x)   g (c)

   Por definici´n de l´
              o      ımite, si ≤ > 0, existe un δ > 0 tal que si 0 < c − a < δ,
entonces                        Ø 0          Ø
                                Ø f (c)      Ø
                                Ø            Ø
                                Ø g 0 (c) − LØ < ≤.                       (3.3)
3.3. Propiedades de las funciones derivables                                      113

    As´ tenemos que si 0 < x − a < δ, existe un c ∈ ]a, x[ que cumple (3.2) y
       ı
(3.3). Por consiguiente, para todo x ∈ ]a, a + δ[ se cumple
                                Ø          Ø
                                Ø f (x)    Ø
                                Ø       − LØ < ≤.
                                Ø g(x)     Ø

   Esto significa que
                                           f (x)
                                     l´
                                      ım         = L.
                                     x→a   g(x)


    Obviamente la regla de L’Hˆpital tambi´n es v´lida cuando en las hip´tesis
                                   o            e      a                       o
cambiamos a por b. Combinando las dos versiones obtenemos la regla de
L’Hˆpital para funciones definidas en intervalos ]a − ≤, a + ≤[  {a} y tomando
    o
l´
 ımites en a (si existe el l´
                            ımite del cociente de derivadas, existen los l´
                                                                          ımites por
la derecha y por la izquierda y coinciden, por los casos correspondientes de la
regla, existen los l´
                    ımites de los cocientes de las funciones por ambos lados y
coinciden, luego existe el l´ ımite y coincide con el de las derivadas).
    Los teoremas siguientes demuestran otras variantes de la regla de L’Hˆpital
                                                                              o
de no menor inter´s.
                   e

Teorema 3.18 (Regla de L’Hˆpital) Sean f , g : ]a, +∞[ −→ R dos funcio-
                                o
nes derivables tales que l´           ım g(x) = 0 y de modo que g y g 0 no
                          ım f (x) = l´
                          x→+∞                  x→+∞
se anulan en ]a, +∞[. Si existe

                                        f 0 (x)
                                     l´
                                      ım        = L,
                                   x→+∞ g 0 (x)


entonces tambi´n existe
              e
                                        f (x)
                                     l´
                                      ım      = L.
                                   x→+∞ g(x)


                ´
   Demostracion: Consideremos las funciones F (x) = f (1/x) y G(x) =
g(1/x), definidas en ]0, 1/a[. Claramente F y G son continuas, y l´ F (x) =
                                                                 ım
                                                                            x→0
l´ G(x) = 0. Adem´s por la regla de la cadena son funciones derivables y sus
 ım              a
x→0
derivadas son
                                  f 0 (1/x)                   g 0 (1/x)
                    F 0 (x) = −             ,    G0 (x) = −             .
                                       x2                          x2
   Tambi´n es claro que ni G ni G0 se anulan en su dominio y
        e

                                   F 0 (x)  f 0 (1/x)
                                     0 (x)
                                           = 0        ,
                                   G        g (1/x)

luego existe
                                        F 0 (x)
                                    l´
                                     ım         = L.
                                    x→0 G0 (x)
114                               Cap´
                                     ıtulo 3. C´lculo diferencial de una variable
                                               a

El caso ya probado de la regla de L’Hˆpital nos da ahora que tambi´n existe
                                     o                            e
                                         F (x)
                                  l´
                                   ım          = L.
                                  x→0    G(x)
Obviamente entonces
                                          f (x)
                                   l´
                                    ım          = L.
                                 x→+∞     g(x)


    Igualmente se prueba la regla de L’Hˆpital para funciones definidas en in-
                                          o
tervalos ]− nf ty, b[ y cuando x tiende a −∞.
    As´ pues, si tenemos una indeterminaci´n de tipo 0/0 y al derivar nume-
       ı                                    o
rador y denominador podemos calcular el l´  ımite, la funci´n original tiene ese
                                                           o
mismo l´ ımite. Ahora veremos que la regla de L’Hˆpital es aplicable tambi´n a
                                                  o                         e
indeterminaciones del tipo ∞/∞.

Teorema 3.19 (Regla de L’Hˆpital) Sean f , g : ]a, +∞[ −→ R dos funcio-
                                o
nes derivables tales que l´           ım g(x) = ∞ y de modo que g y g 0 no
                          ım f (x) = l´
                          x→+∞            x→+∞
se anulan en ]a, +∞[. Si existe

                                      f 0 (x)
                                  l´
                                   ım         = L,
                                 x→+∞ g 0 (x)

entonces tambi´n existe
              e
                                          f (x)
                                   l´
                                    ım          = L.
                                 x→+∞     g(x)
                ´
   Demostracion: Por definici´n de l´
                             o       ımite, dado ≤ > 0, existe un M > a tal
que si x > M entonces     Ø 0          Ø
                          Ø f (x)      Ø
                          Ø            Ø
                          Ø g 0 (x) − LØ < ≤.

   Por el teorema de Cauchy, si x > M , existe un y ∈ ]M, x[ de modo que

                            f (x) − f (M )  f 0 (y)
                                           = 0      ,
                            g(x) − g(M )    g (y)
luego                       Ø                   Ø
                            Ø f (x) − f (M )    Ø
                            Ø                − LØ < ≤.
                            Ø g(x) − g(M )      Ø

(Notar que, como g 0 no se anula, la funci´n g es mon´tona, luego el denominador
                                          o          o
es no nulo).
    Puesto que l´ım f (x) = ∞, existe un N > M tal que si x > N entonces
               x→+∞
|f (x)| > |f (M )|, y en particular f (x) − f (M ) 6= 0. Por ello, para x > N
podemos escribir
               f (x)   f (x) − f (M )    f (x)     g(x) − g(M )
                     =                                          .
               g(x)    g(x) − g(M ) f (x) − f (M )     g(x)
3.4. La diferencial de una funci´n
                                o                                           115

    Si en los dos ultimos factores dividimos numerador y denominador entre f (x)
                  ´
y g(x) respectivamente, queda claro que tienden a 1 cuando x → +∞, luego
tomando N suficientemente grande podemos suponer que si x > N entonces el
producto de ambos dista de 1 menos de ≤. De este modo, para x suficientemente
grande, el cociente f (x)/g(x) se puede expresar como producto de dos n´meros
                                                                        u
reales, uno arbitrariamente pr´ximo a L y otro arbitrariamente pr´ximo a 1.
                                 o                                  o
De la continuidad del producto se sigue que

                                        f (x)
                                l´
                                 ım           = L.
                               x→+∞     g(x)


   Naturalmente la regla de L’Hˆpital tambi´n es v´lida en el caso ∞/∞ cuando
                               o           e      a
x → −∞. El mismo argumento que nos ha permitido pasar del caso finito al
caso infinito en la indeterminaci´n 0/0 nos permite pasar ahora al caso finito.
                                o
Es f´cil probar:
    a

Teorema 3.20 (Regla de L’Hˆpital) Sean f , g : ]a, b[ −→ R derivables tales
                             o
que l´ f (x) = l´ g(x) = ∞ y de modo que g y g 0 no se anulan en ]a, b[. Si
      ım        ım
     x→a       x→a
existe
                                f 0 (x)
                            l´
                             ım 0       = L,
                            x→a g (x)

entonces tambi´n existe
              e
                                       f (x)
                                l´
                                 ım          = L.
                                x→a    g(x)

    Tambi´n se cumple la versi´n correspondiente cuando x tiende a b y cuando
          e                   o
x tiende a un punto por la izquierda y la derecha a la vez.


3.4     La diferencial de una funci´n
                                   o
    Consideremos una funci´n f : A −→ R derivable en un punto a ∈ A. Sea
                            o
∆x un n´mero pr´ximo a 0 de modo que a + ∆x ∈ A (el t´rmino ∆x se lee
         u        o                                       e
“incremento de x”, porque representa un peque˜o aumento de la variable x
                                               n
en el punto a). Al calcular f en el punto a + ∆x obtenemos una variaci´n o
                                                                      o
incremento de f dado por ∆a (f ) = f (a + ∆x) − f (a). La expresi´n ∆a (f )
                                                                  o
representa a una funci´n de la variable ∆x, definida en un entorno de 0. La
                       o
derivada de f en a es, por definici´n,
                                  o

                                              ∆a (f )
                             f 0 (a) = l´
                                        ım            .
                                       ∆x→0    ∆x
   Llamemos
                                       ∆a (f )
                           ≤a (∆x) =           − f 0 (a).
                                        ∆x
As´ l´ ≤a (∆x) = 0.
  ı, ım
    ∆x→0
116                              Cap´
                                    ıtulo 3. C´lculo diferencial de una variable
                                              a

   Desarrollando las definiciones tenemos que

               ∆a (f ) = f (a + ∆x) − f (a) = f 0 (a)∆x + ≤(∆x)∆x.

La figura muestra la situaci´n:
                           o


                                                            ≤a (∆x)∆x
                   f 0 (a)∆x
                                                            ∆a (f )
                                               ∆x


                      f

                                    a                    a + ∆x

    El hecho de que ≤a (∆x) tienda a 0 expresa simplemente el hecho de que,
para valores peque˜os de ∆x, se cumple f (a + ∆x) − f (a) ≈ f 0 (a)∆x, donde el
                   n
signo ≈ significa “aproximadamente igual”, es decir, que el valor de la funci´n  o
f (a + ∆x) es similar al de la recta tangente f (a) + f 0 (a)∆x. En la figura ambos
valores son muy diferentes porque hemos tomado un ∆x grande para mayor
claridad.
    Llamaremos diferencial de f en el punto a a la aplicaci´n df (a) : R −→ R
                                                           o
dada por df (a)(∆x) = f 0 (a)∆x. As´ df (a) es una aplicaci´n lineal en R de
                                      ı                      o
modo que f (a + ∆x) − f (a) ≈ df (a)(∆x), o sea, la funci´n df (a) aproxima las
                                                         o
diferencias entre las im´genes de f en puntos cercanos al punto a y la imagen
                        a
de a. De aqu´ su nombre.
              ı
     Si consideramos la funci´n polin´mica x, su derivada es 1, luego la diferencial
                             o       o
de x es simplemente dx(a)(∆x) = ∆x. Por ello podemos escribir df (a)(∆x) =
f 0 (a) dx(a)(∆x), luego tenemos la igualdad funcional

                               df (a) = f 0 (a) dx(a).

Si la funci´n f es derivable en todo punto de A, la igualdad anterior se cumple
           o
en todo punto, luego si consideramos a df y dx como aplicaciones de A en el
espacio de aplicaciones lineales de R en R, tenemos la igualdad funcional

                                    df = f 0 dx,

donde dx es la funci´n constante que a cada a ∈ A le asigna la funci´n identidad
                    o                                               o
en R.
    Del mismo modo que la estructura topol´gica permite hablar de los puntos
                                            o
de alrededor de un punto dado, pese a que ning´n punto en particular est´
                                                  u                            a
alrededor de otro, as´ mismo la diferencial de una funci´n recoge el concepto
                      ı                                   o
de “incremento infinitesimal” de una funci´n, pese a que ning´n incremento
                                            o                     u
en particular es infinitamente peque˜o. Por ejemplo, la igualdad dx2 = 2x dx
                                     n
3.4. La diferencial de una funci´n
                                o                                              117

expresa que cuando la variable x experimenta un incremento infinitesimal dx,
la funci´n x2 experimenta un incremento infinitesimal de 2x dx. Con rigor, dx2
        o
no es un incremento infinitesimal, sino la funci´n que a cada incremento ∆x
                                                 o
le asigna una aproximaci´n al incremento correspondiente de x2 , de modo que
                         o
lo que propiamente tenemos es la aproximaci´n que resulta de evaluar dx en
                                               o
incrementos concretos, es decir, ∆x (x2 ) ≈ 2x∆x. El error de esta aproximaci´n
                                                                             o
se puede hacer arbitrariamente peque˜o tomando ∆x suficientemente peque˜o.
                                      n                                     n
    Por ejemplo, (1,1)2 ≈ 12 + dx2 (1)(0,1) = 1 + 2 · 0, 1 = 1,2. En realidad
(1,1)2 = 1,21, luego el error cometido es de una cent´sima.
                                                     e
     Dada la igualdad df = f 0 dx, representaremos tambi´n la derivada de f
                                                               e
mediante la notaci´n o
                                              df
                                    f 0 (x) =    ,
                                              dx
que expresa que f 0 (x) es la proporci´n entre las funciones df y dx, o tambi´n que
                                      o                                      e
f 0 (x) es la raz´n entre un incremento infinitesimal de f respecto al incremento
                 o
infinitesimal de x que lo ocasiona.
    Es costumbre, especialmente en f´ ısica, nombrar las funciones, no por la ex-
presi´n que las determina, sino por la magnitud que determinan. Por ejemplo,
     o
supongamos que la posici´n e de un objeto depende del tiempo viene dada por
                          o
la relaci´n e(t) = t2 Entonces la velocidad del m´vil es
         o                                       o
                                          de
                                 v(t) =      = 2t,
                                          dt
lo que nos permite expresar t en funci´n de v, mediante t(v) = v/2. A su vez,
                                      o
esto nos permite calcular la posici´n en funci´n de la velocidad, mediante la
                                   o          o
funci´n e(v) = v 2 /4.
     o
    De este modo, llamamos e tanto a la funci´n e(t) como a la funci´n e(v),
                                                o                        o
que son funciones distintas. La letra v representa a una funci´n en v = 2t y a
                                                               o
una variable en t = v/2. Estos convenios no provocan ninguna ambig¨edad, al
                                                                       u
contrario, en muchos casos resultan m´s claros y permiten expresar los resul-
                                        a
tados de forma m´s elegante. Por ejemplo, si tenemos dos funciones y = y(x)
                   a
y z = z(y), entonces la funci´n compuesta se expresa, en estos t´rminos, como
                             o                                    e
z = z(x). Si las funciones son derivables en sus dominios, la regla de la cadena
se convierte en
                                  dz    dz dy
                                     =        .
                                  dx    dy dx
   La primera derivada es la de la funci´n compuesta z(x), mientras que la
                                            o
segunda es la de z(y). No es necesario indicar que dicha derivada ha de calcularse
en y(x), pues esto ya est´ impl´
                         a      ıcito en el hecho de que se trata de una funci´n
                                                                               o
de y (no de x). Por ejemplo,
                          de   de dv  v
                             =       = · 2 = v = 2t,
                          dt   dv dt  2
como cab´ esperar.
        ıa
118                               Cap´
                                     ıtulo 3. C´lculo diferencial de una variable
                                               a

   Similarmente, si y(x) es una funci´n inyectiva y derivable con derivada no
                                      o
nula, su inversa se representa por x(y), y el teorema de la funci´n inversa se
                                                                 o
expresa as´ı:
                                   dy    1
                                      = dx .
                                   dx    dy

   Por ejemplo,
                                dv   1     1
                                   = dt =     = 2.
                                dt   dv
                                          1/2
   Vemos, pues, que en estos t´rminos las propiedades de las derivadas son
                                e
formalmente an´logas a las de las fracciones.
              a


3.5      El teorema de Taylor
    Sea f : A −→ R una funci´n derivable en el abierto A y tal que f 0 : A −→ R
                              o
tambi´n sea derivable en A. Entonces a la derivada de f 0 se la denomina derivada
      e
segunda de f en A, y se representa por f 00 .
    A su vez la derivada segunda puede ser derivable, y entonces est´ definida la
                                                                     a
derivada tercera, y as´ sucesivamente. Si una funci´n admite n derivadas en A,
                      ı                              o
a la derivada n-sima se la representa por f n) : A −→ R.
    Conviene usar la notaci´n f 0) para referirse a la propia funci´n f .
                            o                                      o
    Llamaremos C n (A) al conjunto de las funciones definidas en A que admiten n
derivadas y todas ellas son continuas en A. Si llamamos C 0 (A) = C(A), es decir,
al conjunto de las funciones continuas en A, entonces tenemos

                C 0 (A) ⊃ C 1 (A) ⊃ C 2 (A) ⊃ C 3 (A) ⊃ C 4 (A) ⊃ · · ·

    Llamaremos C ∞ (A) al conjunto de las funciones infinitamente derivables
en A. Por ejemplo, los polinomios y las fracciones algebraicas son de clase C ∞
en su dominio. Es inmediato que estos conjuntos son todos sub´lgebras de C(A).
                                                               a
    Las inclusiones son todas estrictas. Por ejemplo, si a ∈ A es f´cil ver que la
                                                                   a
funci´n dada por
     o                         Ω
                                    (x − a)n+1 si x ≥ a
                       f (x) =
                                 −(x − a)n+1 si x ≤ a
es una funci´n de clase C n (A) pero no de clase C n+1 (A).
            o
    Seg´n sabemos, si una funci´n f es derivable en un punto a, entonces alre-
       u                          o
dedor de a la funci´n f puede ser aproximada por su recta tangente, esto es,
                    o
por el polinomio f (a) + f 0 (a)(x − a). La recta tangente es el unico polinomio
                                                                  ´
P (x) de grado 1 que cumple P (a) = f (a) y P 0 (a) = f 0 (a).
    Cabe suponer que si una funci´n f admite dos derivadas y tomamos un
                                      o
polinomio P de grado 2 tal que P (a) = f (a), P 0 (a) = f 0 (a) y P 00 (a) = f 00 (a),
el polinomio P nos dar´ una aproximaci´n mejor de la funci´n f que la recta
                        a                  o                    o
tangente. Esto no siempre es as´ pero hay bastante de verdad en ello. Vamos
                                   ı,
a investigarlo.
3.5. El teorema de Taylor                                                              119

   Ante todo, si K es un cuerpo y a ∈ K, la aplicaci´n u : K[x] −→ K[x] dada
                                                          o
por u(p) = p(x − a) es un isomorfismo de K-espacios vectoriales. Como los
polinomios 1, x, x2 , x3 , . . . son una K-base de K[x], resulta que los polinomios

                1,   (x − a),    (x − a)2 ,        (x − a)3 ,     (x − a)4 , . . .

son tambi´n una K-base, es decir, que todo polinomio de K[x] se expresa de
         e
forma unica como
      ´

             P (x) = c0 + c1 (x − a) + c2 (x − a)2 + · · · + cn (x − a)n ,            (3.4)

para cierto natural n y ciertos coeficientes co , . . . , cn ∈ K.
   Si una funci´n f admite n derivadas en un punto a, las ecuaciones
               o

              f (a) = P (a),    f 0 (a) = P 0 (a),     ...      f n) (a) = P n) (a)

son satisfechas por un unico polinomio de grado ≤ n. En efecto, si P (x) viene
                       ´
dado por (3.4), entonces P (a) = c0 , luego ha de ser c0 = f (a). Derivando
obtenemos
                 P 0 (x) = c1 + 2c2 (x − a) + · · · + ncn (x − a)n−1 ,

de donde P 0 (a) = c1 , y ha de ser c1 = f 0 (a). Similarmente, P 00 (a) = 2c2 , luego
c2 = f 00 (a)/2. Igualmente se obtiene c3 = f 000 (a)/6 y, en general, ck = f k) (a)/k!.
En resumen:
                                       n
                                      X f k)
                             P (x) =           (x − a)k .
                                          k!
                                         k=0


    Rec´ ıprocamente, es f´cil ver que el polinomio P (x) as´ definido cumple que
                           a                                ı
P k) (a) = f k) (a) para k = 0, . . . , n.


Definici´n 3.21 Sea f una funci´n derivable n veces en un punto a. Llamare-
        o                       o
mos polinomio de Taylor de grado n de f en a al polinomio

                                       n
                                       X f k)
                        Pn (f )(x) =               (x − a)k ∈ R[x].
                                              k!
                                       k=0


    El polinomio de Taylor es el unico polinomio P de grado menor o igual
                                    ´
que n que cumple P k) (a) = f k) (a) para k = 0, . . . , n. En particular si f es un
polinomio de grado menor o igual que n se ha de cumplir Pn (f ) = f .
    Notar tambi´n que P0 (f ) = f (a), y que P1 (f ) = f (a) + f 0 (a)(x − a) es la
               e
recta tangente a f en a. Nuestra conjetura es que Pn (f ) es el polinomio de
grado menor o igual que n que m´s se parece a f alrededor de a.
                                   a
120                                           Cap´
                                                 ıtulo 3. C´lculo diferencial de una variable
                                                           a

Ejemplo Consideremos la funci´n f (x) = x1/2 y a = 1. Calculemos sus
                             o
derivadas:
                 Orden      Derivada         en 1
                   0                x1/2        1
                                                           1 −1/2                         1
                                  1                        2x                             2

                                  2                 − 1 1 x−3/2
                                                      2 2                        −1
                                                                                  2
                                                                                          1
                                                                                          2
                                                     1 1 3 −5/2                  1 1 3
                                  3                  2 2 2x                      2 2 2

                                  4           −1
                                               2
                                                     1 3 5 −7/2
                                                     2 2 2x               −1
                                                                           2
                                                                                 1 3 5
                                                                                 2 2 2

   En general se prueba que las derivadas en 1 van alternando el signo, en el
numerador tienen el producto de los primeros impares y en el denominador las
sucesivas potencias de 2. Con esto podemos calcular cualquier polinomio de
Taylor en 1:

                 P0 (f )(x) = 1,
                                 1
                 P1 (f )(x) = 1 + (x − 1),
                                 2
                                 1                                1
                 P2 (f )(x) = 1 + (x − 1) −                         (x − 1)2 ,
                                 2                                8
                                 1                                1            1
                 P3 (f )(x) = 1 + (x − 1) −                         (x − 1)2 + (x − 1)3 .
                                 2                                8            16
   Aqu´ est´n sus gr´ficas junto a la de la funci´n. Vemos que el intervalo en
        ı   a       a                           o
que se confunden con la gr´fica de f es cada vez mayor.
                          a
         2                                                        2

      1.75                                                     1.75

       1.5                                                      1.5

      1.25                                                     1.25

        1                                                        1

      0.75                                                     0.75

       0.5                                                      0.5

      0.25                                                     0.25

             0   0.5    1   1.5       2       2.5      3          0       0.5     1           1.5    2       2.5    3

         2                                                            2

      1.75                                                      1.75

       1.5                                                       1.5

      1.25                                                      1.25

         1                                                           1

      0.75                                                      0.75

       0.5                                                       0.5

      0.25                                                      0.25

             0    0.5   1   1.5           2    2.5         3          0    0.5        1        1.5       2    2.5       3



   El polinomio de grado 8 es bastante representativo de lo que sucede cuando
n es grande:
3.5. El teorema de Taylor                                                       121
                            2

                         1.75

                          1.5

                         1.25

                           1

                         0.75

                          0.5

                         0.25

                            0   0.5    1     1.5   2      2.5   3



   Vemos que la aproximaci´n es cada vez mejor en el intervalo [0, 2], pero a
                                o
partir del 2 el polinomio se aleja bruscamente. Un ejemplo num´rico:
                                                                e
                                                 p
       P8 (f )(1, 5) = 1, 224729895, mientras que 1, 5 = 1, 224744871. . .

La aproximaci´n tiene 5 cifras exactas.
             o

    Los polinomios de Taylor plantean varios problemas importantes. La cues-
ti´n principal es si el error producido al aproximar una funci´n de clase C ∞ por
  o                                                           o
sus polinomios de Taylor puede reducirse arbitrariamente aumentando suficien-
temente el grado.

Definici´n 3.22 Si f es una funci´n de clase C ∞ en un entorno de un punto
         o                         o
a, llamaremos serie de Taylor de f en a a la serie funcional
                                ∞
                                X f k) (a)
                                             (x − a)k .
                                       k!
                                k=0

   La cuesti´n es si la serie de Taylor de f converge a f . El ejemplo anterior
             o         √
sugiere que la serie de x en 1 converge a la funci´n en el intervalo ]0, 2[, pero no
                                                  o
parece converger m´s all´ de 2. Tambi´n hemos de tener presente la posibilidad
                     a   a             e
de que la serie de Taylor de una funci´n f converja a una funci´n distinta de f .
                                      o                          o
Para estudiar estos problemas introducimos el concepto de resto de Taylor:

    Sea f una funci´n derivable n veces en un punto a. Llamaremos resto de
                     o
Taylor de grado n de f en a, a la funci´n Rn (f )(x) = f (x) − Pn (f )(x), donde
                                         o
Pn (f ) es el polinomio de Taylor de grado n de f en a.

   Nuestro problema es determinar el comportamiento del resto de una funci´n.
                                                                            o
Para ello contamos con el siguiente teorema, que es una generalizaci´n del teo-
                                                                    o
rema del valor medio.

Teorema 3.23 (Teorema de Taylor) Sea f : A −→ R una funci´n derivable
                                                                  o
n + 1 veces en un intervalo abierto A y a ∈ A. Entonces para cada x ∈ A existe
un λ ∈ ]0, 1[ tal que si c = λa + (1 − λ)x, se cumple

                                       f n+1) (c)
                        Rn (f )(x) =              (x − a)n+1 .
                                       (n + 1)!
122                                Cap´
                                      ıtulo 3. C´lculo diferencial de una variable
                                                a

                  ´
   Demostracion: Para x = a es evidente, pues se cumple Pn (f )(a) = f (a)
y Rn (f )(x) = 0. Supongamos que x 6= a. Sea
                                           1
                             Q(x) =              Rn (f )(x).
                                      (x − a)n+1
Sea F : A −→ R dada por
                  ≥       x−t 0       (x − t)2 00             (x − t)n n)
  F (t) = f (x) − f (t) +     f (t) +         f (t) + · · · +         f (t)
                           1!
                           ¥             2!                      n!
           +(x − t)n+1 Q(x) .

   La funci´n f y sus n primeras derivadas son continuas y derivables, luego F
           o
tambi´n es continua y derivable en A. Adem´s F (x) = f (x) − f (x) = 0 y
     e                                       a
                 °                    n+1
                                               ¢
  F (a) = f (a) − Pn (f )(a) + (x − a)    Q(x) = Rn (f )(x) − Rn (f )(x) = 0.
    Por el teorema de Rolle existe un punto entre a y x, o sea, de la forma
c = λa + (1 − λ)x, tal que F 0 (c) = 0. Calculemos en general F 0 (t):
                  ≥                 x − t 00      2(x − t) 00       (x − t)2 000
 F 0 (t) = 0 − f 0 (t) − f 0 (t) +        f (t) −          f (t) +          f (t)
                                      1!              2!               2!
                n(x − t)n−1 n)         (x − t)n n+1)                             ¥
         ··· −             f (t) +              f     (t) − (n + 1)(x − t)n Q(x) .
                    n!                    n!
    Los t´rminos consecutivos se cancelan entre s´ y queda
         e                                         ı,
                             (x − t)n n+1)
               F 0 (t) = −           f     (t) + (n + 1)(x − t)n Q(x).
                                n!
Como F 0 (c) = 0, evaluando en c queda
                                            f n+1) (c)
                                   Q(x) =              ,
                                            (n + 1)!
y por definici´n de Q:
             o
                                        f n+1) (c)
                        Rn (f )(x) =               (x − a)n+1 .
                                        (n + 1)!


    As´ pues, la diferencia entre Pn (f )(x) y f (x) tiene la forma de un monomio
      ı
m´s del polinomio de Taylor salvo por el hecho de que la derivada (n + 1)-´sima
  a                                                                         e
no se eval´a en el punto a, sino en un punto intermedio entre a y x.
          u
    Por ejemplo, si las derivadas de f est´n uniformemente acotadas en un in-
                                              a
tervalo A, es decir, si existe una misma constante K tal que |f n) (x)| ≤ K para
todo natural n y para todo x ∈ A, entonces
                                  Ø n+1)                Ø
                                  Øf     (c)            Ø K|x − a|n+1
                                  Ø
           |f (x) − Pn (f )(x)| = Ø          (x − a)n+1 Ø
                                    (n + 1)!            Ø ≤ (n + 1)! .

   En el ejemplo de la p´gina 56 probamos que la sucesi´n M n /n! converge a 0,
                          a                            o
luego la sucesi´n {Pn (f )(x)}∞ tiende a f (x). As´ pues:
               o              n=0                 ı
3.6. Series de potencias                                                           123

Teorema 3.24 Si A es un intervalo abierto, a ∈ A, f ∈ C ∞ (A) y las derivadas
de f est´n uniformemente acotadas en A, entonces para cada punto x ∈ A se
        a
cumple
                                ∞
                               X f n) (a)
                       f (x) =            (x − a)n .
                               n=0
                                     n!
                                       √
    Este teorema no es aplicable a x. En muchos casos, entre ellos el de
esta funci´n, los problemas de convergencia de las series de Taylor se vuelven
           o
evidentes en el contexto de la teor´ de funciones de variable compleja (ver el
                                    ıa
cap´ıtulo XII). Los resultados de la secci´n siguiente resultan de gran ayuda en
                                          o
muchos casos, como tendremos ocasi´n de comprobar m´s adelante.
                                      o                    a


3.6      Series de potencias
Definici´n 3.25 Sea a ∈ C y {an }∞ una sucesi´n en C. La serie de potencias
        o                        n=0             o
de coeficientes {an }∞ y centro a es la serie funcional
                    n=0

                                   ∞
                                   X
                                         an (z − a)n .
                                   n=0

    Las series de Taylor son, pues, series de potencias. En muchos casos es
f´cil determinar en qu´ puntos converge una serie de potencias. Para verlo
 a                      e
necesitamos el concepto de l´
                            ımite superior de una sucesi´n de n´meros reales.
                                                        o      u
Se trata de lo siguiente:
    Sea {an }∞ una sucesi´n de n´meros reales. Su l´
             n=0         o      u                  ımite superior es el supremo
(en R) del conjunto de sus puntos adherentes. Lo representaremos mediante
l´ an .
 ım
 n

     Se cumple que
                              l´ an = ´ sup an .
                               ım     ınf
                               n            k≥0 n≥k

   En efecto, sea p un punto adherente de {an }∞ . Dados ≤ > 0 y k ≥ 0, existe
                                                n=0
un n ≥ k tal que an ∈ ]p − ≤, p + ≤[, luego p − ≤ ≤ sup an . Esto vale para todo
                                                             n≥k
≤ > 0, luego p ≤ sup an para todo k ≥ 0, luego p ≤ ´ sup an . Como el l´
                                                   ınf                 ımite
                  n≥k                                         k≥0 n≥k
superior es el supremo de estos p, tenemos que l´ an ≤ ´ sup an .
                                                ım     ınf
                                                         n         k≥0 n≥k

     Sea L = ´ sup an . Dado ≤ > 0, existe un k ≥ 0 tal que L ≤ sup an ≤ L + ≤.
             ınf
             k≥0 n≥k                                                         n≥k
     Si L = sup an , entonces existe un n ≥ k tal que L − ≤ < an ≤ L. Si por el
            n≥k
contrario L < sup an < L + ≤, entonces existe un n ≥ k tal que L ≤ an < L + ≤.
               n≥k
   En cualquier caso existe un n ≥ k tal que an ∈ ]L − ≤, L + ≤[. Esto significa
que L es un punto adherente de la sucesi´n, luego L ≤ l´ an y tenemos la
                                          o                ım
                                                            n
igualdad.
124                              Cap´
                                    ıtulo 3. C´lculo diferencial de una variable
                                              a

   Por la propia definici´n es claro que si una sucesi´n converge en R entonces
                        o                            o
su l´
    ımite, que es su unico punto adherente, coincide con su l´
                     ´                                          ımite superior.
Ahora podemos probar:

                     P
                     ∞                                                        p
Teorema 3.26 Sea           an (z−a)n una serie de potencias, sea R = 1/ l´
                                                                         ım   n
                                                                                |an |
                     n=0                                                n
(entendiendo que 1/0 = +∞ y 1/(+∞) = 0). Entonces la serie converge abso-
luta y uniformemente en todo compacto contenido en BR (a) y diverge en todo
punto de C  B R (a) (las bolas se toman respecto a la norma eucl´
                                                                 ıdea. Conveni-
mos que B+∞ (a) = C). En particular la serie converge absoluta y puntualmente
en BR (a) a una funci´n continua.
                       o

                 ´
   Demostracion: Sea K un compacto en BR (a). Veamos que la serie con-
verge absoluta y uniformemente en K. La funci´n |x − a| es continua en K,
                                                   o
luego alcanza su m´ximo r en un punto x ∈ K, es decir, |x − a| = r y para todo
                   a
y ∈ K se cumple |y − a| ≤ r. As´ K ⊂ B r (a).
                               ı                     p
   Como x ∈ BR (a) ha de ser r < R, luego r l´ n |an | < 1. Tomemos ρ tal
                                                ım
          p                         p            n     p
que r l´ n |an | < ρ < 1. Como l´ n |an | = ´ sup n |an |, existe un natural
       ım                        ım           ınf
        n                         n           k≥0 n≥k
               p                                        p
k tal que sup |an | < ρ/r, luego si n ≥ k se cumple n |an | < ρ/r y por lo
               n

          n≥k
tanto |an |rn < ρn .
     Si y ∈ K entonces |y − a| ≤ r, luego |y − a|n ≤ rn , luego |an (y − a)n | ≤
                                  P
                                  ∞                                      P n
                                                                         ∞
|an |rn < ρn . As´ pues, la serie
                 ı                  an (y − a)n est´ mayorada en K por
                                                   a                         ρ ,
                                 n=k                                        n=k
que es convergente por ser geom´trica de raz´n menor que 1. El criterio de
                                   e           o
Weierstrass nos da que la serie de potencias converge absoluta y uniformemente
a una funci´n continua en K. Todo punto de BR (a) tiene un entorno compacto
           o
contenido en BR (a) (una bola cerrada de radio adecuado), luego la suma es
continua en BR (a).
   Ahora veamos que la serie diverge en CB R (a). Sea x ∈ C tal que |x−a| > R.
                           p
Entonces 1 < |x − a| l´ n |an |. Por lo tanto, para todo natural k se cumple
                       ım
                p       n                              p
1/|x − a| < sup n |an |, luego existe un n ≥ k tal que n |an ||x − a| > 1, o sea,
            n≥k
|an (y − a)n | > 1. Esto significa que an (y − a)n no tiende a 0, luego la serie
diverge.

    El n´mero R se llama radio de convergencia de la serie de potencias. La bola
        u
BR (a) se llama disco de convergencia. Tenemos, pues que una serie de potencias
converge absolutamente en su disco de convergencia y diverge en los puntos
exteriores a ´l (los puntos interiores de su complementario). En cada punto de
             e
la frontera del disco la serie puede converger absolutamente, condicionalmente
o diverger, seg´n los casos.
                u

    A la hora de determinar el radio de convergencia de una serie suele ser util
                                                                            ´
el teorema siguiente:
3.6. Series de potencias                                                       125

                      P
                      ∞
Teorema 3.27 Sea           an (z − a)n una serie de potencias tal que exista
                     n=0

                                          |an+1 |
                                    l´
                                     ım           = L.
                                     n     |an |

Entonces su radio de convergencia es 1/L.

                  ´
    Demostracion: Por el teorema anterior, el radio de convergencia de la
                                          P
                                          ∞
serie dada es el mismo que el de la serie   |an |z n . Si x > 0, tenemos que
                                                n=0


                                     |an+1 |xn+1
                               l´
                                ım               = Lx,
                                n      |an |xn

luego el criterio de D’Alembert implica que la serie converge cuando Lx < 1 y
diverge si LX > 1. Consecuentemente el radio de convergencia ha de ser 1/L.


   Las series de potencias se pueden derivar t´rmino a t´rmino. Conviene pro-
                                              e         e
bar un resultado un poco m´s general:
                            a

Teorema 3.28 Sea {fn }∞ una sucesi´n de funciones fn : ]a, b[ −→ R que
                            n=1            o
converge uniformemente a una funci´n f . Supongamos que todas ellas son de-
                                       o
rivables en ]a, b[ y que la sucesi´n de derivadas converge uniformemente a una
                                  o
funci´n g. Entonces f es derivable y g = f 0 .
     o

             ´
   Demostracion: Fijemos un punto x ∈ ]a, b[ y consideremos las funciones
                                     Ω fn (x)−fn (y)
                                                         si y 6= x
                        Fn (y) =          0
                                             x−y
                                         fn (x)          si y = x

Similarmente definimos F : ]a, b[ −→ R mediante
                                     Ω f (x)−f (y)
                                                       si y 6= x
                           F (y) =          x−y
                                         g(x)          si y = x

    El hecho de que fn sea derivable en x implica que Fn es continua en ]a, b[.
Basta probar que para todo ≤ > 0 existe un n´mero natural n0 tal que si m, n ≥
                                               u
n0 e y ∈ ]a, b[ entonces |Fm (y)−Fn (y)| < ≤. En efecto, esto significa que {Fn }∞
                                                                                n=1
es (uniformemente) de Cauchy, luego seg´n el teorema 2.54 la sucesi´n ha de
                                             u                            o
converger uniformemente a alguna funci´n continua, pero dado que converge
                                            o
puntualmente a F , de hecho converger´ uniformemente a F . Tenemos, pues,
                                          a
que F es continua y a su vez esto implica que f es derivable en x y f 0 (x) = g(x).
    Existe un n´mero natural n0 tal que si m, n > n0 entonces
                 u

                     0        0            ≤
                   |fn (u) − fm (u)| <          para todo u ∈ ]a, b[ .
                                           2
126                                Cap´
                                      ıtulo 3. C´lculo diferencial de una variable
                                                a

   Entonces, dados y ∈ ]a, b[ y m, n ≥ n0 , si y 6= x se cumple
                               Ø                                   Ø
                               Ø fn (x) − fn (y) fm (x) − fm (y) Ø
       |Fn (y) − Fm (y)| = Ø   Ø                 −                 Ø
                                      x−y               x−y        Ø
                               Ø       Ø
                               Ø 1 Ø
                         ≤ Ø           Ø
                               Ø x − y Ø |fn (x) − fm (x) − fn (y) + fm (y)|

    Aplicamos el teorema del valor medio a la funci´n fn − fm en el intervalo
                                                      o
[y, x] (suponemos, por ejemplo, y < x). Entonces existe un u ∈ ]a, b[ tal que
                                              ° 0        0
                                                              ¢
           fn (x) − fm (x) − fn (y) + fm (y) = fn (u) − fm (u) (x − y).

As´ pues,
  ı
                                Ø      Ø
                                Ø 1 Ø 0
                                Ø
            |Fn (y) − Fm (y)| ≤ Ø      Ø |fn (u) − fm (u)| |x − y| < ≤ .
                                                    0
                                  x − yØ                             2
As´ mismo, si y = x tenemos
  ı
                                        0        0          ≤
                  |Fn (x) − Fm (x)| = |fn (x) − fm (x)| <     < ≤.
                                                            2


   Como consecuencia tenemos:
                       P
                       ∞
Teorema 3.29 Sea             an (x − a)n una serie de potencias con centro y coe-
                       n=0
                                                                 P
                                                                 ∞
ficientes reales. Supongamos que tanto ella como la serie              nan (x − a)n−1
                                                                n=1
convergen en un intervalo ]a − ≤, a + ≤[. Entonces la segunda serie es la deri-
vada de la primera.

   Llamemos f (x) a la funci´n definida sobre ]a − ≤, a + ≤[ por la serie dada y
                             o
g(x) a la funci´n definida por la segunda serie. Hemos de probar que f 0 (x) =
               o
g(x) para todo x en el intervalo.
                 Pn
   Sea fn (x) =     an (x − a)n . Se trata de una sucesi´n de polinomios cuyas
                                                        o
                 k=0
            0
derivadas fn (x) son las sumas parciales de la segunda serie. Dado un punto
x ∈ ]a − ≤, a + ≤[, tomamos un intervalo cerrado [x − δ, x + δ] ⊂ ]a − ≤, a + ≤[.
                                                                0
Por el teorema 3.26, en este intervalo las sucesiones fn (x) y fn (x) convergen
absoluta y uniformemente a f y g respectivamente.
    El lector puede demostrar que, en realidad, las dos series del teorema anterior
tienen el mismo radio de convergencia, con lo que la hip´tesis sobre la conver-
                                                            o
gencia de la segunda es redundante. En la pr´ctica no necesitaremos este hecho,
                                              a
pues es obvio que si existe l´ |an+1 | = L, entonces el l´
                             ım |an |                     ımite correspondiente a
                              n
la segunda serie tambi´n existe y vale lo mismo.
                       e
    Con los resultados que veremos en la secci´n siguiente sobre la funci´n expo-
                                               o    p                     o
nencial es f´cil probar esto mismo pero sobre l´ n |an |, con lo que obtenemos
            a                                    ım
                                                  n
3.7. La funci´n exponencial
             o                                                               127

la igualdad de los radios de convergencia en el caso general. De aqu´ se sigue
                                                                       ı
inmediatamente que una serie de potencias con coeficientes y centro reales es
una funci´n de clase C ∞ en su intervalo real de convergencia, y adem´s coincide
         o                                                           a
con su serie de Taylor.


3.7     La funci´n exponencial
                o
    Vamos a aplicar las ideas de las secciones precedentes a la construcci´n de
                                                                           o
las funciones m´s importantes del an´lisis: la exponencial, la logar´
                a                      a                             ıtmica y las
trigonom´tricas. En esta secci´n nos ocuparemos de la funci´n exponencial.
          e                    o                             o
    Hasta ahora tenemos definido ar cuando a es un n´mero real positivo y r
                                                       u
es un n´mero racional. No es dif´ probar que la funci´n r 7→ ar admite una
        u                         ıcil                  o
unica extensi´n continua a R que sigue conservando la propiedad ax+y = ax ay .
´             o
Adem´s esta funci´n es infinitamente derivable y coincide en todo punto con
      a              o
su serie de Taylor en 0. En lugar de probar todos estos hechos lo que haremos
ser´ definir la funci´n exponencial a partir de su serie de Taylor, para lo cual
   a                  o
no necesitaremos siquiera el hecho de que ya la tenemos definida sobre Q. No
obstante, ahora vamos a suponer la existencia de la funci´n ax , as´ como que es
                                                         o         ı
derivable, y vamos a calcular su serie de Taylor. As´ obtendremos la serie que
                                                     ı
deberemos tomar como definici´n. o
    Sea f (x) = ax . Entonces,
                            ax+h − ax            ah − 1
              f 0 (x) = l´
                         ım            = ax l´ım        = ax f 0 (0).
                        h→0     h            h→0   h
    Llamemos k = f 0 (0). Entonces hemos probado que f 0 (x) = kf (x), luego por
inducci´n concluimos que f es infinitamente derivable y f n) (x) = kn f (x). No
       o
puede ser k = 0, o de lo contrario f ser´ constante. Sea e = a1/k = f (1/k).
                                          ıa
Entonces la funci´n g(x) = ex = ax/k = f (x/k) cumple g 0 (x) = f 0 (x/k)(1/k) =
                  o
f (x/k) = g(x), es decir, escogiendo adecuadamente la base e obtenemos una
funci´n exponencial que coincide con su derivada. Su serie de Taylor en 0 es
     o
entonces f´cil de calcular: todas las derivadas valen e0 = 1, lo cual nos lleva a
          a
la definici´n siguiente:
          o
Definici´n 3.30 Llamaremos funci´n exponencial a la definida por la serie de
        o                      o
potencias
                                  ∞
                                 X zn
                            ez =        .
                                 n=0
                                     n!
   Puesto que
                              1/(n + 1)!        1
                          l´
                           ım             = l´
                                             ım = 0,
                              n   1/n!        n n

el radio de convergencia es infinito, luego la exponencial est´ definida sobre
                                                               a
todo n´mero complejo z. El ultimo teorema de la secci´n anterior implica que
       u                      ´                         o
la exponencial real es derivable, y su derivada en un punto x es
                    ∞
                   X nxn−1    ∞
                             X xn−1        ∞
                                           X xn
                           =             =       = ex .
                   n=1
                       n!    n=1
                                 (n − 1)! n=0 n!
128                               Cap´
                                     ıtulo 3. C´lculo diferencial de una variable
                                               a

   Es claro que e0 = 1. Definimos el n´mero
                                     u
                     ∞
                    X 1
                    1
              e=e =        = 2, 7182818284590452353602874. . .
                    n=0
                        n!

   Ahora probamos la ecuaci´n que caracteriza a la funci´n exponencial:
                           o                            o

Teorema 3.31 Si z1 , z2 ∈ C, entonces ez1 +z2 = ez1 ez2 .

             ´
   Demostracion: Usamos la f´rmula del producto de Cauchy:
                            o
                      ∞      ∞
                     X zn X zn         ∞ n
                                      XX
                          1      2                 1
         ez1 ez2   =               =                      z k z n−k
                     n=0
                         n! n=0 n!    n=0 k=0
                                              k! (n − k)! 1 2
                     X X 1 µn∂
                      ∞ n                      ∞
                                              X (z1 + z2 )n
                                    k n−k
                   =               z1 z2    =                    = ez1 +z2 .
                     n=0
                             n! k             n=0
                                                       n!
                           k=0



    De aqu´ obtenemos muchas consecuencias. Por una parte, si n es un n´mero
          ı                                                                   u
                                  n         n
                          n    1+···+1
natural no nulo entonces e = e         = e · · · e, es decir, la funci´n exponencial
                                                                      o
sobre n´meros naturales (incluido el 0) coincide con la exponenciaci´n usual
        u                                                                   o
con base e. As´ mismo, 1 = e0 = ex−x = ex e−x , luego e−x = 1/ex , con lo que
               ı
la funci´n exponencial coincide tambi´n con la usual cuando el exponente es
        o                              e
entero.
   Como los coeficientes de la serie exponencial son positivos, vemos que si
x ≥ 0 entonces ex > 0, y si x < 0 entonces ex = 1/e−x > 0. As´ pues, ex > 0
                                                                    ı
para todo n´mero real x.
           u
                                                                 √
   Como, (e1/n )n√ e1/n+···+1/n = e1 = e, resulta que e1/n = n e. Es f´cil ver
                  =                                                        a
ahora que ep/q = q ep , luego la funci´n exponencial coincide con la que ten´
                                      o                                      ıamos
definida para exponentes racionales.
    Puesto que la derivada es positiva en todo punto, vemos que la funci´n expo-
                                                                        o
nencial es estrictamente creciente en R. En particular es inyectiva. Separando
los dos primeros t´rminos de la serie vemos que si x ≥ 0 entonces 1 + x ≤ ex ,
                   e
luego l´ım ex = +∞. A su vez esto implica que
      x→+∞

                                                         1
                         ım ex = l´
                        l´        ım e−x = l´
                                            ım             = 0.
                        x→−∞      x→+∞          x→+∞    ex
   Por el teorema de los valores intermedios, la funci´n exponencial biyecta R
                                                      o
con el intervalo ]0, +∞[.

Ejemplo Aplicando n veces la regla de L’Hˆpital se concluye claramente que
                                         o
                                        xn
                                    l´
                                     ım    = 0,
                                   x→+∞ ex
3.7. La funci´n exponencial
             o                                                                 129

y cambiando x por 1/x llegamos a que

                                e−1/x
                         l´ +
                          ım          = 0,         n = 0, 1, 2, . . .         (3.5)
                        x→0      xn

   Esto implica que la funci´n h : R −→ R dada por
                            o
                                       Ω
                            h(x) =         e−1/x     si x > 0
                                           0         si x ≤ 0

es de clase C ∞ en R. En efecto, una simple inducci´n prueba que las derivadas
                                                   o
de h para x > 0 son de la forma

                                       e−1/x
                                             P (x),
                                        xn

donde P (x) es un polinomio. De aqu´ que las derivadas sucesivas de h en 0
                                        ı
existen y valen todas 0. En efecto, admitiendo que existe hk) (0) = 0 (para
k ≥ 0) la derivada hk+1) (0) se obtiene por un l´
                                                ımite cuando ∆x → 0 que por la
izquierda es claramente 0 y por la derecha es de la forma

                                        e−1/∆x
                                 l´ +
                                  ım           P (∆x),
                                ∆x→0     ∆xn

de modo que el primer factor tiende a 0 por (3.5) y el segundo est´ acotado en
                                                                  a
un entorno de 0. Por lo tanto existe hk+1) (0) = 0.

   En particular, la funci´n h(x2 ) es de clase C ∞ , sus derivadas son todas nulas
                          o
en 0 pero es no nula en todo punto distinto de 0. Tenemos as´ un ejemplo de
                                                                   ı
funci´n de clase C ∞ cuya serie de Taylor en 0 s´lo converge (a ella) en 0.
     o                                            o

   La funci´n h del ejemplo anterior permite construir una familia de funciones
           o
que nos ser´n de gran utilidad m´s adelante:
           a                    a

Teorema 3.32 Dados n´meros reales 0 ≤ a < b existe una funci´n f : R −→ R
                          u                                        o
de clase C ∞ tal que f (x) > 0 si x ∈ ]a, b[ y f (x) = 0 en caso contrario.

                ´
    Demostracion: En efecto, la funci´n h1 (x) = h(x − a) se anula s´lo en
                                         o                               o
los puntos x ≤ a y la funci´n h2 (b − x) se anula s´lo en los puntos x ≥ b. Su
                           o                        o
producto se anula s´lo en los puntos exteriores al intervalo x ∈ ]a, b[.
                   o


Definici´n 3.33 Llamaremos funci´n logar´
       o                         o     ıtmica a la inversa de la funci´n
                                                                      o
exponencial, log : ]0, +∞[ −→ R.

   He aqu´ las gr´ficas de las funciones exponencial y logar´
         ı       a                                         ıtmica.
130                                   Cap´
                                         ıtulo 3. C´lculo diferencial de una variable
                                                   a

                                               4     ex
                                               3


                                               2
                                                             log x
                                               1



                          -4         -2                  2       4

                                              -1


                                              -2


                                              -3


                                              -4



   El teorema de la funci´n inversa nos da que y = log x es derivable, y su
                             o
derivada es y 0 = 1/(ey )0 = 1/ey = 1/x.
   De las propiedades de la funci´n exponencial se deducen inmediatamente las
                                 o
de la funci´n logar´
           o        ıtmica. Obviamente es una funci´n estrictamente creciente,
                                                    o
adem´s verifica la ecuaci´n funcional log(xy) = log x + log y. Tambi´n es claro
     a                    o                                        e
que log 1 = 0, log e = 1 y

                        l´
                         ım log x = +∞,            l´ log x = −∞.
                                                    ım
                        x→+∞                       x→0


   Veamos c´mo puede calcularse en la pr´ctica un logaritmo. Es decir, vamos
             o                             a
a calcular el desarrollo de Taylor de la funci´n log. Obviamente no hay un
                                               o
desarrollo en serie sobre todo ]0, +∞[. Si desarrollamos alrededor del 1 a lo
sumo podemos obtener una serie convergente en ]0, 2[.
   Como las series de potencias centradas en 0 son m´s f´ciles de manejar,
                                                         a a
vamos a desarrollar en 0 la funci´n log(1 + x). Sus derivadas son
                                 o

              (1 + x)−1 , −(1 + x)−2 , 2(1 + x)−3 , −2 · 3(1 + x)−4 , . . .

y en general, la derivada n-sima es (−1)n+1 (n − 1)!(1 + x)−n . Puesto que
log(1 + 0) = 0, la serie de Taylor queda:
                                           ∞
                                          X (−1)n
                                                  xn .
                                          n=1
                                              n

   Como
                                   1/(n + 1)        n
                          l´
                           ım                = l´
                                                ım     = 1,
                               n      1/n        n n+1

el radio de convergencia es 1 (como era de esperar), luego la serie converge en
]−1, 1[. De hecho en x = −1 obtenemos una serie divergente, pero en x = 1
        P (−1)n
        ∞
queda        n , que es convergente luego, con exactitud, la serie converge en
       n=1
el intervalo ]−1, 1].
3.7. La funci´n exponencial
             o                                                                  131

    Seg´n hemos visto en la secci´n anterior, la funci´n definida por la serie es
       u                         o                    o
derivable, y su derivada se obtiene derivando cada monomio, es decir, se trata
de la serie geom´trica
                e
                      ∞
                      X                          ∞
                                                 X              1
                           (−1)n+1 xn−1 =            (−x)n =       .
                     n=1                         n=0
                                                               1+x

   Resulta, pues, que la serie de Taylor y la funci´n log(1 + x) tienen la misma
                                                   o
derivada en ]−1, 1[. Por lo tanto la diferencia entre ambas funciones es una
constante, pero como ambas toman el valor 0 en 0, se concluye que
                                                  ∞
                                                 X (−1)n
                               log(1 + x) =              xn
                                                 n=1
                                                     n

para todo n´mero x ∈ ]−1, 1[.
           u
Ejercicio: Estudiando el resto de Taylor de la funci´n log(1 + x), probar que
                                                    o
                                    X (−1)n
                                    ∞

                                                  = log 2.
                                             n
                                    n=1


    Para calcular el logaritmo de un n´mero x > 2 podemos usar la relaci´n
                                      u                                 o
log(1/x) = − log x.
   Ahora podemos definir ax para cualquier base a > 0. La forma m´s f´cil de
                                                                a a
hacerlo es la siguiente:

Definici´n 3.34 Sea a > 0 y x ∈ R. Definimos ax = ex log a .
       o

    Notar que, como log e = 1, en el caso a = e la exponencial que acabamos
de definir coincide con la que ya ten´ıamos definida. Sin embargo la funci´n o
ex se diferencia de las otras exponenciales en que est´ definida sobre todo el
                                                      a
plano complejo y no s´lo sobre la recta real. M´s adelante interpretaremos
                        o                         a
esta extensi´n compleja. Las funciones exponenciales verifican las propiedades
            o
siguientes:

                   ax+y    =     e(x+y) log a = ex log a ey log a = ax ay ,
                 log ax    =     log ex log a = x log a,
                                         x
                  (ax )y   =     ey log a = exy log a = axy
                     a0    =     1, a1 = a, a−x = 1/ax .

    As´ mismo es claro que ax coincide con la exponenciaci´n usual cuando x es
       ı                                                  o √
un n´mero entero y que sobre n´meros racionales es ap/q = q ap . La funci´n
     u                           u                                         o
y x considerada como funci´n de dos variables en ]0, +∞[ × R es continua.
                           o
    La derivada de ax es (log a)ax , la derivada de xb es

                                          b  1
                               eb log x     = bxb = bxb−1 .
                                          x  x
132                             Cap´
                                   ıtulo 3. C´lculo diferencial de una variable
                                             a

    Finalmente, puesto que la derivada de ax es siempre positiva si a > 1 y
siempre negativa si a < 1, tenemos que ax es mon´tona y biyecta R con el
                                                      o
intervalo ]0, +∞[. Por lo tanto tiene una inversa, que representaremos por
loga x y se llama logaritmo en base a de x. Las propiedades algebraicas de estos
logaritmos son las mismas que las de la funci´n log y se demuestran igual. A
                                               o
estas hay que a˜adir las siguientes, ambas elementales:
                n

                                                              loga x
                      loga xb = b loga x,     logb x =               .
                                                              loga b

En particular
                                              log x
                                 loga x =           .
                                              log a
   Hay una caracterizaci´n importante del n´mero e:
                        o                  u

Teorema 3.35 Se cumple
                                      µ     ∂x
                                          1
                             e = l´
                                  ım   1+      .
                                 x→+∞     x

             ´
   Demostracion: Por definici´n
                            o
                      µ      ∂x
                           1
                       1+       = ex log(1+1/x) ,
                           x

luego basta probar que
                                     µ      ∂
                                          1
                            l´
                             ım x log 1 +     = 1.
                           x→+∞           x

   Pasamos la x al denominador como 1/x y aplicamos la regla de L’Hˆpital,
                                                                   o
con lo que el l´
               ımite se transforma en

                           −x−2
                           1+1/x                 1
                       l´
                        ım          = l´
                                       ım             = 1.
                      x→+∞ −x−2          x→+∞ 1 + 1/x




Ejercicio: Probar que, para todo x ∈ R,
                                          ≥          ¥n
                                                 x
                               ex = l´
                                     ım 1 +               .
                                     n           n


   Terminamos la secci´n con una aplicaci´n de los logaritmos junto a t´cnicas
                      o                  o                             e
anal´
    ıticas.
3.8. Las funciones trigonom´tricas
                           e                                                        133

Ejemplo Se define la media aritm´tica de n n´meros reales x1 , . . . , xn como
                                        e           u
(x1 + · · · + xn )/n. Si son mayores o iguales que 0 se define su media geom´trica
                                                                           e
       √
como n x1 · · · xn . Vamos a probar que la media geom´trica siempre es menor
                                                          e
o igual que la media geom´trica. A su vez, deduciremos esto de la desigualdad
                              e
log t ≤ t − 1, v´lida para todo t > 0.
                  a
    Para probar esta desigualdad vemos que la derivada de f (t) = t − 1 − log t
es 1 − 1/t, que es negativa si t < 1 y positiva si t > 1. Por el teorema 3.14,
f es decreciente en ]0, 1] y creciente en [1, +∞[. Puesto que f (1) = 0, es claro
entonces que f (t) ≥ 0 para todo t > 0.
   Respecto a la desigualdad entre las medias, si uno de los n´meros es nulo la
                                                              u
media geom´trica es nula y el resultado es obvio. Supongamos que son todos
            e
no nulos y sea x = x1 · · · xn . Entonces
                                  x            x
                                  √i − 1 ≥ log √i ,
                                  n
                                    x          n
                                                 x
luego sumando obtenemos
                           P
                           n
                              xi
                                       x · · · xn
                            √ − n ≥ log 1
                           i=1
                                                  = 0,
                            n
                              x           x
con lo que
                                    P
                                    n
                                          xi
                                    i=1            √
                                                   n
                                               ≥     x.
                                      n



3.8     Las funciones trigonom´tricas
                              e
    En geometr´ se definen varias funciones de inter´s, entre las que destacan
               ıa                                  e
las funciones seno y coseno. Si llamamos R a la medida de un ´ngulo recto,
                                                                 a
entonces la funci´n sen x est´ definida sobre R y tiene periodo 4R, es decir,
                  o          a
sen(x + 4R) = sen x para todo x ∈ R. As´ definido, el valor de R es arbitrario,
                                           ı
pues podemos tomar cualquier n´mero real como medida de un ´ngulo recto.
                                 u                               a
Si queremos que existan ´ngulos unitarios deberemos exigir que R > 1/4. Por
                         a
ejemplo, si tomamos como unidad de ´ngulo el grado sexagesimal, entonces
                                         a
R = 90. Supongamos que las funciones seno y coseno son derivables as´ como
                                                                        ı
sus propiedades algebraicas y vamos a calcular su serie de Taylor. Con ello
obtendremos una definici´n anal´
                         o      ıtica alternativa.
    En primer lugar, como el coseno tiene un m´ximo en 0, ha de ser cos0 0 = 0.
                                                a
En cualquier otro punto tenemos
                    cos(x + h) − cos x          cos x cos h − sen x sen h − cos x
   cos0 x =      l´
                  ım                     = l´ım
                 h→0         h              h→0                 h
                          cos h − 1              sen h
             = cos x l´
                      ım             − sen x l´
                                              ım
                     h→0      h              h→0   h
             = cos x cos0 0 − sen x sen0 0 = − sen x sen0 0.
134                                      Cap´
                                            ıtulo 3. C´lculo diferencial de una variable
                                                      a

    Si llamamos k = sen0 0 concluimos que cos0 x = −k sen x, y similarmente
llegamos a que sen0 x = k cos x.
    Del mismo modo que hicimos con la exponencial, podemos normalizar las
funciones seno y coseno cambi´ndolas por sen(x/k) y cos(x/k). Geom´tricamen-
                               a                                      e
te esto significa fijar una unidad de ´ngulos. Entonces tenemos sen0 x = cos x y
                                      a
cos0 x = − sen x.
    Vemos entonces que las funciones seno y coseno son infinitamente derivables,
y sus derivadas est´n uniformemente acotadas por 1, luego las series de Taylor
                     a
deben converger en R a las funciones respectivas. Puesto que sen 0 = 0 y
cos 0 = 1, las series han de ser las que consideramos en la definici´n siguiente:
                                                                   o

Definici´n 3.36 Llamaremos seno y coseno a las funciones definidas por las
         o
series de potencias
                            ∞
                           X (−1)n                                  ∞
                                                                   X (−1)n
                 sen z =                 z 2n+1 ,       cos z =              z 2n .
                           n=0
                               (2n + 1)!                           n=0
                                                                       (2n)!

    No es dif´ probar directamente la convergencia de estas series sobre todo el
             ıcil
plano complejo. El teorema siguiente muestra una sorprendente conexi´n entre
                                                                       o
las funciones trigonom´tricas as´ definidas y la funci´n exponencial. Observar
                       e        ı                    o
que la prueba contiene otra demostraci´n alternativa de la convergencia de estas
                                      o
series.

Teorema 3.37 Para todo z ∈ C se cumple

                                     eiz − e−iz                 eiz + e−iz
                      sen z =                   ,     cos z =              .
                                         2i                          2
             ´
   Demostracion:
                                P
                                ∞       n     P
                                              ∞            n

            iz      −iz              in z +
                                        n!          (−i)n z
                                                          n!        ∞
                                                                   X in + (−i)n z n
           e +e                n=0            n=0
                           =                                   =                    .
             2                                2                    n=0
                                                                          2     n!

   Ahora bien, la sucesi´n (in +(−i)n )/2 es simplemente 1, 0, −1, 0, 1, 0, −1, 0. . .,
                        o
luego queda la serie del coseno. Similarmente se razona con el seno.
   Derivando t´rmino a t´rmino las series de Taylor se concluye f´cilmente que
              e         e                                        a

                               sen0 x = cos x,       cos0 x = − sen x.

    Las f´rmulas siguientes son todas consecuencias sencillas del teorema ante-
         o
rior:
                               sen2 z + cos2 z = 1
                      sen(x + y) = sen x cos y + cos x sen y,
                      cos(x + y) = cos x cos y − sen x sen y,
                             eiz = cos z + i sen z,
3.8. Las funciones trigonom´tricas
                           e                                                 135

    La primera f´rmula implica que si x ∈ R entonces −1 ≤ sen x, cos x ≤ 1. De
                 o
la ultima se sigue que para todo x, y ∈ R se cumple
   ´

                          ex+iy = ex (cos y + i sen y),

con lo que tenemos descrita la exponencial compleja en t´rminos de la exponen-
                                                        e
cial real y de las funciones seno y coseno reales.
   El hecho de que sen0 0 = cos 0 = 1 equivale a
                                       sen x
                                 l´
                                  ım         = 1,
                                 x→0     x
que es otra propiedad del seno que conviene recordar.
    Vamos a probar ahora la periodicidad de las funciones trigonom´tricas reales.
                                                                   e
El punto m´s delicado es demostrar que cos x se anula en alg´n x 6= 0. Para ello
            a                                                 u
probaremos que el coseno es menor o igual que los cuatro primeros t´rminos de
                                                                     e
su serie de Taylor:
                                          x2    x4
                              cos x ≤ 1 −     + .
                                          2     24
                                     2      4
    Esto equivale a probar que 1 − x /2 + x /24 − cos x ≥ 0 para x ≥ 0. Puesto
que esta funci´n vale 0 en 0, basta probar que su derivada es positiva. Dicha
               o
derivada es sen x−x+x3 /6. Esta funci´n vale tambi´n 0 en 0, luego para probar
                                        o            e
que es positiva (para x ≥ 0) basta ver que su derivada lo es. Dicha derivada es
cos x − 1 + x2 /2. Por el mismo argumento derivamos una vez m´s y obtenemos
                                                                 a
x − sen x. Al derivar una vez m´s llegamos a 1 − cos x, que sabemos que es
                                   a
positiva.
    Vemos que la gr´fica del polinomio de Taylor de
                      a                                    4

grado 4 en 0 de cos x toma valores negativos. De
                                           √
hecho un simple c´lculo nos da que en 3 toma el
                    a √                                    3


valor −1/8, luego cos 3 ≤ −1/8. Como√ 0 = 1,cos
                                                           2
por continuidad existe un punto 0 < x < 3 tal que
cos x = 0.                                                 1
    Sea A = {x > 0 | cos x = 0}. El conjunto A es la
antiimagen de {0} por la aplicaci´n coseno restringida -1
                                  o                             1    2    3     4
a [0, +∞[. Como {0} es cerrado y cos es continua, A
es un cerrado. El ´  ınfimo de un conjunto est´ en su
                                              a           -1

clausura, luego F = ´ A ∈ √ y as´ cos F = 0. Es obvio que F ≥ 0, y como
                        ınf   A       ı
cos 0 6= 0, ha de ser 0 < F < 3.                             √
    Es costumbre llamar π = 2F . As´ se cumple 0 < π < 2 3, cos(π/2) = 0,
                                        ı,
pero cos x > 0 en el intervalo [0, π/2[.
    Ahora, como el coseno es la derivada del seno, resulta que sen x es estricta-
mente creciente en el intervalo [0, π/2]. Como sen 0 = 0, resulta que sen x ≥ 0
en [0, π/2]. Concretamente, sen(π/2) es un n´mero positivo que cumple
                                              u

                  sen2 (π/2) + cos2 (π/2) = sen2 (π/2) + 0 = 1,

luego sen(π/2) = 1.
136                                      Cap´
                                            ıtulo 3. C´lculo diferencial de una variable
                                                      a

    Adem´s, cos0 x = − sen x ≤ 0 en [0, π/2], luego el coseno es estrictamente
          a
decreciente en [0, π/2]. En resumen, tenemos demostrado lo que refleja la gr´fica
                                                                           a
siguiente:
                                1

                              0.8

                              0.6

                               0.4

                               0.2

                       -0.5                  0.5        1       1.5       2
                              -0.2

                              -0.4




    Incidentalmente hemos probado una desigualdad que a veces es de inter´s:
                                                                         e
si x ≥ 0 entonces sen x ≤ x. M´s en general, | sen x| ≤ |x|.
                              a
    El comportamiento de las funciones seno y coseno fuera del intervalo [0, π/2]
se deduce de las relaciones trigonom´tricas que ya hemos probado. Por ejemplo,
                                    e
expresando π = π/2 + π/2 obtenemos sen π = 0, cos π = −1, y a su vez de aqu´    ı
sen 2π = 0, cos 2π = 1. Ahora

                  sen(x + 2π) = sen x,                 cos(x + 2π) = cos x,

lo que prueba que ambas funciones son peri´dicas y basta estudiarlas en el
                                               o
intervalo [0, 2π]. Dejamos a cargo del lector completar la descripci´n de estas
                                                                    o
funciones. A partir de lo que ya hemos probado es f´cil obtener todos los
                                                        a
resultados que se demuestran en geometr´   ıa. Nos limitaremos a mostrar sus
gr´ficas en [0, 2π]:
  a
                          1
                        0.5

                                     1      2      3        4    5    6
                       -0.5
                         -1



   El teorema siguiente se demuestra de forma m´s natural en geometr´ pero
                                               a                     ıa,
vamos a probarlo para tener una construcci´n completamente anal´
                                           o                     ıtica de las
funciones trigonom´tricas:
                  e

Teorema 3.38 Sea z ∈ C, z 6= 0 y sea a ∈ R. Entonces existe un unico n´mero
                                                                ´     u
real θ ∈ [a, a + 2π[ tal que z = |z|eiθ = |z|(cos θ + i sen θ).

    Demostracion: Sea z/|z| = x + iy. Entonces x2 + y 2 = 1. Distinguimos
                   ´
cuatro casos: seg´n el signo de x e y. Todos son an´logos, as´ que supondremos
                   u                                  a       ı
por ejemplo x ≤ 0, y ≥ 0. M´s concretamente tenemos −1 ≤ x ≤ 0. En el
                                 a
intervalo [π, 3π/2] se cumple cos π = −1, cos 3π/2 = 0, luego por continuidad
existe un n´mero φ ∈ [π, 3π/2] tal que cos φ = x. Entonces 1 = x2 + y 2 =
            u
cos2 φ + sen2 φ, por lo que y 2 = sen2 φ y, como ambos son negativos, ha de ser
y = sen φ. As´ pues, z = |z|(cos φ + i sen φ) = |z|eiφ .
               ı
    Existe un n´mero entero p tal que θ = 2pπ + φ ∈ [a, a + 2π[. Entonces,
                 u
teniendo en cuenta que e2pπi = 1, resulta que z = |z|eiφ e2pπi = |z|eiθ .
3.8. Las funciones trigonom´tricas
                           e                                                               137

    La unicidad se debe a que si |z|eiθ1 = |z|eiθ2 , entonces ei(θ1 −θ2 ) = 1, luego
cos(θ1 − θ2 ) = 1 y sen(θ1 − θ2 ) = 0, ahora bien, cos x = 1 y senx = 0 s´lo ocurre
                                                                          o
en x = 0 en el intervalo [0, 2π[, luego s´lo ocurre en los n´meros reales de la
                                           o                    u
forma 2kπ, con k ∈ Z. As´ pues θ1 − θ2 = 2kπ, y si ambos est´n en el intervalo
                            ı                                     a
[a, a + 2π[, ha de ser θ1 = θ2 .

   Un argumento de un n´mero complejo z 6= 0 es un n´mero real θ tal que
                         u                                u
z = |z|eiθ . Hemos probado que cada n´mero complejo no nulo tiene un unico
                                       u                                    ´
argumento en cada intervalo [a, a + 2π[. En particular en el intervalo [0, 2π[.
    Recordemos que para conseguir que la derivada
del seno fuera el coseno hemos tenido que fijar una
medida de ´ngulos concreta. El ´ngulo de medida 1
            a                        a
respecto a esta unidad, es decir, el ´ngulo que forman
                                       a
los vectores (1, 0) y (cos 1, sen 1), recibe el nombre de
radi´n1 La figura muestra un radi´n.
     a                                 a
   Las funciones seno y coseno nos permiten mostrar
algunos ejemplos de inter´s sobre derivabilidad.
                         e

Ejemplo La funci´n f : R −→ R dada por
                o
                            Ω 2    1
                             x sen x si x 6= 0
                    f (x) =
                             0         si x = 0

    es derivable en R. El unico punto donde esto no es evidente es x = 0, pero
                          ´

                                                      1
                                 f 0 (0) = l´ h sen
                                            ım          = 0.
                                           h→0        h
   Para probar esto observamos en general que el producto de una funci´n       o
acotada por otra que tiende a 0 tiende a 0 (basta aplicar la definici´n de l´
                                                                    o      ımite).
   Sin embargo la derivada no es continua, pues en puntos distintos de 0 vale

                                                   1      1
                                f 0 (x) = 2x sen     − cos ,
                                                   x      x
y es f´cil ver que el primer sumando tiende a 0 en 0 (como antes), mientras que
      a
el segundo no tiene l´ ımite, luego no existe l´ f 0 (x).
                                               ım
                                                   x→0

    Los mismos c´lculos que acabamos de realizar prueban una limitaci´n de la
                a                                                    o
regla de L’Hˆpital. Consideremos la funci´n g(x) = x. Entonces
            o                            o

                                             f (x)
                                       l´
                                        ım         = 0,
                                       x→0   g(x)
   1 Elnombre se debe a que, seg´n probaremos en el cap´
                                u                         ıtulo siguiente, si un arco de circun-
ferencia mide un radi´n, entonces su longitud es igual al radio. Ser´ m´s adecuado llamarlo
                     a                                               ıa a
a
´ngulo “radiante”.
138                              Cap´
                                    ıtulo 3. C´lculo diferencial de una variable
                                              a

pero si intentamos calcular el l´
                                ımite por la regla de L’Hˆpital nos encontramos
                                                         o
con
                                  f 0 (x)
                             l´
                              ım 0        = l´ f 0 (x),
                                             ım
                            x→0 g (x)       x→0

y ya hemos visto que este l´ımite no existe. La regla de L’Hˆpital s´lo afirma que
                                                            o       o
si existe el l´
              ımite del cociente de derivadas tambi´n existe el l´
                                                     e            ımite original y
ambos coinciden, pero es importante recordar que si el segundo l´  ımite no existe
de ah´ no podemos deducir que el primero tampoco exista.
      ı
   Otra funci´n trigonom´trica importante es la tangente, definida como
             o          e
                                                 sen z
                                     tan z =           .
                                                 cos z
    No es dif´ probar que la funci´n coseno se anula unicamente sobre los
              ıcil                     o                  ´
m´ltiplos enteros de π/2 (no tiene ceros imaginarios). En efecto, si cos z = 0,
  u
por definici´n eiz +e−iz = 0, luego e2iz = −1. Si z = a+bi, queda e2ia e−2b = −1
            o
y tomando m´dulos, e−2b = 1, luego b = 0 y z es real. Igualmente ocurre con el
               o
seno. Por lo tanto la tangente est´ definida sobre todos los n´meros complejos
                                   a                          u
que no son m´ltiplos enteros de π/2. Claramente su restricci´n a R es derivable
              u                                              o
en su dominio, y su derivada es 1/ cos2 x = 1 + tan2 x. En particular es siempre
positiva, luego la tangente es creciente. Su gr´fica es:
                                               a
                                             6


                                             4


                                             2



                           -6   -4     -2          2       4   6

                                            -2


                                            -4


                                            -6



    Es f´cil ver que la funci´n tangente biyecta el intervalo ]−π/2, π/2[ con la
        a                    o
recta real. Junto con ´sta, tenemos tambi´n las biyecciones siguientes:
                       e                   e
                    h π πi
               sen : − ,       −→ [−1, 1], cos : [0, π] −→ [−1, 1].
                        2 2
  Por lo tanto podemos definir las funciones inversas, llamadas respectiva-
mente, arco seno, arco coseno y arco tangente:
                               h π πi
            arcsen : [−1, 1] −→ − ,     , arccos : [−1, 1] −→ [0, π],
                                  2 2
                          arctan : R −→ ]−π/2, π/2[ .
   El teorema de la funci´n inversa permite calcular sus derivadas:
                         o
                     1                        −1                                    1
      arcsen0 x = √       ,     arccos0 x = √       ,              arctan0 x =          .
                   1 − x2                    1 − x2                              1 + x2
3.8. Las funciones trigonom´tricas
                           e                                                       139

                                                             dx
   Por ejemplo, si y = arcsen x, entonces x = sen y, luego   dy   = cos y, luego

                    dy     1        1          1
                       =       =p          =√       .
                    dx   cos y   1 − sen2y   1 − x2

    Vamos a calcular la serie de Taylor de la funci´n arco tangente. No podemos
                                                   o
calcular directamente las derivadas, pues las expresiones que se obtienen son
cada vez m´s complicadas y no permiten obtener una f´rmula general. En su
            a                                             o
lugar emplearemos la misma t´cnica que hemos usado en la secci´n anterior
                                 e                                    o
para calcular la serie del logaritmo. Claramente
                                   ∞
                                   X
                 1         1
                     =           =   (−1)n x2n , para |x| < 1.
              1 + x2   1 − (−x2 ) n=0

   Ahora es f´cil obtener una serie cuya derivada sea la serie anterior, a saber:
             a
                                 ∞
                                X (−1)n
                                           x2n+1 .
                                n=0
                                    2n + 1

Es f´cil ver que su radio de convergencia es 1.
    a
   Por lo tanto esta serie se diferencia en una constante de la funci´n arctan x
                                                                     o
en el intervalo ]−1, 1[, pero como ambas funciones toman el valor 0 en x = 0,
concluimos que son iguales, o sea:
                                ∞
                               X (−1)n
                  arctan x =              x2n+1 , para |x| < 1.
                               n=0
                                   2n + 1

    Cuando x = ±1 la serie se convierte en una serie alternada cuyo t´rmino
                                                                         e
general es decreciente y tiende a 0, luego por el criterio de Leibniz tambi´n e
converge. No vamos a demostrarlo aqu´ (ver la p´g. 237), pero el l´
                                      ı         a                  ımite resulta
ser arctan(±1). Puesto que arctan 1 = π/4, esto nos lleva a la conocida f´rmula
                                                                         o
de Leibniz para el c´lculo de π:
                    a
                          µ                              ∂
                               1 1 1 1           1
                   π =4 1− + − + −                 + ··· .
                               3 5 7 9 11

    Esta f´rmula converge muy lentamente a π, en el sentido de que es necesario
          o
calcular muchos t´rminos para obtener pocas cifras exactas. Hay otras expresio-
                  e
nes m´s complicadas pero m´s eficientes. Veamos una de ellas. Es f´cil probar
      a                      a                                      a
la f´rmula de la tangente del ´ngulo doble:
    o                         a
                                            2 tan α
                               tan 2α =              .
                                          1 − tan2 α
De aqu´ se sigue que
      ı
                  µ          ∂                µ           ∂
                           1     5                      1     120
              tan 2 arctan     =    ,      tan 4 arctan     =     .
                           5     12                     5     119
140                               Cap´
                                     ıtulo 3. C´lculo diferencial de una variable
                                               a

Teniendo en cuenta que arctan(−x) = − arctan x resulta
                 µ                       ∂     120
                           1          1            − 1
              tan 4 arctan − arctan        = 119 120239 = 1,
                                                       1
                           5         239      1 + 119 239
con lo que, finalmente,
                               µ                      ∂
                                        1          1
                          π = 4 4 arctan − arctan       ,
                                        5         239
o sea,
                            X (−1)n 4 µ 4
                             ∞
                                                  1
                                                       ∂
                         π=                  −           .
                            n=0
                                2n + 1 52n+1   2392n+1
   Esta serie converge muy r´pidamente. Veamos sus primeras sumas parciales:
                            a
                     0    3,18326359832635983263598326360
                     1    3,14059702932606031430453110658
                     2    3,14162102932503442504683251712
                     3    3,14159177218217729501821229111
                     4    3,14159268240439951724025983607
                     5    3,14159265261530860814935074767
                     6    3,14159265362355476199550459382
                     7    3,14159265358860222866217126049
                     8    3,14159265358983584748570067225
                     9    3,14159265358979169691727961962
                    10    3,14159265358979329474737485772
                    11    3,14159265358979323639184094467
                    12    3,14159265358979323853932459267
                    13    3,14159265358979323845978816126
                    14    3,14159265358979323846275020768
                    15    3,14159265358979323846263936981
   Vemos que con 6 sumas tenemos ya una aproximaci´n con diez cifras exactas,
                                                  o
y con 15 superamos las 20 cifras.

*Las funciones hiperb´licas El lector que est´ familiarizado con la geo-
                          o                        e
metr´ hiperb´lica habr´ notado la similitud formal entre las f´rmulas del teo-
     ıa        o        a                                     o
rema 3.37 y las definiciones de las razones trigonom´tricas hiperb´licas. Esta
                                                     e           o
similitud se traduce en las relaciones siguientes:
                   ex − e−x   ei(−ix) − e−i(−ix)                sen ix
         senh x =           =                    = i sen(−ix) =        ,
                       2               2                           i
                   ex + e−x   ei(−ix) + e−i(−ix)
      cosh x =              =                    = cos(−ix) = cos ix.
                       2               2
   En definitiva, tenemos
                               sen(ix) = i senh x,
                               cos(ix) =   cosh x,
                               tan(ix) = i tanh x.
3.8. Las funciones trigonom´tricas
                           e                                                       141

   De aqu´ se siguen, por ejemplo, las relaciones cosh2 x − senh2 x = 1, o las
          ı
f´rmulas del seno y el coseno de una suma, etc.
 o
Ejercicio: Deducir de las relaciones anteriores las series de Taylor de las funciones
senh x y cosh x.

   A partir de las definiciones es f´cil probar
                                   a
                                                               1
      senh0 x = cosh x,   cosh0 x = senh x,     tanh0 x =           1 − tanh2 x.
                                                            cosh2 x
   Puesto que cosh x ≥ 0, el seno hiperb´lico es creciente. De hecho es una
                                        o
funci´n biyectiva, como puede probarse a partir de la propia definici´n: Si
     o                                                               o
x = senh y entonces
                                                              p
    ey − e−y − 2x = 0, ⇒ e2y − 2xey − 1 = 0, ⇒ ey = x + x2 + 1,

luego la inversa del seno hiperb´lico es la funci´n argumento del seno hiperb´lico
                                o                o                           o
dada por                                        p
                                          °             ¢
                         arg senh x = log x + x2 + 1 .
   Teniendo en cuenta su derivada, el coseno hiperb´lico es decreciente en
                                                       o
]−∞, 0] y creciente en [0, +∞[. Como cosh 0 = 1, la imagen est´ en [1, +∞[.
                                                              a
Existe la inversa arg cosh : [1, +∞[ −→ [0, +∞[ dada por
                                         °   p       ¢
                         arg cosh x = log x + x2 − 1 .

   Teniendo en cuenta las relaciones
                                    1
                  tan2 x = 1 −           ,   tanh(−x) = − tanh x,
                                 cosh2 x
es claro que tanh : R −→ ]−1, 1[ es biyectiva, luego tiene como inversa a la
funci´n arg tanh : ]−1, 1[ −→ R.
     o
   Dejamos a cargo del lector el c´lculo de las derivadas de los argumentos
                                  a
hiperb´licos.
       o


*Geometr´ no eucl´
            ıas          ıdeas Los resultados de esta secci´n nos permiten
                                                               o
mostrar una conexi´n importante entre la geometr´ eucl´
                     o                               ıa    ıdea y las geometr´ıas
el´
  ıptica e hiperb´lica. Antes de entrar en ello, observemos que en la geometr´
                  o                                                             ıa
eucl´
    ıdea existe una asimetr´ entre la medida de longitudes y la medida de
                             ıa
a
´ngulos. En efecto, no es posible definir geom´tricamente una unidad de longi-
                                               e
tud. El metro se define actualmente en t´rminos del segundo y de la velocidad
                                          e
de la luz, y a su vez el segundo se define en t´rminos de una propiedad f´
                                                 e                          ısica
del ´tomo de kript´n; antiguamente el metro se defin´ como la longitud del
    a                o                                  ıa
patr´n de platino que se hallaba en Par´ En cualquier caso, si alguien quiere
     o                                   ıs.
construir un metro con precisi´n se ve obligado a observar ´tomos de kript´n,
                                o                            a                o
a viajar a Par´ o algo similar. En cambio, no es necesario viajar a Par´ para
               ıs                                                        ıs
construir un ´ngulo recto, o un radi´n, o un grado sexagesimal con precisi´n.
              a                      a                                        o
142                               Cap´
                                     ıtulo 3. C´lculo diferencial de una variable
                                               a

Podr´ haber un ´ngulo patr´n en Par´ pero no es necesario porque existen
      ıa            a             o          ıs,
unidades naturales de ´ngulo, en el sentido de que pueden definirse por medios
                         a
puramente geom´tricos. Nosotros hemos definido el radi´n y no hemos tenido
                  e                                             a
que aludir a ning´n ´tomo.
                   u a
    Esta asimetr´ no se da en las geometr´ no eucl´
                 ıa                           ıas        ıdeas. Pensemos por ejemplo
en la geometr´ el´
              ıa ıptica. Los segmentos pueden medirse tambi´n en radianes, o
                                                                     e
en rectos, o en grados sexagesimales. Una longitud de un recto es simplemente
la mitad de la longitud de una recta cualquiera. Una longitud de un radi´n           a
es simplemente 2/π rectos. Desde un punto de vista m´s conceptual, esto se
                                                                a
refleja en que la geometr´ eucl´
                           ıa      ıdea tiene semejanzas que no son isometr´ (apli-
                                                                               ıas
caciones que conservan ´ngulos pero no longitudes, de modo que dos segmentos
                          a
cualesquiera son semejantes), mientras que en las geometr´ no eucl´
                                                                 ıas        ıdeas todas
las semejanzas son isometr´   ıas.
    La ausencia de unidades naturales de longitud (o la presencia de semejanzas)
hace que la geometr´ eucl´
                      ıa      ıdea sea invariante a escala. La geometr´ de Liliput
                                                                          ıa
es exactamente la misma que la nuestra, y as´ ser´ aunque los liliputienses
                                                     ı     ıa
midieran una millon´sima de mil´
                      e               ımetro. No habr´ ning´n argumento objetivo
                                                       ıa      u
para concluir que ellos son “peque˜os” y nosotros “grandes” o “normales”. Las
                                       n
nociones de “grande” y “peque˜o” son relativas a la unidad de medida, y ´sta es
                                   n                                             e
arbitraria. No ocurre lo mismo en las geometr´ no eucl´
                                                  ıas         ıdeas. Supongamos que
la superficie de la Tierra fuera completamente esf´rica, sin hoyos ni elevaciones.
                                                       e
Ahora s´ tiene sentido decir que un metro es objetivamente “peque˜o”, con
         ı                                                                    n
respecto a una unidad natural de longitud, pues un metro es 20 millones de
veces m´s peque˜o que un meridiano (una recta el´
         a        n                                     ıptica). Quiz´ el lector piense
                                                                     a
que esta noci´n de peque˜ez no deja de ser subjetiva. Ciertamente no es rigurosa
             o              n
en el sentido de que no podemos determinar cu´ndo una longitud deja de ser
                                                      a
peque˜a, pero es la forma m´s natural de expresar un hecho objetivo que vamos
       n                        a
a explicar a continuaci´n.
                         o
    Supongamos que trazamos un tri´ngulo en nuestra Tierra perfecta. Digamos
                                         a
que uno de sus lados mide un metro. Entonces podemos aplicarle el teorema
del coseno para un lado, es decir, la f´rmula:
                                           o

                     cos α = − cos β cos γ + sen β sen γ cos a.

    Ahora bien, si entendemos que las funciones trigonom´tricas que aparecen
                                                              e
son las que hemos estudiado en este cap´    ıtulo, los ´ngulos han de estar en ra-
                                                       a
dianes. Si el lado a mide un metro, su medida en radianes es aproximadamente
a ≈ 1,6 · 10−7 , y entonces cos a ≈ 0,9999999999999872. Por consiguiente nuestro
tri´ngulo cumple
   a

      cos α ≈ − cos β cos γ + sen β sen γ = − cos(β + γ) = cos(π − β − γ),

de donde se sigue que α + β + γ ≈ π + 2kπ. Como la suma de los ´ngulos de un
                                                                a
tri´ngulo el´
   a        ıptico est´ entre π y 3π, concluimos que la suma ha de parecerse a
                      a
π o a 3π. Enseguida descartaremos el segundo caso y concluiremos

                                  α + β + γ ≈ 2π.
3.8. Las funciones trigonom´tricas
                           e                                                    143

   Si hacemos c´lculos concretos veremos que esta aproximaci´n excede nues-
                 a                                             o
tra capacidad de discernimiento, por lo que aparentemente nuestro tri´ngulo
                                                                     a
cumplir´ la ley eucl´
        a           ıdea de que la suma de sus ´ngulos es igual a π.
                                               a
   La raz´n por la que la suma de los ´ngulos no puede acercarse a 3π nos la
          o                            a
da el teorema del coseno para un ´ngulo:
                                  a

                       cos a = cos b cos c + sen b sen c cos α.

    Si ahora sustituimos cos a ≈ 1, cos b ≈ 1, cos b ≈ 1 obtenemos la relaci´n
                                                                            o
sen b sen c cos α ≈ 0, que no expresa m´s que el hecho de que cuando b y c son
                                       a
peque˜os sen b ≈ 0 ≈ sen c. Vamos a aproximar las razones trigonom´tricas por
       n                                                           e
sus polinomios de Taylor de grado 2 en 0.
    Consideramos grado 2 porque, para el coseno, el polinomio de Taylor de
grado 1 es tambi´n P1 (x) = 1, luego estamos en el mismo caso de antes. En
                   e
cambio el de grado 2 nos da la aproximaci´n:
                                           o

                                                 x2
                                  cos x ≈ 1 −       .
                                                 2
   Respecto al seno, el polinomio de grado 1 coincide con el de grado 2. Ambos
nos dan la aproximaci´n sen x ≈ x.
                      o
Ejercicio: Comprobar que para a ≈ 1,6 · 10−7 el resto del polinomio de Taylor de
grado 3 (que es el mismo que el de grado 2) del coseno en 0 es menor que 3 · 10−29 .
El resto de grado 2 del seno es menor que 7 · 10−22 .

   Por consiguiente

                                            b2   c2   b2 c2
                        cos b cos c ≈ 1 −      −    +       .
                                            2    2      4
   ´
   Esta es una aproximaci´n de cuarto grado. Podemos despreciar el ultimo
                         o                                         ´
t´rmino y quedarnos con
 e

                                                 b2  c2
                             cos b cos c ≈ 1 −      − .
                                                 2   2
   Aunque no hemos definido este concepto, lo cierto es que 1−x2 /2−y 2 /2 es el
polinomio de Taylor de segundo grado de la funci´n de dos variables cos x cos y.
                                                o
Con estas aproximaciones el teorema del coseno se convierte en

                             a2     b2   c2
                        1−      ≈1−    −    + bc cos α,
                             2      2    2
o equivalentemente,
                             a2 ≈ b2 + c2 − 2bc cos α,
que es el teorema del coseno eucl´ıdeo. Esto significa que los ´ngulos de nuestro
                                                              a
tri´ngulo ser´n aproximadamente los mismos que los del tri´ngulo eucl´
   a          a                                               a          ıdeo de
lados a, b, c, luego su suma se parecer´ a π y no a 3π.
                                       a
144                              Cap´
                                    ıtulo 3. C´lculo diferencial de una variable
                                              a

    En general, todas las f´rmulas de la geometr´ el´
                           o                    ıa ıptica aproximan a f´rmulas
                                                                        o
eucl´
    ıdeas cuando las longitudes involucradas son peque˜as. La aproximaci´n
                                                         n                   o
sen x ≈ x transforma el teorema de los senos el´   ıptico en el correspondiente
eucl´
    ıdeo.
Ejercicio: Comprobar que el teorema de Pit´goras el´
                                              a        ıptico: cos a = cos b cos c se
convierte aproximadamente en el eucl´
                                    ıdeo para tri´ngulos peque˜os.
                                                 a             n
    Resulta as´ que la geometr´ el´
              ı               ıa ıptica a gran escala es muy diferente de la geo-
metr´ el´
     ıa ıptica a peque˜a escala, pues ´sta ultima es aproximadamente eucl´
                        n               e   ´                               ıdea.
Esto se expresa diciendo que la geometr´ el´
                                          ıa ıptica es localmente eucl´ ıdea. La
interpretaci´n geom´trica es clara: la geometr´ el´
            o        e                         ıa ıptica es localmente igual a la
geometr´ de una esfera, y la geometr´ de una esfera se aproxima localmente a
        ıa                             ıa
la de cualquiera de sus planos tangentes, que es eucl´
                                                     ıdea.
    Todo lo dicho vale igualmente para la geometr´ hiperb´lica. En primer
                                                     ıa      o
lugar hemos de observar que tambi´n en esta geometr´ hay unidades naturales
                                    e                  ıa
de longitud, definibles geom´tricamente. Por ejemplo, si un tri´ngulo equil´tero
                            e                                 a           a
tiene todos sus lados unitarios, el teorema del coseno nos permite calcular sus
a
´ngulos. Todos miden
                                         e2 + 1
                       α = arccos                 ≈ 0,92 rad.
                                    e2   + 2e + 1
    Por lo tanto podemos definir la unidad de longitud hiperb´lica como la
                                                                o
longitud del lado del tri´ngulo equil´tero cuyos ´ngulos miden α. La selecci´n
                         a           a           a                          o
de esta unidad de longitud se lleva a cabo en el momento en que definimos la
distancia entre dos puntos mediante la f´rmula
                                         o
                                    1
                        d(P, Q) =     log R(P, Q, Q∞ , P∞ ).
                                    2
Si cambiamos la base del logaritmo o si cambiamos la constante 1/2 estamos
cambiando de unidad de longitud (ambos cambios son equivalentes).
    Para transformar las f´rmulas hiperb´licas en f´rmulas eucl´
                          o             o          o           ıdeas basta usar
las aproximaciones de Taylor:
                                                         x2
                          senh x ≈ x,     cosh x ≈ 1 +      .
                                                         2
   Dejamos los detalles a cargo del lector.


3.9      Primitivas
   El teorema 3.16 afirma que una funci´n derivable est´ completamente de-
                                       o                a
terminada por su derivada y su valor en un punto. A menudo se plantea el
problema pr´ctico de determinar una funci´n a partir de estos datos.
           a                             o
Definici´n 3.39 Diremos que una funci´n F : I −→ R definida en un intervalo
         o                              o
abierto I es una primitiva de una funci´n f : I −→ R si F es derivable en I y
                                       o
F0 = f.
3.9. Primitivas                                                               145

     No estamos en condiciones de decir mucho sobre cu´ndo una funci´n tiene
                                                         a               o
primitiva. Nos limitaremos a hacer algunas observaciones te´ricas que en casos
                                                              o
concretos nos permitir´n encontrar primitivas de funciones dadas. En estos
                        a
t´rminos, lo que afirma el teorema 3.16 es que si una funci´n f admite una
 e                                                              o
primitiva F , entonces el conjunto de todas las primitivas de f est´ formado por
                                                                   a
las funciones de la forma F + c, para cada c ∈ R. Esto hace que, aunque F no
est´ un´
    e ıvocamente determinada por f , dados a, b ∈ I, el incremento F (b)−F (a)
s´ lo est´. Conviene introducir la notaci´n
 ı       a                               o
                             £     §b
                              F (x) a = F (b) − F (a).

    En el lenguaje del c´lculo infinitesimal, si sabemos que dy = f (x)dx, esto
                         a
significa que la funci´n y experimenta un incremento infinitesimal de f (x)dx
                      o
cada vez que la variable se incrementa en dx. Supongamos que y est´ definida
                                                                     a
en [a, b] y conocemos y(a). Entonces y(b) ≈ y(a) + f (a)(b − a). En realidad
´ste es el valor que toma en b la recta tangente a y en a. Obtendremos una
e
aproximaci´n mejor si dividimos el intervalo [a, b] en partes iguales, digamos
            o
a = x0 < x1 < · · · < xn = b, todas de longitud ∆x, y vamos calculando:

                    y(x0 ) = y(a),
                    y(x1 ) ≈ f (x0 )∆x + y(a),
                    y(x2 ) ≈ f (x0 )∆x + f (x1 )∆x + y(a),
                      ···    ············

   En definitiva,
                                             n
                                             X
                          y(b) − y(a) ≈            f (xi−1 )∆x
                                             i=1

   La aproximaci´n ser´ mejor cuantas m´s partes consideremos, es decir,
                  o      a                    a
cuanto menor sea ∆x. As´ el incremento de la primitiva puede pensarse como
                           ı,
una suma de infinitos sumandos correspondientes a un incremento infinitesimal
dx. Por ello la notaci´n cl´sica para el incremento de una primitiva F de una
                      o     a
funci´n f (x) en un intervalo [a, b] es
     o
                             Z    b             £     §b
                                      f (x) dx = F (x) a                     (3.6)
                              a

donde el s´ımbolo proviene de una S de “suma” (en realidad del lat´ summa)
                                                                        ın
y se lee integral de la funci´n f respecto a x en [a, b] (porque es el incremento
                             o
“entero” que se obtiene al sumar sus incrementos infinitesimales). Los n´meros
                                                                            u
a y b se llaman l´ımites de la integral. Para convertir al c´lculo integral en una
                                                            a
teor´ matem´tica eficaz es necesario tener en cuenta estas ideas y tratarlas
    ıa         a
con rigor, pero de momento no vamos a entrar en ello y vamos a limitarnos a
considerar la integraci´n como la operaci´n inversa a la derivaci´n. As´ pues,
                        o                   o                        o      ı
tomamos (3.6) como definici´n de la integral de f . Notemos que si dejamos el
                               o
l´
 ımite superior como variable obtenemos una primitiva concreta G de f , a saber,
146                             Cap´
                                   ıtulo 3. C´lculo diferencial de una variable
                                             a

la unica que cumple G(a) = 0:
   ´
                            Z       x
                     G(t) =             f (x) dx = F (x) − F (a).
                                a

  Cuando queremos referirnos a una primitiva arbitraria de una funci´n usa-
                                                                        o
mos esta misma notaci´n integral, pero omitimos los l´
                     o                               ımites de integraci´n, as´
                                                                        o     ı,
                   Z
                      f (x) dx = F (x) + c, donde c ∈ R.

   Veremos que esta notaci´n es consistente con los otros usos que venimos
                            o
haciendo de los s´
                 ımbolos dx. De la propia definici´n de primitiva se sigue que
                                                   o
                            Z
                              y 0 (x) dx = y(x) + c.

Con la notaci´n dy = y 0 dx esto se escribe as´
             o                                ı:
                                 Z
                                    dy = y + c.

    Cada regla de derivaci´n da lugar a una regla de integraci´n. Por ejemplo,
                          o                                   o
el hecho de que la derivada de una suma es la suma de las derivadas implica
que una suma tiene por primitiva a la suma de las primitivas. M´s en general,
                                                                 a
dadas dos funciones u, v,
           Z                    Z          Z
             (α u + β v) dx = α u dx + β v dx, para α, β ∈ R.

   Uniendo esto a la regla evidente:
                        Z
                                 xn+1
                           xn =       + c,           n 6= −1,
                                 n+1
podemos integrar cualquier polinomio. El caso exceptuado es claro:
                            Z
                              x−1 dx = log x + c.

   La regla de derivaci´n del producto requiere m´s atenci´n: dadas dos funcio-
                       o                         a        o
nes derivables u y v tenemos que d(uv) = udv + vdu, luego integrando tenemos
                            Z              Z
                               u dv = uv − v du.

   Esta f´rmula se conoce como “regla de integraci´n por partes”. Obviamente
         o                                           o
de aqu´ se sigue a su vez la versi´n con l´
      ı                           o       ımites:
                           Z b                Z b
                                          b
                               u dv = [uv]a −     v du.
                            a                        a
3.9. Primitivas                                                                147
                           R
Ejemplo Vamos a calcular xex dx. Para R llamamos u = x y dv = ex dx.
                                 R      ello
Claramente entonces du = dx y v = dv = ex dx = ex . La f´rmula anterior
                                                        o
nos da          Z                Z
                   xex dx = xex − ex dx = xex − ex + c.

Observar que hemos omitido la constante al calcular v = ex . Es claro que para
aplicar la regla podemos tomar como v una primitiva fija cualquiera.
                      R
Ejemplo Sea Im,n = senm x cosn x dx. Vamos a encontrar unas expresiones
recurrentes que nos permitan calcular estas integrales. Integramos por partes
tomando u = cosn−1 x, dv = senm x cos x dx. De este modo:
                                          Z
              senm+1 x cosn−1 x    n−1
    Im,n =                      +            senm+1 x cosn−2 x sen x dx
                    m+1            m+1
                                          Z
              senm+1 x cosn−1 x    n−1
          =                     +            senm x cosn−2 x(1 − cos2 x) dx
                    m+1            m+1
              senm+1 x cosn−1 x    n−1
          =                     +        (Im,n−2 − Im,n ).
                    m+1            m+1
   Despejando llegamos a

                            senm+1 x cosn−1 x   n−1
                   Im,n =                     +     Im,n−2 .
                                 m+n            m+n
   Similarmente se prueba

                             senm−1 x cosn+1 x   m−1
                  Im,n = −                     +     Im−2,n .
                                  m+n            m+n
   Estas f´rmulas reducen el c´lculo de cualquier integral Im,n al c´lculo de las
          o                   a                                     a
cuatro integrales
             Z       Z             Z             Z
                dx,    sen x dx,      cos x dx,     sen x cos x dx,

y todas ellas son inmediatas (para la ultima aplicamos la f´rmula del seno del
                                      ´                    o
a
´ngulo doble).
    Por ultimo veamos en Rqu´ se traduce la regla de la cadena. Supongamos
        ´                      e
que tenemos una integral u(x) dx, que F (x) es una primitiva de u(x) (la que
queremos calcular) y que x = x(t) es una funci´n derivable con derivada no nula
                                                  o
(que por consiguiente tiene inversa derivable t = t(x)). Entonces por la regla
de la cadena F (x(t))0 = F 0 (x(t)) x0 (t) = u(x(t))x0 (t), luego
                        Z
                           u(x(t)) x0 (t) dt = F (x(t)) + c.
                       R
As´ pues, para calcular u(x) dx podemos sustituir x por x(t) y dx por x0 (t) dt y
   ı
calcular una primitiva G(t) de la funci´n resultante, ´sta ser´ F (x(t)) + c, luego
                                       o              e       a
148                                    Cap´
                                          ıtulo 3. C´lculo diferencial de una variable
                                                    a

si sustituimos G(t(x)) = F (x(t(x))) + c = F (x) + c, obtenemos una primitiva de
la funci´n original. A esta t´cnica se la llama integraci´n por sustituci´n. La
         o                       e                             o               o
versi´n con l´
     o        ımites es:
  Z t(b)                                                                 Z b
         u(x(t)) x0 (t) dt = F (x(t(b))) − F (x(t(a))) = F (b) − F (a) =     u(x) dx,
  t(a)                                                                       a

o sea:                 Z                     Z
                             b                   t(b)
                                 u(x) dx =              u(x(t)) x0 (t) dt.
                         a                   t(a)

                                 R√
Ejemplo Vamos a calcular             1 − x2 dx. El integrando est´ definido en el
                                                                 a
intervalo ]−1, 1[. Consideramos la funci´n x = sen t, definida y biyectiva en
                                             o
]0, π[. Entonces dx = cos t dt y se cumple
     Z p               Z p                        Z           Z
                                                                1 + cos 2t
          1 − x2 dx =       1 − sen2 t cos t dt = cos2 t dt =              dt
                                                                    2
           Z         Z
         1         1                  t    1             t   1
       =     dt +       2 cos 2t dt = + sen 2t + c = + sen t cos t + c
         2         4                  2 4                2 2
                                            √
                               arcsen x x 1 − x2
                           =            +           + c.
                                   2            2


    En general, si la primitiva de una funci´n en un intervalo ]a, b[ se extiende
                                            o
continuamente al intervalo [a, b], dicha extensi´n es obviamente unica, por lo
                                                o                   ´
que podemos calcular la integral desde a hasta b, que se interpreta como el
incremento completo de la primitiva. As´ en el ejemplo anterior tenemos
                                         ı,
                                   Z   1p           π
                                         1 − x2 dx = .
                                     −1             2


3.10       Ap´ndice: La trascendencia de e y π
             e
    Para acabar el cap´ ıtulo probaremos que las constantes e y π que nos han
aparecido son n´meros trascendentes (sobre Q). Supondremos al lector familia-
                u
rizado con la teor´ de n´meros algebraicos. Aunque es muy sencillo probar que
                   ıa     u
casi todos los n´meros reales son trascendentes, pues el conjunto de n´meros
                 u                                                      u
algebraicos es numerable y R no lo es. No es f´cil, en cambio, probar la tras-
                                                   a
cendencia de un n´mero particular. Hermite fue el primero en demostrar la
                     u
trascendencia de e y Lindemann prob´ despu´s la de π. Aqu´ veremos unas
                                          o       e               ı
pruebas m´s sencillas, pero hay que se˜alar que la prueba de Lindemann se ge-
           a                              n
neraliza a un teorema m´s potente, en virtud del cual los valores que toman las
                          a
funciones sen x, cos x, ex , log x, etc. sobre n´meros algebraicos son—salvo los
                                                u
casos triviales— n´meros trascendentes. Por ello a estas funciones se les llama
                    u
tambi´n funciones trascendentes.
      e
3.10. Ap´ndice: La trascendencia de e y π
        e                                                                                                   149

  Comenzamos introduciendo unos convenios utiles de notaci´n:
                                          ´               om
                                                           P
                             r
Definici´n 3.40 Escribiremos h = r!, de modo que si f (z) =
       o                                                      cr z r ∈ C[z],
                                                                                                r=0
entonces f (h) representar´
                          a
                                             m
                                             X                m
                                                              X
                                   f (h) =          cr hr =          cr r!
                                             r=0               r=0

    Igualmente, f (z + h) ser´ el polinomio que resulta de sustituir y r por hr = r!
                             a
en la expresi´n desarrollada de f (z + y). Concretamente:
             o
                                                            √m                 !
            Xm                 X X µr ∂
                                m      r                 X X µr ∂
                                                         m
f (z + y) =     cr (z + y)r =      cr        z r−k y k =         cr       z r−k y k ,
            r=0                r=0
                                          k                           k
                                              k=0                            k=0   r=k

luego
              m
                √m             µ ∂    !      m
                                               √m                   !   m
              X X               r r−k        X X     r!                 X
                                                                r−k
f (z + h) =                 cr    z     k! =               cr z       =   f k) (z),
                                k                 (r − k)!
              k=0     r=k                            k=0      r=k                                     k=0

         k)
donde f (z) es la k-´sima derivada formal del polinomio f . Observar que
                    e
                                                    m
                                                    X
                                   f (z + h) =            cr (z + h)r ,
                                                    r=0
pues
              m                         m           m                  m
                                                                         √m                     !k)
              X                         X           X                  X X
                               r                           r k)                             r
                    cr (z + h)      =         cr        (z )       =                 cr z
              r=0                       r=0         k=0                k=0     r=0
                                        Xm
                                    =         f k) (z) = f (z + h).
                                        k=0

   As´ mismo,
     ı
                                        m
                                        X                   m
                                                            X
                        f (0 + h) =           f k) (0) =           cr r! = f (h).
                                        k=0                 r=0
   Sea                                              ∞
                                                    X      zn
                                    ur (z) = r!                  .
                                                    n=1
                                                        (r + n)!
   Teniendo en cuenta que
                                             |z|n         |z|n
                                         (r+n)!
                                                     <         ,
                                                           n!
                                           r!

es claro que la serie converge en todo C y que |ur (z)| < e|z| . Llamaremos
                                                      ur (z)
                                         ≤r (z) =            .
                                                       e|z|
   As´ |≤r (z)| < 1.
     ı,
150                                      Cap´
                                            ıtulo 3. C´lculo diferencial de una variable
                                                      a

                          P
                          s                            Ps
Teorema 3.41 Sea φ(z) =      cr z r ∈ C[z]. Sea ψ(z) =     cr ≤r (z)z r . Enton-
                         r=0                           r=0
ces
                     ez φ(h) = φ(z + h) + ψ(z)e|z| .
             ´
   Demostracion: En primer lugar
                     X µr ∂
                     r                 r
                                       X r!          r
                                                     X zk
          (z + h)r =        z k hr−k =      z k = r!      ,
                         k               k!            k!
                                 k=0                      k=0                  k=0

y por otro lado
                                 ∞
                                 X zk               ∞
                                                    X              ∞
                                                                   X zk      ∞
                                                                             X zk
      z           r                                   zn     r
  r!e − ur (z)z       = r!                − r!              z = r!      − r!
                                       k!      n=1
                                                   (r + n)!          k!        k!
                                 k=0                                         k=0       k=r+1
                                 Xr
                                       zk
                      = r!                ,
                                       k!
                                 k=0

o sea, (z + h)r = r!ez − ur (z)z r , y por lo tanto

               ez hr = (z + h)r + ur (z)z r = (z + h)r + e|z| ≤r (z)z r .

Multiplicando por cr y sumando en r obtenemos la igualdad buscada.

Teorema 3.42 Sea m ≥ 2 y f (x) ∈ Z[x]. Definimos los polinomios F1 y F2
mediante:
                      xm−1                      xm
            F1 (x) =          f (x), F2 (x) =          f (x).
                     (m − 1)!                 (m − 1)!
Entonces F1 (h), F2 (h) ∈ Z, F1 (h) ≡ f (0) (m´d m) y F2 (h) ≡ 0 (m´d m).
                                              o                    o
                                              P
                                              r
             ´
   Demostracion: Sea f (x) =                        ar xr , con ar ∈ Z. Entonces
                                              r=0

                      s
                      X                                        s
                                                               X
                                 xr+m−1                                   (r + m − 1)!
           F1 (x) =         ar            ,         F1 (h) =         ar                ∈Z
                      r=0
                                 (m − 1)!                      r=0
                                                                            (m − 1)!

y m divide a cada sumando excepto quiz´ al primero, que es a0 = f (0). Por lo
                                        a
tanto F1 (h) ≡ f (0) (m´d m). Con F2 se razona an´logamente.
                       o                         a
   Como ultimo preliminar recordemos que p(x1 , . . . , xn ) ∈ A[x1 , . . . , xn ] es un
               ´
polinomio sim´trico si para toda permutaci´n σ de las variables se cumple que
                    e °                       ¢       o
p(x1 , . . . , xn ) = p σ(x1 ), . . . , σ(xn ) . Los polinomios sim´tricos elementales de
                                                                   e
n variables son los polinomios e0 , . . . , en tales que ei es la suma de todos los mo-
nomios posibles formados por i variables distintas. Por ejemplo, los polinomios
sim´tricos elementales de tres variables son
    e

           e0 = 1,    e1 = x + y + z,               e2 = xy + xz + yz,          e3 = xyz.

   Vamos a usar los dos resultados siguientes sobre polinomios elementales:
3.10. Ap´ndice: La trascendencia de e y π
        e                                                                               151

     Todo polinomio sim´trico p(x1 , . . . , xn ) es de la forma q(e1 , . . . , en ),
                        e
     para cierto polinomio q(x1 , . . . , xn ).
     Los coeficientes (x − α1 ) · · · (x − αn ) son (−1)i ei (α1 , . . . , αn ), para
     i = 0, . . . , n.

Teorema 3.43 El n´mero e es trascendente.
                 u

                 ´
   Demostracion: Si e fuera algebraico ser´ la ra´ de un polinomio con
                                           ıa     ız
                             P
                             n
coeficientes enteros. Digamos   ct e = 0, con n ≥ 1, ct ∈ Z, c0 6= 0 (si c0
                                   t
                                     t=0
fuera 0 podr´
            ıamos dividir entre e y quedarnos con un polinomio menor).
   Sea p un primo tal que p > n y p > |c0 |. Sea

                              xp−1 °                              ¢p
                   φ(x) =             (x − 1)(x − 2) · · · (x − n) .
                             (p − 1)!

   Por el teorema 3.41:
               n
               X                    n
                                    X                     n
                                                          X
          0=         ct et φ(h) =         ct φ(t + h) +         ct ψ(t)et = S1 + S2 .
               t=0                  t=0                   t=0

   Tomando m = p, el teorema 3.42 nos da que φ(h) ∈ Z y

                             φ(h) ≡ (−1)pn (n!)p (m´d p).
                                                   o

   Si 1 ≤ t ≤ n, entonces

                     (x + t)p−1 °                                                ¢p
      φ(t + x) =                 (x + t − 1)(x + t − 2) · · · x · · · (x + t − n) ,
                      (p − 1)!

y sacando el factor x queda
                                                   xp
                                φ(t + h) =               f (x),
                                                (p − 1)!

con f (x) ∈ Z[x]. Por el teorema 3.42 tenemos que φ(t + h) ∈ Z y es un m´ltiplo
                                                                        u
de p. Ahora,
                 n
                 X
          S1 =         ct φ(t + h) ≡ c0 φ(h) ≡ c0 (−1)pn (n!)p 6≡ 0 (m´d p),
                                                                      o
                 t=0

ya que c0 6= 0 y p > n, |c0 |. As´ pues, S1 ∈ Z y S1 6= 0, luego |S1 | ≥ 1. Como
                                 ı
S1 + S2 = 0, lo mismo vale para S2 , es decir, |S2 | ≥ 1. Por otro lado, sea
       Ps
φ(x) =     ar xr . Entonces
       r=0
                      Ø s            Ø
                      ØX             Ø X s                    s
                                                              X
                      Ø             rØ
             |ψ(t)| = Ø   ar ≤r (t)t Ø ≤   |ar | |≤r (t)|tr ≤   |ar |tr .
                      Ø              Ø
                          r=0                  r=0                     r=0
152                                   Cap´
                                         ıtulo 3. C´lculo diferencial de una variable
                                                   a

    Observemos que |ar | es el coeficiente de grado r del polinomio
                                xp−1 °                       ¢p
                                        (x + 1) · · · (x + n) .
                               (p − 1)!
                                                              °            ¢p
   Basta ver que si bi es el coeficiente de grado i de (x − 1) · · · (x − n) ,
                                             °                     ¢p
entonces |bi | es el coeficiente de grado i de (x + 1) · · · (x + n) , pero

               |bi | = |(−1)pn−i enp−i (1, . . . , n, . . . , 1, . . . , n)|
                     = (−1)pn−i enp−i (−1, . . . , −n, . . . , −1, . . . , −n).
    Por lo tanto podemos concluir:
                        s
                        X                   tp−1 °                             ¢p
             |ψ(t)| ≤         |ar |tr =            (t + 1)(t + 2) · · · (t + n) ,
                        r=0
                                          (p − 1)!

y en definitiva:
                                                   °                      ¢p−1
                                                    t(t + 1) · · · (t + n)
             |ψ(t)| ≤ (t + 1)(t + 2) · · · (t + n)                             .
                                                           (p − 1)!
   Pero esta expresi´n tiende a 0 cuando p tiende a infinito (por la convergencia
                     o
de la serie de la funci´n exponencial). En consecuencia, tomando p suficiente-
                       o
                                          P
                                          n
mente grande podemos exigir que S2 =         ct ψ(t)et cumpla |S2 | < 1, cuando
                                                   t=0
hemos demostrado lo contrario para todo p. Esto prueba que e es trascendente.

   La trascendencia de π es algo m´s complicada de probar. Adem´s de los
                                    a                          a
teoremas 3.41 y 3.42 necesitaremos otro resultado auxiliar:
Teorema 3.44 Sea p(x) = dxm + d1 xm−1 + · · · + dm−1 x + dm ∈ Z[x], sean
                      ıces en C y sea q(x1 , . . . , xm ) ∈ Z[x1 , . . . , xm ] un polinomio
α1 , . . . , αm sus ra´
sim´trico. Entonces q(dα1 , . . . , dαm ) ∈ Z.
     e
              ´
    Demostracion: Claramente
dm−1 p(x) = (dx)m + d1 (dx)m−1 + dd2 (dx)m−2 + · · · + dm−2 dm−1 (dx) + dm−1 dm .
    O sea, dm−1 p(x) = r(dx), donde
      r(x) = xm + d1 xm−1 + dd2 xm−2 + · · · + dm−2 dm−1 x + dm−1 dm ∈ Z[x]
es un polinomio m´nico y sus ra´
                          o                   ıces son obviamente dα1 , . . . , dαm . Conse-
cuentemente, r(x) = (x − dα1 ) · · · (x − dαm ) y los coeficientes de r(x) son
(−1)i ei (dα1 , . . . , dαm ) para i = 0, . . . m. As´ pues, ei (dα1 , . . . , dαm ) ∈ Z para
                                                         ı
i = 1, . . . , m.
   Por otro lado sabemos que q(x1 , . . . , xm ) = r(e1 , . . . , em ) para cierto polino-
mio r(x1 , . . . , xm ) ∈ Z[x1 , . . . , xm ], luego
                                 °                                                       ¢
       q(dα1 , . . . , dαm ) = r e1 (dα1 , . . . , dαm ), . . . , em (dα1 , . . . , dαm ) ∈ Z.
3.10. Ap´ndice: La trascendencia de e y π
        e                                                                                           153

Teorema 3.45 El n´mero π es trascendente.
                 u
              ´
    Demostracion: Si π es algebraico tambi´n lo es iπ. Sea
                                          e

                        dxm + d1 xm−1 + · · · + dm−1 x + dm ∈ Z[x]

un polinomio tal que d 6= 0 y con ra´ iπ. Sean ω1 , . . . , ωm sus ra´
                                      ız                                ıces en C.
Como una de ellas es iπ y eiπ + 1 = 0, tenemos que (1 + eω1 ) · · · (1 + eωm ) = 0,
o sea,
                                   m
                                  2X −1
                              1+         eαt = 0,
                                                 t=1
donde α1 , . . . , α2m −1 son ω1 , . . . , ωm , ω1 + ω2 , . . . , ωm−1 + ωm , . . . , ω1 + · · · + ωm .
   Supongamos que c − 1 de ellos son nulos y n = 2m − 1 − (c − 1) no son nulos.
Orden´moslos como α1 , . . . , αn , 0, . . . , 0. As´ c ≥ 1 y
     e                                                 ı
                                                n
                                                X
                                           c+          eαt = 0.                                   (3.7)
                                                 t=1

    Notemos lo siguiente:

                         ei (x1 , . . . , xn ) = ei (x1 , . . . , xn , 0, . . . , 0),

donde ei es a la izquierda el polinomio sim´trico elemental de n variables y a la
                                           e
derecha el de 2m − 1 variables. Por lo tanto

                         ei (dα1 , . . . , dαn ) = ei (dα1 , . . . , dα2m −1 )

     = ei (dω1 , . . . , dωm , dω1 + dω2 , . . . , dωm−1 + dωm , . . . , dω1 + · · · + dωm ).
    Sea qi (x1 , . . . , xm ) = ei (x1 , . . . , xm , x1 +x2 , . . . , xm−1 +xm , . . . , x1 +· · ·+xm ).
    Claramente se trata de polinomios sim´tricos con coeficientes enteros y
                                                          e

                           ei (dα1 , . . . , dαn ) = qi (dω1 , . . . , dωm ),

luego el teorema anterior nos permite afirmar que ei (dα1 , . . . , dαn ) ∈ Z.
   Si s(x1 , . . . , xn ) ∈ Z[x1 , . . . , xn ] es sim´trico, entonces s depende polin´mi-
                                                      e                               o
camente de los ei , luego s(dα1 , . . . , dαn ) ∈ Z. Sea p un primo tal que p > |d|,
p > c, p > |dn α1 · · · αn |. Sea
                                dnp+p−1 xp−1 °                         ¢p
                      φ(x) =                  (x − α1 ) · · · (x − αn ) .
                                  (p − 1)!
    Multiplicamos (3.7) por φ(h) y aplicamos el teorema 3.41. Nos queda
                        n
                        X                      n
                                               X
             cφ(h) +          φ(αt + h) +            ψ(αt )e|αt | = S0 + S1 + S2 = 0.
                        t=1                    t=1

    Ahora,
                               xp−1 p−1 °                             ¢p
                   φ(x) =              d (dx − dα1 ) · · · (dx − dαn ) .
                              (p − 1)!
154                                     Cap´
                                           ıtulo 3. C´lculo diferencial de una variable
                                                     a

    Los coeficientes de (y − dα1 ) · · · (y − dαn ) son polinomios sim´tricos elemen-
                                                                     e
tales sobre dα1 , . . . , dαn , luego son enteros, seg´n hemos visto antes. De aqu´
                                                      u                            ı
se sigue que tambi´n son enteros los coeficientes de (dx − dα1 ) · · · (dx − dαn ),
                       e
con lo que
                                       np
                                xp−1 X
                  φ(x) =                  gr xr , donde cada gr ∈ Z.
                             (p − 1)! r=0

    Por el teorema 3.42 tenemos que φ(h) ∈ Z y φ(h) ≡ g0 (m´d p). Concre-
                                                                      o
tamente, g0 = (−1)pn dp−1 (dα1 · · · dαn )p , luego por la elecci´n de p resulta que
                                                                 o
p - g0 (aqu´ es importante que dα1 · · · dαn ∈ Z porque es el t´rmino indepen-
            ı                                                       e
diente de (y − dα1 ) · · · (y − dαn ). Como p - c, resulta que p - S0 = cφ(h).
    Nos ocupamos ahora de S1 . Tenemos que

                       dnp+p−1 (αt + x)p−1 °
        φ(αt + x) =                         (x + αt − α1 ) · · · (x + αt − αt−1 )
                            (p − 1)!
                                                                                            ¢p
                                                      x(x + αt − αt+1 ) · · · (x + αt − αn )

              xp                    °
       =            dp (dαt + dx)p−1 (dx + dαt − dα1 ) · · · (dx + dαt − dαt−1 )
           (p − 1)!
                                                                                         ¢p
                                              (dx + dαt − dαt+1 ) · · · (dx + dαt − dαn )

                                                 np−1
                                                 X
                                           xp
                                    =                 frt xr ,
                                        (p − 1)! r=0

donde frt = fr (dαt , dα1 , . . . , dαt−1 , dαt+1 , . . . , dαn ) y fr es un polinomio sim´-
                                                                                          e
trico respecto a todas las variables excepto la primera, con coeficientes enteros
y que no depende de t. En efecto, consideramos el polinomio
            °           ¢p−1 ≥°                      ¢ °                     ¢¥p
             y − (−x1 )              y − (x2 − x1 ) · · · (y − (xn − x1 )        .

Sus coeficientes son los polinomios sim´tricos elementales actuando sobre −x1
                                            e
(p−1 veces) y sobre x2 −x1 , . . . , xn −x1 (p veces cada uno), luego son polinomios
                                                              np−1
                                                                P
sim´tricos en x2 , . . . , xn . Digamos que el polinomio es
   e                                                                sr (x1 , . . . , xn )y r .
                                                                          r=0
Entonces
                             np−1
                             X
                       xp
      φ(αt + x) =                 dp sr (dαt , dα1 , . . . , dαt−1 , dαt+1 , . . . , dαn )dr xr ,
                    (p − 1)! r=0

es decir, fr = dr+p sr (x1 , . . . , xn ). Por lo tanto,
                      n
                                                   √ n
                                               np−1 X
                                                          !
                      X                  xp    X
                          φ(αt + x) =                  frt xr ,
                      t=1
                                      (p − 1)! r=0 t=1
3.10. Ap´ndice: La trascendencia de e y π
        e                                                                                   155

pero
                n
                X           n
                            X
                    frt =         fr (dαt , dα1 , . . . , dαt−1 , dαt+1 , . . . , dαn ),
                t=1         t=1
                  P
                  n
y el polinomio      fr (xt , x1 , . . . , xt−1 , xt+1 , . . . xn ) es sim´trico (respecto a todas
                                                                         e
                  t=1          Pn
las variables), luego Fr =           frt depende sim´tricamente de dα1 , . . . , dαn y por
                                                             e
                                  t=1
lo tanto es un entero. As´ pues,
                         ı
                            n
                            X                               np−1
                                                            X
                                                      xp
                                  φ(αt + x) =                    Fr xr ,
                            t=1
                                                   (p − 1)! r=0

                                                         P
                                                         n
y por el teorema 3.42 concluimos que S1 =                      φ(αt + h) ∈ Z y es m´ltiplo de p
                                                                                   u
                                                         t=1
(aqu´ hemos usado que (φ1 + φ2 )(h) = φ1 (h) + φ2 (h), lo cual es evidente).
    ı
     Esto nos da que S0 + S1 ∈ Z y no es un m´ltiplo de p. En particular
                                                    u
|S0 + S1 | ≥ 1 y, por la ecuaci´n S0 + S1 + S2 = 0 resulta que tambi´n S2 ∈ Z y
                                 o                                  e
|S2 | ≥ 1. Como en el caso de e, ahora probaremos lo contrario.
                 np+p−1
                   P
     Sea ψ(x) =          cr ≤r (x)xr . Entonces
                     r=0
                       Ønp+p−1            Ø np+p−1
                       Ø X                Ø   X
                       Ø                 rØ
              |ψ(x)| = Ø       cr ≤r (x)x Ø ≤      |cr | |xr |
                       Ø                  Ø
                                  r=0                        r=0
                             |d|np+p−1 |x|p−1 °                                 ¢p
                        ≤                      (|x| + |α1 |) · · · (|x| + |αn |)
                                 (p − 1)!

(por el mismo razonamiento que en la prueba de la trascendencia de e) y as´
                                                                          ı

                                                   M 2np+2p−2
                                        |ψ(x)| ≤              ,
                                                    (p − 1)!

donde M es una cota que no depende de p.
    Como M 2np+2p−2 ≤ M 2np+2p = M (2n+2)p = K p = KK p−1 , tenemos que

                                                       K p−1
                                        |ψ(x)| ≤ K
                                                      (p − 1)!

y la sucesi´n converge a 0 cuanto p tiende a infinito, pues la serie converge
           o
a KeK . Esto para cada x fijo. Tomando un primo p suficientemente grande
                           P
                           n
podemos exigir que |S2 | ≤   |ψ(αt )|e|αt | < 1, con lo que llegamos a una con-
                                   t=1
tradicci´n.
        o
Cap´
   ıtulo IV

C´lculo diferencial de varias
  a
variables

   Este cap´ıtulo est´ dedicado a generalizar a funciones de varias variables las
                     a
ideas que introdujimos en el cap´
                                ıtulo anterior. B´sicamente se trata de estudiar
                                                 a
c´mo var´ una funci´n de varias variables cuando incrementamos ´stas infinite-
 o       ıa          o                                             e
simalmente. M´s concretamente estudiaremos una funci´n f : A ⊂ Rn −→ Rm ,
               a                                         o
donde A es un abierto, aunque a efectos de interpretar la teor´ nos centraremos
                                                              ıa
de momento en el caso en que m = 1.


4.1     Diferenciaci´n
                    o
    Pensemos por ejemplo en una funci´n f : R2 −→ R. Mientras una funci´n de
                                      o                                  o
una variable derivable en un punto tiene asociada una unica recta tangente que
                                                       ´
la aproxima, una funci´n de dos variables tiene (o puede tener) una tangente
                       o
distinta para cada direcci´n. La figura muestra (a la izquierda) una tangente a
                          o
la gr´fica de f en un punto, y a la derecha vemos varias tangentes distintas en
     a
ese mismo punto.


                              f (a)




                    a + hv   a



   Intuitivamente est´ claro qu´ es la recta tangente a una superficie en un
                     a         e
punto y en una direcci´n. Ahora vamos a caracterizar matem´ticamente este
                       o                                     a

                                      157
158                            Cap´
                                  ıtulo 4. C´lculo diferencial de varias variables
                                            a

                                                                      ´
concepto. Tenemos un punto a ∈ Rn y una recta que pasa por a. Esta queda
determinada por un vector v ∈ Rn no nulo. Podemos suponer kvk = 1 (mientras
no se indique lo contrario, todas las normas que consideraremos ser´n eucl´
                                                                   a      ıdeas).
Los puntos de la recta son los de la forma a+hv, con h ∈ R. M´s concretamente,
                                                               a
el punto a + hv es el que se encuentra a una distancia |h| de a sobre dicha recta
(el signo de h distingue los dos puntos en estas condiciones).
    Buscamos una recta que se parece a la gr´fica de f alrededor del punto a.
                                                a
Si la gr´fica fuera rectil´
        a                ınea en la direcci´n considerada, su pendiente vendr´
                                           o                                    ıa
dada por
                                f (a + hv) − f (a)
                                                   ,
                                         h
para cualquier h 6= 0. Si no es as´ entonces esta expresi´n se parecer´ m´s a
                                     ı,                    o             a a
la pendiente que buscamos cuanto menor sea h. Ello nos lleva a la definici´n    o
siguiente:
Definici´n 4.1 Dada una funci´n f : A ⊂ Rn −→ Rm definida en un abierto,
        o                        o
un punto a ∈ A y un vector v ∈ Rn no nulo, llamaremos derivada direccional
de f en a y en la direcci´n de v al vector
                         o
                                        f (a + hv) − f (a)
                      f 0 (a; v) = l´
                                    ım                     ∈ Rm .
                                   h→0          h
    Es f´cil ver que si existe f 0 (a; v) entonces existe f 0 (a; λv) = λf 0 (a, v) para
        a
todo λ ∈ R  {0}. Por lo tanto no perdemos generalidad si suponemos kvk = 1.
Si existe f 0 (a; v), para valores peque˜os de h tenemos la aproximaci´n
                                          n                                o
                           f (a + hv) ≈ f (a) + h f 0 (a; v),
con lo que la expresi´n h f 0 (a; v) aproxima el incremento que experimenta f (a)
                     o
cuando la variable se incrementa h unidades en la direcci´n de v.
                                                            o
    En el caso m = 1 la funci´n a+hv 7→ f (a)+h f 0 (a; v) se llama recta tangente
                             o
a la gr´fica de f en a. Es claro que se trata de la recta que pretend´
       a                                                                     ıamos
caracterizar.
   Como en el caso de una variable, si una funci´n f : A ⊂ Rn −→ Rn admite
                                                    o
derivada direccional en la direcci´n de v y en todo punto de A, entonces tenemos
                                    o
definida una funci´n
                  o
                               f 0 ( ; v) : A −→ Rm .
   Respecto al c´lculo de derivadas direccionales, las propiedades de los l´
                a                        °                       ¢         ımites
nos dan en primer lugar que si f (x) = f1 (x), . . . , fm (x) , entonces
                                  ° 0                          ¢
                      f 0 (a; v) = f1 (a; v), . . . , fm (a; v) ,
                                                       0


entendiendo que la derivada de f existe si y s´lo si existen las derivadas de
                                                 o
todas las funciones coordenadas fi . Por consiguiente el c´lculo de derivadas
                                                            a
direccionales se reduce al caso de funciones f : A ⊂ Rn −→ R. A su vez ´stas
                                                                          e
se reducen al c´lculo de derivadas de funciones de una variable. Efectivamente,
               a
basta considerar la funci´n φ(h) = f (a + hv). El hecho que que A sea abierto
                         o
implica claramente que φ est´ definida en un entorno de 0 y comparando las
                                a
definiciones es claro que f 0 (a; v) = φ0 (0).
4.1. Diferenciaci´n
                 o                                                                     159

Ejemplo Vamos a calcular la derivada de f (x, y) = x2 y 2 en el punto (2, 1) y
en la direcci´n (−1, 1). Para ello consideramos
             o

                     φ(h) = f (2 − h, 1 + h) = (2 − h)2 (1 + h)2 .

Entonces φ0 (h) = −2(2 − h)(1 + h)2 + 2(2 − h)2 (1 + h) y φ0 (0) = 4.
    Existen unas derivadas direccionales especialmente simples de calcular y es-
pecialmente importantes en la teor´ Se trata de las derivadas en las direcciones
                                   ıa.
de la base can´nica de Rn .
              o

Definici´n 4.2 Sea f : A ⊂ Rn −→ Rm una funci´n definida en un abierto y
        o                                            o
a ∈ A. Se define la derivada parcial de f respecto a la i-´sima variable en el
                                                          e
punto a como
                                  ∂f
                       Di f (a) =     (a) = f 0 (a; ei ),
                                  ∂xi
donde ei = (0, . . . , 1, . . . , 0) es el vector con un 1 en la posici´n i-´sima.
                                                                       o    e

   Expl´
       ıcitamente:
                                     f (a1 , . . . , ai + h, . . . , an ) − f (a)
                  Di f (a) = l´
                              ım                                                  ,
                               h→0                        h
luego si h es peque˜o
                   n

                    f (a1 , . . . , ai + h, . . . , an ) ≈ f (a) + h Di f (a).

En otras palabras, la expresi´n h Di f (a) aproxima el incremento que experi-
                             o
menta f (a) cuando incrementamos h unidades la variable xi .
   Si f admite derivada parcial i-´sima en todos los puntos de A entonces
                                   e
tenemos definida la funci´n Di f : A −→ Rm .
                        o
   El c´lculo de las derivadas parciales de una funci´n f : A ⊂ Rn −→ R
        a                                                        o
es mucho m´s simple que el de las derivadas direccionales en general, pues
             a
podemos considerar la funci´n φ(xi ) = f (a1 , . . . , xi , . . . , an ) y entonces es claro
                              o
que Di f (a) = φ0 (ai ). Notar que si f es una funci´n de una variable, entonces
                                                         o
φ = f , luego la derivada parcial respecto de la unica variable coincide con la
                                                       ´
derivada de f en el sentido del cap´  ıtulo anterior. Un poco m´s en general, si
                                                                           a
f : A ⊂ R −→ Rm llamaremos tambi´n derivada de f a su unica derivada
                                           e                                 ´
parcial en un punto a, y la representaremos tambi´n por f 0 (a).
                                                         e

Ejemplo Las derivadas parciales de la funci´n f (x, y) = x2 y 3 son
                                           o
                               ∂f                  ∂f
                                  = 2xy 3 ,           = 3x2 y 2 .
                               ∂x                  ∂y
    En efecto, para calcular la parcial respecto de x en un punto (x0 , y0 ) hay
que derivar la funci´n x 7→ x2 y0 en x0 . La derivada es obviamente 2x0 y0 . En
                    o           3                                         3
                                                               2 3
la pr´ctica podemos ahorrarnos los sub´
     a                                  ındices: para derivar x y respecto de x
160                               Cap´
                                     ıtulo 4. C´lculo diferencial de varias variables
                                               a

basta considerar a y como una constante (la segunda coordenada del punto en
que derivamos) y derivar respecto de x. Lo mismo vale para y.
   Es claro que todas las reglas de derivaci´n de funciones de una variable
                                             o
pueden ser usadas en el c´lculo de derivadas parciales.
                         a
Ejercicio: Sean dos funciones derivables f, g : I ⊂ R −→ Rn . Probar la regla de
derivaci´n (f g)0 = f 0 g + f g 0 . Si n = 3 se cumple tambi´n (f ∧ g)0 = f 0 ∧ g + f ∧ g 0 .
        o                                                   e
    El hecho de que una funci´n admita derivadas direccionales en un punto no
                              o
puede ser equiparado a la derivabilidad de una funci´n de una variable. Por
                                                       o
ejemplo, la existencia de derivadas direccionales no implica siquiera la conti-
nuidad de la funci´n en el punto. La generalizaci´n adecuada del concepto de
                    o                              o
funci´n derivable es el concepto de “funci´n diferenciable”, que vamos a intro-
     o                                    o
ducir ahora.
    Recordemos que si una funci´n de una variable f tiene derivada en un
                                  o
punto a, entonces podemos definir su diferencial en a, que es una aplicaci´n    o
lineal df (a) : R −→ R con la propiedad de que f (a) + df (a)(x − a) es una recta
que “se confunde” con f alrededor de a. Una funci´n de varias variables ser´
                                                     o                           a
diferenciable cuando exista una aplicaci´n lineal que juegue un papel an´logo:
                                        o                                 a

Definici´n 4.3 Sea f : A ⊂ Rn −→ Rm una funci´n definida en un abierto A.
        o                                       o
Sea a ∈ A. Diremos que f es diferenciable en A si existe una aplicaci´n lineal
                                                                     o
φ : Rn −→ Rm tal que
                                  f (a + v) − f (a) − φ(v)
                           l´
                            ım                             = 0.
                           v→0              kvk
    Para analizar esta definici´n conviene comenzar probando lo siguiente:
                              o

Teorema 4.4 Sea f : A ⊂ Rn −→ Rm una funci´n diferenciable en un punto
                                               o
a ∈ A. Sea φ : Rn −→ Rm una aplicaci´n lineal que cumpla la definici´n
                                          o                                 o
anterior. Entonces, para cada vector v ∈ Rn no nulo existe f 0 (a; v) y adem´s
                                                                            a
φ(v) = f 0 (a; v).
                  ´
   Demostracion: Obviamente hv tiende a 0 cuando h tiende a 0. Por lo
tanto, restringiendo el l´
                         ımite de la definici´n de diferenciabildad concluimos que
                                            o
                                 f (a + hv) − f (a) − φ(hv)
                          l´
                           ım                               = 0.
                         h→0                khvk
    Usando que φ y la norma son lineales vemos que
                         µ                              ∂
                      1    f (a + hv) − f (a)    h
                l´
                 ım                           −     φ(v) = 0.
                h→0 kvk            |h|          |h|
   Claramente podemos eliminar el factor 1/kvk sin que el l´
                                                           ımite var´ Ahora
                                                                    ıe.
multiplicamos por la funci´n R  {0} −→ {±1} dada por h 7→ |h|/h y usamos
                          o
que el producto de una funci´n que tiende a 0 por otra acotada tiende a 0:
                            o
                                 f (a + hv) − f (a)
                           l´
                            ım                      − φ(v) = 0,
                          h→0            h
4.1. Diferenciaci´n
                 o                                                                161

   Por lo tanto existe
                                         f (a + hv) − f (a)
                      f 0 (a; v) = l´
                                    ım                      = φ(v).
                                  h→0            h

    En particular vemos que si f es diferenciable en a existe una unica aplicaci´n
                                                                  ´             o
lineal φ que cumple la definici´n de diferenciabilidad, a saber, la dada por
                                 o
φ(v) = f 0 (a; v).
Definici´n 4.5 Sea f : A ⊂ Rn −→ Rm una funci´n diferenciable en un punto
        o                                        o
a ∈ A. Llamaremos diferencial de f en a a la unica aplicaci´n lineal, represen-
                                             ´             o
tada por df (a) : Rn −→ Rm , que cumple
                              f (a + v) − f (a) − df (a)(v)
                        l´
                         ım                                 = 0.
                        v→0               kvk
   El teorema anterior afirma que para todo v ∈ Rn  {0} se cumple
                                  df (a)(v) = f 0 (a; v).
   Consideremos el caso m = 1. Entonces, para un vector unitario v, la funci´n
                                                                            o
       a + hv 7→ f (a) + df (a)(hv) = f (a) + h df (a)(v) = f (a) + hf 0 (a; v)
es la recta tangente a f por a y en la direcci´n de v. Cuando h var´ en R
                                                o                       ıa
y v var´ entre los vectores unitarios, el punto x = a + hv var´ en todo Rn
        ıa                                                        ıa
y la aplicaci´n x 7→ f (a) + df (a)(x − a) recorre todos los puntos de todas las
             o
rectas tangentes a f por a. Puesto que se trata de una aplicaci´n af´ dichas
                                                                 o    ın,
tangentes forman un hiperplano.
    En resumen, hemos probado que para que una aplicaci´n (con m = 1) sea
                                                            o
diferenciable en un punto a es necesario que tenga rectas tangentes por a en to-
das las direcciones y que adem´s ´stas formen un hiperplano. A este hiperplano
                                a e
se le llama hiperplano tangente a la gr´fica de f en a. De la propia definici´n
                                         a                                   o
de diferencial (haciendo v = x − a) se sigue que para puntos x cercanos a a se
cumple
                           f (x) ≈ f (a) + df (a)(x − a).
   El miembro derecho es precisamente el hiperplano tangente a f en a. Esta
expresi´n indica, pues, que dicho hiperplano aproxima a f alrededor de a.
       o
162                           Cap´
                                 ıtulo 4. C´lculo diferencial de varias variables
                                           a

   La figura de la derecha muestra la gr´fica de la funci´n
                                        a                  o
                              ( 3 3
                                y −x
                                x2 +y 2  si (x, y) 6= (0, 0)
                   f (x, y) =
                                   0     si (x, y) = (0, 0)

   Vemos tambi´n cuatro tangentes en (0, 0). Como no se encuentran sobre el
               e
mismo plano, concluimos que esta funci´n no es diferenciable en (0, 0).
                                      o
    Pasamos ahora al c´lculo de la diferencial de una funci´n. Como primeras
                        a                                         o
observaciones elementales notamos que si f es lineal entonces df (a) = f y si f
es constante (alrededor de a) entonces df (a) = 0 (la aplicaci´n nula). Ambos
                                                                    o
hechos se demuestran comprobando que con las elecciones indicadas para φ se
cumple trivialmente la definici´n de diferencial.
                                o
                               °                     ¢
    Para una funci´n f (x) = f1 (x), . . . , fm (x) , las propiedades de los l´
                   o                                                          ımites
nos dan que f es diferenciable en un punto a si y s´lo si lo es cada funci´n
                                                            o                    o
coordenada fi , y en tal caso
                                  °                            ¢
                     df (a)(v) = df1 (a)(v), . . . , dfm (a)(v) .

   Para determinar df (a) es suficiente conocer su matriz en las bases can´nicas
                                                                         o
de Rn y Rm . Dicha matriz tiene por filas las im´genes de los vectores ei de la
                                                 a
base can´nica.
        o

Definici´n 4.6 Sea f : A ⊂ Rn −→ Rm una funci´n diferenciable en un punto
         o                                            o
a ∈ A. Llamaremos matriz jacobiana de f en a a la matriz Jf (a) que tiene por
filas a las derivadas parciales Di f (a).
                                     °                  ¢
   M´s concretamente, si f (x) = f1 (x), . . . , fm (x) , el coeficiente de la fila i,
      a
columna j de Jf (a) es Di fj (a).
   Si m = 1, se llama vector gradiente de f en a al vector formado por las
derivadas parciales de f en a. Se representa:
                                 °                         ¢
                        ∇f (a) = D1 f (a), . . . , Dn f (a) .

   Si ei es el vector i-´simo de la base can´nica, sabemos que
                        e                   o

                         df (a)(ei ) = f 0 (a; ei ) = Di f (a),

luego la matriz jacobiana de f es simplemente la matriz de df (a) en las bases
can´nicas de Rn y Rm . As´ pues,
   o                      ı

                                df (a)(v) = vJf (a).

   Cuando m = 1, usando el producto escalar en lugar del producto de matrices
tenemos tambi´n
             e
                                       ∂f                   ∂f
               df (a)(v) = ∇f (a)v =       (a) v1 + · · · +     (a) vn .
                                       ∂x1                  ∂xn
4.1. Diferenciaci´n
                 o                                                                    163

    Consideremos en particular la funci´n polin´mica xi , es decir, la funci´n
                                           o       o                           o
Rn −→ R dada por (x1 , . . . , xn ) 7→ xi . Es claro que ∇xi (a) = ei , luego
dxi (a)(v) = vi . Por consiguiente, la ecuaci´n anterior puede escribirse como
                                             o

                           ∂f                           ∂f
            df (a)(v) =        (a) dx1 (a)(v) + · · · +     (a) dxn (a)(v).
                           ∂x1                          ∂xn

   Como esto es v´lido para todo v, tenemos la ecuaci´n funcional
                 a                                   o

                              ∂f                        ∂f
                   df (a) =       (a) dx1 (a) + · · · +     (a) dxn (a).
                              ∂x1                       ∂xn

   Si f : A ⊂ Rn −→ R es diferenciable en todos los puntos de A podemos
considerar df , dxi como funciones de A en el espacio de aplicaciones lineales de
Rn en R y la ecuaci´n anterior nos da
                     o

                                   ∂f                ∂f
                           df =        dx1 + · · · +     dxn .
                                   ∂x1               ∂xn

    Esta f´rmula expresa que si cada variable experimenta un incremento infi-
             o
nitesimal dxi entonces la funci´n f experimenta un incremento df de la forma
                                    o
que se indica. Como en el caso de una variable, la expresi´n ha de enten-
                                                                  o
derse en realidad como una igualdad funcional que a cada vector de incrementos
(∆x1 , . . . , ∆xn ) le asigna una aproximaci´n del incremento ∆f que experimenta
                                             o
la funci´n.
         o
    Similarmente, en el caso m > 1 tenemos

                      df = (df1 , . . . , dfm ) = (dx1 , . . . , dxn ) Jf.

Ejemplo Consideremos la funci´n ]0, +∞[ × ]−π, π[ −→ R2 dada por
                             o

                                      x = ρ cos θ,
                                      y = ρ sen θ.

    Podr´ıamos demostrar que es diferenciable aplicando la definici´n, pero m´s
                                                                   o        a
adelante ser´ inmediato (teorema 4.11), as´ que vamos a aceptar que lo es y
            a                                ı
calcularemos su diferencial. Para ello calculamos la matriz jacobiana:
                             ∂x            ∂y  µ                                ∂
                             ∂ρ            ∂ρ       cos θ               sen θ
            J(x, y)(ρ, θ) =                   =
                              ∂x            ∂y     −ρ sen θ             ρ cos θ
                              ∂θ            ∂θ
Por consiguiente
                                        µ                          ∂
                                               cos θ       sen θ
           (dx, dy) = (dρ, dθ)
                                            −ρ sen θ     ρ cos θ
                        = (cos θ dρ − ρ sen θ dθ, sen θ dρ + ρ cos θ dθ),
164                            Cap´
                                  ıtulo 4. C´lculo diferencial de varias variables
                                            a

o m´s claramente:
   a

                            dx = cos θ dρ − ρ sen θ dθ,
                            dy = sen θ dρ + ρ cos θ dθ.

   Tambi´n podr´
        e      ıamos haber calculado dx y dy de forma independiente.



4.2     Propiedades de las funciones diferenciables
    Vamos a estudiar las funciones diferenciables. Entre otras cosas obtendremos
un criterio sencillo que justificar´ la diferenciabilidad de la mayor´ de funcio-
                                  a                                  ıa
nes de inter´s. Comenzamos observando que en funciones de una variable la
             e
diferenciabilidad equivale a la derivabilidad.

Teorema 4.7 Sea f : A ⊂ R −→ Rm una funci´n definida en un abierto A y
                                                 o
sea a ∈ A. Entonces f es diferenciable en a si y s´lo si existe la derivada de f
                                                   o
en a. Adem´s en tal caso df (a)(h) = f 0 (a)h.
           a

             ´
   Demostracion: Si f es derivable en a entonces existe

                                     f (a + h) − f (a)
                       f 0 (a) = l´
                                  ım                   = k,
                                 h→0         h
luego
                             f (a + h) − f (a) − kh
                         l´
                          ım                        = 0,
                         h→0           h
y si multiplicamos por la funci´n acotada h/|h| el l´
                               o                    ımite sigue siendo 0, es decir,
tenemos
                             f (a + h) − f (a) − kh
                         l´
                          ım                         = 0,
                         h→0           |h|
lo que indica que f es diferenciable y que df (a)(h) = f 0 (a)h.
    El rec´
          ıproco se prueba igualmente, partiendo de que df (a)(h) = kh se llega
a que existe f 0 (a) = k.

Teorema 4.8 Si f : A ⊂ Rn −→ Rm es diferenciable en un punto a, entonces
f es continua en a.

             ´
   Demostracion: Tenemos que

                            f (a + v) − f (a) − df (a)(v)
                      l´
                       ım                                 = 0.
                      v→0               kvk

   Multiplicamos por kvk, que tambi´n tiende a 0, con lo que
                                   e

                       l´ f (a + v) − f (a) − df (a)(v) = 0.
                        ım
                      v→0
4.2. Propiedades de las funciones diferenciables                                   165

   La aplicaci´n df (a) es lineal, luego es continua, luego tiende a 0, luego
              o

                              l´ f (a + v) − f (a) = 0,
                               ım
                              v→0

y esto equivale a
                                    l´ f (x) = f (a),
                                     ım
                                    x→a

luego f es continua en a.
   Las propiedades algebraicas de la derivabilidad de funciones son v´lidas
                                                                     a
tambi´n para la diferenciabilidad:
     e

Teorema 4.9 Sean f y g funciones diferenciables en un punto a. Entonces
  a) f + g es diferenciable en a y d(f + g)(a) = df (a) + dg(a).
  b) Si α ∈ R entonces αf es diferenciable en a y d(αf )(a) = α df (a).
  c) f g es diferenciable en a y d(f g)(a) = g(a)df (a) + f (a)dg(a).
  d) si g(a) 6= 0 entonces f /g es diferenciable en a y

                                          g(a)df (a) − f (a)dg(a)
                           d(f /g)(a) =                           .
                                                   g 2 (a)

             ´
   Demostracion: Veamos por ejemplo la propiedad c). Llamemos

            f (a + v) − f (a) − df (a)(v)               g(a + v) − g(a) − dg(a)(v)
   E(v) =                                 ,   F (v) =                              .
                        kvk                                        kvk
   Ambas funciones est´n definidas en un entorno de 0 y tienden a 0. Adem´s
                      a                                                 a

f (a + v) − f (a) = df (a)(v) + kvkE(v),      g(a + v) − g(a) = dg(a)(v) + kvkF (v).

   Entonces

(f g)(a + v) − (f g)(a) = f (a + v)g(a + v) − f (a)g(a + v) + f (a)g(a + v) − f (a)g(a)
                 °                 ¢                 °                 ¢
              = f (a + v) − f (a) g(a + v) + f (a) g(a + v) − g(a) .
Sustituimos f (a + v) − f (a), g(a + v) y g(a + v) − g(a) usando las igualdades
anteriores. Al operar queda
                               °                       ¢
      (f g)(a + v) − (f g)(a) − g(a)df (a) + f (a)dg(a) = df (a)(v)dg(a)(v)
      °                                                       ¢
 +kvk df (a)(v)F (v) + E(v)g(a) + E(v)dg(a)(v) + f (a)F (v) + kvk2 E(v)F (v).
   Hay que probar que el miembro derecho dividido entre kvk tiende a 0. El
unico t´rmino para el que esto no es inmediato es
´      e
                                  df (a)(v)dg(a)(v)
                                                    ,
                                         kvk
166                                Cap´
                                      ıtulo 4. C´lculo diferencial de varias variables
                                                a

pero kdf (a)(v)dg(a)(v)k ≤ kdf (a)k kdg(a)k kvk2 , luego la norma del cociente
est´ mayorada por
   a
                            kdf (a)k kdg(a)k kvk,
que tiende a 0.
   Veamos ahora la versi´n en varias variables de la regla de la cadena.
                        o

Teorema 4.10 (Regla de la cadena) Consideremos f : A ⊂ Rn −→ Rm y
g : B ⊂ Rm −→ Rk de modo que f [A] ⊂ B. Si f es diferenciable en un punto
a ∈ A y g es diferenciable en f (a), entonces f ◦ g es diferenciable en a y
                                                 °     ¢
                        d(f ◦ g)(a) = df (a) ◦ dg f (a) .

   Demostracion: Llamemos h = f ◦ g y b = f (a). Dado un v ∈ Rn tal que
                ´
a + v ∈ A, tenemos

            h(a + v) − h(a) = g(f (a + v)) − g(f (a)) = g(b + u) − g(b),

donde u = f (a + v) − f (a). Consideremos las funciones

            f (a + v) − f (a) − df (a)(v)                       g(b + u) − g(b) − dg(b)(u)
   E(v) =                                 ,          F (u) =                               ,
                        kvk                                                kuk

definidas en un entorno de 0 y con l´
                                   ımite 0. Se cumple
                                             °                   ¢
h(a + v) − h(a) = dg(b)(u) + kukF (u) = dg(b) df (a)(v) + kvkE(v) + kukF (u)
              ≥           °     ¢¥              °    ¢
             = df (a) ◦ dg f (a) (v) + kvk dg(b) E(v) + kukF (u).

   Basta probar que
                                    °    ¢ kuk
                            l´ dg(b) E(v) +
                             ım                 F (u) = 0,
                           v→0              kvk

para lo cual basta a su vez probar que la funci´n kuk/kvk est´ acotada en un
                                               o              a
entorno de 0. Ahora bien,
                      ∞                   ∞
              kuk     ∞df (a)(v) + kvkE(v)∞
                   =                        ≤ kdf (a)k + kE(v)k,
              kvk               kvk

y, como E tiende a 0 en 0, est´ acotada en un entorno de 0.
                              a
   Como consecuencia, J(f ◦ g)(a) = Jf (a)Jg(f (a)).
    Equivalentemente, supongamos que tenemos una funci´n z = z(y1 , . . . , ym ),
                                                                  o
donde a su vez yi = yi (x1 , . . . , xn ). Entonces la regla de la cadena nos dice que,
si las funciones son diferenciables,

                ∇z t (x1 , . . . , xn ) = Jy(x1 , . . . , xn )∇z t (y1 , . . . , ym ),
4.2. Propiedades de las funciones diferenciables                                                        167

luego
                                ∂z    ∂z ∂y1           ∂z ∂ym
                                    =         + ··· +         .
                                ∂xi   ∂y1 ∂xi         ∂ym ∂xi
    ´
    Esta es la forma expl´
                         ıcita de la regla de la cadena.
    En otros t´rminos, si tenemos dz expresado como combinaci´n lineal de
                   e                                                        o
dy1 , . . . , dym y cada dyi como combinaci´n lineal de dx1 , . . . , dxn , es decir,
                                           o

                             dz = (dy1 , . . . , dyn )∇z(y1 , . . . , ym )t ,

                      (dy1 , . . . , dyn ) = (dx1 , . . . , dxn )Jy(x1 , . . . , xn ),
entonces, para expresar a dz como combinaci´n lineal de dx1 , . . . , dxn basta
                                               o
sustituir el segundo grupo de ecuaciones en la primera, pues as´ obtenemos
                                                               ı

(dx1 , . . . , dxn )Jy(x1 , . . . , xn )∇z(y1 , . . . , ym )t = (dx1 , . . . , dxn )∇z t (x1 , . . . , xn ),

es decir, dz(x1 , . . . , xn ).
                                            p
Ejemplo Consideremos las funciones z = x2 + y 2 , x = ρ cos θ, y = ρ sen θ.
Suponemos ρ > 0, con lo que (x, y) 6= (0, 0) y todas las funciones son diferen-
ciables (ver el teorema 4.11, m´s abajo). Claramente
                               a
                                     x                 y
                           dz   p =        dx + p            dy,
                                  x2 + y 2          x2 + y 2
                           dx = cos θ dρ − ρ sen θ dθ,
                           dy = sen θ dρ + ρ cos θ dθ.

    Entonces
            ρ cos θ °                     ¢ ρ sen θ °                     ¢
     dz =            cos θ dρ − ρ sen θ dθ +         sen θ dρ + ρ cos θ dθ = dρ,
               ρ                               ρ
que es el mismo resultado que se obtiene si diferenciamos directamente la funci´n
                                                                               o
compuesta z(ρ, θ) = ρ.
    Es importante comprender que el paso del primer grupo de ecuaciones a la
expresi´n de dz en funci´n de ρ y θ no es una mera manipulaci´n algebraica,
        o                 o                                      o
sino que se fundamenta en la regla de la cadena. En este caso particular, lo que
dice la regla de la cadena es:

        Si llamamos z(ρ, θ) a la funci´n que resulta de sustituir x e y en
                                        o
        z(x, y) por sus valores en funci´n de ρ y θ, entonces la diferencial
                                          o
        de esta funci´n es la que resulta de sustituir x, y, dx, dy en dz(x, y)
                     o
        por sus valores en funci´n de ρ, θ, dρ, dθ, respectivamente.
                                o

    Y esto no es evidente en absoluto.
  El teorema siguiente es el unico criterio de diferenciabilidad que necesitare-
                             ´
mos en la pr´ctica:
            a
168                                Cap´
                                      ıtulo 4. C´lculo diferencial de varias variables
                                                a

Teorema 4.11 Sea f : A ⊂ Rn −→ Rm , donde A es un abierto en Rn . Si f
tiene derivadas parciales continuas en A entonces f es diferenciable en A.

                  ´
    Demostracion: Podemos suponer m = 1, pues si f tiene derivadas par-
ciales continuas en A lo mismo vale para sus funciones coordenadas, y si ´stas
                                                                         e
son diferenciables f tambi´n lo es.
                          e
   Sea a ∈ A. Vamos a probar que f es diferenciable en a. Para ello basta
probar que
                                        Pn
                    f (a + v) − f (a) −     Di f (a)vi
                                        i=1
                l´
                 ım                                    = 0,
                v→0                kvk
lo que a su vez equivale a que, dado ≤ > 0, exista un δ > 0 de modo que si
kvk < δ entonces
                   Ø                                 Ø
                   Ø                                 Ø
                   Øf (a + v) − f (a) − P Di f (a)vi Ø < ≤kvk.
                                        n
                   Ø                                 Ø
                                                  i=1

    Por la continuidad de las derivadas parciales tenemos que existe un δ > 0 tal
que si ky − ak < δ entonces y ∈ A y |Di f (y) − Di f (a)| < ≤/n para i = 1, . . . , n.
Fijemos un v tal que kvk < δ.
   Definimos Fi = f (a1 + v1 , . . . , ai + vi , ai+1 , . . . , an ). En particular, vemos
que f (a + v) = Fn y f (a) = F0 , luego
         Ø                                 Ø Øn                                  Ø
         Ø                                 Ø Ø                                   Ø
         Øf (a + v) − f (a) − P Di f (a)vi Ø = Ø P (Fi − Fi−1 − Di f (a)vi )Ø
                              n
         Ø                                 Ø Ø                                   Ø
                                   i=1                  i=1

                                   P
                                   n
                               ≤         |Fi − Fi−1 − Di f (a)vi |.
                                   i=1

   As´ pues, (teniendo en cuenta que |vi | ≤ kvk) basta probar que
     ı
                                                               ≤
                             |Fi − Fi−1 − Di f (a)vi | <         |vi |,
                                                               n
para i = 1, . . . , n. Esto resulta de aplicar el teorema del valor medio a la funci´n
                                                                                    o
de una variable dada por

             gi (t) = f (a1 + v1 , . . . , ai−1 + vi−1 , ai + tvi , ai+1 , . . . , an ).

     Esta funci´n est´ definida en un intervalo abierto que contiene al intervalo
                o     a
[0, 1], y el hecho de que f tenga derivadas parciales implica que gi es derivable
en su dominio. En particular es derivable en ]0, 1[ y continua en [0, 1]. Adem´s,
                                                                              a
es claro que
           0
          gi (t) = Di f (a1 + v1 , . . . , ai−1 + vi−1 , ai + tvi , ai+1 , . . . , an )vi .

   El teorema del valor medio nos da que existe 0 < t0 < 1 tal que
                                                      0
                       Fi − Fi−1 = gi (1) − gi (0) = gi (t0 )(1 − 0).
4.2. Propiedades de las funciones diferenciables                                         169

   Notemos que y = (a1 + v1 , . . . , ai−1 + vi−1 , ai + t0 vi , ai+1 , . . . , an ) cumple
               ky − ak = k(v1 , . . . , vi−1 , t0 vi , 0, . . . , 0)k ≤ kvk < δ,
luego
                                                                            ≤
            |Fi − Fi−1 − Di f (a)vi | = |Di f (y) − Di f (a)| |vi | <         |vi |,
                                                                            n
como hab´ que probar.
        ıa

Definici´n 4.12 Supongamos que una funci´n f : A ⊂ Rn −→ Rm admite
          o                                   o
derivada parcial respecto a una variable xi en todo el abierto A. Si a su vez
la funci´n Di f admite derivada parcial respecto a la variable xj en A, a esta
        o
derivada se la representa por Dij f . Tambi´n se usa la notaci´n
                                           e                  o
                                                ∂2f
                                     Dij f =           .
                                               ∂xi ∂xj
Cuando el ´
          ındice es el mismo se escribe
                                                 ∂2f
                                       Dii f =       .
                                                 ∂x2
                                                   i

Las funciones Dij f se llaman derivadas segundas de f . M´s generalmente, la
                                                                a
funci´n Di1 ···ik f ser´ la funci´n que resulta de derivar f respecto de i1 , derivar
     o                 a         o
dicha parcial respecto a i2 , etc. Alternativamente,
                                           ∂kf
                                                        ,
                                      ∂xk11 · · · ∂xkrr
                                        i           i

donde k1 + · · · + kr = k, representar´ la funci´n que resulta de derivar k1 veces
                                      a         o
f respecto a i1 , luego k2 veces la funci´n resultante respecto a i2 , etc. Estas
                                          o
funciones de llaman derivadas parciales de orden k de la funci´n f .
                                                                o
   Diremos que f es de clase C k en A si existen todas sus derivadas parciales
de orden k en A y todas ellas son continuas en A. En particular, las funciones
de clase C 0 son las funciones continuas.
    Obviamente una funci´n es de clase C k+1 si y s´lo si todas sus derivadas
                            o                            o
parciales son de clase C k . El teorema anterior afirma que todas las funciones
de clase C 1 son diferenciables. Si una funci´n f es de clase C 2 , entonces su
                                                 o
derivadas parciales son de clase C 1 , luego son diferenciables, luego son continuas
y por lo tanto f es tambi´n de clase C 1 . Por el mismo argumento se prueba en
                           e
general que si k ≤ r entonces toda funci´n de clase C r es de clase C k .
                                           o
    Las reglas de derivaci´n justifican inmediatamente que la suma y el producto
                          o
por un escalar de funciones de clase C k es una funci´n de clase C k . El producto
                                                       o
de funciones de clase C k (con valores en R) es de clase C k . Lo mismo vale para
el cociente si exigimos que el denominador no se anule.
Ejercicio: Probar que la composici´n de dos funciones de clase C k es de clase C k .
                                  o
   Ahora vamos a probar un teorema muy importante sobre derivadas sucesivas,
pues nos dice que el orden de derivaci´n no importa:
                                      o
170                             Cap´
                                   ıtulo 4. C´lculo diferencial de varias variables
                                             a

Teorema 4.13 (Teorema de Schwarz) Si f : A ⊂ Rn −→ Rm es una funci´n
                                                                  o
de clase C 2 en el abierto A, entonces Dij f (a) = Dji f (a).

                      ´
    Demostracion: No perdemos generalidad si suponemos m = 1. Tambi´n          e
podemos suponer que n = 2, pues en general podemos trabajar con la funci´n     o
F (xi , xj ) = f (a1 , . . . , xi , . . . , xj , . . . an ).
    As´ pues, probaremos que D12 f (a) = D21 f (a). Sea a = (a1 , a2 ). Considere-
        ı
mos la funci´n o

      ∆f (h) = f (a1 + h, a2 + h) − f (a1 + h, a2 ) − f (a1 , a2 + h) + f (a1 , a2 ),

definida en un entorno de 0. Vamos a probar que
                                                   ∆f (h)
                               D12 f (a) = l´ +
                                            ım            .
                                            h→0     h2
Por simetr´ este l´
          ıa      ımite ser´ tambi´n D21 f (a) y el teorema estar´ probado.
                           a      e                              a
   Dado ≤ > 0, la continuidad de D12 f en a implica que existe un h0 > 0 tal
que si 0 < k, k0 < h, entonces |D12 f (a1 + k, a2 + k0 ) − D12 f (a1 , a2 )| < ≤.
   Podemos tomar h0 suficientemente peque˜o para que si 0 < h < h0 la funci´n
                                               n                                  o

                             G(t) = f (t, a2 + h) − f (t, a2 )

est´ definida en el intervalo [a1 , a1 + h]. Por el teorema del valor medio existe
   e
un n´mero 0 < k < h tal que
     u

              ∆f (h) = G(a1 + h) − G(a1 ) = hG0 (a1 + k)
                        °                                          ¢
                     = h D1 f (a1 + k, a2 + h) − D1 f (a1 + k, a2 ) .

   Ahora aplicamos el teorema del valor medio a la funci´n
                                                        o

                                H(x) = D1 f (a1 + k, t)

en el intervalo [a2 , a2 + h], que nos da un n´mero 0 < k0 < h tal que
                                              u

        D1 f (a1 + k, a2 + h) − D1 f (a1 + k, a2 ) = D12 f (a1 + k, a2 + k0 )h.

   En total tenemos que

                          ∆f (h) = D12 f (a1 + k, a2 + k0 )h2 ,

luego                  Ø        Ø
                       Ø ∆f (h) Ø
                       Ø        Ø                     0
                       Ø h2 Ø = |D12 f (a1 + k, a2 + k )| < ≤,
siempre que 0 < h < h0 .
    El teorema de Schwarz implica claramente que al calcular cualquier derivada
parcial de orden k de una funci´n de clase C k es irrelevante el orden en que
                                o
efectuemos las derivadas.
4.2. Propiedades de las funciones diferenciables                               171

    Ahora vamos a encaminarnos a probar el teorema de la funci´n inversa.
                                                                        o
Esencialmente se trata de probar que las inversas de las funciones biyectivas y
diferenciables son diferenciables. La situaci´n es m´s complicada que en el caso
                                              o       a
de una variable, pues en el cap´  ıtulo anterior vimos que toda funci´n derivable
                                                                      o
cuya derivada no se anula es mon´tona, mientras que no hay ning´n resultado
                                     o                                u
an´logo para el caso de varias variables. Por ello vamos a necesitar varios
   a
resultados previos. Entre otras cosas, nos apoyaremos en el concepto de extremo
relativo y su relaci´n con la diferenciabilidad. La situaci´n en esto s´ es an´loga
                    o                                      o           ı      a
a la de una variable.

Definici´n 4.14 Sea f : A ⊂ Rn −→ R y a ∈ A. Diremos que f tiene un
         o
m´ınimo relativo en a si existe un entorno G de a tal que para todo p ∈ G se
cumple f (p) ≥ f (a). Similarmente se define un m´ximo relativo. Diremos que
                                                  a
a es un extremo relativo si es un m´ximo o un m´
                                   a            ınimo relativo.

Teorema 4.15 Sea f : A ⊂ Rn −→ R una funci´n diferenciable en un punto
                                                 o
a ∈ A. Si f tiene un extremo relativo en a, entonces df (a) = 0.

   Demostracion: Sea v ∈ Rn y consideremos la funci´n φ(h) = f (a + hv),
                 ´                                       o
para un cierto vector v ∈ Rn , definida en un entorno de 0. Es claro que φ tiene
un extremo relativo en 0. Sea g(h) = a + hv. Por la regla de la cadena
                                      °    ¢°        ¢
            0 = φ0 (0) = dφ(0)(1) = df φ(0) dg(0)(1) = df (a)(v).



Teorema 4.16 Sea f : Bδ (a) ⊂ Rn −→ Rn una aplicaci´n continua, diferen-
                                                        o
ciable en Bδ (a), y tal que para todo y ∈ Bδ (a) se cumpla |Jf (y)| 6= 0. Su-
pongamos adem´s que para todo x ∈ ∂Bδ (a) se cumple f (x) 6= f (a). Entonces
 £      §       a
f Bδ (a) es un entorno de f (a).

   Demostracion: Sea g : ∂Bδ (a) −→ R la aplicaci´n definida mediante
                 ´                                      o
g(x) = kf (x) − f (a)k. Por compacidad alcanza su m´ınimo en un punto x. Por
hip´tesis m = g(x) > 0. Tenemos, pues, que¢g(z) £≥ g(x), para todo z tal que
   o                                  °                 §
kz − ak = δ. Vamos a probar que Bm/2 f (a) ⊂ f Bδ (a) .
                   °    ¢
   Sea y ∈ Bm/2 f (a) . Consideremos la funci´n h : Bδ (a) −→ R dada por
                                                o
h(x) = kf (x) − yk. Por compacidad alcanza su m´ınimo en un punto z y, puesto
que h(a) = kf (a) − yk < m/2, vemos que h(z) < m/2.
   Si x ∈ ∂Bδ (a), entonces
                                                               m     m  m
h(x) = kf (x) − yk ≥ kf (x) − f (a)k − kf (a) − yk > g(x) −      ≥m−   = ,
                                                               2     2  2
luego h(x) no es el m´
                     ınimo de h. En otros t´rminos, z ∈ ∂Bδ (a), luego z ∈ Bδ (a)
                                           e          /
   Es claro que h2 tambi´n alcanza su m´
                         e                ınimo en z y
                                       n
                                       X
                            h2 (x) =       (fk (x) − yk )2 .
                                       k=1
172                            Cap´
                                  ıtulo 4. C´lculo diferencial de varias variables
                                            a

   Por consiguiente,
                                 n
                                 X
                   Dj h2 (z) =         2(fk (z) − yk )Dj fk (z) = 0,
                                 k=1
                                               °         ¢
pues z es un extremo. Matricialmente tenemos f (z) − y Jf (z)t £= 0 y § como el
determinante de la matriz es no nulo por hip´tesis, y = f (z) ∈ f Bδ (a) .
                                            o

Teorema 4.17 Sea f : A ⊂ Rn −→ Rn una aplicaci´n inyectiva, diferenciable
                                                      o
en el abierto A y tal que |Jf (x)| 6= 0 para todo x ∈ A. Entonces f es abierta,
luego f : A −→ f [A] es un homeomorfismo.
                  ´
    Demostracion: Sea U un abierto en A. Veamos que f [U ] es abierto en
Rn . Tomemos un punto a ∈ U y veamos que f [U ] es entorno de f (a). Existe
un δ > 0 tal que Bδ (a) ⊂ U , y la restricci´n de f a esta bola cerrada est´ en las
                                            o       £       §              a
hip´tesis del teorema anterior. Por consiguiente f Bδ (a) ⊂ f [U ] es un entorno
   o
de f (a).
   Ahora ya podemos probar el teorema de la funci´n inversa.
                                                 o

Teorema 4.18 (Teorema de la funci´n inversa) Sea f : A ⊂ Rn −→ Rn
                                           o
una funci´n inyectiva de clase C k , con k ≥ 1, en el abierto A y tal que se cumpla
           o
|Jf (x)| 6= 0 para todo x ∈ A. Entonces B = f [A] es abierto y f −1 : B −→ A es
de clase C k en B.

     Demostracion: Llamemos g = f −1 . Por el teorema anterior f y g son
                  ´
homeomorfismos. Veamos que tiene g parciales continuas. Sea ei el i-´simo    e
vector de la base can´nica de Rn . Sea b ∈ B y a = g(b). Tomemos una bola
                        o
abierta Bη (a) ⊂ A y un α > 0 suficientemente peque˜o tal que el segmento de
                                                            n
extremos b y b + αei est´ contenido en f [Bη (a)]. Sea a0 = g(b + αei ). Entonces
                          e
a0 ∈ Bη (a), luego el segmento de extremos a y a0 est´ contenido en A.
                                                           a
     Claramente f (a0 ) − f (a) = αei . Si fj es la j-´sima funci´n coordenada de
                                                         e       o
f , tenemos
                                fj (a0 ) − fj (a) = αδij ,
donde (δij ) es la matriz identidad. Aplicamos el teorema del valor medio a la
                   °              ¢
funci´n φ(t) = fj a + t(a0 − a) , definida en [0, 1], en virtud del cual existe
     o
0 < t < 1 tal que
                                             °             ¢
          αδij = φ(1) − φ(0) = dφ(t)(1) = dfj a + t(a0 − a) (a0 − a).

Sea z j = a + t(a0 − a). As´
                           ı
                                  n
                                  X
                         αδij =         Dk fj (z j )(a0 − ak ).
                                                      k
                                  k=1

Matricialmente tenemos
                                         °            ¢
                            αI = (a0 − a) Dk fj (z j ) .
4.2. Propiedades de las funciones diferenciables                                       173
                                                                   Ø           Ø
    La funci´n h : An −→ R dada por h(z 1 , . . . , z n ) = Ø(Dk fj (z j ))Ø es continua,
                 o
pues las derivadas parciales son continuas y el determinante es un polinomio.
Por hip´tesis tenemos que h(a, . . . , a) 6= 0, luego existe un entorno de (a, . . . , a)
         o
en el cual h no se anula. Tomando α suficientemente peque˜o podemos exigirn
que (a0 , . . . , a0 ) est´ en una bola de centro (a, . . . , a) contenida en dicho entorno,
                          e
con lo que el punto (z 1 , . . Ø , z n ) que hemos construido tambi´n est´ en dicho
                       Ø           .                                       e     a
entorno, luego Ø(Dk fj (z j ))Ø 6= 0 y podemos calcular la matriz inversa, cuyos
coeficientes se expresan como un cociente de determinantes de matrices cuyos
coeficientes son derivadas parciales. En definitiva obtenemos una expresi´n de           o
la forma                                        °              ¢
                                  a0 − ak
                                     k        Pk Dk fj (z j )
                                           =     °              ¢,
                                       α      Qk Dk fj (z j )
donde Pk y Qk son polinomios. Por definici´n de a y a0 tenemos
                                            o
                                              °            ¢
                   gk (b + αei ) − gk (b)   Pk Dk fj (z j )
                                          =   °             ¢.
                            α               Qk Dk fj (z j )

    Tomando α suficientemente peque˜o podemos conseguir que kz i − ak se
                                          n
haga arbitrariamente peque˜o. Por la continuidad de las derivadas parciales
                              n
podemos exigir que |Dk fj (z j )−Dk fj (a)| se haga arbitrariamente peque˜o y por
                                                                         n
la continuidad de los polinomios Pk y Qk podemos hacer que el miembro derecho
de la ecuaci´n anterior se aproxime cuanto queramos al t´rmino correspondiente
            o                                              e
con a en lugar de los puntos z i . En definitiva, existe
                                                        °            ¢
                             gk (b + αei ) − gk (b)   Pk Dk fj (g(b))
             Di gk (b) = l´
                          ım                        =   °             ¢.
                         α→0          α               Qk Dk fj (g(b))
    M´s a´n, los polinomios Pk y Qk son los que expresan las soluciones de una
     a u
ecuaci´n lineal en t´rminos de sus coeficientes, luego no dependen de b, luego esta
      o             e
expresi´n muestra tambi´n que Di gk es una composici´n de funciones continuas,
       o                 e                             o
luego es continua. M´s en general, si f es de clase C k , entonces g tambi´n lo
                       a                                                     e
es.
     Si f est´ en las condiciones del teorema anterior tenemos que f ◦ f −1 =
             a
    −1
f     ◦ f = 1, luego por la regla de la cadena
                        df (a) ◦ df −1 (b) = df −1 (b) ◦ df (a) = 1,
luego las dos diferenciales son biyectivas y df −1 (b) = df (a)−1 .
   Equivalentemente, si yi (x1 , . . . , xn ) es una transformaci´n biyectiva y dife-
                                                                 o
renciable con determinante jacobiano no nulo y llamamos xi (y1 , . . . , yn ) a la
funci´n inversa, entonces el sistema de ecuaciones
     o
                                     ∂y1                 ∂y1
                          dy1   =        dx1 + · · · +       dxn
                                     ∂x1                 ∂xn
                           .
                           .           .
                                       .                   .
                                                           .
                           .           .                   .
                                     ∂yn                 ∂yn
                          dyn   =        dx1 + · · · +       dxn
                                     ∂x1                 ∂xn
174                             Cap´
                                   ıtulo 4. C´lculo diferencial de varias variables
                                             a

tiene por matriz de coeficientes a la matriz jacobiana de la transformaci´n,          o
luego podemos despejar dx1 , . . . , dxn en funci´n de dy1 , . . . , dyn y as´ obtenemos
                                                 o                           ı
precisamente la diferencial de la funci´n inversa.
                                          o

Ejemplo Como ya advert´     ıamos, al contrario de lo que sucede en una variable,
el hecho de que una aplicaci´n tenga diferencial no nula en todo punto (o incluso
                            o
determinante jacobiano no nulo) no garantiza que sea biyectiva. Por ejemplo,
consideremos f (x, y) = (ex cos y, ex sen y) (vista como aplicaci´n de C en C, se
                                                                 o
trata simplemente de la exponencial compleja). La matriz jacobiana de f es
                            µ                        ∂
                                 ex cos y ex sen y
                               −ex sen y ex cos y
y su determinante en cada punto (x, y) es ex 6= 0. Por otro lado es f´cil ver que
                                                                     a
f no es biyectiva.
   Lo m´ximo que podemos deducir del hecho de que el determinante jacobiano
        a
no se anule es que la funci´n es localmente inyectiva. La prueba se basa en un
                           o
argumento que hemos usado en la prueba del teorema de la funci´n inversa.
                                                                 o
Teorema 4.19 (Teorema de inyectividad local) Sea f : A ⊂ Rn −→ Rn
una funci´n de clase C 1 en el abierto A y sea a ∈ A tal que |Jf (a)| 6= 0.
          o
Entonces existe un entorno B de a tal que |Jf (x)| 6= 0 para todo x ∈ B y f es
inyectiva sobre B.
   Demostracion: La funci´n h : An −→ R dada por
             ´            o
                                           Ø              Ø
                     h(z , . . . , z n ) = Ø(Dk fj (z j ))Ø
                        1


es continua, pues las derivadas parciales son continuas y el determinante es un
polinomio. Por hip´tesis tenemos que h(a, . . . , a) 6= 0, luego existe un entorno
                        o
de (a, . . . , a) en el cual h no se anula. Este entorno lo podemos tomar de la
forma Bδ (a) × · · · × Bδ (a). Tomaremos B = Bδ (a).
    Veamos que si x, y ∈ Bδ (a) y f (x) = f (y) entonces x = y. Consideremos la
funci´n φ(t) = fi (x + t(y − x)), definida en [0, 1]. Claramente es derivable. Por
     o
el teorema del valor medio,
      fi (y) − fi (x) = dφ(ti )(1) = dfi (x + ti (y − x))(y − x) = dfi (z i )(y − x),
donde z i es un punto entre x e y, luego z i ∈ Bδ (a). Por lo tanto
                                           n
                                           X
                       fi (y) − fi (x) =         Dk fi (z i )(yk − xk ),
                                           k=1

lo que matricialmente se expresa como
                        0 = f (y) − f (x) = (y − x)(Dk fi (z i )).
La matriz tiene determinante h(z 1 , . . . , z n ) 6= 0, luego ha de ser x = y.
   Para terminar generalizamos a varias variables un hecho que tenemos pro-
bado para el caso de una:
4.3. Curvas parametrizables                                                  175

Teorema 4.20 Si f : A ⊂ Rn −→ Rm es una funci´n diferenciable en un
                                                    o
abierto conexo A y df = 0, entonces f es constante.
                 ´
    Demostracion: Podemos suponer m = 1. Dados dos puntos a, b ∈ A,
existe una poligonal contenida en A con extremos a y b. Basta probar que f
toma el mismo valor en los v´rtices de la poligonal, luego en definitiva basta
                              e
probar que si a y b son los extremos de un segmento contenido en A entonces
f (a) = f (b). Consideramos la funci´n φ(t) = f (a + t(b − a)) en [0, 1] y le
                                     o
aplicamos el teorema del valor medio. Concluimos que

               f (b) − f (a) = φ0 (t) = df (a + t(b − a))(b − a) = 0.




4.3     Curvas parametrizables
    Las t´cnicas de este cap´
            e                  ıtulo nos capacitan para estudiar curvas m´s efi-
                                                                           a
cientemente que las del cap´  ıtulo anterior. En efecto, all´ estudi´bamos curvas
                                                            ı       a
consider´ndolas como gr´ficas de funciones de una variable, pero esto no per-
           a               a
mite trabajar con curvas cualesquiera. Por ejemplo, una elipse no es la gr´fica
                                                                             a
de ninguna funci´n. Ahora podemos aplicar la derivabilidad al estudio de curvas
                   o
en el sentido de aplicaciones x : I −→ Rn , donde I es un intervalo en R. Para
que una tal aplicaci´n x pueda ser llamada “curva” razonablemente, debere-
                       o
mos exigir al menos que sea continua. Aqu´ nos centraremos en las curvas que
                                              ı
adem´s son derivables. Si una curva est´ definida en un intervalo cerrado [a, b],
      a                                   a
exigiremos que sea derivable en ]a, b[. A estas curvas las llamaremos arcos. Si
x : [a, b] −→ Rn , los puntos x(a) y x(b) se llaman extremos del arco. Concreta-
mente, x(a) es el extremo inicial y x(b) es el extremo final. La gr´fica de una
                                                                       a °     ¢
funci´n continua f : [a, b] −→ R puede identificarse con el arco x(t) = t, x(t) .
      o
De este modo, el tratamiento de los arcos que estamos dando aqu´ generaliza al
                                                                     ı
del cap´ ıtulo anterior.
    Seg´n lo dicho, una curva no es un mero conjunto de puntos en Rn , sino un
       u
conjunto de puntos recorridos de un modo en concreto. Si x(t) es una curva, la
variable t se llama par´metro de la misma. Conviene imaginarse a t como una
                       a
variable temporal, de modo que x(t) es la posici´n en el instante t de un punto
                                                o
m´vil que recorre la curva. La imagen de x es la trayectoria del m´vil.
  o                                                                 o
    Vamos a interpretar la derivabilidad de una curva x(t) en un punto t. Si
existe x0 (t) = v 6= 0, entonces para valores peque˜os de h tenemos
                                                   n
                               x(t + h) − x(t)
                                               ≈ v,                         (4.1)
                                      h
luego x(t+h) ≈ x(t)+hv. La curva x(t)+hv, cuando var´ h, recorre los puntos
                                                         ıa
de una recta, y estamos diciendo que para valores peque˜os de h la curva x se
                                                          n
parece a dicha recta. As´ pues, la recta de direcci´n x0 (t) se confunde con la
                          ı                         o
curva alrededor de x(t), y por ello la llamamos recta tangente a x en x(t). Esto
176                           Cap´
                                 ıtulo 4. C´lculo diferencial de varias variables
                                           a

interpreta la direcci´n de x0 (t). Es f´cil ver que su sentido es el sentido de avance
                       o                 a
al recorrer la curva. Observemos que si f : I −→ R es una funci´n derivable en
                                                       °      ¢        o
un punto t, entonces la tangente del arco x(t) = t, f (t) es la recta de direcci´n
°          ¢                                                                        o
 1, f 0 (t) , luego su pendiente es f 0 (t), luego coincide con la tangente tal y como
la definimos en el cap´   ıtulo anterior.

    Ya tenemos interpretados la direcci´n y el sentido de x0 (t). Falta interpretar
                                         o
su m´dulo. Claramente se trata del l´
      o                                  ımite del m´dulo de (4.1). La cantidad
                                                    o
kx(t + h) − x(t)k es la distancia que recorremos en h unidades de tiempo desde
el instante t, luego al dividir entre |h| obtenemos la distancia media recorrida
por unidad de tiempo en el intervalo de extremos t y t + h, es decir, la velocidad
media en dicho intervalo. El l´  ımite cuando h → 0 es, pues, la velocidad con
que recorremos la curva en el instante t. En realidad los f´
                                                           ısicos prefieren llamar
velocidad a todo el vector x0 (t), de modo que la direcci´n indica hacia d´nde
                                                          o                   o
nos movemos en el instante t y el m´dulo indica con qu´ rapidez lo hacemos.
                                      o                  e

    Conviene precisar estas ideas. La primera ley de Newton afirma que si un
cuerpo est´ libre de toda acci´n externa, permanecer´ en reposo o se mover´ en
           a                  o                     a                     a
l´
 ınea recta a velocidad constante. Todo esto se resume en que su velocidad en
sentido vectorial permanece constante.


Ejemplo Consideremos la curva x(t) = (cos t, sen t), definida en el intervalo
[0, +∞[. Esta curva recorre infinitas veces la circunferencia de centro (0, 0) y
radio 1. Su velocidad es x0 (t) = (− sen t, cos t), cuyo m´dulo es constante igual a
                                                           o
1, esto significa que recorremos la circunferencia a la misma velocidad, digamos
de un metro por segundo. Para que un objeto siga esta trayectoria es necesario
que una fuerza lo obligue a mantenerse a la misma distancia del centro. Por
ejemplo, el m´vil podr´ ser un cuerpo que gira atado a una cuerda. El hecho
               o        ıa
de que x0 (2π) = (0, 1) significa que si en el instante 2π se cortara la cuerda
entonces el cuerpo, libre ya de la fuerza que le reten´ saldr´ despedido hacia
                                                         ıa,     ıa
arriba a raz´n de un metro por segundo.
             o
    Consideremos ahora la curva x(t) = (cos t2 , sen t2 ). Su trayectoria es la
misma, pero ahora la velocidad es x0 (t) = (−2t sen t2 , 2t cos t2 ), cuyo m´dulo es
                                                                            o
2t, lo que significa que ahora el m´vil gira cada vez m´s r´pido. Comienza a
                                     o                       a a
velocidad 0, al dar una vuelta alcanza la velocidad de 2 metros por segundo, a
la segunda vuelta de 4, etc.

    Las consideraciones anteriores muestran que la derivabilidad de una curva
se traduce en la existencia de una recta tangente salvo que la derivada sea nula.
La existencia de una recta tangente en x(t) significa que el arco se confunde con
una recta alrededor de x(t), con lo que el arco no puede formar un “pico” en
x(t). Esto ya no es cierto si x0 (t) = 0. Por ejemplo, la curva x(t) = (t3 , |t3 |) es
derivable en 0, pues su derivada por la izquierda coincide con la de (t3 , −t3 ) y
su derivada por la derecha coincide con la de (t3 , −t3 ), y ambas son nulas, pero
su gr´fica es la misma que la de (t, |t|), es decir, la de la funci´n |x|, que tiene
      a                                                           o
un pico en 0. Esto nos lleva a descartar las curvas con derivada nula.
4.3. Curvas parametrizables                                                 177

Definici´n 4.21 Una curva parametrizada regular x : I −→ Rn es una apli-
         o
caci´n definida sobre un intervalo abierto I ⊂ R derivable y con derivada no
    o
nula en ning´n punto.
            u

   El vector
                                                x0 (t)
                                   T (t) =
                                               kx0 (t)k
se llama vector tangente a x en el punto x(t). La recta que pasa por x(t) con
direcci´n T (t) se llama recta tangente a x por x(t).
       o
    Hemos visto un ejemplo de una misma trayectoria recorrida a velocidades
distintas. Desde un punto de vista geom´trico, lo que importa de una curva
                                            e
es su forma, y no la velocidad con la que se recorre. Vamos a explicitar esta
distinci´n.
        o
    Dado un arco parametrizado x : [a, b] −→ Rn , un cambio de par´metro es
                                                                       a
una aplicaci´n t : [u, v] −→ [a, b] que se extiende a un intervalo abierto mayor
             o
donde es derivable y la derivada no se anula. Por consiguiente t es biyectiva y
t0 tiene signo constante. Diremos que t es un cambio de par´metro directo o
                                                                a
inverso seg´n si t0 > 0 o t0 < 0. El arco parametrizado y(s) = x(t(s)) se llama
            u
reparametrizaci´n de x mediante el cambio de par´metro t.
                 o                                  a
   Diremos que dos arcos parametrizados regulares x e y son (estrictamente)
equivalentes si existe un cambio de par´metro (directo) que transforma uno en
                                       a
otro.
    Es claro que la identidad es un cambio de par´metro directo, la inversa
                                                     a
de un cambio de par´metro (directo) es un cambio de par´metro (directo) y la
                     a                                     a
composici´n de dos cambios de par´metro (directos) es un cambio de par´metro
          o                         a                                  a
(directo). De aqu´ se sigue que la equivalencia y la equivalencia estricta son
                   ı
relaciones de equivalencia entre los arcos parametrizados.
   Llamaremos arcos regulares a las clases de equivalencia estricta de arcos
parametrizados regulares, de modo que dos elementos de la misma clase se
considerar´n dos parametrizaciones de un mismo arco.
          a
    Todas las parametrizaciones de un arco tienen la misma imagen, a la que
podemos llamar imagen del arco. Los cambios de par´metro directos son cre-
                                                     a
cientes, por lo que dos parametrizaciones de un mismo arco tienen los mismos
extremos, a los que podemos llamar extremos del arco.
    Consideremos dos parametrizaciones x : [a, b] −→ Rn , y : [c, d] −→ Rn de
un mismo arco. Entonces y(s) = x(t(s)) para un cierto cambio de par´metro
                                                                       a
directo t. Consideremos ahora dos cambios de par´metro inversos
                                                  a

                   u : [a0 , b0 ] −→ [a, b],    v : [c0 , d0 ] −→ [c, d]

y las reparametrizaciones x(u(r)), y(v(r)). Entonces y(v(r)) = x(t(v(r)) =
x(u(u−1 (t(v(r)))) y v ◦ t ◦ u−1 es un cambio de par´metro directo, luego las
                                                    a
dos reparametrizaciones corresponden a un mismo arco. Por lo tanto, podemos
definir el arco inverso de un arco x al arco resultante de componer con un
cambio de par´metro inverso cualquiera de las parametrizaciones de x. Lo
               a
178                          Cap´
                                ıtulo 4. C´lculo diferencial de varias variables
                                          a

representaremos por −x. Es claro que x y −x tienen la misma imagen, pero el
extremo inicial de x es el extremo final de −x y viceversa.
    De este modo, la noci´n de arco como clase estricta de arcos parametrizados
                         o
recoge el concepto geom´trico de arco regular independiente del modo en que
                         e
se recorre, pero conservando el sentido del recorrido. Si consideramos clases no
estrictas identificamos cada arco con su inverso, y con ello hacemos abstracci´n
                                                                              o
incluso del sentido en que lo recorremos. Todos estos conceptos se aplican
igualmente a curvas cualesquiera.

Longitud de un arco Consideremos el arco x(t) = (r cos t, r sen t), con r > 0.
Su derivada tiene m´dulo r, lo que se interpreta como que el arco recorre la cir-
                    o
cunferencia de centro (0, 0) y radio r a una velocidad constante de r unidades de
longitud por unidad de tiempo. Puesto que recorre la circunferencia completa
en 2π unidades de tiempo, concluimos que el espacio que recorre, es decir, la
longitud de la circunferencia, es 2πr. M´s en general, mediante esta parame-
                                           a
trizaci´n recorremos un arco de α radianes en α unidades de tiempo, luego la
       o
longitud de un arco de α radianes es αr, tal y como anticip´bamos en el cap´
                                                            a               ıtulo
anterior. Vamos a generalizar este argumento para definir la longitud de un arco
arbitrario.
    Sea x : [a, b] −→ Rn un arco y vamos a definir la funci´n s : [a, b] −→ R
                                                              o
tal que s(t) es la longitud de arco entre x(a) y x(t). Obviamente ha de cumplir
s(a) = 0. Supongamos que es derivable y vamos a calcular su derivada en un
punto t. El arco x se confunde con una recta alrededor de x(t). Esto significa
que si h es suficientemente peque˜o el arco entre x(t) y x(t + h) es indistinguible
                                  n
del segmento que une ambos puntos, luego tendremos

                     s(t + h) − s(t) ≈ ±kx(t + h) − x(t)k,

donde el signo es el de h. La aproximaci´n ser´ mejor cuanto menor sea h.
                                         o      a
Dividiendo entre h queda
                                     ∞                 ∞
                     s(t + h) − s(t) ∞ x(t + h) − x(t) ∞
                                     ∞                 ∞.
                                    ≈∞                 ∞
                            h                 h
   Estos dos cocientes se parecer´n m´s cuanto menor sea h, lo que se traduce
                                 a   a
en que los l´
            ımites cuando h → 0 han de coincidir. As´
                                                    ı:
                                  ds
                                     = kx0 (t)k,                             (4.2)
                                  dt
luego                                  Z   t
                              s(t) =           kx0 (u)k du.
                                       a
   En particular, la longitud del arco completo ser´  a
                                     Z b
                             L(x) =      kx0 (t)k dt.
                                           a
4.3. Curvas parametrizables                                                             179

Definici´n 4.22 Diremos que un arco parametrizado regular x : [a, b] −→ Rn
         o
es rectificable si la funci´n kx0 (t)k tiene primitiva en [a, b] (es decir, si tiene
                          o
primitiva en el intervalo abierto y ´sta se extiende continuamente al intervalo
                                     e
cerrado), y entonces llamaremos longitud de x al n´mero real
                                                        u
                                       Z b
                              L(x) =       kx0 (t)k dt.
                                          a

   Notar que como el integrando es positivo, su primitiva ha de ser estricta-
mente creciente, luego L(x) > 0. La longitud de un arco parametrizado coincide
con la de cualquiera de sus reparametrizaciones. En efecto, si y(s) = x(t(s)),
entonces y 0 (s) = x0 (t(s))t0 (s), luego
            Z b                 Z s(b)                        Z s(b)
   L(x) =        kx0 (t)k dt =         kx0 (t(s))kt0 (s) ds =        ky 0 (s)k ds = L(y).
             a                 s(a)                         s(a)


Ejercicio: Comprobar que la longitud de un arco coincide con la de su opuesto, y
que la longitud es invariante por isometr´
                                         ıas.
   Ahora es inmediato comprobar que la longitud de un arco de circunferencia
de radio r y amplitud α es α. En particular la longitud de una circunferencia
de radio r es 2πr. De hecho, los griegos llamaron π a esta constante por ser la
proporci´n entre el per´
        o              ımetro de la circunferencia y su di´metro.
                                                          a
    Sea x : [a, b] −→ Rn un arco rectificable y sea s(t) la longitud de arco entre
x(a) y x(t). Hemos visto que se trata de una funci´n derivable y que s0 (t) =
                                                         o
kx0 (t)k. Por lo tanto s es creciente y biyectiva. Su inversa t : [0, L] −→ [a, b]
es un cambio de par´metro, la funci´n x(s) = x(t(s)) es una reparametrizaci´n
                      a                o                                      o
del arco y
                                                  x0 (t)
                          x0 (s) = x0 (t)t0 (s) = 0      ,
                                                 kx (t)k
luego kx0 (s)k = 1 y as´ x0 (s) = T (s). M´s concretamente, x(s) se caracteriza
                       ı                  a
por que la longitud de arco entre x(0) y x(s) es s. A esta parametrizaci´n   o
del arco la llamaremos parametrizaci´n natural. Tambi´n diremos entonces
                                        o                e
que x est´ parametrizado por el arco Desde un punto de vista cinem´tico, la
          a                                                           a
parametrizaci´n natural se interpreta como la que recorre el arco a velocidad
              o
constante igual a 1 (constante en m´dulo).
                                     o

Ejemplo La trayectoria de un clavo de una rueda que gira se conoce con el
nombre de cicloide. Vamos a calcular la longitud de una vuelta de cicloide.

    Primeramente necesitamos encontrar una parame-
trizaci´n de la curva. Supongamos que la rueda gira
       o                                                       y
sobre el eje y = 0 y que el clavo parte de la posici´n
                                                     o
(0, 0). Si llamamos r al radio de la circunferencia, ve-                        t
mos que cuando la rueda ha girado t radianes su centro                              r
se encuentra en el punto (rt, r), luego el clavo se en-                      x rt
cuentra en x(t) = (rt − r sen t, r − r cos t).
180                                 Cap´
                                       ıtulo 4. C´lculo diferencial de varias variables
                                                 a

   Por consiguiente x0 (t) = r(1 − cos t, − sen t),
                                     √                    t
                         kx0 (t)k = r 2 − 2 cos t = 2r sen .
                                                          2
   Vemos que los m´ltiplos de 2π son puntos singulares de la cicloide. Corres-
                  u
ponden a los momentos en que el clavo toca el suelo. Entonces se para y cambia
de sentido.




   Es f´cil calcular
       a
                         Z    2π                     ∑        ∏2π
                                            t               t
                    L=             2r sen     dt = 4r − cos       = 8r.
                          0                 2               2 0


Ejercicio: Calcular la longitud de la astroide, dada por x(t) = (a cos3 t, a sen3 t).




Ejemplo La trayectoria de un clavo de una rueda que gira sobre una circun-
ferencia se llama epicicloide. El caso m´s simple lo tenemos cuando ambas
                                        a
circunferencias tienen el mismo radio. La curva se llama entonces cardioide,
porque su forma recuerda a un coraz´n.
                                    o

    Supongamos que la circunferencia fija tiene
centro en (a/4, 0) y radio a/4 y que el clavo parte                               θ
de la posici´n (0, 0). Cuando la rueda ha girado α
            o                                                             ρ   α
radianes la situaci´n es la que indica la figura. El
                    o
cuadril´tero tiene dos ´ngulos y dos lados iguales,
       a                a
por lo que los otros dos ´ngulos tambi´n tienen la
                          a             e                          θα
misma amplitud θ. Es claro entonces que
                                             a    a
                                      ρ=       + 2 cos θ,
                                             2    4
luego
                                             a
                                      ρ=       (1 + cos θ),
                                             2
                   ´
donde θ ∈ ]−π, π[. Esta es la ecuaci´n de la cardioide en coordenadas polares.
                                    o
4.3. Curvas parametrizables                                                   181




   Vamos a ver en general cu´l es la °
                               a         expresi´n¢de la longitud de una curva
                                                o
parametrizada en coordenadas polares ρ(t), θ(t) . Notemos que (4.2), para el
caso de dos variables puede escribirse tambi´n como
                                             e

                                   ds2 = dx2 + dy 2 .

    Se dice que ´sta es la expresi´n del elemento de longitud (es decir, de una
                e                 o
longitud infinitesimal) en coordenadas cartesianas. Se trata de la versi´n infi-
                                                                         o
nitesimal del teorema de pit´goras. Si diferenciamos las relaciones x = ρ cos θ,
                             a
y = ρ sen θ obtenemos

            dx = cos θ dρ − ρ sen θ dθ,        dy = sen θ dρ + ρ cos θ dθ.

   Sustituyendo queda
                                  ds2 = dρ2 + ρ2 dθ2 .                       (4.3)

   ´
   Esta es la expresi´n del elemento de longitud de un arco en coordenadas
                      o
polares. Aplicado a la cardioide resulta

                                        a2   a2
                                ds2 =      +    cos θ dθ2 ,
                                        4    4

de donde
                                                 θ
                                   ds = a cos      dθ.
                                                 2

   As´ pues, la longitud de la cardioide es
     ı
                        Z   π                    ∑      ∏π
                                        θ             θ
                   L=           a cos     dθ = 2a sen      = 4a.
                         −π             2             2 −π
182                           Cap´
                                 ıtulo 4. C´lculo diferencial de varias variables
                                           a



Ejemplo Consideremos un cuerpo puntual situado en
(l, 0) atado a una cuerda de longitud l con su otro ex-
tremo en (0, 0). Estiramos de la cuerda de modo que
su extremo suba por el eje Y . La trayectoria del cuerpo
arrastrado por la cuerda recibe el nombre de tractriz.
Vamos a obtener una parametrizaci´n de la tractriz. Un
                                    o
cuerpo estirado por una cuerda se mueve en la direcci´n
                                                      o
de la cuerda, luego ´sta ha de ser tangente a la trayec-
                    e
toria. Si llamamos y = f (x) a la tractriz, definida para
0 < x < l, entonces su recta tangente es

               Y = f (x) + f 0 (x)(X − x).
                                °               ¢
       a                                           ´
Cortar´ al eje Y en el punto 0, f (x) − f 0 (x)x . Este es el punto donde est´
                                                                             a
                                                         °      ¢
el extremo de la cuerda cuando el otro extremo est´ en x, f (x) . La distancia
                                                   a
entre ambos debe ser, pues, igual a l. Por consiguiente:

                                x2 + f 0 (x)2 x2 = l2 .

   Despejando obtenemos
                                        r
                                             l2
                               dy = −           − 1 dx.
                                             x2
El signo negativo se debe a que, tal y como hemos planteado el problema, la
funci´n y ha de ser decreciente. El cambio x = l sen θ biyecta los n´meros
     o                                                                    u
0 < x ≤ l con los n´meros π/2 ≤ θ < π. La igualdad anterior se transforma en
                   u
                 r
                     1                    cos2 θ       l dθ
         dy = −l      2θ
                         − 1 cos θ dθ = l        dθ =       − l sen θ dθ.
                   sen                    sen θ       sen θ
   La posici´n inicial corresponde a x = l, luego a θ = π/2, es decir, y(π/2) = 0,
            o
luego
                                 Z θ           Z θ
                                       dt
                        y(θ) = l            −l      sen t dt.
                                  π/2 sen t     π/2

    Existen reglas de integraci´n que permiten calcular met´dicamente la pri-
                               o                              o
mera primitiva. Como no nos hemos ocupado de ellas nos limitaremos a dar el
resultado. El lector puede comprobar sin dificultad que es correcto derivando
la soluci´n que presentamos.
         o
                    ∑         ∏θ
                            t                θ              θ
           y(θ) = l log tan       + l [cos t]π/2 = l log tan + l cos θ.
                            2 π/2                           2

   As´ pues, la tractriz viene dada por
     ı
                                            θ
              T (θ) = (l sen θ, l log tan     + l cos θ),   θ ∈ [π/2, π[ .
                                            2
4.3. Curvas parametrizables                                                               183

Su derivada es
                        µ                  ∂
                  0                 cos2 θ                             cos θ
                 T (θ) = l cos θ, l          ,        kT 0 (θ)k = −l         .
                                    sen θ                              sen θ

   La tractriz es regular en ]π/2, π[. La longitud de un arco de tractriz es
                        Z   θ
                                  cos t
            s(θ) = −l                   dt = −l [log sen t]θ = −l log sen θ.
                                                           π/2
                         π/2      sen t




Vector normal y curvatura Sea x(s) un arco parametrizado por la longitud
de arco. Supongamos que admite derivada segunda. Derivando la igualdad
x0 (s)x0 (s) = 1 obtenemos que 2x00 (s)x0 (s) = 0, luego x00 (s) ⊥ x0 (s). Supuesto
que x00 (s) 6= 0 podemos definir el vector normal del arco como

                                                 x00 (s)
                                      N (s) =             ,
                                                kx00 (s)k

y la curvatura del arco como κ(s) = kx00 (s)k.
    Para interpretar la curvatura llamemos ∆θ al ´ngulo entre los vectores x0 (s)
                                                 a
y x0 (s + ∆s), donde ∆θ es una funci´n de ∆s. Puesto que x0 tiene m´dulo
                                       o                                  o
constante igual a 1, la trigonometr´ nos da que
                                    ıa

                                                 ∆θ
            kx0 (s + ∆s) − x0 (s)k = 2 sen          .                            2 sen(∆θ/2)
                                                 2
   Por consiguiente,

                       kx0 (s + ∆s) − x0 (s)k   sen ∆θ ∆θ
                                                     2
                                              =            .
                                |∆s|             ∆θ/2 |∆s|

   Es claro que ∆θ → 0 cuando ∆s → 0, luego

                                                      ∆θ
                                     κ(s) = l´
                                             ım           .
                                            ∆s→0     |∆s|

   As´ pues, la curvatura mide la variaci´n del ´ngulo del vector tangente por
     ı                                   o      a
unidad de arco recorrido. Es claro que cuanto mayor sea la curvatura “m´s   a
curvado” estar´ el arco.
              a

Ejemplo La parametrizaci´n natural de una circunferencia de radio r es
        °                    o
                             ¢
x(s) = r cos(s/r), r¢sen(s/r) . El vector tangente es, por lo tanto, x0 (s) =
°
 − sen(s/r), cos(s/r) . De aqu´ obtenemos
                               ı
                                   µ                ∂
                             00      1   s 1      s
                            x (s) = − cos , − sen     ,
                                     r   r r      r
184                           Cap´
                                 ıtulo 4. C´lculo diferencial de varias variables
                                           a
                                         °                  ¢
con lo que el vector normal es N (s) = − cos(s/r), sen(s/r) y la curvatura es
κ(s) = 1/r. Intuitivamente es claro que una circunferencia est´ menos curvada
                                                              a
cuanto mayor es su radio, tal y como se pone de manifiesto en la f´rmula que
                                                                  o
hemos obtenido.
    Dada una curva x de curvatura no nula en un punto dado x(s), la circunfe-
rencia de radio r = 1/κ(s) y centro x(s) − κN (n) pasa por x(s) y tiene el mismo
vector tangente, el mismo vector normal y la misma curvatura en este punto.
Esto hace que sea la circunferencia que m´s se parece a x en un entorno de x(s)
                                          a
y se la llama circunferencia osculatriz a x por x(s). El radio r(s) = 1/κ(s) se
llama radio de curvatura de x en x(s).
    Veamos ahora f´rmulas expl´
                     o             ıcitas para calcular el vector normal y la curva-
tura cuando la parametrizaci´n no es la natural. Conviene usar el lenguaje de la
                                o
cinem´tica. Supongamos que x(t) representa la posici´n de un m´vil puntual en
      a                                                   o          o
funci´n del tiempo. Llamaremos x(s) a la parametrizaci´n natural. Entonces la
     o                                                       o
velocidad del m´vil es V = x0 (t). Si llamamos v = kvk, entonces sabemos que
                  o
v = s0 (t), con lo que v es la velocidad sobre la trayectoria, que mide la distancia
recorrida por unidad de tiempo. Adem´s V = x0 (t) = x0 (s)s0 (t), es decir,
                                           a
                                      V = vT.
    Se define el vector aceleraci´n como A = V 0 = X 00 (t). Derivando en la
                                o
relaci´n anterior tenemos
      o
                            A = v 0 (t)T (t) + v(t)T 0 (t).
Llamaremos a(t) = v 0 (t), que es la aceleraci´n sobre la trayectoria, es decir la
                                                 o
variaci´n de la velocidad sobre la trayectoria por unidad de tiempo. Aplicando
       o
la regla de la cadena a T (t) = T (s(t)) obtenemos T 0 (t) = T 0 (s)s0 (t) = κvN ,
luego
                                                       v2
                         A = aT + κv 2 N = aT +             N.
                                                        r
    Vemos, pues, que la aceleraci´n se descompone de forma natural en una
                                    o
componente tangencial, que mide la variaci´n del m´dulo de la velocidad, y una
                                               o          o
componente normal, que determina la curvatura.
    Ahora multiplicamos esta igualdad por s´ misma: kAk2 = a2 + κ2 v 4 , de
                                                  ı
donde
                                         kAk2 − a2
                                 κ2 =                .
                                            v4
    Ahora bien,
                                             VV0        VV0
                         a = v 0 = kV k0 =           =       ,
                                             kV k         v
luego
                            kAk2 v 2 − (V V 0 )2      kV ∧ Ak2
                      κ2 =             6
                                                 =             ,
                                     v                    v6
lo que nos da
                                         kV ∧ Ak
                                  κ=               .
                                            v3
4.3. Curvas parametrizables                                                       185

   Las dos ultimas igualdades suponen que la imagen de x est´ en R3 . En el
            ´                                               a
lenguaje geom´trico hemos obtenido las f´rmulas siguientes:
              e                         o

                   x0            kx0 k2 x00 − (x0 x00 )x0          kx0 ∧ x00 k
            T =         ,   N=                            ,   κ=                 (4.4)
                  kx0 k            kx0 k kx0 ∧ x00 k                kx0 k3 .

    En el caso de curvas planas es conveniente modificar como sigue el vector
normal y la curvatura. Fijada una orientaci´n en el plano, definimos el vector
                                               o
normal de una curva x(s) parametrizada por el arco como el vector unitario N (s)
                                                      °          ¢
que es perpendicular a T (s) y de modo que la base T (s), N (s) est´ orientada
                                                                      e
positivamente. Esta definici´n puede diferir de la anterior en cuanto al signo
                             o
de N (s), por lo que redefinimos la curvatura de modo que x00 (s) = κ(s)N (s).
Notemos que ahora el vector normal est´ definido incluso en los puntos donde
                                          a
la curvatura es nula.
    Con el convenio usual de orientaci´n, el vector N apunta hacia la izquierda si
                                      o
miramos en el sentido de T . La curvatura es positiva si cuando la curva avanza
se desv´ hacia la izquierda y negativa si se desv´ hacia la derecha (o nula si no
       ıa                                         ıa
se desv´
       ıa). Diremos que la curva gira en sentido positivo o en sentido negativo
seg´n el signo de su curvatura. El sentido de giro positivo es el contrario a las
    u
agujas del reloj. De este modo, la orientaci´n distingue los dos sentidos de giro.
                                             o

Vector binormal y torsi´n La teor´ de curvas en R3 se completa con la
                              o           ıa
introducci´n del vector binormal y la torsi´n. El vector binormal de una curva
           o                                 o
x(s) tres veces derivable en un punto de curvatura no¢nula es B(s) = T (s)∧N (s).
                                   °
La base formada por los vectores T (s), N (s), B(s) se conoce como triedro de
Frenet. Definimos la torsi´n de x en cada punto como τ (s) = −N 0 (s)B(s).
                            o
   Para interpretar la torsi´n empezaremos por determinar N 0 . Digamos que
                            o

                              N 0 = aT + bN + cB.                                (4.5)

Multiplicando por T obtenemos c = N 0 T , y como T N = 0, derivando resulta
T 0 N + T N 0 = 0, luego c = −T 0 N = −κN N = −κ.
     Si multiplicamos (4.5) por N resulta b = N 0 N , pero al derivar en N N = 1
resulta 2N N 0 = 0, luego b = 0. Por ultimo, es claro que c = N 0 B = −τ . Por
                                       ´
consiguiente
                                 N 0 = −κT − τ B.
   La misma t´cnica nos da una expresi´n para B 0 . Sea B 0 = aT + bN + cB.
               e                         o
Multiplicando por T obtenemos a = T B 0 , pero de BT = 0 se concluye que
T B 0 = −T 0 B = −κN B = 0. Similarmente b = N B 0 = −N 0 B = τ . Al
multiplicar por B llegamos a c = B 0 B = 0, pues BB = 1.
   Tenemos as´ las llamadas f´rmulas de Frenet:
               ı             o

                              T0     =  κN,
                              N0     = −κT − τ B,
                              B0     =  τ N.
186                             Cap´
                                   ıtulo 4. C´lculo diferencial de varias variables
                                             a

    Vemos que si τ = 0 en todo punto entonces B es constante, luego (xB)0 =
 0
x B = T B = 0 implica que xB es constante, luego x est´ contenido en un plano
                                                        a
perpendicular a B, luego la curva es plana. El rec´  ıproco es claro. As´ pues,
                                                                           ı
las curvas sin torsi´n son exactamente las curvas planas. En general, el plano
                    o
x(s)+hT (s), N (s)i recibe el nombre de plano osculante a la curva. Si la curva es
plana, su plano osculante es el mismo en todo punto, y la curva est´ contenida
                                                                     a
en ´l. En caso contrario, puede probarse que el plano osculante en un punto es
   e
el plano m´s pr´ximo a la curva en un entorno del punto. La tercera f´rmula
           a    o                                                          o
de Frenet muestra que la torsi´n mide la rapidez con que var´ B o, lo que es
                                o                               ıa
lo mismo, la rapidez con la que var´ el plano osculante.
                                    ıa
    A continuaci´n derivamos una f´rmula expl´
                o                 o           ıcita para la torsi´n de una curva.
                                                                 o
Si x est´ parametrizada por la longitud de arco, entonces
        a

                                  x00             x000 κ − x00 κ0
                            N=        ,   N0 =                    .
                                  κ                      κ2
luego,

                           1                   (x0 ∧ x00 )x000    (x0 , x00 , x000 )
τ = −BN 0 = (T ∧ N )N 0 = − (x0 ∧ x00 )N 0 = −                 =−                    ,
                           κ                        κ2                  κ2
donde (u, v, w) = u(v∧w) es el producto mixto de vectores. Si la parametrizaci´n
                                                                              o
no es la natural tenemos evidentemente
                                           x0 ∧ x00
                                    B=                ,
                                          kx0 ∧ x00 k

y un c´lculo rutinario nos lleva de la expresi´n que tenemos para τ (s) a
      a                                       o

                                          (x0 , x00 , x000 )
                                  τ =−                       .
                                           kx0 ∧ x00 k2

Ejercicio: Calcular la curvatura y la torsi´n de la h´lice (r sen t, r cos t, kt).
                                           o         e

    Para acabar probaremos que la curvatura y la torsi´n determinan una curva
                                                      o
salvo por su posici´n en el espacio.
                   o

Teorema 4.23 Sean x, x : I −→ R3 dos curvas con las mismas funciones κ y
                        ¯                                     °    ¢
τ . Entonces existe una isometr´ f : R3 −→ R3 tal que x(s) = f x(s) para
                               ıa                               ¯
todo s ∈ I.

                    ´
    Demostracion: Es f´cil comprobar que los vectores del triedro de Frenet,
                             a
as´ como la curvatura y la torsi´n se conservan por isometr´ en el sentido de
  ı                                 o                             ıas,
                                                                    ~
que, por ejemplo, si f es una isometr´ se cumple Tx◦f (s) = f ◦ Tx , donde f es
                                         ıa                                          ~
la isometr´ lineal asociada a f . Igualmente κx◦f (s) = κ(s), etc.
           ıa
    Sea s0 ∈ I. Aplicando una isometr´ a x podemos exigir que x(s0 ) = x(s0 ),
                                           ıa ¯                                   ¯
          ¯                  ¯                 ¯
T (s0 ) = T (s0 ), N (s0 ) = N (s0 ), B(s0 ) = B(s0 ), κ(s0 ) = κ(s0 ), τ (s0 ) = τ (s0 ).
                                                                ¯                 ¯
Probaremos que en estas condiciones x = x.     ¯
4.3. Curvas parametrizables                                                      187

   Es claro que
                    1d °      ¯           ¯           ¯
                                                          ¢
                         kT − T k2 + kN − N k2 + kB − Bk2
                    2 ds
                ¯         ¯            ¯         ¯            ¯        ¯
         = (T − T )(T 0 − T 0 ) + (N − N )(N 0 − N 0 ) + (B − B)(B 0 − B 0 )
   Aplicando las f´rmulas de Frenet queda
                  o
      ¯       ¯         ¯       ¯          ¯       ¯         ¯      ¯
κ(T − T )(N − N )−κ(N − N )(T − T )−τ (N − N )(B − B)+τ (B − B)(N − N ) = 0,
            ¯        ¯       ¯
luego T = T , N = N , B = B, pues las diferencias son constantes y se anulan
en s0 . La primera igualdad es x0 = x0 , y como ambas funciones coinciden en s0
                                    ¯
ha de ser x = x.
               ¯
    Como consecuencia, si una curva plana tiene curvatura constante κ, entonces
es un arco de circunferencia de radio r = 1/κ, pues su curvatura y su torsi´no
(nula) coinciden con las de la circunferencia. Las curvas de curvatura nula son
las rectas.

Sistemas de referencia no inerciales A la hora de medir la posici´n de un  o
objeto f´ısico es necesario tomar a otro como referencia. Aunque en la pr´ctica
                                                                              a
las coordenadas cartesianas no son siempre las m´s apropiadas, te´ricamente
                                                     a                  o
podemos imaginar que seleccionamos un objeto r´  ıgido en el que marcamos cuatro
puntos a los que asignamos las coordenadas (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1)
y con respecto a ellos determinamos la posici´n de cualquier otro punto del
                                                 o
espacio.
    Podr´ parecer conveniente exigir que el objeto mediante el cual definimos
          ıa
nuestro sistema de referencia est´ en reposo, para evitar que las coordenadas de
                                  e
un cuerpo var´ por causa del movimiento del sistema de referencia y no por
                ıen
su propio movimiento. Sin embargo la Tierra, el Sol y las estrellas se mueven
por el espacio, luego no tenemos a nuestra disposici´n ning´n objeto del que
                                                        o        u
podamos garantizar que est´ en reposo. M´s a´n, la f´
                             a              a u        ısica ense˜a que el requisito
                                                                 n
mismo no tiene sentido, pues no existe forma de dar sentido al concepto de
“reposo absoluto”, sino que el concepto de movimiento es esencialmente relativo
al sistema de referencia que adoptemos.
    Pese a ello, no todos los sistemas de referencia son equivalentes. Una clase
especial de ellos la forman los determinados por objetos libres de toda influencia
externa. Uno de los postulados b´sicos de la f´
                                    a           ısica es que si dos objetos est´n a
libres de toda influencia externa, su movimiento relativo ser´ uniforme, es decir,
                                                               a
al tomar como referencia a uno de ellos el otro se mover´ (en l´
                                                             a      ınea recta) con
velocidad constante, tal vez nula. A los sistemas de referencia en estas condicio-
nes se les llama inerciales, de modo que la primera ley de Newton, de la que ya
hemos hablado, afirma en realidad que la velocidad de un cuerpo libre de toda
influencia exterior medida desde un sistema de referencia inercial permanece
constante.
    Esta ley no es aplicable a sistemas no inerciales. Por ejemplo, enseguida
justificaremos que un tren que se mueve con velocidad constante puede ser
188                            Cap´
                                  ıtulo 4. C´lculo diferencial de varias variables
                                            a

considerado como un sistema de referencia inercial, pero en el momento en que
el tren acelera o frena deja de serlo. En efecto, imaginemos una esfera en reposo
sobre el pasillo del tren. Visto desde la tierra, tanto el tren como la esfera est´n
                                                                                  a
movi´ndose a la misma velocidad. Cuando el tren frena, los frenos act´an sobre
      e                                                                   u
´l haci´ndolo parar, pero no act´an sobre la esfera, que sigue movi´ndose a la
e       e                          u                                    e
misma velocidad. Desde un sistema de referencia determinado por el tren, la
esfera en reposo pasa a moverse hacia delante sin que nada haya influido sobre
ella. Esto es una violaci´n de la primera ley de Newton.
                           o
    La Tierra no es un sistema de referencia inercial a causa de sus movimientos
de rotaci´n y traslaci´n. No obstante, la traslaci´n alrededor del Sol sigue una
          o             o                            o
o
´rbita de radio tan grande que localmente es casi recta, y las consecuencias de
este movimiento son inapreciables. En cuanto a la rotaci´n, sus efectos s´ son
                                                               o               ı
detectables mediante experimentos f´    ısicos que falsean la ley de Newton, pero
en muchas ocasiones tambi´n resulta despreciable (una bola encima de una
                              e
mesa nunca empieza a moverse sola como en el tren). Un sistema de referencia
determinado por un objeto que se mueva a velocidad constante respecto a un
sistema de referencia inercial cumple igualmente la ley de Newton y las leyes
restantes de la din´mica, por lo que puede ser considerado inercial. Es el caso
                     a
del tren que coment´bamos antes. Lo que sucede es que aunque el tren est´
                       a                                                            a
sometido a la acci´n de su motor, ´sta se emplea unicamente en contrarrestar
                    o                 e                ´
las fuerzas de rozamiento que se oponen a su avance, con lo que las dos acciones
que ´ste experimenta se cancelan mutuamente, y el resultado es el mismo que
     e
si ninguna fuerza actuara sobre ´l.e
    Con m´s detalle: los cuerpos act´an unos sobre otros alterando su estado
            a                           u
de movimiento. Por ejemplo, si dejamos en el aire un objeto en reposo ´ste noe
permanecer´ en tal estado, sino que caer´, y esto no es una violaci´n de la ley
              a                              a                          o
de Newton. Lo que sucede es que el cuerpo no est´ libre de acciones externas,
                                                       a
sino que sufre la acci´n de la gravedad terrestre. La segunda ley de Newton
                         o
afirma que la acci´n que un cuerpo ejerce sobre otro se traduce siempre en
                     o
una aceleraci´n sobre el mismo. M´s detalladamente, a dicha acci´n se le puede
                o                    a                               o
asociar un vector llamado fuerza, de modo que si sumamos todas las fuerzas que
produce sobre un cuerpo cada uno de los cuerpos externos que le influyen, el
vector fuerza resultante es el producto de una constante, llamada masa inercial
del cuerpo, por la aceleraci´n que experimenta.
                             o
    Ahora vamos a estudiar qu´ consecuencias tiene la rotaci´n de la tierra en
                                 e                                o
el movimiento de los objetos. En general, consideremos los vectores
         i = (cos ωt, sen ωt, 0),   j = (− sen ωt, cos ωt, 0),   k = (0, 0, 1).
    En cada instante t, estos vectores forman una base ortonormal positivamente
orientada (notar que k = i ∧ j). Podemos suponer que hemos fijado un sistema
de referencia inercial con origen en el centro de la tierra y que k apunta hacia el
norte. Si ω es la velocidad angular de la Tierra, es decir, π/12 radianes por hora,
entonces los tres vectores se mueven con la Tierra, y est´n en reposo respecto a
                                                            a
ella.
   Consideremos un objeto de masa m que se mueve seg´n la trayectoria x(t).
                                                         u
Esto significa que la fuerza resultante que act´a sobre ´l en cada instante t es
                                              u        e
4.3. Curvas parametrizables                                                         189

F = mx00 . Expresemos

                       x(t) = xr (t)i(t) + yr (t)j(t) + zr (t)k.

   As´ (xr , yr , zr ) son las coordenadas del m´vil respecto a un sistema de refe-
      ı,                                        o
rencia relativo a la Tierra. Derivemos:

                      x0 = Vr − ωyr i + ωxr j = Vr + ωk ∧ x,

donde Vr = x0 i+yr j +zr k es la velocidad relativa del m´vil. Volvemos a derivar:
            r
                 0     0
                                                         o

        x00 = Ar + ωk ∧ Vr + ωk ∧ x0 = Ar + 2ωk ∧ Vr + ω 2 k ∧ (k ∧ x),
donde Ar = x00 i + yr j + zr k es la aceleraci´n relativa. Multiplicamos por la
            r
                    00     00
                                              o
masa m del m´vil y despejamos
            o

                    mAr = F + 2mωVr ∧ k + mω 2 (k ∧ x) ∧ k.
    ´
    Esta es la expresi´n de la segunda ley de Newton en un sistema de referencia
                      o
en rotaci´n con velocidad angular constante. La masa de un objeto por la
          o
aceleraci´n que experimenta no es la resultante de las fuerzas que act´an sobre
         o                                                            u
el objeto, sino la suma de esta resultante m´s dos “fuerzas ficticias”, llamadas
                                              a
fuerza centr´ıfuga y fuerza de Coriolis, dadas por

                             Fcen   = mω 2 (k ∧ x) ∧ k,
                             Fcor   = 2mωVr ∧ k.

    Se las llama fuerzas ficticias (o inerciales) porque se comportan formalmente
como fuerzas que hay que sumar a las dem´s, pero que no se corresponden con
                                              a
ninguna acci´n de ning´n objeto sobre el m´vil (como en el caso de la esfera
              o           u                      o
que se mueve sola).
    Si el m´vil se encuentra en la superficie de la tierra a una latitud α (el ´ngulo
            o                                                                 a
que forma con el ecuador) entonces la fuerza centr´      ıfuga tiene la direcci´n y
                                                                                o
el sentido de x, es decir, apunta hacia arriba (recordemos que el origen de
coordenadas est´ en el centro de la Tierra) y su m´dulo es mω 2 R cos α, donde
                  a                                    o
R es el radio de la Tierra, luego es nula en los polos y m´xima en el ecuador.
                                                             a
    Para hacernos una idea de su intensidad, sobre un cuerpo de 1kg de masa
act´a una fuerza centr´
   u                    ıfuga de

                         1 · (7,29 · 10−5 )2 6,3 · 106 ≈ 0,03N,

mientras1 que su peso es de 9,8N , unas 326 veces mayor. Por consiguiente la
fuerza centr´
            ıfuga es generalmente despreciable. Si la Tierra girara mucho m´s
                                                                           a
r´pido los cuerpos pesar´ menos por causa de esta fuerza y llegado a un punto
 a                      ıan
podr´ salir despedidos hacia el cielo.
     ıan
   La fuerza de Coriolis s´lo act´a sobre cuerpos en movimiento respecto a la
                          o      u
Tierra. Por ejemplo, si un cuerpo cae su velocidad Vr apunta al centro de la
  1 La unidad de fuerza es el Newton. Un Newton es la fuerza que aplicada a un cuerpo de

1Kg de masa le produce una aceleraci´n de 1m/s2 .
                                    o
190                          Cap´
                                ıtulo 4. C´lculo diferencial de varias variables
                                          a

Tierra y Vr ∧ k apunta hacia el este, por lo que los cuerpos que caen sufren una
desviaci´n hacia el este, nula en los polos y m´xima en el ecuador.
         o                                       a
    Si el movimiento se realiza sobre la superficie de la Tierra observamos que k
apunta hacia el exterior de la misma en el hemisferio norte y hacia el interior en
el hemisferio sur, por lo que Vr ∧k apunta hacia la derecha de Vr en el hemisferio
norte y hacia la izquierda en el hemisferio sur. Si descomponemos esta fuerza
en dos vectores, uno en la direcci´n del centro de la Tierra y otro tangente a la
                                    o
misma, la gravedad hace inadvertible la primera componente, pero la segunda
                ´
es apreciable. Esta es nula en el ecuador y m´xima en los polos. Puesto que se
                                                a
dirige siempre hacia el mismo lado, la fuerza de Coriolis hace girar los objetos,
y se pone de manifiesto en los l´ ıquidos y gases, por ejemplo, el agua que cae por
un desag¨e gira en sentido horario en el hemisferio norte, en sentido antihorario
          u
en el hemisferio sur y no gira en las proximidades del ecuador. Tambi´n puede
                                                                         e
apreciarse su efecto sobre un p´ndulo suficientemente largo y pesado (p´ndulo
                                  e                                         e
de Foucault).

*Longitud de arcos no eucl´      ıdeos Veamos ahora c´mo se generalizan los
                                                          o
resultados sobre longitud de arcos a las geometr´ hiperb´lica y el´
                                                  ıas        o°      ıptica. ¢Co-
mencemos por la primera. Consideremos un arco X(t) = x(t), y(t), z(t) en
el plano proyectivo P2 (R) contenido en el interior de una c´nica de ecuaci´n
                                                               o               o
f (X, X) = 0. Llamamos s(t) a la longitud de arco que queremos definir. Lo
haremos determinando su derivada como en el caso eucl´   ıdeo. La idea central es
que si d representa la distancia hiperb´lica entre dos puntos, entonces
                                       o
                                          °              ¢
                      s(t + h) − s(t)   d X(t + h), X(t)
                                      ≈                    ,
                             h                  |h|
y la aproximaci´n ser´ mejor cuanto menor sea h, pues si X es derivable se parece
               o     a
a una recta alrededor de X(t), luego el l´
                                         ımite cuando h → 0 en el cociente de la
izquierda nos dar´ la derivada de s. Para calcular este l´
                 a                                       ımite usaremos que
                                      senh v
                                  l´
                                   ım        =1
                                  v→0   v
y que                             s
                                      f 2 (X, Y ) − f (X, X)f (Y, Y )
                senh d(X, Y ) =                                       .
                                             f (X, X)f (Y, Y )
As´ pues,
  ı
                s      °              ¢   °          ¢ °                  ¢
  ds       1        f 2 X(t), X(t + h) − f X(t), X(t) f X(t + h), X(t + h)
     = l´
        ım                      °          ¢ °                  ¢           .
  dt h→0 |h|                   f X(t), X(t) f X(t + h), X(t + h)

   Sea X(t + h) = X(t) + ∆X(t, h). Usando que f es bilineal la expresi´n
                                                                      o
anterior se simplifica:
                       s
      ds             1          f 2 (X, ∆X) − f (X, X)f (∆X, ∆X)
            = l´ım                °                                 ¢
      dt       h→0 |h|   f (X, X) f (X, X) + 2f (X, ∆X) + f (∆X, ∆X)
4.3. Curvas parametrizables                                                      191
                      s
                                 f 2 (X, ∆X ) − f (X, X)f ( ∆X , ∆X )
                                          h                  h    h
           =    l´
                 ım               °                                   ¢
                h→0       f (X, X) f (X, X) + 2f (X, ∆X) + f (∆X, ∆X)
                s
                    f 2 (X, X 0 ) − f (X, X)f (X 0 , X 0 )
           =                                               .
                                  f 2 (X, X)

   Vamos a particularizar esta f´rmula para el caso del plano de Klein, es decir,
                                o
tomando como f la circunferencia unidad f (X1 , X2 ) = z1 z2 − x1 x2 − y1 y2¢ y el
                        °             ¢                           °
arco de la forma X(t) = x(t), y(t), 1 , de modo que X 0 (t) = x0 (t), y 0 (t), 0 . El
resultado es:
               µ ∂2
                 ds      (xx0 − yy 0 )2 + (1 − x2 − y 2 )(x02 + y 02 )
                      =                                                .
                 dt                    (1 − x2 − y 2 )2

Operando y multiplicando por dt2 obtenemos una expresi´n para el elemento
                                                      o
de longitud hiperb´lica en el plano de Klein:
                  o

                                  dx2 + dy 2 − (x dy − y dx)2
                          ds2 =                               ,
                                        (1 − x2 − y 2 )2

que ha de entenderse como una ecuaci´n funcional, para cada punto t, entre
                                         o
la diferencial de la longitud de arco ds(t) y las diferenciales dx(t), dy(t) de las
funciones coordenadas del arco. Formalmente, si X : [a, b] −→ R2 , definimos
s(t) como la integral desde a hasta t de la ra´ cuadrada del miembro derecho
                                                ız
de la igualdad anterior, con lo que obtenemos una funci´n que satisface dicha
                                                           o
relaci´n. Informalmente ds as´ calculado es el incremento infinitesimal que ex-
      o                        ı
perimenta la longitud de arco cuando el par´metro se incrementa en dt y la
                                                a
integral de ds nos da el incremento completo de la longitud de arco entre dos
l´
 ımites dados.
    Observemos que la longitud hiperb´lica es invariante por isometr´
                                         o                              ıas. En
efecto, a cada arco X : [a, b] −→ R2 le hemos asociado la funci´n s determinada
                                                               o
por s(a) = 0 y                        °              ¢
                           ds        d X(t + h), X(t)
                               = l´
                                  ım
                           dt h→0           |h|
y es obvio que el miembro derecho es invariante por isometr´
                                                           ıas.
    La expresi´n que hemos obtenido no es muy manejable, y las integrales a que
              o
da lugar resultan complicadas. Las coordenadas polares nos dan una expresi´n o
m´s sencilla. Si diferenciamos (x, y) = (r cos θ, r sen θ) y sustituimos en la
  a
expresi´n de ds obtenemos
       o

                                        dr2         r2
                            ds2 =               +        dθ2 .
                                     (1 − r2 )2   1 − r2

   Si un punto se encuentra a una distancia hiperb´lica ρ del centro del plano
                                                  o
de Klein, la distancia eucl´
                           ıdea es r = tanh ρ. Al diferenciar esta relaci´n y
                                                                          o
192                          Cap´
                                ıtulo 4. C´lculo diferencial de varias variables
                                          a

sustituir en la expresi´n anterior obtenemos el elemento de longitud hiperb´lico
                       o                                                   o
en coordenadas polares hiperb´licas, que resulta ser
                                o

                            ds2 = dρ2 + senh2 ρ dθ2 ,                         (4.6)

relaci´n an´loga a (4.3).
      o    a
    Por ejemplo, consideremos una circunferencia cuyo centro coincida con el del
plano de Klein y de radio (hiperb´lico) r. Entonces su longitud hiperb´lica es
                                 o                                     o
                          Z 2π
                               senh r dθ = 2π senh r.
                             0

   Observemos que si el radio es peque˜o la longitud es aproximadamente la
                                      n
eucl´
    ıdea 2πr.
   La f´rmula (4.6) es intr´
         o                  ınseca, en el sentido de que las coordenadas (ρ, θ) de
un punto P representan la distancia hiperb´lica de P a un punto fijo O y el
                                               o
                         −−
                          →
a
´ngulo de la semirrecta OP con una semirrecta fija de origen O, y nada de esto
depende del plano de Klein. Por lo tanto la f´rmula ha de ser v´lida tambi´n
                                                 o                   a          e
en el c´
       ırculo de Poincar´. La relaci´n entre la distancia eucl´
                        e           o                         ıdea r y la distancia
hiperb´lica ρ de un punto P al punto 0 en el c´
       o                                         ırculo de Poincar´ es
                                                                   e
                                             1+r
                                   ρ = log       ,
                                             1−r
de donde
                                    2r              2dr
                        senh ρ =        2
                                          , dρ =         .
                                  1−r             1 − r2
   Por consiguiente, el elemento de longitud en coordenadas polares (eucl´
                                                                         ıdeas)
en el c´
       ırculo de Poincar´ resulta ser
                        e
                                      √
                                       dr2 + r2 dθ2
                             ds = 2                 .
                                          1 − r2
    Seg´n (4.3), el numerador es el elemento de longitud eucl´
       u                                                     ıdea en coordenadas
polares. Si usamos la notaci´n compleja para el arco z(t) = x(t) + i y(t) y
                  p           o
llamamos |dz| = dx2 + dy 2 al elemento de longitud eucl´  ıdea, entonces tenemos
                                           2 |dz|
                                   ds =            .
                                          1 − |z|2
    Esta expresi´n diferencial muestra la naturaleza de la distancia hiperb´lica
                o                                                          o
mucho m´s claramente que la f´rmula de la distancia entre dos puntos. Vemos
          a                     o
que la distancia hiperb´lica es infinitesimalmente la eucl´
                        o                                 ıdea dividida entre el
factor m´s simple posible que hace que se “dilate” al acercarnos al borde del
         a
c´
 ırculo de radio 1, de modo que las peque˜as distancias eucl´
                                          n                   ıdeas son cada vez
m´s grandes desde el punto de vista hiperb´lico. La expresi´n tambi´n es muy
  a                                         o                o        e
clara en el semiplano de Poincar´. La transformaci´n circular
                                  e                o
                                          iw + 1
                                    z=
                                           w+i
4.3. Curvas parametrizables                                                                193

              ırculo |z| < 1 en el semiplano Im w > 0. Se comprueba2 que
convierte el c´

                      −2 dw                       2 |dw|                       4y
              dz =            ,         |dz| =            ,    1 − |z|2 =            .
                     (w + i)2                    |w + i|2                   |w + i|2

    De todo esto resulta
                                                     |dw|
                                              ds =        ,
                                                       y
es decir, que el elemento de longitud hiperb´lico en el semiplano de Poincar´ es
                                            o                               e
el eucl´
       ıdeo dividido entre la parte imaginaria, de modo que cuando ´sta tiende
                                                                     e
a 0 las longitudes tienden a infinito.
    Todos los argumentos anteriores valen igualmente para la geometr´ el´
                                                                      ıa ıptica,
partiendo ahora de una c´nica imaginaria f (X1 , X2 ). La unica diferencia es un
                         o                                 ´
signo en la f´rmula
             o
                               s
                                 −f 2 (X, Y ) + f (X, X)f (Y, Y )
                sen d(X, Y ) =                                    ,
                                        f (X, X)f (Y, Y )

debido a que la relaci´n fundamental entre los senos y cosenos circulares difiere
                      o
en un signo respecto a la hiperb´lica. Como consecuencia llegamos a
                                o
                     µ        ∂2
                         ds            −f 2 (X, X 0 ) + f (X, X)f (X 0 , X 0 )
                                   =                                           .
                         dt                          f 2 (X, X)

    En el modelo esf´rico, o sea, si suponemos f (X1 , X2 ) = x1 x2 + y1 y2 + z1 z2
                    e
y f (X, X) = 1, al derivar respecto de t queda f (X, X 0 ) = 0, y la expresi´n se
                                                                             o
reduce a             µ ∂2
                       ds
                             = f (X 0 , X 0 ) = x02 + y 02 + z 02 ,
                       dt
es decir,
                                       ds2 = dx2 + dy 2 + dz 2 ,
luego la longitud el´
                    ıptica de un arco contenido en la esfera unitaria coincide con
su longitud eucl´
                ıdea. En coordenadas polares el´ ıpticas:

                         (x, y, z) = (sen ρ cos θ, cos ρ sen θ, sen θ),

la expresi´n es
          o
                                       ds2 = dρ2 + sen2 ρ dθ.
    La longitud de una circunferencia el´
                                        ıptica de radio (el´
                                                           ıptico) r es 2π sen r.


    2 La teor´ de funciones de variable compleja justifica que es l´
             ıa                                                      ıcito calcular dz derivando
la expresi´n anterior como si w fuera una variable real y tratando las constantes imaginarias
           o
como constantes reales. Nosotros no hemos probado esto, por lo que el lector puede, si lo
desea, hacer los c´lculos en t´rminos de las dos variables reales x, y, pero est´ avisado de que
                  a           e                                                 a
llegar´ al mismo resultado.
       a
Cap´
   ıtulo V

Introducci´n a las
          o
variedades diferenciables

    En este cap´ıtulo aplicaremos el c´lculo diferencial al estudio de las superfi-
                                       a
cies. Si bien todos los ejemplos que consideraremos ser´n bidimensionales, la
                                                            a
mayor parte de la teor´ la desarrollaremos sobre un concepto general de “su-
                         ıa
perficie de n dimensiones”. La idea b´sica es que una superficie es un espacio
                                         a
topol´gico que localmente se parece a un plano. El ejemplo t´
      o                                                        ıpico es la superficie
terrestre: tenemos que alejarnos mucho de ella para darnos cuenta de que no
es plana, sino esf´rica. Una definici´n topol´gica que recoja estas ideas ser´ la
                  e                  o       o                                  ıa
siguiente:

      Un subconjunto S de Rn es una superficie si para cada punto p ∈ S
      existe un entorno V de p, un abierto U en R2 y un homeomorfismo
      X : U −→ V ∩ S.

    Es decir, S es una superficie si alrededor de cada punto es homeomorfa a un
abierto de R2 . Notar que no pedimos que S sea homeomorfa a un abierto de
R2 , sino s´lo que lo sea alrededor de cada punto. Basta pensar en una esfera
           o
para comprender la importancia de este hecho. Una esfera no es homeomorfa a
un abierto de R2 , pero un peque˜o trozo de esfera es como un trozo de plano
                                   n
abombado, homeomorfo a un trozo de plano “llano”. Sin embargo nosotros
estamos interesados en superficies diferenciables, en el sentido de que se parezcan
a planos afines alrededor de cada punto. Podr´ pensarse que para conseguir esto
                                               ıa
bastar´ exigir que el homeomorfismo X sea diferenciable, pero no es as´ Por
        ıa                         °         ¢                              ı.
ejemplo, pensemos en X(u, v) = u3 , v, |u3 | . La aplicaci´n X es diferenciable,
                                                           o
y es un homeomorfismo entre R2 y un conjunto S ⊂ R3 cuya forma es la de
una hoja de papel doblada por la mitad. Alrededor de los puntos de la forma
(0, v, 0) no se parece a ning´n plano, sino que
                             u
tiene un “pico”. Si la Tierra tuviera esta forma
no necesitar´ıamos alejarnos de ella para darnos
cuenta de que estar´ “doblada”.
                     ıa

                                        195
196                        Cap´
                              ıtulo 5. Introducci´n a las variedades diferenciables
                                                 o

   La raz´n es que dX(0, b) = (0, dv(0, b), 0), de modo que alrededor de un
          o
punto (0, b) la funci´n X se parece a la aplicaci´n af´ f (u, v) = (0, v, 0), cuya
                     o                           o    ın
imagen es la recta x = z = 0. As´ pues, aunque topol´gicamente la imagen de
                                  ı                    o
X es homeomorfa a un plano, desde el punto de vista del c´lculo diferencial la
                                                             a
imagen de X alrededor de un punto (0, y, 0) se parece a la recta x = z = 0, y no
a un plano. Para evitar esto hemos de exigir que la imagen de dX(u, v) sea un
plano y no una recta. Esto es tanto como decir que la matriz jacobiana tenga
rango 2.


5.1       Variedades
Definici´n 5.1 Un conjunto S ⊂ Rm es una variedad diferenciable de di-
         o
mensi´n n ≤ m y de clase C q si para cada punto p ∈ S existe un entorno
      o
V de p, un abierto U en Rn y una funci´n X : U −→ Rm de clase C q de modo
                                       o
que el rango de la matriz JX sea igual a n en todo punto y X : U −→ S ∩ V
sea un homeomorfismo. Una aplicaci´n X en estas condiciones se llama carta
                                    o
de S alrededor de p.

    En lo sucesivo supondremos que las variedades con las que trabajamos son de
clase C q para un q suficientemente grande como para que existan las derivadas
que consideremos (y sean continuas). Rara vez nos har´ falta suponer q > 3,
                                                         a
aunque de hecho todos los ejemplos que consideraremos ser´n de clase C ∞ .
                                                            a
   La palabra “carta” hay que entenderla en el sentido de “mapa”. En efecto,
podemos pensar en U como un mapa “plano” de una regi´n de S, y la aplicaci´n
                                                       o                  o
X es la que hace corresponder cada punto del mapa con el punto real que
representa.

                      S                              X                   U




    Alternativamente, podemos pensar en X −1 como una aplicaci´n que asigna
                                                                    o
a cada punto p ∈ S ∩ V unas coordenadas x = (x1 , . . . , xn ) ∈ U ⊂ Rn , de forma
an´loga a los sistemas de coordenadas en un espacio af´ 1 Dentro de poco
   a                                                         ın.
ser´ equivalente trabajar con cartas o con sistemas de coordenadas, pero por el
   a
momento podemos decir que las cartas son diferenciables y en cambio no tiene
sentido decir que las funciones coordenadas lo sean, pues no est´n definidas
                                                                      a
sobre abiertos de Rm .
   1 Etimol´gicamente, una “variedad” no es m´s que un conjunto cuyos elementos vienen
           o                                       a
determinados por “varias” coordenadas. En los resultados generales llamaremos x1 , . . . , xn
a las coordenadas para marcar la analog´ con Rn , aunque en el caso de curvas seguiremos
                                           ıa
usando la variable t (o s si la parametrizaci´n es la natural) y en el caso de superficies S ⊂ R3
                                             o
usaremos x, y, z para las coordenadas en R3 y u, v para las coordenadas en S.
5.1. Variedades                                                                   197

Ejemplo Todo abierto U en Rn es una variedad diferenciable de dimensi´n n   o
y clase C ∞ . Basta tomar como carta la identidad en U . De este modo, todos
los resultados sobre variedades valen en particular para Rn y sus abiertos.

Ejercicio: Refinar el argumento del teorema 2.21 para concluir que dos puntos cua-
lesquiera de una variedad conexa S de clase C q pueden ser unidos por un arco de clase
C q contenido en S.
   El teorema siguiente proporciona una clase importante de variedades dife-
renciables, pues a continuaci´n vemos que toda variedad es localmente de este
                             o
tipo.

Teorema 5.2 Sea f : U ⊂ Rn −→ Rk una aplicaci´n de° clase C q sobre un
                                                     o           ¢
abierto U y X : U −→ Rn+k la aplicaci´n dada por X(x) = x, f (x) . Entonces
                                       o
X[U ] es una variedad diferenciable de dimensi´n n y clase C q .
                                              o

                 ´
   Demostracion: Basta observar que X es obviamente un homeomorfismo
en su imagen (su inversa es una proyecci´n) y JX(x) contiene una submatriz
                                          o
de orden n igual a la identidad, luego su rango es n. La definici´n se satisface
                                                                o
tomando V = Rn+k .
    Observar que X[U ] es la gr´fica de f , luego el teorema anterior afirma que
                                a
la gr´fica de una funci´n diferenciable es siempre una variedad diferenciable.
     a                  o
Ahora veamos que todo punto de una variedad diferenciable tiene un entorno
en el que la variedad es la gr´fica de una funci´n.
                              a                o

Teorema 5.3 Sea S ⊂ Rn+k una variedad de clase C q y de dimensi´n n. Sea
                                                                 o
p ∈ S. Entonces existe un entorno V de p, un abierto U en Rn y una funci´n
                                                                        o
f : U −→ Rk de¢clase C q de modo que la aplicaci´n X : U −→ Rn+k dada por
       °                                        o
X(x) = x, f (x) es una carta alrededor de p.

   En realidad hemos de entender que las coordenadas de x y f (x) se intercalan
en un cierto orden que no podemos elegir, tal y como muestra la prueba.
    Demostracion: Sea Y : W −→ Rn+k una carta alrededor de p. Sea V un
                  ´
entorno de p tal que Y : W −→ S ∩ V sea un homeomorfismo. Sea t0 ∈ W
el vector de coordenadas de p, es decir, Y (t0 ) = p. Puesto que JY (t0 ) tiene
rango n, reordenando las funciones coordenadas de Y podemos suponer que el
determinante formado por las derivadas parciales de las n primeras es no nulo.
                       °           ¢
Digamos que Y (t) = Y1 (t), Y2 (t) , donde |JY1 (t0 )| 6= 0. Sea p1 = Y1 (t0 ).
    Por el teorema de inyectividad local y el teorema de la funci´n inversa, existe
                                                                  o
un entorno abierto G ⊂ W de t0 tal que Y1 es inyectiva en G, Y1 [G] = U es
abierto en Rn y la funci´n Y1−1 : U −→ G es de clase C q .
                         o
    El conjunto Y [G] es un entorno abierto de p en S ∩V , luego existe un entorno
abierto V 0 de p en Rn+k tal que Y [G] = S ∩ V ∩ V 0 . Cambiando V 0 por V ∩ V 0
podemos suponer que V 0 ⊂ V y que Y [G] = S ∩ V 0 .
    De este modo, cada punto p ∈ S ∩ V 0 est´ determinado por sus coordenadas
                                               a
t ∈ G, las cuales a su vez est´n determinadas por x = Y1 (t) ∈ U , con la particu-
                              a
laridad de que x es el vector de las primeras componentes de p. Concretamente
198                    Cap´
                          ıtulo 5. Introducci´n a las variedades diferenciables
                                             o
                                 °        ¢
p est´ formado por x y f (x) = Y2 Y1−1 (x) . La funci´n f es de clase C q en U .
     a                                               o
                               −1
De este modo, si x ∈ U y t = Y1 (x) ∈ G, tenemos que
                      °       ¢ °             ¢
             X(x) = x, f (x) = Y1 (t), Y2 (t) = Y (t) ∈ S ∩ V 0 .

   Rec´ıprocamente, si (x, y) ∈ ° ∩ V 0 ,¢entonces x = Y1 (t), y = Y2 (t) para
                                S
un cierto t ∈ G, luego (x, y) = x, f (x) = X(x). En definitiva tenemos que
X : U −→ S ∩ V 0 es biyectiva. Su inversa es la proyecci´n en las primeras
                                                           o
componentes, luego X es un homeomorfismo.
   En las condiciones de la prueba anterior, sea π : Rm −→ Rn la proyecci´n   o
en las n primeras componentes y g : V 0 −→ G la aplicaci´n dada por g(x) =
     °    ¢                                                   o
Y1−1 π(x) . Notemos que si x ∈ V 0 entonces π(x) ∈ U , luego g est´ bien definida
                                                                  a
y es de clase C q . Si t ∈ G entonces
                     °     ¢    °             ¢      °      ¢
                    g Y (t) = g Y1 (t), Y2 (t) = Y1−1 Y1 (t) = t,

luego (Y |G )−1 es la restricci´n a V 0 ∩ S de g. Con esto hemos probado:
                               o

Teorema 5.4 Sea Y : U −→ S ⊂ Rm una carta de una variedad diferenciable
de dimensi´n n y clase C q . Para cada punto t ∈ U existe un entorno G ⊂ U
           o
de t, un entorno V de Y (t) y una aplicaci´n g : V −→ G de clase C q tal que
                                          o
(Y |G )−1 = g|V ∩S .

   De aqu´ se sigue una propiedad fundamental de las cartas:
         ı

Teorema 5.5 Sea S ⊂ Rm una variedad diferenciable de dimensi´n n y de  o
clase C q . Sea p ∈ S y X : U −→ S ∩ V , Y : U 0 −→ S ∩ V 0 dos cartas alrededor
de p. Sean V0 = V ∩ V 0 , U0 = X −1 [V0 ], U0 = Y −1 [V0 ]. Entonces la aplicaci´n
                                             0
                                                                                o
      −1
X ◦Y       : U0 −→ U0 es biyectiva, de clase C q y con determinante jacobiano no
                     0

nulo, con lo que su inversa es tambi´n de clase C q .
                                      e

                 ´
    Demostracion: Si t ∈ U0 , por el teorema anterior existe una funci´n g de
                                                                       o
clase C q definida en un entorno de X(t) de modo que X ◦ Y −1 = X ◦ g (en
un entorno de t), luego X ◦ Y −1 es de clase C q en un entorno de t, luego en
todo U0 . Lo mismo vale para su inversa Y ◦ X −1 , luego la regla de la cadena
nos da que sus diferenciales son mutuamente inversas, luego los determinantes
jacobianos son no nulos.
   Veremos ahora otro ejemplo importante de variedades diferenciables. Pri-
meramente consideraremos el caso lineal al cual generaliza.

Ejemplo Una variedad af´ de dimensi´n n en Rm es tambi´n una variedad
                            ın           o                      e
diferenciable de la misma dimensi´n y de clase C ∞ . En efecto, una tal variedad
                                 o
est´ formada por los puntos que satisfacen un sistema de m − n ecuaciones
   a
lineales linealmente independientes. Esto implica que la matriz de coeficientes
del sistema tiene un determinante de orden m − n no nulo, luego agrupando
adecuadamente las variables podemos expresar el sistema como xA + yB = c,
donde x ∈ Rn , y ∈ Rm−n , |B| 6= 0, luego podemos despejar y = f (x) =
5.1. Variedades                                                                 199

(c − xA)B −1 , donde la funci´n f es obviamente de clase C ∞ . Esto significa que
                             o
la variedad lineal est´ formada por los puntos (x, y) tales que y = f (x), luego
                      a
es la gr´fica de f y por consiguiente es una variedad de clase C ∞ .
        a
    Ahora probamos que las soluciones de un sistema de k = m−n ecuaciones di-
ferenciables con m inc´gnitas constituyen una variedad de dimensi´n n supuesto
                      o                                          o
que se cumpla una condici´n de independencia similar a la independencia lineal
                          o
que exig´
        ıamos en el ejemplo anterior.

Definici´n 5.6 Si f : A ⊂ Rn+k −→ Rk es diferenciable en (x, y) ∈ A, donde
         o
x ∈ Rn , y ∈ Rk , definimos
                                    Ø                                     Ø
                                    Ø Dn+1 f1 (x, y) · · · Dn+1 fk (x, y) Ø
           ∂(f1 · · · fk )          Ø                                     Ø
                                    Ø       .
                                            .                    .
                                                                 .        Ø
                           (x, y) = Ø       .                    .        Ø.
           ∂(y1 · · · yk )          Ø                                     Ø
                                    Ø Dn+k f1 (x, y) · · · Dn+k fk (x, y) Ø


Teorema 5.7 (Teorema de la funci´n impl´       o      ıcita) Consideremos una apli-
caci´n f : A ⊂ Rn+k −→ Rk de clase C q en el abierto A, con q ≥ 1. Sea
     o
(x0 , y 0 ) ∈ A tal que f (x0 , y 0 ) = 0 y supongamos que

                             ∂(f1 · · · fk ) 0 0
                                             (x , y ) 6= 0.
                             ∂(y1 · · · yk )

Entonces existen abiertos V ⊂ A, U ⊂ Rn de modo que (x0 , y 0 ) ∈ A, x0 ∈ U y
una funci´n g : U −→ Rk de clase C q tal que
         o

        {(x, y) ∈ V | f (x, y) = 0} = {(x, y) ∈ Rn+k | x ∈ U, y = g(x)}.

   Demostracion: Sea F : A −→ Rn+k la funci´n F (x, y) = (x, f (x, y)). Sus
                 ´                                  o
funciones coordenadas son las proyecciones en las componentes de Rn m´s lasa
funciones coordenadas de f , luego F es de clase C q . Su determinante jacobiano
es            Ø                                                   Ø
              Ø 1 ··· 0       D1 f1 (x, y)   ···    D1 fk (x, y) Ø
              Ø                                                   Ø
              Ø .       .           .                    .        Ø
              Ø .
                .       .
                        .           .
                                    .                    .
                                                         .        Ø
              Ø                                                   Ø
              Ø 0 ··· 1       Dn f1 (x, y)   ···    Dn fk (x, y) Ø
              Ø                                                   Ø
              Ø                                                   Ø,
              Ø 0 ··· 0 D                                         Ø
              Ø                n+1 f1 (x, y) · · · Dn+1 fk (x, y) Ø
              Ø .       .           .                    .        Ø
              Ø .       .           .                    .        Ø
              Ø .       .           .                    .        Ø
              Ø 0 ··· 0 D          f (x, y) · · · D     f (x, y) Ø
                                n+k 1                      n+k k

que claramente coincide (salvo signo) con

                                 ∂(f1 · · · fk )
                                                 (x, y).
                                 ∂(y1 · · · yk )

   As´ |JF (x0 , y 0 )| 6= 0. Por el teorema de inyectividad local existe un entorno
      ı
V de (x0 , y 0 ) donde F es inyectiva y su determinante jacobiano no se anula. Por
200                    Cap´
                          ıtulo 5. Introducci´n a las variedades diferenciables
                                             o

el teorema de la funci´n inversa tenemos que W = F [V ] es abierto en Rn+k y
                       o
la funci´n G = F −1 : W −→ V es de clase C q .
        o                         °                 ¢
    Podemos expresar G(x, y) = G1 (x, y), G2 (x, y) . Claramente G1 y G2 son
ambas de clase C q . Si (x, y) ∈ W , entonces
                °        ¢     °                 ¢ °             °     ¢¢
     (x, y) = F G(x, y) = F G1 (x, y), G2 (x, y) = G1 (x, y), f G(x, y) ,
                                                     °           ¢
luego G1 (x, y) = x, con lo que en general G(x, y) = x, G2 (x, y) .
  Definimos U = {x ∈ Rn | (x, 0) ∈ W }. Es claro que se trata de un abierto.
Adem´s, F (x0 , y 0 ) = (x0 , 0) ∈ W , luego x0 ∈ U . Definimos g : U −→ Rk
     a
mediante g(x) = G2 (x, 0). Claramente g es de clase C q .
    Tomemos ahora x ∈ U e y = g(x). Hemos de probar que (x, y) ∈ V y
f (x, y) = 0. En efecto, por definici´n de U es (x, 0) ∈ W , luego G(x, 0) ∈ V ,
                                    o
pero                        °           ¢ °        ¢
                  G(x, 0) = x, G2 (x, 0) = x, g(x) = (x, y).
                   °       ¢             °         ¢
Adem´s (x, 0) = F G(x, 0) = F (x, y) = x, f (x, y) , luego f (x, y) = 0.
       a
   Rec´ıprocamente, si (x, y) ∈ V y f (x, y) = 0 entonces
                                 °          ¢
                      F (x, y) = x, f (x, y) = (x, 0) ∈ W,
                         °        ¢              °         ¢ °      ¢
luego x ∈ U y (x, y) = G F (x, y) = G(x, 0) = x, G2 (x, 0) = x, g(x) , con lo
que g(x) = y.
    Lo que afirma este teorema es que si S = {x ∈ Rn+k | f (x) = 0} es un
conjunto determinado por un sistema de k ecuaciones de clase C q y p ∈ S
cumple la hip´tesis entonces V ∩ S = X[U ], donde X(x) = (x, g(x)), de donde
               o
se sigue que X cumple las condiciones para ser una carta de S alrededor de p.
Si la hip´tesis se cumple en todo punto entonces S es una variedad diferenciable
         o
de dimensi´n n.
           o
    Por ejemplo, si f (x, y, z) = x2 + y 2 + z 2 − r2 , entonces el conjunto S es
una esfera. Para comprobar que se trata de una superficie de clase C ∞ basta
comprobar que en cada punto al menos una de las derivadas
                        ∂f          ∂f           ∂f
                           = 2x,       = 2y,        = 2z,
                        ∂x          ∂y           ∂z
es no nula, pero las tres s´lo se anulan simult´neamente en (0, 0, 0), que no es
                             o                    a
un punto de S, luego, efectivamente, la esfera es una superficie diferenciable.
    Es importante observar que la derivada que no se anula no siempre es la
misma. Por ejemplo, en el polo norte (0, 0, r) la unica derivada que no se anula
                                                     ´
es la de z, luego en un entorno podemos expresar z como funci´n z(x, y). Con-
                    p                                              o
cretamente, z = r       2 − x2 − y 2 . Similarmente, la porci´n de esfera alrededor
                                                             o
                                                p
del polo sur es la gr´fica de la funci´n z = − r2 − x2 − y 2 . En cambio, alrede-
                      a                 o
dor de (r, 0, 0) la esfera no es la gr´fica de ninguna funci´n z(x, y). Es f´cil ver
                                       a                     o              a
que dado cualquier entorno U de (r, 0, 0) y cualquier entorno V de (r, 0) siempre
hay puntos (x, y) en U para los cuales hay dos puntos distintos (x, y, ±z) en U
5.1. Variedades                                                                    201

(con lo que (x, y) deber´ tener dos im´genes) y puntos (x, y) con x2 + y 2 > r2
                         ıa             a
para los que no existe ning´n z tal que (x, y, z) ∈ UpSin embargo, alrededor de
                            u                        .
este punto la esfera es la gr´fica de la funci´n x = r2 − y 2 − z 2 .
                             a               o
    El mismo argumento prueba en general que la esfera de dimensi´n no

                           S n = {x ∈ Rn+1 | kxk2 = 1}
                                                2

es una variedad diferenciable.

Ejemplo: superficies de revoluci´n Sea C una variedad diferenciable de
                                   o
dimensi´n 1 en R2 . Supongamos que todos sus puntos (x, z) cumplen x > 0.
       o
Llamaremos superficie de revoluci´n generada por C al conjunto
                                o
                      ©               °p             ¢   ™
                 S = (x, y, z) ∈ R3 |    x2 + y 2 , z ∈ C .

    El conjunto S est´ formado por todos los puntos que resultan de girar al-
                        a
rededor del eje Z los puntos de C. Vamos a ver que se trata de una variedad
diferenciable de dimensi´n 2.
                            o            p
    Tomemos (x0 , ¢ 0 , z0 ) ∈ S y x0 = x2 + y0 . Entonces (¯0 , z0 ) ∈ C. Sea
        °           y              ¯         0
                                                   2            x
α(u) = r(u), z(u) una carta de C alrededor de este punto, digamos r(u0 ) = x0 , ¯
z(u0 ) = z0 . Por definici´n existe un entorno V0 de u0 y un entorno U0 de (¯0 , z0 )
                          o                                                x
de modo que C ∩ U0 = α[V0 ]. Sea
                        °                          ¢
             X(u, v) = r(u) cos v, r(u) sen v, z(u) , (u, v) ∈ V0 × R.

   Claramente X es diferenciable (de la misma clase que α) y su matriz jaco-
biana es                 µ                                     ∂
                             r0 (u) cos v r0 (u) sen v z 0 (u)
             JX(u, v) =                                          .
                           −r(u) sen v r(u) cos v          0
El menor formado por las dos primeras columnas es r(u)r0 (u). Por hip´tesis      o
r no se anula y, por ser α una carta, su matriz jacobiana (r0 , z 0 ) no puede ser
nula tampoco, luego si r0 (u) = 0, entonces z 0 (u) 6= 0, luego uno de los menores
r(u)z 0 (u) sen v o −r(u)z 0 (u) cos v es no nulo. En cualquier caso el rango de JX
es 2.
    Es claro que existe un v0 ∈ R tal que X(u0 , v0 ) = (x0 , y0 , z0 ). La aplicaci´n
                                                                                    o
X no es inyectiva, pero s´ lo es su restricci´n a V = V0 ×]v0 − π, v0 + π[. Veamos
                           ı                  o
que es una carta para el punto dado. Sea

               U = {(x cos v, x sen v, z) | (x, z) ∈ U0 , |v − v0 | < π}.

    Sin la restricci´n sobre v, elp
                        o           ° conjunto U¢ ser´ la antiimagen de U0 por la
                                                        ıa
aplicaci´n continua (x, y, z) 7→
         o                              x2 + y 2 , z . En realidad U es la intersecci´n
                                                                                     o
de este abierto con el complementario del semiplano formado por los puntos
(x cos v0 , x sen v0 , z), con x ≥ 0, que es un cerrado, luego U es abierto. Es f´cil
                                                                                    a
ver que X[V ] = U ∩ S. Falta probar que X −1 es continua, ahora bien, dado
                                                                         p
(x, y, z) ∈ U ∩ S podemos obtener su coordenada u como u = α−1 ( x2 + y 2 , z),
que es una aplicaci´n continua, y su coordenada v se obtiene aplicando a
                          o
202                       Cap´
                             ıtulo 5. Introducci´n a las variedades diferenciables
                                                o
°                ¢
 x/r(u), y/r(u) la inversa del homeomorfismo v 7→ (cos v, sen v) definido para
|v − v0 | < π. Por lo tanto X|V es una carta alrededor de (x0 , y0 , z0 ).
                                                    °          ¢
    Si la variedad C es cubrible por una unica carta r(u), z(u) , lo que se traduce
                                         ´
en que C es una curva regular, entonces tenemos una unica funci´n X, de modo
                                                       ´            o
que todo punto de S admite como carta a una restricci´n de X. Expresaremos
                                                         o
esto diciendo simplemente que X es una carta de S.
    Las l´ıneas de la forma X(u, v0 ) y X(u0 , v), donde u0 y v0 son constantes,
se llaman meridianos y paralelos de la superficie S. Los paralelos son siempre
circunferencias paralelas entre s´ los meridianos son giros de la curva C.
                                  ı,
    Los ejemplos m´s simples de superficies de revoluci´n se obtienen al girar
                     a                                  o
una recta. Si ´sta es paralela al eje de giro obtenemos un cilindro, y en caso
                e
contrario un cono.° En el caso del cono hemos de considerar en realidad una
                              ¢
semirrecta abierta r(u), z(u) = (mu, u), para u > 0, pues para u = 0 tenemos
el v´rtice del cono, donde S no es diferenciable. Una carta del cilindro es
    e

                             X(u, v) = (r cos v, r sen v, u),

y para el cono tenemos

                          X(u, v) = (mu cos v, mu sen v, u).




   Las figuras muestran algunos de los meridianos y paralelos del cilindro y el
cono. Los meridianos son rectas y los paralelos circunferencias.
   Un caso m´s sofisticado aparece al girar una circunferencia de radio r cuyo
               a
centro est´ a una distancia R del eje Z, es decir, tomando
          e
              °          ¢
               r(u), z(u) = (R + r cos u, r sen u), con 0 < r < R.

    Todo punto de la circunferencia admite como carta a una restricci´n de
                                                                        o
esta curva. As´ obtenemos un tubo de secci´n circular cerrado sobre s´ mismo.
              ı                           o                          ı
Recibe el nombre de toro.2 En este caso

          X(u, v) = (R cos v + r cos u cos v, R sen v + r cos u sen v, r sen u).
  2 Del  lat´ torus, que es el nombre dado en arquitectura a los salientes tubulares de las
            ın
columnas. Obviamente no tiene nada que ver con taurus, el animal del mismo nombre en
castellano.
5.2. Espacios tangentes, diferenciales                                                   203




    Obviamente X es de clase C ∞ . Su restricci´n a ]0, 2π[ × ]0, 2π[ es inyectiva
                                                 o
y cubre todos los puntos del toro excepto los de las circunferencias u = 0 y
v = 0. Si llamamos U al complementario de la uni´n de estas dos circunferencias
                                                   o
tenemos un abierto en R3 , y es claro que con ´l se cumple la definici´n de
                                                   e                        o
variedad. Igualmente se prueba que la restricci´n a ]−π, π[ × ]−π, π[ constituye
                                                 o
una carta para los puntos exceptuados. As´ pues, el toro es una superficie
                                               ı
diferenciable de clase C ∞ . Sus meridianos son circunferencias de radio r.
   La esfera menos dos puntos ant´   ıpodas puede considerarse como la super-
ficie de revoluci´n generada por la semicircunferencia (r sen φ, r cos φ), para
                 o
φ ∈ ]0, π[. La carta correspondiente es

      X(φ, θ) = (r sen φ cos θ, r sen φ sen θ, r cos φ),    φ ∈ ]0, π[ , θ ∈ ]0, 2π[ .

    Si p = X(φ, θ) entonces θ es la longitud de p en el sentido geogr´fico y φ
                                                                      a
es la “colatitud”, es decir, el ´ngulo respecto al polo norte. Los meridianos y
                                a
paralelos coinciden con los geogr´ficos. La carta no cubre los polos, aunque
                                   a
girando la esfera obtenemos otra carta similar que los cubra.

Ejemplo: Producto de variedades Si S1 ⊂ Rm1 y S2 ⊂ Rm2 son variedades
entonces S1 × S2 ⊂ Rm1 +m2 es tambi´n una variedad. Si X1 : U1 −→ V1 ∩ S1
                                            e
es una carta alrededor de un punto p1 ∈ S1 y X2 : U2 −→ V2 ∩ S2 es una carta
alrededor de p2 ∈ S2 , entonces X1 × X2 : U1 × U2 −→ (V1 × V2 ) ∩ (S2 × S2 ) dada
                                °              ¢
por (X1 × X2 )(u1 , u2 ) = X1 (u1 ), X2 (u2 ) es una carta alrededor de (p1 , p2 ).
     Sean πi : S1 × S2 −→ Si las proyecciones. Si la carta X1 tiene coordenadas
x1 , . . . , xn1 y la carta X2 tiene coordenadas y1 , . . . , yn2 , entonces las coordenadas
de X1 × X2 son las funciones π1 ◦ xi y π2 ◦ yi , a las que podemos seguir llamando
xi e yi sin riesgo de confusi´n.  o


5.2      Espacios tangentes, diferenciales
   Al principio de la secci´n anterior anticip´bamos que los sistemas de coor-
                           o                  a
denadas en una variedad son un an´logo a los sistemas de coordenadas en un
                                    a
espacio af´ La diferencia principal es que en el caso af´ las coordenadas est´n
          ın.                                           ın                   a
definidas sobre todo el espacio, mientras que en una variedad las tenemos defi-
nidas s´lo en un entorno de cada punto. En esta secci´n desarrollaremos esta
       o                                                 o
analog´ mostrando que toda variedad diferenciable se confunde en un entorno
      ıa
de cada punto con una variedad af´ Para empezar, si p es un punto de una
                                   ın.
variedad S, X es una carta alrededor de p y x es su sistema de coordenadas
204                    Cap´
                          ıtulo 5. Introducci´n a las variedades diferenciables
                                             o

asociado, sabemos que ¢ un entorno de x(p) el punto X(x) se confunde con
       °    ¢°        en
p + dX° x(p)¢ x − x(p) , con lo que los puntos de S se confunden con los de
p + dX x(p) [Rn ].

Definici´n 5.8 Sea S ⊂ Rm una variedad diferenciable de dimensi´n n y sea
       o                                                             o
X : U −→ S una carta alrededor de un punto p ∈ S. Sea x ∈ U tal que
X(x) = p. Llamaremos espacio tangente a S en p a la variedad lineal Tp (S) =
dX(x)[Rn ]. Llamaremos variedad tangente a S por p a la variedad af´ p+Tp (S).
                                                                   ın

    Puesto que JX(x) tiene rango n, es claro que las variedades tangentes tienen
dimensi´n n. El teorema 5.5 prueba que el espacio tangente no depende de la
        o
carta con la que se construye, pues si X e Y son dos cartas alrededor de p,
digamos X(x) = Y (y) = p, sabemos que g = X ◦ Y −1 es diferenciable en un
entorno de x y X = g ◦ Y , luego dX(x) = dg(x) ◦ dY (y), luego dX(x) y dY (y)
tienen la misma imagen (pues dg(x) es un isomorfismo). El teorema siguiente
muestra m´s expl´
           a     ıcitamente que Tp (S) s´lo depende de S.
                                         o

Teorema 5.9 Sea S ⊂ Rm una variedad diferenciable de dimensi´n n. En-
                                                                    o
tonces Tp (S) est´ formado por el vector nulo m´s los vectores tangentes en p a
                 a                              a
todas las curvas regulares que pasan por p contenidas en S.

                   ´
   Demostracion: Sea X : U −→ S ¢
                                °      una carta alrededor de p. Podemos supo-
ner que es de la forma X(x) = x, f (x) , para una cierta funci´n diferenciable f .
                                                              o
Sea X(p1 ) = p. Sea v ∈ Rn no nulo. Consideremos la curva x(t) = p1 + tv. Para
valores suficientemente peque˜os de t se cumple que x(t) ∈ U . Consideremos la
                               n
curva α(t) = X(x(t)). Claramente α est´ contenida en S y cumple α(0) = p.
                                          a
Su vector tangente en p es
                                  °  ¢
                     α0 (0) = dX x(0) (x0 (0)) = dX(p1 )(v).

     Esto prueba que todo vector de Tp (S) es de la forma indicada. Rec´  ıproca-
mente, si α(t) es una curva regular contenida en S que pasa por p, digamos
α(t0 ) = p, sea x(t) = X −1 (α(t)), definida en un entorno de t0 . Se cumple
que x(t) es derivable, pues X −1 no es m´s que la restricci´n de la proyecci´n
                                              a              o                o
π : Rm −→ ° n , que es diferenciable, luego x = α ◦ π. Tenemos α = x ◦ X, luego
             R ¢
α0 (t) = dX x(t) (x0 (t)). Esta relaci´n prueba que x0 (t) 6= 0 o de lo contrario
                                         o
tambi´n se anular´ α0 (t). Por¢lo tanto x es regular. Adem´s la tangente de α
       e            ıa    °                                  a
en p es α0 (t0 ) = dX(p1 ) x0 (t0 ) ∈ Tp (S).
    En la prueba de este teorema hemos visto un hecho importante: si α es
una curva contenida en una variedad S y pasa por un punto p, dada una carta
X : U −→ S alrededor de p, podemos trasladar a la carta el arco de curva
alrededor de p, es decir, existe otra curva x en U de modo que α = x ◦ X (en
un entorno de las coordenadas de p). En otras palabras, x es la representaci´n
                                                                            o
de α en el mapa de S determinado por X.
Ejercicio: Probar que el plano tangente a una gr´fica vista como variedad diferen-
                                                a
ciable coincide con el que ya ten´
                                 ıamos definido.
5.2. Espacios tangentes, diferenciales                                          205

    Precisemos la interpretaci´n geom´trica de la variedad tangente. Ya hemos
                              o      e
justificado que los puntos de S se confunden con los de la variedad tangente
Tp (S) en un entorno de p, pero m´s exactamente, si X es una carta alrededor
                                   a
de p y x es su sistema de coordenadas, hemos visto que cada punto q ∈ S
suficientemente pr´ximo a p se confunde con el punto
                   o
                           °    ¢°           ¢
                     p + dX x(p) x(q) − x(p) ∈ p + Tp (S).

Definici´n 5.10 Sea S ⊂ Rm , p ∈ S, sea X : U −→ V ∩ S una carta alrededor
          o
de p y sea x su sistema de coordenadas. Llamaremos proyecci´¢° asociada a ¢
                                                         ° on             X
a la aplicaci´n πp : S ∩ V −→ Tp (S) dada por πp (q) = dX x(p) x(q) − x(p) .
             o

    Seg´n hemos visto, la interpretaci´n geom´trica de estas proyecciones con-
       u                               o       e
siste en que el paso q 7→ πp (q) es imperceptible si tomamos puntos q suficien-
temente pr´ximos a p. Ahora veamos que las coordenadas de q en la carta
            o
coinciden con las coordenadas de πp (q) asociadas a un cierto sistema de refe-
rencia af´ en Tp (S).
         ın
    Sea X : U −→ S una carta de una variedad S. Sea X(x) = p. Entonces
dX(x) : Rn −→ Tp (S) es un isomorfismo. Por consiguiente, si e1 , . . . , en son los
vectores de la base can´nica en Rn , sus im´genes dX(x)(ei ) = Di X(x) forman
                        o                   a
una base de Tp (S). El espacio tangente no tiene una base can´nica pero, seg´n
                                                                o               u
acabamos de ver, cada carta alrededor de p determina una base en Tp (S). Es
claro que si q ∈ S est´ en el entorno de p cubierto por la carta, las coordenadas
                      a
de πp (q) en la base asociada en Tp (S) son x(q) − x(p), luego si con dicha base
formamos un sistema de referencia af´ en p + Tp (S) cuyo origen sea el punto
             °    ¢°     ¢             ın
O = p − dX x(p) x(p) , tenemos que las coordenadas de πp (q) en este sistema
son precisamente x(q). Cuando hablemos del sistema de referencia af´ asociado
                                                                       ın
a la carta nos referiremos a ´ste. En conclusi´n, cada punto q de un entorno
                               e                o
de p en S se confunde con el punto πp (q) de id´nticas coordenadas afines en la
                                                e
variedad tangente p + Tp (S).
Ejercicio: Probar que si S1 y S2 son variedades diferenciables y (p, q) ∈ S1 × S2
entonces T(p,q) (S1 × S2 ) = Tp (S1 ) × Tq (S2 ).

   Seguidamente generalizamos la noci´n de diferenciabilidad al caso de apli-
                                        o
caciones entre variedades cualesquiera (no necesariamente abiertos de Rn ).

Definici´n 5.11 Diremos que una aplicaci´n continua f : S −→ T entre dos
         o                                    o
variedades es diferenciable (de clase C q ) en un punto p ∈ S si existen cartas
X e Y alrededor de p y f (p) respectivamente de modo que X ◦ f ◦ Y −1 sea
diferenciable (de clase C q ) en X −1 (p).

    El teorema 5.5 implica que la diferenciabilidad de f en p no depende de la
elecci´n de las cartas X e Y , en el sentido de que si unas cartas prueban que f
      o
es diferenciable, otras cualesquiera lo prueban igualmente.
    Es f´cil ver que la composici´n de aplicaciones diferenciables es diferenciable.
        a                        o
Una aplicaci´n f : U −→ Rm definida en un abierto U de Rn es diferenciable
              o
206                    Cap´
                          ıtulo 5. Introducci´n a las variedades diferenciables
                                             o

en el sentido que ya ten´  ıamos definido si y s´lo si lo es considerando a U y a
                                               o
Rm como variedades diferenciables (con la identidad como carta).
     Por el teorema 5.4, si S ⊂ T ⊂ Rm son variedades diferenciables, la inclusi´n
                                                                                o
i : S −→ T es diferenciable, lo que se traduce en que las restricciones a S de las
funciones diferenciables en T son funciones diferenciables en S.
     Es claro que todas estas propiedades valen tambi´n si sustituimos la diferen-
                                                      e
ciabilidad por la propiedad de ser de clase C q .
    Una aplicaci´n f : S −→ T entre dos variedades es un difeomorfismo si
                 o
es biyectiva, diferenciable y su inversa es diferenciable. Dos variedades son
difeomorfas si existe un difeomorfismo entre ellas.
    Es obvio que las cartas de una variedad son difeomorfismos en su imagen.
M´s a´n:
  a u

Teorema 5.12 Todo difeomorfismo entre un abierto de Rn y un abierto de una
variedad S en Rm es una carta para S.

                 ´
   Demostracion: Sea f : U −→ W un difeomorfismo, donde W ⊂ S es
abierto en S. Entonces existe un abierto V en Rm tal que f [U ] = W = V ∩ S.
Obviamente df tiene rango m´ximo en cada punto, con lo que se cumple la
                              a
definici´n de carta.
       o
    En particular tenemos que las coordenadas xi : S ∩ V −→ R asociadas a
una carta X son funciones diferenciables (son la composici´n de X −1 con las
                                                              o
proyecciones πi : Rn −→ R). Ahora definimos la diferencial de una funci´n   o
diferenciable.
    Supongamos que f : S −→ T es una aplicaci´n entre dos variedades diferen-
                                                 o
ciable en un punto p. Sean X : U −→ S e Y : W −→ T cartas alrededor de
p y f (p). Digamos que U (x) = p, Y (y) = f (p). Entonces j = X ◦ f ◦ Y −1 es
diferenciable en x y tenemos las aplicaciones lineales siguientes:

                            Tp (S)            Tf (p) (T )
                              x                 x
                                               
                         dX(x)                 dY (y)
                                    dj(x)
                               Rn − − − → Rm
                                   −−−

    Las flechas verticales representan isomorfismos, luego podemos definir la
diferencial de f en p como la aplicaci´n lineal df (p) : Tp (S) −→ Tf (p) (T ) dada
                                      o
por df (p) = dX(x)−1 ◦ dj(x) ◦ dY (y). Teniendo en cuenta que las diferenciales
aproximan localmente a las funciones correspondientes no es dif´ convencerse
                                                                  ıcil
de que df (p) se confunde con f cuando los puntos de Tp (S) se confunden con
los de S. El teorema siguiente prueba que df (p) no depende de la elecci´n de o
las cartas X e Y .

Teorema 5.13 Sea f : S −→ T una aplicaci´n diferenciable en un punto p ∈ S.
                                           o
Sea v ∈ Tp (S). Si α es cualquier curva contenida en S que pase por p con
tangente v, entonces α ◦ f es una curva contenida en T que pasa por f (p) con
tangente df (p)(v).
5.2. Espacios tangentes, diferenciales                                           207

                    ´
   Demostracion: Sean X e Y cartas alrededor de p y f (p) respectivamente.
Digamos que X(x) = p e Y (y) = f (p). Sea β la representaci´n de α en la
                                                             °     o¢
carta X, es decir, α = β ◦ X. Entonces v = α0 (t0 ) = dX(x) β 0 (t0 ) .
   Podemos descomponer α ◦ f = α ◦ X −1 ◦ X ◦ f ◦ Y −1 ◦ Y . Con la notaci´n o
que hemos empleado en la definici´n de df (p) tenemos α ◦ f = β ◦ j ◦ Y . Esto
                                         o
prueba que α ◦ f es derivable en t0 y adem´s   a
                        ≥     °         ¢¥       ≥     °           ¢¥
(α ◦ f )0 (t0 ) = dY (y) dj(x) β 0 (t0 ) = dY (y) dj(x) dX(x)−1 (v) = df (p)(v).



    Es inmediato comprobar que la regla de la cadena sigue siendo v´lida para
                                                                   a
aplicaciones diferenciables entre variedades, es decir,
                                                  °     ¢
                         d(f ◦ g)(p) = df (p) ◦ dg f (p) .

    De aqu´ se sigue en particular que si f es un difeomorfismo, entonces df (p)
          ı              °     ¢
es un isomorfismo y df −1 f (p) = df (p)−1 .
    Si S ⊂ T ⊂ Rm son variedades diferenciables entonces el teorema anterior
prueba que la diferencial de la inclusi´n i : S −→ T en cada punto p ∈ S es
                                       o
simplemente la inclusi´n de Tp (S) en Tp (T ). De aqu´ se sigue que la diferencial
                      o                               ı
en un punto p de la restricci´n a S de una funci´n f diferenciable en T es
                               o                     o
simplemente la restricci´n de df (p) a Tp (S), pues la restricci´n no es m´s que
                        o                                       o          a
la composici´n con la inclusi´n.
            o                o
    Si X : U −→ S es una carta de una variedad S alrededor de un punto
p, entonces sus coordenadas asociadas xi son ciertamente diferenciables. M´s   a
concretamente, si πi : Rn −→ R es la proyecci´n en la i-´sima coordenada,
                                                    o          e
tenemos que xi = X −1 ◦ πi , luego dxi (p) = dX(p)−1 ◦ dπi (x) y en particular
                                                    Ω
                                                      1 si i = j
                 dxi (p) (Dj X(x)) = dπi (x)(ej ) =
                                                      0 si i 6= j

es decir, las aplicaciones dxi (p) forman la base dual de D1 X(x), . . . , Dn X(x).
Por consiguiente, para cada v ∈ Tp (S) se cumple que dxi (p)(v) es la coordenada
correspondiente a Di X(x) en la expresi´n de v como combinaci´n lineal de las
                                         o                       o
derivadas de X.

Ejemplo Consideremos el plano tangente a R2 en el punto p = (1, 1) (que
es el propio R2 ). La base asociada a la carta identidad es simplemente la base
can´nica (e1 , e2 ), y su base dual es la dada por las proyecciones dx(p), dy(p).
    o
Tambi´n podemos considerar tambi´n la carta determinada por las coordenadas
       e                               e
polares (ρ, θ), es decir, (x, y) = (ρ cos θ, ρ sen θ). Su base asociada es la formada
por las derivadas parciales:

             v1 (ρ, θ) = (cos θ, sen θ),   v2 (ρ, θ) = (−ρ sen θ, ρ cos θ).
208                       Cap´
                             ıtulo 5. Introducci´n a las variedades diferenciables
                                                o


   En particular, en el punto (1, 1) queda
            µ          ∂                                                         v1
               1    1
      v1 = √ , √         , v2 = (−1, 1).                       v2       dρ
                2    2                                                                dx
                                                                    p
    Dado un vector u ° R , sus coordenadas (en
                         ∈   2
                                         ¢                                                 dy
la base can´nica) son dx(p)(u), dy(p)(u) , mien-
          ° o                ¢                                           dθ                u
tras que dρ(p)(u), dθ(p)(u) son sus coordena-
das en la base (v1 , v2 ).
    Conocemos la relaci´n entre las diferenciales:
                           o

             dx = cos θ dρ − ρ sen θ dθ,       dy = sen θ dρ + ρ cos θ dθ.

    Concretamente, en el punto (1, 1) se cumple
                            √                      √
                              2                      2
                      dx =      dρ − dθ, dy =          dρ + dθ.                (5.1)
                             2                      2
                                          √
    Sea ahora S la circunferencia de radio 2. Tres posibles cartas de S alrededor
de (1, 1) son
            ° p          ¢            °p            ¢           √
   g1 (x) = x, 2 − x2 , g2 (y) =         2 − y 2 , y , g3 (θ) = 2 (cos θ, sen θ).

    Sus funciones coordenadas son respectivamente (las
restricciones de) las funciones x, y, θ, luego sus diferen- V
ciales asociadas son las restricciones de las diferencia-
les correspondientes, que seguiremos llamando dx(p),
dy(p), dθ(p). Es f´cil ver que las bases asociadas a las
                   a                                                         p
tres cartas son respectivamente
                                                                                 S
      vx = (1, −1),     vy = (−1, 1),    vθ = (−1, 1).

Obviamente no podemos tomar a ρ como coordenada, pues ρ es constante en S.
Esto se traduce en que dρ(p) = 0 (sobre Tp (S)). Alternativamente, vemos que
los vectores de Tp (S) tienen nula la primera coordenada de su expresi´n en la
                                                                       o
base (v1 , v2 ). Como consecuencia, de (5.1) se sigue ahora que dy = dθ = −dx.


Ejemplo Consideremos el toro T de carta

        X(u, v) = (R cos v + r cos u cos v, R sen v + r cos u sen v, r sen u).

    Ya hemos comentado que X no es exactamente una carta de T , sino que
las cartas de T son restricciones de X a dominios adecuados. Consideremos
la circunferencia unidad S 1 = {x ∈ R2 | kxk = 1}. Entonces la aplicaci´n
                                                                       o
f : S 1 × S 1 −→ T dada por

                      f (x, y) = (Ry1 + rx1 y1 , Ry2 + rx1 y2 , rx2 )
5.2. Espacios tangentes, diferenciales                                             209

es un difeomorfismo. Notemos que si x = (cos u, sen u), y = (cos v, sen v), enton-
ces f (x, y) = X(u, v). Teniendo esto en cuenta es f´cil ver que f es biyectiva.
                                                      a
Adem´s es diferenciable porque sus funciones coordenadas son polin´micas (es
       a                                                                 o
la restricci´n de una funci´n diferenciable en R4 ). En un entorno de cada punto
            o              o
de T , la funci´n f −1 puede expresarse como (cos u, sen u, cos v, sen v), donde u,
                o
v son las funciones coordenadas de la carta de T alrededor de punto obtenida
por restricci´n de X. Por consiguiente f es un difeomorfismo.
              o

Ejercicio: Probar que un cilindro es difeomorfo al producto de un segmento por una
circunferencia y que una bola abierta menos su centro es difeomorfa al producto de
un segmento por una esfera.

Definici´n 5.14 Sea f : S −→ R una funci´n definida sobre una variedad y
         o                                        o
sea p ∈ S un punto donde f sea diferenciable. Sea X una carta de S alrededor
de p y sean x1 , . . . , xn sus coordenadas asociadas. Definimos la derivada parcial
de f respecto a xi en p como
                             ∂f              °       ¢
                                 (p) = df (p) Di X(x) ,
                             ∂xi
donde x es el vector de coordenadas de p en la carta dada.

   Es claro que esta noci´n de derivada parcial generaliza a la que ya ten´
                         o                                                ıamos
para el caso de funciones definidas en abiertos de Rn . En el caso general sea
j = X ◦ f . Seg´n la definici´n de df (p) resulta que
               u            o

                           ∂f                     ∂j
                               (p) = dj(x)(ei ) =     (x),
                           ∂xi                    ∂xi
donde ei es el i-´simo vector de la base can´nica de Rn . Si f es diferenciable en
                 e                          o
un entorno de p tenemos
                                ∂f            ∂j
                                     = X −1 ◦     .
                               ∂xi            ∂xi
    Ahora es claro que una funci´n f es de clase C q en S si y s´lo si tiene
                                       o                                    o
derivadas parciales continuas de orden q.
    Puesto que dx1 (p), . . . , dxn (p) es la base dual de D1 X(x), . . . , Dn X(x), de
la propia definici´n de derivada parcial se sigue que
                 o
                                 ∂f                ∂f
                          df =       dx1 + · · · +     dxn .
                                 ∂x1               ∂xx
    Tambi´n es f´cil ver que las reglas usuales de derivaci´n de sumas y productos
          e     a                                          o
siguen siendo v´lidas, as´ como el teorema de Schwarz. Adem´s
               a          ı                                       a
                                       Ω
                               ∂xj       1 si i = j
                                    =
                               ∂xi       0 si i 6= j.

   Es importante observar que la derivada de una funci´n f respecto a una
                                                       o
coordenada xi no depende s´lo de f y xi , sino de la carta de la cual forma
                           o
210                       Cap´
                             ıtulo 5. Introducci´n a las variedades diferenciables
                                                o

parte xi . Por ejemplo, si en la esfera de centro 0 y radio 1 consideramos un
punto cuyas tres coordenadas (x, y, z) sean no nulas, en un entorno podemos
considerar la carta de coordenadas (x, y), respecto a la cual
                                ∂z         x
                                   = −p             .
                                ∂x     1 − x2 − y 2
Sin embargo, tambi´n podemos considerar la carta de coordenadas (x, z) y en-
                   e
tonces resulta que
                                ∂z
                                    = 0.
                                ∂x

5.3      La m´trica de una variedad
             e
     Todas las propiedades m´tricas de Rn se derivan de su producto escalar, que
                                   e
es una forma bilineal Rn × Rn −→ R. En una variedad S ⊂ Rm no tenemos
definido un producto escalar, pero s´ tenemos uno en cada uno de sus espacios
                                           ı
tangentes: la restricci´n del producto escalar en Rm .
                            o
     Conviene introducir ciertos hechos b´sicos sobre formas bilineales. Puesto
                                                  a
que son puramente algebraicas las enunciaremos para un espacio vectorial arbi-
trario E, pero en la pr´ctica E ser´ siempre el espacio tangente Tp (S) de una
                              a           a
variedad S en un punto p. Fijada una base (v1 , . . . , vn ) de E, representare-
mos su base dual por (dx1 , . . . , dxn ). Esta notaci´n —puramente formal en un
                                                             o
principio— se ajusta al unico ejemplo que nos interesa, pues si E = Tp (S) y
                                ´
(v1 , . . . , vn ) es la base asociada a una carta X, entonces la base dual que en
general hemos llamado (dx1 , . . . , dxn ) es concretamente la formada por las dife-
renciales dx1 (p), . . . , dxn (p), donde x1 , . . . , xn son las funciones en S que a cada
punto le asignan sus coordenadas respecto a X.
Definici´n 5.15 Sea E un espacio vectorial de dimensi´n n. Llamaremos B(E)
          o                                           o
al conjunto de todas las formas bilineales F : E × E −→ R, que es claramente
un espacio vectorial con la suma y el producto definidos puntualmente.3
    Si f, g : E −→ R son aplicaciones lineales, definimos su producto tensorial
como la forma bilineal f ⊗ g ∈ B(E) dada por (f ⊗ g)(u, v) = f (u)g(v).
   Las propiedades siguientes son inmediatas:
  a) f ⊗ (g + h) = f ⊗ g + f ⊗ h, (f + g) ⊗ h = f ⊗ h + g ⊗ h.
  b) (αf ) ⊗ g = f ⊗ (αg) = α(f ⊗ g),            para α ∈ R.
Teorema 5.16 Todo elemento de B(E) se expresa de forma unica como
                                                       ´
                             n
                             X
                       F =           αij dxi ⊗ dxj ,   con αij ∈ R.
                             i,j=1

Concretamente αij = F (vi , vj ).
   3 Los elementos de B(E) se llaman tensores dos veces covariantes, pero aqu´ no vamos a
                                                                             ı
entrar en el c´lculo tensorial.
              a
5.3. La m´trica de una variedad
         e                                                                                 211

             ´
   Demostracion: Basta observar que
                                      n
                                        1 si i = r, j = s
             (dxi ⊗ dxj )(vr , vs ) =
                                        0 en caso contrario.
De aqu´ se sigue que F y el miembro derecho de la igualdad act´an igual sobre
       ı                                                      u
todos los pares de vectores b´sicos. La unicidad es clara.
                             a
   Por ejemplo, en estos t´rminos el producto escalar en Rn viene dado por
                          e

                               dx1 ⊗ dx1 + · · · + dxn ⊗ dxn .

Definici´n 5.17 Un campo tensorial (dos veces covariante) en una variedad
          o
S ⊂ Rm es una aplicaci´n que a cada p ∈ S le hace corresponder una forma
                          o
bilineal en Tp (S). El tensor m´trico de S es el campo g que a cada punto p le
                                e
asigna la restricci´n a Tp (S) del producto escalar en Rm .
                   o

    Si llamamos T (S) al conjunto de los campos tensoriales en S seg´n la defi-
                                                                        u
nici´n anterior, es claro que se trata de un espacio vectorial con las operaciones
    o
definidas puntualmente. M´s a´n, podemos definir el producto de una funci´n
                             a u                                                o
f : S −→ R por un campo F ∈ T (S) como el campo f F ∈ T (S) dado por
(f F )(p) = f (p)F (p).
   Sea X : U −→ S una carta de S. Representaremos por x1 , . . . , xn las
funciones coordenadas respecto a X. Si x ∈ U y p = X(x), sabemos que
D1 X(x), . . . , Dn X(x) es una base de Tp (S) y dx1 (p), . . . , dxn (p) es su base dual.
Por consiguiente, todo w ∈ Tp (S) se expresa como

             w = dx1 (p)(w)D1 X(x(p)) + · · · + dxn (p)(w)Dn X(x(p)).

   As´ pues, si w1 , w2 ∈ Tp (S), su producto escalar es
     ı
                            n
                            X
         gp (w1 , w2 ) =            Di X(x(p))Dj X(x(p))dxi (p)(w1 )dxj (p)(w2 ),
                            i,j=1

luego
            n
            X
     gp =           gij (p)dxi (p) ⊗ dxj (p),       con gij (p) = Di X(x(p))Dj X(x(p)),
            i,j=1

o, m´s brevemente, como igualdad de campos:
    a
                                           n
                                           X
                                      g=           gij dxi ⊗ dxj ,                        (5.2)
                                           i,j=1

    Esta expresi´n recibe el nombre de expresi´n en coordenadas del tensor
                o                               o
m´trico de S en la carta X. Las funciones gij se llaman coeficientes del tensor
  e
m´trico en la carta dada. Claramente son funciones diferenciables. Notemos
  e
que la expresi´n coordenada no est´ definida en toda la variedad S, sino s´lo
              o                     a                                      o
sobre los puntos del rango V de la carta X.
212                           Cap´
                                 ıtulo 5. Introducci´n a las variedades diferenciables
                                                    o

   La matriz (gij (p)) es la matriz del producto escalar de Tp (S) en una cierta
base. Es claro entonces que su determinante es no nulo. Este hecho ser´ rele-
                                                                         a
vante en varias ocasiones.
   A trav´s del difeomorfismo X : U −→ V juntamente con los isomorfismos
          e
dX(x) : Rn −→ Tp (S) podemos transportar la restricci´n a V del tensor m´trico
                                                       o                  e
de S hasta un campo tensorial en U , concretamente el dado por
                                     °                      ¢
                   hX (w1 , w2 ) = gp dX(x)(w1 ), dX(x)(w2 )
           n
           X
       =           gij (X(x)) dxi (X(x))(dX(x)(w1 )) dxj (X(x))(dX(x)(w2 ))
           i,j=1

                     n
                     X
               =            gij (X(x)) d(X ◦ xi )(x)(w1 ) d(X ◦ xj )(x)(w2 )
                    i,j=1

                                n
                                X
                            =           gij (x) dxi (x)(w1 ) dxj (x)(w2 ),
                                i,j=1

donde en el ultimo t´rmino xi es simplemente la proyecci´n en la i-´sima coor-
             ´       e                                    o         e
denada de U y gij (x) = (X ◦ gij )(x). Por lo tanto hX tiene la misma expresi´n
                                                                             o
(5.2) interpretando convenientemente las funciones.
   Al transportar a la carta el tensor m´trico, podemos calcular el producto
                                        e
de dos vectores tangentes a dos curvas α y β que ° cortan en p a partir ¢de
                                                   se ¢              °
sus representaciones en X. Digamos que α(t) = X x(t) y β(t) = X x(t) y ¯
supongamos que en t0 pasan por p. Entonces

                            gp (α0 (t0 ), β 0 (t0 )) = hX (x0 (t0 ), x0 (t0 )).
                                                                     ¯

   Del mismo modo que el tensor m´trico de una variedad S asigna a cada
                                        e
punto p el producto escalar de Tp (S), tambi´n podemos considerar la aplicaci´n
                                            e                                o
                                                    ´
que a cada punto p le asigna la norma en Tp (S). Esta recibe el nombre de
elemento de longitud de S y se representa por ds. As´ pues,
                                                    ı
                                            q
                         ds(p)(v) = kvk = gp (v, v).

    El tensor m´trico y el elemento de longitud se determinan mutuamente por
               e
la relaci´n
         o

                   ds2 (p)(u + v) = ds2 (p)(u) + ds2 (p)(v) + 2gp (u, v),

luego en la pr´ctica es equivalente trabajar con uno o con otro y ds suele dar
              a
lugar a expresiones m´s simples. Por ejemplo, la expresi´n de ds2 en una carta
                      a                                 o
es
                                    Xn
                             ds2 =      gij dui duj .                    (5.3)
                                               i,j=1
5.3. La m´trica de una variedad
         e                                                                        213

   La misma expresi´n es v´lida para el campo que resulta de transportarlo al
                     o       a
dominio de la carta interpretando adecuadamente las funciones.
   El nombre de elemento de longitud se debe a que si α : [a, b] −→ S es
una curva regular cuya imagen est´ contenida en el rango de una carta X y
                                      a
α(t) = X(x(t)), entonces ds2 (x0 (t)) = kα0 (t)k2 , luego la longitud de α es
                                         v
                    Z b               Z buX
                                         u n
           L =          kα0 (t)k dt =    t         gij (x(t))x0 (t)x0 (t) dt
                                                              i     j
                     a                       a     i,j=1
                    v
                 Z buX                                 Z
                    u n                                                b
               =    t   gij (x(t)) x0 (t)dt x0 (t)dt =
                                    i        j                             ds,
                     a      i,j=1                                  a


entendiendo ahora que en (5.3) x = x(t) y dxi = x0 (t)dt.
    En el caso de una superficie S ⊂ R3 es costumbre representar las derivadas
parciales de una carta X(u, v) mediante Xu , Xv y los coeficientes del tensor
m´trico como E = Xu Xu , F = Xu Xv , G = Xv Xv , de modo que la expresi´n
  e                                                                        o
en coordenadas del tensor m´trico es
                            e

               E du ⊗ du + F (du ⊗ dv + dv ⊗ du) + G dv ⊗ dv.                    (5.4)

   El elemento de longitud es

                         ds2 = E du2 + 2F dudv + G dv 2 .

Ejemplo Vamos a calcular los coeficientes del tensor m´trico de la superficie
                                                           e
de revoluci´n dada por
           o
                                                        ¢
                       X = (r(u) cos v, r(u) sen v, z(u) .

   Tenemos
                              ° 0                                ¢
                    Xu      =  r (u) cos v, r0 (u) sen v, z 0 (u)
                              °                              ¢
                    Xv      = −r(u) sen v, r(u) cos v, 0 ,

luego
                  E = r0 (u)2 + z 0 (u)2 ,        F = 0,   G = r(u)2 .
   Observemos que E es el m´dulo al cuadrado de la curva que genera la su-
                               o
perficie, luego si su parametrizaci´n es la natural tenemos simplemente E = 1.
                                   o
                                 °         ¢
   En el caso del toro tenemos r(u), z(u) = (R + r cos u, r sen u), luego

                    E = r2 ,        F = 0,       G = (R + r cos u)2 .

° Por lo¢tanto la longitud de una curva que sobre la carta venga dada por
 u(t), v(t) se calcula integrando

                         ds2 = r2 du2 + (R + r cos u)2 dv 2 .
214                       Cap´
                             ıtulo 5. Introducci´n a las variedades diferenciables
                                                o

    Por ejemplo, la longitud de un arco de paralelo (u0 , t), donde t ∈ [0, k] es
                Z k       Z k
                     ds =     (R + r cos u0 ) dt = (R + r cos u0 )k,
                    0              0
como era de esperar, dado que el paralelo es un arco de circunferencia de radio
R + r cos u0 .
Ejercicio: Calcular los coeficientes del tensor m´trico del cilindro, el cono y la esfera.
                                                e

Definici´n 5.18 Diremos que un difeomorfismo f : S −→ T entre dos varie-
         o
dades es una isometr´ si para todo arco α contenido en S se cumple que α ◦ f
                     ıa
tiene la misma longitud.4
   Expl´ıcitamente, si f es una isometr´ y α : [a, b] −→ S es un arco y α(t0 ) = p,
                                       ıa
entonces              Z                Z
                              t                       t
                                  kα0 (x)k dx =           k(α ◦ f )0 (x)k dx,
                          a                       a
y derivando resulta
                                                             °        ¢
                     kα0 (t0 )k = k(α ◦ f )0 (t0 )k = kdf (p) α0 (t0 ) k.
   Ahora bien, todo vector no nulo de Tp (S) es de la forma α0 (t0 ) para un cierto
arco α, luego tenemos que df (p) : Tp (S) −→ Tf (p) (T ) es una isometr´ para todo
                                                                       ıa
punto p. Igualmente se prueba el rec´  ıproco.
Ejercicio: Probar que las isometr´ de Rn en Rn en el sentido que acabamos de
                                    ıas
definir coinciden con las isometr´ en el sentido del ´lgebra lineal.
                                ıas                 a
    Si f es una isometr´ X es una carta alrededor de p con X(x) = p y llamamos
                       ıa,
Y = X ◦ f , es claro que Y es una carta alrededor de f (p). Adem´s tenemos que
                               °          ¢                     a
Di Y (x) = dY (x)(ei ) = df (p) dX(x)(ei ) = df (p)(Di X(x)), de donde se sigue
que los coeficientes del tensor m´trico son iguales en ambas cartas, es decir,
                                 e
                    gij (x) = Di X(x)Dj X(x) = Di Y (x)Dj Y (x).
Similarmente se concluye que si dos variedades tienen cartas con un mismo domi-
nio y con los mismos coeficientes gij del tensor m´trico entonces los fragmentos
                                                  e
de superficie cubiertos por las cartas son superficies isom´tricas.
                                                          e

Ejemplo Consideremos la carta del cilindro dada por
                                   °     v      v ¢
                         X(u, v) = r cos , r sen , u .
                                         r      r
    El elemento de longitud del cilindro es, en esta carta, ds2 = du2 + dv 2 ,
que es exactamente la misma que la del plano con la identidad como carta. La
aplicaci´n X no es una isometr´ porque no es biyectiva, pero s´ es una isometr´
        o                      ıa                              ı              ıa
local, en el sentido de que todo punto del plano tiene un entorno V de modo
que la restricci´n de X es una isometr´ entre U y X[U ]. As´ pues, un cilindro
                o                     ıa                     ı
es localmente isom´trico a un plano.
                    e
   4 En      ıtulo siguiente probaremos que toda curva de clase C 1 es rectificable. Conside-
       el cap´
raremos que esta definici´n se aplica a curvas y aplicaciones de clase C 1 , con lo que siempre
                         o
tendremos garantizado el car´cter rectificable.
                             a
5.4. Geod´sicas
         e                                                                     215

*Ejemplo Observemos que las distintas expresiones que hemos obtenido para
la longitud de un arco en el plano hiperb´lico son de la forma (5.4) para ciertas
                                           o
funciones E, F , G. El caso m´s simple es el del semiplano de Poincar´, donde
                                 a                                        e
E = G = 1/v 2 , F = 0. Sucede que los distintos modelos del plano hiperb´lico o
se comportan como cartas de una superficie que no conocemos, pero de la que
tenemos su elemento de longitud. Existe una teor´ abstracta de variedades
                                                       ıa
diferenciales que permite tratar como tales a espacios topol´gicos dotados de
                                                                o
una “estructura diferenciable”, definida adecuadamente, sin necesidad de que
est´n sumergidos en Rn . El plano hiperb´lico es una variedad en este sentido
    e                                        o
abstracto.
                ıptico casi puede considerarse como una superficie en R3 : la esfera
     El plano el´
de radio 1. En realidad una esfera no es un plano el´ıptico, pues hemos de identi-
ficar los puntos ant´  ıpodas. Sin embargo, un “fragmento” no demasiado grande
de plano el´ıptico es isom´trico a un fragmento de esfera. Por ello podemos con-
                            e
siderar a las cartas de una esfera que no cubran m´s de una semiesfera como
                                                      a
cartas del plano el´ ıptico. Un tratamiento completamente riguroso requerir´ el
                                                                              ıa
concepto abstracto de variedad diferenciable.


5.4     Geod´sicas
            e
    Imaginemos la superficie S de un planeta cuyos habitantes creen que es
plano. Cuando ´stos creen caminar en l´
                 e                        ınea recta en realidad sus trayectorias
son curvas, sin embargo su distinci´n entre rectas y curvas tiene un significado
                                    o
objetivo. Tratemos de explicitarlo. Sea Np (S) el espacio normal a S en p, es
decir, el complemento ortogonal de Tp (S). Consideremos una curva α contenida
en S. Entonces α0 (t) ∈ Tα(t) (S). Podemos descomponer α00 (t) = vt (t) + vn (t),
donde vt (t) ∈ Tα(t) (S) y vn (t) ∈ Nα(t) (S). La descomposici´n es unica. El
                                                                o      ´
vector vn contiene la parte de la aceleraci´n que mantiene a los habitantes del
                                            o
planeta pegados a su superficie (la gravedad) y es “invisible” para ellos, pues
si el planeta fuera realmente plano la gravedad no curvar´ sus trayectorias. El
                                                           ıa
vector vt contiene la variaci´n de la velocidad que ellos detectan: determina si
                             o
la trayectoria se curva a la izquierda o a la derecha. Ellos llaman rectas a las
curvas que cumplen vt = 0. A continuaci´n desarrollamos estas ideas en un
                                              o
contexto m´s general:
            a

Definici´n 5.19 Sea S ⊂ Rm una variedad de dimensi´n n, sea α : I −→ S una
         o                                               o
curva regular y V : I −→ Rm una funci´n de clase C 1 tal que para todo t ∈ I
                                          o
se cumpla V (t) ∈ Tα(t) (S). En estas condiciones diremos que V es un campo de
vectores sobre α. Llamaremos derivada covariante de V en cada punto t a la
proyecci´n ortogonal de V 0 (t) sobre Tα(t) (S). La representaremos por DV (t).
        o

    En la situaci´n que describ´
                 o             ıamos antes, el vector vt es la derivada covariante
del campo dado por V (t) = α0 (t). Para ilustrar el caso general podemos pensar
en un habitante del planeta S que camina rumbo norte con su brazo derecho
apuntando hacia el noreste. Si interpretamos el brazo como un campo de vec-
tores sobre su trayectoria, desde el punto de vista del caminante ´ste apunta
                                                                      e
216                       Cap´
                             ıtulo 5. Introducci´n a las variedades diferenciables
                                                o

siempre en la misma direcci´n, pues ´l camina “recto”, es decir, sin desviarse ni
                             o         e
hacia el este ni hacia el oeste, y su brazo forma un ´ngulo fijo con su direcci´n
                                                     a                        o
de avance. En otras palabras, considera que el campo vectorial es constante y
su derivada es nula. Esto es falso, pues en realidad su trayectoria no es recta,
sino una circunferencia y su brazo s´ cambia de direcci´n (el unico caso en que
                                      ı                 o     ´
la direcci´n no variar´ ser´ si apuntara al este o al oeste, con lo que siem-
          o            ıa    ıa
pre marcar´ la direcci´n perpendicular al plano de la circunferencia en que se
            ıa          o
mueve). La que en realidad es nula es la derivada covariante del campo, que
los habitantes confunden con la derivada total al desconocer la curvatura de su
planeta.
   En las condiciones de la definici´n anterior, sea X : U ¢
                                   o                 °    −→ S una carta de S
y expresemos la curva (localmente) como α(t) = X x(t) . Entonces una base
de Tα(t) (S) en cada punto es

                                D1 X(x(t)), . . . , Dn X(x(t)),

luego podremos expresar

                V (t) = a1 (t)D1 X(x(t)) + · · · + an (t)Dn X(x(t)),                  (5.5)

para ciertas funciones ai (t). Multiplicando la igualdad por Di X(x(t)) se obtiene
un sistema de ecuaciones lineales con coeficientes gij (x(t)). Como el determi-
nante es no nulo, resolviendo el sistema concluimos que las funciones ai (t) son
derivables. Entonces
                        n
                        X                          n
                                                   X
            V 0 (t) =         a0 (t)Di X(x(t)) +
                               i                           ai (t)Dij X(x(t))x0 (t).
                                                                             j        (5.6)
                        i=1                        i,j=1


   El primer t´rmino es tangente a S, luego no se altera al tomar la proyecci´n
              e                                                              o
ortogonal. Para calcular la proyecci´n del segundo conviene introducir un nuevo
                                    o
concepto:

Definici´n 5.20 Sea X : U −→ S una carta de una variedad S. Llamaremos
        o
 ımbolos de Christoffel de S en la carta X a las funciones Γk : U −→ R que
s´                                                         ij
cumplen
                                 Xn
                         Dij X =     Γk Dk X + Nij ,
                                      ij                             (5.7)
                                         k=1

donde Nij (x) ∈ Np (S) (con p = X(x)). Observemos que Γk = Γk .
                                                       ij   ji

   Las proyecciones de las segundas parciales Dij X se obtienen eliminando la
componente Nij , con lo que al calcular la proyecci´n de (5.6) llegamos a que la
                                                   o
derivada covariante de V viene dada por

                                   X≥
                                   n      n
                                          X          ¥
                         DV =        a0 +
                                      k     ai Γk x0 Dk X.
                                                ij j                                  (5.8)
                                   k=1         i,j=1
5.4. Geod´sicas
         e                                                                                   217

   Un hecho muy importante es que los s´    ımbolos de Christoffel, y por consi-
guiente la derivada covariante, dependen unicamente de los coeficientes gij de la
                                         ´
primera forma fundamental de S. En efecto, multiplicando las ecuaciones (5.7)
por Dl X obtenemos
                                         X n
                            Dij XDl X =       gkl Γk .
                                                   ij
                                                   k=1

    Una simple comprobaci´n nos da que
                         o
                                          1
                        Dij XDl X =         (Di gjl + Dj gil − Dl gij ),
                                          2
luego en total resulta
                         n
                         X                1
                               gkl Γk =
                                    ij      (Di gjl + Dj gil − Dl gij ).                    (5.9)
                                          2
                         k=1

    Fijando i, j y variando l obtenemos un sistema de n ecuaciones lineales con
      o                                                          ımbolos Γk en
n inc´gnitas y coeficientes (gkl ), que nos permite despejar los s´        ij
t´rminos de los coeficientes gij y sus derivadas, como quer´
 e                                                        ıamos probar. Ahora
nos ocupamos con detalle del caso particular que describ´ ıamos al principio de
la secci´n:
        o

Definici´n 5.21 Sea α(t) una curva contenida en una variedad S. Llamaremos
         o
aceleraci´n geod´sica5 de α a la derivada covariante del campo vectorial α0 .
         o      e

    Supongamos que α est´ parametrizada por el arco. Entonces kα0 (s)k = 1,
                           a
luego derivando resulta α00 (s)α0 (s) = 0, y esta ortogonalidad se conserva al
proyectar sobre Tp (S), de modo que Dα0 (s) es perpendicular al vector tangente
de α. Llamaremos curvatura geod´sica de α a κg = kDα0 k. Si κg 6= 0 definimos el
                                  e
vector normal geod´sico de α como el vector κ−1 Dα0 , de modo que Dα0 = κg ng .
                   e                          g

   En el caso de que α no est´ parametrizada por el arco el vector normal
                                  e
geod´sico y la curvatura geod´sica se definen a trav´s de su parametrizaci´n
     e                          e                       e                        o
natural. Expl´ıcitamente, si α(t) es una curva contenida en S y s(t) es su longitud
de arco, usando la notaci´n v = s0 (t) = kα0 (t)k, a = v 0 (t) para la velocidad y
                          o
aceleraci´n sobre la trayectoria y T = α0 (s) para el vector tangente, tenemos
         o

                        α0 (t) = vα0 (s),     α00 (t) = aT + v 2 α00 (s).

    Al proyectar sobre el espacio tangente resulta

                                  Dα0 (t) = aT + v 2 κg ng .

    De este modo, la aceleraci´n geod´sica de α se descompone en una acele-
                              o        e
raci´n tangencial, cuyo m´dulo a es la tasa de variaci´n de la velocidad v, y una
    o                    o                            o
   5 La geodesia (gr. = divisi´n de la tierra) estudia la forma de la Tierra, deducida a partir de
                              o
mediciones realizadas desde su superficie. La geometr´ diferencial ha adoptado este adjetivo
                                                          ıa
para referirse en general a los conceptos que puede medir un “habitante” de una variedad
arbitraria sin salir de ella.
218                        Cap´
                              ıtulo 5. Introducci´n a las variedades diferenciables
                                                 o

aceleraci´n normal, cuyo m´dulo es v 2 κg . Un habitante del planeta S que “crea”
         o                   o
vivir en Tp (S) confundir´ la aceleraci´n geod´sica, el vector normal geod´sico y
                         a             o       e                           e
la curvatura geod´sica de α con la aceleraci´n, el vector normal y la curvatura
                   e                         o
de α. Por lo tanto llamar´ rectas a las curvas sin aceleraci´n geod´sica:
                           a                                 o       e
Definici´n 5.22 Una curva α contenida en una variedad S es una geod´sica6 si
         o                                                              e
cumple κg = 0, o equivalentemente, si Dα0 es proporcional a α0 en cada punto.
En tal caso el factor de proporcionalidad es simplemente a = s00 (t), donde s es
la longitud de arco, por lo que si α est´ parametrizada por el arco entonces α
                                        a
es una geod´sica si y s´lo si Dα0 = 0.
            e          o
   Vamos a particularizar las ecuaciones que determinan la derivada covariante
de un campo al caso de la aceleraci´n geod´sica de una curva. Si α(t) = X(x(t)),
                                   o      e
entonces                            n
                                   X
                          α0 (t) =    Di X(x(t))x0 (t),
                                                  i
                                           i=1

luego si en (5.5) hacemos V = α0 tenemos ai = x0 , luego la f´rmula (5.8) se
                                                 i           o
convierte en
                           X≥
                            n       Xn          ¥
                      DV =    x00 +
                                k      Γk x0 x0 Dk X.
                                         ij i j
                                  k=1             i,j=1

    El vector
                                 ≥      n
                                        X          ¥n
                                  x00 +
                                   k      Γk x0 x0
                                           ij i j
                                                             k=1
                                           i,j=1

es la antiimagen por dX de Dα0 , es decir, la representaci´n en el mapa de la
                                                          o
aceleraci´n geod´sica de α. Lo llamaremos expresi´n en coordenadas de dicha
         o      e                                 o
aceleraci´n geod´sica.
         o      e
   La condici´n necesaria y suficiente para que una curva parametrizada por el
             o
arco de coordenadas x(s) sea una geod´sica es
                                      e
                                n
                                X
                        x00 +
                         k              Γk x0 x0 = 0,
                                         ij i j           k = 1, . . . , n.            (5.10)
                                i,j=1

   Si la parametrizaci´n es arbitraria s´lo hemos de exigir que el vector formado
                      o                 o
por los miembros izquierdos sea proporcional a x0 .

Ejemplo Si una carta X(u, v) de una superficie S ⊂ R3 cumple F = 0, las
ecuaciones (5.9) se reducen a
                                  Eu                  Ev               Ev
                     Γ1
                      11    =        ,      Γ2 = −
                                             11          ,     Γ1 =
                                                                12        ,
                                  2E                  2G               2E
                                  Gu                  Gu               Gv
                     Γ2
                      12    =        ,      Γ1
                                             22    =−    ,     Γ2
                                                                22   =    .            (5.11)
                                  2G                  2E               2G

   6 Deber´ıamos decir “recta geod´sica”, es decir, el equivalente en S a una recta, pero es
                                    e
preferible contraer el t´rmino pues, al fin y al cabo, normalmente las geod´sicas no son rectas.
                        e                                                 e
5.4. Geod´sicas
         e                                                                        219

Ejemplo En un plano (tomando como carta la identidad) todos los s´       ımbolos
de Christoffel son nulos, por lo que las geod´sicas parametrizadas por el arco
                                                   e
son las curvas que cumplen (u00 , v 00 ) = (0, 0), es decir, las rectas.
                                                                  °         ¢
Ejemplo En la superficie de revoluci´n generada por la curva r(u), z(u) ,
                                      o
suponiendo a ´sta parametrizada por el arco, los unicos s´
             e                                   ´       ımbolos de Christoffel
no nulos son
                            r0 (u)
                      Γ2 =
                       12          , Γ1 = −r(u)r0 (u).
                                      22
                            r(u)
   Por lo tanto las ecuaciones de las geod´sicas parametrizadas por el arco son
                                          e

                                                                r0 (u)
                     u00 = v 02 r(u)r0 (u),   v 00 = −2u0 v 0          .
                                                                r(u)

   Es inmediato comprobar que los meridianos (t, v0 ) cumplen estas ecuaciones,
luego son geod´sicas. Si se cumple r0 (u) = 0, (por ejemplo en los extremos
                  e
locales de r) entonces el paralelo (u0 , t) tambi´n cumple las ecuaciones, luego es
                                                  e
una geod´sica.
          e
   En el caso concreto de la esfera los meridianos son los arcos de circunferencia
de radio m´ximo que unen los polos. Dada la simetr´ de la esfera, que permite
            a                                           ıa
tomar cualquier par de puntos ant´      ıpodas como polos, podemos afirmar que
todas las circunferencias m´ximas son geod´sicas. Para una carta dada, el unico
                            a                  e                              ´
paralelo (u0 , t) que cumple r0 (u0 ) = 0 es el ecuador de la esfera, que tambi´n es
                                                                               e
una circunferencia m´xima, luego ya sab´
                       a                     ıamos que es una geod´sica.
                                                                     e

*Ejemplo Las f´rmulas que determinan los s´
                    o                           ımbolos de Christoffel a partir de
los coeficientes del tensor m´trico hacen que tenga sentido calcularlos en el caso
                              e
de los planos el´ıptico e hiperb´lico, donde la definici´n de derivada covariante
                                o                      o
que hemos dado no es aplicable. El hecho de que las circunferencias m´ximas de
                                                                       a
una esfera sean geod´sicas se traduce en que las rectas el´
                        e                                 ıpticas sean geod´sicas
                                                                           e
del plano el´ıptico (pues ´ste es localmente isom´trico a una esfera de radio 1).
                          e                       e
Veamos ahora que las rectas hiperb´licas son geod´sicas del plano hiperb´lico.
                                      o             e                      o
Para ello trabajaremos con el semiplano de Poincar´, donde los s´
                                                       e              ımbolos de
Christoffel son m´s sencillos. Teniendo en cuenta que E = G = 1/v 2 y F = 0
                   a
es f´cil ver que los unicos s´
    a                 ´      ımbolos no nulos son

                               1           1               1
                       Γ2 =
                        11       ,   Γ1 = − ,
                                      12             Γ2 = − .
                                                      22
                               v           v               v

   La aceleraci´n covariante de una curva de coordenadas (u, v) tiene coorde-
               o
nadas                  µ                              ∂
                                 u0 v 0 00 u02 − v 02
                         u00 − 2       , v +            .
                                  v            v
    Para las rectas verticales (u, v) = (u0 , t) la aceleraci´n es (0, −1/t), que
                                                                 o
efectivamente es proporcional a (u0 , v 0 ) = (0, 1), luego son geod´sicas. Las rectas
                                                                    e
220                     Cap´
                           ıtulo 5. Introducci´n a las variedades diferenciables
                                              o

proyectivas restantes son las semicircunferencias (u, v) = (u0 + r cos t, r sen t).
Un simple c´lculo nos da que la aceleraci´n en este caso es
            a                             o
                 µ                   ∂
                              cos2 t      cos t
                  r cos t, −r          =−       (−r sen t, r cos t),
                              sen t       sen t

proporcional a (u0 , v 0 ), luego todas las rectas proyectivas son geod´sicas.
                                                                       e


5.5      Superficies
   Terminaremos el cap´ ıtulo con algunos resultados espec´
                                                          ıficos sobre superficies
S ⊂ R3 . Si X es una carta de una superficie S, entonces Xu , Xv son en cada
punto (u, v) una base del plano tangente en X(u, v), luego el vector Xu ∧ Xv es
no nulo y perpendicular a dicho plano. Si llamamos α al ´ngulo formado por
                                                            a
Xu y Xv en un punto dado, entonces

kXu ∧ Xv k2 = kXu k2 kXv k2 (1 − cos2 α) = Xu Xu Xv Xv − (Xu Xv )2 = EG − F 2 .
                       √
As´ pues, kXu ∧ Xv k = EG − F 2 .
  ı

Definici´n 5.23 La aplicaci´n de Gauss asociada a una carta X : U −→ S de
        o                    o
una superficie S es la aplicaci´n n : U −→ R3 dada por
                              o
                                   Xu ∧ Xv     Xu ∧ Xv
                      n(u, v) =              =√         .
                                  kXu ∧ Xv k   EG − F 2
    De este modo, n(u, v) es en cada punto un vector unitario perpendicular a S
en X(u, v). Esto lo determina completamente salvo en su sentido. Si cambiamos
de carta, el sentido de n puede cambiar.
              ¯
    Si X y X son dos cartas que cubren una misma regi´n conexa de una va-
                                                            o
riedad, entonces n(u, v) = ≤(u, v)¯ (u, v), donde ≤(u, v) = ±1. Es claro que ≤ es
                                  n
una funci´n continua en un conexo, luego ha de ser constante. En definitiva,
            o
n(u, v) = ±¯ (u, v). Resulta, pues, que en un entorno de cada punto de S existen
              n
exactamente dos determinaciones opuestas del vector normal. A cualquiera de
ellas la llamaremos tambi´n aplicaci´n de Gauss de la superficie.
                          e           o
    Si llamamos G ⊂ S a la imagen de X, la aplicaci´n n induce otra aplicaci´n
                                                      o                       o
n : G −→ S 2 , donde S 2 es la esfera de centro (0, 0, 0) y radio 1, que est´   a
un´ıvocamente determinada en un entorno de cada punto excepto por su signo.
Es importante notar que no siempre es posible extender esta aplicaci´n n a toda
                                                                      o
la superficie S (sin perder la continuidad).
    De momento no vamos a entrar en detalles, pero la
figura muestra un ejemplo de variedad sobre la cual no
es posible definir un vector normal. Se la conoce como
banda de M¨bius. Es una cinta pegada por sus extre-
              o
mos tras haberla girado media vuelta. Si la aplicaci´n
                                                     o
de Gauss pudiera definirse sobre toda la banda M , al
componerla con una curva α : R −→ M que d´ una    e
5.5. Superficies                                                                           221

vuelta completa obtendr´ ıamos un vector normal sobre α que variar´ de forma
                                                                     ıa
continua, pero es claro que al dar una vuelta completa el vector normal termina
en sentido inverso a como empez´, cuando por continuidad deber´ tender al
                                   o                                ıa
vector de partida.
    La aplicaci´n de Gauss aporta informaci´n importante sobre las superficies
               o                             o
y simplifica algunos de los conceptos que hemos estudiado para variedades ar-
bitrarias. Por ejemplo, en la secci´n anterior hemos estudiado la componente
                                    o
tangencial (o geod´sica) de la curvatura de una curva contenida en una varie-
                   e
dad. Del mismo modo podemos definir la curvatura normal como el m´dulo deo
la componente normal de la segunda derivada. En el caso de las superficies en
R3 podemos apoyarnos en la aplicaci´n de Gauss.
                                      o

Definici´n 5.24 Sea S una superficie (al menos de clase C 2 ) y α una curva
        o
contenida en S parametrizada por el arco y que pase por un punto p. Fijada
una determinaci´n n del vector normal a S alrededor de p, llamaremos curvatura
               o
normal de α a κn = α00 n. Definimos Nn = κn n y Nt = α00 − Nn .

    Notemos que el signo de κn depende de la determinaci´n que elijamos de la
                                                        o         °        ¢
aplicaci´n de Gauss. Supongamos que sobre una carta la curva es u(t), v(t) .
        o
Entonces

α0 = Xu u0 + Xv v 0 ,   α00 = Xuu u02 + Xu u00 + Xuv u0 v 0 + Xuv u0 v 0 + Xvv v 02 + Xv v 00 ,

luego
                κn = α00 n = (Xuu n)u02 + 2(Xuv n)u0 v 0 + (Xvv n)v 02 .
    Llamamos
                        e = Xuu n,      f = Xuv n,       g = Xvv n,
que son funciones de la carta X (salvo por el signo, que depende de la elecci´no
del sentido de n). Si la parametrizaci´n de la curva no es la natural y s(t) es la
                                      o
longitud de arco, usamos la regla de la cadena:
                             du   du ds          dv   dv ds
                                =       ,           =       ,
                             dt   ds dt          dt   ds dt
con la que la f´rmula, llamando ahora u0 , v 0 , s0 a las derivadas respecto de t
               o
(hasta ahora eran las derivadas respecto de s), se convierte en
                                     e u02 + 2f u0 v 0 + g v 02
                              κn =                              .
                                               s02
   Observemos que esta expresi´n no depende de la curva (u, v), sino s´lo de
                                    o                                           o
su derivada (u0 , v 0 ) (recordemos que s0 = k(u0 , v 0 )k). De aqu´ deducimos:
                                                                   ı

Teorema 5.25 (Teorema de Meusnier) Si S es una superficie, todas las
curvas contenidas en S que pasan por un punto p con un mismo vector tan-
                                        ´
gente tienen la misma curvatura normal. Esta viene dada por
                                   e du2 + 2f dudv + g dv 2
                           κn =                             .
                                  E du2 + 2F dudv + G dv 2
222                         Cap´
                               ıtulo 5. Introducci´n a las variedades diferenciables
                                                  o

                  ´
    Demostracion: Es claro que X es una carta alrededor de p y α es una
curva contenida en S que pasa por p con vector tangente w, entonces la re-
presentaci´n de α en la carta X es X −1 ◦ α, luego el vector tangente de esta
          o
representaci´n —el que en la discusi´n previa al teorema llam´bamos (u0 , v 0 )—
   °        o          ¢            o                        a
es du(p)(w), dv(p)(w) , donde ahora u y v son las funciones coordenadas de X.
    As´ pues, la f´rmula que hab´
      ı           o             ıamos obtenido nos da que

                    e(p) du(p)2 (w) + 2f (p) du(p)(w)dv(p)(w) + g(p) dv(p)2 (w)
      κn (p)(w) =                                                               ,
                     E(p) du(p)2 (w) + 2F (p) du(p)(w)dv(p)(w) + G dv(p)2 (w)

entendiendo aqu´ a e, f , g como las composiciones con X −1 de las funciones del
               ı
mismo nombre que ten´  ıamos definidas.

Definici´n 5.26 El elemento de longitud de una superficie S se conoce tambi´n
         o                                                                   e
con el nombre que le dio Gauss: la primera forma fundamental de S. Definimos
la segunda forma fundamental de S como la aplicaci´n que a p ∈ S y cada vector
                                                    o
w ∈ Tp (S) le asigna la curvatura normal en p de las curvas contenidas en S que
pasan por p con tangente w multiplicada por kwk2 .

   El teorema anterior prueba que la segunda forma fundamental es en cada
punto puna forma cuadr´tica definida sobre Tp (S). Concretamente, si fijamos
                       a
una carta tenemos

         F 1 = E du2 + 2F dudv + G dv 2 ,            F 2 = e du2 + 2f dudv + g dv 2 .

    Ambas formas cuadr´ticas pueden considerarse definidas tanto sobre la su-
                          a
perficie S como sobre el dominio de la carta (en cuyo caso du y dv representan
simplemente las proyecciones de R2 ). Sin embargo, una diferencia importante es
que, aunque las expresiones anteriores son v´lidas unicamente sobre el rango de
                                             a     ´
una carta, la primera forma fundamental est´ definida sobre toda la superficie
                                               a
y est´ completamente determinada por la misma, mientras que la segunda s´lo
     a                                                                      o
la tenemos definida en un entorno de cada punto y adem´s salvo signo.
                                                         a
    Para calcular expl´
                      ıcitamente la segunda forma fundamental de una superficie
notamos que

                                            Xu ∧ Xv    (Xuu , Xu , Xv )
                    e = Xuu n = Xuu                   = √               ,
                                           kXu ∧ Xv k     EG − F 2
e igualmente
                             (Xuv , Xu , Xv )         (Xvv , Xu , Xv )
                       f=     √               ,     g= √               .
                               EG − F 2                 EG − F 2

Ejemplo Los coeficientes de la segunda forma fundamental de la superficie de
                                °          ¢
revoluci´n generada por la curva r(u), z(u) son
        o

               z 00 (u)r0 (u) − z 0 (u)r00 (u)                   z 0 (u)r(u)
          e=         p                         ,   f = 0,   g=p                   .
                       r0 (u)2 + z 0 (u)2                      r0 (u)2 + z 0 (u)2
5.6. La curvatura de Gauss                                                              223
                                 °          ¢
    Para el caso del toro tenemos r(u), z(u) = (R +r cos v, r sen v) luego queda
                       e = r,    f = 0,    g = R cos u + r cos2 u.


Ejercicio: Comprobar que la curvatura normal en todo punto de la esfera de radio
r y en toda direcci´n es igual a ±1/r, donde el signo es positivo si elegimos el vector
                   o
normal que apunta hacia dentro de la esfera y negativo en caso contrario.



5.6      La curvatura de Gauss
    Es un hecho conocido que si F es una forma bilineal sim´trica en un espa-
                                                                e
cio eucl´
        ıdeo existe una base ortonormal en la que la matriz de F es diagonal.
Podemos aplicar esto a un plano tangente Tp (S) de una superficie tomando el
producto escalar determinado por la primera forma fundamental y como F la
segunda forma fundamental. Entonces concluimos que existe una base (e1 , e2 )
de Tp (S) en la cual las expresi´n en coordenadas de las formas fundamentales
                                 o
es
                F 1 (x, y) = x2 + y 2 y F 2 (x, y) = λ1 x2 + λ2 y 2 .
    Los n´meros λ1 y λ2 son los valores propios de cualquiera de las matrices
          u
de F 2 en cualquier base ortonormal de Tp (S), luego est´n un´
                                                         a    ıvocamente de-
terminados salvo por el hecho de que un cambio de carta puede cambiar sus
signos. Podemos suponer λ1 ≤ λ2 . Entonces se llaman respectivamente curva-
tura m´ınima y curvatura m´xima de S en p. En efecto, se trata del menor y el
                          a
mayor valor que toma F 2 entre los vectores de norma 1, pues
        λ1 = λ1 (x2 + y 2 ) ≤ λ1 x2 + λ2 y 2 = F 2 (x, y) ≤ λ2 (x2 + y 2 ) = λ2 .
    Si w ∈ Tp (S) tiene norma arbitraria entonces aplicamos esto a w/kwk y
concluimos que
                                     F 2 (w)
                               λ1 ≤ 1        ≤ λ2 ,
                                     F (w)
es decir, λ1 ≤ κn ≤ λ2 . As´ pues, λ1 y λ2 son la menor y la mayor curvatura
                            ı
normal que alcanzan las curvas que pasan por p. Adem´s se alcanzan en direc-
                                                         a
ciones perpendiculares e1 y e2 , llamadas direcciones principales en p. Notemos
que puede ocurrir λ1 = λ2 , en cuyo caso la curvatura normal es la misma en
todas direcciones y no hay direcciones principales distinguidas. Los puntos de
S donde λ1 = λ2 se llaman puntos umbilicales.
    Veamos ahora c´mo calcular las direcciones principales en una carta. Consi-
                  o
deremos la f´rmula de Meusnier como funci´n (diferenciable) de dos variables.
            o                              o
Si (du, dv) marca una direcci´n principal7 entonces κn es m´ximo o m´
                             o                                 a         ınimo
   7 Aqu´ podemos considerar (du, dv) ∈ R2 . La notaci´n diferencial est´ motivada por lo
         ı                                                 o                a
siguiente: Fijada una carta con coordenadas u, v, una curva regular en la superficie viene
determinada por una representaci´n coordenada (u(t), v(t)). El vector tangente a la curva en
                                     o
un punto dado marcar´ una direcci´n principal si y s´lo si la f´rmula de Meusnier evaluada
                          a            o                o        o
en (u0 (t), v 0 (t)) toma un valor m´ximo o m´
                                     a          ınimo, pero dicha f´rmula depende s´lo de las
                                                                   o                 o
diferenciales (du(t), dv(t)), por lo que en realidad buscamos una relaci´n entre du y dv.
                                                                        o
224                    Cap´
                          ıtulo 5. Introducci´n a las variedades diferenciables
                                             o

en este punto, luego el teorema 4.15 afirma que sus derivadas parciales han de
anularse en ´l. As´ pues, se ha de cumplir
            e     ı

          ∂κn        2(e du + f dv) 2(E du + F dv) 2
                 =                  −               F (du, dv) = 0,
          ∂du          F 1 (du, dv)   F 1 (du, dv)2
          ∂κn        2(f du + g dv) 2(F du + G dv) 2
                 =                  −               F (du, dv) = 0.
          ∂dv          F 1 (du, dv)   F 1 (du, dv)2

   Despejando obtenemos

                               F 2 (du, dv)   e du + f dv
                     κn   =      1 (du, dv)
                                            =             ,                (5.12)
                               F              E du + F dv
                               F 2 (du, dv)   f du + g dv
                     κn   =      1 (du, dv)
                                            =             .
                               F              F du + G dv

   Al igualar ambas ecuaciones obtenemos una condici´n necesaria para que un
                                                       o
vector indique una direcci´n principal. Es f´cil ver que puede expresarse en la
                          o                 a
forma:                    Ø                     Ø
                          Ø dv 2 −dudv du2 Ø
                          Ø                     Ø
                          Ø E       F      G Ø = 0.
                          Ø                     Ø
                          Ø e       f       g Ø
   Si (E, F, G) (en un punto) es m´ltiplo de (e, f, g) entonces la ecuaci´n se
                                     u                                      o
cumple trivialmente, pero por otra parte es claro que la curvatura normal es
constante y no hay direcciones principales. En caso contrario es claro tenemos
una forma cuadr´tica con al menos dos coeficientes no nulos. Si suponemos,
                 a
por ejemplo, que el coeficiente de dv 2 es no nulo, entonces du 6= 0, y al dividir
entre du2 la forma cuadr´tica se convierte en una ecuaci´n de segundo grado
                          a                                 o
en la raz´n dv/du. Esta ecuaci´n tiene a lo sumo dos soluciones linealmente
         o                       o
independientes, luego ´stas han de ser necesariamente las direcciones principales.
                      e
Por consiguiente la ecuaci´n caracteriza dichas direcciones.
                          o

Definici´n 5.27 Se llama curvatura media y curvatura total o de Gauss de una
        o
superficie S en un punto p a los n´meros
                                 u

                                λ1 + λ2
                          H=            ,   K = λ1 λ2 .
                                   2
   Notemos que el signo de H depende de la carta, mientras que el de K es
invariante. Si operamos en (5.12) obtenemos

                     (e − Eκn )du + (f − F κn )dv    = 0,
                     (f − F κn )du + (g − Gκn )dv    = 0.

   Puesto que el sistema tiene una soluci´n no trivial en (du, dv) se ha de
                                         o
cumplir                Ø                     Ø
                       Ø e − Eκn f − F κn Ø
                       Ø                     Ø
                       Ø f − F κn g − Gκn Ø = 0,
5.6. La curvatura de Gauss                                                       225

o equivalentemente
             (EG − F 2 )κ2 − (eG − 2F f + gE)κn + (eg − f 2 ) = 0.
                         n

   Esta ecuaci´n la cumplen las curvaturas principales κn = λ1 , λ2 y por otro
                o
lado tiene s´lo dos soluciones, luego
            o
                                      eG − 2F f + gE
                              H   =                  ,
                                        2(EG − F 2 )
                                       eg − f 2
                              K   =             .                             (5.13)
                                      EG − F 2
   En particular vemos que la curvatura de Gauss es el cociente de los deter-
minantes de las dos formas fundamentales.
Ejercicio: Calcular la curvatura media y la curvatura de Gauss del cilindro, el cono,
el toro y la esfera.

Definici´n 5.28 Un punto p de una superficie S es el´
        o                                             ıptico o hiperb´lico seg´n
                                                                     o        u
si K(p) > 0 o K(p) < 0. Si K(p) = 0 distinguiremos entre puntos parab´licos,
                                                                          o
cuando s´lo una de las curvaturas extremas es nula y puntos planos, cuando las
        o
dos curvaturas extremas son nulas.
    Si un punto es el´
                     ıptico todas las curvas que pasan por ´l tienen la curvatura
                                                            e
normal del mismo signo, por lo que la superficie se curva toda hacia el mismo
lado del plano tangente, como es el caso de la esfera o del toro. Si un punto es
hiperb´lico entonces hay curvas (perpendiculares, de hecho) que pasan por ´l
        o                                                                      e
con curvaturas en sentidos opuestos, luego la superficie tiene puntos pr´ximos
                                                                          o
a ambos lados del plano tangente. Es el caso del hiperboloide√ = x2 − y 2 , cuya
                                                                z
curvatura en la carta (u, v, u2 − v 2 ) viene dada por K = −4/ 4u2 + 4v 2 + 1 3 .
    Los puntos de un cilindro son parab´licos. Las curvas u =cte. y v =cte.
                                            o
son circunferencias de radio r y rectas, respectivamente. Las primeras tienen
curvatura normal λ2 = 1/r y las segundas λ1 = 0. Es f´cil ver que se trata de
                                                          a
las curvaturas principales. Todos los c´lculos son sencillos.
                                          a
    Todos los puntos de un plano son puntos planos. Otro ejemplo es el punto
(0, 0) en la gr´fica de x3 + y 3 .
               a




               z = x2 − y 2                       z = x3 + y 3
226                      Cap´
                            ıtulo 5. Introducci´n a las variedades diferenciables
                                               o

    Probamos ahora una caracterizaci´n algebraica de la curvatura de Gauss que
                                        o
m´s adelante nos dar´ una interpretaci´n geom´trica de la misma. Observemos
  a                    a                  o     e
que si n es una determinaci´n del vector normal alrededor de un punto p en
                                o
una superficie S y llamamos S 2 a la esfera de centro (0, 0, 0) y radio 1, enton-
ces dn(p) : Tp (S) −→ Tn(p) (S 2 ), pero como n(p) es perpendicular a Tp (S), en
realidad Tn(p) (S 2 ) = Tp (S), luego podemos considerar a dn(p) como un endo-
morfismo de Tp (S).

Teorema 5.29 Sea S una superficie y n una determinaci´n del vector normal
                                                    o
alrededor de un punto p. Entonces K(p) = |dn(p)|.

                 ´
    Demostracion: Sea X una carta alrededor de p. Entonces una base de
Tp (S) la forman los vectores Xu y Xv . Llamemos n(u, v) a X ◦ n. Entonces

           dn(p)(Xu ) = dn(p)(dX(u, v)(1, 0)) = dn(u, v)(1, 0) = nu ,
           dn(p)(Xv ) = dn(p)(dX(u, v)(0, 1)) = dn(u, v)(0, 1) = nv .

   Si expresamos

                                 nu      = aXu + bXv
                                 nv      = cXu + dXv

entonces el determinante de dn(p) es el de la matriz formada por a, b, c, d.
Notemos que derivando las igualdades nXu = nXv = 0 se deduce la relaci´n   o
nu Xu = −nXuu = −e y similarmente nu Xv = nv Xu = −f , nv Xv = −g. Por
consiguiente al multiplicar las ecuaciones anteriores por Xu y Xv obtenemos

      −e = aE + bF,      −f = aF + bG,            −f = cE + dF,         −g = cF + dG,

de donde                 µ           ∂       µ         ∂µ           ∂
                             e   f               a b        E   F
                     −                   =                              .
                             f   g               c d        F   G
   Tomando determinantes concluimos que

                             eg − f 2 = |dn(p)| (EG − F 2 ),

luego efectivamente |dn(p)| = K(p).

    Consideremos ahora las f´rmulas (5.7) que definen los s´
                               o                             ımbolos de Christof-
fel. Al particularizarlas al caso de una superficie se convierten en

                         Xuu      = Γ1 Xu + Γ2 Xv + en,
                                     11      11
                         Xuv      = Γ1 Xu + Γ2 Xv + f n,
                                     12      12
                         Xvv      = Γ1 Xu + Γ2 Xv + gn,
                                     22      22

(en principio la componente normal ha de ser de la forma αn para cierto α, y
multiplicando la igualdad por n se sigue que α = e, f, g seg´n el caso.)
                                                            u
5.6. La curvatura de Gauss                                                   227

   De estas ecuaciones se sigue
                                      ° 1 1            ¢
        Xuu Xvv − Xuv = eg − f 2
                   2
                                    +  Γ11 Γ22 − (Γ1 )2 E
                                                   12
                                      °                         ¢
                                    + Γ1 Γ2 + Γ2 Γ1 − 2Γ1 Γ2 F
                                        11 22     11 22   12 12
                                      °                ¢
                                    + Γ2 Γ2 − (Γ2 )2 G.
                                        11 22      12

   Por otra parte, derivando respecto a v y u respectivamente las relaciones
                                 1                     1
                    Xuu Xv = Fu − Ev ,      Xuv Xv =     Gu
                                 2                     2
y restando los resultados obtenemos

                              2     1           1
                   Xuu Xvv − Xuv = − Evv + Fuv − Guu .
                                    2           2
   En definitiva resulta la expresi´n
                                  o
                1           1             ° 1 1            ¢
    eg − f 2 = − Evv + Fuv − Guu        −  Γ11 Γ22 − (Γ1 )2 E
                                                       12
                2           2             °                         ¢
                                        − Γ1 Γ2 + Γ2 Γ1 − 2Γ1 Γ2 F
                                            11 22     11 22   12 12
                                          °                ¢
                                        − Γ2 Γ2 − (Γ2 )2 G.
                                            11 22      12

    La f´rmula (5.13) muestra ahora que la curvatura de Gauss de un punto
        o
depende unicamente de los coeficientes E, F , G de la primera forma fundamental
         ´
y sus derivadas. Puesto que dos superficies localmente isom´tricas tienen cartas
                                                           e
con los mismos coeficientes E, F , G, hemos probado el resultado que Gauss, en
sus Diquisitiones generales circa superficies curuas, present´ con el nombre de
                                                            o
theorema egregium:

Teorema 5.30 (Gauss) Las isometr´ locales conservan la curvatura.
                                ıas

   Las ecuaciones (5.11) nos dan la siguiente expresi´n para la curvatura res-
                                                     o
pecto a una carta con F = 0:
                         2
               Eu Gu + Ev    Ev Gv + G2
                                      u   Evv + Guu
          K=               +            −           ,         si F = 0.
                  4E 2 G        4EG2        2EG
   Desde aqu´ es f´cil deducir a su vez los siguientes casos particulares:
            ı     a
                    µ 2                   ∂
                 1     ∂ log A ∂ 2 log A
        K=−                    +             , si F = 0, E = G = A,
                2A       ∂u2        ∂v 2
                                   √
                             1 ∂2 G
                    K = −√             , si F = 0, E = 1.
                              G ∂u2
   En° particular, la curvatura de la superficie de revoluci´n definida por la
                ¢                                          o
curva r(u), z(u) es
                                       r00 (u)
                                K=−            .
                                        r(u)
228                     Cap´
                           ıtulo 5. Introducci´n a las variedades diferenciables
                                              o

*Ejemplo Notemos que sin el teorema de Gauss no tendr´ sentido hablar
                                                                 ıa
de la curvatura del plano hiperb´lico, pues lo unico que sabemos de ´l es que
                                    o            ´                     e
sus modelos se comportan como cartas de una variedad desconocida de la que
tenemos su primera forma fundamental. Sin embargo, las f´rmulas anteriores
                                                               o
nos permiten calcular su curvatura a partir de estos datos. Por ejemplo, en el
caso del semiplano de Poincar´, donde E = G = 1/v 2 y F = 0, ahora es f´cil
                                 e                                           a
calcular que K = −1. As´ pues, si pudi´ramos identificar el plano hiperb´lico
                            ı               e                               o
con una superficie en R3 , ´sta tendr´ que tener curvatura constante igual a
                              e          ıa
−1. En el caso del plano el´  ıptico sabemos que localmente es como la esfera de
radio 1, luego si pudi´ramos identificar el plano el´
                       e                             ıptico con una superficie de
R3 , ´sta tendr´ que tener curvatura constante igual a 1. Ahora vamos a probar
     e         ıa
que existen variedades cuya relaci´n con el plano hiperb´lico es la misma que
                                      o                     o
hay entre la esfera y el plano el´ıptico.

Ejemplo Se llama pseudoesfera a la superficie de revoluci´n P generada por
                                                               o
la tractriz. Recordemos que la tractriz es
                  °          ¢ ≥                             u¥
                   r(u), z(u) = l sen u, l cos u + l log tan    .
                                                             2
   Por lo tanto la pseudoesfera est´ dada por
                                    a
                     ≥                                                 u¥
           X(u, v) = l sen u cos v, l sen u sen v, l cos u + l log tan    .
                                                                       2
    Recordemos tambi´n que la longitud de arco es s =
                       e
−l log sen u, luego sen u = e−s/l . La carta de P que
resulta de tomar la tractriz parametrizada por el arco
tiene la primera forma fundamental determinada por

        E = 1,    F = 0,     G = r(s)2 = l2 e−2s/l .

De aqu´ se sigue f´cilmente que K = −1/l2 .
       ı          a
   Por lo tanto un ejemplo de superficie de curvatura
constante igual a K < 0 es la pseudoesfera
                  1 ≥                                            u¥
               √       sen u cos v, sen u sen v, cos u + log tan    .
                 −K                                              2



*Nota La pseudoesfera es al plano hiperb´lico lo que un cilindro es al plano
                                           o
eucl´
    ıdeo. En efecto, hemos visto que si parametrizamos por el arco la tractriz
obtenemos una carta de la pseudoesfera cuya primera forma fundamental es
(para l = 1)
                           ds2 = dw2 + e−2u dv 2 ,
donde w ∈ ]0, +∞[ es la longitud de arco de la tractriz (que arriba repre-
sent´bamos por s). Las cartas de la pseudoesfera tienen dominios de la forma
    a
(w, v) ∈ ]0, +∞[×]v0 − π, v0 + π[. Si ahora hacemos el cambio (w, v) = (log y, x)
5.6. La curvatura de Gauss                                                    229

obtenemos cartas con dominios de la forma ]x0 − π, x0 + π[ × ]1, +∞[ de modo
que la primera forma fundamental pasa a ser

                                        dx2 + dy 2
                                ds2 =              ,
                                            y2
es decir, exactamente la del semiplano de Poincar´. Un c´lculo rutinario nos da
                                                 e       a
la forma expl´ıcita de estas cartas:
             √                 p                                            !
               cos x sen x       y2 − 1 1              1    °    p        ¢
  X(x, y) =          ,     ,−          + log(y − 1) + log y + y 2 − 1 .
                 y      y         y      2             2

    Esto significa que un fragmento del semiplano de Poincar´ de la forma
                                                                  e
]x0 − π, x0 + π[ × ]1, +∞[ puede verse como un mapa de la pseudoesfera de
modo que la longitud hiperb´lica en el mapa coincide con la longitud eucl´
                             o                                           ıdea
sobre la superficie. Por lo tanto la porci´n de pseudoesfera cubierta por la
                                             o
carta (toda ella menos un meridiano x =cte.) puede identificarse con un frag-
mento de plano hiperb´lico exactamente igual que una porci´n de esfera puede
                        o                                     o
identificarse con un fragmento de plano el´  ıptico.
    La situaci´n es, como dec´
              o               ıamos, an´loga a la del cilindro dado por
                                        a
                           °                         ¢
                            r cos(v/r), r sen(v/r), u ,

cuya primera forma fundamental es ds2 = dx2 + dy 2 , igual que la del plano. La
diferencia es que, en este caso, al quitarle una recta x =cte. podemos desplegarlo
hasta hacerlo plano sin modificar su primera forma fundamental, mientras que
la pseudoesfera no puede desplegarse sin sufrir estiramientos que alteren su
m´trica y su curvatura. Por ello no podemos extenderla a un plano hiperb´lico
  e                                                                          o
completo.
Cap´
   ıtulo VI

Ecuaciones diferenciales
ordinarias

   Una ecuaci´n diferencial ordinaria es una relaci´n de la forma
             o                                               o
                        °                                  ¢
                       f t, y(t), y 0 (t), . . . , y n) (t) = 0,

donde f : D ⊂ Rn+2 −→ R e y : I −→ R es una funci´n definida en un          o
intervalo I derivable n veces. Normalmente la funci´n y es desconocida, y
                                                                      o
entonces se plantea el problema de integrar la ecuaci´n, es decir, encontrar
                                                                       o
todas las funciones y que la satisfacen. El adjetivo “ordinaria” se usa para
indicar que la funci´n inc´gnita tiene una sola variable. Las ecuaciones que
                      o        o
relacionan las derivadas parciales de una funci´n de varias variables se llaman
                                                           o
ecuaciones diferenciales en derivadas parciales, pero no vamos a ocuparnos de
ellas. Dentro de las ecuaciones ordinarias, nos vamos a ocupar unicamente de un
                                                                            ´
caso m´s simple pero suficientemente general: aquel en que tenemos despejada
        a
la derivada de orden mayor, es decir, una ecuaci´n de la formao
                                   °                                    ¢
                       y n) (t) = f t, y(t), y 0 (t), . . . , y n−1) (t) .

    El n´mero n se llama orden de la ecuaci´n. El caso m´s simple es la ecuaci´n
        u                                   o            a                    o
de primer orden y 0 = f (t). Sabemos que si la ecuaci´n tiene soluci´n de hecho
                                                     o              o
hay infinitas de ellas pero, en un intervalo dado, cada una se diferencia de
las dem´s en una constante, de modo que una soluci´n queda completamente
        a                                              o
determinada cuando se especifica un valor y(t0 ) = y0 . Veremos que esto sigue
siendo v´lido para todas las ecuaciones de primer orden. Por ello se define un
         a
problema de Cauchy como                         æ
                                 y 0 = f (t, y)
                                y(t0 ) = y0
    Resolver el problema significa encontrar una funci´n y definida alrededor de
                                                     o
t0 de modo que satisfaga la ecuaci´n diferencial y cumpla la condici´n inicial
                                   o                                 o
y(t0 ) = y0 . Probaremos que bajo condiciones muy generales los problemas de
Cauchy tienen soluci´n unica.
                      o ´

                                      231
232                             Cap´
                                   ıtulo 6. Ecuaciones diferenciales ordinarias

    Toda la teor´ se aplica igualmente al caso de sistemas de ecuaciones diferen-
                ıa
ciales. De hecho un sistema de ecuaciones puede verse como una unica ecuaci´n
                                                                  ´            o
vectorial. Basta considerar que y : I −→ Rn y f : D ⊂ Rn+1 −→ Rn .
    Son muchas las ocasiones en las que el unico conocimiento que tenemos de
                                             ´
una o varias funciones es el hecho de que satisfacen un sistema de ecuaciones
diferenciales. Por ejemplo, las ecuaciones (5.10) del cap´ ıtulo anterior son un
sistema de ecuaciones de segundo orden que determinan cu´ndo una curva x(s)
                                                            a
representa a una geod´sica de una variedad en una carta dada. Los resultados
                       e
que probaremos en este cap´   ıtulo nos asegurar´n en particular la existencia de
                                                a
geod´sicas. De momento no tenemos garantizada la existencia de soluci´n ni en
     e                                                                   o
                                  ´
el caso m´s simple: y 0 = f (x). Este es el primer punto que hemos de estudiar,
          a
lo que nos lleva a profundizar un poco m´s en el c´lculo integral.
                                           a        a


6.1     La integral de Riemann
   Recordemos que hemos definido la expresi´n
                                          o
                                    Z    b
                                         f (x) dx
                                     a

como F (b) − F (a), donde F es una primitiva de f , pero la interpretaci´n      o
geom´trica era el n´mero que resulta de dividir el intervalo [a, b] en intervalos
     e              u
infinitesimales de longitud dx y sumar los incrementos infinitesimales f (x) dx.
Vamos a dar rigor a esta idea, lo que nos llevar´ a una construcci´n de la integral
                                                 a                o
que no postule la existencia de la primitiva.
    La t´cnica ser´, por supuesto, sustituir la divisi´n en infinitos intervalos in-
        e         a                                   o
finitesimales por particiones en intervalos de longitud arbitrariamente peque˜a. n
Puede probarse que no importa c´mo escojamos estas particiones, por lo que
                                    o
trabajaremos concretamente con intervalos de longitud 2−n .
    Para cada n´mero natural n sea Pn = {2−n k | k ∈ Z}. Para cada x ∈ Pn
                u
sea x0 = x + 2−n . De este modo, la recta real se divide en una uni´n disjunta
     n                                                                 o
de intervalos de longitud 2−n
                                       [
                                 R=        [x, x0 [ .
                                                n
                                        x∈Pn


   Llamaremos F al conjunto de todas las funciones f : R −→ R tales que el
conjunto {x ∈ R | f (x) 6= 0} est´ acotado. Para cada f ∈ F definimos
                                 a
                                             X
                             Sn (f ) =           f (x)2−n .
                                         x∈Pn


    Notar que f se anula en todos los puntos de Pn salvo a lo sumo en un
n´mero finito de ellos, luego la suma anterior es en realidad una suma finita.
 u
La suma Sn (f ) es la aproximaci´n de la integral de f que resulta de aproximar
                                o
el incremento infinitesimal dx por el incremento finito 2−n .
6.1. La integral de Riemann                                                                   233

   Diremos que f es integrable Riemann si existe
                         Z
                           f (x) dx = l´ Sn (f ) ∈ R.
                                       ım
                                               n

   A esta cantidad la llamaremos integral de Riemann de f . Llamaremos R al
conjunto de todas las funciones de F que son integrables Riemann.
   Si A ⊂ R, llamaremos funci´n caracter´
                             o          ıstica de A a la funci´n χA : R −→ R
                                                              o
dada por                          Ω
                                     1 si x ∈ A
                         χA (x) =
                                     0 si x ∈ A
                                              /
   Dado un intervalo [a, b] y una funci´n f : R −→ R, es claro que f χ[a,b] ∈ F.
                                       o
Diremos que f es integrable Riemann en [a, b] si f χ[a,b] es integrable Riemann.
En tal caso llamaremos
                        Z b           Z
                            f (x) dx = f (x)χA (x) dx.
                            a

    Es obvio que la integrabilidad de f en [a, b] y, en su caso, el valor de la
integral s´lo dependen de la restricci´n de f al intervalo considerado. Por lo
            o                             o
tanto, si f es una funci´n definida en [a, b], diremos que es integrable Riemann
                             o
en [a, b] si lo es la extensi´n a R que toma el valor 0 en todos los puntos exteriores
                              o
a [a, b]. As´ una funci´n es integrable en [a, b] si y s´lo si lo es, en este sentido,
              ı,           o                              o
su restricci´n a dicho intervalo.
              o
    Llamaremos R(a, b) al conjunto de todas las funciones integrables Riemann
en [a, b].
   Observemos que si f ∈ R, entonces existe un intervalo [a, b] tal que f se
anula fuera de [a, b], con lo que f = f χ[a,b] y por lo tanto f ∈ R(a, b) y
                                Z                Z     b
                                    f (x) dx =         f (x) dx.
                                                   a

   Por consiguiente no perdemos generalidad si trabajamos con funciones inte-
grables en un intervalo fijo.

Teorema 6.1 Sea [a, b] un intervalo. Se cumplen las propiedades siguientes:
  a) Si f , g ∈ R(a, b) y α, β ∈ R entonces αf + βg ∈ R(a, b) y
                 Z    b°                               Z       b              Z   b
                                     ¢
                       αf (x) + βg(x) dx = α                   f (x) dx + β       f (x) dx.
                  a                                        a                  a


  b) Si f , g ∈ R(a, b) y f ≤ g entonces
                                    Z    b                 Z   b
                                         f (x) dx ≤                g(x) dx.
                                     a                     a
234                                    Cap´
                                          ıtulo 6. Ecuaciones diferenciales ordinarias

  c) Si f ∈ R(a, b) y |f | tambi´n es integrable entonces
                                e
                             ØZ           Ø Z
                             Ø b          Ø     b
                             Ø            Ø
                             Ø    f (x) dxØ ≤     |f (x)| dx.
                             Ø a          Ø   a


  d) Si k ∈ [a, b] entonces χ{k} ∈ R(a, b) y
                                          Z    b
                                                   χ{k} dx = 0.
                                           a


  e) Si a < c < b, f ∈ R(a, c) y f ∈ R(c, b) entonces f ∈ R(a, b) y
                         Z    b                Z       c            Z   b
                              f (x) dx =               f (x) dx +       f (x) dx.
                          a                        a                c


  f ) La funci´n constante igual a 1 es integrable en [a, b] y
              o
                                          Z        b
                                                   dx = b − a.
                                              a


                  ´
     Demostracion: Las tres primeras propiedades son obvias para las sumas
Sn y se trasladan a las integrales por las propiedades de los l´ımites. Para
probar d) observamos que si k ∈ Pn para alg´n n0 entonces Sn (χ{k} ) = 2−n ,
                                              u
para n ≥ n0 y en caso contrario Sn (χ{k} ) = 0 para todo n. En cualquier caso
el l´
    ımite cuanto n tiende a infinito vale 0.
     Para probar e) observamos que

                      f χ[a,b] = f χ[a,c] + f χ[c,b] − f (c)χ{c} .

    El resultado es inmediato a partir de los apartados anteriores. Para demos-
trar f) consideramos la suma
                                        X
                         Sn (χ[a,b] ) =    χ[a,b] (x)2−n .
                                               x∈Pn

    Si los puntos de Pn contenidos en [a, b] son a ≤ x0 < · · · < xk ≤ b, es claro
que k2−n = xk − x0 ≤ b − a y (b − a) − k2−n = x0 − a + b − xk ≤ 2−n+1 . Por
lo tanto

         |Sn (χ[a,b] ) − (b − a)| = |(k + 1)2−n − (b − a)| ≤ 2−n+1 + 2−n ,

luego existe
                                  l´ Sn (χ[a,b] ) = b − a.
                                   ım
                                   n



   El teorema anterior puede mejorarse considerablemente. Por ejemplo, puede
probarse que si f es integrable entonces |f | tambi´n lo es, con lo que sobra la
                                                   e
6.1. La integral de Riemann                                                   235

hip´tesis correspondiente en el apartado c). As´ mismo, si a < c < b, la integra-
    o                                            ı
bilidad de f en [a, b] implica la integrabilidad en [a, c] y [c, b]. Tambi´n puede
                                                                          e
probarse que el producto de funciones integrables es integrable. No entraremos
en todo esto porque vamos a trabajar unicamente con funciones continuas, y
                                           ´
estos hechos resultan triviales en este caso una vez probado el teorema siguiente.

Teorema 6.2 Toda funci´n continua en un intervalo [a, b] es integrable Rie-
                      o
mann en [a, b].

                 ´
   Demostracion: En la prueba usaremos la siguiente observaci´n sobre las
                                                                 o
sumas Sn (f ): Si una funci´n f es constante sobre cada intervalo [x, x0 [ con
                             o                                         n
x ∈ Pn , entonces Sn (f ) = Sn+1 (f ).
   En efecto, los puntos de Pn+1 son los de Pn y los de la forma x + 2−n−1 , con
x ∈ Pn . Por consiguiente
              X°                         ¢         X
  Sn+1 (f ) =      f (x) + f (x + 2−n−1 ) 2−n−1 =       2f (x)2−n−1 = Sn (f ).
              x∈Pn                                      x∈Pn

   De aqu´ se sigue a su vez que Sn (f ) = Sm (f ) para m ≥ n.
         ı
   Consideremos ahora una funci´n f continua en [a, b] y sea ≤ > 0. Por el
                                     o
teorema 2.36 sabemos que f es uniformemente continua en [a, b], luego existe
un δ > 0 tal que si x, x0 ∈ [a, b] cumplen |x − x0 | < δ entonces
                                                     ≤
                           |f (x) − f (x0 )| <            .
                                                 2(b − a)

   Sea n0 un n´mero natural tal que 1/n0 < δ. Podemos exigir adem´s que
                u                                                a
2−n0 +1 < b − a. Para cada x ∈ Pn0 sea
                                       £       £
                   mx = ´ {f (t) | t ∈ x, x0 0 ∩ [a, b]},
                            ınf             n
                                       £       £
                   Mx = sup{f (t) | t ∈ x, x0 0 ∩ [a, b]}.
                                            n

   Estos supremos e ´ınfimos existen£porque f est´ acotada en [a, b] (por com-
                              £                   a
pacidad). Entendemos que si x, x0 0 ∩ [a, b] = ∅ entonces mx = Mx = 0.
                                 n
   Puesto que x0 0 − x < 2−n0 < δ tenemos que la distancia entre dos valores
                n    £      £
de f en un intervalo x, x0 0 ∩ [a, b] no es superior a ≤/2(b − a), de donde se
                         n
concluye inmediatamente que Mx − mx ≤ ≤/2(b − a).            £      £
   Llamemos g y h a las funciones que en cada intervalo x, x0 0 toman el
                                                                  n
valor constante mx y Mx respectivamente. Entonces es claro que g ≤ f ≤ h y
0 ≤ h − g ≤ ≤/2(b − a).
   Para todo n ≥ n0 se cumple

                  Sn0 (g) = Sn (g) ≤ Sn (f ) ≤ Sn (h) = Sn0 (h),

luego para n, m ≥ n0 se cumple
                                                    X
            |Sn (f ) − Sm (f )| ≤ Sn0 (h − g) =           (Mx − mx )2−n0
                                                  x∈Pn0
236                                  Cap´
                                        ıtulo 6. Ecuaciones diferenciales ordinarias
                                                               £       £
    Si llamamos k al n´mero de puntos x ∈ Pn0 tales que x, x0 0 ⊂ [a, b] es
                        u                                           n
claro que k2−n0 ≤ b − a. Puede ocurrir que haya dos puntos adicionales y ∈ Pn
         £ 0 £
tal que y, yn0 no est´ contenido en [a, b] pero corte a [a, b]. En cualquier caso
                      e
hay a lo sumo k + 2 intervalos que cortan a [a, b] y por lo tanto la suma anterior
tiene a lo sumo k + 2 sumandos no nulos. As´ pues
                                              ı
                                                                             ≤
                  |Sn (f ) − Sm (f )| ≤ (k + 2)2−n0                               < ≤.
                                                                         2(b − a)

    Esto prueba que la sucesi´n Sn (f ) es de Cauchy, luego converge, luego f es
                             o
integrable Riemann.
   Conviene introducir el convenio de que
                  Z     b                Z       a               Z       a
                        f (x) dx = −                 f (x) dx,           f (x) dx = 0.
                    a                        b                       a

    De este modo la f´rmula del apartado e) del teorema 6.1 se cumple para tres
                     o
puntos cualesquiera a, b, c independientemente de c´mo est´n ordenados o de
                                                       o      e
si son iguales o no. En particular, si f es una funci´n continua en un intervalo
                                                     o
I (no necesariamente acotado) y a ∈ I podemos definir
                                        Z x
                               F (x) =      f (t) dt
                                                         a

para todo x ∈ I. Ahora probamos que la integral de Riemann de una funci´n
                                                                       o
continua coincide con la integral calculada mediante una primitiva.

Teorema 6.3 Sea f una funci´n continua en un intervalo I y sea a ∈ I. En-
                           o
tonces la funci´n
               o                  Z x
                          F (x) =    f (t) dt
                                                         a
                                                 0
es derivable en el interior de I y F = f .

                  ´
    Demostracion: Sea x un punto interior de I y sea J ⊂ I un intervalo
cerrado y acotado que contenga a a y a x (a ´ste ultimo en su interior). Por
                                                 e     ´
el teorema 2.36 la funci´n f es uniformemente continua en J, luego para cada
                         o
≤ > 0 existe un δ > 0 tal que si u, u0 ∈ J, |u−u0 | < δ entonces |f (u)−f (u0 )| < ≤.
    Sea h ∈ R tal que |h| < δ y x + h ∈ J. Sean m y M el m´     ınimo y el m´ximo
                                                                              a
de f en el intervalo cerrado de extremos x y x + h. Si h > 0
                      Z     x+h          Z   x+h                     Z       x+h
             mh =               m dt ≤                  f (t) dt ≤             M dt = M h.
                            x            x                               x

   Si h < 0 se invierten las desigualdades, pero en ambos casos resulta
                                         R x+h
                                             x
                                                       f (t) dt
                                  m≤                            ≤ M.
                                                       h
6.1. La integral de Riemann                                                     237

Por el teorema de los valores intermedios existe un α entre x y x + h de modo
que
                           R x+h
                                 f (t) dt    F (x + h) − F (x)
                   f (α) = x              =                    .
                                 h                   h
   Claramente |α − x| < |h| < δ, luego
               Ø                           Ø
               Ø F (x + h) − F (x)         Ø
               Ø                    − f (x)Ø = |f (α) − f (x)| < ≤,
               Ø         h                 Ø

por lo que existe F 0 (x) = f (x).
   Como consecuencia obtenemos:
Teorema 6.4 (Regla de Barrow) Si f es una funci´n continua en un inter-
                                                         o
valo [a, b] entonces F tiene una primitiva F en [a, b] y
                            Z b
                               f (x) dx = F (b) − F (a).
                              a

                ´
   Demostracion: Cuando decimos que F es una primitiva de f en [a, b]
queremos decir que F es continua en [a, b], derivable en ]a, b[ y F 0 = f en ]a, b[.
Basta tomar como F la funci´n
                            o
                                      Z x
                              F (x) =    f (t) dt,
                                          c

donde a < c < b. S´lo falta probar que F es continua en a y en b, lo cual es
                      o
sencillo: Sea |f (x)| ≤ M en [a, b]. Entonces
                                Z b              Z b
              |F (b) − F (x)| ≤     |f (t)| dt ≤     M dt = M (b − x),
                                     x          x

luego si |b − x| < δ = ≤/M se cumple |F (b) − F (x)| < ≤, lo que prueba la
continuidad en b, e igualmente sucede con a.
    Puesto que toda funci´n continua tiene primitiva, todo arco x de clase C 1
                           o
es rectificable, pues la funci´n kx0 k es continua.
                             o

Ejemplo Vamos a demostrar el resultado que dejamos pendiente en el cap´          ı-
tulo III, a saber, la convergencia de la serie de Taylor del arco tangente incluso
en los puntos frontera ±1. Para ello partimos de la suma parcial de la serie
geom´trica de raz´n −t2 :
      e             o
               1                                                t2n+2
                    = 1 − t2 + t4 + · · · + (−1)n t2n + (−1)n+1        .
             1 + t2                                             1 + t2
   Integrando ambos miembros resulta
                  Z x
                      1              x3   x5                 x2n+1
       arctan x =       2
                          dt = x −      +    − · · · + (−1)n
                   0 1+t             3     5                 2n + 1
                                         Z x 2n+2
                                             t
                              + (−1)n+1            2
                                                     dt.
                                          0 1+t
238                            Cap´
                                  ıtulo 6. Ecuaciones diferenciales ordinarias

   El polinomio de la derecha es el polinomio de Taylor del arco tangente, luego
                          ØZ x 2n+2 Ø ØZ x              Ø
                          Ø    t        Ø Ø             Ø |x|2n+3
            |R2n+1 (x)| = Ø
                          Ø         2
                                      dtØ ≤ Ø
                                        Ø Ø     t2n+2 dtØ =
                                                        Ø          ,
                            0 1+t             0             2n + 3

de donde se sigue que el resto tiende a cero incluso si x = ±1, como hab´ que
                                                                        ıa
probar.
   Finalmente definimos la integral de una funci´n f : [a, b] −→ Rn como
                                                     o
              Z b            √Z                      Z b          !
                                b
                  f (x) dx =      f1 (x) dx, . . . ,     fn (x) dx ,
                 a               a                a


entendiendo que f es integrable Riemann en [a, b] si y s´lo si lo son todas sus
                                                        o
funciones coordenadas fi .


6.2     Ecuaciones diferenciales de primer orden
    Nos ocupamos ahora de asegurar la existencia y unicidad de la soluci´n de
                                                                        o
los problemas de Cauchy. Nos basaremos en un resultado general sobre espacios
m´tricos completos:
  e

Teorema 6.5 (Teorema de punto fijo de Banach) Sea M un espacio m´-     e
trico completo y T : M −→ M una aplicaci´n tal que existe un n´mero real
                                            o                  u
0 < α < 1 de modo que
                °            ¢
               d T (x), T (y) < α d(x, y), para todo x, y ∈ M.

Entonces existe un unico x ∈ M tal que T (x) = x.
                   ´

    Las aplicaciones T que cumplen la propiedad indicada se llaman contractivas.
Los puntos x que cumplen T (x) = x se llaman puntos fijos de T . El teorema
afirma, pues, que toda aplicaci´n contractiva en un espacio m´trico completo
                               o                                e
tiene un unico punto fijo.
         ´
                   ´
   Demostracion: Tomamos un punto arbitrario x0 ∈ M y consideramos la
sucesi´n dada por xn+1 = T (xn ). Por la propiedad de T , tenemos que
      o
                         °                ¢
          d(x1 , x2 ) = d T (x0 ), T (x1 ) < α d(x0 , x1 ),
                         °                ¢
          d(x2 , x3 ) = d T (x1 ), T (x2 ) < α d(x1 , x2 ) = α2 d(x0 , x1 ),

y en general concluimos d(xn , xn+1 ) < αn d(x0 , x1 ). Aplicando la desigualdad
triangular resulta, para n < m,
                  √m−1 !               √∞ !
                   X                    X                      αn
                        i
    d(xn , xm ) <      α d(x0 , x1 ) <      αi d(x0 , x1 ) =        d(x0 , x1 ).
                   i=n                  i=n
                                                              1−α
6.2. Ecuaciones diferenciales de primer orden                                      239

    El t´rmino de la derecha tiende a 0, lo que significa que la sucesi´n xn es de
        e                                                             o
Cauchy. Como el espacio M es completo existe x = l´ xn ∈ M . Veamos que x
                                                      ım
                                                       n
es un punto fijo de T . Para ello observamos que
             °        ¢                               °            ¢
            d x, T (x) ≤ d(x, xn ) + d(xn , xn+1 ) + d xn+1 , T (x)
                        < (1 + α)d(x, xn ) + αn d(x0 , x1 ).
                                                      °       ¢
    El ultimo t´rmino tiende a 0, luego ha de ser ° x, T (x) ¢ 0, es decir,
       ´       e                                     d           =
T (x) = x. Si y es otro punto fijo de T , entonces d T (x), T (y) = d(x, y), en
contradicci´n con la propiedad contractiva, luego el punto fijo es unico.
           o                                                      ´
    Es frecuente que una ecuaci´n diferencial dependa de uno m´s par´metros.
                                  o                                a      a
Por ejemplo, la fuerza F (t, x) que afecta a un m´vil de masa m es, por lo general,
                                                 o
funci´n del tiempo t y de la posici´n x. La segunda ley de Newton afirma que
     o                               o
su trayectoria x(t) obedece la ecuaci´n diferencial de segundo orden
                                       o

                                 F (t, x) = m x00 (t),

donde la masa m es un par´metro. En casos como este podemos considerar
                              a
la soluci´n como funci´n de los par´metros, es decir, x(t, m) es la posici´n en
         o             o             a                                    o
el instante t de un cuerpo de masa m sometido a la fuerza F (t, x) (y en unas
condiciones iniciales dadas). En el teorema de existencia y unicidad que damos
a continuaci´n contemplamos la existencia de estos par´metros y probamos que
             o                                         a
la soluci´n depende continuamente de ellos.
         o

                                            0            0
Teorema 6.6 Sean t0 , a, b1 , . . . , bn , y1 , . . . , yn n´meros reales. Consideremos
                                                            u
una aplicaci´n continua
            o
                                       n
                                       Y
              f : [t0 − a, t0 + a] ×       [yi − bi , yi + bi ] × K −→ Rn ,
                                             0         0

                                       i=1

donde K es un espacio m´trico compacto. Sea M una cota de f respecto a la
                       e
norma k k∞ en Rn . Supongamos que existe una constante N tal que

                     kf (t, y, µ) − f (t, z, µ)k∞ ≤ N ky − zk∞ .

   Entonces el problema de Cauchy
                                                          æ
                               y 0 (t, µ) = f (t, y, µ)
                               y(t0 , µ) = y0

tiene soluci´n unica y : [t0 − h0 , t0 + h0 ] × K −→ Rn , continua en su dominio,
            o ´
donde h0 es cualquier n´mero real tal que
                         u
                                  Ω                 æ
                                        b1       bn           1
                  0 < h0 ≤ m´ a, , . . . ,
                               ın                     , h0 < .
                                        M        M           N
240                                            Cap´
                                                  ıtulo 6. Ecuaciones diferenciales ordinarias

    Se entiende que derivada de y que aparece en el problema de Cauchy es
respecto de la variable t. Te´ricamente deber´
                             o                ıamos usar la notaci´n de derivadas
                                                                  o
parciales, pero es costumbre usar la notaci´n del an´lisis de una variable para
                                            o         a
evitar que el problema parezca una ecuaci´n diferencial en derivadas parciales,
                                           o
cuando en realidad no lo es.
               ´
    Demostracion: Sea h0 en las condiciones indicadas, sea I = [t−h0 , t+h0 ],
        Q 0
        n
                     0
sea D =   [yi −bi , yi +bi ] y sea M = C(I ×K, D), que es un espacio de Banach
          i=1
con la norma supremo. Definimos el operador T : M −→ M mediante
                                                          Z   t    °             ¢
                          T (y)(t, µ) = y 0 +                     f t, y(t, µ), µ dt.
                                                          t0


    Hemos de probar que T (y)(t, µ) ∈ D y que T (y) es una aplicaci´n continua.
                                                                        o
En primer lugar,
                          ØZ t                Ø ØZ t                  Ø   ØZ t Ø
  Ø                   Ø   Ø                   Ø Ø                     Ø   Ø     Ø
  ØT (y)i (t, µ) − yi Ø = Ø
                    0                         Ø≤Ø
                               fi (t, y, µ) dtØ Ø                     Ø≤MØ
                                                     |fi (t, y, µ)| dtØ       dtØ
                          Ø                                               Ø     Ø
                                        t0                                      t0                              t0
                             = M |t − t0 | ≤ M h0 ≤ bi .

    Esto prueba que T (y)(t, µ) ∈ D. La continuidad es consecuencia de un
c´lculo rutinario:
 a
                                            ØZ t1                     Z t2                  Ø
                                            Ø                                               Ø
                                            Ø
 kT (y)(t1 , µ1 ) − T (y)(t2 , µ2 )k∞ = m´x Ø
                                         a        fi (t, y, µ1 ) dt −      fi (t, y, µ2 ) dtØ
                                                      i                                     Ø
                                                                  t0                               t0

                      µØZ              t1                              Z   t1                     Ø
                       Ø                                                                          Ø
                 ≤ m´x Ø
                    a Ø                     fi (t, y, µ1 ) dt −                  fi (t, y, µ2 ) dtØ +
                                                                                                  Ø
                    i              t0                                  t0
                                  ØZ   t1                              Z    t2                    Ø∂
                                  Ø                                                               Ø
                                  Ø         fi (t, y, µ2 ) dt −                  fi (t, y, µ2 ) dtØ
                                  Ø                                                               Ø
                                   t0                                      t0
             µØZ      t1 °                                   Ø ØZ                        t1                    Ø∂
              Ø                                           ¢ Ø Ø                                                Ø
        ≤ m´x Ø
           a Ø             fi (t, y, µ1 ) − fi (t, y, µ2 ) dtØ + Ø
                                                             Ø Ø                              fi (t, y, µ2 ) dtØ
                                                                                                               Ø
           i         t0                                                                t2
                      ØZ      t1 Ø                                   Ø
                      Ø                                          Ø Ø
                ≤ m´x Ø
                   a             Øfi (t, y, µ1 ) − fi (t, y, µ2 )Ø dtØ + M |t1 − t2 |.
                   i Ø       t0
                                                                     Ø

     Sea ≤ > 0. La funci´n fi (t, y(t, µ), µ) es uniformemente continua en el
                                  o
compacto I × K, luego existe un δ > 0 tal que si d(µ1 , µ2 ) < δ, entonces
|fi (t, y, µ1 ) − fi (t, y, µ2 )| < ≤/2h0 . Podemos suponer que esto vale para todo
i = 1, . . . , n, y si suponemos tambi´n que |t1 − t2 | < ≤/2M concluimos que
                                           e

                             kT (y)(t1 , µ1 ) − T (y)(t2 , µ2 )k∞ < ≤.

Esto prueba la continuidad de T (y) en el punto (t1 , µ1 ).
6.2. Ecuaciones diferenciales de primer orden                                        241

    Ahora probamos que T es contractivo, con constante α = N h0 < 1. En
efecto,
                                       ØZ t                                           Ø
                                       Ø °                                         ¢ Ø
  kT (y)(t, µ) − T (z)(t, µ)k∞         Ø
                                 = m´x Ø
                                    a       fi (t, y(t, µ), µ) − fi (t, z(t, µ), µ) dtØ
                                    i                                                 Ø
                                           t0

       ØZ t                          Ø         ØZ t           Ø
       Ø                             Ø         Ø              Ø
 ≤ m´x Ø
    a Ø     N ky(t, µ) − z(t, µ)k∞ dtØ ≤ N m´x Ø
                                     Ø      a Ø     ky − zk dtØ ≤ N h0 ky − zk.
                                                              Ø
    i     t0                                i              t0

   Por definici´n de norma supremo resulta kT (y) − T (z)k ≤ αky − zk. El
              o
teorema anterior implica ahora la existencia de una unica funci´n y ∈ M tal
                                                          ´    o
que
                                        Z t
                        y(t, µ) = y 0 +     f (t, y, µ) dt,
                                                t0

pero es claro que esto equivale a ser soluci´n del problema de Cauchy, luego ´ste
                                            o                                e
tiene soluci´n unica.
            o ´
   En la pr´ctica, hay una hip´tesis m´s fuerte que la condici´n de Lipschitz
            a                  o        a                        o
que hemos exigido en el teorema anterior pero que es m´s f´cil de comprobar.
                                                         a a
Se trata de exigir simplemente que la funci´n f sea de clase C 1 .
                                           o

Teorema 6.7 Sea f : D ⊂ Rn −→ Rm una funci´n de clase C 1 en un abierto
                                                  o
D. Para todo subconjunto compacto convexo C ⊂ D existe una constante N tal
que si y, z ∈ C entonces kf (y) − f (z)k∞ ≤ N ky − zk∞ .

                  ´
     Demostracion: Si llamamos f1 , . . . , fm a las funciones coordenadas de f ,
basta probar que |fi (y) − fi (z)| ≤ Ni ky − zk∞ para todo y, z ∈ C, pues to-
mando como N la mayor de las constantes Ni se cumple la desigualdad buscada.
Equivalentemente, podemos suponer que m = 1.           °           ¢
     Dados y, z ∈ C, consideramos la funci´n g(h) = f y + h(z − y) , definida en
                                           o
[0, 1], pues C es convexo. Se cumple g(0) = f (y), g(1) = f (z). Por el teorema
del valor medio existe 0 < h0 < 1 tal que

               f (z) − f (y) = g 0 (h0 ) = df (ξ)(z − y) = ∇f (ξ)(z − y),

donde ξ = y + h0 (z − y) ∈ C. Sea N0 una cota del m´dulo de las derivadas
                                                           o
parciales de f (que por hip´tesis son continuas) en el compacto C. Entonces
                             o
                     Ø n                   Ø
                     ØX                    Ø X n
                     Ø                     Ø
   |f (z) − f (y)| = Ø   Di f (ξ)(zi − yi )Ø ≤   N0 kz − yk∞ = nN0 kz − yk∞ .
                     Ø                     Ø
                      i=1                            i=1




   En realidad, si tomamos como hip´tesis que la ecuaci´n diferencial sea
                                        o                 o
de clase C 1 obtenemos no s´lo la continuidad de la soluci´n respecto de los
                            o                             o
par´metros, sino tambi´n la derivabilidad.
   a                  e
242                               Cap´
                                     ıtulo 6. Ecuaciones diferenciales ordinarias

Teorema 6.8 Sea f : D ⊂ R × Rn × Rm −→ Rn una funci´n de clase C 1 en el
                                                            o
abierto D. Sea (t0 , y0 , µ) ∈ D. Entonces el problema de Cauchy
                                                         æ
                                y 0 (t, µ) = f (t, y, µ)
                                y(t0 , µ) = y0

tiene soluci´n unica definida y de clase C 1 en un entorno de (t0 , µ).
            o ´

                 ´
    Demostracion: Tomamos un entorno C de (t0 , y0 , µ) que est´ contenido en
                                                                 e
D y sea producto de intervalos cerrados de centro cada una de las componentes
del punto. En particular es convexo y compacto. El teorema anterior garantiza
que se cumplen las hip´tesis del teorema de existencia y unicidad. Falta probar
                        o
que la funci´n y(t, µ) es de clase C 1 en su dominio.
            o
    Obviamente y es derivable respecto de t y la derivada es continua. Veamos
que lo mismo sucede con las dem´s variables. Sea ei un vector de la base
                                     a
can´nica de Rm . Consideramos un punto (t1 , µ1 ) del dominio de y. La funci´n
    o                                                                        o

                                       y(t, µ + hei ) − y(t, µ)
                       Q(t, µ, h) =
                                                 h
est´ definida en los puntos de un entorno de (t1 , µ1 , 0) para los que h 6= 0.
   a
Hemos de probar que tiene l´
                           ımite cuando h tiende a 0. Claramente

               ∂Q   f (t, y(t, µ + hei ), µ + hei ) − f (t, y(t, µ), µ)
                  =                                                     .
               ∂t                            h
   Llamemos
                       
                        f (p + x) − f (p) − df (p)(x)            si x 6= 0
             E(p, x) =               kxk
                       
                                       0                          si x = 0

   Se comprueba que es continua en un entorno de (t1 , y(t1 , µ1 ), µ1 , 0). S´lo
                                                                              o
hay que ver la continuidad en los puntos de la forma (q, 0). Se demuestra para
cada funci´n coordenada independientemente, y a su vez para ello se aplica el
          o
teorema del valor medio la la funci´n fj (p + tx). El resultado es que
                                   o
                                  °                   ¢ x
                       Ej (p, x) = ∇fj (p0 ) − ∇fj (p)     ,
                                                       kxk

donde p0 es un punto entre p y p + x, y ahora basta aplicar la continuidad de
las derivadas parciales de f .
    En t´rminos de E tenemos
         e
                      ∂Q                     °                  ¢
                         = df (t, y(t, µ), µ) 0, Q(t, µ, h), ei
                      ∂t

                                     |h|
             +k(0, Q(t, µ, h), 1)k       E(0, y(t, µ + hei ) − y(t, µ), h).
                                      h
6.2. Ecuaciones diferenciales de primer orden                                          243

   M´s brevemente
    a
     ∂Q                     °                 ¢
        = df (t, y(t, µ), µ) 0, Q(t, µ, h), ei + k(0, Q(t, µ, h), 1)k E ∗ (t, µ, h),
     ∂t
entendiendo que E ∗ (t, µ, h) es continua en un entorno de (t1 , µ1 , 0) y se anula
en los puntos donde h = 0.
    Esto significa que Q es la soluci´n de una ecuaci´n diferencial determinada
                                         o                o
por la funci´n continua
            o
                                           °        ¢
         g(t, Q, µ, h) = df (t, y(t, µ), µ) 0, Q, ei + k(0, Q, 1)k E ∗ (t, µ, h),

donde µ y h son par´metros. Esta funci´n no es diferenciable, pero cumple
                       a                       o
claramente la hip´tesis del teorema 6.6. Concretamente la consideramos definida
                  o
en un producto de intervalos de centros t1 , Q(t1 , µ1 , h) (para un h fijo) por
un entorno compacto K de (µ1 , h) que contenga a (µ1 , 0). Si tomamos como
condici´n inicial en el punto (t1 , µ1 , h) la determinada por la funci´n Q que ya
       o                                                                o
tenemos definida, el teorema 6.6 nos garantiza la existencia de soluci´n continua
                                                                         o
en un conjunto de la forma [t1 − r, t1 + r] × K. Por la unicidad la soluci´n debe
                                                                             o
coincidir con la funci´n Q que ya ten´
                       o                   ıamos. En particular coincidir´ con ella
                                                                           a
en los puntos de un entorno de (t1 , µ1 , 0) tales que h 6= 0. De aqu´ se sigue que
                                                                      ı
existe
                                                 ∂y
                          l´ Q(t1 , µ1 , h) =
                           ım                        (t1 , µ1 ).
                          h→0                   ∂µi
    M´s a´n, esta derivada satisface la ecuaci´n diferencial
      a u                                          o
                                                   µ              ∂
                      ∂ ∂y         °             ¢       ∂y
                             = df t, y(t, µ), µ 0,            , ei .
                      ∂t ∂µi                            ∂µi

   Esto implica que es continua, luego y es de clase C 1 .
    Hemos probado que las derivadas respecto a los par´metros de una ecuaci´n
                                                        a                      o
diferencial determinada por una funci´n de clase C k satisfacen una ecuaci´n
                                         o                                     o
diferencial de clase C k−1 . Una simple inducci´n prueba entonces que la soluci´n
                                               o                               o
y de una ecuaci´n de clase C k es una funci´n de clase C k .
                 o                           o
   Notemos que la soluci´n y de un problema de Cauchy puede considerarse
                            o
tambi´n como funci´n de las condiciones iniciales, es decir, y(t, µ, t0 , y0 ). Del
      e              o
teorema anterior se deduce que y es continua respecto a todas las variables, es
decir, como funci´n definida en un entorno de (t0 , µ, t0 , y0 ) en R × Rm × R × Rn .
                  o
Para ello basta ver que si hacemos z = y(t, µ, t0 , y0 )−y0 y r = t−t0 , el problema
                                                     æ
                               y 0 (t) = f (t, y, µ)
                               y(t0 ) = y0
es equivalente a                                                æ
                            z 0 (r) = f (r + t0 , z + y0 , µ)
                            z(0) = 0
en el sentido de que una soluci´n de uno da una del otro mediante los cambios de
                               o
variable indicados. El segundo miembro del segundo problema es una funci´n    o
244                               Cap´
                                     ıtulo 6. Ecuaciones diferenciales ordinarias

g(r, z, ν), donde ν = (t0 , y0 , µ) ∈ D. Concretamente, el dominio de g es el
abierto
             {(r, z, t0 , y0 , µ) | (r + t0 , z + y0 , µ) ∈ D, (t0 , y0 , µ) ∈ D}.
   Una soluci´n z del segundo problema definida en un entorno de (0, t0 , y0 , µ)
              o
se traduce en una soluci´n y(t, µ, t0 , y0 ) del primer problema definida en un
                              o
entorno de (t0 , µ, t0 , y0 ). En definitiva tenemos el siguiente enunciado, m´s
                                                                              a
completo, del teorema de existencia y unicidad:

Teorema 6.9 Sea f : D ⊂ R × Rn × Rm −→ Rn una funci´n de clase C ko
(k ≥ 1) en el abierto D. Sea (t0 , y0 , µ) ∈ D. Entonces el problema de Cauchy
                                                             æ
                          y 0 (t, µ, t0 , y0 ) = f (t, y, µ)
                          y(t0 , µ, t0 , y0 ) = y0

tiene soluci´n unica de clase C k en un entorno de (t0 , µ, t0 , y0 ).
            o ´

   Conviene interpretar las ecuaciones diferenciales de primer orden en t´rminos
                                                                         e
cercanos a las aplicaciones f´
                             ısicas. Supongamos que D es una regi´n del espacio
                                                                  o
ocupada por un fluido en movimiento, como puede ser el aire o un caudal de
agua. Podemos considerar entonces la funci´n V : I × D ⊂ R × Rn −→ Rn que
                                              o
determina la velocidad del fluido Vt (x) en cada instante t ∈ I y en cada punto
x ∈ D. Es lo que se llama un campo de velocidades variable. Si V no depende
de t tenemos un campo de velocidades estacionario. Entonces, la soluci´n del
                                                                           o
problema de Cauchy                          °    ¢æ
                                 x0 (t) = Vt x(t)
                                 x(t0 ) = x0
se interpreta como la trayectoria que seguir´ un cuerpo de masa despreciable (un
                                              a
papel en el aire) abandonado en el punto x0 en el instante t0 . Las soluciones
se llaman l´ ıneas de flujo del campo de velocidades. Estos problemas son el
objeto de estudio de la hidrodin´mica, o mec´nica de fluidos. Observemos que
                                    a            a
cualquier problema de Cauchy puede interpretarse de este modo, lo cual es
conveniente en muchas ocasiones. La funci´n x(t, µ, t0 , y0 ) dada por el teorema
                                               o
anterior se conoce como flujo del campo de velocidades. Cuando el campo es
estacionario el instante inicial t0 es irrelevante, pues claramente x(t, µ, t0 , y0 ) =
x(t−t0 , µ, 0, y0 ), por lo que podemos suponer siempre que t0 = 0 y entender que
el flujo x(t, µ, y0 ) indica la posici´n de un objeto sometido al campo t unidades
                                     o
de tiempo despu´s de que se encontrara en la posici´n y0 .
                    e                                   o
    Otra cuesti´n importante es el dominio de la soluci´n y(t) (para unos par´-
                 o                                       o                       a
metros y condiciones iniciales dados). En principio hemos probado que la
ecuaci´n tiene soluci´n unica en un entorno de t0 , pero una soluci´n dada en un
       o               o ´                                          o
entorno dado puede admitir prolongaciones a un intervalo mayor. Haciendo uso
de las estimaciones expl´ ıcitas del teorema 6.6 junto con la unicidad de las solu-
ciones es f´cil ver que dos prolongaciones de una misma soluci´n han de coincidir
           a                                                   o
en su dominio com´n, luego la uni´n de todas las prolongaciones constituye una
                     u               o
soluci´n m´xima, no prolongable, de la ecuaci´n diferencial. El dominio de esta
      o     a                                    o
soluci´n m´xima ha de ser un intervalo abierto, sin que pueda prolongarse por
      o     a
6.2. Ecuaciones diferenciales de primer orden                                      245

continuidad a sus extremos, o de lo contrario podr´    ıamos usar el teorema de
existencia para prolongar la soluci´n un poco m´s tomando como condiciones
                                     o            a
iniciales los valores en dicho extremo. Si el dominio de la soluci´n m´xima est´
                                                                  o    a         a
acotado superior o inferiormente, ello se debe necesariamente a que la curva
obtenida tiende a infinito en el extremo o bien se acerca a la frontera del abierto
donde est´ definido el problema. No entraremos en detalles sobre esto.
           a
   Como ejemplo de aplicaci´n del teorema anterior demostramos lo siguiente:
                           o
Teorema 6.10 Dadas dos funciones κ, τ : I −→ R de clase C 2 de modo que
κ ≥ 0 y un punto t0 ∈ I, existe una curva regular x : ]t0 − ≤, t0 + ≤[ −→ R3
parametrizada por el arco tal que κ y τ son respectivamente su curvatura y su
torsi´n. La curva es unica salvo isometr´
     o               ´                  ıas.
                 ´
    Demostracion: La unicidad nos la da el teorema 4.23. Para probar la
existencia consideramos el sistema de ecuaciones diferenciales determinado por
las f´rmulas de Frenet:
     o
                    T 0 = κN,     N 0 = −κT − τ B,     B 0 = τ N.
    Se trata de un sistema de nueve ecuaciones diferenciales con inc´gnitas las
                                                                    o
nueve funciones coordenadas de T , N y B. Tomamos unas condiciones iniciales
cualesquiera T0 , N0 , B0 tales que formen una base ortonormal positivamente
orientada. Por el teorema anterior existen unas unicas funciones (T, B, N ) que
                                                 ´
satisfacen las ecuaciones. Un simple c´lculo nos da
                                       a
      (T N )0   =  κN N − κT T − τ T B,            (T B)0    = κN B + τ T N,
      (N B)0    = −κT B − τ BB + τ N N             (T T )0   = 2κT N,
      (N N )0   = −2κT N − 2τ N B                  (BB)0     = 2τ N B.
    Vemos que las seis funciones T N , T B, N B, T T , N N , BB satisfacen un
sistema de ecuaciones diferenciales con la condici´n inicial (0, 0, 0, 1, 1, 1) que por
                                                   o
otra parte es claro que tiene por soluci´n a la funci´n constante (0, 0, 0, 1, 1, 1).
                                        o             o
La unicidad implica que (T, N, B) es una base ortonormal de R3 .
    Definimos                           Z s
                               x(s) =      T (s) ds.
                                             t0
                             0
   Entonces es claro que x (s) = T (s), luego en particular x est´ parametrizada
                                                                  a
por el arco. Adem´s x00 (s) = κN , luego κ es la curvatura de x. Un simple c´lculo
                  a                                                         a
nos da que la torsi´n es τ .
                   o
   Veamos ahora una aplicaci´n a las variedades diferenciables. Sea S ⊂ Rm
                                o
una variedad de dimensi´n n y α : I −→ S una curva parametrizada por el
                          o
arco. Sea α(s0 ) = p. Sea X una carta de S alrededor de p. Entonces α¢tiene
                                                                        °
asociada una representaci´n en la carta x(s) de modo que α(s) = X x(s) . Un
                          o
vector arbitrario w0 ∈ Tp (S) es de la forma w0 = dX(x(s0 ))(a0 ). Teniendo en
cuenta las ecuaciones (5.8) del cap´
                                   ıtulo anterior es claro que la soluci´n a(s) del
                                                                        o
problema
                                    Xn
                             a0 +
                               k        ai Γk x0 = 0
                                            ij j
                                     i,j=1
246                              Cap´
                                    ıtulo 6. Ecuaciones diferenciales ordinarias

con la condici´n inicial a(s0 ) = a0 determina un campo de vectores
              o
                                   °    ¢                   °    ¢
               w(s) = a1 (s) D1 X x(s) + · · · + an (s) Dn X x(s)

con derivada covariante nula. Con esto casi tenemos demostrado el teorema
siguiente:

Teorema Sea S una variedad y α : I −→ S una curva parametrizada por
el arco. Sea α(s0 ) = p y sea w0 ∈ Tp (S). Entonces existe un unico campo
                                                              ´
w : I −→ R3 tal que w(s) ∈ Tα(s) (S), w(s0 ) = w0 y Dw = 0. Lo llamaremos
transporte paralelo de w0 a trav´s de α.
                                e
     En realidad hemos probado la existencia de w en un entorno de s0 . Vamos
a justificar que la soluci´n puede prolongarse a todo I. Para ello conviene
                           o
observar que al ser Dw = 0 tenemos que w0 (s) es perpendicular a Tα(s) (S),
luego (ww)0 = 2ww0 = 0, es decir, kwk es constante. De aqu´ se sigue que el
                                                                  ı
transporte paralelo es unico: si w y w0 son transportes paralelos de un mismo
                        ´
vector, entonces w − w0 es un transporte paralelo del vector nulo (porque su
derivada covariante es la resta de las de los dos campos, luego es nula), luego es
la aplicaci´n constantemente nula.
           o
     Acabamos de usar la linealidad de la derivada covariante. M´s en general,
                                                                     a
                               0
si tenemos dos vectores w0 , w0 ∈ Tp (S) y ambos tienen transporte paralelo w y
w0 , entonces αw + βw0 es un transporte paralelo de αw0 + βw0 . Seg´n lo que
                                                                   0
                                                                           u
sabemos, existe un entorno de s0 a lo largo del cual todos los vectores de una
base de Tp (S) tienen transporte paralelo, con lo que de hecho todos los vectores
de Tp (S) lo tienen.
     Dado cualquier s ∈ I, es claro que el intervalo [s0 , s] (o [s, s0 ] si s < s0 )
puede cubrirse con un n´mero finito de estos entornos donde existe transporte
                          u
paralelo, de donde se sigue inmediatamente la existencia de transporte paralelo
desde s0 hasta s, luego el transporte paralelo existe sobre todo I.
Definici´n 6.11 Sea S una variedad y α : [s0 , s1 ] −→ S una curva parametri-
          o
zada por el arco de extremos p y q. Seg´n el teorema anterior, para cada vector
                                        u
w0 ∈ Tp (S) tenemos definido el transporte paralelo w(s) a lo largo de α de modo
que w(s0 ) = w0 . Al vector tpα (w0 ) = w(s1 ) ∈ Tq (S) lo llamaremos trasladado
                              pq
de w0 a lo largo de α. Esto nos define una aplicaci´n tpα : Tp (S) −→ Tq (S) a
                                                     o     pq
la que llamaremos transporte paralelo de Tp (S) a Tq (S) a lo largo de α.

Ejercicio: Probar que el transporte paralelo tpα : Tp (S) −→ Tq (S) es una isometr´
                                               pq                                 ıa.



6.3      Ecuaciones diferenciales de orden superior
    Las ecuaciones diferenciales que aparecen con mayor frecuencia en f´
                                                                       ısica y en
geometr´ son de orden 2. Afortunadamente, toda la teor´ sobre existencia y
        ıa                                                 ıa
unicidad que vamos a necesitar para ecuaciones diferenciales de orden superior
se deduce inmediatamente del caso de orden 1. En efecto:
6.3. Ecuaciones diferenciales de orden superior                                         247

Teorema 6.12 Sea f : D ⊂ R × Rnm × Rk −→ Rn una funci´n de clase C k   o
con k ≥ 1 en un abierto D. Entonces la ecuaci´n diferencial
                                                        o
                                                                     
                       y m) (t) = f (t, y, y 0 , . . . , y m−1) , µ) 
                                                                     
                         y(t0 ) = y0                                 
                                                                     
                                                                     
                         0          0
                        y (t0 ) = y0
                        ······     ···                               
                                                                     
                                                                     
                                                                     
                      m−1)          m−1)                             
                    y      (t0 ) = y0

                                              0       m−1)
tiene soluci´n unica y(t, µ, t0 , y0 , y0 , . . . , y0
            o ´                                              ) de clase C k en un entorno de
                               0            m−1)
cada punto (t0 , µ, t0 , y0 , y0 , . . . , y0    ).

                 ´
   Demostracion: Basta observar que el problema equivale al sistema de
ecuaciones de primer orden
                                                                            
                                     y 0 (t) = y1                           
                                                                            
                                      0                                     
                                                                            
                                     y1 (t) = y2                            
                                                                            
                                                                            
                                    ······     ···
                                  0
                                 ym−2 (t) = ym−1                            
                                                                            
                                                                            
                                 ym−1 (t) = f (t, y, y1 , . . . , ym−1 , µ) 
                                  0
                                                                            
                                                                            
                                                     0            m−1       
               (y, y1 , . . . , ym−1 )(t0 ) = (y0 , y0 , . . . , y0 )

donde hemos introducido las variables auxiliares yi , que representan funciones
con valores en Rn . Todo este sistema se puede expresar como una unica ecuaci´n
                                                                 ´           o
vectorial en las condiciones de la secci´n anterior.
                                        o


Ejemplo Vamos a calcular todas las soluciones de la ecuaci´n
                                                          o

                                           k 0
                              y 00 (t) =     y (t),   k ∈ R, t > 0.
                                           t
    Obviamente las funciones constantes son soluciones de la ecuaci´n. Si y no
                                                                    o
es constante existe un punto t0 > 0 tal que y 0 (t0 ) 6= 0. Llamemos y1 = y 0 (t).
En un entorno de t0 tenemos
                                  0
                                 y1 (t)   k
                                        = ,
                                 y1 (t)   t
luego integrando entre t0 y t queda

                               log y1 (t) − log y(t0 ) = log xk ,

de donde y1 (t) = y1 (t0 )xk , es decir, y 0 (t) = y 0 (t0 )xk . Integrando de nuevo
concluimos que
                           0
                           y (t0 ) xk+1 + y(t ) si k 6= −1
                                                   0
                 y(t) =        k+1
                           0
                              y (t0 ) log t + y(t0 ) si k = −1
248                             Cap´
                                   ıtulo 6. Ecuaciones diferenciales ordinarias

    Ahora es claro que las soluciones de la ecuaci´n dada est´n todas definidas
                                                  o          a
en ]0, +∞[ y vienen dadas por
                              Ω
                                 Axk+1 + B si k 6= −1
                      y(t) =
                                 A log t + B si k = −1

Estas expresiones incluyen las funciones constantes, que hab´
                                                            ıamos dejado aparte.

    El an´logo de segundo orden a un campo de velocidades ser´ un campo de
         a                                                      ıa
aceleraciones, pero en f´
                        ısica resulta m´s natural hablar de campos de fuerzas.
                                        a
Es frecuente que la fuerza Ft (x) que act´a sobre un cuerpo en un instante dado
                                          u
dependa unicamente de su posici´n en el espacio, con lo que tenemos una funci´n
         ´                        o                                          o
F : I × D −→ Rn . El campo de fuerzas ser´ estacionario si no depende del
                                                 a
tiempo. De acuerdo con la segunda ley de Newton, la trayectoria x(t) de un
cuerpo de masa m sometido a este campo vendr´ determinada por la ecuaci´n
                                                   a                         o
diferencial
                                    Ft = m x00 .
   La soluci´n depende de la posici´n inicial x0 y la velocidad inicial v0 .
            o                      o

Ejemplo La ley de la gravitaci´n universal de Newton afirma que la fuerza
                                   o
con que se atraen mutuamente dos cuerpos es directamente proporcional a sus
masas e inversamente proporcional al cuadrado de la distancia que los separa.
Consideremos una regi´n del espacio donde haya un cuerpo S de masa M tan
                        o
grande que la masa de cualquier otro cuerpo en las proximidades resulte despre-
ciable. Es el caso del Sol, rodeado de planetas de masa insignificante a su lado,
o de la Tierra y sus alrededores. En tal caso podemos suponer que la unica´
fuerza que act´a sobre un cuerpo es la provocada por S. En efecto, cuando de-
               u
jamos caer un objeto nuestro cuerpo lo atrae por gravedad, pero esta atracci´n
                                                                             o
es completamente inapreciable frente a la gravitaci´n terrestre. Igualmente,
                                                     o
J´piter atrae gravitatoriamente a la Tierra, pero la fuerza con que lo hace es
 u
insignificante frente a la del Sol.
    Si tomamos un sistema de referencia con origen en el punto donde se halla
el objeto masivo S, la fuerza que experimenta otro cuerpo de masa m situado
en un punto x viene dada por
                                       GM m
                                F =−        x,
                                       kxk3

donde G = 6,672 · 10−11 N · m2 /Kg2 es la constante de gravitaci´n universal. El
                                                                o
hecho de que su valor sea tan peque˜o hace que la gravedad no se manifieste
                                      n
salvo en presencia de grandes masas, como las estrellas y los planetas.
    Tras estudiar minuciosamente una gran cantidad de observaciones astron´-  o
micas, en 1610 Kepler public´ su astronomia nova, donde conclu´ que los pla-
                              o                                   ıa
netas se mueven siguiendo ´rbitas el´
                            o        ıpticas, de modo que el Sol ocupa uno de
           ´
los focos. Esta es la primera ley de Kepler. Newton mostr´ que ´ste y muchos
                                                           o      e
otros hechos sobre el movimiento de los astros pueden deducirse a partir de las
6.3. Ecuaciones diferenciales de orden superior                               249

leyes b´sicas de la din´mica y de su ley de gravitaci´n. Vamos a comprobar
       a                a                             o
que las trayectorias de los objetos sometidos a un campo de fuerzas como el que
estamos considerando son rectas o secciones c´nicas.
                                               o
    En primer lugar, es claro que si un cuerpo se encuentra en un punto x0
en las proximidades del Sol con una velocidad v0 , su trayectoria no saldr´ del
                                                                            a
plano determinado por los vectores x0 y v0 (o de la recta que determinan, si
son linealmente dependientes). Por ello podemos tomar el sistema de referencia
de modo que el eje Z sea perpendicular a este plano, con lo que la trayectoria
cumplir´ z = 0 y podemos trabajar unicamente con las coordenadas (x, y).
        a                              ´
    Conviene introducir coordenadas polares, r = (x, y) = (ρ cos θ, ρ sen θ). En
general, cuando la trayectoria de un m´vil viene dada en coordenadas polares
                                          o
por unas funciones ρ(t), θ(t), se llama velocidad angular a la derivada ω = θ0 .
La segunda derivada α = ω 0 = θ00 se conoce como aceleraci´n angular.
                                                                o
    La ecuaci´n de Newton puede expresarse en t´rminos de la cantidad de mo-
             o                                     e
vimiento, definida como p = mv, donde v = r0 es la velocidad del m´vil y m es
                                                                     o
su masa. Admitiendo que ´sta es constante, la segunda ley de Newton afirma
                            e
que
                                           dp
                                      F =      ,
                                            dt
donde F es la fuerza total que act´a sobre el cuerpo. En particular, la cantidad
                                    u
de movimiento de un cuerpo sobre el que no act´a ninguna fuerza permanece
                                                   u
constante.
    Existen magnitudes an´logas a la cantidad de movimiento y la fuerza en
                            a
coordenadas polares. Se llama momento angular de un m´vil a la magnitud
                                                                 o
L = r ∧ p = m r ∧ v. Si la trayectoria est´ contenida en un plano el vector L
                                              a
es perpendicular a ´l. Veamos su expresi´n en coordenadas polares. Para ello
                   e                         o
calculamos:
                    v = ρ0 (cos θ, sen θ) + ρω(− sen θ, cos θ),             (6.1)
de donde

           L = mρ(cos θ, sen θ, 0) ∧ ρω(− sen θ, cos θ, 0) = (0, 0, mρ2 ω).

   Para un movimiento plano podemos abreviar y escribir L = mρ2 ω. Se define
el momento de una fuerza F que act´a sobre un m´vil de posici´n r como
                                       u            o              o
M = r ∧ F . Es claro que si sobre un cuerpo act´an varias fuerzas el momento
                                               u
de la fuerza resultante es la suma de los momentos. La versi´n angular de la
                                                             o
segunda ley de Newton es
                       dL
                          = mv ∧ v + r ∧ ma = r ∧ F = M,
                       dt
es decir, el momento total que act´a sobre un m´vil es la derivada de su momento
                                  u            o
angular. En particular, si un cuerpo est´ libre de toda fuerza su momento
                                            a
angular permanece constante. Sin embargo, el momento angular se conserva
incluso en presencia de fuerzas, con tal de que la fuerza resultante sea paralela
a la posici´n, como ocurre en el caso de la fuerza gravitatoria que el Sol ejerce
            o
sobre los planetas.
250                               Cap´
                                     ıtulo 6. Ecuaciones diferenciales ordinarias

    Esto ya nos da una informaci´n sobre el movimiento de los planetas: puesto
                                 o
que mρ2 ω ha de ser constante, los planetas giran m´s r´pidamente cuando est´n
                                                   a a                      a
m´s cerca del Sol.
  a
   Veamos ahora la expresi´n de la segunda ley de Newton para la gravitaci´n
                          o                                               o
en coordenadas polares. Calculamos la aceleraci´n
                                               o

         a = v 0 = (ρ00 − ρω 2 )(cos θ, sen θ) + (2ρ0 ω + ρα)(− sen θ, cos θ).

   La fuerza gravitatoria es

                                     GM m
                            F =−          (cos θ, sen θ).
                                      ρ2

   Teniendo en cuenta que los vectores (cos θ, sen θ) y (− sen θ, cos θ) son orto-
gonales,la ecuaci´n F = ma equivale a las ecuaciones
                 o

                                       GM
                      ρ00 − ρω 2 = −       ,    2ρ0 ω + ρα = 0.                  (6.2)
                                        ρ2

    La soluci´n es complicada, pero ahora estamos interesados unicamente en la
              o                                                  ´
forma de la trayectoria, aunque sea con otra parametrizaci´n. Por ello, en lugar
                                                             o
de calcular las funciones ρ(t) y θ(t) calcularemos la parametrizaci´n ρ(θ). Por
                                                                     o
supuesto hay un caso en el que esta parametrizaci´n es imposible. Si ω0 = 0
                                                      o
(lo cual equivale a que la velocidad inicial v0 sea nula o paralela a r0 )° entonces
                                                                                  ¢
es f´cil ver que la soluci´n de las ecuaciones es una recta de la forma ρ(t), θ0 ,
    a                     o
donde ρ est´ determinada por la ecuaci´n
             a                            o

                                               GM
                                     ρ00 = −
                                                ρ2

con las condiciones iniciales ρ0 y ρ0 , determinadas a su vez por r0 y v0 . En
                                     0
efecto, una trayectoria de este tipo cumple ω = α = 0 y satisface trivialmente
las ecuaciones. En definitiva, el cuerpo se aleja del Sol en l´
                                                             ınea recta o bien cae
sobre ´l. Hemos probado que si la trayectoria de un m´vil cumple ω(t) = 0 en
      e                                                  o
un instante t entonces ω = 0 en todo instante, luego, rec´ ıprocamente, si ω0 6= 0
entonces ω no se anula nunca. Esto hace que la funci´n θ(t) sea un cambio de
                                                       o
par´metro, luego podemos considerar la reparametrizaci´n ρ(θ). Claramente
    a                                                      o

                         ρ0 = ρ0 ω
                               θ      y ρ00 = ρ00 ω 2 + ρ0 α.
                                               θ         θ

    Sustituimos estas igualdades en (6.2) y eliminamos α en la primera usando
la segunda. El resultado es la ecuaci´n
                                     o
                         µ              ∂
                            00  2ρ02              GM
                          ρ −        − ρ ω2 = − 2 ,
                                 ρ                 ρ

donde ahora todas las derivadas son respecto de θ y no respecto de t. No obs-
tante, la presencia de ω nos obliga a considerar ambos miembros como funciones
6.3. Ecuaciones diferenciales de orden superior                                  251

de t (la expresi´n entre par´ntesis es una funci´n de θ compuesta con la funci´n
                o            e                  o                             o
θ(t)).
    Sin embargo, al multiplicar ambos miembros por m2 ρ4 queda
                            µ              ∂
                         1          2ρ02          GM m2
                          2
                              ρ00 −      −ρ =−            ,                (6.3)
                        ρ            ρ              L2
donde L = mρ2 ω es una constante, luego todo el segundo miembro es constante y
la igualdad sigue siendo v´lida si consideramos el primer miembro como funci´n
                          a                                                 o
de θ.
    Recordemos que si r es una recta y F un punto exterior, la c´nica de directriz
                                                                o
r y foco F est´ formada por los puntos tales que la raz´n entre las distancias a
              a                                          o
r y a F es constante (y recibe el nombre de excentricidad de la c´nica). Toda
                                                                    o
c´nica que no sea una circunferencia es de esta forma. Si suponemos que el foco
 o
es el origen y la directriz es la recta vertical x = p > 0, entonces la distancia
de un punto de coordenadas polares (ρ, θ) a la directriz es |p − ρ cos θ|, luego la
ecuaci´n de la c´nica de excentricidad ≤ es
       o         o
                                       ρ
                                              = ≤.
                                  p − ρ cos θ
    En principio faltar´ un valor absoluto. Si ≤ ≤ 1 tenemos una elipse o
                         ıa
una par´bola y podemos suprimirlo, pues la curva queda al mismo lado de la
         a
directriz que el foco. Si ≤ > 1 tenemos una hip´rbola, y al suprimir el valor
                                                  e
absoluto estamos qued´ndonos con una de sus ramas. Lo hacemos as´ porque
                         a                                              ı
los cuerpos que se mueven siguiendo trayectorias hiperb´licas tienen al Sol en el
                                                        o
foco correspondiente a la rama que siguen o, dicho de otro modo, que la rama
que eliminamos no va a ser soluci´n de la ecuaci´n diferencial. Despejando ρ y
                                 o              o
llamando r = p≤ queda
                                         r
                             ρ=                   ,
                                 1 + ≤ cos(θ + k)
    La constante k equivale a girar la c´nica, de modo que ahora la directriz
                                        o
es arbitraria. Cualquier curva de esta forma es una c´nica de excentricidad ≤.
                                                      o
Adem´s esta expresi´n incorpora tambi´n a las circunferencias, para las que
      a               o                  e
≤ = 0. Es f´cil calcular
           a
               ≤ρ2                       2≤2 ρ3                ≤ρ2
        ρ0 =       sen(θ + k),   ρ00 =      2
                                                sen2 (θ + k) +     cos(θ + k).
                r                         r                     r
  Al sustituir en el miembro izquierdo de (6.3) se obtiene sin dificultad el valor
−1/r, luego concluimos que la c´nica
                               o
                               L2 °                 ¢−1
                         ρ=       2
                                    1 + ≤ cos(θ + k)
                              GM m
satisface (6.3). S´lo queda probar que ´stas son las unicas soluciones posibles o,
                  o                          e            ´
lo que es equivalente, que hay una soluci´n de esta forma cualesquiera que sean
                                               o
las condiciones iniciales ρ0 , θ0 , ρ0 , ω0 . Basta ver que las ecuaciones
                                     0

                L2 °                  ¢−1               GM m2 ρ2
                                                               0
       ρ0 =        2
                     1 + ≤ cos(θ0 + k)    ,      ρ0 =
                                                  0              ≤ sen(θ0 + k)
               GM m                                       L2
252                              Cap´
                                    ıtulo 6. Ecuaciones diferenciales ordinarias

tienen soluci´n en ≤ > 0, k para todos los valores de ρ0 , θ0 , ρ0 , ω0 , pero susti-
             o                                                   0
tuyendo L = mρ2 ω0 estas ecuaciones equivalen a
                  0
                                            µ 3 2                 ∂
                °                        ¢   ρ0 ω0      ρ0 ρ2 ω 2
               ≤ cos(θ0 + k), sen(θ0 + k) =        − 1, 0 0 0 ,
                                             GM           GM

que obviamente tienen soluci´n. Con esto hemos probado que las trayectorias
                             o
de los objetos sometidos a la atracci´n de una masa fija puntual son rectas o
                                     o
secciones c´nicas.
           o

Ejemplo Sea S una variedad diferenciable, sea p ∈ S y w ∈ Tp (S) un vector
unitario. Sea X una carta alrededor de p, p = X(x0 ) y w = dX(x0 ). Entonces
                                                                     0
existe una unica curva x(t) que verifica las ecuaciones (5.10) del cap´
           ´                                                         ıtulo anterior
                                                                             °    ¢
con las condiciones iniciales x(0) = x0 , x0 (0) = x0 . La curva g(t) = X x(t)
                                                    0
es una geod´sica de S parametrizada por el arco tal que g(0) = p y g 0 (0) = w.
             e
Rec´ıprocamente, la representaci´n en la carta de cualquier geod´sica que cumpla
                                 o                                e
esto ha de ser soluci´n de las ecuaciones (5.10), luego g es unica (salvo cambio
                     o                                        ´
de par´metro). En resumen:
       a
      En una variedad, por cada punto pasa una unica geod´sica en cada
                                               ´         e
      direcci´n.
             o
    Por ejemplo, en el cap´
                          ıtulo anterior probamos que los c´
                                                           ırculos m´ximos son
                                                                    a
geod´sicas de la esfera. Puesto que por cada punto y en cada direcci´n pasa un
     e                                                              o
c´
 ırculo m´ximo, concluimos que los c´
          a                           ırculos m´ximos son las unicas geod´sicas
                                               a              ´          e
de la esfera.

*Ejemplo En el cap´     ıtulo anterior demostramos que las rectas el´
                                                                    ıpticas e hi-
perb´licas son geod´sicas de los planos el´
    o                e                     ıptico e hiperb´lico. Puesto que por
                                                          o
cada punto y en cada direcci´n pasa una unica recta, ahora podemos concluir
                               o            ´
que las rectas son las unicas geod´sicas.
                       ´           e
Cap´
   ıtulo VII

Teor´ de la medida
    ıa

    Pensemos en el concepto de ´rea de una figura plana F . Una primera apro-
                                 a
ximaci´n consiste en definir dicha ´rea µ(F ) como el n´mero de veces que F
       o                           a                     u
contiene al cuadrado de lado unidad, pero esta definici´n s´lo es aplicable si
                                                         o o
F es uni´n de un n´mero finito de cuadrados unitarios. Por ejemplo, si F es
          o          u
un rect´ngulo de lados m y n (naturales) entonces µ(F ) = mn. Si F es un
        a
rect´ngulo de lados racionales r = p/q y r0 = p0 /q 0 , es f´cil concluir que el
     a                                                       a
´rea del rect´ngulo de lados p y q ha de ser qq 0 veces el ´rea de F , de donde
a             a                                            a
µ(F ) = rr0 . Si F es un rect´ngulo de lados arbitrarios α y β, ya no podemos
                              a
compararlo directamente con cuadrados unitarios y hemos de recurrir a un ar-
gumento de continuidad: si r < α < r0 , s < β < s0 son n´meros racionales,
                                                              u
el ´rea de F ha de ser mayor que el ´rea de un rect´ngulo de lados r y s y
   a                                   a               a
menor que la de un rect´ngulo de lados r0 y s0 , es decir, rs ≤ µ(F ) ≤ r0 s0 . El
                         a
unico n´mero real posible es µ(F ) = αβ. Una vez determinada el ´rea de un
´       u                                                            a
rect´ngulo arbitrario, existen numerosos y elegantes argumentos que nos permi-
     a
ten calcular el ´rea de muchas figuras, basados en que el ´rea se conserva por
                a                                           a
isometr´ as´ como en un principio elemental:
        ıas ı

               Si F ∩ G = ∅, entonces µ(F ∪ G) = µ(F ) + µ(G).                (7.1)

    Es f´cil calcular el ´rea de un paralelogramo, de un tri´ngulo, de un pol´
        a                a                                  a                ıgono
regular arbitrario, etc. Sin embargo, para calcular el ´rea de figuras m´s com-
                                                         a                 a
plicadas, como pueda ser un c´   ırculo, necesitamos de nuevo argumentos de con-
tinuidad. Por ejemplo, si llamamos Pn al pol´    ıgono regular de 2n lados inscrito
en un c´ırculo C y con un v´rtice en un punto prefijado, es f´cil ver que
                              e                                a
                                                       ∞
                                                       [
                    P2 ⊂ P3 ⊂ P4 ⊂ · · · C,   y C=           Pn ,
                                                       n=2

y en estas circunstancias es natural considerar que

                               µ(C) = sup µ(Pn ).
                                         n


                                       253
254                                            Cap´
                                                  ıtulo 7. Teor´ de la medida
                                                               ıa

    Admitiendo (7.1), es f´cil ver que el hecho de que el ´rea de la uni´n de
                           a                                 a              o
una sucesi´n creciente de conjuntos sea el supremo de las ´reas es equivalente
           o                                                 a
a que el ´rea de una uni´n disjunta numerable de conjuntos sea la suma de
          a                o
sus ´reas. Este principio engloba a (7.1) y es suficiente para justificar todos
     a
los razonamientos sobre c´lculo de ´reas. Con ´l como unica base podemos
                            a          a          e         ´
justificar la existencia y el c´lculo de ´reas de una amplia familia de figuras.
                              a          a
Sin embargo no nos capacita para definir el ´rea de cualquier subconjunto de
                                              a
R2 . Existen problemas t´cnicos para ello en los que no vamos a entrar, pero lo
                         e
cierto es que s´lo podremos definir una funci´n ´rea µ : M −→ [0, +∞] sobre
               o                               o a
una cierta familia M, que contendr´ a todos los c´
                                     a             ırculos, tri´ngulos, etc., pero
                                                               a
que no ser´ todo el conjunto de partes de R2 .
           a
    Conviene introducir una nueva estructura matem´tica que recoja estas ideas
                                                      a
y nos permita extenderlas a otras situaciones an´logas (el volumen en R3 , el
                                                  a
a
´rea en una superficie, etc.)


7.1     Medidas positivas
Definici´n 7.1 Sea X un conjunto. Un ´lgebra de subconjuntos de X es una
         o                              a
familia A de subconjuntos de X tal que:
  a) ∅, X ∈ A.
  b) Si A ∈ A, entonces X  A ∈ A.
  c) Si A, B ∈ A, entonces A ∪ B, A ∩ B ∈ A.
   Observar que la propiedad b) hace que la propiedad c) para uniones implique
la parte para intersecciones y viceversa. Si dicha propiedad se cumple para
familias numerables entonces se dice que A es una σ-´lgebra.
                                                    a
    Una medida positiva (o simplemente una medida) en una σ-´lgebra A de sub-
                                                            a
conjuntos de X es una aplicaci´n µ : A −→ [0, +∞] que cumpla las propiedades
                              o
siguientes:
  a) µ(∅) = 0.
  b) Si {An }∞ es una familia de conjuntos de A disjuntos dos a dos, entonces
             n=0
                             √∞       !    ∞
                               [          X
                           µ       An =       µ(An ).
                                  n=0         n=0

   Los conjuntos de A se llaman subconjuntos medibles de X. Un espacio
medida es una terna (X, A, µ), donde A es una σ-´lgebra de subconjuntos de X
                                                a
y µ es una medida en A. En la pr´ctica escribiremos X en lugar de (X, A, µ).
                                  a
    La medida µ es unitaria si µ(X) = 1, es finita si 0 < µ(X) < +∞ y es
σ-finita si µ(X) > 0 y existen conjuntos medibles {An }∞ de medida finita
                                                       n=0
tales que
                                    ∞
                                    [
                                X=     An .
                                        n=0
7.1. Medidas positivas                                                         255

    ´
    Este ultimo es el caso del ´rea en el plano o el volumen en el espacio. El ´rea
         ´                     a                                               a
del plano es infinita, pero podemos descomponerlo en una uni´n numerable de
                                                                  o
bolas de ´rea finita. Tambi´n se habla de espacios medida unitarios, finitos o
          a                   e
σ-finitos, seg´n sea la medida definida en ellos.
             u
    La σ-´lgebra m´s simple es la formada por todos los subconjuntos de X, pero
          a        a
ya hemos comentado que no podremos definir medidas interesantes sobre ella.
Es claro que la intersecci´n de una familia de σ-´lgebras sobre un conjunto X
                          o                      a
es de nuevo una σ-´lgebra, por lo que dado G ⊂ X existe una m´
                   a                                            ınima σ-´lgebra
                                                                        a
que contiene a G. Se la llama σ-´lgebra generada por G. Si X es un espacio
                                   a
topol´gico, la σ-´lgebra generada por los conjuntos abiertos recibe el nombre
     o           a
de σ-´lgebra de Borel. Una medida definida sobre la σ-´lgebra de Borel de un
      a                                                  a
espacio topol´gico X recibe el nombre de medida de Borel en X.
             o
    Las propiedades siguientes de las medidas se deducen inmediatamente de la
definici´n. Usamos el convenio de que si a ∈ R entonces a+∞ = +∞+∞ = +∞.
        o
Teorema 7.2 Sea X un espacio medida.
  a) Si A ⊂ B son medibles entonces µ(A) ≤ µ(B).
  b) Si A ⊂ B son medibles y µ(A) < +∞, entonces µ(B  A) = µ(B) − µ(A).
  c) Si A y B son conjuntos medibles disjuntos µ(A ∪ B) = µ(A) + µ(B).
  d) Si A y B son medibles entonces µ(A ∪ B) ≤ µ(A) + µ(B).
  e) Si {An }∞ son medibles entonces
             n=0
                            √∞      ! ∞
                              [       X
                          µ      An ≤   µ(An ).
                                  n=0         n=0

  f ) Si {An }∞ son medibles y cada An ⊂ An+1 , entonces
              n=0
                             √∞      !
                               [
                           µ      An = sup µ(An ).
                                                n
                                  n=0

  g) Si {An }∞ son medibles, cada An+1 ⊂ An y µ(A0 ) < +∞, entonces
             n=0
                            √∞      !
                               
                          µ       An = ´ µ(An ).
                                        ınf
                                                n
                                   n=0

   Por ejemplo, para probar el ultimo apartado aplicamos el anterior a los
                               ´
conjuntos A0  An .
    Los conjuntos de medida cero se llaman conjuntos nulos. Si A es un conjunto
nulo y B ⊂ A o bien B no es medible o bien es nulo. Sucede que siempre podemos
suponer que es nulo, en el sentido de que la σ-´lgebra donde est´ definida una
                                                a                 a
medida siempre se puede extender para que incluya a todos los subconjuntos de
los conjuntos nulos. Antes de probar esto conviene definir una medida completa
como una medida para la cual todos los subconjuntos de un conjunto nulo son
medibles (y por lo tanto nulos).
256                                                      Cap´
                                                            ıtulo 7. Teor´ de la medida
                                                                         ıa

Teorema 7.3 Sea X un conjunto µ : A −→ [0, +∞] una medida definida sobre
una σ–´lgebra de subconjuntos de X. Sea
      a

      B = {A ⊂ X | existen B, C ∈ A tales que B ⊂ A ⊂ C y µ(C  B) = 0}.

Entonces B es una σ-´lgebra de subconjuntos de X que contiene a A y µ se
                      a
extiende a una unica medida en B, que es completa.
               ´

                 ´
    Demostracion: Si A ∈ A es claro que A ∈ B. Basta tomar B = C = A.
As´ pues A ⊂ A, luego en particular ∅, X ∈ B.
  ı
    Si A ∈ B, sean B, C ∈ A tales que B ⊂ A ⊂ C y µ(C  B) = 0. Entonces
X  C ⊂ X  A ⊂ X  B, y claramente X  C, X  A ∈ A y
                     °                  ¢
                    µ (X  C)  (X  B) = µ(B  C) = 0.

Por lo tanto X A ∈ B. Para probar que B es una σ-´lgebra basta probar que la
                                                  a
uni´n numerable de elementos de B est´ en B. Sea, pues, {An }∞ una familia
   o                                 a                       n=0
de elementos de B. Sean {Bn }n y {Cn }n seg´n la definici´n de B. Entonces
                                           u            o
                               ∞
                               [             ∞
                                             [           ∞
                                                         [
                                     Bn ⊂         An ⊂         Cn ,
                               n=0          n=0          n=0

los conjuntos de los extremos est´n en A y
                                 a
                 √√ ∞      ! √∞         !!    √∞        !
                     [           [             [
           0≤µ           Cn         Bn    ≤µ    Cn  Bn = 0.
                         n=0           n=0                     n=0

               S
               ∞
Por lo tanto         An ∈ B. Esto prueba que B es una σ-´lgebra.
                                                        a
               n=0
    Si A ∈ B y B, C son los conjuntos dados por la definici´n, es claro que
                                                                  o
µ(B) = µ(C). Veamos que podemos extender la medida µ definiendo µ(A) =
µ(B) = µ(C). Es claro que esta es la unica extensi´n posible. En efecto,
                                             ´              o
si B 0 y C 0 tambi´n cumplen la definici´n, entonces B  B 0 ⊂ C 0  B 0 , luego
                   e                       o
µ(B  B 0 ) ≤ µ(C 0  B 0 ) = 0, de donde µ(B  B 0 ) = 0 y µ(B) = µ(B 0 ), luego B
y B 0 dan lugar al mismo valor de µ(A).
    Veamos que la extensi´n de µ que acabamos de definir es realmente una
                              o
medida. Para ello tomamos una familia {An }∞ de elementos de B disjuntos
                                                 n=0
dos a dos. Sean {Bn } y {Cn } elementos de A que satisfagan la definici´n de B.
                                                                           o
                                      S
                                      ∞        S
                                               ∞                     S
                                                                     ∞
Seg´n hemos visto, los conjuntos
    u                                    Bn y      Cn justifican que       An ∈ B y
                                        n=0         n=0                     n=0
es claro que los Bn son disjuntos dos a dos, luego
               √∞      !      √∞      !     ∞            ∞
                 [              [          X             X
             µ      An = µ         Bn =         µ(Bn ) =   µ(An ).
                   n=0                n=0           n=0               n=0

Es claro que la medida en B es completa, pues si A ∈ B es nulo y D ⊂ A,
entonces tomamos B, C ∈ A tales que B ⊂ A ⊂ C con µ(B) = µ(C) = 0.
Claramente ∅ ⊂ D ⊂ C y µ(C  ∅) = 0, luego D ∈ B.
7.1. Medidas positivas                                                         257

    La extensi´n construida en el teorema anterior se conoce como compleci´n
              o                                                           o
de µ. En vista de esto, normalmente podremos suponer sin p´rdida de genera-
                                                             e
lidad que trabajamos con medidas completas. Otra propiedad importante que
puede poseer una medida sobre un espacio topol´gico es la regularidad, que
                                                  o
definimos a continuaci´n.
                      o

Definici´n 7.4 Diremos que una medida µ en un espacio topol´gico X es regu-
          o                                                     o
lar si todos los abiertos son medibles, los subespacios compactos tienen medida
finita y para todo conjunto medible E se cumple

                    µ(E) = ´
                           ınf{µ(V ) | E ⊂ V, V abierto}

y
                  µ(E) = sup{µ(K) | K ⊂ E, K compacto}.

  Diremos que la medida es casi regular si la segunda propiedad se cumple al
menos cuando µ(E) < +∞ y cuando E es abierto.

    En definitiva una medida es regular si la medida de todo conjunto medible
puede aproximarse por la medida de un abierto mayor y de un compacto menor.
El concepto de medida casi regular lo introducimos por cuestiones t´cnicas, pero
                                                                   e
a continuaci´n probamos que en todos los espacios que nos van a interesar es
            o
equivalente a la regularidad.

   Diremos que un espacio topol´gico es σ-compacto si es uni´n numerable de
                               o                            o
conjuntos compactos. Por ejemplo, todo abierto Ω en Rn es σ-compacto, pues
puede expresarse como uni´n de los compactos
                         o

         Ωn = {x ∈ Ω | kxk ≤ n, d(x, Rn  Ω) ≥ 1/n},      n = 1, 2, 3, . . .

Teorema 7.5 Toda medida casi regular en un un espacio σ-compacto es regular.

   Demostracion: Supongamos que X es la uni´n de los compactos {Kn }∞ .
                ´                               o                      n=1
Sustituyendo cada Kn por su uni´n con los precedentes podemos suponer que si
                               o
m ≤ n entonces Km ⊂ Kn . Dado un conjunto de Borel B tal que µ(B) = +∞,
tenemos que
                                   ∞
                                   [
                             B=       B ∩ Kn ,
                                    n=1

y como la uni´n es creciente sup µ(B ∩ Kn ) = µ(B) = +∞. Dado R > 0 existe
             o
                              n
un n tal que µ(B ∩ Kn ) > R + 1 y, como µ es casi regular, B ∩ Kn tiene medida
finita y existe un compacto K ⊂ B ∩ Kn tal que µ(K) > R, lo que prueba que
µ es regular.

Ejercicio: Probar que la compleci´n de una medida regular es una medida regular.
                                 o
258                                           Cap´
                                                 ıtulo 7. Teor´ de la medida
                                                              ıa

7.2     Funciones medibles
   Si X es un espacio medida, a menudo tendremos que trabajar con subcon-
juntos de X definidos a partir de una aplicaci´n f : X −→ Y y necesitaremos
                                             o
garantizar que dichos conjuntos son medibles. Esto lo lograremos mediante el
concepto de aplicaci´n medible.
                    o

Definici´n 7.6 Si X es un espacio medida e Y es un espacio topol´gico, una
          o                                                        o
aplicaci´n f : X −→ Y es medible si las antiim´genes por f de los abiertos de
        o                                     a
Y son conjuntos medibles.

     Como las antiim´genes conservan las operaciones conjuntistas es muy f´cil
                      a                                                     a
probar que los conjuntos de Y cuyas antiim´genes son medibles forman una
                                               a
σ-´lgebra, que en el caso de una funci´n medible contiene a los abiertos, luego
   a                                   o
contendr´ a todos los conjuntos de Borel, es decir, una aplicaci´n es medible si
          a                                                     o
y s´lo si las antiim´genes de los conjuntos de Borel son conjuntos medibles. El
    o               a
siguiente caso particular nos interesar´ especialmente:
                                       a

Teorema 7.7 Una aplicaci´n f : X −→ [−∞, +∞] es medible si y s´lo si lo
                            o
                            £       §                         o
son todos los conjuntos f −1 ]x, +∞] , para todo x ∈ R.
                  ´
    Demostracion: Ya hemos comentado que los conjuntos con antiimagen
medible forman una σ-´lgebra A. Hemos de ver que A contiene a los abiertos
                       a
de [−∞, +∞]. Por hip´tesis contiene a los intervalos ]x, +∞], luego tambi´n a
                       o                                                    e
sus complementarios [−∞, x]. Todo intervalo [−∞, x[ es intersecci´n numerable
                                                                   o
de los intervalos [−∞, x + 1/n], luego tambi´n est´ en A. De aqu´ se sigue que
                                              e    a               ı
A contiene tambi´n a los intervalos ]x, y[ = ]x, +∞] ∩ [−∞, y[. Finalmente, todo
                  e
abierto de [−∞, +∞] se expresa como uni´n numerable de intervalos abiertos,
                                            o
luego est´ en A.
         a
    Es claro que la composici´n de una funci´n medible con una funci´n continua
                             o              o                       o
es una funci´n medible. Esto nos da, por ejemplo, que si f : X −→ [−∞, +∞]
             o
es medible, tambi´n lo es |f | y αf para todo n´mero real α, as´ como 1/f si f
                   e                           u                ı
no se anula.
    Para probar resultados an´logos cuando intervienen dos funciones (suma de
                               a
funciones medibles, etc.) usaremos la observaci´n siguiente:
                                               o

      Si los espacios topol´gicos Y , Z tienen bases numerables (como
                           o
      [−∞, +∞] y sus subespacios) y u : X −→ Y , v : X −→ Z son
      aplicaciones medibles, °
                             entonces la aplicaci´n u × v : X −→ Y × Z
                                        ¢        o
      dada por (u × v)(x) = u(x), v(x) es medible.

   Basta observar que los productos de abiertos b´sicos A × B forman una base
                                                   a
numerable de Y × Z, luego todo abierto de Y × Z es uni´n numerable de estos
                                                           o
conjuntos, por lo que es suficiente que sus antiim´genes sean medibles, pero
                                                     a
(u × v)−1 [A × B] = u−1 [B] ∩ v −1 [C].
   Ahora, por ejemplo, si u, v : X −→ R son aplicaciones medibles, tambi´n lo
                                                                           e
son f + g y f g, pues son la composici´n de u × v con la suma y el producto, que
                                       o
son continuas.
7.2. Funciones medibles                                                      259

    Nos interesa extender este resultado a funciones u, v : X −→ [−∞, +∞],
pero entonces tenemos el problema de que no es posible extender la suma y el
producto de modo que sean continuas en los puntos (+∞, −∞), (−∞, +∞) en
el caso de la suma y en los puntos (±∞, 0), (0, ±∞) en el caso del producto.
    Hacemos esto: definimos u + v de modo que +∞ − ∞ = 0 (por ejemplo) y
ahora observamos lo siguiente:

     Sea u : X −→ Y una funci´n medible, A un subconjunto medible de
                               o
     X e y ∈ Y . Entonces la funci´n v : X −→ Y que coincide con u
                                    o
     fuera de A y toma el valor y en A es medible.

   La raz´n es que
         o
                                      Ω
                                          u−1 [B]  A si y ∈ B
                                                           /
                         v −1 [B] =
                                          u−1 [B] ∪ A si y ∈ B

    As´ dadas u, v : X −→ [−∞, +∞] medibles tales que donde una vale +∞
      ı,
la otra no vale −∞, las modificamos para que valgan 0 donde toman valores
infinitos, las sumamos y obtenemos una funci´n medible, luego modificamos
                                                o
la suma para que tome el valor ∞ adecuado donde deba tomar dichos valores
(claramente en un conjunto medible), con lo que obtenemos una funci´n medible.
                                                                    o
Igualmente con el producto.
    Otra consecuencia del teorema sobre el producto cartesiano de funciones
medibles es que si tenemos dos funciones medibles u, v : X −→ [−∞, +∞], los
                        ©                   ™
conjuntos del estilo de x ∈ X | u(x) < v(x) son medibles (por ejemplo en este
                                                    ©              ™
caso se trata de la antiimagen por u × v del abierto (x, y) | x < y ).
   Dos operaciones definibles sobre todas las ™
                                  ©           funciones f, g : X −→ [−∞, +∞]
                                                                   ©        ™
son las dadas por (f ∨ g)(x) = m´x f (x), g(x) y (f ∧ g)(x) = m´ f (x), g(x) .
                                a                                ın
    Las funciones ∨, ∧ : [−∞, +∞] × [−∞, +∞] −→ [−∞, +∞] son ambas con-
tinuas, pues lo son trivialmente cuando se restringen a los cerrados determina-
dos por las condiciones x ≤ y e y ≤ x, respectivamente. Esto implica que si
f, g : X −→ [−∞, +∞] son medibles, tambi´n lo son f ∨ g y f ∧ g.
                                            e
   En particular si f : X −→ [−∞, +∞] es una funci´n medible, definimos las
                                                      o
funciones f + = f ∨ 0 y f − = −(f ∧ 0), llamadas parte positiva y parte negativa
de f , respectivamente.
   Tenemos que si f es medible tambi´n lo son f + y f − . El rec´
                                     e                          ıproco es cierto
porque claramente f = f + − f − . Adem´s |f | = f + + f − .
                                       a
   Seguidamente probaremos que la medibilidad se conserva al tomar l´
                                                                    ımites. Si
{an }∞ es una sucesi´n en [−∞, +∞], definimos sus l´
     n=0            o                               ımites superior e inferior
como
                l´ an = ´ sup an , l´ an = sup ´ an .
                 ım       ınf         ım            ınf
                     n         k≥0 n≥k          n       k≥0 n≥k

    En el cap´
             ıtulo III demostr´bamos que el l´
                              a              ımite superior de una sucesi´n es el
                                                                         o
supremo de sus puntos adherentes. Igualmente se prueba que el l´   ımite inferior
es el ´
      ınfimo de sus puntos adherentes.
260                                                Cap´
                                                      ıtulo 7. Teor´ de la medida
                                                                   ıa

   Una sucesi´n converge si y s´lo si tiene un unico punto adherente (su l´
              o                o               ´                          ımite),
por lo que {an }∞ converge si y s´lo si l´ an = l´ an y entonces
                n=0                o       ım       ım
                                             n            n


                               l´ an = l´ an = l´ an .
                                ım      ım      ım
                                n       n             n


   Si {fn }∞ es una sucesi´n de funciones fn : X −→ [−∞, +∞], definimos
           n=0             o
puntualmente las funciones sup fn , ´ fn , l´ fn y l´ fn . Si la sucesi´n es
                                    ınf     ım      ım                 o
                                    n    n        n           n
puntualmente convergente las dos ultimas funciones coinciden con la funci´n
                                 ´                                       o
l´
 ımite puntual l´ fn .
                ım
                 n

Teorema 7.8 Si las funciones fn son medibles, tambi´n lo son las funciones
                                                   e
sup fn , ´ fn , l´ fn y l´ fn .
         ınf     ım      ım
 n       n       n        n

               ´
     Demostracion: Claramente
                µ       ∂−1            ∞
                                       [
                            £       §     −1
                                             £     §
                 sup fn      ]x, +∞] =   fn ]x, +∞] ,
                      n
                                                 n=0

es medible. Igualmente se prueba con ´ınfimos y de aqu´ se deducen los resultados
                                                     ı
sobre l´
       ımites superiores e inferiores. En particular, el l´
                                                          ımite puntual de una
sucesi´n de funciones medibles es una funci´n medible.
      o                                    o
   Si X es un espacio medida y E es un subconjunto medible, entonces los
subconjuntos medibles de E forman una σ-´lgebra de subconjuntos de E y la
                                          a
medida de X restringida a esta σ-´lgebra es una medida en E. En lo sucesivo
                                 a
consideraremos a todos los subconjuntos medibles de los espacios medida como
espacios medida de esta manera.
                           S
                           ∞
     Notar que si X =           En es una descomposici´n de X en subconjuntos
                                                      o
                          n=0
medibles (no necesariamente disjuntos), entonces f : X −→ Y es medible si y
s´lo si lo son todas las funciones f |En , pues si f es medible y G es un abierto
 o
en Y , (f |En )−1 [G] = f −1 [G] ∩ En , luego (f |En )−1 [G] es medible, y si las f |En
son medibles, entonces f −1 [G] = (f |En )−1 [G], luego tambi´n es medible.
                                                                 e
    Si E es un subconjunto de X, su funci´n caracter´
                                         o          ıstica χE es medible si y
s´lo si lo es E.
 o
    Si extendemos una funci´n medible f : E −→ [−∞, +∞] asign´ndole el va-
                            o                                    a
lor 0 fuera de E, obtenemos una funci´n medible en X. Por ello identificaremos
                                     o
las funciones medibles f : E −→ [−∞, +∞] con las funciones medibles en X
que se anulan fuera de E. En particular identificaremos la restricci´n a E de
                                                                    o
una funci´n f : X −→ [−∞, +∞] con la funci´n f χE .
          o                                 o
    Los resultados que hemos dado son suficientes para garantizar que todas las
funciones que manejaremos y los conjuntos definidos por ellas son medibles. No
insistiremos en ello a menos que haya alguna dificultad inusual.
7.3. La integral de Lebesgue                                                    261

7.3       La integral de Lebesgue
    En todo espacio medida X podemos definir una integral que generaliza fuer-
temente a la integral de Riemann que estudiamos en el cap´  ıtulo anterior para
el caso de la recta real. M´s°adelante veremos que es posible definir una unica
                           a      ¢                                        ´
medida en R de modo que µ [a, b] = b − a. La integral asociada a esta medida
coincide con la integral de Riemann sobre las funciones en las que ´sta est´
                                                                      e        a
definida.
    La idea fundamental es que el papel que juegan los intervalos en la integral
de Riemann lo juegan los conjuntos medibles en el caso general. Al considerar
conjuntos m´s generales obtenemos muchas m´s funciones integrables, lo que
             a                                 a
se traduce en que la integrabilidad se conserva no s´lo por las operaciones al-
                                                    o
gebraicas (como en el caso de la integral de Riemann) sino tambi´n por pasos
                                                                  e
al l´
    ımite. En lugar de dar una definici´n de integral que muestre estas ideas,
                                        o
aprovecharemos las propiedades de convergencia para dar una definici´n r´pida.
                                                                     o a

Definici´n 7.9 Una funci´n simple en un espacio medida X es una funci´n
         o                 o                                                    o
medible s : X −→ [0, +∞[ que s´lo toma un n´mero finito de valores α1 , . . . , αn .
                                o            u
Si llamamos Ai = s−1 [αi ], entonces los conjuntos Ai son medibles disjuntos y
     Pn
s=      αi χAi .
    i=1

   La base de nuestra construcci´n de la integral ser´ el teorema siguiente:
                                o                    a

Teorema 7.10 Si X es un espacio medida y f : X −→ [0, +∞] es una funci´n
                                                                       o
medible, entonces existe una sucesi´n {sn }∞ de funciones simples en X tal
                                   o        n=1
que
                    0 ≤ s1 ≤ s2 ≤ · · · ≤ f y f = l´ sn .
                                                   ım
                                                         n

                  ´
   Demostracion: Para cada n´mero na-
                                    u
tural n > 0 y cada t ∈ R existe un unico´          2
k = kn (t) ∈ N tal que k/2n ≤ t < (k + 1)/2n .
Sea fn : [0, +∞] −→ [0, +∞] dada por                                      f2
             Ω
               kn (t)/2n si 0 ≤ t < n
   fn (t) =                                        1
               n          si n ≤ t ≤ +∞

La figura muestra la funci´n f2 . Claramente
                         o
fn toma un n´mero finito de valores y
            u

           f1 ≤ f2 ≤ f3 ≤ · · · ≤ I,                            1           2

donde I es la funci´n identidad I(t) = t. Como t − 1/2n < fn (t) ≤ t para
                      o
0 ≤ t ≤ n, es claro que {fn }∞ converge puntualmente a I.
                             n=1
    Sea sn = f ◦ fn . Claramente sn toma un n´mero finito de valores (a lo sumo
                                               u
los que toma fn ) y las antiim´genes de estos valores son las antiim´genes por f
                              a                                     a
de los intervalos donde los toma fn , luego son conjuntos medibles. Adem´s a

                              0 ≤ s1 ≤ s2 ≤ · · · ≤ f,
262                                                            Cap´
                                                                  ıtulo 7. Teor´ de la medida
                                                                               ıa

luego las funciones sn son simples y, tomando l´
                                               ımites, es obvio que la sucesi´n
                                                                             o
converge puntualmente a f .
                                                                        P
                                                                        n
Definici´n 7.11 Sea X un espacio medida y s =
       o                                                                      αi χAi una funci´n simple
                                                                                              o
                                                                        i=1
en X. Definimos la integral de s en X como
                     Z          Xn
                         s dµ =    αi µ(Ai ) ∈ [0, +∞],
                               X            i=1

con el convenio de que +∞ · 0 = 0.
                                                                                    P
                                                                                    n
      Si E es un subconjunto medible de X, entonces s|E =                                 αi χAi ∩E , donde
                                                                                    i=1
las funciones caracter´
                      ısticas se toman ahora sobre E. Por lo tanto
                           Z          Xn
                             s|E dµ =    ai µ(Ai ∩ E).
                                   E               i=1

                         P
                         n
Por otro lado sχE =            αi χAi ∩E (con las funciones caracter´
                                                                    ısticas en X), luego
                         i=1
concluimos que
                     Z                 Z                 n
                                                         X
                          s dµ =            sχE dµ =           αi µ(Ai ∩ E),
                      E                 X                i=1

es decir, que a efectos de integraci´n podemos adoptar consistentemente el con-
                                    o
venio explicado antes por el que identificamos la funci´n s|E con sχE .
                                                      o
  Ahora necesitamos el siguiente resultado t´cnico, que despu´s generalizare-
                                            e                e
mos notablemente.
Teorema 7.12 Sea X un espacio medida.
  a) Sea s una funci´nRsimple en X. Para cada subconjunto medible E de X
                    o
     definimos ν(E) = E s dµ. Entonces ν es una medida en X.
    b) Si s y t son funciones simples en X se cumple
                           Z               Z        Z
                              (s + t) dµ =   s dµ +   t dµ.
                                   X                     X                X

                                             P
                                             n
                ´
      Demostracion: a) Sea s =                     αi χAi . Claramente ν(∅) = 0. Sea E =
                                             i=1
S
∞
      Ej una uni´n disjunta de conjuntos medibles. Entonces
                o
j=1
                               n
                               X                             n
                                                             X          ∞
                                                                        X
               ν(E) =                  αi µ(Ai ∩ E) =              αi         µ(Ai ∩ Ej )
                               i=1                           i=1    j=1
                                ∞ n
                               XX                                  ∞
                                                                   X
                         =                  αi µ(Ai ∩ Ej ) =              ν(Ej ).
                                j=1 i=1                            j=1
7.3. La integral de Lebesgue                                                          263

                 P
                 n                     P
                                       m
   b) Sean s =         αi χAi y t =          βj χBj . Llamemos Eij = Ai ∩ Bj . As´ tanto
                                                                                 ı,
                 i=1                   j=1
s como t son constantes en los conjuntos Eij (s toma el valor αi y t el valor βj ).
Por lo tanto
Z                                                              Z        Z
    (s + t) dµ = (αi + βj )µ(Eij ) = αi µ(Eij ) + βj µ(Eij ) =   s dµ +      t dµ.
 Eij                                                                 Eij        Eij


   Como los conjuntos Eij son disjuntos dos a dos y su uni´n es X, la parte a)
                                                          o
nos da que la igualdad se cumple para integrales en X.
  En particular notamos que si s ≤ t son funciones simples en un espacio
medida X, entonces t − s tambi´n es una funci´n simple y
                              e              o
               Z           Z        Z               Z
                   s dµ ≤    s dµ +    (t − s) dµ =    t dµ.
                     X           X               X              X

   En particular se cumple que
          Z              Z
                        ©                                        ™
              t dµ = sup    s dµ | s es una funci´n simple, s ≤ t .
                                                 o
             X                 X

   Esto hace consistente la siguiente definici´n:
                                             o

Definici´n 7.13 Sea X un espacio medida y f : X −→ [0, +∞] una funci´n
        o                                                               o
medible. Definimos la integral de f como
     Z              Z
                   ©                                        ™
         f dµ = sup    s dµ | s es una funci´n simple, s ≤ f ∈ [0, +∞].
                                            o
       X                  X

   Observar que si E es un subconjunto medible de X, si s es una funci´n     o
simple en E por debajo de f |E , su extensi´n a X (nula fuera de E) es una
                                               o
funci´n simple bajo f χE , y la restricci´n a E de una funci´n simple en X bajo
     o                                   o                  o
f χE es una funci´n simple en E bajo f |E . De aqu´ se sigue que
                 o                                    ı
                              Z           Z
                                 f dµ =      f χE dµ,
                                   E              X

pues ambas integrales son el supremo del mismo conjunto de n´meros reales.
                                                              u
   Las propiedades siguientes son inmediatas a partir de la definici´n:
                                                                   o

Teorema 7.14 Sea X un espacio medida y E un subconjunto medible de X.
                                                       R        R
  a) Si 0 ≤ f ≤ g son funciones medibles en X, entonces X f dµ ≤ X g dµ.

  b) Si f ≥ 0 es una R
                     funci´n medible en X y A ⊂ B son subconjuntos medibles
                          o   R
     de X, entonces A f dµ ≤ B f dµ.
                                                               R
  c) Si f ≥ 0 es una funci´n medible en X y f |E = 0, entonces E f dµ = 0
                           o
     (aunque sea µ(E) = +∞).
264                                                           Cap´
                                                                 ıtulo 7. Teor´ de la medida
                                                                              ıa
                                                                                         R
  d) Si f ≥ 0 es una funci´n medible en X y µ(E) = 0, entonces
                          o                                                              E
                                                                                             f dµ = 0
     (aunque sea f |E = +∞).

   El resultado siguiente es uno de los m´s importantes del c´lculo integral:
                                         a                   a

Teorema 7.15 (de la convergencia mon´tona de Lebesgue) Sea X un
                                         o
espacio medida y {fn }∞ una sucesi´n de funciones medibles en X tal que
                      n=1         o

                    0 ≤ f1 ≤ f2 ≤ · · · ≤ f               y     f = l´ fn .
                                                                     ım
                                                                       n

Entonces f es medible y
                                  Z                   Z
                                      f dµ = l´
                                              ım              fn dµ.
                                  X               n   X
                                            R           R
               ´
   Demostracion: Por el teorema anterior X fn dµ ≤ X fn+1 dµ. Toda
sucesi´nRmon´tona creciente en [0, +∞] converge a su supremo, luego existe
      o     o
α = l´ X fn dµ ∈ [0, +∞].
     ım
      n
   Sabemos que f es medible por ser l´ R puntual de funciones medibles. De
                             R       ımite                R
nuevo por el teorema anterior X fn dµ ≤ X f dµ, luego α ≤ X f dµ.
   Sea s una funci´n simple s ≤ f y sea 0 < c < 1. Definimos
                  o

             En = {x ∈ X | fn (x) ≥ cs(x)},                    para n = 1, 2, 3, . . .

   Claramente E1 ⊂ E2 ⊂ E3 ⊂ · · ·, son conjuntos medibles y, seg´n veremos
              S                                                  u
enseguida, X = En .
                n
    En efecto, si x ∈ X y f (x) = 0, entonces x ∈ E1 y si, por el contrario,
f (x) > 0 entonces cs(x) < s(x) ≤ f (x), luego x ∈ En para alg´n n. Claramente
                                                              u
                       Z          Z              Z
                          fn dµ ≥      fn dµ ≥ c     s dµ.
                          X                  En                  En

   Ahora aplicamos el teorema 7.12 y el hecho de que la medida de la uni´n   o
de una sucesi´n creciente de conjuntos es el supremo de las medidas, con lo que
             o
obtenemos                Z                Z           Z
                α = l´
                     ım           fn dµ ≥ c l´
                                             ım               s dµ = c         s dµ.
                      n       X                   n   En                   X
                                                                   R
   Como esto es cierto para todo c < 1 podemos concluir que α ≥ X s dµ para
todaRfunci´n simple s ≤ f , luego tomando el supremo de estas integrales resulta
          o
α ≥ X f dµ, con lo que tenemos la igualdad buscada.
   El teorema de la convergencia mon´tona permite en particular reducir pro-
                                      o
piedades de la integral de funciones no negativas a propiedades de funciones
simples. Por ejemplo, ahora es inmediato que si f : X −→ [0, +∞] es medible y
α ∈ R, entonces             Z             Z
                                          αf dµ = α           f dµ.
                                      X                   X
7.3. La integral de Lebesgue                                                   265

   En efecto, por el teorema 7.10 existe una sucesi´n mon´tona de funciones
                                                   o       o
simples {sn }∞ convergente a f y, por el teorema anterior,
             n=1
                           Z             Z
                              f dµ = l´
                                      ım    sn dµ.
                                X               n     X
                                                 R              R
   Pero para funciones simples es inmediato que X αsn dµ = α X sn dµ, luego
tomando l´ımites tenemos el mismo resultado para f .
   Otra aplicaci´n importante es que la integral conserva las sumas, incluso las
                o
infinitas.

Teorema 7.16 Sea X un espacio medida y sea {fn }∞ una sucesi´n de fun-
                                                n=1         o
ciones no negativas medibles en X. Entonces
                              Z X
                                ∞                   XZ
                                                    ∞
                                      fn dµ =                 fn dµ.
                              X n=1                 n=1   X


                 ´
   Demostracion: Probaremos en primer lugar que si f y g son medibles y
no negativas, entonces
                      Z              Z        Z
                        (f + g) dµ =   f dµ +   g dµ.
                          X                     X               X

   Tomamos dos sucesiones mon´tonas {sn }∞ y {tn }∞ de funciones simples
                                o           n=1        n=1
convergentes a f y g respectivamente (existen por el teorema 7.10). R
                                     R                   R
   Por el teorema 7.12 sabemos que X (sn + tn ) dµ = X sn dµ + X tn dµ y,
tomando l´ımites, el teorema de la convergencia mon´tona nos da la igualdad
                                                     o
buscada. En el caso general sabemos, por lo que acabamos de probar, que
               Z X
                 k                  XZ
                                    k
                         fn dµ =               fn dµ para k = 1, 2, 3, . . .
                X n=1               n=1    X


                   P
                   k
   Las funciones         fn forman una sucesi´n mon´tona de funciones medibles,
                                             o     o
                   n=1
luego por el teorema de la convergencia mon´tona
                                           o
                              Z X
                                ∞                    ∞
                                                     X
                                          fn dµ =          fn dµ.
                               X n=1                 n=1




   Generalizamos ahora la primera parte del teorema 7.12.

Teorema 7.17 Sea X un espacio medida y f : X −→ [0, +∞] una Rfunci´n
                                                                   o
medible. Para cada subconjunto medible E de X definimos ν(E) = X f dµ.
Entonces ν es una medida en X.
266                                                           Cap´
                                                                 ıtulo 7. Teor´ de la medida
                                                                              ıa

                                                                         S
                                                                         ∞
                  ´
        Demostracion: Claramente ν(∅) = 0. Sea E =                             En una uni´n disjunta
                                                                                         o
                                                                         n=1
                                                                  P
                                                                  ∞
de conjuntos medibles. Es claro que f χE =                            f χEn . Aplicando el teorema
                                                              n=1
                                  P
                                  ∞
anterior queda ν(E) =                 ν(En ).
                              n=1

        Despu´s necesitaremos el hecho siguiente:
             e

Teorema 7.18 (Lema de Fatou) Sea X un espacio medida y sea {fn }∞
                                                                n=1
una sucesi´n de funciones medibles no negativas en X. Entonces
          o
                        Z                  Z
                           l´ fn dµ ≤ l´
                            ım          ım    fn dµ.
                                      X   n               n   X

              ´
  Demostracion: Sea gk = ´ fn . Entonces gk ≤ fn para n ≥ k, luego
                           ınf
R           R              n≥k
  g dµ ≤ ´
 X k
         ınf X fn dµ. Adem´s las funciones gk forman una sucesi´n mon´-
                          a                                    o     o
                n≥k
tona creciente que converge a l´ fn , luego por el teorema de la convergencia
                               ım
                                              n
mon´tona
   o
Z                Z             Z                 Z             Z
  l´ fn dµ = l´
   ım         ım   gk dµ = sup   gk dµ ≤ sup ´
                                             ınf   fn dµ = l´
                                                            ım   fn dµ.
    X    n            k   X               k≥1         X       k≥1 n≥k      X            n   X



   Ahora extendemos la integral a funciones medibles no necesariamente ma-
yores o iguales que 0.

Definici´n 7.19 Sea X un espacio medida y f : X −→ [−∞, +∞] una funci´n
         o                                                                   o
medible. Entonces f + y f − son funciones medibles no R
                                                      negativas y f = R + − f − .
                                                                      f
Diremos que f es integrable Lebesgue en X si tanto X f + dµ como X f − dµ
son finitas. En tal caso definimos la integral de Lebesgue de f como
                     Z          Z           Z
                        f dµ =     f + dµ −    f − dµ ∈ R.
                              X               X               X

    Llamaremos L1 (µ) al conjunto de las funciones integrables Lebesgue en X
respecto a la medida µ.
    Si una funci´n f es no negativa, entonces f − = 0 y su integral es la que ya
                o
ten´ıamos definida. Las propiedades siguientes son todas inmediatas a partir de
los resultados que ya hemos demostrado.

Teorema 7.20 Sea X un espacio medida y sean f , g : X −→ [−∞, +∞] fun-
ciones medibles.
                                    R
   a) f es integrable si y s´lo si X |f | dµ < +∞, y en tal caso
                            o
                                  ØZ       Ø Z
                                  Ø        Ø
                                  Ø f dµØ ≤     |f | dµ.
                                  Ø        Ø
                                                  X           X
7.3. La integral de Lebesgue                                                            267

  b) Si α, β ∈ R, y f , g son integrables, entonces αf + βg es integrable y
                      Z                     Z           Z
                         (αf + βg) dµ = α      f dµ + β    g dµ.
                        X                        X               X

                                                        R              R
  c) Si f ≤ g y ambas son integrables, entonces          X
                                                              f dµ ≤   X
                                                                           g dµ.

  d) Si E es un subconjunto medibleR de X y f es integrable en X, entonces f
                         R
     es integrable en E y E f dµ = X f χE dµ.

  e) Si E y F son subconjuntos medibles disjuntos de X, entonces la funci´n  o
     f es integrable en E ∪ F si y s´lo si lo es en E y en F y, en tal caso,
                                    o
                          Z            Z           Z
                               f dµ =      f dµ +    f dµ.
                             E∪F             E              F

                                                                            R
  f ) Si E es un subconjunto medible de X y f |E = 0, entonces               E
                                                                                 f dµ = 0.
                                                 R
  g) Si E es un subconjunto nulo de X, entonces E f dµ = 0.

  h) Si f es integrable en X, entonces el conjunto de los puntos donde f toma
     los valores ±∞ es nulo.

   (La propiedad e sale de aplicar el teorema 7.17 a las partes positiva y negativa
de f .)                                         R          R
   Algunas consecuencias: por d) vemos que E 1 dµ = X χE dµ = µ(E). Por
a) tenemos que si |f | ≤ g y g es integrable entonces f tambi´n lo es. Toda
                                                                   e
funci´n medible y acotada sobre un conjunto de medida finita es integrable.
      o
    Otra observaci´n de inter´s es la siguiente: si pasamos de una medida a su
                   o          e
compleci´n, es claro que las funciones simples para la primera lo son tambi´n
          o                                                                    e
para la segunda y las integrales coinciden. El teorema de la convergencia mon´-o
tona implica entonces que toda funci´n positiva integrable para una medida
                                        o
sigue si´ndolo para su compleci´n, y de aqu´ se sigue inmediatamente el resultado
        e                       o           ı
para funciones arbitrarias. De este modo la integral respecto a la compleci´n  o
extiende a la integral respecto a la medida de partida.
   Veamos ahora un teorema de convergencia v´lido para funciones medibles
                                            a
arbitrarias.

Teorema 7.21 (de la convergencia dominada de Lebesgue) Sea X un
espacio medida y sean {fn }∞ funciones medibles de X en [−∞, +∞] que
                           n=1
convergen puntualmente a una funci´n f . Si existe una funci´n integrable
                                  o                         o
g : X −→ [−∞, +∞] tal que |fn | ≤ g para todo n, entonces f es integrable
y                        Z           Z
                                  f dµ = l´
                                          ım         fn dµ.
                              X          n       X

   Se dice que las funciones fn est´n dominadas por g.
                                   a
268                                                Cap´
                                                      ıtulo 7. Teor´ de la medida
                                                                   ıa

                  ´
    Demostracion: Claramente |f | ≤ g, luego f es integrable. Puesto que
|fn − f | ≤ 2g, podemos aplicar el lema de Fatou a las funciones no negativas
2g − |fn − f |, con lo que obtenemos que
    Z               Z                     Z             Z
       2g dµ ≤ l´ım (2g − |fn − f |) dµ =   2g dµ + l´
                                                     ım (−|fn − f |) dµ.
      X          n   X                         X              n   X

    Es f´cil ver que el signo negativo sale del l´
        a                   R                    ımite, pero cambiando ´ste por un
                                                              R             e
l´
 ımite superior, as´ − l´ X |fn − f | dµ ≥ 0, o sea, l´ X |fn − f | dµ ≤ 0.
                   ı     ım                               ım
                          n         R                      nR
    Pero es obvio que 0 ≤ l´ X |fn − f | dµ ≤ l´ X |fn − f | dµ = 0, luego
                                ım                     ım
                                                        n
                                 n                       R
los l´
     ımites superior e inferior coinciden, luego l´ X |fn − f | dµ = 0. Ahora
                                                    ım
                                                     n
aplicamos que
            ØZ            Z        Ø ØZ               Ø Z
            Ø                      Ø Ø                Ø
            Ø fn dµ −              Ø = Ø (fn − f ) dµØ ≤
                              f dµØ Ø                           |fn − f | dµ,
            Ø                                         Ø
             X           X              X                     X

de donde se sigue el teorema.
    Cuando una propiedad se verifica para todos los puntos de un espacio medida
salvo los de un conjunto nulo se dice que la propiedad se verifica para casi todo
punto, y lo abreviaremos p.c.t.p. Veamos un ejemplo:

Teorema 7.22 RSi X es un espacio medida y f : X −→ [0, +∞] es una funci´n
                                                                       o
medible tal que X f dµ = 0, entonces f = 0 p.c.t.p. de X.

             ´
   Demostracion: Para cada natural n > 0 sea En = {x ∈ E | f (x) > 1/n}.
Entonces                    Z          Z
                 1
                   µ(En ) ≤     f dµ ≤    f dµ = 0,
                 n           En         X

luego µ(En ) = 0. La uni´n de los En es el conjunto E = {x ∈ X | f (x) > 0},
                         o
luego f = 0 salvo en los puntos del conjunto nulo E.
    Cuando digamos que una funci´n f : X −→ [−∞, +∞] est´ definida p.c.t.p.
                                  o                          a
esto significar´ que en realidad es f : X  E −→ [−∞, +∞], donde E es un
              a
conjunto nulo. Diremos que f es medible si loRes al extenderla a X tomando el
valor 0 en E. En tal caso podemos hablar de X f dµ definida como la integral
de dicha extensi´n.
                o
    Terminamos la secci´n con un importante teorema sobre integrales param´-
                       o                                                  e
tricas:

Teorema 7.23 Sea U abierto en Rn , K un espacio m´trico compacto, µ una
                                                 e
medida de Borel finita en K, sean f : U × K −→ R una funci´n continua y
                                                          o
g : K −→ R una funci´n medible acotada. Definamos F : U −→ Rn como la
                     o
funci´n dada por
     o                        Z
                          F (x) =       f (x, y)g(y) dµ(y),
                                    K
7.3. La integral de Lebesgue                                                           269

donde dµ(y) indica que la integral se realiza respecto a la variable y ∈ K, con-
siderando constante a x. Entonces F es continua en U y si existe
                                  ∂f
                                      : U × K −→ R
                                  ∂xi
y es continua en U × K, entonces existe
                              Z
                       ∂F         ∂f
                           =          (x, y)g(y) dµ(y)
                       ∂xi     K ∂xi
y es continua en U .
                   ´
   Demostracion: Tomemos x0 ∈ U y sea B una bola cerrada de centro
x0 contenida en U . Sea M una cota de g en K. Como f es uniformemente
continua en B × K, dado ≤ > 0 existe un δ > 0 tal que si kx − x0 k < δ,
entonces |f (x, y) − f (x0 , y)| < ≤/M µ(K), para todo y ∈ K. Por consiguiente, si
kx − x0 k < δ se cumple
                                  Z
            |F (x) − F (x0 )| ≤      |f (x, y) − f (x0 , y)| |g(y)| dµ(y) ≤ ≤.
                                   K
Esto prueba que F es continua en x0 .
    Supongamos ahora la hip´tesis de derivabilidad respecto a xi y sea ei el
                                o
i-´simo vector de la base can´nica de Rn . Como ∂f /∂xi es uniformemente
  e                              o
continua en B × K, existe un δ > 0 tal que si |h| < δ entonces
        Ø                                  Ø
        Ø ∂f                   ∂f          Ø      ≤
        Ø                                  Ø
        Ø ∂xi (x0 + hei , y) − ∂xi (x0 , y)Ø < M µ(K) , para todo y ∈ K.

    Si |h| < δ e y ∈ K, el teorema del valor medio nos da que existe un r ∈ R
tal que |r| < |h| y
                                                     ∂f
                   f (x0 + hei , y) − f (x0 , y) =       (x0 + rei , y)h.
                                                     ∂xi
(Notar que r depende de y.) Por consiguiente,
               Ø                                                            Ø
               Ø f (x0 + hei , y)g(y) − f (x0 , y)g(y)      ∂f              Ø
               Ø                                        −       (x0 , y)g(y)Ø
               Ø                   h                        ∂xi             Ø
                     Ø                                  Ø
                     Ø ∂f                    ∂f         Ø              ≤
                  =Ø                                    Ø
                     Ø ∂xi (x0 + rei , y) − ∂xi (x0 , y)Ø |g(y)| < µ(K) .
De aqu´ se sigue claramente que
       ı
             Ø                              Z                            Ø
             Ø F (x0 + hei ) − F (x0 )          ∂f                       Ø
             Ø                            −         (x0 , y)g(y) dµ(y)Ø < ≤.
             Ø              h                   ∂xi                      Ø
                                            K

siempre que |h| < δ, luego existe
                                                       Z
         ∂F              F (x0 + hei ) − F (x0 )             ∂f
             (x0 ) = l´
                      ım                         =               (x0 , y)g(y) dµ(y).
         ∂xi         h→0          h                      K   ∂xi
Adem´s la derivada es continua por la primera parte de este mismo teorema.
    a
270                                             Cap´
                                                   ıtulo 7. Teor´ de la medida
                                                                ıa

7.4     El teorema de Riesz
    Hasta ahora no tenemos ninguna medida de inter´s a la que aplicar los re-
                                                     e
sultados que acabamos de exponer. La construcci´n de medidas es el punto m´s
                                                 o                          a
delicado de toda la teor´ Puesto que el proceso es complicado cualquiera que
                        ıa.
sea el camino que tomemos, seguiremos uno que nos proporcionar´ un teorema
                                                                 a
notable de la teor´ de la medida, el teorema de representaci´n de Riesz. Nece-
                  ıa                                        o
sitamos unos preliminares topol´gicos sobre espacios localmente compactos.
                               o

Definici´n 7.24 Un espacio (de Hausdorff) X es localmente compacto si todo
        o
punto de X tiene una base de entornos compactos.

   As´ pues, si p es un punto de un espacio localmente compacto X y V es un
      ı
entorno abierto de p, existe un entorno compacto K ⊂ V . Por definici´n deo
entorno existe un abierto W tal que p ∈ W ⊂ K ⊂ V y claramente W ⊂ K es
un entorno compacto de p. En resumen, si X es localmente compacto, p ∈ X y
V es un abierto tal que p ∈ V , existe otro abierto W con clausura compacta tal
que p ∈ W ⊂ W ⊂ V .
   El teorema siguiente recoge un par de propiedades sencillas:

Teorema 7.25 Sea X un espacio de Hausdorff.
  a) Si K ⊂ X es compacto y p ∈ X  K, entonces existen abiertos disjuntos
     U y V tales que p ∈ U y K ⊂ V .
  b) Si X es localmente compacto, V es abierto en X y K ⊂ V es compacto,
     entonces existe un abierto W tal que K ⊂ W ⊂ W ⊂ V y W es compacto.

                       ´
    Demostracion: a) Por la propiedad de Hausdorff, para cada x ∈ K pode-
mos encontrar abiertos disjuntos Ux y Vx tales que p ∈ Ux y x ∈ Vx . Entonces
K est´ cubierto por los Vx , luego podemos tomar un subcubrimiento finito
         a
Vx1 , . . . , Vxn . Basta tomar como U la intersecci´n de los Uxi y como V la uni´n
                                                    o                            o
de los Vxi .
    b) Para cada x ∈ K existe un abierto Wx de clausura compacta tal que
x ∈ Wx ⊂ W x ⊂ V . Los abiertos Wx cubren a K. Tomamos un subcubrimiento
finito y llamamos W a la uni´n de sus miembros.
                                  o
   Si X es un espacio localmente compacto y f : X −→ R, llamaremos soporte
de f a la clausura del conjunto de puntos donde f toma el valor 0. Llamare-
mos Cc (X) al conjunto de las aplicaciones continuas f : X −→ R con soporte
compacto. Es claro que se trata de un subespacio vectorial de C(X).
   Usaremos las notaciones K ≺ f y f ≺ V para indicar que f : X −→ [0, 1],
f ∈ Cc (X), K es compacto, V es abierto, f toma el valor 1 en K y f toma el
valor 0 en X  V .

Teorema 7.26 (Lema de Urysohn) Sea X un espacio localmente compacto,
sea V un abierto y K ⊂ V compacto. Entonces existe f ∈ Cc (X) tal que
K ≺f ≺V.
7.4. El teorema de Riesz                                                               271

                ´
    Demostracion: Por el teorema anterior existe un abierto W0 de clausura
compacta tal que K ⊂ W0 ⊂ W 0 ⊂ V . Sea W1 = X. Aplicamos de nuevo el
teorema a W 0 ⊂ V , con lo que obtenemos un abierto W1/2 de clausura compacta
tal que
                 K ⊂ W0 ⊂ W 0 ⊂ W1/2 ⊂ W 1/2 ⊂ V ⊂ W1 .
   Dos nuevas aplicaciones del mismo teorema nos dan

 K ⊂ W0 ⊂ W 0 ⊂ W1/4 ⊂ W 1/4 ⊂ W1/2 ⊂ W 1/2 ⊂ W3/4 ⊂ W 3/4 ⊂ V ⊂ W1 .

   Inductivamente vamos obteniendo una familia de abiertos {Wr }r∈R , donde
R = {k/2i | i ∈ N, 0 ≤ k ≤ 2i }, de manera que si r < r0 < 1 son puntos de R,
entonces K ⊂ W r ⊂ Wr0 ⊂ V .
   Definimos g : X −→ [0, 1] mediante g(x) = ´          ınf{r ∈ R | x ∈ Wr }. As´
                                                                               ı
g[K] = {0} porque K ⊂ W0 y g[X  V ] = {1} porque Ur ∩ (X  V ) = ∅ si r < 1.
Basta probar que g es continua, pues entonces f = 1 − g cumple lo pedido.
   Sea x ∈ X y ≤ > 0. Si g(x) 6= 0 y g(x) 6= 1, entonces existen r, r0 ∈ R tales
que g(x) − ≤ < r < g(x) < r0 < g(x) + ≤, luego U = Wr0 − W r es un entorno de
x que cumple
                      g[U ] ⊂ [r, r0 ] ⊂ ]g(x) − ≤, g(x) + ≤[ .
   Si g(x) = 0 tomamos 0 = g(x) < r < g(x)+≤ y U = Wr cumple lo mismo. Si
g(x) = 1 tomamos g(x) − ≤ < r < g(x) y el U buscado es X  W r . En cualquier
caso obtenemos la continuidad de g en x.

Teorema 7.27 Si X es un espacio localmente compacto, V1 , . . . , Vn son abier-
tos de X y K ⊂ V1 ∪ · · · ∪ Vn es compacto, entonces existen funciones hi ≺ Vi
tales que h1 (x) + · · · + hn (x) = 1 para todo x ∈ K.

    Se dice que las funciones hi forman una partici´n de la unidad subordinada
                                                   o
a los abiertos dados.
                  ´
    Demostracion: Dado x ∈ K existe un i tal que x ∈ Vi . Existe un abierto
Wx de clausura compacta tal que x ∈ Wx ⊂ W x ⊂ Vi . Los abiertos Wx cubren
a K. Extraemos un subcubrimiento finito y llamamos Hi a la uni´n de todos
                                                                   o
los abiertos del subcubrimiento cuya clausura est´ en Vi . De este modo los Hi
                                                  a
son abiertos de clausura compacta que cubren a K y H i ⊂ Vi . Por el teorema
anterior existen funciones H i ≺ gi ≺ Vi . Definimos

   h1 = g1 ,   h2 = (1 − g1 )g2 ,   ...    hn = (1 − g1 )(1 − g2 ) · · · (1 − gn−1 )gn .

   Es claro que hi ≺ Vi y una simple inducci´n prueba que
                                            o

                     h1 + · · · + hn = 1 − (1 − g1 ) · · · (1 − gn ).

Es claro entonces que la suma vale 1 sobre los puntos de K, pues una de las
funciones gi ha de tomar el valor 1.
   Ya estamos en condiciones de demostrar el teorema de Riesz.
272                                            Cap´
                                                  ıtulo 7. Teor´ de la medida
                                                               ıa

Teorema 7.28 (Teorema de representaci´n de Riesz) Sea X un espacio
                                             o
localmente compacto y sea T : Cc (X) −→ R una aplicaci´n lineal tal que si
                                                          o
f ≥ 0 entonces T (f ) ≥ 0. Entonces existe una unica medida de Borel casi
                                                  ´
regular µ en X tal que para toda funci´n f ∈ Cc (X) se cumple
                                       o
                                        Z
                               T (f ) =   f dµ.
                                          X

                  ´
    Demostracion: Veamos primero la unicidad. Es claro que una medida
casi regular est´ completamente determinada por los valores que toma sobre los
                a
conjuntos compactos, luego basta probar que si µ1 y µ2 representan a T en el
sentido del teorema entonces µ1 (K) = µ2 (K) para todo compacto K.
    Por la regularidad existe un abierto V tal que K ⊂ V y µ2 (V ) < µ2 (K) + ≤.
Por el lema de Urysohn existe una funci´n K ≺ f ≺ V . Entonces
                                          o
                          Z             Z                    Z
             µ1 (K) =        χK dµ1 ≤       f dµ1 = T (f ) =    f dµ2
                           X             X                    X
                          Z
                     ≤       χV dµ2 = µ2 (V ) < µ2 (K) + ≤.
                           X

   Por consiguiente µ1 (K) ≤ µ2 (K) e igualmente se prueba la desigualdad
contraria.
   Para cada abierto V de X definimos µ(V ) = sup{T (f ) | f ≺ V }. Es obvio
que si V1 ⊂ V2 entonces µ(V1 ) ≤ µ(V2 ), luego si definimos

          µ(E) = ´
                 ınf{µ(V ) | E ⊂ V, V abierto},      para todo E ⊂ X,

es claro que la medida de un abierto es la misma en los dos sentidos en que la
tenemos definida.
    Aunque hemos definido la medida de cualquier conjunto, ´sta s´lo cumplir´
                                                                e     o          a
las propiedades de las medidas al restringirla a una cierta σ-´lgebra que contiene
                                                              a
a la σ-´lgebra de Borel. Concretamente, definimos MF como la familia de
        a
subconjuntos E de X tales que µ(E) < +∞ y

                  µ(E) = sup{µ(K) | K ⊂ E, K compacto}.

Definimos M como la familia de todos los E ⊂ X tales que E ∩ K ∈ MF
para todo compacto K. Probaremos que M es una σ-´lgebra que contiene a la
                                                    a
σ-´lgebra de Borel y que la restricci´n de µ a M es una medida casi regular.
  a                                  o
Veremos tambi´n que MF est´ formada por los conjuntos de M de medida finita.
              e             a
Dividimos la prueba en varios pasos.
  1) Si {Ei }∞ son subconjuntos de X, entonces
             i=1
                             √∞ !         ∞
                               [         X
                           µ      Ei ≤      µ(Ei ).
                                   i=1        i=1
7.4. El teorema de Riesz                                                                 273

     Probamos primero que si V1 y V2 son abiertos µ(V1 ∪ V2 ) ≤ µ(V1 ) + µ(V2 ).
     Tomemos g ≺ V1 ∪ V2 arbitraria. Por el teorema 7.27 existen funciones h1
     y h2 tales que hi ≺ Vi y h1 + h2 vale 1 sobre los puntos del soporte de g.
     Por lo tanto hi g ≺ Vi , g = h1 g + h2 g.

                      T (g) = T (h1 g) + T (h2 g) ≤ µ(V1 ) + µ(V2 ).

     Como esto se cumple para toda g ≺ V1 + V2 , concluimos la desigualdad
     buscada.

     Podemos suponer que µ(Ei ) < +∞ para todo i, o la desigualdad que
     queremos probar se cumplir´ trivialmente. Dado ≤ > 0 la definici´n
                                   ıa                                      o
     de µ implica que existen abiertos Vi que contienen a Ei de modo que
     µ(Vi ) < µ(Ei ) + ≤/2i . Sea V la uni´n de todos los Vi y tomemos f ≺ V .
                                          o
     Como f tiene soporte compacto en realidad f ≺ V1 ∪ · · · ∪ Vn para alg´n
                                                                           u
     n, luego
                                                                     ∞
                                                                     X
          T (f ) ≤ µ(V1 ∪ · · · ∪ Vn ) ≤ µ(V1 ) + · · · + µ(Vn ) ≤         µ(Ei ) + ≤.
                                                                     i=1


     Como esto vale para toda f ≺ V , resulta que
                                           ∞
                                           X
                                 µ(V ) ≤         µ(Ei ) + ≤.
                                           i=1


     Ahora bien, la uni´n de los Ei est´ contenida en V , y la funci´n µ es
                       o               a                            o
     claramente mon´tona por su definici´n, luego
                    o                   o
                            √∞ !         ∞
                              [         X
                          µ      Ei ≤      µ(Ei ) + ≤.
                                  i=1            i=1

     Como esto vale para todo ≤ tenemos la desigualdad buscada.
  2) Si K es compacto, entonces K ∈ MF y µ(K) = ´  ınf{T (f ) | K ≺ f }. En
     particular los compactos tienen medida finita.
     Si K ≺ f y 0 < α < 1, sea Vα = {x ∈ X | f (x) > α}. Entonces K ⊂ Vα y
     si g ≺ Vα se cumple αg ≤ f . Por lo tanto

                  µ(K) ≤ µ(Vα ) = sup{T (g) | g ≺ Vα } ≤ α−1 T (f ).

     Si hacemos que α tienda a 1 concluimos que µ(K) ≤ T (f ) y es obvio que
     K est´ en MF .
           a
     Dado ≤ > 0 existe un abierto V tal que K ⊂ V y µ(V ) < µ(K) + ≤. Existe
     una funci´n K ≺ f ≺ V , luego
              o

                           µ(K) ≤ T (f ) ≤ µ(V ) < µ(K) + ≤,

     lo que prueba que µ(K) = ´
                              ınf{T (f ) | K ≺ f }.
274                                                 Cap´
                                                       ıtulo 7. Teor´ de la medida
                                                                    ıa

  3) MF contiene a todos los abiertos de medida finita.
     Sea V un abierto de medida finita y α un n´mero real tal que α < µ(V ).
                                                  u
     Existe f ≺ V tal que α < T (f ). Si W es un abierto que contiene al soporte
     K de f entonces f ≺ W , luego T (f ) ≤ µ(W ), luego T (f ) ≤ µ(K). As´    ı
     hemos encontrado un compacto K ⊂ V tal que α < µ(K), lo que prueba
     que V ∈ MF .
                                                          S
                                                          ∞
  4) Si {Ei }∞ son elementos disjuntos de MF , y E =
             i=1                                            Ei entonces
                                                                 i=1
                                             ∞
                                             X
                                 µ(E) =            µ(Ei ).
                                             i=1

      Si adem´s µ(E) < +∞ entonces E ∈ MF .
             a
      Veamos primero que si K1 y K2 son compactos disjuntos µ(K1 ∪ K2 ) =
      µ(K1 ) + µ(K2 ). Dado ≤ > 0 existe K1 ≺ f ≺ X  K2 . Por el paso 2) existe
      g tal que K1 ∪ K2 ≺ g y T (g) < µ(K1 ∪ K2 ) + ≤. Claramente K1 ≺ f g y
      K2 ≺ (1 − f )g, luego

          µ(K1 ) + µ(K2 ) ≤ T (f g) + T (g − f g) = T (g) < µ(K1 ∪ K2 ) + ≤,

      luego tenemos µ(K1 ) + µ(K2 ) ≤ µ(K1 ∪ K2 ) y el paso 1) nos da la otra
      desigualdad.
      Pasando al caso general, de nuevo por 1) basta probar una desigualdad.
      ´
      Esta es trivial y µ(E) = +∞, luego podemos suponer que E tiene medida
      finita. Fijado ≤ > 0, puesto que Ei ∈ MF existen compactos Hi ⊂ Ei tales
      que µ(Hi ) > µ(Ei ) − ≤/2i . Sea Kn = H1 ∪ · · · ∪ Hn . Entonces
                                       n
                                       X                 n
                                                         X
                    µ(E) ≥ µ
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis
Analisis

Analisis

  • 1.
    Carlos Ivorra Castillo ´ ´ ANALISIS MATEMATICO
  • 3.
    Si una cantidadno negativa fuera tan peque˜a n que resultara menor que cualquier otra dada, cier- tamente no podr´ ser sino cero. A quienes pregun- ıa tan qu´ es una cantidad infinitamente peque˜a en e n matem´ticas, nosotros respondemos que es, de he- a cho, cero. As´ pues, no hay tantos misterios ocultos ı en este concepto como se suele creer. Esos supues- tos misterios han convertido el c´lculo de lo infinita- a mente peque˜o en algo sospechoso para mucha gente. n Las dudas que puedan quedar las resolveremos por completo en las p´ginas siguientes, donde explicare- a mos este c´lculo. a Leonhard Euler
  • 5.
    ´ Indice General Introducci´n o ix Cap´ ıtulo I: Topolog´ıa 1 1.1 Espacios topol´gicos . . . . . . o . . . . . . . . . . . . . . . . . . . 1 1.2 Bases y subbases . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3 Productos y subespacios . . . . . . . . . . . . . . . . . . . . . . . 11 1.4 Algunos conceptos topol´gicos . o . . . . . . . . . . . . . . . . . . . 15 1.5 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.6 L´ımites de funciones . . . . . . . . . . . . . . . . . . . . . . . . . 34 1.7 Convergencia de sucesiones . . . . . . . . . . . . . . . . . . . . . 43 1.8 Sucesiones y series num´ricas . e . . . . . . . . . . . . . . . . . . . 48 Cap´ ıtulo II: Compacidad, conexi´n y completitud o 59 2.1 Espacios compactos . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.2 Espacios conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 2.3 Espacios completos . . . . . . . . . . . . . . . . . . . . . . . . . . 79 2.4 Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . 83 2.5 Aplicaciones a las series num´ricas . . . . . . . . e . . . . . . . . . 86 2.6 Espacios de funciones . . . . . . . . . . . . . . . . . . . . . . . . 92 2.7 Ap´ndice: El teorema de Baire . . . . . . . . . . e . . . . . . . . . 96 Cap´ ıtulo III: C´lculo diferencial de una variable a 101 3.1 Derivaci´n . . . . . . . . . . . . . . . . . . . . . o . . . . . . . . . . 101 3.2 C´lculo de derivadas . . . . . . . . . . . . . . . a . . . . . . . . . . 104 3.3 Propiedades de las funciones derivables . . . . . . . . . . . . . . . 108 3.4 La diferencial de una funci´n . . . . . . . . . . o . . . . . . . . . . 115 3.5 El teorema de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.6 Series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 123 3.7 La funci´n exponencial . . . . . . . . . . . . . . o . . . . . . . . . . 127 3.8 Las funciones trigonom´tricas . . . . . . . . . . e . . . . . . . . . . 133 3.9 Primitivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 3.10 Ap´ndice: La trascendencia de e y π . . . . . . e . . . . . . . . . . 148 v
  • 6.
    vi ´ INDICE GENERAL Cap´ ıtulo IV: C´lculo diferencial de varias variables a 157 4.1 Diferenciaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 o 4.2 Propiedades de las funciones diferenciables . . . . . . . . . . . . . 164 4.3 Curvas parametrizables . . . . . . . . . . . . . . . . . . . . . . . 175 Cap´ ıtulo V: Introducci´n a las variedades diferenciables o 195 5.1 Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 5.2 Espacios tangentes, diferenciales . . . . . . . . . . . . . . . . . . 203 5.3 La m´trica de una variedad . . . . . . . . . . . . . . . . e . . . . . 210 5.4 Geod´sicas . . . . . . . . . . . . . . . . . . . . . . . . . e . . . . . 215 5.5 Superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 5.6 La curvatura de Gauss . . . . . . . . . . . . . . . . . . . . . . . . 223 Cap´ ıtulo VI: Ecuaciones diferenciales ordinarias 231 6.1 La integral de Riemann . . . . . . . . . . . . . . . . . . . . . . . 232 6.2 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . 238 6.3 Ecuaciones diferenciales de orden superior . . . . . . . . . . . . . 246 Cap´ ıtulo VII: Teor´ de la medida ıa 253 7.1 Medidas positivas . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 7.2 Funciones medibles . . . . . . . . . . . . . . . . . . . . . . . . . . 258 7.3 La integral de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . 261 7.4 El teorema de Riesz . . . . . . . . . . . . . . . . . . . . . . . . . 270 7.5 La medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . 278 Cap´ ıtulo VIII: Teor´ de la medida II ıa 287 8.1 Producto de medidas . . . . . . . . . . . . . . . . . . . . . . . . . 287 8.2 Espacios Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 8.3 Medidas signadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 8.4 Derivaci´n de medidas . . . . . . . o . . . . . . . . . . . . . . . . . 309 8.5 El teorema de cambio de variable . . . . . . . . . . . . . . . . . . 313 Cap´ ıtulo IX: Formas diferenciales 321 9.1 Integraci´n en variedades . . . . . . . o . . . . . . . . . . . . . . . 321 9.2 El ´lgebra exterior . . . . . . . . . . . a . . . . . . . . . . . . . . . 330 9.3 El ´lgebra de Grassmann . . . . . . . a . . . . . . . . . . . . . . . 337 9.4 Algunos conceptos del c´lculo vectorial a . . . . . . . . . . . . . . . 348 Cap´ ıtulo X: El teorema de Stokes 359 10.1 Variedades con frontera . . . . . . . . . . . . . . . . . . . . . . . 359 10.2 La diferencial exterior . . . . . . . . . . . . . . . . . . . . . . . . 365 10.3 El teorema de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . 369 10.4 Aplicaciones del teorema de Stokes . . . . . . . . . . . . . . . . . 376 10.5 Las f´rmulas de Green . . . . . . . . . . o . . . . . . . . . . . . . . 387 10.6 El teorema de Stokes con singularidades . . . . . . . . . . . . . . 390 10.7 Ap´ndice: Algunas f´rmulas vectoriales e o . . . . . . . . . . . . . . 395
  • 7.
    ´ INDICE GENERAL vii Cap´ ıtulo XI: Cohomolog´ de De Rham ıa 399 11.1 Grupos de cohomolog´ . . . . . . . ıa . . . . . . . . . . . . . . . . 399 11.2 Homotop´ . . . . . . . . . . . . . . ıas . . . . . . . . . . . . . . . . 402 11.3 Sucesiones exactas . . . . . . . . . . . . . . . . . . . . . . . . . . 408 11.4 Aplicaciones al c´lculo vectorial . . . a . . . . . . . . . . . . . . . . 415 Cap´ ıtulo XII: Funciones Harm´nicas o 419 12.1 El problema de Dirichlet sobre una bola . . . . . . . . . . . . . . 420 12.2 Funciones holomorfas . . . . . . . . . . . . . . . . . . . . . . . . . 423 12.3 Funciones subharm´nicas . . . . . o . . . . . . . . . . . . . . . . . 438 12.4 El problema de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . 441 Cap´ ıtulo XIII: Aplicaciones al electromagnetismo 447 13.1 Electrost´tica . . . . . . . . . . . . . . . . . . . . a . . . . . . . . . 447 13.2 Magnetost´tica . . . . . . . . . . . . . . . . . . . a . . . . . . . . . 450 13.3 Las ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . 455 13.4 La ecuaci´n de ondas . . . . . . . . . . . . . . . . o . . . . . . . . . 461 13.5 Soluciones de las ecuaciones de Maxwell . . . . . . . . . . . . . . 470 Bibliograf´ ıa 477 ´ Indice de Materias 478
  • 9.
    Introducci´n o En el siglo XVII Newton y Leibniz descubren independientemente el an´lisisa matem´tico o c´lculo infinitesimal, una potent´ a a ısima herramienta que revolucion´ o el tratamiento matem´tico de la f´ a ısica y la geometr´ y que m´s tarde impreg- ıa, a nar´ las m´s diversas ramas de la matem´tica, como la estad´ ıa a a ıstica o la teor´ıa de n´meros. u Esencialmente, el c´lculo infinitesimal consist´ por una parte en analizar a ıa o descomponer la dependencia entre varias magnitudes estudiando el compor- tamiento de unas al variar o diferenciar levemente otras (lo que constitu´ el ıa c´lculo diferencial) y por otra parte en integrar los resultados diferenciales para a obtener de nuevo resultados globales sobre las magnitudes en consideraci´n (elo llamado c´lculo integral). a Es dif´ que un lector que no tenga ya algunas nociones de c´lculo pueda ıcil a entender cabalmente el p´rrafo anterior, pero las nuevas ideas eran a´n m´s a u a dif´ıciles de entender de la pluma de sus descubridores. El primer libro de texto que se public´ con el fin de explicarlas sistem´ticamente fue el “An´lisis” del o a a marqu´s de l’Hˆpital. Veamos algunos pasajes: e o La parte infinitamente peque˜a en que una cantidad variable es au- n mentada o disminuida de manera continua, se llama la diferencial de esta cantidad. Siguiendo la notaci´n leibniziana, L’Hˆpital explica que la letra d se usa para o o representar uno de estos incrementos infinitamente peque˜os de una magnitud, n de modo que dx representa un incremento diferencial de la variable x, etc. En ning´n momento se precisa qu´ debemos entender por un aumento infi- u e nitamente peque˜o de una cantidad, pero en compensaci´n se presentan varias n o reglas para tratar con diferenciales. Por ejemplo: Post´lese que dos cantidades cuya diferencia es una cantidad infini- u tamente peque˜a pueden intercambiarse una por la otra; o bien (lo n que es lo mismo) que una cantidad que est´ incrementada o dismi- a nuida solamente en una cantidad infinitamente menor, puede consi- derarse que permanece constante. As´ por ejemplo, si analizamos el incremento infinitesimal que experimenta ı, un producto xy cuando incrementamos sus factores, obtenemos d(xy) = (x + dx)(y + dy) − xy = x dy + y dx + dxdy = x dy + y dx, ix
  • 10.
    x Introducci´n o donde hemos despreciado el infinit´simo doble dxdy porque es infinitamente e menor que los infinit´simos simples x dy e y dx. e Es f´cil imaginar que estos razonamientos infinitesimales despertaron sospe- a chas y pol´micas. Baste citar el t´ e ıtulo del panfleto que en 1734 public´ el obispo o de Berkeley: El analista, o discurso dirigido a un matem´tico infiel, donde se a examina si los objetos, principios e inferencias del an´lisis moderno a est´n formulados de manera m´s clara, o deducidos de manera m´s a a a evidente, que los misterios religiosos y los asuntos de la fe. En esta fecha el c´lculo infinitesimal ten´ ya m´s de medio siglo de historia. a ıa a La raz´n por la que sobrevivi´ inmune a estas cr´ o o ıticas y a la vaguedad de sus fundamentos es que muchos de sus razonamientos infinitesimales terminaban en afirmaciones que no involucraban infinit´simos en absoluto, y que eran confir- e mados por la f´ ısica y la geometr´ Por ejemplo, consideremos la circunferencia ıa. formada por los puntos que satisfacen la ecuaci´n o x2 + y 2 = 25. Aplicando la regla del producto que hemos “demostrado” antes al caso en que los dos factores son iguales obtenemos que dx2 = 2x dx e igualmente ser´ dy 2 = a 2y dy. Por otra parte, d25 = 0, pues al incrementar la variable x la constante 25 no se ve incrementada en absoluto. Si a esto a˜adimos que la diferencial de n una suma es la suma de las diferenciales resulta la ecuaci´n diferencial o 2x dx + 2y dy = 0, de donde a su vez dy x =− . dx y Esto significa que si tomamos, por ejemplo, el punto (3, 4) de la circun- ferencia e incrementamos infinitesimalmente su coordenada x, la coordenada y disminuir´ en 3/4 dx. Notemos que esto es falso para cualquier incremento finito a de la variable x, por peque˜o que sea, pues si valiera para incrementos suficien- n temente peque˜os resultar´ que la circunferencia contendr´ un segmento de la n ıa ıa recta 3 y − 4 = − (x − 3), 4 lo cual no es el caso. Vemos que ´sta se comporta igual que la circunferencia para e variaciones infinitesimales de sus variables alrededor del punto (3, 4), aunque difiere de ella para cualquier variaci´n finita. La interpretaci´n geom´trica es o o e que se trata de la recta tangente a la circunferencia por el punto (3, 4). El argumento ser´ nebuloso y discutible, pero lo aplastante del caso es que a nos proporciona un m´todo sencillo para calcular la tangente a una circunferen- e cia por uno cualquiera de sus puntos. De hecho el m´todo se aplica a cualquier e curva que pueda expresarse mediante una f´rmula algebraica razonable, lo que o
  • 11.
    xi supera con crecesa las t´cnicas con las que contaba la geometr´ anal´ e ıa ıtica antes del c´lculo infinitesimal. a A lo largo del siglo XIX la matem´tica emprendi´ un proceso de funda- a o mentaci´n que termin´ con una teor´ formal donde todos los conceptos est´n o o ıa a perfectamente definidos a partir de unos conceptos b´sicos, los cuales a su vez a est´n completamente gobernados por unos axiomas precisos. Las ambig¨edades a u del c´lculo infinitesimal fueron el motor principal de este proceso. En los a˜os a n sesenta del siglo XX se descubri´ que una delicada teor´ l´gica, conocida como o ıa o an´lisis no est´ndar permite definir rigurosamente cantidades infinitesimales a a con las que fundamentar el c´lculo a la manera de Leibniz y L’Hˆpital, pero no a o es ´se el camino habitual ni el que nosotros vamos a seguir. Lo normal es erra- e dicar los infinit´simos de la teor´ pero no as´ el formalismo infinitesimal. En e ıa, ı ocasiones los s´ımbolos dy, dx aparecen en ciertas definiciones “en bloque”, sin que se les pueda atribuir un significado independiente, como cuando se define la derivada de una funci´n y = y(x) mediante o dy y(x + ∆x) − y(x) = l´ ım . dx ∆x→0 ∆x De este modo, el cociente de diferenciales tiene el mismo significado que para Leibniz, en el sentido de que al calcularlo obtenemos el mismo n´mero o u la misma funci´n que ´l obten´ pero con la diferencia de que ya no se trata de o e ıa, un cociente de diferenciales, no es un cociente de nada. La definici´n anterior o nos permite hablar de dy/dx, pero no de dy o de dx. No obstante se puede ir m´s lejos y dar una definici´n adecuada de dx y dy a o de modo que se pueda probar la equivalencia dy = f (x) ⇐⇒ dy = f (x) dx. dx Es algo parecido al paso de una relaci´n algebraica como xy 2 = x + 4y 3 , o donde x e y son, digamos, n´meros reales indeterminados, a la misma expresi´n u o entendida como una igualdad de polinomios, donde ahora x e y son indetermina- das en un sentido matem´tico muy preciso. Por ejemplo, seg´n una definici´n a u o habitual del anillo de polinomios R[x, y], la indeterminada x es la aplicaci´no de los pares de n´meros naturales en R dada por x(1, 0) = 1 y x(i, j) = 0 u para cualquier otro par, es decir, algo que en nada recuerda a “un n´mero real u indeterminado”. Al introducir las formas diferenciales muchos libros modernos insisten en recalcar que los objetos como dx son “puramente formales” —como las indeter- minadas en un anillo de polinomios—, que no tienen un singificado intr´ ınseco, sino que simplemente son objetos dise˜ados para que se comporten seg´n ciertas n u reglas que se adaptan a las propiedades de las derivadas e integrales. Llegan incluso a perdir disculpas por lo excesivamente vac´ y abstracta que resulta la ıa teor´ en torno a ellos. Explican que, pese a ello, merece la pena el esfuerzo de ıa familiarizarse con ella porque al final se ve su gran (y sorprendente) utilidad. En este libro insistiremos en todo momento en que las diferenciales tienen un significado intr´ınseco muy concreto e intuitivo, y trataremos de evidenciarlo
  • 12.
    xii Introducci´n o desde el primer momento, de modo que —sin desmerecer la profundidad de la teor´ıa— su utilidad y buen comportamiento no resulta sorprendente en absoluto. Su interpretaci´n no ser´, naturalmente la de incrementos infinitesimales, sino o a la de aproximaciones lineales, aceptables —al menos— en los alrededores de los puntos. Esta interpretaci´n los mantiene en todo momento muy cerca de los o hipot´ticos infinit´simos en los que est´n inspirados. e e a Muchos libros de f´ ısica contin´an trabajando con razonamientos infinitesi- u males al estilo antiguo, los cuales les permiten llegar r´pidamente y con fluidez a a resultados importantes a cambio de sacrificar el rigor l´gico. Aqu´ adopta- o ı remos una posici´n intermedia entre los dos extremos: seremos rigurosos, pero o no formalistas, daremos pruebas sin saltos l´gicos, pero llegaremos a resultados o enunciados de tal modo que resulten “transparentes” en la pr´ctica, emulando a as´ la fluidez de los razonamientos infinitesimales. ı Hay un caso en que los razonamientos infinitesimales est´n plenamente jus- a tificados, y es cuando se trata de motivar una definici´n. Por ejemplo, a partir o de la ley de gravitaci´n de Newton para dos masas puntuales puede “deducirse” o que el campo gravitatorio generado por una distribuci´n continua de masa con- o tenida en un volumen V con densidad ρ viene dado por Z ρ(y) E(x) = −G (x − y) dy. V kx − yk3 La deducci´n no puede considerarse una demostraci´n matem´tica, pues o o a la f´rmula anterior tiene el status l´gico de una definici´n, luego es un sin- o o o sentido tratar de demostrarla. En todo caso se podr´ complicar la definici´n ıa o sustituy´ndola por otra que mostrara claramente su conexi´n con las masas e o puntuales y despu´s probar que tal definici´n es equivalente a la anterior. La e o prueba se basar´ en la posibilidad de aproximar integrales por sumas finitas ıa y con toda seguridad ser´ bastante prolija. Esta opci´n ser´ absurda tanto ıa o ıa desde el punto de vista formal (¿para qu´ sustituir una definici´n sencilla por e o otra complicada?) como desde el punto de vista f´ ısico (¿para qu´ entrar en e disquisiciones ≤–δ que acabar´n donde todos sabemos que tienen que acabar?). a En cambio, un argumento en t´rminos de infinit´simos convence a cualquiera e e de que esta definici´n es justamente la que tiene que ser.1 o Del mismo modo podemos convencernos de que el potencial gravitatorio determinado por una distribuci´n de masa ρ debe ser o Z ρ(y) V (x) = −G dy. V kx − yk Ahora bien, de aceptar ambos hechos tendr´ıamos como consecuencia la re- laci´n E = −∇V , pues el potencial de un campo de fuerzas es por definici´n o o la funci´n que cumple esto. Sin embargo esto ya no es una definici´n, sino una o o afirmaci´n sobre dos funciones que podr´ ser falsa en principio y que, por con- o ıa siguiente, requiere una demostraci´n. Muchos libros de f´ o ısica dan por sentado 1A cualquiera menos a un formalista puro, quien no le encontrar´ sentido, pero es que, a como alguien dijo, “un formalista es alguien incapaz de entender algo a menos que carezca de significado.”
  • 13.
    xiii este hecho, incurriendoas´ en una laguna l´gica que nosotros cubriremos. As´ ı o ı pues, cuando el lector encuentre en las p´ginas que siguen un razonamiento en a t´rminos de diferenciales deber´ observar que o bien desemboca en una defi- e a nici´n o bien est´ completamente avalado por teoremas previos que justifican o a las manipulaciones de diferenciales. Este libro ha sido escrito siguiendo cuatro gu´ principales: ıas • Presentar los resultados m´s importantes del an´lisis matem´tico real. a a a Concretamente abordamos el c´lculo diferencial e integral de una y va- a rias variables reales, las ecuaciones diferenciales ordinarias y, aunque no hay ning´n cap´ u ıtulo dedicado espec´ıficamente a ellas, estudiamos varias ecuaciones en derivadas parciales: la ecuaci´n de Lagrange, la de Poisson, o la ecuaci´n de ondas y las ecuaciones de Maxwell. Tambi´n planteamos o e la ecuaci´n del calor, si bien no entramos en su estudio. Aunque, como o ya hemos dicho, nos centramos en el an´lisis real, estudiamos las series a de potencias complejas, introduciendo en particular la exponencial y las funciones trigonom´tricas complejas, y a partir de la teor´ de funciones e ıa harm´nicas y el teorema de Stokes demostramos algunos de los resultados o fundamentales sobre las funciones holomorfas (esencialmente el teorema de los residuos). • Justificar todas las definiciones, sin caer en la falacia formalista de que la l´gica nos da derecho a definir lo que queramos como queramos sin o tener que dar explicaciones. Pensemos, por ejemplo, en la definici´n de o a ´rea de una superficie. Muchos libros se limitan a definirla mediante una f´rmula en t´rminos de expresiones coordenadas, sin m´s justificaci´n que o e a o la demostraci´n de su consistencia (de que no depende del sistema de o coordenadas elegido). Otros aceptan como “motivaci´n” el teorema de o cambio de variables, considerando que es natural tomar como definici´n o de cambio de variables entre un abierto de Rn y un abierto en una variedad lo que entre dos abiertos de Rn es un teorema nada trivial. No podemos resumir nuestro enfoque en pocas l´ ıneas, pero invitamos al lector a que preste atenci´n a la justificaci´n de ´ste y muchos otros conceptos. o o e • Mostrar la fundamentaci´n del c´lculo infinitesimal cl´sico, en lugar de o a a sustituirlo por otro c´lculo moderno mucho m´s r´ a a ıgido y abstracto. Por ejemplo, a la hora de desarrollar una teor´ de integraci´n potente es ıa o imprescindible introducir la teor´ de la medida abstracta y sus resultados ıa m´s importantes. A ello dedicamos los cap´ a ıtulos VII y VIII, pero tras ello, en el cap´ ıtulo siguiente, envolvemos toda esta teor´ abstracta en ıa otra mucho m´s el´stica y natural, la teor´ de formas diferenciales, que a a ıa requiere a la anterior como fundamento, pero que termina por ocultarla, de modo que a partir de cierto punto es muy rara la ocasi´n en que se o hace necesario trabajar expl´ıcitamente con las medidas y sus propiedades. • Mostrar la aplicaci´n y la utilidad de los resultados te´ricos que presen- o o tamos. Las primeras aplicaciones tienen que ver con la geometr´ pero ıa, paulatinamente van siendo desplazadas por aplicaciones a la f´ ısica. En
  • 14.
    xiv Introducci´n o la medida de lo posible hemos evitado presentar las aplicaciones como animales enjaulados en un zool´gico, es decir, desvinculadas de sus con- o textos naturales, de manera que den m´s la impresi´n de an´cdotas que a o e de verdaderos ´xitos del c´lculo infinitesimal. En el caso de la f´ e a ısica va- mos introduciendo los conceptos fundamentales (velocidad, aceleraci´n, o fuerza, energ´ etc.) seg´n van siendo necesarios, de modo que de estas ıa, u p´ginas podr´ extraerse una sucinta introducci´n a la f´ a ıa o ısica. En lo to- cante a la geometr´ por los motivos explicados en el segundo punto nos ıa, hemos restringido a trabajar con subvariedades de Rn , es decir, hemos evi- tado la definici´n abstracta de variedad para tener as´ una interpretaci´n o ı o natural de los espacios tangentes y su relaci´n con la variedad. En algu- o nos ejemplos concretos necesitamos que el lector est´ familiarizado con la e geometr´ proyectiva, la teor´ de las secciones c´nicas y otros puntos de ıa ıa o la geometr´ pre-diferencial. Los hemos marcado con un asterisco. Nin- ıa guno de estos ejemplos es necesario para seguir el resto del libro. Uno de ellos, el del plano proyectivo, lo usamos de forma no rigurosa para ilustrar la necesidad de una definici´n m´s general de variedad, mostrando que o a muchos de los conceptos que definimos para una subvariedad de R3 son aplicables formalmente al caso del plano proyectivo, si bien la teor´ de ıa que disponemos no nos permite justificar esta aplicaci´n. o De los puntos anteriores no debe leerse entre l´ ıneas una cierta aversi´n hacia o el an´lisis abstracto. Al contrario, creemos que este libro puede ser continuado a de forma natural en muchas direcciones: la teor´ espectral, la teor´ de distri- ıa ıa buciones, el an´lisis de Fourier, el c´lculo variacional, la teor´ de funciones de a a ıa variable compleja, la geometr´ diferencial y la topolog´ general. ıa ıa Por citar algunos ejemplos, nosotros probamos que el problema de Dirichlet tiene soluci´n en una familia muy amplia de abiertos para unas condiciones de o frontera dadas, pero la resoluci´n expl´ o ıcita en casos concretos requiere de la transformada de Fourier, que en general se aplica a muchas otras ecuaciones en derivadas parciales. Por otra parte, la transformada de Fourier permite des- componer una onda en su espectro continuo de frecuencias. Cuando se estudia la soluci´n de la ecuaci´n de ondas en abiertos distintos de todo R3 aparecen o o las ondas estacionarias, que llevan al an´lisis espectral y, en casos particulares, a a la teor´ de series de Fourier o de las funciones de Bessel entre otras. Los ıa problemas de gravitaci´n o electromagnetismo que involucran masas y cargas o puntuales o corrientes el´ctricas unidimensionales pueden unificarse con los pro- e blemas que suponen distribuciones continuas de masas, cargas y corrientes a trav´s de la teor´ de distribuciones. e ıa Tampoco nos gustar´ que las comparaciones que hemos hecho con otros ıa libros se interpreten a modo de cr´ıtica. Tan s´lo queremos hacer hincapi´ en que o e nuestros objetivos son distintos a los de muchos otros libros. Somos conscientes de que nuestro prop´sito de justificar las definiciones m´s all´ de una motivaci´n o a a o m´s o menos dudosa nos ha llevado a seguir caminos mucho m´s profundos y a a laboriosos que los habituales, por lo que, a pesar de su car´cter autocontenido a en lo tocante a topolog´ y an´lisis, es muy dif´ que este libro sea de utilidad ıa a ıcil a un lector que no cuente ya con una cierta familiaridad con la materia. Por ello
  • 15.
    xv es obvio queun libro cuya finalidad principal sea did´ctica, o bien que quiera a profundizar m´s que nosotros en f´ a ısica o geometr´ diferencial, deber´ pasar por ıa a alto muchas sutilezas en las que nosotros nos hemos detenido. Comentamos, para terminar, que al lector se le supone unicamente unos cier- ´ tos conocimientos de ´lgebra, especialmente de ´lgebra lineal, y algunas nociones a a elementales de geometr´ (salvo para los ejemplos marcados con un asterisco). ıa Espor´dicamente ser´n necesarios conocimientos m´s profundos, como para la a a a prueba de la trascendencia de e y π, sobre todo en la de π, o al estudiar el concepto de orientaci´n, donde para interpretar el signo del determinante de o una biyecci´n af´ usamos que el grupo especial lineal de Rn est´ generado por o ın a las transvecciones. Ninguno de estos hechos se necesita despu´s.e
  • 17.
    Cap´ ıtulo I Topolog´ ıa La topolog´ puede considerarse como la forma m´s abstracta de la geo- ıa a metr´ ıa. El concepto principal que puede definirse a partir de la estructura topol´gica es el de aplicaci´n continua, que viene a ser una transformaci´n rea- o o o lizada sin cortes o saltos bruscos o, dicho de otro modo, que transforma puntos pr´ximos en puntos pr´ximos. Los resultados topol´gicos son aplicables tanto a o o o la geometr´ propiamente dicha como a la descripci´n de otros muchos objetos ıa o m´s cercanos a la teor´ de conjuntos general, si bien aqu´ nos centraremos en a ıa ı la vertiente geom´trica. Al combinarla con el ´lgebra obtendremos el c´lculo e a a diferencial, que constituye la herramienta m´s potente para el estudio de la a geometr´ ıa. 1.1 Espacios topol´gicos o Seg´n acabamos de comentar, una aplicaci´n continua es una aplicaci´n que u o o transforma puntos pr´ximos en puntos pr´ximos. Nuestro objetivo ahora es o o definir una estructura matem´tica en la que esta afirmaci´n pueda convertirse a o en una definici´n rigurosa. En primer lugar conviene reformularla as´ una apli- o ı: caci´n continua es una aplicaci´n que transforma los puntos de alrededor de un o o punto dado en puntos de alrededor de su imagen. En efecto, si cortamos una cir- cunferencia por un punto P para convertirla en un segmento, la transformaci´no no es continua, pues los puntos de alrededor de P se transforman unos en los puntos de un extremo del segmento y otros en los puntos del otro extremo, luego no quedan todos alrededor del mismo punto. En cambio, podemos transformar continuamente (aunque no biyectivamente) una circunferencia en un segmento sin m´s que aplastarla. a 1
  • 18.
    2 Cap´ ıtulo 1. Topolog´ ıa Una forma de dar rigor al concepto de “puntos de alrededor” de un punto dado es a trav´s de una distancia. Veremos que no es lo suficientemente general, e pero s´ muy representativa. La formalizaci´n algebraica de la geometr´ eucl´ ı o ıa ıdea se lleva a cabo a trav´s de Rn . Su estructura vectorial permite definir los puntos, e rectas, planos, etc. y a ´sta hay que a˜adirle la estructura m´trica derivada del e n e producto escalar: Xn xy = xi yi . i=1 A partir de ´l se definen los dos conceptos fundamentales de la geometr´ e ıa m´trica: la longitud de un vector y el ´ngulo entre dos vectores. En efecto, la e a longitud de un vector es la norma v u n √ uX kxk = xx = t x2 , i i=1 y el ´ngulo α que forman dos vectores no nulos x, y viene dado por a xy cos α = . kxk kyk Estas estructuras son demasiado particulares y restrictivas desde el punto de vista topol´gico. La medida de ´ngulos es un sinsentido en topolog´ y la de o a ıa, longitudes tiene un inter´s secundario, pues no importan las medidas concretas e sino tan s´lo la noci´n de proximidad. En primer lugar generalizaremos el o o concepto de producto escalar para admitir como tal a cualquier aplicaci´n que o cumpla unas m´ ınimas propiedades: Definici´n 1.1 Usaremos la letra K para referirnos indistintamente al cuerpo o R de los n´meros reales o al cuerpo C de los n´meros complejos. Si α ∈ K, u u la notaci´n α representar´ al conjugado de α si K = C o simplemente α = α o ¯ a ¯ si K = R. Si H es un K-espacio vectorial, un producto escalar en H es una aplicaci´n · : H × H −→ K que cumple las propiedades siguientes: o a) x · y = y · x, b) (x + y) · z = x · z + y · z, c) (αx) · y = α(x · y), d) x · x ≥ 0 y x · x = 0 si y s´lo si x = 0, o para todo x, y, z ∈ H y todo α ∈ K. Notar que a) y b) implican tambi´n la propiedad distributiva por la derecha: e x · (y + z) = x · y + x · z. Un espacio prehilbertiano es un par (H, ·), donde H es un K-espacio vectorial y · es un producto escalar en H. En la pr´ctica escribiremos simplemente H en a lugar de (H, ·). Si H es un espacio prehilbertiano, definimos su norma asociada como la √ aplicaci´n k k : H −→ R dada por kxk = x · x. o
  • 19.
    1.1. Espacios topol´gicos o 3 Ejemplo Un producto escalar en el espacio Kn viene dado por x · y = x1 y1 + · · · + xn yn . ¯ ¯ p De este modo, kxk = |x1 |2 + · · · + |xn |2 . Teorema 1.2 Sea H un espacio prehilbertiano y sean x, y ∈ H. Entonces a) (desigualdad de Schwarz) |x · y| ≤ kxk kyk. b) (desigualdad triangular) kx + yk ≤ kxk + kyk. Demostracion: a) Sean A = kxk2 , B = |x · y| y C = kyk2 . Existe un ´ n´mero complejo α tal que |α| = 1 y α(y · x) = B. Para todo n´mero real r se u u cumple 0 ≤ (x − rαy) · (x − rαy) = x · x − rα(y · x) − rα(x · y) + r2 y · y. ¯ ¯ Notar que α(x · y) = B = B, luego A − 2Br + Cr2 ≥ 0. Si C = 0 ha de ¯ ser B = 0, o de lo contrario la desigualdad ser´ falsa para r grande. Si C > 0 ıa tomamos r = B/C y obtenemos B 2 ≤ AC. b) Por el apartado anterior: kx + yk2 = (x + y) · (x + y) = x · x + x · y + y · x + y · y ≤ kxk2 + 2kxk kyk + kyk2 = (kxk + kyk)2 . Notar que x · y + y · x es un n´mero real, luego u x · y + y · x ≤ |x · y + y · x| ≤ |x · y| + |y · x|. La norma permite definir una distancia entre puntos con la que formalizar el concepto de proximidad que nos interesa, pero para ello no es necesario que la norma provenga de un producto escalar. Conviene aislar las propiedades de la norma que realmente nos hacen falta para admitir como tales a otras muchas aplicaciones: Definici´n 1.3 Si E es un espacio vectorial sobre K, una norma en E es una o aplicaci´n k k : E −→ [0, +∞[ que cumpla las propiedades siguientes: o a) kvk = 0 si y s´lo si v = 0. o b) kv + wk ≤ kvk + kwk. c) kα vk = |α| kvk, para v, w ∈ E y todo α ∈ K.
  • 20.
    4 Cap´ ıtulo 1. Topolog´ ıa Un espacio normado es un par (E, k k) en estas condiciones. En la pr´ctica a escribiremos E, sin indicar expl´ ıcitamente la norma. Es inmediato comprobar que la norma de un espacio prehilbertiano es una norma en el sentido general de la definici´n anterior. En particular Kn es un o espacio normado con la norma del ejemplo anterior, que recibe el nombre de norma eucl´ıdea. El teorema siguiente nos da otras dos normas alternativas. La prueba es elemental. Teorema 1.4 Kn es un espacio normado con cualquiera de estas normas: v n u n X uX © Ø ™ kxk1 = |xi |, kxk2 = t |xi |2 , kxk∞ = m´x |xi | Ø i = 1, . . . , n . a i=1 i=1 Notar que para n = 1 las tres normas coinciden con el valor absoluto. El hecho de que estas tres aplicaciones sean normas permite obtener un resultado m´s general: a Teorema 1.5 Sean E1 , . . . , En espacios normados. Entonces las aplicaciones siguientes son normas en E = E1 × · · · × En . v n u n X uX © Ø ™ kxk1 = kxi k, kxk2 = t kxi k2 , kxk∞ = m´x kxi k Ø i = 1, . . . , n . a i=1 i=1 Adem´s se cumplen las relaciones: kxk∞ ≤ kxk2 ≤ kxk1 ≤ nkxk∞ . a ´ Demostracion: Tenemos kxki = k(kx1 k, . . . , kxn k)ki para i = 1, 2, ∞. Usando el teorema anterior se ve inmediatamente que son normas. v v u n uX p uX u n X kxk∞ = kxk2 ≤ t∞ kxi k2 = kxk2 ≤ t kxi k2 + 2 kxi k kxj k i=1 i=1 i<j v√ !2 u n u X n X = t kxi k = kxk1 ≤ kxk∞ = nkxk∞ . i=1 i=1 Notemos tambi´n que las normas del teorema 1.4 coinciden con las construi- e das mediante este ultimo teorema a partir del valor absoluto en K. ´ Ø Ø Ejercicio: Probar que en un espacio normado se cumple Økxk − kykØ ≤ kx − yk. Como ya hemos comentado, desde un punto de vista topol´gico el unico o ´ inter´s de las normas es que permiten definir la distancia entre dos puntos como e d(x, y) = kx − yk. Sin embargo, a efectos topol´gicos no es necesario que una o distancia est´ definida de este modo. e
  • 21.
    1.1. Espacios topol´gicos o 5 Definici´n 1.6 Una distancia o m´trica en un conjunto M es una aplicaci´n o e o d : M × M −→ [0, +∞[ que cumpla las propiedades siguientes a) d(x, y) = 0 si y s´lo si x = y, o b) d(x, y) = d(y, x), c) d(x, z) ≤ d(x, y) + d(y, z), para todos los x, y, z ∈ M . Un espacio m´trico es un par (M, d) donde M es un conjunto y d una dis- e tancia en M . Como en el caso de espacios normados escribiremos M en lugar de (M, d). Todo espacio normado E es un espacio m´trico con la distancia definida e por d(x, y) = kx − yk. Las propiedades de la definici´n de norma implican o inmediatamente las de la definici´n de distancia. En particular en Kn tenemos o definidas tres distancias: v n u n X uX d1 (x, y) = |xi − yi |, d2 (x, y) = t (xi − yi )2 , i=1 i=1 © Ø ™ d∞ (x, y) = m´x |xi − yi | Ø 1 ≤ i ≤ n . a M´s en general, estas f´rmulas permiten definir distancias en cualquier pro- a o ducto finito de espacios m´tricos. La prueba del teorema siguiente es muy e sencilla a partir de los teoremas 1.4 y 1.5. Teorema 1.7 Sean M1 , . . . , Mn espacios m´tricos. Sea M = M1 × · · · × Mn . e Entonces las aplicaciones d1 , d2 , d∞ : M × M −→ [0, +∞[ definidas como sigue son distancias en M : n X d1 (x, y) = d(xi , yi ), i=1 v u n uX d2 (x, y) = t d(xi , yi )2 , i=1 d∞ (x, y) = m´x{d(xi , yi ) | 1 ≤ i ≤ n}. a Adem´s se cumplen las relaciones d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ≤ n d∞ (x, y). a Definici´n 1.8 Sea M un espacio m´trico, x ∈ M y ≤ > 0 (en estos casos o e sobreentenderemos ≤ ∈ R). Definimos B≤ (x) = {y ∈ M | d(x, y) < ≤} (Bola abierta de centro x y radio ≤). 0 B≤ (x) = {y ∈ M | d(x, y) ≤ ≤} (Bola cerrada de centro x y radio ≤).
  • 22.
    6 Cap´ ıtulo 1. Topolog´ ıa La figura muestra las bolas de centro (0, 0) y radio 1 para las tres m´tricas e que hemos definido en R2 . d2 d1 d∞ Las bolas con otros centros son trasladadas de ´stas, y las bolas de otros e radios son homot´ticas. Las bolas abiertas se diferencian de las cerradas en que e las primeras no contienen los puntos del borde. El inter´s de las bolas reside e en que una bola de centro un punto P contiene todos los puntos de alrededor de P , por peque˜o que sea su radio. Observar que el concepto de “puntos de n alrededor” es un tanto escurridizo: Seg´n lo que acabamos de decir, ning´n u u punto en particular (distinto de P ) est´ alrededor de P , pues siempre podemos a tomar una bola suficientemente peque˜a como para que deje fuera a dicho punto. n Esto significa que no podemos dar sentido a la afirmaci´n “Q es un punto de o alrededor de P ”, pero lo importante es que s´ tiene sentido decir “El conjunto A ı contiene a todos los puntos de alrededor de P ”. Esto sucede cuando A contiene una bola cualquiera de centro P , y entonces diremos que A es un entorno de P . Aunque el concepto de entorno podr´ tomarse como concepto topol´gico b´sico, ıa o a lo cierto es que es m´s c´modo partir de un concepto “m´s regular”: diremos a o a que un conjunto es abierto si es un entorno de todos sus puntos. Los conjuntos abiertos tienen las propiedades que recoge la definici´n siguiente: o Definici´n 1.9 Una topolog´ en un conjunto X es una familia T de subconjun- o ıa tos de X a cuyos elementos llamaremos abiertos, tal que cumpla las propiedades siguientes: a) ∅ y X son abiertos. b) La uni´n de cualquier familia de abiertos es un abierto. o c) La intersecci´n de dos abiertos es un abierto. o Un espacio topol´gico es un par (X, T), donde X es un conjunto y T es una o topolog´ en X. En la pr´ctica escribiremos simplemente X en lugar de (X, T). ıa a Sea M un espacio m´trico. Diremos que un conjunto G ⊂ M es abierto si e para todo x ∈ G existe un ≤ > 0 tal que B≤ (x) ⊂ G. Es inmediato comprobar que los conjuntos abiertos as´ definidos forman una topolog´ en M , a la que ı ıa llamaremos topolog´ inducida por la m´trica. En lo sucesivo consideraremos ıa e siempre a los espacios m´tricos como espacios topol´gicos con esta topolog´ e o ıa. En el p´rrafo previo a la definici´n de topolog´ hemos definido “abierto” a o ıa como un conjunto que es entorno de todos sus puntos. Puesto que formalmente
  • 23.
    1.1. Espacios topol´gicos o 7 hemos definido los espacios topol´gicos a partir del concepto de abierto, ahora o hemos de definir el concepto de entorno. Si X es un espacio topol´gico, U ⊂ X y x ∈ U , diremos que U es un entorno o de x si existe un abierto G tal que x ∈ G ⊂ U . Es inmediato comprobar que en un espacio m´trico U es entorno de x si y e s´lo si existe un ≤ > 0 tal que B≤ (x) ⊂ U , es decir, si y s´lo si U contiene a o o todos los puntos de alrededor de x, tal y como hab´ ıamos afirmado. Ejemplo El intervalo I = [0, 1], visto como subconjunto de R, es entorno de todos sus puntos excepto de sus extremos 0 y 1, pues si 0 < x < 1 siempre podemos tomar ≤ = m´ ın{x, 1 − x} y entonces B≤ (x) = ]x − ≤, x + ≤[ ⊂ I. En cambio, I no contiene todos los puntos de alrededor de 1, pues toda bola de centro 1 contiene puntos a la derecha de 1 y ninguno de ellos est´ en I. El caso a del 0 es similar. En particular I no es abierto. El teorema siguiente recoge las propiedades b´sicas de los entornos. La a prueba es inmediata. Teorema 1.10 Sea X un espacio topol´gico, x ∈ X y Ex la familia de todos o los entornos de x. a) Un conjunto G ⊂ X es abierto si y s´lo si es un entorno de todos sus puntos. o b1) X ∈ Ex . b2) Si U ∈ Ex y U ⊂ V ⊂ X entonces V ∈ Ex . b3) Si U , V ∈ Ex entonces U ∩ V ∈ Ex . Puesto que los abiertos pueden definirse a partir de los entornos, es obvio que si dos topolog´ sobre un mismo conjunto tienen los mismos entornos entonces ıas son iguales. Las desigualdades del teorema 1.7 implican que una bola para una de las tres distancias definidas en el producto M contiene otra bola del mismo centro para cualquiera de las otras distancias. De aqu´ se sigue que ı un subconjunto de M es entorno de un punto para una distancia si y s´lo o si lo es para las dem´s, y de aqu´ a su vez que las tres distancias definen la a ı misma topolog´ en el producto. En particular, las tres distancias que tenemos ıa definidas sobre Kn definen la misma topolog´ a la que llamaremos topolog´ ıa, ıa usual o topolog´ eucl´ ıa ıdea en Kn . ´ Esta es una primera muestra del car´cter auxiliar de las distancias en topo- a log´ Cuando queramos probar un resultado puramente topol´gico sobre Rn ıa. o podremos apoyarnos en la distancia que resulte m´s conveniente, sin que ello su- a ponga una p´rdida de generalidad. La distancia d2 es la distancia eucl´ e ıdea y por lo tanto la m´s natural desde un punto de vista geom´trico, pero las distancias a e d1 y d∞ son formalmente m´s sencillas y a menudo resultan m´s adecuadas. a a
  • 24.
    8 Cap´ ıtulo 1. Topolog´ ıa Ejemplo Es f´cil definir una distancia en Kn que induzca una topolog´ dis- a ıa tinta de la usual. De hecho, si X es un conjunto cualquiera podemos considerar la distancia d : X × X −→ R dada por Ω 1 si x 6= y, d(x, y) = 0 si x = y Es f´cil ver que efectivamente es una distancia y para todo punto x se cumple a que B1 (x) = {x}, luego {x} es un entorno de x, luego es un abierto y, como toda uni´n de abiertos es abierta, de hecho todo subconjunto de X es abierto. o La m´trica d recibe el nombre de m´trica discreta y la topolog´ que induce es e e ıa la topolog´ discreta. Un espacio topol´gico cuya topolog´ sea la discreta es un ıa o ıa espacio discreto. En un espacio discreto un punto no tiene m´s punto a su alrededor que ´l a e mismo. Esta topolog´ es la m´s adecuada para conjuntos como N o Z, pues, ıa a efectivamente, un n´mero entero no tiene alrededor a ning´n otro. u u Las bolas abiertas de un espacio m´trico son abiertas. Esto es f´cil de ver e a intuitivamente, pero el mero hecho de que las hayamos llamado as´ no justifica ı que lo sean: Teorema 1.11 Las bolas abiertas de un espacio m´trico son conjuntos abiertos. e ´ Demostracion: Sea B≤ (x) una bola abierta y sea y ∈ B≤ (x). Entonces d(x, y) < ≤. Sea 0 < δ < ≤ − d(x, y). Basta probar que Bδ (y) ⊂ B≤ (x). Ahora bien, si z ∈ Bδ (y), entonces d(z, x) ≤ d(z, y) + d(y, x) < δ + d(x, y) < ≤, luego en efecto z ∈ B≤ (x). 1.2 Bases y subbases Hemos visto que la topolog´ en un espacio m´trico se define a partir de las ıa e bolas abiertas. El concepto de “bola abierta” no tiene sentido en un espacio topol´gico arbitrario en el que no tengamos dada una distancia, sin embargo o hay otras familias de conjuntos que pueden representar un papel similar. Definici´n 1.12 Sea X un espacio topol´gico. Diremos que una familia B de o o abiertos de X (a los que llamaremos abiertos b´sicos) es una base de X si para a todo abierto G de X y todo punto x ∈ G existe un abierto B ∈ B tal que x ∈ B ⊂ G. Si x ∈ X diremos que una familia E de entornos (abiertos) de x (a los que llamaremos entornos b´sicos de x) es una base de entornos (abiertos) de x si a todo entorno de x contiene un elemento de E. En estos t´rminos la propia definici´n de los abiertos m´tricos (junto con el e o e hecho de que las bolas abiertas son realmente conjuntos abiertos) prueba que las bolas abiertas son una base de la topolog´ m´trica, y tambi´n es claro que ıa e e
  • 25.
    1.2. Bases ysubbases 9 las bolas abiertas de centro un punto x forman una base de entornos abiertos de x. Pero estos conceptos son mucho m´s generales. Pensemos por ejemplo que a otras bases de un espacio m´trico son las bolas abiertas de radio menor que 1, las e bolas abiertas de radio racional, etc. Cualquier base determina completamente la topolog´ y en cada ocasi´n puede convenir trabajar con una base distinta. ıa o Teorema 1.13 Sea X un espacio topol´gico. o a) Una familia de abiertos B es una base de X si y s´lo si todo abierto de X o es uni´n de abiertos de B. o b) Si B es una base de X y x ∈ X entonces Bx = {B ∈ B | x ∈ B} es una base de entornos abiertos de X. c) Si para cada punto xS X el conjunto Ex es una base de entornos abiertos ∈ de x entonces B = Ex es una base de X. x∈X ´ Demostracion: a) Si B es una base de X y G es un abierto es claro que G es la uni´n de todos los abiertos de B contenidos en G, pues una inclusi´n es o o obvia y si x ∈ G existe un B ∈ B tal que x ∈ B ⊂ G, luego x est´ en la uni´n a o considerada. El rec´ ıproco es obvio. b) Los elementos de Bx son obviamente entornos de x y si U es un entorno de x entonces existe un abierto G tal que x ∈ G ⊂U, y a su vez existe B ∈ B tal que x ∈ B ⊂ G, luego B ∈ Bx y B ⊂ U . Esto prueba que Bx es una base de entornos abiertos de x. c) Si G es un abierto de X y x ∈ G, entonces G es un entorno de x, luego existe un entorno b´sico B ∈ Ex tal que x ∈ B ⊂ G y ciertamente B ∈ B. Como a adem´s los elementos de B son abiertos, tenemos que B es una base de X. a Una forma habitual de definir una topolog´ en un conjunto es especificar una ıa base o una base de entornos abiertos de cada punto. Por ejemplo, la topolog´ ıa m´trica puede definirse como la topolog´ que tiene por base a las bolas abiertas e ıa o como base de entornos de cada punto x a las bolas abiertas de centro x. No obstante, para que una familia de conjuntos pueda ser base de una topolog´ ıa ha de cumplir unas propiedades muy simples que es necesario comprobar. El teorema siguiente da cuenta de ellas. Teorema 1.14 Sea X un conjunto y B una familia de subconjuntos de X que cumpla las propiedades siguientes: S a) X = B, B∈B b) Si U , V ∈ B y x ∈ U ∩ V entonces existe W ∈ B tal que x ∈ W ⊂ U ∩ V . Entonces existe una unica topolog´ en X para la cual B es una base. ´ ıa ´ Demostracion: Definimos los abiertos de X como las uniones de elementos de B. Basta comprobar que estos abiertos forman realmente una topolog´ pues ıa, ciertamente en tal caso B ser´ una base y la topolog´ ser´ unica. a ıa a´
  • 26.
    10 Cap´ ıtulo 1. Topolog´ ıa El conjunto vac´ es abierto trivialmente (o si se prefiere, por definici´n). El ıo o conjunto X es abierto por la propiedad a). La uni´n de abiertos es obviamente abierta (una uni´n de uniones de ele- o o mentos de B es al fin y al cabo una uni´n de elementos de B). o Sean G1 y G2 abiertos y supongamos que x ∈ G1 ∩G2 . Como G1 es uni´n de o elementos de B existe un U ∈ B tal que x ∈ U ⊂ G1 . Similarmente x ∈ V ⊂ G2 con V ∈ B. Por la propiedad b) existe W ∈ B tal que x ∈ W ⊂ U ∩V ⊂ G1 ∩G2 . As´ pues, x est´ en la uni´n de los conjuntos W ∈ B tales que W ⊂ G1 ∩ G2 , y ı a o la otra inclusi´n es obvia, luego G1 ∩ G2 es uni´n de elementos de B. o o El teorema siguiente nos da las condiciones que hemos de comprobar para definir una topolog´ a partir de una familia de bases de entornos abiertos. ıa Teorema 1.15 Sea X un conjunto y para cada x ∈ X sea Bx una familia no vac´ de subconjuntos de X tal que: ıa a) Si U ∈ Bx , entonces x ∈ U . b) Si U , V ∈ Bx , existe un W ∈ Bx tal que W ⊂ U ∩ V . c) Si x ∈ U ∈ By , existe un V ∈ Bx tal que V ⊂ U . Entonces existe una unica topolog´ para la cual cada Bx es una base de entornos ´ ıa abiertos de x. S ´ Demostracion: Sea B = Bx . Veamos que B cumple las condiciones x∈X del teorema anterior para ser base de una topolog´ en X. Por la condici´n a) S ıa o tenemos que X = B. B∈B Si U , V ∈ B y x ∈ U ∩ V , entonces U ∈ By y V ∈ Bz para ciertos y, z. Existen U 0 , V 0 ∈ Bz tales que U 0 ⊂ U y V 0 ⊂ V (por la condici´n c). Existe o W ∈ Bx tal que W ⊂ U 0 ∩ V 0 (por la condici´n b). As´ x ∈ W ⊂ U ∩ V con o ı W ∈ B. Por lo tanto B es la base de una topolog´ en X para la que los elementos ıa de cada Bx son abiertos y, en particular, entornos de x. Si A es un entorno de x para dicha topolog´ existe un U ∈ B tal que x ∈ U ⊂ A. Por definici´n de B, ıa, o existe un y ∈ X tal que U ∈ By , y por c) existe un V ∈ Bx tal que V ⊂ U ⊂ A. Esto prueba que Bx es una base de entornos de x. Las bases de entornos determinan los entornos y por tanto la topolog´ es ıa, decir, se da la unicidad. Ejemplo Como aplicaci´n de este teorema vamos a convertir en espacio to- o pol´gico al conjunto R = R ∪ {−∞, +∞}. Para ello definimos como base de o entornos abiertos de cada n´mero real x al conjunto los entornos abiertos de x u en R con la topolog´ usual, la base de entornos abiertos de +∞ est´ formada ıa a por los intervalos ]x, +∞], donde x var´ en R, y la base de entornos abiertos ıa de −∞ la forman los intervalos [−∞, x[, donde x var´ en R. Con esto estamos ıa
  • 27.
    1.3. Productos ysubespacios 11 diciendo que un conjunto contiene a los alrededores de +∞ si contiene a todos los n´meros reales a partir de uno dado, y an´logamente para −∞. u a Es f´cil comprobar que las familias consideradas cumplen las propiedades a del teorema anterior, luego definen una topolog´ en R. ıa Teniendo en cuenta que hemos definido los entornos abiertos de los n´meros u reales como los entornos abiertos que ya tienen en la topolog´ usual, es inme- ıa diato que un subconjunto de R es abierto en la topolog´ usual de R si y s´lo si ıa o lo es en la topolog´ que hemos definido en R. ıa Hay un concepto an´logo a los de base y base de entornos que es menos a intuitivo, pero mucho m´s pr´ctico a la hora de definir topolog´ Se trata del a a ıas. concepto de subbase: Definici´n 1.16 Sea X un espacio topol´gico. Una familia de abiertos S es o o una subbase de X si las intersecciones finitas de elementos de S forman una base de X. Por ejemplo, es f´cil ver que los intervalos abiertos ]a, b[ forman una base de a R (son las bolas abiertas). Por consiguiente, los intervalos de la forma ]−∞, a[ y ]a, +∞[ forman una subbase de R, pues son abiertos y entre sus interseccio- nes finitas se encuentran todos los intervalos ]a, b[ (notar adem´s que cualquier a familia de abiertos que contenga a una base es una base). La ventaja de las subbases consiste en que una familia no ha de cumplir ninguna propiedad en especial para ser subbase de una topolog´ ıa: Teorema 1.17 Sea X un conjunto y S una familia de subconjuntos de X. Entonces existe una unica topolog´ en X de la cual S es subbase. ´ ıa ´ Demostracion: Sea B la familia de las intersecciones finitas de elementos T de S. Entonces X = G ∈ B y obviamente la intersecci´n de dos intersec- o G∈∅ ciones finitas de elementos de S es una intersecci´n finita de elementos de S; o luego si U , V ∈ B tambi´n U ∩ V ∈ B, de donde se sigue que B es la base de e una topolog´ en X, de la cual S es subbase. Claramente es unica, pues B es ıa ´ base de cualquier topolog´ de la que S sea subbase. ıa 1.3 Productos y subespacios Hemos visto que el producto de una familia finita de espacios m´tricos es e de nuevo un espacio m´trico de forma natural (o mejor dicho, de tres formas e distintas pero equivalentes desde un punto de vista topol´gico). Ahora veremos o que la topolog´ del producto se puede definir directamente a partir de las ıa topolog´ de los factores sin necesidad de considerar las distancias. M´s a´n, ıas a u podemos definir el producto de cualquier familia de espacios topol´gicos, no o necesariamente finita.
  • 28.
    12 Cap´ ıtulo 1. Topolog´ ıa Definici´n 1.18 Sean {Xi }i∈I espacios topol´gicos. Consideremos su pro- o Q o ducto cartesiano X = Xi y las proyecciones pi : X −→ Xi que asignan i∈I a cada punto su coordenada i-´sima. Llamaremos topolog´ producto en X a la e ıa que tiene por subbase a los conjuntos p−1 [G], donde i ∈ I y G es abierto en Xi . i T Una base de la topolog´ producto la forman los conjuntos de la forma ıa p−1 [Gi ], donde F es un subconjunto finito de I y Gi es abierto en Xi . i i∈F Q Equivalentemente, la base est´ formada por los conjuntos a Gi , donde cada i∈I Gi es abierto en Xi y Gi = Xi salvo para un n´mero finito Q ´ u de ındices. Al conjunto de estos ´ ındices se le llama soporte del abierto b´sico a Gi . i∈I Si el n´mero de factores es finito la restricci´n se vuelve vac´ de modo que u o ıa, un abierto b´sico en un producto X1 × · · · × Xn es simplemente un conjunto de a la forma G1 × · · · × Gn , donde cada Gi es abierto en Xi . En lo sucesivo “casi todo i” querr´ decir “todo ´ a ındice i salvo un n´mero u finito de ellos”. Teorema 1.19 Sean {Xi }i∈I espacios topol´gicos, para cada i sea Bi una base o Q de Xi . Entonces los conjuntos de la forma Gi , donde cada Gi est´ en Bi o a i∈I Q es Xi (y casi todos son Xi ) forman una base de Xi . i∈I ´ Demostracion: Consideremos la topolog´ T en el producto que tiene ıa por subbase a los conjuntos p−1 [Gi ] con Gi en Bi (y, por consiguiente, tieen i por base a los abiertos del enunciado). Como ciertamente estos conjuntos son abiertos para la topolog´ producto, tenemos que todo abierto de T lo es de ıa la topolog´ producto. Rec´ ıa ıprocamente, un abierto subb´sico de la topolog´ a S ıa producto es p−1 [Gi ], con Gi abierto en Xi . Entonces Gi = i B, donde cada SB∈Ai Ai es un subconjunto de Bi . Por lo tanto p−1 [Gi ] = i p−1 [B] es abierto i B∈Ai de T. Por consiguiente todo abierto de la topolog´ producto lo es de T y as´ ıa ı ambas topolog´ coinciden. ıas En lo sucesivo, a pesar de que en el producto se puedan considerar otras bases, cuando digamos “abiertos b´sicos” nos referiremos a los abiertos indicados a en el teorema anterior tomando como bases de los factores las propias topolog´ıas salvo que se est´ considerando alguna base en concreto. e Tal y como anunci´bamos, el producto de espacios topol´gicos generaliza al a o producto de espacios m´tricos (o de espacios normados). El teorema siguiente e lo prueba. Teorema 1.20 Si M1 , . . . , Mn son espacios m´tricos, entonces la topolog´ in- e ıa ducida por las m´tricas de 1.7 en M = M1 × · · · × Mn es la topolog´ producto. e ıa ´ Demostracion: Como las tres m´tricas inducen la misma topolog´ s´lo e ıa o es necesario considerar una de ellas, pero para la m´trica d∞ se cumple B≤ (x) = e
  • 29.
    1.3. Productos ysubespacios 13 B≤ (x1 )×· · ·×B≤ (xn ), luego la base inducida por la m´trica es base de la topolog´ e ıa producto. La definici´n de topolog´ producto es sin duda razonable para un n´mero o ıa u finito de factores. Sin embargo cuando tenemos infinitos factores hemos exigido una condici´nQ finitud que no hemos justificado. En principio podr´ o de Q ıamos considerar en Xi la topolog´ que tiene por base a los productos ıa Gi con Gi i∈I i∈I abierto en Xi (sin ninguna restricci´n de finitud). Ciertamente estos conjuntos o son base de una topolog´ a la que se le llama topolog´ de cajas, y el teorema ıa ıa siguiente muestra que no coincide con la topolog´ producto que hemos definido. ıa La topolog´ producto resulta ser mucho m´s util que la topolog´ de cajas. ıa a ´ ıa Teorema 1.21 Sea {Xi }i∈I una familia de espacios topol´gicos. Los unicos Q Q o ´ abiertos en Xi de la forma Gi 6= ∅ son los abiertos b´sicos, es decir, los a i∈I i∈I que adem´s cumplen que cada Gi es abierto y Gi = Xi para casi todo i. a Q ´ Demostracion: Supongamos que Gi es un abierto no vac´ıo. Con- Q i∈I Q sideremos un punto x ∈ Gi . Existir´ un abierto b´sico a a Hi tal que Q Q i∈I i∈I x∈ Hi ⊂ Gi , luego para cada ´ ındice i se cumplir´ xi ∈ Hi ⊂ Gi , y como a i∈I i∈I casi todo Hi es igual a Xi , tenemos que Gi = Xi para casi todo i. Adem´s tene- a mos que Gi es un entorno de xi , pero dado cualquier elemento a ∈ Gi siempre Q podemos formar un x ∈ Gi tal que xi = a, luego en realidad tenemos que Gi i∈I es un entorno de todos sus puntos, o sea, es abierto. Nos ocupamos ahora de los subespacios de un espacio topol´gico. Es evidente o que todo subconjunto N de un espacio m´trico M es tambi´n un espacio m´trico e e e con la misma distancia restringida a N ×N . Por lo tanto tenemos una topolog´ıa en M y otra en N . Vamos a ver que podemos obtener la topolog´ de N ıa directamente a partir de la de M , sin pasar por la m´trica. e Teorema 1.22 Sea X un espacio topol´gico (con topolog´ T) y A ⊂ X. De- o ıa finimos TA = {G ∩ A | G ∈ T}. Entonces TA es una topolog´ en A llamada ıa topolog´ relativa a X (o topolog´ inducida por X) en A. En lo sucesivo so- ıa ıa breentenderemos siempre que la topolog´ de un subconjunto de un espacio X es ıa la topolog´ relativa. ıa Demostracion: A = X ∩ A ∈ TA , ∅ = ∅ ∩ A ∈ TA . ´ Sea C ⊂ TA . Para cada G ∈ C sea UG = {U ∈ T | U ∩ A = G} 6= ∅ y sea VG la uni´n de todos los abiertos de UG . o De este modo VG es un abierto en X y VG ∩ A = G. [ [ [ G= VG ∩ A, y VG ∈ T, luego G ∈ TA . G∈C G∈C G∈C Si U , V ∈ TA , U = U ∩ A y V = V 0 ∩ A con U 0 , V 0 ∈ T. Entonces 0 U ∩ V = U 0 ∩ V 0 ∩ A ∈ TA , pues U 0 ∩ V 0 ∈ T. As´ TA es una topolog´ en A. ı ıa
  • 30.
    14 Cap´ ıtulo 1. Topolog´ ıa Ejemplo Consideremos I = [0, 1] ⊂ R. Resulta que ]1/2, 1] es abierto en I, pues ]1/2, 1] = ]1/2, 2[ ∩ I y ]1/2, 2[ es abierto en R. Sin embargo ]1/2, 1] no es abierto en R porque no es entorno de 1. Intuitivamente, ]1/2, 1] no contiene a todos los puntos de alrededor de 1 en R (faltan los que est´n a la derecha de 1), a pero s´ contiene a todos los puntos de alrededor de 1 en I. ı La relaci´n entre espacios y subespacios viene perfilada por los teoremas o siguientes. El primero garantiza que la topolog´ relativa no depende del espacio ıa desde el que relativicemos. Teorema 1.23 Si X es un espacio topol´gico (con topolog´ T) y A ⊂ B ⊂ X, o ıa entonces TA = (TB )A . ´ Demostracion: Si U es abierto en TA , entonces U = V ∩ A con V ∈ T, luego V ∩ B ∈ TB y U = V ∩ A = (V ∩ B) ∩ A ∈ (TB )A . Si U ∈ (TB )A , entonces U = V ∩ A con V ∈ TB , luego V = W ∩ B con W ∈ T. As´ pues, U = W ∩ B ∩ A = W ∩ A ∈ TA . Por lo tanto TA = (TB )A . ı Teorema 1.24 Si B es una base de un espacio X y A ⊂ X, entonces el con- junto {B ∩ A | B ∈ B} es una base de A. ´ Demostracion: Sea U un abierto en A y x ∈ U . Existe un V abierto en X tal que U = V ∩ A. Existe un B ∈ B tal que x ∈ B ⊂ V , luego x ∈ B ∩ A ⊂ V ∩ A = U . Por lo tanto la familia referida es base de A. Similarmente se demuestra: Teorema 1.25 Si Bx es una base de entornos (abiertos) de un punto x de un espacio X y x ∈ A ⊂ X, entonces {B ∩ A | B ∈ Bx } es una base de entornos (abiertos) de x en A. Teorema 1.26 Sea M un espacio m´trico y sea A ⊂ M . Entonces d0 = d|A×A e es una distancia en A y la topolog´ que induce es la topolog´ relativa. ıa ıa ´ Demostracion: Una base para la topolog´ inducida por la m´trica de A ıa e ser´ la formada por las bolas ıa 0 B≤ (x) = {a ∈ A | d0 (x, a) < ≤} = {a ∈ X | d(x, a) < ≤} ∩ A = B≤ (x) ∩ A, d d pero ´stas son una base para la topolog´ relativa por el teorema 1.24. e ıa Teorema 1.27 Sea {Xi }i∈I una familia de espacios topol´gicos y para cada i Q oQ sea Yi ⊂ Xi . Entonces la topolog´ inducida en ıa Yi por Xi es la misma i∈I i∈I que la topolog´ producto de los {Yi }i∈I . ıa (La base obtenida por el teorema 1.24 a partir de la base usual de la topolog´ ıa producto es claramente la base usual de la topolog´ producto.) ıa Ejercicio: Probar que la topolog´ que hemos definido en R induce en R la topolog´ ıa ıa eucl´ ıdea.
  • 31.
    1.4. Algunos conceptostopol´gicos o 15 1.4 Algunos conceptos topol´gicos o Dedicamos esta secci´n a desarrollar el lenguaje topol´gico, es decir, a intro- o o ducir las caracter´ ısticas de un espacio y sus subconjuntos que pueden definirse a partir de su topolog´ Hasta ahora hemos visto unicamente los conceptos de ıa. ´ abierto y entorno. Otro concepto importante es el dual conjuntista de “abierto”: Definici´n 1.28 Diremos que un subconjunto de un espacio topol´gico es ce- o o rrado si su complementario es abierto. Por ejemplo, un semiplano (sin su recta frontera) es un conjunto abierto, mientras que un semiplano con su frontera es cerrado, pues su complementario es el semiplano opuesto sin su borde, luego es abierto. Pronto veremos que la diferencia entre los conjuntos abiertos y los cerrados es precisamente que los primeros no contienen a los puntos de su borde y los segundos contienen todos los puntos de su borde. En importante notar que un conjunto no tiene por qu´ e ser ni abierto ni cerrado. Baste pensar en el intervalo [0, 1[. Ejercicio: Sea X = [0, 1] ∪ ]3, 4]. Probar que ]3, 4] es a la vez abierto y cerrado en X. Las propiedades de los cerrados se deducen inmediatamente de las de los abiertos: Teorema 1.29 Sea X un espacio topol´gico. Entonces: o a) ∅ y X son cerrados. b) La intersecci´n de cualquier familia de cerrados es un cerrado. o c) La uni´n de dos cerrados es un cerrado. o Puesto que la uni´n de abiertos es abierta, al unir todos los abiertos con- o tenidos en un conjunto dado obtenemos el mayor abierto contenido en ´l. Si- e milarmente, al intersecar todos los cerrados que contienen a un conjunto dado obtenemos el menor cerrado que lo contiene: Definici´n 1.30 Sea X un espacio topol´gico. Llamaremos interior de un o o conjunto A ⊂ X al mayor abierto contenido en A. Lo representaremos por ◦ int A o A. Llamaremos clausura de A al menor cerrado que contiene a A. Lo ◦ representaremos por cl A o A. Los puntos de A se llaman puntos interiores de A, mientras que los de A se llaman puntos adherentes de A. ◦ As´ pues, para todo conjunto A tenemos que A⊂ A ⊂ A. El concepto de ı punto interior es claro: un punto x es interior a un conjunto A si y s´lo si A es o un entorno de x. Por ejemplo, en un semiplano cerrado, los puntos interiores son los que no est´n en el borde. El teorema siguiente nos caracteriza los puntos a adherentes. Teorema 1.31 Sea X un espacio topol´gico y A un subconjunto de X. Un o punto x es adherente a A si y s´lo si todo entorno de x corta a A. o
  • 32.
    16 Cap´ ıtulo 1. Topolog´ ıa ´ Demostracion: Supongamos que x es adherente a A. Sea U un entorno de x. Existe un abierto G tal que x ∈ G ⊂ U . Basta probar que G ∩ A 6= ∅. Ahora bien, en caso contrario X G ser´ un cerrado que contiene a A, luego ıa A ⊂ X G, mientras que x ∈ A ∩ G. Rec´ıprocamente, si x tiene esta propiedad entonces x ∈ A, ya que de lo contrario X A ser´ un entorno de x que no corta a A. ıa Vemos, pues, que, como su nombre indica, los puntos adherentes a un con- junto A son los que “est´n pegados” a A, en el sentido de que tienen alrededor a puntos de A. Por ejemplo, es f´cil ver que los puntos adherentes a un semi- a plano abierto son sus propios puntos m´s los de su borde. Veamos ahora que el a concepto de borde corresponde a una noci´n topol´gica general: o o Definici´n 1.32 Sea X un espacio topol´gico y A ⊂ X. Llamaremos frontera o o de A al conjunto ∂A = A ∩ X A. As´ los puntos frontera de un conjunto son aquellos que tienen alrededor ı, puntos que est´n en A y puntos que no est´n en A. Esto es claramente una a a definici´n general del “borde” de un conjunto. Por ejemplo, la frontera de un o tri´ngulo la forman los puntos de sus lados. a Teorema 1.33 Sea X un espacio topol´gico. Se cumple: o ◦ ◦ a) Si A ⊂ X entonces A⊂ A ⊂ A, adem´s A es abierto y A es cerrado. a ◦ b) Si A ⊂ B ⊂ X y A es abierto entonces A ⊂B . c) Si A ⊂ B ⊂ X y B es cerrado entonces A ⊂ B. ◦ ◦ d) Si A ⊂ B ⊂ X entonces A⊂B y A ⊂ B. e) Si A, B ⊂ X, entonces int (A ∩ B) = int A ∩ int B, A ∪ B = A ∪ B. ◦ f ) A ⊂ X es abierto si y s´lo si A =A, y es cerrado si y s´lo si A = A. o o B X g) Si A ⊂ B ⊂ X, entonces A = A ∩ B. h) Si A ⊂ X, entonces int (X A) = X cl A y cl (X A) = X int A. ´ Demostracion: Muchas de estas propiedades son inmediatas. Probaremos s´lo algunas. o e) Claramente A ∪ B ⊂ A ∪ B, y el segundo conjunto es cerrado, luego A ∪ B ⊂ A ∪ B. Por otra parte es claro que A ⊂ A ∪ B y B ⊂ A ∪ B, luego tenemos la otra inclusi´n. La prueba con interiores es id´ntica. o e g) Observemos en primer lugar que los cerrados de B son exactamente las intersecciones con B de los cerrados de X. En efecto, si C es cerrado en X entonces X C es abierto en X, luego B ∩ (X C) = B C es abierto en B, luego B (B C) = B ∩ C es cerrado en B. El rec´ ıproco es similar.
  • 33.
    1.4. Algunos conceptostopol´gicos o 17 X Por definici´n, A es la intersecci´n de todos los cerrados en X que contienen o o X a A, luego A ∩ B es la intersecci´n de todas las intersecciones con B de los o cerrados en X que contienen a A, pero estos son precisamente los cerrados de X B B que contienen a A, o sea, A ∩ B es exactamente A . h) Tenemos que A ⊂ cl A, luego X cl A ⊂ X A y el primero es abierto, luego X cl A ⊂ int (X A). Por otra parte int (X A) ⊂ X A, luego A ⊂ X int (X A), y ´ste es e cerrado, luego A ⊂ X int (X A) y int (X A) ⊂ X A. En la prueba de la propiedad g) hemos visto lo siguiente: Teorema 1.34 Si X es un espacio topol´gico y A ⊂ X, los cerrados en la o topolog´ relativa de A son las intersecciones con A de los cerrados de X. ıa Conviene observar que el an´logo a g) para interiores es falso. Es decir, no a ◦ ◦ se cumple en general que A B =A ∩B. Por ejemplo, es f´cil ver que en R se a ◦ ◦ ◦ Z cumple N = ∅, luego N ∩ Z = ∅, mientras que N = N. Vamos a refinar el concepto de punto adherente. Hemos visto que los puntos adherentes a un conjunto A son aquellos que tienen alrededor puntos de A. Sucede entonces que todo punto x ∈ A es trivialmente adherente, porque x es un punto de alrededor de x y est´ en A. Cuando eliminamos esta posibilidad a trivial tenemos el concepto de punto de acumulaci´n: o Definici´n 1.35 Sea X un espacio topol´gico y A ⊂ X. Diremos que un o o punto x ∈ X es un punto de acumulaci´n de A si todo entorno U de x cumple o (U {x})∩A 6= ∅. El conjunto de puntos de acumulaci´n de A se llama conjunto o derivado de A y se representa por A0 . © ™ Ejemplo Consideremos el conjunto A = 1/n | n ∈ N {0} ⊂ R. Es f´cil a ver que A = A ∪ {0}. Sin embargo, A0 = {0}. En efecto, en general se cumple que A0 ⊂ A, pero ning´n punto 1/n ∈ A es de acumulaci´n, pues u o ∏ ∑ 1 1 1 1 − , + n n+1 n n+1 es un entorno de 1/n que no corta a A salvo en este mismo punto. Como ya hemos dicho, siempre es cierto que A0 ⊂ A. Tambi´n es claro que e un punto adherente que no est´ en A ha de ser un punto de acumulaci´n de A. e o En otras palabras, A = A ∪ A0 . Los puntos de A pueden ser de acumulaci´n o o no serlo. Por ejemplo, todos los puntos de [0, 1] son de acumulaci´n, mientras o que los puntos del ejemplo anterior no lo eran. Definici´n 1.36 Sea X un espacio topol´gico y A ⊂ X. Los puntos de A A0 o o se llaman puntos aislados de A.
  • 34.
    18 Cap´ ıtulo 1. Topolog´ ıa Un punto x ∈ A es aislado si y s´lo si tiene un entorno U tal que U ∩A = {x}. o El entorno lo podemos tomar abierto, y entonces vemos que los puntos aislados de A son los puntos que son abiertos en la topolog´ relativa. Vemos, pues, que ıa un espacio es discreto si y s´lo si todos sus puntos son aislados. Es el caso del o ejemplo anterior. Definici´n 1.37 Un subconjunto A de un espacio topol´gico X es denso si o o A = X. Aplicando la propiedad h) de 1.33 vemos que A es denso en X si y s´lo si o X A tiene interior vac´ es decir, si y s´lo si todo abierto de X corta a A. ıo, o Esto significa que los puntos de A est´n “en todas partes”. Por ejemplo, puesto a que todo intervalo de n´meros reales contiene n´meros racionales e irracionales, u u es claro que Q y R Q son densos en R. De aqu´ se sigue f´cilmente que Qn y ı a (R Q)n son densos en Rn . Ejercicio: Probar que si A es abierto en un espacio X y D es denso en X entonces A ∩ D es denso en A. Hay una propiedad que no cumplen todos los espacios topol´gicos, pero s´ o ı la pr´ctica totalidad de espacios de inter´s. a e Definici´n 1.38 Diremos que un espacio topol´gico X es un espacio de Haus- o o dorff si para todo par de puntos distintos x, y ∈ X existen abiertos disjuntos U y V tales que x ∈ U , y ∈ V (se dice que los abiertos U y V separan a x e y). Por ejemplo, si en un conjunto X con m´s de un punto consideramos la a topolog´ formada unicamente por los abiertos ∅ y X (topolog´ trivial) obte- ıa ´ ıa nemos un espacio que no es de Hausdorff. Se trata de un espacio patol´gico o donde todo punto est´ alrededor de cualquier otro. Aunque la topolog´ trivial a ıa es ciertamente la m´s patol´gica posible, lo cierto es que todas las topolog´ a o ıas no de Hausdorff comparten con ella su patolog´ y rara vez resultan de inter´s. ıa, e Veamos las propiedades de los espacios de Hausdorff: Teorema 1.39 Se cumplen las propiedades siguientes: a) En un espacio de Hausdorff, todo conjunto finito es cerrado. b) Todo espacio de Hausdorff finito es discreto. c) Todo subespacio de un espacio de Hausdorff es un espacio de Hausdorff. d) El producto de una familia de espacios de Hausdorff es un espacio de Hausdorff. e) Todo espacio m´trico es un espacio de Hausdorff. e f ) Un espacio X es de Hausdorff si y s´lo si la diagonal ∆ = {(x, x) | x ∈ X} o es cerrada en X × X.
  • 35.
    1.4. Algunos conceptostopol´gicos o 19 ´ Demostracion: a) Basta probar que todo punto {x} en un espacio de Hausdorff X es cerrado. Ahora bien, dado y ∈ X {x}, existen abiertos disjuntos U , V tales que x ∈ U , y ∈ V , luego y ∈ V ⊂ X {x}, lo que prueba que X {x} es entorno de todos sus puntos, luego {x} es cerrado. b) En un espacio de Hausdorff finito todo subconjunto es cerrado, luego todo subconjunto es abierto, luego es discreto. c) Si X es un espacio de Hausdorff y A ⊂ X, dados dos puntos x, y ∈ A, existen abiertos disjuntos U , V en X que separan a x e y, luego U ∩ A, V ∩ A son abiertos disjuntos en A que separan a x e y. Q d) Consideremos un producto de espacios de Hausdorff Xi y dos de sus i∈I puntos x, y. Sea i0 un ´ındice tal que xi0 6= yi0 . Existen abiertos U , V en Xi0 que separan a xi0 e yi0 . Entonces p−1 (U ) y p−1 (V ) son abiertos subb´sicos i0 i0 a disjuntos en el producto que separan a x e y. e) Si X es un espacio m´trico, dos de sus puntos x, y est´n separados por e a las bolas de centros x, y y radio d(x, y)/2. f) La diagonal ∆ es cerrada si y s´lo si su complementario es abierto, si y o s´lo si para todo par (x, y) ∈ X × X con x 6= y existe un abierto b´sico U × V o a en X × X tal que (x, y) ∈ U × V ⊂ X × X ∆. Ahora bien, la condici´n o U × V ⊂ X × X ∆ equivale a U ∩ V = ∅, luego la diagonal es cerrada si y s´lo o si X es Hausdorff. Ejercicio: Probar que si un producto de espacios topol´gicos es un espacio de Haus- o dorff no vac´ entonces cada uno de los factores es un espacio de Hausdorff. ıo, Terminamos la secci´n con algunas propiedades m´tricas, no topol´gicas, es o e o decir propiedades definidas a partir de la distancia en un espacio m´trico y que e no se pueden expresar en t´rminos de su topolog´ e ıa. Definici´n 1.40 Un subconjunto A de un espacio m´trico es acotado si existe o e un M > 0 tal que para todo par de puntos x, y ∈ A se cumple d(x, y) ≤ M . El di´metro de un conjunto acotado A es el supremo de las distancias d(x, y) a cuando (x, y) var´ en A × A. ıa Es f´cil probar que todo subconjunto de un conjunto acotado es acotado, a as´ como que la uni´n finita de conjuntos acotados est´ acotada. Sin embargo ı o a hemos de tener presente el hecho siguiente: dado un espacio m´trico M , podemos © ™ e definir d0 (x, y) = m´ 1, d(x, y) . Es f´cil ver que d0 es una distancia en M y las ın a bolas de radio menor que 1 para d0 coinciden con las bolas respecto a d. Como estas bolas forman una base de las respectivas topolog´ m´tricas concluimos ıas e que ambas distancias definen la misma topolog´ Sin embargo, respecto a d0 ıa. todos los conjuntos est´n acotados. Esto prueba que el concepto de acotaci´n a o no es topol´gico. o Ejercicio: Calcular el di´metro de una bola abierta en Rn y en un espacio con la a m´trica discreta. e
  • 36.
    20 Cap´ ıtulo 1. Topolog´ ıa Definici´n 1.41 Si M es un espacio m´trico, A 6= ∅ un subconjunto de M y o e x ∈ M , definimos la distancia de x a A como d(x, A) = ´ ınf{d(x, y) | y ∈ A}. Es evidente que si x ∈ A entonces d(x, A) = 0, pues entre las distancias cuyo ´ ınfimo determinan d(x, A) se encuentra d(x, x) = 0. Sin embargo los puntos que cumplen d(x, A) = 0 no est´n necesariamente en A. a Teorema 1.42 Si M es un espacio m´trico y A ⊂ M , entonces un punto x e cumple d(x, A) = 0 si y s´lo si x es adherente a A. o ´ Demostracion: Si d(x, A) = 0, para probar que es adherente basta ver que toda bola abierta de centro x corta a A. Dado ≤ > 0 tenemos que d(x, A) < ≤, lo que significa que existe un y ∈ A tal que d(x, y) < ≤, es decir, y ∈ B≤ (x) ∩ A. El rec´ ıproco se prueba igualmente. En el caso de espacios normados podemos hacer algunas afirmaciones adi- cionales. La prueba del teorema siguiente es inmediata. Teorema 1.43 Sea E un espacio normado y A ⊂ E. Las afirmaciones siguien- tes son equivalentes: a) A es acotado. b) Existe un M > 0 tal que kxk ≤ M para todo x ∈ A. c) Existe un M > 0 tal que A ⊂ BM (0). Ejercicio: Probar que en un espacio normado la clausura de una bola abierta es la bola cerrada del mismo radio y el interior de una bola cerrada es la bola abierta. ¿Cu´l a es la frontera de ambas? Dar ejemplos que muestren la falsedad de estos hechos en un espacio m´trico arbitrario. e 1.5 Continuidad Finalmente estamos en condiciones de formalizar la idea de funci´n continua o como funci´n f que env´ los alrededores de un punto a los alrededores de su o ıa imagen. No exigimos que las im´genes de los puntos de alrededor de un punto x a sean todos los puntos de alrededor de f (x). Por ejemplo, sea S la circunferencia unidad en R2 y f la aplicaci´n dada por o [0, 1] −→ S x 7→ (cos 2πx, sen 2πx) Lo que hace f es “pegar” los extremos del intervalo en un mismo punto (1, 0). Queremos que esta aplicaci´n sea continua, y vemos que [0, 1/4] es un entorno o de 0 que se transforma en “medio” entorno de (1, 0), en los puntos de alrededor de (1, 0) contenidos en el semiplano y > 0. Esto no debe ser, pues, un obst´culo a a la continuidad.
  • 37.
    1.5. Continuidad 21 Pedir que los puntos de alrededor de x sean enviados a puntos de alrededor de f (x) (no necesariamente todos) es pedir que todo entorno U de f (x) contenga a las im´genes de los puntos de alrededor de x, es decir, las im´genes de un a a entorno de x, es decir, que f −1 [U ] contenga un entorno de x, pero esto equivale a que ´l mismo lo sea. As´ pues: e ı Definici´n 1.44 Una aplicaci´n f : X −→ Y entre dos espacios topol´gicos o o o es continua en un punto x ∈ X si para todo entorno U de f (x) se cumple que f −1 [U ] es un entorno de x. Diremos que f es continua si lo es en todos los puntos de x. Observar que en esta definici´n podemos sustituir “entorno” por “entorno o b´sico”. En un espacio m´trico podemos considerar concretamente bolas abier- a e tas, y entonces la definici´n se particulariza como sigue: o Teorema 1.45 Una aplicaci´n f : M −→ N entre dos espacios m´tricos es o e continua en un punto x ∈°M si y s´lo si para todo ≤ > 0 existe un δ > 0 tal que o ¢ si d(x, x0 ) < δ entonces d f (x), f (x0 ) < ≤. Veamos varias caracterizaciones de la continuidad. Teorema 1.46 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos. Las o o afirmaciones siguientes son equivalentes: a) f es continua. b) Para todo abierto (b´sico) G de Y se cumple que f −1 [G] es abierto en X. a c) Para todo cerrado C de Y se cumple que f −1 [C] es cerrado en X. d) Para todo A ⊂ X se cumple f [A] ⊂ f [A]. e) Para todo B ⊂ Y se cumple f −1 [B] ⊂ f −1 [B]. f ) Para todo B ⊂ Y se cumple f −1 [int B] ⊂ int f −1 [B]. Demostracion: a) ↔ b). Si f es continua y x ∈ f −1 [G] entonces f (x) ∈ G, ´ luego G es un entorno de f (x), luego por definici´n de continuidad f −1 [G] es o un entorno de x, luego f −1 [G] es abierto. Es claro que b) → a). Evidentemente b) ↔ c). a) → d). Si x ∈ f [A] entonces x = f (y), con y ∈ A. Si E es un entorno de x, por definici´n de continuidad f −1 [E] es un entorno de y, luego f −1 [E] ∩ A 6= ∅, o de donde E ∩ f [A] 6= ∅, lo que prueba que x ∈ f [A]. £ § £ § d) → e). Tenemos que f −1 [B] ⊂ X, luego f f −1 [B] ⊂ f f −1 [B] ⊂ B, luego f −1 [B] ⊂ f −1 [B].
  • 38.
    22 Cap´ ıtulo 1. Topolog´ ıa e) → f). En efecto: £ § f −1 [int B] = f −1 Y (Y int B) = X f −1 [Y int B] = X f −1 [Y B] ⊂ X f −1 [Y B] = X X f −1 [B] = X (X int f −1 [B]) = int f −1 [B]. f) → b). Si B es abierto en Y , entonces f −1 [B] = f −1 [int B] ⊂ int f −1 [B] ⊂ f −1 [B], luego f −1 [B] = int f −1 [B] que es, por lo tanto, abierto. Ahora vamos a probar una serie de resultados generales que nos permitir´n a reconocer en muchos casos la continuidad de una aplicaci´n de forma inmediata. o De la propia definici´n de continuidad se sigue inmediatamente: o Teorema 1.47 Si f : X −→ Y es continua en un punto x y g : Y −→ Z es continua en f (x), entonces f ◦g es continua en x. En particular, la composici´n o de aplicaciones continuas es una aplicaci´n continua. o Otro hecho b´sico es que la continuidad depende s´lo de la topolog´ en la a o ıa imagen y no de la del espacio de llegada. Teorema 1.48 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos. o o Entonces f es continua en un punto x ∈ X como aplicaci´n f : X −→ Y si y o s´lo si lo es como aplicaci´n f : X −→ f [X]. o o ´ Demostracion: Un entorno de f (x) en f [X] es U ∩ f [X], donde U es un entorno de f (x) en Y , pero f −1 [U ∩ A] = f −1 [U ], luego es indistinto considerar entornos en f [X] o en Y . Teniendo en cuenta que la aplicaci´n identidad en un conjunto es obviamente o continua, de los teoremas anteriores se deduce inmediatamente el que sigue: Teorema 1.49 Si X es un espacio topol´gico y A ⊂ X, entonces la inclusi´n o o i : A −→ X dada por i(x) = x es continua. Por tanto, si f : X −→ Y es continua en un punto x ∈ A, la restricci´n f |A = i ◦ f es continua en x. o En particular la restricci´n de una aplicaci´n continua a un subconjunto es o o tambi´n continua. El rec´ e ıproco no es cierto, pero se cumple lo siguiente: Teorema 1.50 Dada una aplicaci´n f : X −→ Y , si A es un entorno de un o punto x ∈ X y f |A es continua en x, entonces f es continua en x. Demostracion: Si U es un entorno de f (x) en Y , entonces (f |A )−1 [U ] = ´ −1 f [U ] ∩ A es un entorno de x en A, luego existe un entorno G de x en X de manera que x ∈ G ∩ A = f −1 [U ] ∩ A, luego en particular x ∈ G ∩ A ⊂ f −1 [U ], y G ∩ A es un entorno de x en X, luego f −1 [U ] tambi´n lo es. e
  • 39.
    1.5. Continuidad 23 Esto significa que la continuidad es una propiedad local, es decir, el que una funci´n sea continua o no en un punto es un hecho que s´lo depende del compor- o o tamiento de la funci´n en un entorno del punto. En particular, si cubrimos un o espacio topol´gico por una familia de abiertos, para probar que una aplicaci´n o o es continua basta ver que lo es su restricci´n a cada uno de los abiertos. Esto es o cierto tambi´n si cubrimos el espacio con cerrados a condici´n de que sean un e o n´mero finito. u Teorema 1.51 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos. o o Sean C1 , . . . , Cn subconjuntos cerrados de X tales que X = C1 ∪ · · · ∪ Cn . Entonces f es continua si y s´lo si cada f |Ci es continua. o ´ Demostracion: Una implicaci´n es obvia. Si las restricciones son conti- o nuas, entonces dado un cerrado C de Y , se cumple que f −1 [C] = (f −1 [C] ∩ C1 ) ∪ · · · ∪ (f −1 [C] ∩ Cn ) = (f |C1 )−1 [C] ∪ · · · ∪ (f |Cn )−1 [C]. Ahora, cada (f |Ci )−1 [C] es cerrado en Ci , luego es la intersecci´n con Ci de o un cerrado de X, luego es la intersecci´n de dos cerrados en X, luego es cerrado o en X. As´ pues, f −1 [C] es la uni´n de un n´mero finito de cerrados de X, luego ı o u es cerrado en X. Esto prueba que f es continua. Teorema 1.52 Si {Xi }i∈I es una familia de espacios topol´gicos, las proyec- Q o ciones pi : Xi −→ Xi son funciones continuas. i∈I ´ Demostracion: Las antiim´genes de abiertos en Xi son abiertos b´sicos a a del producto. Ejercicio: Probar que la topolog´ producto es la menor topolog´ que hace continuas ıa ıa a las proyecciones. Teorema 1.53 Si {Xi }i∈I es una familia de espacios Q ogicos y X es un topol´ espacio topol´gico, entonces una aplicaci´n f : X −→ Xi es continua si y o o s´lo si lo son todas las funciones fi = f ◦ pi . o i∈I ´ Demostracion: Si f es continua las funciones f ◦ pi tambi´n lo son por ser e composici´n de funciones continuas. Q o Si cada f ◦ pi es continua, sea A = Ai un abierto b´sico del producto. a i∈I £ § ındices tales que Aij 6= Xij . Entonces f −1 p−1 [Aij ] = Sean i1 , . . . , in los ´ ij (f ◦ pij )−1 [Aij ] es abierto en X, pero n n £ § A= p−1 [Aij ] ij y f −1 [A] = f −1 p−1 [Aij ] ij j=1 j=1 es abierto en X.
  • 40.
    24 Cap´ ıtulo 1. Topolog´ ıa As´ por ejemplo, para probar que la aplicaci´n f : R −→ R2 dada por ı, o f (x) = (x + 1, x2 ) es continua, basta probar que lo son las aplicaciones x + 1 y x2 . Definici´n 1.54 Sean E y F espacios normados. Una aplicaci´n f : E −→ F o o tiene la propiedad de Lipschitz si existe un M > 0 tal que para todos los vectores v, w ∈ E se cumple que kf (v) − f (w)k ≤ M kv − wk. Teorema 1.55 Las aplicaciones con la propiedad de Lipschitz son continuas. ´ Demostracion: Sea f : E −→ F una aplicaci´n con la propiedad de o Lipschitz con constante M . Vamos a aplicar el teorema 1.45. Dado ≤ > 0 tomamos δ = ≤/M . As´ si kv−wk < δ, entonces kf (v)−f (w)k ≤ M kv−wk < ≤. ı, Por ejemplo, es f´cil ver que si E es un espacio normado entonces la norma a k k : E −→ R tiene la propiedad de Lipschitz con constante M = 1, luego es una aplicaci´n continua. Un ejemplo menos trivial es el de la suma: o Teorema 1.56 Sea E un espacio normado. Entonces la suma + : E ×E −→ E tiene la propiedad de Lipschitz, luego es continua. ´ Demostracion: Consideraremos a E × E como espacio normado con la norma k k1 . Entonces, si (u, v), (a, b) ∈ E × E, tenemos que k(u + v) − (a + b)k = k(u − a) + (v − b)k ≤ ku − ak + kv − bk = k(u − a, v − b)k1 = k(u, v) − (a, b)k1 . El producto no cumple la propiedad de Lipschitz, pero aun as´ es continuo. ı Teorema 1.57 Sea E un espacio normado. El producto · : K × E −→ E es una aplicaci´n continua. o ´ Demostracion: Veamos que el producto es continuo en un punto (λ, x) de K × E. Usaremos la norma k k∞ en K × E. Dado ≤ > 0, sea (λ0 , x0 ) ∈ K × E. kλ0 x0 − λxk = kλ0 (x0 − x) + (λ0 − λ)xk ≤ |λ0 | kx0 − xk + |λ0 − λ| kxk. Tomemos ahora 0 < δ < 1 que cumpla adem´s a ≤ δ< < ≤. |λ| + kxk + 1 As´ si k(λ0 , x0 ) − (λ, x)k∞ < δ, entonces |λ0 − λ| < δ y kx0 − xk < δ. En ı particular |λ0 | ≤ |λ| + δ < |λ| + 1. As´ ı |λ0 |≤ kxk ≤ kλ0 x0 − λxk < + < ≤. |λ| + kxk + 1 |λ| + kxk + 1
  • 41.
    1.5. Continuidad 25 Definici´n 1.58 Un espacio vectorial topol´gico es un par (V, T), donde V es o o un espacio vectorial sobre K y T es una topolog´ de Hausdorff sobre V de modo ıa que las aplicaciones + : V × V −→ V y · : K × V −→ V son continuas. Hemos demostrado que todo espacio normado es un espacio vectorial to- pol´gico. o En general, si X es un conjunto y V es un espacio vectorial sobre un cuerpo K, el conjunto V X de todas las aplicaciones de X en V es un espacio vectorial con las operaciones dadas por (f + g)(x) = f (x) + g(x) y (αf )(x) = αf (x). Si X e Y son espacios topol´gicos, llamaremos C(X, Y ) al conjunto de todas o las aplicaciones continuas de X en Y . Si X es un espacio topol´gico y V un espacio vectorial topol´gico, entonces o o C(X, V ) resulta ser un subespacio de V X , pues la suma de dos funciones conti- nuas f y g puede °obtenerse como composici´n de la aplicaci´n h : X −→ V × V ¢ o o dada por h(x) = f (x), g(x) , que es continua, y la suma en V , que tambi´n lo e es, luego f + g es continua. Similarmente se prueba que si α ∈ K y f ∈ C(X, V ), entonces αf ∈ C(X, V ). El espacio KX tiene tambi´n estructura de anillo conmutativo y unitario con e el producto dado por (f g)(x) = f (x)g(x). Como el producto · : K × K −→ K es continuo (tomando E = K en el teorema anterior), resulta que C(X, K) es un subanillo de KX . En general, una cu´drupla (A, +, ·, ◦), donde la terna (A, +, ·) es un espacio a vectorial sobre un cuerpo K, la terna (A, +, ◦) es un anillo unitario y adem´s a α(ab) = (αa)b = a(αb) para todo α ∈ K, y todos los a, b ∈ A, se llama una K-´lgebra. a Tenemos, pues, que si X es un espacio topol´gico, entonces C(X, K) es una o K-´lgebra de funciones. El espacio C(X, K) contiene un subcuerpo isomorfo a a K, a saber, el espacio de las funciones constantes. Cuando no haya confusi´n o identificaremos las funciones constantes con los elementos de K, de modo que 2 representar´ a la funci´n que toma el valor 2 sobre todos los puntos de X. a o M´s a´n, si p(x1 , . . . , xn ) ∈ K[x1 , . . . , xn ], el polinomio p determina una a u unica funci´n evaluaci´n p : Kn −→ K, de modo que los polinomios constan- ´ o o tes se corresponden con las funciones constantes y la indeterminada xi con la proyecci´n en la i-´sima coordenada. Como todo polinomio es combinaci´n de o e o sumas y productos de constantes e indeterminadas, tenemos que K[x1 , . . . , xn ] ⊂ C(Kn , K). Por ejemplo, la aplicaci´n f : R3 −→ R2 dada por f (x, y, z) = (3x−2yz, xyz) o es claramente continua. Teorema 1.59 La aplicaci´n h : K {0} −→ K dada por h(x) = 1/x es conti- o nua. DemostracioØ Sea x ∈ K {0}. Sea δ = |x|/2. Si y ∈ Bδ (x) entonces ´ n: Ø | − x − (y − x)| ≥ Ø| − x| − |y − x|Ø, o sea, |y| ≥ |x| − δ = δ.
  • 42.
    26 Cap´ ıtulo 1. Topolog´ ıa Dado ≤ > 0, sea δ 0 < 1, δ 0 < δ|x|≤. As´ si |y − x| < δ 0 tenemos ı, Ø Ø Ø1 Ø Ø − 1 Ø = |y − x| < δ|x|≤ = ≤. Øy xØ |y| |x| δ|x| Consecuentemente, si f ∈ C(X, K) y f no se anula en X, podemos definir la funci´n 1/f ∈ C(X, K) mediante (1/f )(x) = 1/f (x). o Por ejemplo, la funci´n f : R {1} −→ R dada por o x2 f (x) = x−1 es obviamente continua. √ Teorema 1.60 La funci´n o : [0, +∞[ −→ [0, +∞[ es continua. ´ Demostracion: Basta notar que √ √ § £ x ∈ ]a, b[ ↔ a < x < b ↔ a2 < x < b2 ↔ x ∈ a2 , b2 . § £ Esto significa que la antiimagen del intervalo ]a, b[ es el intervalo a2 , b2 . Simi- £ 2£ larmente se ve que la antiimagen de un intervalo [0, b[ es el intervalo 0, b y, √ como estos intervalos constituyen una base de [0, +∞[, tenemos que es una funci´n continua. o Teorema 1.61 Sea M un espacio m´trico y A 6= ∅ un subconjunto de M . e Entonces las aplicaciones d : M × M −→ R y d( , A) : M −→ R son continuas. ´ Demostracion: Consideremos en M × M la distancia d∞ . Dado un par (x, y) ∈ M × M , y un ≤ > 0, basta probar que si (x0 , y 0 ) dista de (x, y) menos de ≤/2, es decir, si se cumple d(x, x0 ) < ≤/2 y d(y, y 0 ) < ≤/2, entonces tenemos |d(x, y) − d(x0 , y 0 )| < ≤. En efecto, en tal caso d(x, y) ≤ d(x, x0 ) + d(x0 , y 0 ) + d(y 0 , y) < d(x0 , y 0 ) + ≤, luego d(x, y) − d(x0 , y 0 ) < ≤, e igualmente se llega a d(x0 , y 0 ) − d(x, y) < ≤, luego efectivamente |d(x, y) − d(x0 , y 0 )| < ≤. Para probar la continuidad de d( , A) en un punto x observamos que |d(x, A) − d(y, A)| ≤ d(x, y). En efecto, para todo z ∈ A se cumple d(x, z) ≤ d(x, y) + d(y, z). De aqu´ se ı sigue claramente d(x, A) ≤ d(x, y) + d(y, z), y tomando el ´ ınfimo en z vemos que d(x, A) ≤ d(x, y) + d(y, A). Similarmente se prueba d(y, A) ≤ d(x, y) + d(x, A), de donde se sigue la relaci´n con valores absolutos. A su vez esta relaci´n implica o o que si d(x, y) < ≤, entonces |d(x, A) − d(y, A)| < ≤, lo que expresa la continuidad de la aplicaci´n. o Para terminar con las propiedades generales de las aplicaciones continuas probaremos un hecho de inter´s te´rico: e o
  • 43.
    1.5. Continuidad 27 Teorema 1.62 Sean f, g : X −→ Y aplicaciones continuas, D ⊂ X un con- junto denso tal que f |D = g|D y supongamos que Y es un espacio de Hausdorff. Entonces f = g. ° ¢ ´ Demostracion: Sea h : X −→ Y × Y dada por h(x) = f (x), g(x) . Claramente es continua y h[D] ⊂ ∆, donde ∆ = {(y, y) | y ∈ Y } es un cerrado en Y × Y (por 1.39). Por lo tanto h[X] = h[D] ⊂ h[D] ⊂ ∆, de donde f = g. Definici´n 1.63 Una aplicaci´n biyectiva f : X −→ Y entre dos espacios o o topol´gicos es un homeomorfismo si f y su inversa son ambas continuas. Dos o espacios topol´gicos son homeomorfos si existe un homeomorfismo entre ellos. o Un homeomorfismo induce una biyecci´n entre los abiertos de los dos es- o pacios, por lo que ambos son topol´gicamente indistinguibles. Es claro que o cualquier propiedad definida exclusivamente a partir de la topolog´ se con- ıa serva por homeomorfismos, luego dos espacios homeomorfos tienen las mismas propiedades topol´gicas. o Es importante notar que no toda biyecci´n continua es un homeomorfismo. o Por ejemplo, la identidad I : R −→ R, cuando en el primer espacio consideramos la topolog´ discreta y en el segundo la eucl´ ıa ıdea es biyectiva y continua, pero no un homeomorfismo. Veamos un ejemplo m´s intuitivo: a 2 Ejemplo Sea f : [0, 1] ∪ ]2, 3] −→ [0, 2] la aplicaci´n dada por o Ω 1 x si 0 ≤ x ≤ 1 f (x) = x − 1 si 2 < x ≤ 3 0 Es f´cil ver que f es biyectiva, y es continua a porque sus restricciones a los abiertos [0, 1] y 0 1 2 3 ]2, 3] de su dominio son ambas continuas (son polinomios). Sin embargo no es un homeomorfismo. La aplicaci´n f −1 es continua en todos los puntos de o [0, 2] excepto en x = 1. En efecto, [0, 1] es un entorno de f −1 (1) = 1, pero la antiimagen de este intervalo es el mismo [0, 1], que no es un entorno de 1 en [0, 2]. En los dem´s puntos es continua, pues f −1 restringida a los abiertos de a su dominio [0, 1[ y ]1, 2] es polin´mica. o Lo que sucede es que, a pesar de ser biyectiva, f est´ “pegando” los intervalos a [0, 1] y ]2, 3] en el intervalo [0, 2], por lo que f −1 “corta” ´ste por el punto 1. e En general, si una aplicaci´n continua es una aplicaci´n que no corta, aunque o o puede pegar, un homeomorfismo es una aplicaci´n que no corta ni pega. Para o que no pegue ha de ser biyectiva, pero acabamos de ver que esto no es suficiente. El ejemplo de la topolog´ discreta se interpreta igual: los puntos de R con la ıa topolog´ discreta est´n todos “separados” entre s´ luego al pasar a R con la ıa a ı, topolog´ eucl´ ıa ıdea los estamos “pegando”, aunque no identifiquemos puntos.
  • 44.
    28 Cap´ ıtulo 1. Topolog´ ıa Definici´n 1.64 Una aplicaci´n f : X −→ Y entre dos espacios topol´gicos es o o o abierta si para todo abierto A de X, se cumple que f [A] es abierto en Y . De este modo, un homeomorfismo es una biyecci´n continua y abierta. La o propiedad de ser abierta no es muy intuitiva y tampoco es muy frecuente (salvo en el caso de los homeomorfismos). Sin embargo es de destacar el hecho si- guiente: Teorema 1.65 Las proyecciones de un espacio producto en cada uno de sus factores son aplicaciones abiertas. ´ Demostracion: Basta ver que la proyecci´n de un abierto b´sico es un o a abierto, pero los abiertos b´sicos son productos de abiertos, y las proyecciones a son sus factores. Definici´n 1.66 La gr´fica de una aplicaci´n f : X −→ Y es el conjunto1 o a o n° ¢ o x, f (x) ∈ X × Y | x ∈ X . En los casos de funciones f : A ⊂ Rm −→ Rn , donde m + n ≤ 3 la gr´fica de a f tiene una interpretaci´n en el plano o espacio eucl´ o ıdeo intuitivos, y esta repre- sentaci´n permite reconocer r´pidamente las caracter´ o a ısticas de f . El resultado m´s importante por lo que a la continuidad se refiere es el siguiente: a Teorema 1.67 Si f : X −→ Y es una aplicaci´n continua, entonces la apli- ° ¢ o caci´n x 7→ x, f (x) es un homeomorfismo entre X y la gr´fica de f . o a ´ Demostracion: La aplicaci´n es obviamente biyectiva y continua. Su o inversa es la restricci´n a la gr´fica de la proyecci´n sobre el primer factor de o a o X × Y , luego tambi´n es continua. e Ejemplo La gr´fica del polinomio x3 − x es la siguiente: a 2 1.5 1 0.5 -2 -1 1 2 -0.5 -1 -1.5 -2 1 Observar que desde el punto de vista de la teor´ de conjuntos la gr´fica de una funci´n ıa a o f es la propia funci´n f como conjunto. o
  • 45.
    1.5. Continuidad 29 El lector deber´ preguntarse c´mo se sabe que la gr´fica de f tiene esta ıa o a forma y no otra. M´s adelante veremos c´mo determinar anal´ a o ıticamente las caracter´ ısticas de la gr´fica de una funci´n, pero de momento nos bastar´ con a o a lo siguiente: Para obtener una figura como la anterior, basta programar a un ordenador para que calcule la funci´n considerada sobre los suficientes n´meros racionales, o u digamos sobre los n´meros de la forma k/100, donde k var´ entre −200 y 200, u ° ¢ ıa y dibuje un peque˜o cuadrado con coordenadas x, f (x) . El resultado es una n gr´fica como la que hemos mostrado. El proceso s´lo involucra la aritm´tica de a o e los n´meros racionales, que no tiene ninguna dificultad. u Vemos que la gr´fica de f es una l´ a ınea ondulada. Podemos considerarla como una imagen “t´ ıpica” de espacio homeomorfo a R. Se obtiene deformando la recta “el´sticamente”, sin cortarla ni pegarla. La aplicaci´n f no es un a o homeomorfismo, la gr´fica muestra c´mo transforma a R en su imagen: ´sta a o e resulta de “aplastar” la curva sobre el eje vertical, con lo que R se “pliega” sobre s´ mismo, de modo que parte de sus puntos se superponen tres a tres. ı Veamos ahora un ejemplo de gr´fica de una funci´n discontinua. a o Ejemplo Consideremos la funci´n f o : R −→ [0, 1] dada por   1 si x ≤ 0 f (x) = x si 0 < x < 1  1 si x ≥ 1 Su gr´fica es la siguiente: a Es claro que f es continua en todo punto distinto de 0. En efecto, su res- tricci´n al abierto ]−∞, 0[ es constante, luego continua, su restricci´n al abierto o o ]0, +∞[ tambi´n es continua, pues este abierto es a su vez uni´n de dos cerrados, e o ]0, 1] y [1, +∞[, en los cuales f es continua, pues en el primero es el polinomio x y en el segundo es constante. Es f´cil ver que f no es continua en 0. a La gr´fica de f no es homeomorfa a R. No estamos en condiciones de pro- a ° ¢ barlo ahora. Es f´cil ver que x 7→ x, f (x) no es un homeomorfismo, pero esto a no prueba que no exista otra biyecci´n que s´ lo sea. De todos modos, intui- o ı tivamente vemos que la gr´fica est´ formada por dos piezas, por lo que para a a transformar R en la gr´fica es necesario “cortar” por alg´n punto. a u Ejemplo Los homeomorfismos no pueden “cortar” ni “pegar”, pero s´ “esti- ı rar” arbitrariamente un conjunto. Por ejemplo, la homotecia f (x) = ax, donde a > 0 transforma el intervalo [−1, 1] en el intervalo [−a, a]. Las traslaciones
  • 46.
    30 Cap´ ıtulo 1. Topolog´ ıa x 7→ x + b son claramente homeomorfismos de R, luego combinando homote- cias y traslaciones podemos construir un homeomorfismo entre cualquier par de intervalos cerrados de la forma [a, b]. Tambi´n es claro que cualquier par de e intervalos abiertos ]a, b[ son homeomorfos entre s´ al igual que cualquier par de ı, intervalos semiabiertos [a, b[ y ]a, b]. En la secci´n siguiente veremos que tambi´n o e es posible “estirar infinitamente” un intervalo, de modo que, por ejemplo, ]0, 1[ es homeomorfo a R. La topolog´ eucl´ ıa ıdea Notemos que toda aplicaci´n lineal f : Kn −→ Km es o continua, pues es cada una de sus funciones coordenadas es un polinomio. En particular todo automorfismo de Kn es un homeomorfismo. Si V es cualquier K-espacio vectorial de dimensi´n finita n, existe un isomorfismo f : V −→ Kn . o Podemos considerar la topolog´ en V formada por los conjuntos f −1 [G], donde ıa G es abierto en Kn para la topolog´ eucl´ ıa ıdea. Es claro que V es as´ un espacio ı topol´gico homeomorfo a Kn . Adem´s, la topolog´ en V no depende de la o a ıa elecci´n de f , pues si g : V −→ Kn £ cualquier §otro isomorfismo y G es un o es abierto en Kn , entonces g −1 [G] = f −1 (g −1 ◦ f )[G] y (g −1 ◦ f )[G] es un abierto en Kn , porque g −1 ◦ f es un isomorfismo y por consiguiente un homeomorfismo. M´s a´n, la aplicaci´n k k : V −→ R dada por kvk = kf (v)k es claramente a u o una norma en V que induce la topolog´ que acabamos de definir. Esto justifica ıa las definiciones siguientes: Definici´n 1.68 Un isomorfismo topol´gico entre dos espacios vectoriales to- o o pol´gicos es una aplicaci´n entre ambos que sea a la vez isomorfismo y homeo- o o morfismo. Si V es un K-espacio vectorial de dimensi´n finita n, llamaremos o topolog´ eucl´ ıa ıdea en V a la unica topolog´ respecto a la cual todos los isomor- ´ ıa fismos de V en Kn son topol´gicos. o Si h : V −→ W es una aplicaci´n lineal entre dos espacios vectoriales de o dimensi´n finita, entonces es continua, pues considerando isomorfismos (to- o pol´gicos) f : V −→ Km y g : W −→ Kn tenemos que la aplicaci´n h0 = o o f −1 ◦ h ◦ g : Km −→ Kn es lineal, luego continua, luego h = f ◦ h0 ◦ g −1 tambi´n e es continua. Si W es un subespacio de V , entonces la restricci´n a W de la topolog´ o ıa eucl´ ıdea en V es la topolog´ eucl´ ıa ıdea. Para probarlo descomponemos V = W ⊕ W 0 y observamos que la identidad de W con la topolog´ eucl´ ıa ıdea a W con la topolog´ inducida es continua por ser lineal y su inversa es continua por ser ıa la restricci´n de la proyecci´n de V en W , que tambi´n es lineal. Por lo tanto o o e se trata de un homeomorfismo y ambas topolog´ coinciden. ıas Similarmente se prueba que la topolog´ eucl´ ıa ıdea en un producto de espacios vectoriales coincide con el producto de las topolog´ eucl´ ıas ıdeas. Todo subespacio W de un espacio vectorial de dimensi´n finita V es cerrado. o Para probarlo observamos que W puede expresarse como el n´cleo de una apli- u caci´n lineal de W en Kn , es decir, como la antiimagen de 0 por una aplicaci´n o o continua y, como {0} es cerrado, su antiimagen tambi´n. e
  • 47.
    1.5. Continuidad 31 Todos estos hechos se trasladan sin dificultad a los espacios afines sobre K. Se define la topolog´ eucl´ ıa ıdea en un espacio af´ de modo que todas las ın afinidades son continuas y las variedades afines son cerradas. *Ejemplo: La topolog´ proyectiva Un espacio proyectivo sobre K es de ıa la forma X = P(V ), donde V es un K-espacio vectorial de dimensi´n n + 1. o Consideremos la aplicaci´n P : V {~ −→ X dada por P (~ ) = h~ i. Vamos o 0} v v a considerar en X la menor topolog´ que hace continua a P , es decir, los ıa abiertos de X ser´n los conjuntos G ⊂ X tales que P −1 [G] es abierto en V a (respecto a la topolog´ eucl´ ıa ıdea). Es f´cil ver que los conjuntos as´ definidos a ı determinan realmente una topolog´ en X. En lo sucesivo consideraremos a ıa todos los espacios proyectivos como espacios topol´gicos con esta topolog´ La o ıa. llamaremos topolog´ proyectiva. Vamos a probar algunos hechos en torno a ıa ella: La proyecci´n P : V {~ −→ X es continua, abierta y suprayectiva. o 0} S´lo hemos de comprobar que es abierta. Sea G un abierto en V {~ Hemos o £ § 0}. de ver que G0 = P −1 P [G] es abierto en V {~ Es claro que G ⊂ G0 . Sea 0}. ~ ∈ G. Esto significa que existe un w ∈ G tal que P (~ ) = P (w), luego ~ = αw, v ~ v ~ v ~ para un α ∈ K. La homotecia h(~ ) = α~ es un homeomorfismo que transforma x x G en un entorno de ~ . Adem´s h[G] ⊂ h[G0 ] = G0 , luego G0 es entorno de ~ . v a v Las homograf´ entre espacios proyectivos son homeomorfismos. ıas Dada una homograf´ H : X −→ Y , sea h : V −→ W el isomorfismo que ıa la induce, que de hecho es un homeomorfismo. Sean P : V {~ −→ X y 0} P 0 : W {~ −→ Y las proyecciones que definen la topolog´ Entonces, si G es 0} ıa. £ § abierto en Y , por definici´n P 0−1 [G] es abierto en W {~ luego h−1 P 0−1 [G] es o 0}, £ −1 § abierto en V {~ pero es f´cil ver que este conjunto coincide con P −1 H [G] , 0}, a luego H −1 [G] es abierto, y el mismo razonamiento se aplica a la homograf´ ıa inversa. Si E es un hiperplano de V que no pasa por ~ entonces P [E] es 0, abierto en X y P |E : E −→ P [E] es un homeomorfismo. Claramente P |E es inyectiva y continua. Basta£probar que si A es abierto § en E entonces P [A] es abierto en X. Sea B = P −1 P [A] . Basta ver que B es abierto en V {~ Es claro que B = {α~ | α ∈ K {0}, ~ ∈ A}. 0}. v v Escogiendo una base adecuada ~1 , . . . , ~n+1 en V podemos suponer que E v v est´ formado por los vectores con ultima coordenada es xn+1 = 1. Para cada a ´ ~ ∈ V sea α(~ ) su ultima coordenada. La aplicaci´n α es continua. Sea G el v v ´ o conjunto de vectores de V § £ con α(~ ) 6= 0. Tenemos que G es abierto, pues su v complementario es α−1 {0} . La aplicaci´n G −→ E dada por ~ 7→ α(~ )−1 ~ es o v v v continua y B es la antiimagen de A por esta aplicaci´n, luego es abierto en G, o luego en V {~ 0}. Las subvariedades proyectivas de X son cerradas.
  • 48.
    32 Cap´ ıtulo 1. Topolog´ ıa Dado un hiperplano E en V que no pase por 0, tenemos que el comple- mentario de P [E] es un hiperplano de X y, seg´n lo que acabamos de probar, u es cerrado. Como existe una homograf´ que transforma un hiperplano en otro ıa cualquiera, concluimos que todos los hiperplanos son cerrados y, como toda sub- variedad proyectiva es intersecci´n de un n´mero finito de hiperplanos, resulta o u que todas las subvariedades de X son cerradas. La topolog´ inducida por X en una subvariedad proyectiva Y es la ıa topolog´ proyectiva de Y . ıa Sea Y = P(W ). Tomemos un punto y ∈ Y . Sea Π un hiperplano en X que no contenga a y, sea Π0 = Y ∩ Π. Entonces una base de entornos de y para las topolog´ de X e Y son los abiertos que contienen a y y est´n contenidos ıas a en X Π e Y Π0 respectivamente. Las topolog´ de estos espacios son las ıas eucl´ ıdeas, luego una es la inducida por la otra, luego los entornos b´sicos de a y en Y son las intersecciones con Y de los entornos b´sicos de y en X. Por a consiguiente, la topolog´ proyectiva y la topolog´ inducida tienen una misma ıa ıa base de entornos de cada punto, luego son iguales. Para terminar describiremos la topolog´ de la recta proyectiva compleja. ıa Tenemos que P1 (C) = C ∪ {∞}. La topolog´ en C es la eucl´ ıa ıdea. S´lo falta o determinar los entornos de ∞. Como la aplicaci´n 1/z es un homeomorfismo, o una base de entornos de ∞ la forman las im´genes por 1/z de los elementos de a una base de entornos de 0, por ejemplo las bolas abiertas eucl´ ıdeas de centro 0. Pero la imagen de B≤ (0) est´ formada por ∞ y los puntos z ∈ C tales que |z| > a 1/≤, luego una base de entornos abiertos de ∞ la forman los complementarios de las bolas cerradas de centro 0. Es f´cil ver entonces que un conjunto U es a un entorno de ∞ si y s´lo si ∞ ∈ U y U {∞} est´ acotado. Esta misma o a descripci´n vale para los entornos de ∞ en P1 (R). o Ejercicio: Probar que las homograf´ entre c´nicas y rectas son homeomorfismos. ıas o Ejemplo: La proyecci´n estereogr´fica Consideremos la esfera de centro o a (0, 0, 0) y radio 1, es decir, el conjunto S = {(x, y, z) ∈ R3 | x2 + y 2 + z 2 = 1}. Sea N = (0, 0, 1) el “polo norte” de S. La proyecci´n estereogr´fica es la biyecci´n entre S {N } y R2 que a cada o a o punto P de S le asigna el punto donde la recta N P corta al plano z = 0 (que podemos identificar con R2 ). Si P tiene coordenadas (x, y, z), la recta N P est´ formada por los puntos (0, 0, 1) + λ(x, y, x − 1), con λ ∈ R. El valor de a λ que anula la tercera coordenada es el que cumple 1 + λ(z − 1) = 0, o sea, λ = 1/(1 − z), luego la proyecci´n de P es el punto o µ ∂ x y f (x, y, z) = , . 1−z 1−z Similarmente se calcula la proyecci´n inversa, que es o µ ∂ 2u 2v u2 + v 2 − 1 g(u, v) = , , . u2 + v 2 + 1 u2 + v 2 + 1 u2 + v 2 + 1
  • 49.
    1.5. Continuidad 33 Es evidente que tanto f como g son continuas, luego la proyecci´n este- o reogr´fica es un homeomorfismo. As´ pues, el plano es homeomorfo a una esfera a ı menos un punto. Equivalentemente, podemos decir que la esfera es homeomorfa al plano m´s a un punto (extendiendo adecuadamente la topolog´ ıa). Conviene identificar el plano con el cuerpo complejo C. A˜adamos a C un punto cualquiera que repre- n sentaremos por ∞, con lo que formamos el conjunto C∞ = C ∪ {∞}. Podemos extender la proyecci´n estereogr´fica a una biyecci´n f : S −→ C∞ sin m´s que o a o a asignar f (N ) = ∞. Es obvio que si tomamos como abiertos en C∞ las im´genesa por f de los abiertos de S obtendremos una topolog´ en C∞ que induce en ıa C la topolog´ eucl´ ıa ıdea. Vamos a dar una descripci´n directa de una base de o entornos de ∞. Para ello consideramos una base de entornos de N en S, concretamente la formada por las bolas de radio menor que 1. p entorno b´sico de N est´ Un a a formado por los puntos (x, y, x) ∈ S tales que x2 + y 2 + (z − 1)2 < ≤ < 1, y como x2 +y 2 +z 2 = 1, esto equivale a z > 1−≤2 /2. Puesto que ≤ es arbitrario, los entornos b´sicos est´n formados por los puntos (x, y, z) ∈ S tales que 1 − z < ≤, a a para ≤ > 0. Calculemos la imagen de uno de estos entornos. Para ello notamos que si (x, y, z) 6= N , r 1+z |f (x, y, z)| = , 1−z y que si z < z 0 entonces z − zz 0 < z 0 − zz 0 , luego r r r r z z0 2z 2z 0 1+z 1 + z0 < , 1+ < 1+ , < . 1−z 1−z 1−z 1 − z0 1−z 1 − z0 En otras palabras, cuanto mayor es z, mayor es la distancia a 0 de f (x, y, z). Por consiguiente, los puntos tales que z > 1 − ≤ se corresponden con los puntos tales que r 2 |f (x, y, z)| > |f (x, y, 1 − ≤)| = − 1. ≤ Ahora bien, cualquier M > 0 es de esta forma para alg´n ´psilon, concre- u e tamente ≤ = 2/(M 2 + 1). Concluimos que los entornos b´sicos de ∞ son los a conjuntos de la forma {z ∈ C | |z| > M } ∪ {∞}. Esto significa que un punto del plano est´ m´s cerca de infinito cuanto m´s a a a lejos est´ de 0 (de hecho, cuanto m´s lejos est´ de cualquier punto concreto del a a a plano). *Nota Obviamente C∞ es la recta proyectiva compleja con la topolog´ pro- ıa yectiva. Otra forma de llegar al mismo resultado es la siguiente: Si consi- deramos la proyecci´n estereogr´fica entre S y la recta proyectiva compleja, o a podemos expresarla como f (x, y, z) = h(x, y, 1 − z)i, es decir, como la compo- sici´n de la aplicaci´n continua (x, y, z) 7→ (x, y, 1 − z) con la aplicaci´n con- o o o tinua (x, y, z) 7→ h(x, y, z)i, luego es continua. Podr´ıamos probar tambi´n que e
  • 50.
    34 Cap´ ıtulo 1. Topolog´ ıa la inversa es continua, pero no merece la pena el esfuerzo, pues en el cap´ıtulo siguiente (ver 2.12) ser´ evidente a partir de lo que ya hemos probado. La con- a clusi´n es, pues, que la proyecci´n estereogr´fica es un homeomorfismo entre la o o a esfera con la topolog´ eucl´ ıa ıdea y la recta compleja con la topolog´ proyectiva. ıa De aqu´ se sigue f´cilmente que si dotamos al plano hiperb´lico de la topo- ı a o log´ relativa (es decir, si dotamos al plano de Klein con la topolog´ eucl´ ıa ıa ıdea) entonces la topolog´ correspondiente en el c´ ıa ırculo y en el semiplano de Poincar´e es tambi´n la eucl´ e ıdea. Teniendo en cuenta que los c´ ırculos de centro 0 en el plano de Klein coinciden con los eucl´ıdeos (y que las isometr´ son obviamente ıas homeomorfismos) es claro que la esta topolog´ es la inducida por la m´trica ıa e hiperb´lica. o 1.6 L´ ımites de funciones El concepto de l´ımite es, junto al de continuidad, uno de los conceptos m´s a importantes a los que la estructura topol´gica sirve de© o soporte. Para comprender ™ su contenido podemos considerar la funci´n f : R2 (0, 0) −→ R dada por o √ ! 2 f (x, y) = x2 p −1 . x2 + y 2 Esta expresi´n no tiene sentido cuando (x, y) = (0, 0), por lo que es natural o preguntarse si la gr´fica de f mostrar´ alguna particularidad que explique por a a qu´ no puede ser calculada en este punto. He aqu´ dicha gr´fica: e ı a Su aspecto es el de una superficie homeomorfa a R2 , pero sabemos que no est´ definida en (0, 0). De hecho la gr´fica hace pensar que f (0, 0) = 0. La a a explicaci´n es que la funci´n f : R2 −→ R definida mediante o o  µ ∂  2 √ 2 x −1 si (x, y) 6= (0, 0), f (x, y) = x2 +y 2  0 si (x, y) = (0, 0) es continua, aunque esto no es evidente y, de hecho, no estamos en condiciones de probarlo ahora. Si queremos expresar la situaci´n en t´rminos de la expresi´n o e o original de f , no definida en (0, 0), habremos de decir que f transforma los
  • 51.
    1.6. L´ ımites de funciones 35 puntos de alrededor de (0, 0) en puntos de alrededor de 0, o tambi´n, que los e valores que toma f son m´s cercanos a 0 cuanto m´s cercanos a (0, 0) son los a a puntos que consideramos. Todo esto tiene sentido aunque la funci´n f no est´ o e definida en (0, 0). Comenzamos introduciendo el concepto topol´gico que permite expresar con o rigor las ideas que acabamos de introducir: Definici´n 1.69 Sean X, Y espacios topol´gicos, A ⊂ X y f : A −→ Y . Sea o o a ∈ A0 y b ∈ Y . Diremos que f converge a b cuando x tiende a a si para todo entorno V de b existe un entorno U de a tal que si x ∈ U ∩ A y x 6= a, entonces f (x) ∈ V . La interpretaci´n es clara: los puntos f (x) est´n alrededor de b [= en un o a entorno arbitrario V de b] siempre que x est´ alrededor de a [= en un entorno a adecuado U de a, que depender´ de V ], o m´s simplemente: si f env´ los puntos a a ıa de alrededor de a a los alrededores de b. Si Y es un espacio de Hausdorff, una funci´n converge a lo sumo a un unico b o ´ para cada punto a. En efecto, si f converge a dos puntos b y b0 cuando x tiende a a, podr´ıamos tomar entornos disjuntos V y V 0 de b y b0 , para los cuales existir´ ıan entornos U y U 0 de a de modo que si x ∈ U ∩ U 0 ∩ A, entonces f (x) ∈ V ∩ V 0 , contradicci´n. o Por ello, si se da la convergencia, diremos que b es el l´ ımite cuando x tiende a a de f (x), y lo representaremos por b = l´ f (x). ım x→a No exigimos que la funci´n f est´ definida en a. Tan s´lo que a sea un punto o e o de acumulaci´n del dominio de f o, de lo contrario, no existir´ puntos x a los o ıan que aplicar la definici´n y f converger´ trivialmente a todos los puntos de Y . o ıa En estos t´rminos, lo que afirm´bamos antes es que existe e a √ ! 2 l´ ım x2 p − 1 = 0, (x,y)→(0,0) x2 + y 2 de modo que los valores que toma esta expresi´n se acercan m´s a 0 cuanto m´s o a a se acercan las variables al punto (0, 0). Todav´ no podemos probarlo. ıa Por supuesto es posible que la funci´n f est´ definida en a, pero esto es irrele- o e vante, pues en la definici´n de l´ o ımite aparecen s´lo puntos x 6= a, lo que significa o que el l´ ımite es independiente de f (a). En otras palabras, si modific´ramos el a valor de f (a), la existencia del l´ ımite y su valor concreto no se alterar´ıan. Tambi´n es obvio que la existencia o no de l´ e ımite s´lo depende del compor- o tamiento de la funci´n en un entorno del punto. En otras palabras, que si dos o funciones coinciden en un entorno de un punto a (salvo quiz´ en a) entonces a ambas tienen l´ ımite en a o ninguna lo tiene y, si lo tienen, ´stos coinciden. e La relaci´n entre los l´ o ımites y la continuidad es la siguiente:
  • 52.
    36 Cap´ ıtulo 1. Topolog´ ıa Teorema 1.70 Sean X, Y espacios topol´gicos y f : X −→ Y . Sea a ∈ X 0 . o Entonces f es continua en a si y s´lo si existe l´ f (x) = f (a). o ım x→a ´ Demostracion: Si el l´ ımite vale f (a), entonces la definici´n de l´ o ımite se cumple trivialmente cuando x = a y lo que queda es la definici´n de conti- o nuidad en a. Rec´ ıprocamente, la definici´n de continuidad de f en a implica o trivialmente la definici´n de l´ o ımite con b = f (a). Mediante este teorema podemos deducir las propiedades algebraicas de los l´ ımites a partir de las propiedades correspondientes de las funciones continuas. Teorema 1.71 Sean f , g : A ⊂ X −→ K dos funciones definidas sobre un espacio topol´gico X y sea a ∈ A0 . Si existen o l´ f (x) ım y l´ g(x) ım x→a x→a entonces tambi´n existen e ° ¢ l´ f (x) + g(x) = ım l´ f (x) + l´ g(x), ım ım x→a x→a x→a ≥ ¥≥ ¥ l´ f (x)g(x) = ım l´ f (x) ım l´ g(x) , ım x→a x→a x→a f (x) l´ f (x) ım x→a l´ ım = , x→a g(x) l´ g(x) ım x→a (suponiendo, adem´s, en el tercer caso que l´ g(x) 6= 0.) a ım x→a ´ Demostracion: La prueba es la misma en todos los casos. Veamos la primera. Consideramos la funci´n f 0 que coincide con f en todos los puntos o salvo en a, donde toma el valor del l´ımite. Definimos igualmente g 0 . Entonces el teorema anterior implica que f y g 0 son continuas en a, luego f 0 + g 0 tambi´n 0 e lo es, luego por el teorema anterior existe ° ¢ l´ f (x) + g(x) = f 0 (a) + g 0 (a), ım x→a 0 0 ımite de f 0 + g 0 coincide con pero como f + g coincide con f + g salvo en a, el l´ el de f + g, y tenemos la relaci´n buscada. o Es claro que el resultado sobre suma de l´ ımites es v´lido cuando las funciones a toman valores en cualquier espacio vectorial topol´gico. Adem´s en tal caso al o a multiplicar una funci´n por un escalar el l´ o ımite se multiplica por el mismo (para el caso de K esto es un caso particular de la segunda igualdad). La misma t´cnica e nos da inmediatamente: Teorema 1.72 Sea f : A ⊂ X −→ X1 × ·° · × Xn una aplicaci´n entre espacios · ¢ o topol´gicos, que ser´ de la forma f (x) = f1 (x1 ), . . . , fn (x) , para ciertas fun- o a ciones fi : X −→ Xi . Sea a ∈ A0 . Entonces existe l´ f (x) si y s´lo si existen ım o x→a todos los l´ ımites l´ fi (x) y en tal caso ım x→a ≥ ¥ l´ f (x) = l´ f1 (x), . . . , l´ fn (x) . ım ım ım x→a x→a x→a
  • 53.
    1.6. L´ ımites de funciones 37 Para calcular el l´ ımite que tenemos pendiente necesitamos un hecho que a menudo resulta util. Diremos que una funci´n f con valores en un espacio ´ o m´trico est´ acotada si su imagen es un conjunto acotado. e a Teorema 1.73 Sean f , g : A ⊂ X −→ E dos funciones definidas de un espacio topol´gico X en un espacio normado E y sea a ∈ A0 . Si existe l´ f (x) = 0 y o ım x→a g est´ acotada, entonces existe l´ f (x)g(x) = 0. a ım x→a ´ Demostracion: Si g est´ acotada, existe un M > 0 tal que kg(x)k ≤ M a para todo x ∈ A. Entonces kf (x)g(x)k ≤ M kf (x)k. El hecho de que f tienda a 0, sustituyendo los entornos en E de la definici´n general por bolas abiertas, o queda as´ı: Para todo ≤ > 0 existe un entorno U de a tal que si x ∈ U ∩ A y x 6= a, entonces kf (x)k < ≤. Tomamos ahora ≤ > 0 y aplicamos este hecho a ≤/M , con lo que si x ∈ U ∩ A y x 6= a, tenemos que kf (x)g(x)k ≤ M kf (x)k < ≤, y esto significa que f g tiende a 0. Ejemplo Se cumple √ ! 2 2 l´ ım x p −1 = 0, (x,y)→(0,0) x2 + y 2 En efecto, basta probar que 2x2 l´ ım p = 0, (x,y)→(0,0) x2 + y 2 pues el otro sumando, x2 tiende obviamente a 0, por continuidad. Factorizamos 2x xp . x2 + y 2 El primer factor tiende a 0 y el segundo est´ acotado, pues se comprueba a f´cilmente que a x −1 ≤ p ≤ 1. x2 + y 2 Ahora basta aplicar el teorema anterior. El hecho de que la composici´n de funciones continuas es continua se traduce o ahora en el hecho siguiente: Teorema 1.74 Sea f : X −→ Y y g : Y −→ Z, sea a ∈ X 0 y supongamos que existe l´ f (x) = b ım x→a y que g es continua en b. Entonces ≥ ¥ ° ¢ g l´ f (x) = l´ g f (x) . ım ım x→a x→a
  • 54.
    38 Cap´ ıtulo 1. Topolog´ ıa Demostracion: Sea U un entorno de g(b). Entonces g −1 [U ] es un entorno ´ de b. Existe un entorno V de a tal que si x ∈ V , x 6= a, entonces f (x) in g −1 [U ], luego g(f (x)) ∈ U . Por lo tanto se cumple la definici´n de l´ o ımite. Por ejemplo, la continuidad de la ra´ cuadrada implica que ız s 2 l´ ım |x| p − 1 = 0. (x,y)→(0,0) x 2 + y2 Ejercicio: Dar un ejemplo que muestre la falsedad de la afirmaci´n siguiente: Dadas o dos funciones f , g : R −→ R, si existen l´ f (x) = b, l´ g(x) = c entonces existe ım ım x→a x→b tambi´n l´ g(f (x)) = c. Probar que es cierta si f (x) 6= b para x 6= a. e ım x→a Limites restringidos El l´ ımite de una funci´n en un punto depende del do- o minio de ´sta, por eso es importante lo que ocurre al restringir una funci´n a e o dominios menores. Por ejemplo pensemos en la funci´n f : R −→ R dada por o Ω −1 si x < 0 f (x) = 1 si x ≥ 0 Es claro que no tiene l´ ımite en 0, pero s´ lo tienen las funciones f |]−∞,0[ y ı f |]0,+∞[ . Si consideramos s´lo la parte de la izquierda de la funci´n, resulta que o o es constante igual a −1, de donde su l´ ımite es −1. Igualmente el l´ ımite de la parte derecha es 1. Por ello definimos: Definici´n 1.75 Sea f : A ⊂ X −→ Y , B ⊂ A y a ∈ B 0 . Definimos o l´ f (x) = l´ f |B (x). ım x→a ım x→a B Para el caso de funciones definidas sobre subconjuntos de R se define l´ f (x) = x→a f (x), ım l´ ım l´ f (x) = x→a f (x), ım l´ ım x→a− x→a+ ]−∞,a[ ]a,+∞[ y se llaman, respectivamente, l´ ımite por la izquierda y l´ ımite por la derecha de f en a. Tambi´n se les llama l´ e ımites laterales. Su utilidad se debe al teorema siguiente: Teorema 1.76 Sea A un subconjunto de un espacio X y f : A −→ Y . Supon- gamos que A = B1 ∪ · · · ∪ Bn y que a es un punto de acumulaci´n de todos estos o conjuntos. Entonces existe l´ f (x) si y s´lo si existen los l´ ım o ımites x→a f (x) para l´ ım x→a Bi i = 1, . . . , n y todos coinciden. En tal caso f (x) es igual al l´ ımite com´n. u ´ Demostracion: Si existen tales l´ ımites y todos valen L, sea V un entorno de L. Por definici´n existen entornos Ui de a tales que si x ∈ Ui ∩ (A ∩ Bi ) y o x 6= a, entonces f (x) ∈ V . Si U es la intersecci´n de los conjuntos Ui , entonces o U es un entorno de a y si x ∈ U ∩ A, x 6= a, existir´ un i tal que x ∈ Bi , luego a f (x) ∈ V , es decir, l´ f (x) = L. El rec´ ım ıproco es m´s sencillo. a x→a
  • 55.
    1.6. L´ ımites de funciones 39 Ejemplo Se cumple s 2 l´ ım x p − 1 = 0. (x,y)→(0,0) x2 + y2 Para comprobarlo calculamos los l´ ımites s s 2 2 l´ ım x p −1=− l´ ım |x| p − 1 = 0, (x,y)→(0,0) x2 + y2 (x,y)→(0,0) x2 + y2 x≤0 x≤0 s s 2 2 l´ ım x p −1= l´ ım |x| p − 1 = 0, (x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y2 x≥0 x≥0 y aplicamos el teorema anterior. Ejemplo: la proyecci´n c´nica Veamos ahora un caso en el que nos aparece o o de forma natural el c´lculo de un l´ a ımite. Consideremos de nuevo la esfera S y el cono C formado al unir el polo sur (0, 0 − 1) con los puntos del ecuador de S. La figura muestra un corte transversal de S y C. Vamos a probar que S {N } es homeomorfo a una porci´n de C o mediante la aplicaci´n que traslada radialmente o cada punto. Un punto (x, y, z) de C est´ en el segmento que une el punto (0, 0, −1) con a un punto (a, b, 0), donde a2 + b2 = 1. Por tanto ser´ de la forma a (x, y, z) = (0, 0, −1) + λ(a, b, −1), con λ ∈ R. Entonces λ = z + 1, luego x = a(z + 1), y = b(z + 1). De aqu´ se sigue que ı p z + 1 = ± x2 + y 2 . Rec´ıprocamente, si un punto cumple esta ecuaci´n, si z = −1 ha de ser o (0, 0, −1), que est´ en C, y si z 6= −1, entonces los valores a x y λ = z + 1, a= , b= , z+1 z+1 permiten expresar a (x, y, z) en la forma param´trica anterior, luego se trata de e un punto de C. Nos interesa s´lo la porci´n de C formada por los puntos con o o altura entre −1 y 1, por lo que definimos © p ™ C = (x, y, z) ∈ R3 | z + 1 = x2 + y 2 , −1 ≤ z < 1 .
  • 56.
    40 Cap´ ıtulo 1. Topolog´ ıa Notar que los puntos con z = 1 no est´n en C. El homeomorfismo que bus- a camos ha de transformar cada punto (x, y, z) de S {N } en un punto (λx, λy, z), donde λ ≥ 0 es el adecuado para llegar a C. La condici´n es o p (λx)2 + (λy)2 = z + 1 p √ y, teniendo en cuenta que los puntos de la esfera cumplen x2 + y 2 = 1 − z 2 , r 1+z 1+z λ= p = . x2 + y 2 1−z Por lo tanto f : S {N } −→ C ser´ la aplicaci´n dada por a o √r r ! 1+z 1+z f (x, y, z) = x, y, z . 1−z 1−z La inversa se calcula sin dificultad a partir de esta expresi´n: o √r r ! 1−z 1−z g(x, y, z) = x, y, z , si (x, y, z) 6= (0, 0, −1), 1+z 1+z y por supuesto g(0, 0, −1) = (0, 0, −1). Obviamente f es continua. Lo mismo vale para g en todos los puntos salvo en (0, 0, −1).pPara probar la continuidad en este punto hacemos uso de la igualdad 1 + z = x2 + y 2 , que cumplen todos los puntos de C, la cual nos permite expresar g como √ s s ! 2 2 g(x, y, z) = x p − 1, y p − 1, z . x2 + y 2 x2 + y 2 Basta probar que √ s s ! 2 2 l´ ım x p − 1, y p − 1, z = (0, 0, −1), (x,y,z)→(0,0,−1) x2 + y 2 x2 + y 2 pero los dos primeros l´ ımites son el que hemos calculado como ejemplo a lo largo de la secci´n. o As´ pues, f es un homeomorfismo entre S {N } y C. Ahora bien, es in- ı mediato comprobar que la proyecci´n sobre el plano XY es un homeomor- o fismo entre C y la bola abierta de centro 0 y radio 2 (la aplicaci´n inversa es p o (x, y) 7→ (x, y, −1 + x2 + y 2 ), claramente continua), con lo que la composici´n o √r r ! 1+z 1+z h(x, y, z) = x, y . 1−z 1−z
  • 57.
    1.6. L´ ımites de funciones 41 es un homeomorfismo entre S {N } y dicha bola. M´s a´n, si componemos a u la inversa de la proyecci´n estereogr´fica con esta aplicaci´n obtenemos un ho- o a o meomorfismo entre R2 y el disco abierto. Es f´cil ver que la composici´n es a o √ p p ! 2x x2 + y 2 2y x2 + y 2 t(x, y) = , . x2 + y 2 + 1 x2 + y 2 + 1 Si quitamos los doses obtenemos un homeomorfismo t : R2 −→ D, donde D es la bola abierta (eucl´ ıdea) de centro 0 y radio 1. Concretamente: √ p p ! x x2 + y 2 y x2 + y 2 t(x, y) = , . x2 + y 2 + 1 x2 + y 2 + 1 Si restringimos esta aplicaci´n a R, es decir, a los puntos (x, 0) obtenemos o un homeomorfismo entre R y el intervalo ]−1, 1[. Concretamente x|x| t(x) = . x2 + 1 He aqu´ su gr´fica: ı a 0.75 0.5 0.25 -2 -1 1 2 -0.25 -0.5 -0.75 Si lo restringimos a ]0, +∞[ obtenemos un homeomorfismo entre este inter- valo y ]0, 1[. A saber: x2 t(x) = 2 . x +1 A partir de aqu´ es f´cil ver que dos intervalos abiertos cualesquiera (acotados ı a o no) son homeomorfos. L´ ımites infinitos Consideremos ahora l´ ımites de funciones con valores en R = R ∪ {−∞, +∞} o en C∞ = C ∪ {∞}. Recordando que los entornos b´sicos a de +∞ son los intervalos ]M, +∞], es claro que l´ f (x) = +∞ ım x→a significa que para todo M > 0 existe un entorno U de a tal que si x ∈ U , x 6= a est´ en el dominio de f , entonces f (x) > M . Similarmente ocurre con −∞. a Que el l´ ımite valga ∞ significa que para todo M > 0 existe un entorno U de a tal que si x ∈ U , x 6= a est´ en el dominio de f , entonces |f (x)| > M . a Es f´cil probar que los teoremas del estilo de “el l´ a ımite de la suma es la suma de los l´ ımites” etc. valen tambi´n en los casos siguientes: e +∞ + (+∞) = +∞, −∞ + (−∞) = −∞,
  • 58.
    42 Cap´ ıtulo 1. Topolog´ ıa +∞ + a = +∞, −∞ + a = −∞, ∞ + a = ∞, (+∞)(+∞) = +∞, (−∞)(−∞) = +∞, ∞ ∞ = ∞. si a > 0, (+∞)a = +∞, (−∞)a = −∞; si a < 0, (+∞)a = −∞, (−∞)a = +∞. a a a Si a 6= 0, ∞ a = ∞, = = 0, = ∞. ±∞ ∞ 0 Por ejemplo, la igualdad +∞ + (+∞) = +∞ es una forma de expresar que la suma de dos funciones f , g : A ⊂ X −→ R que tienden a +∞ en un punto a ∈ A0 , tiende tambi´n a +∞. La prueba es sencilla: dado un M > 0 existen e entornos U y V de a tales que si x ∈ U ∩A0 entonces f (x) > M/2 y si x ∈ V ∩A0 entonces g(x) > M/2, con lo que si x ∈ U ∩ V ∩ A entonces f (x) + g(x) > M , luego se cumple la definici´n de l´ o ımite. Similarmente se prueban todas las dem´s. a C´lculo de l´ a ımites Estudiamos ahora los l´ ımites m´s simples y frecuentes. a Comencemos con los l´ ımites en infinito de los polinomios. Obviamente l´ ım x = ±∞. x→±∞ Aplicando n veces la regla (+∞)(+∞) = +∞ vemos que si n > 0 entonces ım xn = +∞. l´ x→+∞ ımite en −∞ ser´ obviamente (−1)n ∞. Si n < 0 usamos la regla 1/±∞ = 0 El l´ a y si n = 0 tenemos que x0 es la constante 1, luego en total:   +∞ si n > 0, ım xn = l´ 1 si n = 0, x→+∞  0 si n < 0. El l´ ımite en −∞ difiere s´lo en el primer caso, de forma obvia. o Para calcular el l´ ımite de un polinomio multiplicamos y dividimos por la potencia de x de mayor grado: µ ∂ 3 1 2 5 ım 8x5 − 3x4 + x3 + 2x − 5 = l´ l´ ım x5 8 − + 2 + 4 − 5 = +∞. x→+∞ x→+∞ x x x x En general, si p(x) ∈ R[x] no es constante, se cumple l´ ım P (x) = ±∞, x→±∞ donde el signo depende en forma obvia del signo del coeficiente director de P y de la paridad del grado si tendemos a −∞. En C∞ todos los polinomios no constantes tienen l´ ımite ∞. En particular vemos que, a diferencia de casos como 1/∞ o +∞ + ∞, no hay una regla general para calcular un l´ ımite de la forma +∞ − ∞. En efecto,
  • 59.
    1.7. Convergencia desucesiones 43 los tres l´ ımites siguientes son de este tipo y cada uno da un resultado distinto. Por ello se dice que +∞ − ∞ es una indeterminaci´n. o ım x5 − x2 = +∞, l´ ım x2 − x5 = −∞, l´ l´ (x + 2) − (x + 1) = 1. ım x→+∞ x→+∞ x→+∞ Nos ocupamos ahora de los l´ ımites de fracciones algebraicas (cocientes de polinomios). El ejemplo siguiente ilustra el caso general: 3 1 1 6x4 − 3x3 + x + 1 6 − x + x3 + x4 6 l´ ım = l´ ım = = 3. x→+∞ 2x4 + x2 − 2x + 2 x→+∞ 2 + 1 − 2 + 2 2 x2 x3 x4 Es claro que el l´ ımite en ±∞ del cociente de dos polinomios del mismo grado es el cociente de los t´rminos directores. Si los grados son distintos, al dividir e entre la potencia de mayor grado obtenemos 0 si el grado del denominador es mayor y ±∞ si es mayor el del numerador, donde el signo se calcula de forma ımites en C∞ . obvia. Esto vale igualmente (salvo lo dicho de los signos) para l´ Vemos, pues que el caso ∞/∞ es tambi´n una indeterminaci´n. e o Por ejemplo, antes hemos probado que la funci´n o x|x| t(x) = x2 + 1 es un homeomorfismo entre R y el intervalo ]−1, 1[. Ahora es claro que l´ ım = ±1, x→±∞ luego si definimos t(±∞) = ±1 tenemos una biyecci´n continua t : R −→ [−1, 1]. o En el cap´ıtulo siguiente veremos que es un homeomorfismo. Ejercicio: Calcular t−1 y probar que es continua. 1.7 Convergencia de sucesiones Si los l´ ımites de funciones tienen especial inter´s en el c´lculo diferencial, en e a topolog´ son m´s importantes los l´ ıa a ımites de sucesiones, que en realidad son un caso particular de los primeros. Definici´n 1.77 Una sucesi´n en un conjunto X es una aplicaci´n a : N −→ X. o o o Se suele representar {an }∞ o, m´s gr´ficamente: n=0 a a a0 , a1 , a2 , a3 , ... an , ... En realidad, lo unico que nos interesa de una sucesi´n es el orden en el ´ o que se suceden sus elementos, y no la numeraci´n que ´stos reciben. Por ello o e en la pr´ctica admitiremos sucesiones que comiencen en ´ a ındices mayores de 0. Por ejemplo, la sucesi´n {n}∞ y la sucesi´n {n − 7}∞ son conjuntistamente o n=0 o n=0
  • 60.
    44 Cap´ ıtulo 1. Topolog´ ıa distintas, pero para nosotros ser´n la misma sucesi´n, la sucesi´n de los n´meros a o o u naturales. Por simplicidad, en teor´ hablaremos siempre de sucesiones {an }∞ , aun- ıa n=0 que en la pr´ctica comenzaremos a partir del ´ a ındice que m´s convenga. a La raz´n por la que estas diferencias no nos van a afectar es que s´lo nos van o o a interesar las propiedades finales de las sucesiones. Diremos que una sucesi´n o {an }∞ cumple finalmente una propiedad si existe un n0 ∈ N tal que an cumple n=0 la propiedad para todo n ≥ n0 . Por ejemplo, una sucesi´n es constante si todos sus t´rminos son iguales a o e un cierto elemento x. Una sucesi´n es finalmente constante si es constante a o partir de un t´rmino. La sucesi´n siguiente es finalmente igual a 5: e o 3, 1, −2, 8, 5, 5, 5, 5, 5, 5, ... Una subsucesi´n de {an }∞ es una sucesi´n de la forma {ank }∞ , donde o n=0 o k=0 {nk }∞ es una sucesi´n estrictamente creciente de n´meros naturales, es decir, k=0 o u si k < k0 , entonces nk < nk0 . Una observaci´n util es que en estas condiciones siempre se cumple k ≤ nk . o ´ Se prueba f´cilmente por inducci´n sobre k. a o Definici´n 1.78 Sea X un espacio topol´gico, l ∈ X y {an }∞ una sucesi´n o o n=0 o en X. Diremos que an converge a l si est´ finalmente en todo entorno de l, o a sea, si para cada entorno V de l existe un n0 ∈ N tal que an ∈ V para n ≥ n0 . As´ pues, una sucesi´n converge a un punto l si est´ finalmente alrededor ı o a de l, es decir, si todos sus t´rminos salvo un n´mero finito est´n en cualquier e u a entorno de l prefijado. Si X es un espacio de Hausdorff y {an }∞ converge en X, entonces el punto n=0 al cual converge es unico, pues puntos distintos tienen entornos disjuntos, y una ´ sucesi´n no puede estar finalmente en dos conjuntos disjuntos. Representaremos o por l´ an ım n al unico l´ ´ ımite de la sucesi´n o {an }∞ n=0 en un espacio de Hausdorff, cuando ´ste e exista. Veamos ahora que esta noci´n de l´ o ımite es un caso particular del que hemos estudiado en la secci´n anterior. Consideremos N∞ = N ∪ {∞} con la topolog´ o ıa inducida desde C∞ . Es f´cil ver que la topolog´ en N es la discreta y una base a ıa de entornos de ∞ la forman los conjuntos {n ∈ N | n ≥ n0 } ∪ {∞}. En estos t´rminos, una sucesi´n {an }∞ converge a un punto l si y s´lo si para todo e o n=0 o entorno U de l existe un entorno V de ∞ tal que si n ∈ V , n 6= ∞ entonces an ∈ U , es decir, si y s´lo si la sucesi´n, vista como funci´n N −→ X converge o o o a l cuando n tiende a ∞. En tal caso l´ an = l´ an . ım ım n n→∞ Sabiendo esto, todos los resultados generales para l´ ımites de funciones valen para sucesiones, por ejemplo, el l´ ımite de la suma de dos sucesiones de n´meros u
  • 61.
    1.7. Convergencia desucesiones 45 reales es la suma de los l´ ımites, etc. Veamos ahora algunos hechos espec´ ıficos sobre sucesiones: Una sucesi´n converge si y s´lo si converge finalmente, es decir, o o {an }∞ converge a l si y s´lo si la sucesi´n {an }∞ converge a l. n=0 o o n=k En particular, las sucesiones finalmente constantes convergen. (Esto es consecuencia de que el l´ ımite de una funci´n en un punto — el o punto ∞ en este caso— depende s´lo del comportamiento de la funci´n en un o o entorno del punto). Si A ⊂ X, {an }∞ ⊂ A y l ∈ A, entonces {an }∞ converge a l en n=0 n=0 A si y s´lo si converge a l en X. o (Pues los entornos de l en A son las intersecciones con A de los entornos de l en X y, como la sucesi´n est´ en A, es equivalente que est´ finalmente en un o a e entorno de l en A o que est´ finalmente en un entorno de l en X.) e Este hecho nos dice que la convergencia depende exclusivamente de la su- cesi´n y de su l´ o ımite, y no del espacio en el que los consideremos (siempre que no cambiemos de topolog´ claro est´). Sin embargo, tambi´n de aqu´ se desprende ıa, a e ı que una sucesi´n convergente deja de serlo si eliminamos su l´ o ımite. Por ejemplo, la sucesi´n {1/n}∞ no converge en el espacio ]0, 1], pues si convergiera a un o n=0 punto l, tendr´ıamos que en R deber´ converger a la vez a l y a 0. ıa Si una sucesi´n converge a un punto l, entonces todas sus subsuce- o siones convergen a l. Pues si {an }∞ converge a l y {ank }∞ es una subsucesi´n, para todo n=0 k=0 o entorno U de l existe un n0 tal que si n ≥ n0 se cumple an ∈ U , pero si k ≥ n0 entonces nk ≥ k ≥ n0 , luego ank ∈ U . Ejercicio: Demostrar que una sucesi´n {xn }∞ converge en un espacio producto Q o n=0 Xi a un punto x si y s´lo si las sucesiones {xn }∞ convergen a xi para todo i ∈ I. o i n=0 i∈I No podemos continuar nuestro estudio de las sucesiones sin introducir un nuevo concepto. Sucede que las sucesiones no se comportan adecuadamente en todos los espacios topol´gicos, sino s´lo en aquellos que cumplen la siguiente o o propiedad adicional, por lo dem´s muy frecuente: a Definici´n 1.79 Un espacio X cumple el primer axioma de numerabilidad o (1AN) si para todo punto x ∈ X existe una base de entornos de x de la forma {Vn }∞ . n=0 Esta propiedad la tienen todos los espacios m´tricos, pues si x es un punto e de un espacio m´trico, una base de entornos de x la forman los conjuntos e {B1/n (x)}∞ . As´ pues, todos los espacios que manejamos cumplen 1AN. En n=1 ı el caso de C∞ , en lugar de considerar la m´trica inducida desde la esfera, es e
  • 62.
    46 Cap´ ıtulo 1. Topolog´ ıa m´s f´cil considerar directamente la base de entornos de ∞ formada por los a a conjuntos siguientes: Ø En = {z ∈ C Ø |z| > n} ∪ {∞}, para n = 1, 2, . . . © ™ En R, una base de entornos de +∞ es ]n, +∞] }∞ y una base de entornos © ™ ∞ n=0 de −∞ es [−∞, n[ }n=0 , luego este espacio tambi´n cumple 1AN. e Observemos que si X es un espacio que cumple 1AN y x ∈ X, podemos tomar una base de entornos de x de la forma {Vn }∞ que cumpla adem´s n=0 a V0 ⊃ V1 ⊃ V2 ⊃ V3 ⊃ ... Si una base dada {Wn }∞ no lo cumple, tomamos Vn = W0 ∩ · · · ∩ Wn y as´ n=0 ı tenemos las inclusiones indicadas. Todas las bases de entornos de los ejemplos que acabamos de dar son decrecientes en este sentido. Consideremos ahora esta sucesi´n: o 1, −1, 1, −1, 1, −1, 1, −1, 1, −1, 1, −1, ... Es obvio que no es convergente, pero sin duda hay dos puntos “especiales” para esta sucesi´n, el 1 y el −1. Quiz´ el lector se sienta tentado de afirmar que o a se trata de una sucesi´n con dos l´ o ımites, pero nuestra definici´n de l´ o ımite no admite esa posibilidad. Vamos a dar una definici´n que describa esta situaci´n. o o Definici´n 1.80 Un punto x de un espacio topol´gico X es un punto adherente o o de una sucesi´n {an }∞ en X si para cada entorno V de x y cada n´mero o n=0 u natural n existe un n´mero natural m ≥ n tal que am ∈ V . u Es decir, si la sucesi´n contiene puntos arbitrariamente lejanos en cualquier o entorno de x o, si se prefiere, si la sucesi´n contiene infinitos puntos en cada o entorno de x. En estos t´rminos, la sucesi´n {(−1)n }∞ que hemos puesto como ejemplo e o n=0 tiene exactamente dos puntos adherentes, 1 y −1. Teorema 1.81 Sea X un espacio 1AN. Un punto x ∈ X es un punto adherente de una sucesi´n {an }∞ si y s´lo si ´sta contiene una subsucesi´n que converge o n=0 o e o a x. Demostracion: Si x es un punto adherente de la sucesi´n, sea {Vn }∞ ´ o n=0 una base decreciente de entornos de x. Existe un punto an0 ∈ V0 . Existe un natural n1 ≥ n0 + 1 tal que an1 ∈ V1 . Existe un natural n2 ≥ n1 + 1 tal que an2 ∈ V2 . De este modo obtenemos una subsucesi´n {ank }∞ tal que cada o k=0 ank ∈ Vk y, como la sucesi´n de entornos es decreciente, en realidad Vk contiene o todos los t´rminos de la subsucesi´n posteriores a ank , luego la subsucesi´n que e o o hemos obtenido est´ finalmente en cada entorno Vk , es decir, converge a x. a Rec´ ıprocamente, si hay una subsucesi´n que converge a x, dicha subsucesi´n o o est´ finalmente en cualquier entorno de x, luego dicho entorno contiene infinitos a t´rminos de la sucesi´n dada. e o
  • 63.
    1.7. Convergencia desucesiones 47 En particular vemos que una sucesi´n convergente no tiene m´s punto ad- o a herente que su l´ ımite. La continuidad de funciones puede caracterizarse en t´rminos de sucesiones: e Teorema 1.82 Sea f : X −→ Y una aplicaci´n entre espacios topol´gicos y o o supongamos que X cumple 1AN. Sea x ∈ X. Entonces f es continua en x si y s´lo si para cada sucesi´n {an }∞ ⊂ X tal que l´ an = x, se cumple o o n=0 ım n l´ f (an ) = f (x). ım n ´ Demostracion: Supongamos que f es continua en x. Sea V un entorno de f (x). Entonces f −1 [V ] es un entorno de x y la sucesi´n {an }∞ est´ finalmente o n=0 a en f −1 [V ], luego {f (an )}∞ est´ finalmente en V , o sea, l´ f (an ) = f (x). n=0 a ım n Rec´ıprocamente, supongamos que f no es continua en x. Entonces existe un entorno V de f (x) tal que f −1 [V ] no es entorno de x. Sea {Vn }∞ una n=0 base decreciente de entornos de x. Para cada natural n, no puede ocurrir que Vn ⊂ f −1 [V ], luego existe un punto an ∈ Vn tal que f (an ) ∈ V . / Como la base es decreciente, todos los t´rminos posteriores a an est´n en e a Vn , luego la sucesi´n {an }∞ est´ finalmente en cada Vn , con lo que converge o n=0 a a x. Sin embargo la sucesi´n {f (an )}∞ no tiene ning´n t´rmino en V , luego o n=0 u e no converge a f (x). Los puntos adherentes se caracterizan por sucesiones: Teorema 1.83 Sea X un espacio topol´gico que cumpla 1AN. Sea A ⊂ X. En- o tonces A est´ formado por los l´ a ımites de las sucesiones convergentes contenidas en A. ´ Demostracion: Si l es el l´ ımite de una sucesi´n contenida en A, entonces o todo entorno de l contiene puntos de la sucesi´n, es decir, puntos de A, luego o l ∈ A. ıprocamente, si x ∈ A, tomamos una base decreciente {Vn }∞ de en- Rec´ n=0 tornos abiertos de x. Como Vn ∩ A 6= ∅, existe un an ∈ Vn ∩ A y la sucesi´n o {an }∞ as´ construida converge a x, y est´ contenida en A. n=0 ı a En particular, un conjunto A es cerrado si y s´lo s´ el l´ o ı ımite de toda sucesi´n o convergente contenida en A, est´ en A, es decir, si no es posible “salir” de A a mediante sucesiones. Veamos c´mo puede aplicarse este hecho: supongamos que una sucesi´n de o o n´meros reales cumple l´ an = l y an ≤ 5 para todo n. Entonces la sucesi´n u ım o n est´ contenida en el intervalo cerrado ]−∞, 5], luego su l´ a ımite tambi´n, es decir, e podemos concluir que l ≤ 5. Ejercicio: Probar que si dos sucesiones convergentes de n´meros reales cumplen u an ≤ bn para todo n, entonces l´ an ≤ l´ bn . ım ım n n
  • 64.
    48 Cap´ ıtulo 1. Topolog´ ıa 1.8 Sucesiones y series num´ricas e ımites de sucesiones en K. Vamos a estudiar algunos casos concretos de l´ Consideremos en primer lugar la sucesi´n {rn }∞ , donde r ∈ R. Vamos a o n=0 calcular su l´ ımite. Supongamos primero que r > 1. Sea s = r − 1 > 0. Entonces r = 1 + s y por el teorema del binomio de Newton X µn∂ n n n r = (1 + s) = 1 + ns + sk > ns. k k=2 Sabemos que l´ ns = +∞. Del hecho de que {ns}∞ est´ finalmente en ım n=0 e n cada entorno b´sico de +∞, de la forma ]M, +∞], se sigue claramente que lo a mismo le sucede a {rn }∞ , luego si r > 1 concluimos que l´ rn = +∞. n=0 ım n n Si r = 1 es obvio que l´ r = 1. ım n Si 0 < r < 1 entonces 1 1 l´ rn = l´ ım ım n = = 0. n n (1/r) ∞ Si r = 0 es obvio que l´ rn = 0. ım n En lugar de analizar ahora el caso r < 0 consideraremos en general r ∈ K. Si |r| > 1, entonces l´ |rn | = l´ |r|n = +∞, de donde es f´cil deducir a ım ım a n n n partir de las meras definiciones que l´ r = ∞. ım n Si |r| < 1, entonces l´ |rn | = 0, de donde tambi´n se sigue que l´ rn = 0. ım e ım n n Puede probarse que si |r| = 1 el l´ ımite no existe salvo en el caso r = 1. Por ejemplo, ya hemos visto que l´ (−1)n no existe, pues se trata de la sucesi´n ım o n 1, −1, 1, −1, 1, −1, . . . Definici´n 1.84 Una sucesi´n {an }∞ es mon´tona creciente si m < n implica o o n=0 o am ≤ an . La sucesi´n es estrictamente creciente si cuando m < n entonces o am < an . Igualmente se definen las sucesiones mon´tonas decrecientes y las o sucesiones estrictamente decrecientes. Una sucesi´n es mon´tona si cumple o o cualquiera de estas cuatro propiedades. El inter´s de las sucesiones mon´tonas estriba en que podemos probar que e o son convergentes sin necesidad de calcular su l´ ımite. Esta clase de resultados de convergencia proporcionan la t´cnica m´s importante para definir n´meros e a u reales, expres´ndolos como l´ a ımites de sucesiones sencillas. Teorema 1.85 Toda sucesi´n mon´tona creciente converge a su supremo en o o R, y toda sucesi´n mon´tona decreciente converge a su ´ o o ınfimo en R. Demostracion: Por supremo de una sucesi´n {an }∞ entendemos el su- ´ o n=0 premo del conjunto {an | n ∈ N}. Sea s este supremo y supongamos que es finito. Entonces un entorno b´sico de s es de la forma ]s − ≤, s + ≤[, para un a
  • 65.
    1.8. Sucesiones yseries num´ricas e 49 ≤ > 0. Como s − ≤ no es una cota superior de la sucesi´n, existe un natural m o tal que s − ≤ < am ≤ s y, por la monoton´ s − ≤ < an ≤ s para todo n ≥ m, ıa, es decir, que la sucesi´n est´ finalmente en el entorno. Una ligera modificaci´n o a o nos da el mismo resultado si s = +∞ o si la sucesi´n es decreciente. o Prestaremos ahora atenci´n a un tipo especial de sucesiones de particular o inter´s. Se trata de las llamadas series num´ricas. e e Definici´n 1.86 Llamaremos serie determinada por una sucesi´n {an }∞ en o o n=0 Ω k æ∞ P P ∞ K a la sucesi´n o an . La representaremos por an o, m´s gr´fica- a a n=0 k=0 n=0 mente, por a0 + a1 + a2 + a3 + a4 + a5 + ··· P k Los t´rminos e an se llaman sumas parciales de la serie. Si es convergente, su n=0 P ∞ l´ ımite se llama suma de la serie y se representa tambi´n por e an . Esto nunca n=0 lleva a confusi´n. o As´ pues, una serie es una suma con infinitos sumandos. Una serie de ı t´rminos positivos es, como su nombre indica, una serie en R tal que todos los e t´rminos an son positivos. Vista como sucesi´n, una serie de t´rminos positivos e o e es estrictamente creciente, luego converge en R. De todos modos es costumbre llamar divergente a una serie cuya suma sea +∞. Una progresi´n geom´trica es una sucesi´n en la que cada t´rmino se obtiene o e o e del anterior multiplic´ndolo por un n´mero fijo llamado raz´n. Por lo tanto, a u o si el primer t´rmino de una progresi´n geom´trica es a0 y la raz´n es r, los e o e o t´rminos siguientes ser´n a1 = a0 r, a2 = a0 r2 , a3 = a0 r3 , . . . y, en general, e a an = a0 rn . Una serie geom´trica es una serie asociada a una progresi´n geom´trica, o e o e P n ∞ sea, una serie de la forma ar . n=0 Una suma parcial es de la forma a(1 + r + r2 + · · · + rn ). Es conocida la identidad rn − 1 = (r − 1)(1 + r + r2 + · · · + rn−1 ), luego si r 6= 1 tenemos que arn+1 − a a − arn+1 a(1 + r + r2 + · · · + rn ) = = , r−1 1−r
  • 66.
    50 Cap´ ıtulo 1. Topolog´ ıa y de aqu´ ı, ∞ X a − arn+1 arn = l´ ım . n=1 n 1−r Si |r| > 1 sabemos que l´ arn+1 = ∞, de donde se sigue que la serie diverge. ım n Por otro lado, si |r| < 1, entonces l´ arn+1 = 0, luego ım n ∞ X a arn = . n=1 1−r Por ejemplo: 1 1 1 1 1 1 + + + + + ··· = 2 1 = 1. 2 4 8 16 32 1− 2 As´ pues, las series geom´tricas convergen cuando la raz´n tiene m´dulo ı e o o menor que 1, y su suma es el primer t´rmino dividido entre 1 menos la raz´n. e o Ejemplo: expansiones decimales Es conocido que todo n´mero natural n u P r i puede expresarse de la forma n = ai 10 , donde a0 , a1 , . . . , ar son n´meros u i=1 naturales menores que 10. Adem´s, para n 6= 0 la expresi´n es unica si exigimos a o ´ ar 6= 0. De hecho usamos esta expresi´n para nombrar a cada n´mero natural, o u por ejemplo 4.275 = 4 · 103 + 2 · 102 + 7 · 101 + 5 · 100 . M´s en general, dado un n´mero natural k ≥ 2, todo n´mero natural puede a u u P r i expresarse en la forma ai k , donde a0 , a1 , . . . , ar son n´meros naturales me- u i=0 nores que k. Vamos a extender esta notaci´n para nombrar a ciertos n´meros racionales. o u En lo sucesivo, una expresi´n como ´sta: 23, 472 representar´ al n´mero o e a u 2 · 101 + 3 · 100 + 4 · 10−1 + 7 · 10−2 + 2 · 10−3 . Es decir, del mismo modo que el 2 se interpreta multiplicado por 10, el primer n´mero a la derecha de la coma se considerar´ dividido entre 10, el u a segundo entre 100, etc. De este modo, los n´meros u 0 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 1 dividen al intervalo unidad en 10 partes iguales. Cada una de estas partes se divide a su vez en 10 partes a˜adiendo una cifra m´s, por ejemplo: n a 0, 3 0, 31 0, 32 0, 33 0, 34 0, 35 0, 36 0, 37 0, 38 0, 39 0, 4 es una divisi´n del intervalo [0, 3 , 0, 4] en 10 partes iguales. o
  • 67.
    1.8. Sucesiones yseries num´ricas e 51 Por supuesto podemos usar otras bases diferentes de 10. Por ejemplo, en base 10 tenemos que 1/2 = 5/10 = 0, 5. En base dos, en cambio, 1/2 = 0, 1. Los n´meros racionales expresables de esta forma se llaman n´meros deci- u u males exactos. Tomemos ahora un n´mero natural k ≥ 2 y sea {an }∞ una sucesi´n de u n=1 o n´meros naturales menores que k. Entonces u r X r X ∞ X 1 an k−n ≤ (k − 1) k−n < (k − 1) k−n = (k − 1) k 1 = 1. n=1 n=1 n=1 1− k P ∞ Por lo tanto, el supremo de las sumas parciales de an k−n es menor o n=1 P ∞ igual que 1, luego 0 ≤ an k−n ≤ 1. n=1 Esto nos permite extender nuestros desarrollos decimales hasta admitir un n´mero infinito de cifras. Por ejemplo: 532, 11111. . . representa al n´mero u u 5 · 102 + 3 · 101 + 2 · 100 + 1 · 10−1 + 1 · 10−2 + 1 · 10−3 + 1 · 10−4 + · · · P ∞ Como 10−n = 1/9, tenemos que 532, 11111. . . = 532 + 1/9. n=1 Notar que las sucesiones finalmente nulas nos dan los decimales exactos: 3, 67 = 3, 6700000. . . El inter´s de usar infinitas cifras decimales es que todo n´mero real positivo e u es expresable mediante uno de estos desarrollos, es decir, si k es un n´mero u natural mayor o igual que 2, todo n´mero real positivo x se puede escribir como u r X ∞ X x= bn kn + an k−n , n=0 n=1 donde los coeficientes son n´meros naturales menores que k. u √ Vamos a probarlo para k = 10 y x = 2, aunque el procedimiento es com- Pr pletamente general. La parte bn kn del desarrollo buscado no es sino el n=0 desarrollo decimal de la parte entera de x. En nuestro caso, como 1 < 2 < 4, √ resulta que 1 < 2 < 2, luego la parte entera es 1. Dividimos el intervalo [n, n + 1] en el que se encuentra x en 10 partes, que en nuestro caso son 1 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1, 7 1, 8 1, 9 2 Nuestro n´mero x debe u estar en uno de los 10 intervalos. En nuestro caso, como (1, 0)2 = 1 (1, 5)2 = 2, 25 (1, 1)2 = 1, 21 (1, 6)2 = 2, 56 (1, 2)2 = 1, 44 (1, 7)2 = 2, 89 (1, 3)2 = 1, 69 (1, 8)2 = 3, 24 (1, 4)2 = 1, 96 (1, 9)2 = 3, 61
  • 68.
    52 Cap´ ıtulo 1. Topolog´ ıa √ resulta que (1, 4)2 < 2 < (1, 5)2 , luego 1, 4 < 2 < 1, 5. Procediendo del mismo modo podemos ir obteniendo las desigualdades siguientes: √ 1 < √2 < 2 1, 4 < √2 < 1, 5 1, 41 < √2 < 1, 42 1, 414 < 2 < 1, 415 ··· ··· ··· En general, la n-sima cifra se obtiene como la m´xima que hace que el a decimal exacto correspondiente sea menor o igual que x. Ahora probemos que la sucesi´n as´ obtenida converge a x, es decir, probemos que o ı √ 2 = 1, 4142135623730950488016887. . . No olvidemos que S = 1, 4142135623730950488016887. . . es por definici´n la o suma de una serie cuyas sumas parciales son 1; 1, 4; 1, √ 1, 414. . . 41; Por construcci´n cada suma parcial es menor que √ 2, luego la suma de la o serie, que es el supremo de dichas sumas, cumple S ≤ 2. √ √ Ahora bien, tenemos que 1 ≤ S √ 2 ≤ 2, luego √ distancia | 2 − S| ≤ ≤ la |2 − 1| = 1. Igualmente 1, 4 ≤ S ≤ 2 ≤ 1, 5, luego | 2 − S| ≤ |1,√ − 1, 4| = √ 5 0, 1 = 1/10 y, del mismo modo, 1, 41 ≤ S ≤ 2 ≤ 1, 42, luego | 2 − S| ≤ |1, 42 − 1, 41| = 0, 01 = 1/100. √ En general concluimos que 0 ≤ | 2 − S| ≤ 10−n para todo n´mero natural √ u n. Como la sucesi´n 10−n tiende a 0 concluimos que 0 ≤ | 2 √ S| ≤ ≤ para o √ − todo ≤ > 0, lo cual s´lo es posible si | 2 − S| = 0, o sea, si S = 2. o Esto prueba tambi´n que al truncar un n´mero real (es decir, al quedarnos e u con un n´mero finito de sus decimales) obtenemos una aproximaci´n tanto mejor u o cuantas m´s cifras conservemos. Por ejemplo, el n´mero racional 1, 4142 no es √ a √ u 2, pero se diferencia de 2 en menos de 1/10000. Su cuadrado no es 2, obviamente, pero es 1, 99996164, que dista de 2 menos de 1/10000. En muchas ocasiones y a efectos pr´cticos esto es m´s que suficiente. a a Es importante notar que los desarrollos no son unicos, pues por ejemplo es ´ claro que 1 = 0, 99999. . . ; 0, 1 = 0, 099999. . . ; 0, 01 = 0, 0099999. . . En general, si una sucesi´n {an }∞ es finalmente igual a k − 1 (digamos a o n=1 partir de an ), entonces 0, a1 a2 . . . an−1 (k − 1)(k − 1)(k − 1). . . = 0, a1 a2 . . . an−2 (an−1 + 1), pues ∞ X k−1 0, a1 a2 . . . an−1 (k − 1)(k − 1)(k − 1). . . = 0, a1 a2 . . . an−1 + r=n kr 1 = 0, a1 a2 . . . an−1 + = 0, a1 a2 . . . an−2 (an−1 + 1). kn−1
  • 69.
    1.8. Sucesiones yseries num´ricas e 53 O sea, toda expresi´n finalmente igual a k − 1 admite una expresi´n exacta o o sumando 1 a la cifra anterior al primer k − 1 de la cola constante. Si no admitimos sucesiones finalmente iguales a k − 1 el desarrollo es unico.´ En efecto, supongamos que 0, a1 a2 . . . = 0, b1 b2 . . . Sea an 6= bn la primera cifra diferente. Digamos que an < bn . Tenemos que ∞ X ∞ X 0, a1 a2 . . . an−1 + br k−r = 0, a1 a2 . . . an − 1 + ar k−r , r=n r=n luego X∞ X∞ X∞ bn an an an 1 n + br k−r = n + ar k−r < n + (k − 1)k−r = n + n . k r=n+1 k r=n+1 k r=n+1 k k Notar que la desigualdad es estricta porque no todos los ar son iguales a k−1 (no aceptamos desarrollos finalmente iguales a k − 1). Por lo tanto bn < an + 1, o sea, bn ≤ an , contradicci´n. o El algoritmo de Euclides para dividir n´meros naturales es v´lido para calcu- u a lar el desarrollo decimal de cualquier n´mero racional: u 1, 0 0 0 0 0 0 7 1 0 0, 1 4 2 8 4 30 20 60 30 2 As´ pues, 1/7 = 0, 1428428428428. . . La raz´n por la que el algoritmo es ı o v´lido es que los c´lculos que realizamos pueden expresarse de un modo menos a a pr´ctico, pero conceptualmente m´s claro, de la forma siguiente: a a µ ∂ 1 1 1 10 1 3 1 1 30 = 0+ =0+ · =0+ · 1+ =0+ · · 7 7 10 7 10 7 10 100 7 µ ∂ 1 1 2 1 1 1 20 = 0+ · · 4+ =0+ · ·4+ · = ··· 10 100 7 10 100 1.000 7 Una consecuencia importante es que, como los restos posibles son un n´mero u finito, tras un n´mero finito de pasos hemos de obtener un resto ya obtenido u previamente, y como cada cifra del cociente depende exclusivamente del ultimo ´ resto, resulta que las cifras se repiten c´ ıclicamente. En el caso de 1/7 el grupo de cifras que se repite es 428. Para indicar esto se suele usar la notaci´n 1/7 = o _ 0, 14 428. El bloque 428 se suele llamar per´ıodo del n´mero. El bloque de cifras deci- u males previas al per´ıodo (que puede no existir) se llama anteper´ ıodo (1 en este caso), luego en la expresi´n decimal de un n´mero racional podemos distinguir o u la parte entera, el anteper´ ıodo y el per´ ıodo.
  • 70.
    54 Cap´ ıtulo 1. Topolog´ ıa Rec´ ıprocamente, todo n´mero cuya expresi´n decimal sea de esta forma es u o _ un n´mero racional. Ve´moslo con un ejemplo. r = 37, 195 513. Vamos a u a encontrar una fracci´n igual a r. El m´todo es general. Multiplicamos por un o e 1 seguido de tantos ceros como cifras hay en el per´ ıodo m´s el anteper´ a ıodo: _ (100.000)r = 3.719.513, 513 . Le restamos r multiplicado por un 1 seguido de tantos ceros como cifras hay en el anteper´ ıodo: _ _ (1.000.000)r − (1.000)r = 3.719.513 + 0, 513 −3.719 − 0, 513= 3.715.794. Por consiguiente 3.715.794 r= . 999.000 Un problema que surge a menudo es el de determinar si una serie dada an es o no convergente. Lo m´s elemental que puede decirse al respecto es que para a que una serie converja su t´rmino general ha de tender a 0. En efecto: e P ∞ Teorema 1.87 Sea {an }∞ una sucesi´n en K. Si la serie n=0 o an es conver- n=0 gente, entonces l´ an = 0. ım n P k ´ Demostracion: Sea Sk = an . Que la serie converja a un n´mero u n=0 L significa por definici´n que existe l´ Sk = L. En tal caso tambi´n existe o ım e k l´ Sk−1 = L, pues es el l´ ım ımite de una subsucesi´n, y entonces o k l´ ak = l´ (Sk − Sk−1 ) = L − L = 0. ım ım k k As´ si no sumamos cada vez cantidades m´s peque˜as la serie no puede ı, a n converger. El rec´ ıproco es tentador, pero falso. Basta considerar la serie deter- minada por la m´s sencilla de las sucesiones que tienden a 0: a P ∞ 1 Ejemplo La serie n es divergente. n=1 En efecto, observemos que S1 = 1, 1 S2 = 1+ , 2 1 1 2 1 1 S4 = S2 + + > S2 + = 1 + + , 3 4 4 2 2 1 1 1 1 4 1 1 1 S8 = S4 + + + + > S4 + > 1 + + + . 5 6 7 8 8 2 2 2
  • 71.
    1.8. Sucesiones yseries num´ricas e 55 En general S2n > 1 + n , y esta sucesi´n tiende a +∞, luego las sumas 2 o parciales no est´n acotadas y la serie diverge. a Se conocen muchos criterios para determinar el car´cter convergente o di- a vergente de una serie. Por ejemplo, el siguiente es aplicable a series de t´rminos e positivos. Teorema 1.88 (Criterio de D’Alembert) Sea {an }∞ una sucesi´n de n´- n=0 o u meros reales positivos tal que exista l´ aan = L ∈ R. Entonces: ım n+1 n a) Si L < 1 la serie {an }∞ n=0 es convergente. b) Si L > 1 la serie {an }∞ n=0 es divergente. ´ Demostracion: a) Sea ≤ > 0 tal que L+≤ < 1. Entonces ]−∞, L + ≤[ es un entorno de L, y por definici´n de l´ o ımite existe un natural n0 tal que si n ≥ n0 entonces aan < L + ≤ o, lo que es lo mismo, an+1 < an (L + ≤). As´ pues, n+1 ı an0 +1 < an0 (L + ≤), an0 +2 < an0 +1 (L + ≤) < an0 (L + ≤)2 , an0 +3 < an0 +2 (L + ≤) < an0 (L + ≤)3 , . . . En general, si n ≥ n0 , se cumple que an0 an < an0 (L + ≤)n−n0 = (L + ≤)n . (L + ≤)n0 De aqu´ que si k > n0 , ı k X k X k X ∞ X an0 an0 an ≤ an + (L + ≤)n < (L + ≤)n < +∞, n=0 n=0 (L + ≤)n0 n=n0 +1 (L + ≤)n0 n=n0 +1 donde la ultima serie converge porque es geom´trica de raz´n L + ≤ < 1. La ´ e o P∞ serie an es de t´rminos positivos y sus sumas parciales est´n acotadas, luego e a n=0 converge. b) Sea ahora ≤ > 0 tal que 1 < L − ≤. Igual que en el apartado anterior existe un natural n0 tal que si n ≥ n0 entonces an+1 > an (L − ≤), de donde se deduce igualmente que si n ≥ n0 entonces an0 an > (L − e)n , (L − ≤)n0 y por consiguiente, para k > n0 , k X n0 X k X an0 an ≥ an + (L − ≤)n , n=0 n=0 (L − ≤)n0 n=n0 +1 pero ahora la ultima serie diverge, pues es geom´trica de raz´n mayor que 1, ´ e o luego sus sumas parciales no est´n acotadas, y las de la primera serie tampoco. a As´ pues, ´sta es divergente. ı e En el caso de que el l´ımite L exista y valga 1 no es posible asegurar nada, hay casos en los que esto ocurre y la serie converge y casos en los que diverge.
  • 72.
    56 Cap´ ıtulo 1. Topolog´ ıa P ∞ Mn Ejemplo Si M > 0, la serie n! es convergente, pues por el criterio de n=0 D’Alembert, M n+1 M n M L = l´ ım : = l´ ım = 0 < 1. n (n + 1)! n! n n+1 n Incidentalmente, esto prueba tambi´n que l´ M = 0. e ım n! n Notar que hemos determinado el car´cter de la serie, pero no hemos dicho a nada sobre el c´lculo efectivo de su l´ a ımite. La raz´n es que no hay nada que o decir. Por ejemplo, en el caso m´s simple, M = 1, el n´mero a u ∞ X 1 e= n=0 n! es un n´mero “nuevo”, en el sentido de que no es racional, ni la ra´ cuadrada u ız de un n´mero racional, ni en general expresable en t´rminos de otros n´meros u e u ya conocidos. M´s adelante demostraremos que de hecho se trata de un n´mero a u trascendente sobre Q. El unico sentido en que podemos “calcularlo” es en el de ´ obtener aproximaciones racionales sumando t´rminos de la serie. El resultado e es e = 2, 7182818284590452353602874. . . Para acabar demostraremos un criterio v´lido para las llamadas series alter- a nadas, es decir, para series de n´meros reales en las que los t´rminos sucesivos u e tienen signos opuestos: Teorema 1.89 (Criterio de Leibniz) Sea {an }∞ una sucesi´n de n´meros n=0 o u P ∞ reales positivos decreciente y convergente a 0. Entonces la serie (−1)n an es n=0 convergente. ´ Demostracion: Consideremos primero las sumas parciales pares. Por ejemplo: S6 = (a0 − a1 ) + (a2 − a3 ) + (a4 − a5 ) + a6 . Teniendo en cuenta que la sucesi´n es decreciente, los sumandos as´ agrupa- o ı dos son todos mayores o iguales que 0, luego en general S2n ≥ 0. Por otra parte, S8 = S6 + (−a7 + a8) ≤ S6 , luego la sucesi´n {S2n }∞ es o n=0 mon´tona decreciente y acotada inferiormente por 0. Por lo tanto converge a o un n´mero L. u Ahora, S2n+1 = S2n + a2n+1 , luego existe l´ S2n+1 = L + 0. ım n Es f´cil comprobar que si las dos subsucesiones {S2n }∞ y {S2n+1 }∞ a n=0 n=0 convergen a un mismo n´mero L, entonces toda la sucesi´n {Sn }∞ converge u o n=0 a L, es decir, la serie converge. P ∞ 1 Por ejemplo, la serie (−1)n+1 n es convergente. De nuevo no tenemos n=1 m´s medio para calcular su l´ a ımite que aproximarlo por una suma parcial. En
  • 73.
    1.8. Sucesiones yseries num´ricas e 57 realidad, cuando hacemos esto necesitamos saber cu´l es el error cometido, para a determinar el n´mero de cifras decimales correctas. Por ejemplo, las primeras u sumas parciales de esta serie son: 1 1 11 0, 73654 21 0, 71639 31 0, 70901 2 0, 50000 12 0, 65321 22 0, 67093 32 0, 67776 3 0, 83333 13 0, 73013 23 0, 71441 33 0, 70806 4 0, 58333 14 0, 65870 24 0, 67274 34 0, 67865 5 0, 78333 15 0, 72537 25 0, 71274 35 0, 70722 6 0, 61666 16 0, 66287 26 0, 67428 36 0, 67945 7 0, 75952 17 0, 72169 27 0, 71132 37 0, 70647 8 0, 63452 18 0, 66613 28 0, 67560 38 0, 68016 9 0, 74563 19 0, 71877 29 0, 71009 39 0, 70580 10 0, 64563 20 0, 66877 30 0, 67675 40 0, 68080 El l´ ımite vale 0, 6931471805599453094172321. . . Por lo tanto, si al calcular la d´cima suma afirm´ramos que el l´ e a ımite vale 0, 6456. . . estar´ ıamos cometiendo un grave error. En realidad s´lo la primera cifra decimal es exacta (se dice que o un n´mero decimal finito aproxima a otro con n cifras exactas si las n primeras u cifras de ambos n´meros coinciden). En general, al aproximar una serie por u una suma parcial, o al aproximar cualquier l´ ımite de una sucesi´n por uno de o sus t´rminos, no sabemos cu´l es el error cometido, ni en particular cu´ntas e a a de las cifras de la aproximaci´n son exactas. Sin embargo, en el caso de las o series alternadas es f´cil saberlo pues, seg´n hemos visto, las sumas pares son a u decrecientes (siempre est´n sobre el l´ a ımite) y las impares son crecientes (siempre est´n bajo el l´ a ımite), luego las ultimas sumas de la tabla nos dicen que el l´ ´ ımite se encuentra entre 0,68 y 0,71 y por lo tanto no sabemos ninguna de sus cifras con exactitud (salvo el 0). Yendo m´s lejos tenemos: a S1000 = 0, 69264 y S1001 = 0, 69364, lo que nos permite afirmar que el l´ ımite est´ entre 0, 692 y 0, 694, es decir, es de a la forma 0, 69. . . y ya tenemos dos cifras exactas. En la pr´ctica ignoraremos el problema t´cnico de determinar las cifras a e exactas que nos proporciona una aproximaci´n dada, y consideraremos que un o n´mero es “conocido” si tenemos una sucesi´n que converge a ´l. Todas las u o e aproximaciones que daremos (calculadas con ordenador con t´cnicas de an´lisis e a num´rico) tendr´n todas sus cifras exactas. e a
  • 75.
    Cap´ ıtulo II Compacidad, conexi´n y o completitud Finalmente tenemos los suficientes elementos de topolog´ como para que ıa ´sta se convierta en una herramienta eficaz. En los temas anteriores apenas he- e mos extra´ las consecuencias m´s elementales de las definiciones de topolog´ ıdo a ıa, continuidad, etc. Los resultados que veremos ahora van mucho m´s lejos y dan a una primera muestra de las posibilidades de las t´cnicas topol´gicas. e o 2.1 Espacios compactos La compacidad es en topolog´ una propiedad similar a la “dimensi´n finita” ıa o en ´lgebra lineal. Los espacios compactos no son necesariamente finitos, pero se a comportan en muchos aspectos como si lo fueran. Por ejemplo, es obvio que en un espacio finito toda sucesi´n ha de tomar infinitas veces un mismo valor, luego o toda sucesi´n contiene una subsucesi´n constante, en particular convergente. Lo o o mismo ocurre en R, como se desprende del teorema siguiente. Teorema 2.1 Toda sucesi´n en un conjunto totalmente ordenado contiene una o subsucesi´n mon´tona. o o Demostracion: Sea {an }∞ una sucesi´n en un conjunto totalmente or- ´ n=0 o denado. Sea A el conjunto de las im´genes de la sucesi´n. Si A es finito es obvio a o que A tiene una subsucesi´n constante, luego mon´tona. Supongamos que A es o o infinito. Si todo subconjunto no vac´ de A tiene m´ ıo ınimo podemos tomar x0 igual al m´ınimo de A, luego x1 igual al m´ ınimo de A {x0 }, luego x2 igual al m´ınimo de A {x0 , x1 }, y as´ obtenemos puntos x0 < x1 < x2 <. . ., es decir, obtenemos ı un subconjunto de A sin m´ximo.a As´ pues, o bien existe un subconjunto de A sin m´ ı ınimo o bien existe un subconjunto de A sin m´ximo. Los dos casos se tratan igual. Supongamos que a hay un subconjunto de A sin m´ ınimo. Llam´moslo B. e 59
  • 76.
    60 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Sea an0 un elemento cualquiera de B. Como B no tiene m´ ınimo contiene infinitos t´rminos de la sucesi´n bajo an0 , pero s´lo un n´mero finito de ellos e o o u tienen ´ ındice anterior a n0 , luego existe un an1 en B tal que an1 < an0 y n0 < n1 . Podemos repetir indefinidamente este proceso y obtener una subsucesi´n o an0 > an1 > an2 > an3 > an4 > an5 >. . . mon´tona decreciente. o Como en R toda sucesi´n mon´tona converge a su supremo o a su ´ o o ınfimo, esto prueba que en este espacio toda sucesi´n contiene una subsucesi´n conver- o o gente, al igual que ocurre en los espacios finitos. Cualquier intervalo [a, b] es homeomorfo a R, luego tambi´n cumple esto mismo. e Por otro lado esto es falso en R. La sucesi´n de los n´meros naturales no con- o u tiene ninguna subsucesi´n convergente (ya que cualquier subsucesi´n converge o o a +∞ en R, luego no converge en R). El espacio R y los intervalos [a, b] son ejemplos de espacios compactos. La propiedad de las subsucesiones convergentes caracteriza la compacidad en espa- cios m´tricos, pero para el caso general necesitamos otra definici´n m´s elabo- e o a rada. Definici´n 2.2 Sea X un espacio topol´gico. Un cubrimiento abierto de X es o o S una familia {Ai }i∈I de abiertos de X tal que X = Ai . i∈I Un subcubrimiento del cubrimiento dado es un cubrimiento formado por parte de los abiertos del primero. Un espacio de Hausdorff K es compacto si de todo cubrimiento abierto de K se puede extraer un subcubrimiento finito. Es obvio que si X es un espacio finito, de todo cubrimiento abierto se puede extraer un subcubrimiento finito. Basta tomar un abierto que contenga a cada uno de los puntos del espacio. As´ pues, todo espacio de Hausdorff finito es ı compacto. Observar que si B es una base de un espacio de Hausdorff K, se cumple que K es compacto si y s´lo si todo cubrimiento de K por abiertos b´sicos admite o a un subcubrimiento finito. En efecto, si {Ai }i∈I es un cubrimiento arbitrario, para cada punto x ∈ K existe un ix ∈ I tal que x ∈ Aix y existe un Bx ∈ B tal que x ∈ Bx ⊂ Aix . Entonces {Bx }x∈K es un cubrimiento de K formado por abiertos b´sicos y tiene un subcubrimiento finito a K = Bx1 ∪ · · · ∪ Bxn ⊂ Aix1 ∪ · · · ∪ Aixn ⊂ K. Una familia de abiertos forma un cubrimiento si y s´lo si la familia de sus o complementarios es una familia de cerrados con intersecci´n vac´ Por ello la o ıa. compacidad puede caracterizarse as´ en t´rminos de familias de cerrados: ı e Un espacio de Hausdorff K es compacto si y s´lo si toda familia de cerrados o {Ci }i∈I con la propiedad de que cualquier intersecci´n finita de ellos no es vac´ o ıa, tiene intersecci´n total no vac´ o ıa.
  • 77.
    2.1. Espacios compactos 61 La propiedad de que las intersecciones finitas sean no vac´ se llama pro- ıas piedad de la intersecci´n finita. Por lo tanto: o Teorema 2.3 Un espacio de Hausdorff K es compacto si y s´lo si toda familia o de cerrados de K con la propiedad de la intersecci´n finita tiene intersecci´n no o o vac´ ıa. A menudo nos encontraremos con espacios que no son compactos pero tienen subespacios compactos. Por ello resulta util caracterizar la compacidad de un ´ subespacio en t´rminos de la topolog´ de todo el espacio y no de la topolog´ e ıa ıa relativa. Concretamente: Teorema 2.4 Sea X un espacio de Hausdorff y K un subespacio de X. Enton- ces K es compacto S y s´lo si para toda familia {Ai }i∈I de abiertos (b´sicos) si o a de X tal que K ⊂ Ai se puede extraer una subfamilia finita que cumpla lo mismo. i∈I ´ Demostracion: Supongamos que K es compacto. Entonces {Ai ∩ K}i∈I es claramente un cubrimiento abierto de K, del que podemos extraer un subcu- brimiento finito de modo que K = (Ai1 ∩ K) ∪ · · · ∪ (Ain ∩ K), luego K ⊂ Ai1 ∪ · · · ∪ Ain . Rec´ıprocamente, si K cumple esta propiedad y {Ai }i∈I es un cubrimiento abierto de K, entonces para cadaS existe S abierto Bi de X tal que Ai = i un Bi ∩ K. Consecuentemente K = Ai ⊂ Bi , luego por hip´tesis podemos o i∈I i∈I tomar un n´mero finito de conjuntos de modo que K ⊂ Bi1 ∪ · · · ∪ Bin , luego u K = (Bi1 ∩ K) ∪ · · · ∪ (Bin ∩ K) = Ai1 ∪ · · · ∪ Ain . As´ pues, K es compacto. ı Si la uni´n de una familia de abiertos de un espacio X contiene a un subes- o pacio K, diremos que forma un cubrimiento abierto de K en X. As´ pues, un ı subespacio K de X es compacto si y s´lo si de todo cubrimiento abierto de K o en X puede extraerse un subcubrimiento finito (en X tambi´n).e Aqu´ estamos considerando la topolog´ de X, pero deberemos tener siempre ı ıa presente que la compacidad es una propiedad absoluta, y depende exclusiva- mente de la topolog´ del propio espacio K. ıa Los teoremas siguientes muestran la anunciada similitud entre los espacios compactos y los espacios finitos. Por lo pronto, todo espacio finito es cerrado. El an´logo con compactos es el siguiente: a Teorema 2.5 Se cumplen las propiedades siguientes: a) Si X es un espacio de Hausdorff y K ⊂ X es compacto, entonces K es cerrado en X. b) Si K es un compacto y C ⊂ K es un cerrado, entonces C es compacto.
  • 78.
    62 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o c) Si M es un espacio m´trico y K ⊂ M es compacto, entonces K est´ e a acotado. ´ Demostracion: a) El argumento es el mismo que emplear´ ıamos si K fuera finito. Veamos que X K es abierto. Sea x ∈ X K. Para cada punto u ∈ K existen abiertos disjuntos Au y Bu tales que u ∈ Au y x ∈ Bu . Si K fuera finito bastar´ tomar ahora la intersecci´n de los Bu y tendr´ ıa o ıamos un entorno de x contenido en X K. Ahora aplicamos la compacidad de K. Los conjuntos Au forman un cubrimiento abierto de K, luego existe un subcubrimiento finito: T n K ⊂ Au1 ∪ · · · ∪ Aun . Ahora, Bui es un entorno de x que no corta a K, luego i=1 X K es un entorno de x. b) Si {Ai }i∈I es un cubrimiento abierto de C, entonces {Ai }i∈I ∪ {K C}es un cubrimiento abierto de K, luego existe un subcubrimiento finito K = Ai1 ∪ · · · ∪ Ain ∪ (K C). Claramente entonces C ⊂ Ai1 ∪ · · · ∪ Ain , luego C es compacto. c) Sea x ∈ M un punto cualquiera. Para cada u ∈ K, sea ru = d(x, u) + 1. S Obviamente K ⊂ Bru (x). Por compacidad podemos extraer un subcubri- u∈K miento finito de modo que K ⊂ Bru1 (x)∪· · ·∪Brun (x). Las bolas son conjuntos acotados, una uni´n finita de acotados es acotada y todo subconjunto de un aco- o tado est´ acotado. Por tanto K est´ acotado. a a Teorema 2.6 Si K es un espacio compacto, toda sucesi´n en K posee un punto o adherente. Por tanto si adem´s K cumple 1AN, toda sucesi´n en K tiene una a o subsucesi´n convergente. o Demostracion: Sea {an }∞ una sucesi´n en K. Sea An = {am | m ≥ n}. ´ n=0 o Obviamente A0 ⊃ A1 ⊃ A2 ⊃ A3 ⊃ A4 ⊃. . . , luego tambi´n e A0 ⊃ A1 ⊃ A2 ⊃ A3 ⊃ A4 ⊃. . . , y as´ tenemos una familia de cerrados con la propiedad de la intersecci´n finita. ı o T ∞ Por compacidad existe un punto x ∈ Ai . Obviamente x es un punto adhe- i=0 rente de la sucesi´n, pues si n es un natural y U es un entorno de x, entonces o x ∈ An , luego U ∩ An 6= ∅, es decir, existe un m ≥ n tal que am ∈ U . Como hab´ıamos anunciado, esta propiedad caracteriza a los espacios m´tri- e cos compactos. Teorema 2.7 Un espacio m´trico M es compacto si y s´lo si toda sucesi´n en e o o M tiene una subsucesi´n convergente. o
  • 79.
    2.1. Espacios compactos 63 ´ Demostracion: Supongamos que M no fuera compacto. Entonces existir´ıa S un cubrimiento abierto M = Ai que no admite subcubrimientos finitos. i∈I Sea ≤ > 0 y x0 ∈ M . Si B≤ (x) 6= M , existe un punto x1 ∈ M tal que d(x1 , x0 ) ≥ ≤. Si B≤ (x0 ) ∪ B≤ (x1 ) 6= M , existe un punto x2 ∈ M tal que d(x2 , x0 ) ≥ ≤, d(x2 , x1 ) ≥ ≤. Si M no pudiera cubrirse por un n´mero finito de bolas de radio ≤, podr´ u ıamos construir una sucesi´n {xn }∞ con la propiedad de que d(xi , xj ) ≥ ≤ para o n=0 todos los naturales i, j. Es claro que tal sucesi´n no puede tener subsucesiones o convergentes, pues una bola de centro el l´ ımite y radio ≤/2 deber´ contener ıa infinitos t´rminos de la sucesi´n, que distar´ entre s´ menos de ≤. e o ıan ı Concluimos que para todo ≤ > 0 existen puntos x0 , . . . , xn ∈ M de modo que M = B≤ (x0 ) ∪ · · · ∪ B≤ (xn ). Lo aplicamos a ≤ = 1 y obtenemos tales bolas. Si todas ellas pudieran cubrirse con un n´mero finito de abiertos Ai tambi´n M podr´ luego al menos u e ıa, una de ellas, digamos B1 (x0 ) no es cubrible por un n´mero finito de abiertos u del cubrimiento. Igualmente, con ≤ = 1/2 obtenemos una bola B1/2 (x1 ) no cubrible por un n´mero finito de abiertos del cubrimiento. En general obtenemos una sucesi´n u o de bolas B1/(n+1) (xn ) con esta propiedad. Sea x un punto adherente de la sucesi´n {xn }∞ . Sea i ∈ I tal que x ∈ Ai . o n=0 Como Ai es un abierto existe un n´mero natural k tal que B2/(k+1) (x) ⊂ Ai . Sea u n > k tal que d(xn , x) < 1/(k + 1). Entonces B1/(n+1) (xn ) ⊂ B2/(k+1) (x) ⊂ Ai , en contradicci´n con que B1/(n+1) (xn ) no era cubrible con un n´mero finito de o u abiertos del cubrimiento. Seg´n lo visto al comienzo de la secci´n, R es compacto. Adem´s: u o a Teorema 2.8 Un subconjunto de R es compacto si y s´lo si es cerrado y aco- o tado. Demostracion: Por el teorema 2.5, todo compacto en R ha de ser cerrado ´ y acotado. Si C es un conjunto cerrado y acotado, toda sucesi´n en C tiene o una subsucesi´n convergente en R. Como C es acotado su l´ o ımite estar´ en R y a como C es cerrado, su l´ ımite estar´ en C, luego toda sucesi´n en C tiene una a o subsucesi´n convergente en C. Por el teorema anterior C es compacto. o Tambi´n se puede probar el teorema anterior viendo que los cerrados y aco- e tados de R son precisamente los subconjuntos cerrados de R (o, si se prefiere, esto es consecuencia inmediata del teorema anterior). Ejemplo Vamos a usar la compacidad de [0, 1] para calcular el cardinal de R. Si I = [a, b] es un intervalo cerrado, llamaremos ∑ ∏ ∑ ∏ b−a b−a I0 = a, a + , I1 = a + 2 ,b , 3 3 que son dos intervalos cerrados disjuntos contenidos en I.
  • 80.
    64 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o De este modo, partiendo de I = [0, 1] podemos formar los intervalos I0 , I1 , I00 , I01 , I10 , I11 , etc. M´s exactamente, para cada aplicaci´n s : N −→ {0, 1} a o y cada n ∈ N, si llamamos s|n = s0 . . . sn−1 , tenemos definidos los intervalos Is|n (entendiendo que Is|0 = I), y es claro que forman una sucesi´n decreciente, o es decir, si m ≤ n entonces Is|n ⊂ Is|m . Por lo tanto, {Is|n }∞ es una familia n=0 de cerrados en I con la propiedad de la intersecci´n finita. Por compacidad o T ∞ tenemos que Is = Is|n 6= ∅. M´s a´n, es claro que la longitud (el di´metro) a u a n=0 de Is|n es 1/3n , y como Is ⊂ Is|n , necesariamente el di´metro de Is ha de ser a menor o igual que 1/3n para todo n, es decir, ha de ser 0. Esto implica que Is contiene un unico punto. Digamos Is = {xs }. ´ Tambi´n es claro que si s 6= t entonces xs 6= xt . En efecto, si n es el primer e natural tal que s|n+1 6= tn+1 , entonces Is|n = It|n y los intervalos Is|n+1 , It|n+1 son subconjuntos disjuntos. Como contienen a xs y xt respectivamente, ´stos e han de ser puntos distintos. Esto prueba que |I| ≥ |2N | = 2ℵ0 . Por otra parte, |R| ≤ 2ℵ0 , pues si a cada r ∈ R le asignamos el conjunto de los n´meros racionales menores que r u obtenemos una aplicaci´n inyectiva de R en las partes de Q. Por consiguiente o tenemos que |I| = |R| = 2ℵ0 . Teorema 2.9 (Teorema de Tychonoff) El producto de espacios compactos es compacto. Q ´ Demostracion: Sea K = Ki un producto de espacios compactos. To- i∈I memos una familia B de cerrados en K con la propiedad de la intersecci´n o finita. Hemos de probar que su intersecci´n es no vac´ El conjunto de todas o ıa. las familias de subconjuntos de K (no necesariamente cerrados) que contienen a B y tienen la propiedad de la intersecci´n finita, parcialmente ordenado por o la inclusi´n, satisface las hip´tesis del lema de Zorn, lo que nos permite tomar o o T T una familia maximal U. Entonces U⊂ B, luego basta probar que la primera intersecci´n es no vac´ o ıa. U ∈U B∈B En primer lugar observamos que si un conjunto A ⊂ K corta a todos los elementos de U entonces est´ en U, pues en caso contrario U ∪ {A} contradir´ a ıa la maximalidad de U. Sea pi : K −→ Ki la proyecci´n en el factor i-´simo. Es f´cil ver que la o e a familia {pi [U ] | U ∈ U} tiene la propiedad de la intersecci´n finita luego, por la o compacidad de Ki , existe un punto xi ∈ Ki tal que xi ∈ pi [U ] para T todo U ∈ U. Estos puntos determinan un punto x ∈ K. Basta probar que x ∈ U. U ∈U T −1 Fijemos un entorno b´sico de x, de la forma A = a pi [Gi ], donde F ⊂ I i∈F es finito y Gi es abierto en Ki . Para cada U ∈ U tenemos que xi ∈ pi [U ], luego Gi ∩ pi [U ] 6= ∅, luego p−1 [Gi ] ∩ U 6= ∅. Como esto es cierto para todo i U ∈ U, seg´n hemos observado antes podemos concluir que p−1 [Gi ] ∈ U, para u i todo i ∈ F . Como U tiene la propiedad de la intersecci´n finita, A ∈ U. De o aqu´ se sigue que A corta a todo U ∈ U y, como A es un entorno b´sico de x, ı a esto implica que x ∈ U para todo U ∈ U.
  • 81.
    2.1. Espacios compactos 65 Ahora podemos probar: Teorema 2.10 Un subconjunto de Kn , es compacto si y s´lo si es cerrado y o acotado. ´ Demostracion: La acotaci´n depende en principio de la distancia que o consideremos. Hemos de entender que se trata de la inducida por cualquiera de las tres normas definidas en el cap´ıtulo I. Por el teorema 1.5, todas tienen los mismos acotados. Trabajaremos concretamente con © Ø ™ kxk∞ = m´x |xi | Ø i = 1, . . . , n . a Como Cn es homeomorfo a R2n (con los mismos conjuntos acotados), basta probar el teorema para Rn . Ya hemos visto que un compacto ha de ser cerrado y acotado. Supongamos que K es un subconjunto de Rn cerrado y acotado. Esto significa que existe un M > 0 tal que para todo punto x ∈ C se cumple kxk ≤ M , lo que significa que si x ∈ C, cada xi ∈ [−M, M ] o, de otro modo, que C ⊂ [−M, M ]n . Pero por el teorema anterior [−M, M ]n es compacto y C es cerrado en ´l, e luego C tambi´n es compacto. e Los espacios que nos van a interesar son fundamentalmente los subconjuntos de Rn . Vemos, pues, que la compacidad es muy sencilla de reconocer. En particular las bolas cerradas y las esferas son compactos. El espacio C∞ es homeomorfo a una esfera, luego es compacto. Lo mismo ocurre con R∞ , que es homeomorfo a una circunferencia. Una de las propiedades m´s importantes de la compacidad es que se conserva a por aplicaciones continuas (comp´rese con el hecho de que la imagen (continua) a de un conjunto finito es finita). Teorema 2.11 La imagen de un espacio compacto por una aplicaci´n continua o es de nuevo un espacio compacto (supuesto que sea un espacio de Hausdorff). ´ Demostracion: Sea f : K −→ X continua y suprayectiva. Supongamos que K es compacto y que X es un espacio de Hausdorff. Si {Ai }i∈I es un © ™ cubrimiento abierto de X, entonces f −1 [Ai ] i∈I es un cubrimiento abierto de K, luego admite un subcubrimiento finito K = f −1 [Ai1 ] ∪ · · · ∪ f −1 [Ain ]. Entonces X = Ai1 ∪ · · · ∪ Ain . Este hecho tiene muchas consecuencias. Teorema 2.12 Si f : K −→ X es biyectiva y continua, K es compacto y X es un espacio de Hausdorff, entonces f es un homeomorfismo. ´ Demostracion: Basta probar que la inversa en continua, o sea, que trans- forma cerrados de K en cerrados de X, o equivalentemente, que si C es cerrado en K, entonces f [C] es cerrado en X, pero es que C es compacto, luego f [C] tambi´n lo es, luego es cerrado. e
  • 82.
    66 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Ejemplo Una circunferencia es homeomorfa a un cuadrado. En efecto, si C es un cuadrado de centro (0, 0) en R2 , es claro que la apli- caci´n de C en la circunferencia unidad dada por x 7→ x/kxk es biyectiva y o continua y, como C es compacto, es un homeomorfismo. *Ejemplo Los espacios proyectivos son compactos. En efecto, basta probar que Pn (K) es compacto, pero la restricci´n de la o proyecci´n a la esfera unidad de Kn+1 es continua y suprayectiva y la esfera es o compacta. Otro hecho obvio es que toda aplicaci´n continua de un compacto a un o espacio m´trico est´ acotada. Para las funciones reales podemos decir m´s: e a a Teorema 2.13 Si f : K −→ R es continua y K es un compacto no vac´ ıo, existen u, v ∈ K tales que para todo x ∈ K, se cumple f (u) ≤ f (x) ≤ f (v). Es decir, que f alcanza un valor m´ınimo y un valor m´ximo. a ´ Demostracion: Sea C = f [K]. Entonces C es cerrado y acotado. Sean m y M su ´ ınfimo y su supremo, respectivamente. As´ para todo x ∈ K se cumple ı que m ≤ f (x) ≤ M . S´lo falta probar que m y M son im´genes de puntos de o a K, o sea, que m, M ∈ C. Ve´moslo para M . a Si ≤ > 0, entonces M − ≤ no es una cota superior de C, luego existe un punto y ∈ C de modo que M − ≤ < y, es decir, que ]M − ≤, M + ≤[ ∩ C 6= ∅. Esto significa que todo entorno (b´sico) de M corta a C, o sea, M ∈ C = C. a Observar que este resultado es falso sin compacidad. Por ejemplo la funci´n o f : ]0, 1[ −→ R dada por f (x) = x no tiene m´ximo ni m´ a ınimo. Veamos una aplicaci´n del teorema anterior: o Teorema 2.14 Todas las normas en Kn inducen la misma topolog´ Adem´s ıa. a los subconjuntos acotados son los mismos para todas ellas. Demostracion: Sea k k : Kn −→ [0, +∞[ una norma cualquiera. Vamos ´ P n a ver que induce la misma topolog´ que la dada por kxk1 = ıa |xi | y que los i=1 acotados son los mismos para ambas. Esto probar´ el teorema. a Sea {e1 , . . . , en } la base can´nica de Kn . Si x ∈ Kn se puede expresar como o Pn x= xi ei , luego i=1 n X n X n X kxk ≤ |xi | kei k ≤ kxk1 kei k = kxk1 kei k = Kkxk1 . i=1 i=1 i=1 Ø Ø Por lo tanto, si x, y ∈ Kn , se cumple Økxk − kykØ ≤ kx − yk ≤ Kkx − yk1 , o sea que la aplicaci´n k k tiene la propiedad de Lipschitz, luego es continua o respecto a la topolog´ inducida por k k1 . ıa Sea S = {x ∈ Kn | kxk1 = 1}. Se trata de una esfera, luego de un conjunto compacto para lo topolog´ usual de Kn . Por lo tanto la aplicaci´n k k alcanza ıa o
  • 83.
    2.2. Espacios conexos 67 su m´ximo y su m´ a ınimo en S y as´ como no se anula, existen 0 < m ≤ M en R ı, tales que para todo x ∈ S se tiene m ≤ kxk ≤ M . ∞ ∞ Si x ∈ Kn {0}, entonces x/kxk1 ∈ S, luego m ≤ ∞x/kxk1 ∞ ≤ M , es decir, mkxk1 ≤ kxk ≤ M kxk1 , o tambi´n, e 1 kxk1 ≤ kxk, kxk ≤ M kxk1 . m Como 0 cumple esto trivialmente, en realidad vale para todo x ∈ Kn . De aqu´ se sigue que toda bola de centro x con respecto a una norma contiene ı a otra respecto a la otra norma, luego los acotados son los mismos. Adem´s a todo entorno de un punto para una norma lo es para la otra norma, luego las topolog´ inducidas son las mismas. ıas As´ pues, podemos hablar de acotados en Kn sin precisar la norma a la que ı nos referimos. Sin embargo no hay que olvidar que los acotados pueden variar si consideramos m´tricas que no provengan de normas. Por ejemplo la distancia e d(x, y) = m´ ın{kx − yk, 1}. Tambi´n es claro que el teorema anterior es v´lido de hecho para cualquier e a K-espacio vectorial de dimensi´n finita. o 2.2 Espacios conexos Pensemos en los espacios siguientes: [0, 1] y [0, 1] ∪ [2, 3]. Hay una diferencia esencial entre ellos, y es que el primero est´ formado por “una sola pieza” a mientras que el segundo consta de “dos piezas”. La diferencia no es conjuntista, pues tambi´n podemos dividir [0, 1] = [0, 1/2] ∪ ]1/2, 1], pero esto no son dos e piezas en el mismo sentido que en el caso de [0, 1] ∪ [2, 3]. La diferencia es que los intervalos [0, 1/2] y ]1/2, 1] est´n “pegados” mientras que los intervalos [0, 1] a y [2, 3] est´n “separados”. Con m´s precisi´n, el punto 1/2 est´ s´lo en uno de a a o a o los intervalos, el [0, 1/2], pero aunque no est´ en el otro, est´ pegado a ´l, en el a a e sentido de que est´ en su clausura. a En general, si un espacio X se expresa como X = U ∪ V , donde U y V son disjuntos y no vac´ ıos, podemos decir que U y V son dos “piezas” en el sentido que estamos considerando si U no contiene puntos de la clausura de V y viceversa. Ahora bien, cualquier punto de V que no estuviera en V deber´ ıa estar en U , luego la condici´n equivale a que V = V y U = U , o sea, a que o U y V sean cerrados. Por otra parte, dado que U y V son complementarios, es lo mismo decir que son cerrados o que son abiertos. Con ello llegamos a la definici´n de conexi´n: o o Definici´n 2.15 Un espacio topol´gico X es disconexo si existen subconjuntos o o abiertos U y V en X tales que X = U ∪ V , U ∩ V = ∅ y U 6= ∅ 6= V . En caso contrario X es conexo.
  • 84.
    68 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Seg´n hemos dicho, es indistinto exigir que U y V sean abiertos como que u sean cerrados, pues de hecho si cumplen esto son a la vez abiertos y cerrados. Por lo tanto, un espacio X es conexo si y s´lo si sus unicos subconjuntos que o ´ son a la vez abiertos y cerrados son X y ∅. Es obvio que [0, 1] ∪ [2, 3], o incluso [0, 1/2[ ∪ ]1/2, 1] son ejemplos de espacios disconexos. Notar que [0, 1/2[ no es cerrado en R, pero s´ lo es en el espacio ı [0, 1/2[ ∪ ]1/2, 1] (su clausura en este espacio es la intersecci´n con ´l de su o e clausura en R, que es [0, 1/2], o sea, es [0, 1/2[). Es importante tener claro que los intervalos [0, 1/2[ y ]1/2, 1] est´n separados a pese a que s´lo falta un punto entre ellos. La falta de ese punto es suficiente o para que ambas partes no se puedan “comunicar”, en el sentido de que, por ejemplo, ninguna sucesi´n contenida en una de las piezas puede converger a un o punto de la otra. Esto es suficiente para que ambas partes sean independientes topol´gicamente. As´ la funci´n f : [0, 1/2[ ∪ ]1/2, 1] −→ R dada por o ı, o Ω 1 si x ∈ [0, 1/2[ , f (x) = 2 si x ∈ ]1/2, 1] es continua, mientras que ser´ imposible definir una funci´n continua sobre ıa o [0, 1] que s´lo tomara los valores 1 y 2. o Si la desconexi´n de estos espacios es clara, no lo es tanto la conexi´n de o o espacios como [0, 1]. Ejercicio: Probar que el intervalo [0, 1] ⊂ Q es disconexo. Teorema 2.16 Un subconjunto de R es conexo si y s´lo si es un intervalo. o Demostracion: Sea C un subespacio conexo de R. Sean a y b su ´ ´ ınfimo y su supremo, respectivamente. Vamos a probar que C es uno de los cuatro intervalos de extremos a y b. Para ello basta ver que si a < x < b entonces x ∈ C. En caso contrario los conjuntos C ∩ [−∞, x[ y C ∩ ]x, +∞] son dos abiertos disjuntos no vac´ de C cuya uni´n es C. ıos o Tomemos ahora un intervalo I y veamos que es conexo. Supongamos que existen abiertos disjuntos no vac´ U y V en I de modo que I = U ∪ V . ıos Tomemos x ∈ U e y ∈ V . Podemos suponer que x < y. Como I es un intervalo, [x, y] ⊂ I y U 0 = U ∩ [x, y], V 0 = V ∩ [x, y] son abiertos disjuntos no vac´ en [x, y] de modo que [x, y] = U 0 ∪ V 0 . ıos Sea s el supremo de U 0 . Entonces s ∈ U 0 ∩ [x, y] = U 0 , luego en particular s < y. Claramente ]s, y] ⊂ V 0 , luego s ∈ V 0 ∩ [x, y] = V 0 , contradicci´n. o Una consecuencia de esto es que un intervalo [a, b[ no es homeomorfo a uno de tipo ]c, d[. En efecto, si eliminamos un punto de un intervalo ]c, d[ nos queda un espacio disconexo, mientras que en [a, b[ podemos eliminar el punto a y obtenemos un conexo. (Si fueran homeomorfos, el espacio que resultara de eliminar la imagen de a en ]c, d[ deber´ ser homeomorfo a ]a, b[). ıa Ejercicio: Probar que dos intervalos (acotados o no acotados) son homeomorfos si y s´lo si son del mismo tipo: abierto ]a, b[, cerrado [a, b] o semiabierto [a, b[. o
  • 85.
    2.2. Espacios conexos 69 Los resultados siguientes permiten probar con facilidad la conexi´n de mu- o chos espacios. El primero refleja el hecho de que las aplicaciones continuas pueden pegar pero nunca cortar. Teorema 2.17 Las im´genes continuas de los espacios conexos son conexas. a ´ Demostracion: Si f : X −→ Y es una aplicaci´n continua y suprayectiva o pero Y no es conexo, entonces X tampoco puede serlo, pues si A es una abierto cerrado no vac´ en Y y distinto de Y , entonces f −1 [A] cumple lo mismo en X. ıo Teorema 2.18 Sea {Ai }i∈I unaS T familia de subespacios conexos de un espacio X tal que Ai 6= ∅. Entonces Ai es conexo. i∈I i∈I S ´ Demostracion: Supongamos que Ai = U ∪V , donde U y V son abiertos i∈I disjuntos. Entonces para un i cualquiera se tendr´ que Ai = (U ∩ Ai ) ∪ (V ∩ Ai ), a pero U ∩ Ai , V ∩ Ai son abiertos disjuntos en Ai , luego uno de ellos es vac´ y ıo, as´ Ai ⊂ U o bien Ai ⊂ V . ı T Pero si Ai ⊂ U , entonces U contiene a Ai , luego U corta a todos los Ai Si∈I y por conexi´n los contiene a todos. As´ o ı Ai = U , y V = ∅. Igualmente, si i∈I Ai ⊂ V se deduce que U es vac´ ıo. Ejemplo Las circunferencias son conexas. Sea°f :√ 1] −→ {(x, y) ∈ R2 | x2 + y 2 = 1, y ≥ 0} la aplicaci´n dada por [−1, ¢ o f (x) = x, 1 − x2 . Claramente f es continua y suprayectiva, lo que prueba que la semicircun- ferencia es conexa. Igualmente se prueba que la semicircunferencia opuesta es conexa, y como ambas se cortan en los puntos (±1, 0), su uni´n, es decir, la o circunferencia, es conexa. Teorema 2.19 Si A es un subespacio conexo de un espacio X, entonces A es conexo. ´ Demostracion: Supongamos que A = U ∪ V , donde U y V son abiertos disjuntos en A. Entonces A = (U ∩ A) ∪ (V ∩ A), y U ∩ A, V ∩ A son abiertos disjuntos en A. Por conexi´n uno es vac´ luego A ⊂ U o bien A ⊂ V . Digamos o ıo, A ⊂ U ⊂ A. Pero U es cerrado en A, luego A ⊂ U = U , es decir, U = A y V = ∅. Esto prueba que A es conexo. Hemos dicho que un espacio disconexo es un espacio formado por varias “piezas” ahora podemos dar una definici´n rigurosa de lo que entendemos por o una “pieza”.
  • 86.
    70 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Definici´n 2.20 Sea X un espacio topol´gico y x ∈ X. Llamaremos compo- o o nente conexa de x a la uni´n C(x) de todos los subconjuntos conexos de X que o contienen a x. Por el teorema 2.18, C(x) es un conexo, el mayor subespacio conexo de X que contiene a x. Es obvio que si x, y ∈ X, entonces C(x) y C(y) son iguales o disjuntas. En efecto, si tienen puntos en com´n, por el teorema 2.18 resulta que C(x) ∪ C(y) u es un conexo, luego C(x) ∪ C(y) ⊂ C(x) y C(x) ∪ C(y) ⊂ C(y), con lo que C(x) = C(x) ∪ C(y) = C(y). En resumen, todo espacio X est´ dividido en componentes conexas disjuntas. a Las componentes conexas son cerradas por el teorema 2.19. En efecto, C(x) es un conexo que contiene a x, luego C(x) ⊂ C(x). Sin embargo las componentes conexas no siempre son abiertas. Si un espacio tiene un n´mero finito de componentes conexas, ´stas ser´n abiertas y cerradas u e a a la vez, evidentemente, pero si hay infinitas componentes ya no es necesario. Por ejemplo, ning´n subconjunto de Q con m´s de un punto es conexo, porque u a no es un intervalo de R, luego las componentes conexas de Q son los puntos, que no son abiertos. A la hora de probar que un espacio es conexo, resulta y util el concepto de arco. Un arco en un espacio X es una ´ aplicaci´n continua a : [0, 1] −→ X. El espacio X es arco- o x conexo si para todo par de puntos x, y ∈ X existe un arco a : [0, 1] −→ X tal que a(0) = x, a(1) = y. Como entonces x e y est´n en la imagen del arco a, que es un conexo, resulta a que x e y est´n en la misma componente conexa de X, o sea, que X tiene una a unica componente conexa: Los espacios arco-conexos son conexos. El rec´ ´ ıproco no es cierto, pero no vamos a dar un ejemplo. Dados dos puntos x, y ∈ Rn , el segmento que los une est´ formado por a los puntos de la forma y + λ(x − y), con λ ∈ [0, 1]. Esto se puede definir en cualquier K-espacio vectorial. Si V es un espacio vectorial topol´gico y x, y ∈ V , o entonces la aplicaci´n a : [0, 1] −→ V dada por a(λ) = λx + (1 − λ)y es un arco o (el segmento) que une x con y. Un subconjunto A de un K-espacio vectorial V es convexo si para todos los puntos x, y ∈ A y todo λ ∈ [0, 1] se cumple λx + (1 − λ)y ∈ A, es decir, si cuando A contiene a dos puntos, tambi´n contiene al segmento que los une. e Uniendo todo esto, resulta que en un espacio vectorial topol´gico, todo con- o vexo es arco-conexo, luego conexo. En particular todo espacio vectorial to- pol´gico es conexo. En particular Kn es conexo. o Ejercicio: Probar que toda esfera de centro O en Rn es imagen continua de Rn {0}. Probar que Rn {0} es conexo y deducir de aqu´ la conexi´n de la esfera. ı o Ejercicio: Probar que R2 no es homeomorfo a R. Los conjuntos convexos tienen una propiedad que en general no cumplen los conexos, y es que, claramente, la intersecci´n de convexos es convexa. o
  • 87.
    2.2. Espacios conexos 71 Ejemplo Las bolas en los espacios normados son convexas. En efecto, si x, y ∈ B≤ (z), entonces kx − zk < ≤, ky − zk < ≤, luego para todo λ ∈ [0, 1] se cumple kλx + (1 − λ)y − zk = kλx + (1 − λ)y − λz + (1 − λ)zk ≤ kλ(x − z)k + k(1 − λ)(y − z)k = λkx − zk + (1 − l)ky − zk < λ≤ + (1 − λ)≤ = ≤. Por lo tanto λx + (1 − λ)y ∈ B≤ (z). (Cambiando las desigualdades estrictas por desigualdades no estrictas se prueba que las bolas cerradas son convexas.) Por esto se dice que los espacios normados son localmente convexos. En general, un espacio vectorial topol´gico es localmente convexo si tiene una base o formada por conjuntos convexos. Igualmente un espacio topol´gico es localmente o conexo o localmente arco-conexo si tiene una base formada por abiertos cone- xos o arco-conexos, respectivamente. As´ los espacios localmente convexos son ı, localmente arco-conexos y los espacios localmente arco-conexos son localmente conexos. Un hecho importante es que si A es un abierto en un espacio localmente conexo X, entonces las componentes conexas de A son abiertas y cerradas. En efecto, si C es una componente conexa de A y x ∈ C, entonces existe un abierto (b´sico) U de X tal que U es conexo y x ∈ U ⊂ A. Como C es la componente a conexa de x, ha de ser U ⊂ C, luego C es un entorno de x, o sea, C es entorno de todos sus puntos, luego es un abierto. Ejercicio: Probar que todo abierto no vac´ en R es la uni´n disjunta de una cantidad ıo o numerable de intervalos abiertos. Veamos algunos hechos adicionales sobre arcos. Sean a y b dos arcos en un espacio X de modo que a(1) = b(0). Entonces la aplicaci´n b1 : [1, 2] −→ X dada por b1 (t) = b(t − 1) es continua o y cumple que b1 (1) = b(0), b1 (2) = b(1) (se trata de la composici´n con b del o homeomorfismo i : [1, 2] −→ [0, 1] dado por i(t) = t − 1). a(1) = b(0) a(0) b(1) Ahora, la uni´n c = a∪b1 : [0, 2] −→ X, esto es, la aplicaci´n que restringida o o a [0, 1] es a y restringida a [1, 2] es b1 , es continua (porque restringida a los dos cerrados [0, 1] y [1, 2] lo es, y su imagen es la uni´n de las im´genes de a y b. o a Finalmente, llamamos a ∪ b : [0, 1] −→ X a la funci´n (a ∪ b)(t) = c(2t), o es decir, la composici´n de c con el homeomorfismo j : [0, 1] −→ [0, 2] definido o
  • 88.
    72 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o mediante j(t) = 2t. Claramente a ∪ b es un arco cuya imagen es la uni´n de las o im´genes de a y b. En particular (a ∪ b)(0) = a(0) y (a ∪ b)(1) = b(1). a Esto significa que si podemos unir un punto x con un punto y a trav´s de e un arco a, y podemos unir un punto y con un punto z a trav´s de un arco b, e entonces podemos unir x con z mediante el arco a ∪ b. Por otra parte, si a es un arco en un espacio X, la aplicaci´n −a : [0, 1] −→ X o dada por (−a)(t) = a(1 − t) es un arco con la misma imagen pero de modo que (−a)(0) = a(1) y (−a)(1) = a(0). Tambi´n es obvio que un arco constante une e un punto consigo mismo. De todo esto se sigue que la relaci´n “x e y se pueden unir mediante un arco” o es reflexiva, sim´trica y transitiva en todo espacio X. e Teorema 2.21 Sea X un espacio localmente arco-conexo. Entonces un abierto de X es conexo si y s´lo si es arco-conexo. o ´ Demostracion: Obviamente los abiertos arco-conexos son conexos. Su- pongamos que A es un abierto conexo no vac´ Sea x ∈ A. Sea U el conjunto ıo. de todos los puntos de A que pueden ser unidos con x mediante un arco conte- nido en A. Veamos que U es abierto (en X o en A, es lo mismo). Sea y ∈ U . Entonces existe un arco a en A tal que a(0) = x, a(1) = y. Como X es localmente arco- conexo existe un abierto arco-conexo V tal que y ∈ V ⊂ A. Si z ∈ V , entonces hay un arco b en V (luego en A) que une y con z, luego a ∪ b es un arco en A que une x con z, luego z ∈ U . Por lo tanto V ⊂ U y as´ U es un entorno de y. Tenemos, pues, que U es ı entorno de todos sus puntos, luego es un abierto. Ahora veamos que U es un cerrado en A, o lo que es lo mismo, que A U es abierto. Como U no es vac´ por conexi´n tendr´ que ser U = A, lo que ıo, o a significa que A es arco-conexo. Si y ∈ A U , entonces y no puede ser unido a x mediante un arco. Existe un abierto arco-conexo V tal que y ∈ V ⊂ A, pero los puntos de V pueden unirse a y mediante un arco. Si alguno de estos puntos z pudiera unirse a x mediante un arco a, tendr´ ıamos un arco b que une a y con z y un arco a que une z con x, luego y se podr´ unir con x. Por lo tanto ning´n punto de V puede unirse con ıa u x, es decir, V ⊂ A U , luego A U es abierto. Una poligonal es una uni´n de un n´mero finito de segmentos. Una peque˜a o u n modificaci´n del teorema anterior permite probar que en un espacio localmente o convexo, un abierto es conexo si y s´lo se es conexo por poligonales, es decir, o todo par de puntos se puede unir por una poligonal. Ahora vamos con las aplicaciones de la conexi´n. El resultado principal es o el siguiente hecho obvio: Teorema 2.22 (Teorema de los valores intermedios) Si X es un espacio conexo, f : X −→ R es una aplicaci´n continua, x, y son puntos de X y o f (x) < α < f (y), entonces existe un punto z ∈ X tal que f (z) = α.
  • 89.
    2.2. Espacios conexos 73 ´ Demostracion: Se cumple que f [X] es un conexo, luego un intervalo. Como f (x) y f (y) est´n en f [X], a tambi´n ha de estar en f [X]. a e A pesar de su simplicidad, las consecuencias de este teorema son importantes. Por ejemplo, no hay polinomios irreducibles de grado impar sobre R, salvo los de grado 1: Teorema 2.23 Todo polinomio p(x) ∈ R[x] de grado impar tiene al menos una ra´ en R. ız ´ Demostracion: Como p(x) tiene una ra´ si y s´lo si la tiene −p(x), po- ız o demos suponer que su coeficiente director es positivo. Entonces l´ım p(x) = +∞, mientras que l´ ım p(x) = −∞. En particular x→+∞ x→−∞ existe un u ∈ R tal que p(u) < 0 y existe un v ∈ R tal que p(v) > 0. Por el teorema de los valores intermedios tambi´n existe un a ∈ R tal que p(a) = 0. e Por supuesto el teorema es falso para polinomios de grado par. Basta pensar en el caso x2 + 1. Si a > 0, el teorema de los valores intermedios aplicado al polinomio xn − a nos permite concluir la existencia de un b > 0 tal que bn = a. Es claramente unico, pues si bn = cn , entonces (b/c)n = 1, de donde b/c = ±1, luego si ambos ´ son positivos b = c. Definici´n 2.24 Para cada natural n > 0 y cada n´mero real a > 0 definimos o u la ra´ n-sima de a como el unico n´mero b > 0 tal que bn = a. Lo representa- ız √ ´ u remos b = n a Unas comprobaciones rutinarias muestran que si m, n son n´meros enteros ° √ ¢m u n > 0 y a > 0 entonces el n´mero am/n = n a u depende s´lo de la fracci´n o o m/n, con lo que tenemos definida la exponencial ar para todo n´mero real u positivo a y todo n´mero racional r y extiende a la exponencial entera. Tambi´n u e se comprueba que ar+s = ar as , (ar )r = ars . *Afinidades directas e inversas Las isometr´ de un espacio af´ eucl´ ıas ın ıdeo E se clasifican en movimientos y simetr´ seg´n que el determinante de la ıas u aplicaci´n lineal asociada sea igual a 1 o a −1. La topolog´ proporciona una o ıa interpretaci´n geom´trica de esta distinci´n puramente algebraica. En efecto, o e o es conocido que todo movimiento (en dimensi´n mayor que 1) se descompone o en composici´n de giros, y un giro es una aplicaci´n f que en un sistema de o o referencia af´ adecuado tiene la expresi´n: ın o x01 = x1 cos α − x2 sen α, x02 = x1 sen α + x2 cos α x03 = x3 , ··· ··· x0 n = xn
  • 90.
    74 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Vamos a admitir la continuidad de las funciones trigonom´tricas. La demos- e traremos en el cap´ ıtulo III. Consideremos ahora la aplicaci´n f : [0, 1] × E −→ E tal que si el punto o x tiene coordenadas (x1 , . . . , xn ) en el mismo sistema de referencia, entonces ft (x) = f (t, x) es el punto de coordenadas (x0 , . . . , x0 ) dadas por 1 n x01 = x1 cos tα − x2 sen tα, x02 = x1 sen tα + x2 cos tα x03 = x3 , ··· ··· x0 n = xn Claramente entonces, para cada t ∈ [0, 1], la aplicaci´n ft es un giro de o a ´ngulo tα, de modo que f0 es la identidad y f1 = f . Adem´s la aplicaci´n f es a o continua. Veamos que podemos obtener una aplicaci´n similar para movimientos o arbitrarios: Teorema 2.25 Si f es un movimiento en un espacio af´ eucl´ ın ıdeo E existe una aplicaci´n continua f : [0, 1] × E −→ E tal que para todo t ∈ [0, 1], la aplicaci´n o o ft (x) = f (t, x) es un movimiento, f0 = 1 y f1 = f . ´ Demostracion: Lo probamos por inducci´n sobre el n´mero de giros en o u que se descompone f . Ya lo tenemos probado cuando f es un giro. Basta probar que si f cumple el teorema, g es un giro y h = f g entonces h cumple el teorema. Tenemos, pues, las aplicaciones ft y gt . Sea h : [0, 1] × E −→ E dada por Ω f° x) (2t, ¢ si 0 ≤ t ≤ 1/2, h(t, x) = g 2t − 1, f (x) si 1/2 < t ≤ 1, La aplicaci´n h es claramente continua en el cerrado [0, 1/2] × E. Basta o ° ¢ observar que su restricci´n al cerrado [1/2, 1] × E viene dada por g 2t − 1, f (x) , o pues entonces tambi´n ser´ continua en este cerrado y por consiguiente en todo e a su dominio. Ahora bien, los unicos puntos donde esta igualdad no es cierta por ´ definici´n son los de la forma (1/2, x), pero o ° ¢ ° ¢ h(1/2, x) = f (1, x) = f (x) = g 0, f (x) = g 2 · (1/2) − 1, f (x) . El resto del teorema es obvio: para cada t la aplicaci´n ht es de la forma ft0 o o gt0 , luego es un movimiento, etc. Este teorema se interpreta como que los movimientos pueden efectuarse de forma continua en el tiempo. El punto ft (x) se interpreta como la posici´n x en o el instante t, de modo que para t = 0 tenemos la posici´n inicial x y para t = 1 o tenemos la posici´n final f (x). El arco f (t, x), para un x fijo, es la trayectoria o que sigue x. El hecho de que cada ft sea un movimiento se interpreta como que en cada instante t las distancias entre los puntos son las mismas que las originales.
  • 91.
    2.2. Espacios conexos 75 f0,750 [H] f0,250 [H] f0,500 [H] f1 [H] fο [H] f0,875 [H] f0,625 [H] f0,125 [H] f0,375 [H] Ahora probamos que esta propiedad distingue a los movimientos de las se- mejanzas. Teorema 2.26 Si E es un espacio af´ eucl´ ın ıdeo y f : [0, 1] × E −→ E es una aplicaci´n continua tal que para todo t ∈ [0, 1], la aplicaci´n ft (x) = f (t, x) es o o una isometr´ y f0 = 1, entonces todas las aplicaciones ft son movimientos. ıa ´ Demostracion: Fijado un sistema de referencia af´ en E, la aplicaci´n ın o h : E −→ Rn que a cada punto le asigna sus coordenadas es un homeomorfismo. La aplicaci´n g : [0, 1] × Rn −→ Rn dada por g(t, X) = h(f (t, h−1 (X)) es o continua, y es de la forma g(t, X) = Pt + XAt , donde Pt ∈ Rn y At es una matriz n × n de determinante ±1. La aplicaci´n g 0 (t, X) = g(t, X)−g(t, 0) = XAt tambi´n es continua. Si ei es o e el vector i-´simo de la base can´nica, la aplicaci´n gij (t) = g 0 (t, ei )ej es continua, e o o y gij (t) es simplemente el coeficiente (i, j) de la matriz At . El determinante de una matriz depende polin´micamente de sus coeficientes, por lo que la funci´n o o det ft = det At es continua. Ahora bien, si alguna ft fuera una simetr´ det f0 = det I = 1, mientras que ıa, det ft = det At = −1. Tendr´mos, pues, una aplicaci´n continua y suprayectiva a o del espacio conexo [0, 1] en el espacio disconexo {−1, 1}, lo cual es imposible. Los mismos argumentos sirven para interpretar otros grupos de afinidades. Por ejemplo: Teorema 2.27 Si f es una biyecci´n af´ de determinante positivo en un espa- o ın cio af´ E existe una aplicaci´n continua f : [0, 1] × E −→ E tal que para todo ın o t ∈ [0, 1], la aplicaci´n ft (x) = f (t, x) es una biyecci´n af´ f0 = 1 y f1 = f . o o ın, ´ Demostracion: Probaremos primero el teorema para automorfismos de ~ determinante positivo del espacio vectorial asociado E. Cada uno de estos automorfismos se puede expresar como composici´n de una homotecia lineal o de determinante positivo y un automorfismo de determinante 1. A su vez, estos automorfismos se descomponen en producto de transvecciones, es decir,
  • 92.
    76 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o ~ de aplicaciones de la forma f (x) = x + u(x)h, donde u : E −→ R es una aplicaci´n lineal y h es un vector del n´cleo de u. o u Para una transvecci´n definimos o f (t, x) = x + tu(x)h, ~ ~ que es una transvecci´n para todo t, es continua como aplicaci´n [0, 1]×E −→ E, o o f0 = 1 y f1 = f . Una homotecia lineal es de la forma f (x) = rx. Definimos la aplicaci´n ° ¢ o f (t, x) = 1 + t(r − 1) x. Como 1 + t(r − 1) > 0 siempre que r > 0 y 0 ≤ t ≤ 1, tenemos que ft es una homotecia lineal para todo t. Claramente se cumplen tambi´n las otras propiedades. e Aplicando la misma t´cnica de composici´n que en el caso de los movimientos e o ~ llegamos a que todo automorfismo de E de determinante positivo cumple el teorema. Una biyecci´n af´ en E de determinante positivo es de la forma o ın − −→ v ~ f (P ) = O + ~ + f (OP ), ~ ~ donde O es un punto arbitrario de E y f es un automorfismo de E de deter- − −→ v ~ minante positivo. Definimos f (t, P ) = O + t~ + ft (OP ). Es f´cil ver que esta a aplicaci´n cumple lo pedido. o El teorema es falso para biyecciones afines de determinante negativo, pues con el mismo argumento que hemos empleado para las simetr´ se llega a que ıas la aplicaci´n det ft es una aplicaci´n continua en el espacio conexo [0, 1] tal que o o det f0 = 1, det f1 < 0 pero que nunca toma el valor 0, lo cual es imposible. Si ~ un endomorfismo de E tiene determinante 0 su imagen tiene dimensi´n menor o ~ Por consiguiente, cualquier aplicaci´n que transforme continuamente un que E. o conjunto en su imagen por una biyecci´n af´ de E de determinante negativo, o ın en un momento dado “aplanar´” el espacio en una variedad af´ de dimensi´n a ın o menor. Orientaci´n Los resultados que acabamos de ver nos llevan a introducir un o concepto de orientaci´n en un espacio vectorial (aunque casi todo el razona- o miento que sigue es independiente de lo anterior). Definici´n 2.28 Diremos que dos bases ordenadas de un espacio vectorial real o de dimensi´n finita V tienen la misma orientaci´n si el determinante de la matriz o o de cambio de base es positivo. Alternativamente, si existe un isomorfismo de determinante positivo que transforma una en otra. Es inmediato comprobar que las bases de V se dividen en dos clases de equivalencia, a las que llamaremos orientaciones de V . Si una base tiene una determinada orientaci´n, al cambiar de signo uno cualquiera de sus vectores o pasamos a una base con la orientaci´n opuesta. o
  • 93.
    2.2. Espacios conexos 77 Un espacio vectorial orientado es un espacio vectorial real de dimensi´n o finita en el que hemos seleccionado una orientaci´n, a la que llamaremos positiva, o mientras que a la orientaci´n opuesta la llamaremos negativa. Consideraremos a o Rn como espacio orientado tomando como orientaci´n positiva a la que contiene o a la base can´nica. o Conviene notar que en otros espacios vectoriales, por ejemplo en los subespa- cios de Rn , no hay ninguna base privilegiada que nos permita definir una orien- taci´n, luego la elecci´n de una u otra como positiva es arbitraria. Lo mismo o o sucede con el espacio vectorial asociado a un espacio af´ real, o con el espacio in- ın tuitivo, donde no tenemos bases can´nicas. Para determinar una orientaci´n en o o las representaciones gr´ficas hemos de recurrir a criterios no geom´tricos. Por a e ejemplo, si representamos la recta horizontalmente, se suele considerar como base positiva a la formada por el unico vector unitario que apunta hacia la dere- ´ cha. La distinci´n izquierda-derecha no tiene m´s fundamento que la anatom´ o a ıa humana. Para adoptar criterios similares de orientaci´no en el plano y el espacio debemos notar primero que, e3 seg´n los resultados de la secci´n anterior, dos bases u o ortonormales tienen la misma orientaci´n si y s´lo si o o podemos transformar una en otra mediante un movi- miento continuo en el tiempo. As´ diremos que una ı, e2 base del plano es positiva si cuando el dedo ´ ındice derecho apunta en la direcci´n (y sentido) del primer e1 o vector (con la palma hacia abajo) entonces el pulgar (puesto en ´ngulo recto) apunta en la direcci´n del a o segundo vector. Si dos bases cumplen esto, el movimiento que transporta nues- tra mano de una a la otra justifica que tienen la misma orientaci´n, y viceversa. o Similarmente, consideraremos positivas a las bases ortonormales del espacio ta- les que podemos disponer la mano derecha con el dedo medio apuntando en la direcci´n del primer vector, el pulgar en la del segundo y el ´ o ındice en la del tercero. Una forma equivalente y m´s c´moda de esta regla es la siguiente: Una a o base es positiva si cuando el ´ındice derecho arqueado marca el sentido de giro que lleva del primer vector al segundo por el ´ngulo m´s corto, entonces el pul- a a gar apunta en la direcci´n del tercer vector. Una ligera modificaci´n de estas o o reglas las hace v´lidas para bases cualesquiera, no necesariamente ortonormales. a Si un vector v en un plano orientado tiene coordenadas (a, b) respecto a una base ortonormal positiva, entonces es claro que el vector w de coordenadas (−b, a) es ortogonal al primero, con el mismo m´dulo y la base (v, w) es positiva. o Vamos a obtener un resultado an´logo en tres dimensiones. a Sean v y w dos vectores en un espacio tridimensional orientado V . Sean (a1 , a2 , a3 ), (b1 , b2 , b3 ) sus coordenadas en una base (e1 , e2 , e3 ) ortonormal y positiva. Definimos su producto vectorial v∧w como el vector cuyas coordenadas en dicha base son µØ Ø Ø Ø Ø Ø∂ Ø a1 a3 Ø Ø a3 a1 Ø Ø a1 a2 Ø Ø Ø,Ø Ø,Ø Ø Ø b2 b3 Ø Ø b3 b1 Ø Ø b1 b1 Ø .
  • 94.
    78 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Como regla mnemot´cnica y de c´lculo podemos usar: e a Ø Ø Ø e1 e2 e3 Ø Ø Ø v ∧ w = Ø a1 a2 a3 Ø . Ø Ø Ø b1 b2 b3 Ø Hemos de probar que esta definici´n no depende de la elecci´n de la base, o o siempre que sea positiva. Aunque con rigor el determinante anterior no tiene sentido (pues tiene vectores en su primera fila), s´ hay una relaci´n sencilla ı o entre el producto vectorial y los determinantes que es util para deducir sus ´ propiedades. Si x es un vector de coordenadas (x1 , x2 , x3 ), entonces Ø Ø Ø x1 x2 x3 Ø Ø Ø (x, u, v) = x(v ∧ w) = Ø a1 a2 a3 Ø , Ø Ø Ø b1 b2 b3 Ø donde este determinante s´ tiene sentido. El escalar (x, u, v) se llama producto ı mixto de los vectores x, u, v, y es claro que no depende de la base ortonormal positivamente orientada que se escoja para calcularlo. Teniendo esto en cuenta es f´cil probar hechos como que v ∧ w = −w ∧ v. En efecto, para todo x se a cumple evidentemente x(v ∧ w) = −x(w ∧ v), y esto s´lo es posible si se da la o relaci´n indicada. Del mismo modo se prueban las relaciones o v ∧ (w + x) = v ∧ w + v ∧ x, αv ∧ w = (αv) ∧ w = v ∧ (αw), α ∈ R. Adem´s v ∧ w = 0 si y s´lo si v y w son linealmente dependientes. En a o efecto, si son dependientes x(v ∧ w) = 0 para todo x, luego v ∧ w = 0. Si son independientes entonces existe un x independiente de ambos, de modo que x(v ∧ w) 6= 0, luego v ∧ w 6= 0. Si v y w son linealmente independientes, entonces v∧w es un vector ortogonal a ambos. En efecto, v(v ∧ w) = w(v ∧ w) = 0. M´s a´n, en general se cumple a u kv ∧ wk = kvk kwk sen vw. c Para probarlo basta comprobar la identidad kv ∧ wk2 + (vw)2 = kvk2 kwk2 , que junto con vw = kvk kwk cos vw nos lleva a la relaci´n indicada. c o Por ultimo observamos que si v y w son linealmente independientes entonces ´ la base (v, w, v ∧ w) es positiva, pues el determinante de la matriz de cambio de base respecto a e1 , e2 , e3 es Ø Ø Ø Ø Ø Ø Ø a1 a3 Ø2 Ø a3 a1 Ø2 Ø a1 a2 Ø2 Ø Ø +Ø Ø +Ø Ø Ø b2 b3 Ø Ø b3 b1 Ø Ø b1 b1 Ø > 0. Estas propiedades muestran que v ∧ w es independiente de la base respecto a la cual lo calculamos. Sea cual sea esta base, el producto vectorial resulta ser
  • 95.
    2.3. Espacios completos 79 el vector nulo si v y w son dependientes o bien el vector perpendicular a ambos cuyo m´dulo es el que hemos calculado y cuyo sentido es el necesario para que o la base (v, w, v ∧ w) sea positiva. Para terminar daremos una interpretaci´n intuitiva del m´dulo del producto o o vectorial de dos vectores u y v. Se trata claramente del ´rea del paralelogramo a que los tiene por lados: kuk kuk sen uv c kvk 2.3 Espacios completos La ultima propiedad que vamos a estudiar no es topol´gica, sino m´trica. ´ o e La completitud garantiza la convergencia de ciertas sucesiones sin necesidad de conocer su l´ ımite de antemano. Ya hemos encontrado algunos casos, como el de las sucesiones mon´tonas en R, o las mon´tonas y acotadas en R. Los criterios de o o este son muy utiles porque permiten definir nuevas funciones y constantes como ´ l´ ımites de sucesiones. Comenzamos introduciendo una familia de sucesiones en un espacio m´trico que incluye a todas las convergentes: e Definici´n 2.29 Sea M un espacio m´trico. Una sucesi´n {an }∞ en M es o e o n=0 una sucesi´n de Cauchy si para todo ≤ > 0 existe un natural n0 de modo que si o m, n ≥ n0 , entonces d(am , an ) < ≤. O sea, una sucesi´n es de Cauchy si sus t´rminos est´n finalmente tan o e a pr´ximos entre s´ como se desee. Esto le ocurre a toda sucesi´n convergente, o ı o pues si {an }∞ converge a L, entonces dado ≤ > 0 existe un natural n0 de modo n=0 que para todo n ≥ n0 se cumple d(an , L) < ≤/2, luego si m, n ≥ n0 se cumple ≤ ≤ d(am , an ) ≤ d(am , L) + d(L, an ) < + = ≤. 2 2 As´ pues, toda sucesi´n convergente es de Cauchy, pero el rec´ ı o ıproco no es cierto. Pensemos en la sucesi´n {1/n} en el espacio ]0, 1]. Como en R es o convergente, es de Cauchy. Obviamente sigue siendo de Cauchy como sucesi´n o en ]0, 1], pero ya no es convergente. Por supuesto que el problema no est´ en la sucesi´n, sino en el espacio, al a o que en cierto sentido “le falta un punto”. Los espacios a los que no les faltan puntos en este sentido se llaman completos: Un espacio m´trico M es completo si toda sucesi´n de Cauchy en M es e o convergente. La completitud de R es consecuencia de las siguientes propiedades obvias de las sucesiones de Cauchy: Teorema 2.30 Sea M un espacio m´trico y {an }∞ una sucesi´n de Cauchy. e n=0 o
  • 96.
    80 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o a) Si {an }∞ tiene un punto adherente L, entonces converge a L. n=0 b) La sucesi´n {an }∞ est´ acotada. o n=0 a ´ Demostracion: a) Dado ≤ > 0, existe un n´mero natural a partir del cual u d(am , an ) < ≤/2, y existe tambi´n un natural n0 , que podemos tomar mayor que e el anterior, tal que d(an0 , L) < ≤/2. Por lo tanto si n ≥ n0 se cumple que ≤ ≤ d(an , L) ≤ d(an , an0 ) + d(an0 , L) < + = ≤. 2 2 Por consiguiente la sucesi´n converge a L. o b) Existe un n0 tal que si n ≥ n0 , entonces d(an , an0 ) < 1, esto significa que {an | n ≥ n0 } ⊂ B1 (an0 ), luego es un conjunto acotado, y la sucesi´n completa o es la uni´n de este conjunto con el conjunto de los n0 primeros t´rminos, que es o e finito, luego tambi´n est´ acotado. Por lo tanto la sucesi´n est´ acotada. e a o a Teorema 2.31 Todo espacio normado de dimensi´n finita es completo. o ´ Demostracion: Una sucesi´n de Cauchy est´ acotada, luego est´ conte- o a a nida en una bola cerrada, que es un conjunto compacto, luego tiene un punto adherente, luego converge. En la sencilla prueba de este teorema se ve una relaci´n entre la compacidad o y la completitud. Con m´s detalle, la situaci´n es la siguiente: a o Teorema 2.32 Se cumple: a) Todo espacio m´trico compacto es completo. e b) Todo cerrado en un espacio m´trico completo es completo. e c) Todo subespacio completo de un espacio m´trico es cerrado. e ´ Demostracion: a) Toda sucesi´n tiene una subsucesi´n convergente, luego o o si es de Cauchy es convergente. b) Si M es un espacio m´trico completo y C es un cerrado en M , entonces e toda sucesi´n de Cauchy en C converge en M , y como C es cerrado su l´ o ımite estar´ en C, luego la sucesi´n converge en C. a o c) Si C es un subespacio completo de un espacio m´trico M , dado un punto x e en la clausura de C, existe una sucesi´n en C que converge a x, luego la sucesi´n o o es de Cauchy, luego converge en C, luego x est´ en C, luego C es cerrado. a Por supuesto no todo espacio completo es compacto. A veces es util conocer ´ lo que separa a un espacio completo de la compacidad: Definici´n 2.33 Un espacio m´trico M es precompacto si para cada ≤ > 0 o e existen puntos x1 , . . . , xn en M tales que M = B≤ (x1 ) ∪ · · · ∪ B≤ (xn ).
  • 97.
    2.3. Espacios completos 81 Obviamente todo espacio compacto es precompacto (basta extraer un sub- cubrimiento finito del cubrimiento formado por todas las bolas de radio ≤). El teorema 2.7 contiene la demostraci´n de que un espacio precompacto y o completo es compacto. En efecto partiendo de la hip´tesis sobre subsucesiones o convergentes, en primer lugar se prueba que el espacio es precompacto. Con ayuda de la precompacidad se construye una sucesi´n de bolas B1/(n+1) (xn ) en o las que podemos exigir que cada una de ellas corte a la anterior. Esto garantiza que la sucesi´n de los centros es de Cauchy, con lo que podemos garantizar su o convergencia por la completitud y probamos la compacidad del espacio. As´ ı pues: Teorema 2.34 Un espacio m´trico es compacto si y s´lo si es precompacto y e o completo. Es muy importante tener claro que la completitud es una propiedad m´trica e y no topol´gica. Por ejemplo, los espacios R y ]−1, 1[ son homeomorfos, pero o uno es completo y el otro no. En particular una imagen continua de un espacio completo no tiene por qu´ ser completo. e Si analizamos lo que falla, vemos que en ]−1, 1[ hay sucesiones de Cauchy no convergentes, por ejemplo las que convergen a 1 en R, pero cuando las trans- formamos por el homeomorfismo entre ]−1, 1[ y R se convierten en sucesiones que tienden a +∞, que ya no son de Cauchy, luego no violan la completitud de R. El problema es que mientras una aplicaci´n continua transforma sucesiones o convergentes en sucesiones convergentes, no transforma necesariamente sucesio- nes de Cauchy en sucesiones de Cauchy. Y a su vez esto se debe a que si se estira infinitamente una sucesi´n de Cauchy, ´sta deja de serlo. Esto nos lleva a o e conjeturar que la completitud se conservar´ por aplicaciones continuas que no a produzcan estiramientos infinitos. Vamos a definir este tipo de aplicaciones. Definici´n 2.35 Una aplicaci´n f : M −→ N o o entre espacios m´tricos es uniformemente conti- e nua si para todo ≤ > 0 existe un δ > 0 de modo que si x, y ¢ M cumplen d(x, y) < δ, entonces ° ∈ d f (x), f (y) < ≤. Desde un punto de vista l´gico, la diferencia f (y) o entre aplicaci´n continua y uniformemente conti- o nua es sutil. Conviene confrontarlas. Recorde- mos que f es continua en un punto x si para todo ≤ > 0 existe un δ > 0°tal que si ¢y ∈ M cumple d(x, y) < δ, entonces d f (x), f (y) < ≤. La diferencia es, pues, que cuando f es unifor- memente continua el mismo δ verifica la definici´n f (x) ≤ o de continuidad para un ≤ dado simult´neamente a en todos los puntos x. Por ejemplo, el homeomor- fismo f entre ]−1, 1[ y R estira m´s los puntos a δ δ cuanto m´s pr´ximos est´n de ±1. Si tomamos a o a 0 x y 1
  • 98.
    82 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o un punto x y queremos garantizar que f (z) diste de f (x) menos que ≤, tendre- mos que exigir que z diste de x menos que un cierto δ, pero si consideramos los puntos que distan menos que δ de un punto y m´s cercano a 1, vemos que a muchos de ellos se transforman en puntos que distan de f (y) mucho m´s que a ≤, y que si queremos que no sobrepasen esta cota hemos de tomar un δ mucho menor. Teorema 2.36 Sea f : K −→ M una aplicaci´n continua entre espacios m´tri- o e cos y supongamos que K es compacto. Entonces f es uniformemente continua. ´ Demostracion: Sea ≤ > 0. Para cada punto x ∈ K, como f es continua ° ¢ en x, existe un δ(x) > 0 tal que si d(y, x) < δ(x), entonces d f (y), f (x) < ≤/2. Cubramos el espacio K por todas las bolas abiertas de centro cada punto x y de radio δ(x)/2 y tomemos un subcubrimiento finito. Digamos que las bolas que forman este subcubrimiento tienen centros en los puntos x1 , . . . , xn . Sea δ > 0 el m´ınimo del conjunto {δ(x1 )/2, . . . , δ(xn )/2}. Si x, y son dos puntos cualesquiera de K tales que d(x, y) < δ, entonces x estar´ en una de las bolas Bδ(xi )/2 (xi ). Entonces a δ(xi ) δ(xi ) d(y, xi ) ≤ d(y, x) + d(x, xi ) < + = δ(xi ). 2 2 Por lo tanto x, y ∈ Bδ(xi ) (xi ), de donde ° ¢ ≤ ° ¢ ≤ d f (x), f (xi ) < , d f (y), f (xi ) < . 2 2 ° ¢ Consecuentemente, d f (x), f (y) < ≤. La imagen de una sucesi´n de Cauchy por una aplicaci´n uniformemente o o continua es una sucesi´n de Cauchy. En efecto, si {an }∞ es de Cauchy y o n=0 f es uniformemente continua, dado ≤ > 0 existe un δ > 0 de manera que si ° ¢ d(x, y) < δ, entonces d f (x), f (y) < ° Existe un¢natural no tal que si n, ≤. m ≥ n0 entonces d(am , an ) < δ, luego d f (am ), f (an ) < ≤. Esto prueba que la sucesi´n {f (an )}∞ es de Cauchy. o n=0 Como consecuencia, si dos espacios m´tricos X e Y son uniformemente ho- e meomorfos, esto es, si existe una biyecci´n uniformemente continua con inversa o uniformemente continua entre ellos, uno es completo si y s´lo si lo es el otro. o Es importante destacar que una imagen uniformemente continua de un es- pacio completo no tiene por qu´ ser completa. e Veamos ahora algunas propiedades de las aplicaciones lineales entre espacios normados. Teorema 2.37 Sea f : E −→ F una aplicaci´n lineal entre espacios normados. o Las siguientes condiciones son equivalentes: a) f es continua en E. b) f es continua en 0.
  • 99.
    2.4. Espacios deHilbert 83 c) f est´ acotada en B 1 (0). a d) Existe un M ≥ 0 tal que para todo x ∈ E se cumple kf (x)k ≤ M kxk. e) f es uniformemente continua en E. ´ Demostracion: a) → b) es obvio. b) → c), pues existe un δ > 0 tal que kx−0k ≤ δ, entonces kf (x)−f (0)k ≤ 1. Por lo tanto si kxk ≤ 1, se cumple kδ xk ≤ δ, kf (δ x)k ≤ 1, kf (x)k ≤ 1/δ, o sea, que 1/δ es una cota de f en B 1 (0). c) → d), pues si M es una cota de f en B 1 (0), dado cualquier x 6= 0 se cumple que x/kxk ∈ B 1 (0), luego kf (x/kxk)k ≤ M , de donde kf (x)k ≤ M kxk, y esto tambi´n es cierto si x = 0. e d) → e), pues para todos los x, y en E: kf (x) − f (y)k = kf (x − y)k ≤ M kx − yk, luego dado ≤ > 0, si kx − yk < ≤/M , se cumple kf (x) − f (y)k < ≤. e) → a) es evidente. En particular, todo isomorfismo entre dos K-espacios vectoriales de dimen- si´n finita es un homeomorfismo uniforme para cualquier par de normas. o Definici´n 2.38 Un espacio de Banach es un espacio normado completo. o Hemos visto que todo espacio normado de dimensi´n finita es un espacio de o Banach. 2.4 Espacios de Hilbert En el cap´ıtulo I introdujimos los espacios prehilbertianos, que son los K- espacios vectoriales dotados de un producto escalar. Definici´n 2.39 Un espacio de Hilbert es un espacio prehilbertiano H que sea o completo con la m´trica inducida por el producto escalar. e Vamos a probar algunos hechos de inter´s sobre espacios de Hilbert. Los e primeros son v´lidos en general sobre espacios prehilbertianos: a Teorema 2.40 Si H es un espacio prehilbertiano, entonces el producto escalar en H es una funci´n continua. o Demostracion: Para todos los x, x0 , y, y 0 ∈ H se cumple ´ |x · y − x0 · y 0 | ≤ |(x − x0 ) · y| + |x0 · (y − y 0 )| ≤ kx − x0 k kyk + kx0 k ky − y 0 k ≤ kx − x0 k kyk + kx0 − xk ky − y 0 k + kxk ky − y 0 k. As´ dado un par (x, y) ∈ H × H y un ≤ > 0, todo par (x0 , y 0 ) ∈ H × H que ı, cumpla kx0 − xk, ky 0 − yk < ≤/3M , donde M > kxk, kyk, cumple tambi´n que e ≤ ≤2 ≤ |x · y − x0 · y 0 | < M+ + M < ≤. 3M 9M 2 3M
  • 100.
    84 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Definici´n 2.41 Si H es un espacio prehilbertiano, diremos que x, y ∈ H son o ortogonales, y lo representaremos por x ⊥ y, si x · y = 0. Es conocido que la ortogonalidad en Rn coincide con el concepto geom´trico e de perpendicularidad. Es f´cil generalizar el teorema de Pit´goras: a a Si x ⊥ y, entonces kx + yk2 = kxk2 + kyk2 . As´ mismo, las propiedades del producto escalar dan inmediatamente la ı f´rmula conocida como identidad del paralelogramo: o kx + yk2 + kx − yk2 = 2kxk2 + 2kyk2 . Para cada A ⊂ H, definimos A⊥ = {x ∈ H | x ⊥ a para todo a ∈ A}. Es claro que A⊥ es un subespacio vectorial de H. M´s a´n, puesto que {a}⊥ a u es la antiimagen de 0 por la aplicaci´n continua x 7→ a · x, se cumple que {a}⊥ o es cerrado, y como A⊥ = {a}⊥ , a∈A ⊥ vemos que A es un subespacio cerrado de H. Si V es un subespacio vectorial de H es claro que V ∩ V ⊥ = 0. Vamos a probar que si V es cerrado entonces H = V ⊕ V ⊥ . Para ello necesitamos un resultado previo: Teorema 2.42 Sea M un subconjunto no vac´ cerrado y convexo de un espa- ıo, cio de Hilbert H. Entonces M contiene un unico elemento de norma m´ ´ ınima. ´ Demostracion: Sea δ el ´ ınfimo de las normas de los elementos de M . Aplicando la identidad del paralelogramo a 1 x, 1 y tenemos 2 2 ∞ ∞ 1 1 1 ∞ x + y ∞2 kx − yk2 = kxk2 + kyk2 − ∞ ∞ 2 ∞ . ∞ 4 2 2 Si x, y ∈ M , por convexidad (x + y)/2 ∈ M , luego kx − yk2 ≤ 2kxk2 + 2kyk2 − 4δ 2 . (2.1) Si kxk = kyk = δ esto implica x = y, lo que nos da la unicidad. Es f´cil a construir una sucesi´n {xn }∞ ⊂ M tal que l´ kxn k = δ. Aplicando 2.1 a xm o n=0 ım n y xn concluimos f´cilmente que la sucesi´n es de Cauchy, luego converge a un a o punto x que, por continuidad de la norma, cumplir´ kxk = δ. Adem´s, como M a a es cerrado, ha de ser x ∈ M y claramente su norma es la m´ınima en M . Teorema 2.43 Sea V un subespacio cerrado de un espacio de Hilbert H. En- tonces
  • 101.
    2.4. Espacios deHilbert 85 a) Todo x ∈ H se descompone de forma unica como x = P x + Qx, donde ´ P x ∈ V , Qx ∈ V ⊥ . b) P x y Qx son los puntos de V y V ⊥ m´s pr´ximos a x. a o c) Las aplicaciones P : H −→ V y Q : H −→ V ⊥ son lineales y continuas. d) kxk2 = kP xk2 + kQxk2 . ´ Demostracion: El conjunto x + V es cerrado y convexo, luego podemos definir Qx como el elemento de norma m´ ınima en x + V . Definimos P x = x − Qx. Obviamente P x ∈ V . Veamos que Qx ∈ V ⊥ . Para ello probaremos que (Qx) · y = 0 para todo y ∈ V . No perdemos generalidad si suponemos kyk = 1. Por definici´n de Qx tenemos que o (Qx) · (Qx) = kQxk2 ≤ kQx − αyk2 = (Qx − αy) · (Qx − αy), para todo α ∈ K. Simplificando queda 0 ≤ −α(y · Qx) − α(Qx · y) + αα, ¯ ¯ y si hacemos α = (Qx) · y queda 0 ≤ −|(Qx) · y|2 , luego (Qx) · y = 0. Esto prueba la existencia de la descomposici´n de a). La unicidad se debe a o que V ∩ V ⊥ = 0. En definitiva, H = V ⊕ V ⊥ . Ahora observamos que si y ∈ V entonces kx − yk2 = kQx + (P x − y)k2 = kQxk2 + kP x − yk2 , luego la m´ ınima distancia entre x y un punto y ∈ V se alcanza cuando y = P x. Esto prueba b). El apartado d) es el teorema de Pit´goras. La linealidad de a P y Q es obvia. La continuidad se debe a que por d) tenemos kP xk ≤ kxk, kQxk ≤ kxk, y basta aplicar el teorema 2.37. Terminamos con un teorema que caracteriza las aplicaciones lineales conti- nuas de un espacio de Hilbert en K. Teorema 2.44 Sea H un espacio de Hilbert y f : H −→ K una aplicaci´n o lineal continua. Entonces existe un unico y ∈ H tal que f (x) = x · y para todo ´ x ∈ H. ´ Demostracion: Si f es la aplicaci´n nula tomamos y = 0. En otro caso o sea V el n´cleo de f , que ser´ un subespacio cerrado propio de H. Por el u a teorema anterior V ⊥ 6= 0, luego podemos tomar z ∈ V ⊥ con kzk = 1. Sea u = f (x)z − f (z)x. Como f (u) = f (x)f (z) − f (z)f (x) = 0, tenemos que u ∈ V , luego u · z = 0. La definici´n de u implica o f (x) = f (x)(z · z) = f (z)(x · z). Tomando y = f (z) z resulta f (x) = x · y. La unicidad es obvia, pues si dos puntos y, y 0 cumplen el teorema, entonces y − y 0 es ortogonal a todo x ∈ H.
  • 102.
    86 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o 2.5 Aplicaciones a las series num´ricas e La completitud de K tiene muchas consecuencias sobre las series num´ricas. e En primer lugar, la condici´n de Cauchy para una serie en K puede expresarse o como sigue: P ∞ Teorema 2.45 Una serie an en K es convergente si y s´lo si para todo o n=0 Ø p Ø ØP Ø Ø ≤ > 0 existe un natural n0 tal que si n0 ≤ m ≤ p, entonces Ø an Ø < ≤. Ø n=m p P ´ Demostracion: Se trata de la condici´n de Cauchy, pues o an es la n=m diferencia entre la suma parcial p-´sima menos la suma parcial m − 1-sima, y e su m´dulo es la distancia entre ambas. o De aqu´ se sigue un hecho important´ ı ısimo. P ∞ P ∞ Teorema 2.46 Sea an una serie en K. Si la serie |an | es convergente, n=0 n=0 P ∞ entonces la serie an tambi´n lo es. e n=0 ´ Demostracion: Dado ≤ > 0 existe un n´mero natural n0 de manera que u Pp si n0 ≤ m ≤ p, entonces |an | < ≤. Ø p Øn=m p ØP Ø P Ahora bien, Ø Ø an Ø ≤ Ø |an | < ≤, luego la serie sin m´dulos tambi´n es o e n=m n=m de Cauchy, luego converge. P∞ Definici´n 2.47 Una serie o an en K es absolutamente! convergente (serie) P ∞ n=0 si la serie |an | es convergente. n=0 Hemos probado que toda serie absolutamente convergente es convergente. Las series convergentes que no son absolutamente convergentes se llaman series condicionalmente convergentes. Un ejemplo de serie condicionalmente convergente es 1 1 1 1 1 1 1 1− + − + − + − + · · · = 0, 693147 . . . 2 3 4 5 6 7 8 La convergencia absoluta de una serie es esencial para ciertas cuestiones. Por ejemplo, una consecuencia inmediata de las propiedades de las sumas finitas y de los l´ ımites de sucesiones es que ∞ X ∞ X ∞ X ∞ X ∞ X an + bn = (an + bn ), a an = aan , n=0 n=0 n=0 n=0 n=0
  • 103.
    2.5. Aplicaciones alas series num´ricas e 87 entendiendo que si las series de la izquierda convergen, las de la derecha tambi´n e lo hacen y se da la igualdad. Un resultado an´logo para producto de series ya a no es tan sencillo. P∞ P∞ Definici´n 2.48 Sean o an y bn dos series en K. Llamaremos producto n=0 n=0 µ n ∂ P P ∞ de Cauchy de estas series a la serie ak · bn−k . n=0 k=0 La intenci´n es que la serie que acabamos de definir converja al producto de o las dos series de partida, pero esto no ocurre necesariamente si al menos una de ellas no converge absolutamente. P∞ P ∞ Teorema 2.49 Si an y bn son dos series convergentes en K al menos n=0 n=0 una de las cuales converge absolutamente, entonces ∞ √ n ! √∞ !√ ∞ ! X X X X ak · bn−k = an bn . n=0 k=0 n=0 n=0 ´ Demostracion: Supongamos que la serie que converge absolutamente es P ∞ an y definamos n=0 ∞ X ∞ X n X n X A= an , B = bn , cn = ak · bn−k , Cn = ck , n=0 n=0 k=0 k=0 n X n X An = ak , Bn = bk , βn = Bn − B. k=0 k=0 Ahora, Cn = c0 + · · · + cn = a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + · · · + an b0 ) = a0 Bn + · · · + an B0 = a0 (B + βn ) + · · · + an (B + β0 ) = An B + (a0 βn + · · · + an β0 ) El teorema quedar´ probado si vemos que a0 βn + · · · + an β0 tiende a 0. a P∞ © ™ Sea ≤ > 0. Sea K = |an |. Sea M = sup |βn | | n ≥ 0 (la sucesi´n βn o n=0 tiende a 0, luego est´ acotada). a Existe un n´mero natural n0 tal que si n ≥ n0 , entonces |βn | < ≤/2K y si u Pq k ≥ n0 , entonces |ak | < ≤/2M . En consecuencia, si n ≥ 2n0 , k=n0 +1 n X n0 X n X |a0 bn + · · · + an b0 | ≤ |ak βn−k | = |ak βn−k | + |ak βn−k | k=0 k=0 k=n0 +1 n n ≤ X X ≤ ≤ < |ak | + M |ak | ≤ K+ M = ≤. 2K 2K 2M k=0 k=n0 +1
  • 104.
    88 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Si ninguna de las series converge absolutamente el resultado no tiene por qu´ cumplirse. e Ejemplo Consideremos la serie ∞ X (−1)n √ . n=0 n+1 La serie converge por el criterio de Leibniz. El producto de Cauchy de esta serie por s´ misma tiene t´rmino general ı e n X 1 cn = (−1)n p . k=0 (n − k + 1)(k + 1) Cuando n ≥ k tenemos ≥n ¥2 ≥ n ¥2 ≥ n ¥2 (n − k + 1)(k + 1) = +1 − −k ≤ +1 , 2 2 2 luego 1 1 2 p ≥ n = . (n − k + 1)(k + 1) 2 +1 n+2 Por consiguiente n X 2 2(n + 1) |cn | ≥ = . n+2 n+1 k=0 Esta expresi´n converge a 2, luego cn no converge a 0 y el producto de o Cauchy no converge. El teorema anterior prueba, pues, que la serie dada es condicionalmente convergente. Otro punto en el que la convergencia absoluta resulta crucial es en el de la reordenaci´n de los t´rminos de una serie. o e P ∞ Dada una serie convergente an y una biyecci´n σ : N −→ N, podemos o n=0 P ∞ considerar la serie aσ(n) y estudiar su convergencia. De nuevo el resultado n=0 natural exige que la serie converja absolutamente: P ∞ Teorema 2.50 Si an es una serie absolutamente convergente y σ : N −→ N n=0 P ∞ es una aplicaci´n biyectiva, entonces la serie o aσ(n) es absolutamente conver- n=0 gente y tiene la misma suma. ´ Demostracion: Una serie es absolutamente convergente si y s´lo si las o sumas parciales de sus m´dulos forman un conjunto acotado. Toda suma parcial o de los m´dulos de la reordenaci´n est´ mayorada por una suma parcial de los o o a
  • 105.
    2.5. Aplicaciones alas series num´ricas e 89 m´dulos de la serie original (tomando los sumandos necesarios para incluir todos o los que aparecen en la suma dada). Por tanto las sumas parciales de los m´dulos o de la reordenaci´n est´n acotadas y la serie converge absolutamente. o a Sea ≤ > 0. Existe un n´mero natural n0 tal que si n ≥ n0 u Ø n Ø Ø∞ Ø ØX X Ø ØX Ø X ∞ ∞ ∞ X n X ≤ Ø Ø Ø Ø Ø ak − ak Ø = Ø ak Ø ≤ |ak | = |ak | − |ak | < . Ø Ø Ø Ø 2 k=0 k=0 k=n k=n k=0 k=0 Sea m0 ≥ n0 tal que {0, 1, . . . , n0 } ⊂ {σ(0), σ(1), . . . , σ(m0 )}. Entonces si n ≥ m0 , Ø n Ø Ø n Ø Øn Ø ØX X Ø ∞ ØX X Ø ØX n0 0 X Ø ∞ Ø Ø Ø Ø Ø Ø Ø aσ(k) − ak Ø ≤ Ø aσ(k) − ak Ø + Ø ak − ak Ø Ø Ø Ø Ø Ø Ø k=0 k=0 k=0 k=0 k=0 k=0 ∞ X ≤ < |ak | + < ≤. 2 k=n0 +1 P ∞ P ∞ Por lo tanto aσ(k) = ak . k=0 k=0 Como consecuencia, si I es cualquier conjunto infinito numerable y {ai }i∈I P es cualquier familia de elementos de K con la propiedad de que las sumas |ai |, P i∈F con F ⊂ I finito est´n acotadas, tiene sentido la expresi´n e o ai , definida como i∈I la suma de la serie determinada por cualquier ordenaci´n del conjunto I, y es o un n´mero independiente de la ordenaci´n elegida. Obviamente la expresi´n P u o o ai tiene tambi´n sentido cuando I es un conjunto finito. e i∈I Observar que si ≤ > 0,Ø existe un F0 ⊂ I finito tal que para todo F0 ⊂ F ⊂ I, Ø ØP P Ø se cumple Ø ai − Ø ai Ø < ≤. En efecto, basta considerar una ordenaci´n de I Ø o i∈I i∈F y tomar como F0 los primeros t´rminos de la sucesi´n, de modo que el m´dulo e o o de las colas con y sin m´dulos sea menor que ≤/2. Entonces o Ø Ø Ø Ø Ø Ø ØX X Ø ØX X Ø ØX X Ø ≤ X Ø Ø Ø Ø Ø Ø Ø ai − ai Ø ≤ Ø ai − ai Ø + Ø ai − ai Ø < + |ai | < ≤. Ø Ø Ø Ø Ø Ø 2 i∈I i∈F i∈I i∈F0 i∈F0 i∈F i∈F F0 Las series absolutamente convergentes se pueden manipular exactamente igual que si fueran sumas finitas. El siguiente teorema justifica cualquier ope- raci´n razonable entre ellas. o S ∞ Teorema 2.51 Sea {ai }i∈I una familia de elementos de K. Sea I = In una P n=0 divisi´n de I en partes disjuntas. Entonces o ai es (absolutamente) convergente i∈I P P ∞ si y s´lo si lo son las series o ai y |ai |. Adem´s en tal caso a i∈In n=0 X ∞ XX ai = ai . i∈I n=0 i∈In
  • 106.
    90 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o P ´ Demostracion: Si ai es absolutamente convergente, sus sumas parciales i∈I P en m´dulo est´n acotadas, pero toda suma parcial en m´dulo de cada o a o |ai | i∈In P lo es tambi´n de la primera, luego ´stas est´n acotadas, o sea, las series e e a |ai | i∈In convergen absolutamente. Dado cualquier natural k, tomamos para cada n ≤ k P P un conjunto finito Fn ⊂ In tal que |ai | − |ai | < 1/(k + 1). Entonces i∈In i∈Fn k XX k XX X |ai | < |ai | + 1 ≤ |ai | + 1, n=0 i∈In n=0 i∈Fn i∈I luego las sumas parciales est´n acotadas y as´ todas las series convergen abso- a ı lutamente. P P P ∞ Supongamos ahora que las series |ai | y |ai | convergen absoluta- i∈In n=0 i∈In mente. Si F ⊂ I es finito, para un cierto k suficientemente grande se cumple X k X X k XX ∞ XX |ai | = |ai | ≤ |ai | ≤ |ai |, i∈F n=0 i∈In ∩F n=0 i∈In n=0 i∈In P luego las sumas parciales de |ai | est´n acotadas y la serie converge absoluta- a i∈I mente. Ahora supongamos la convergencia de todas las series y probemos la igualdad de las sumas. Notemos que la serie ∞ XX ai n=0 i∈In es convergente porque es absolutamente convergente. Sea ≤ > 0. Existe un n´mero natural n0 tal que u Ø ∞ Ø Ø X X Ø Ø Ø Ø ai Ø < ≤/4. Ø Ø n=n0 +1 i∈In Para cada n ≤ n0 existe un conjunto finito Fn ⊂ In tal que si Fn ⊂ F ⊂ In , entonces Ø Ø ØX X Ø ≤ Ø Ø Ø ai − ai Ø < . Ø Ø 2(n0 + 1) i∈In i∈Fn Sea F un conjunto finito que contenga a todos los Fn y tal que Ø Ø ØX X Ø Ø Ø Ø ai − ai Ø < ≤/4. Ø Ø i∈I i∈F
  • 107.
    2.5. Aplicaciones alas series num´ricas e 91 Entonces Ø∞ Ø Ø ∞ Ø Øn Ø ØX X X Ø Ø X X Ø ØX X 0 X Ø Ø Ø Ø Ø Ø Ø Ø ai − ai Ø ≤ Ø ai Ø + Ø ai − ai Ø Ø Ø Ø Ø Ø Ø n=0 i∈In i∈I n=n0 +1 i∈In n=0 i∈In i∈F Ø Ø ØX X Ø Ø Ø + Ø ai − ai Ø Ø Ø i∈F i∈I Øn √ !Ø ≤ ØX X Ø 0 X Ø ≤ Ø ≤ ≤ < +Ø ai − ai Ø + + + = ≤. 4 Øn=0 Ø 4 2 4 i∈In i∈In ∩F Por lo tanto ambas sumas coinciden. Ejemplo Consideremos la serie condicionalmente convergente ∞ X (−1)n+1 S= . n=1 n Entonces ∞ X (−1)n+1 S = . n=1 2n 2 P ∞ Ahora consideremos la serie an cuyos t´rminos impares son ceros y sus e n=1 t´rminos pares son los de la serie anterior, es decir, la serie e 1 1 1 1 0+ + 0 − + 0 + + 0 − + ··· 2 4 6 8 Obviamente su suma es tambi´n S/2. La serie e X µ (−1)n+1 ∞ ∂ + an n=1 n converge a 3S/2. Sus primeros t´rminos son: e 1 1 1 1 1 1 1+0+ − + + 0 + − + + 0 + ··· 3 2 5 7 4 9 Eliminando los ceros obtenemos la serie 1 1 1 1 1 1 1 1 1+ − + + − + + − ··· 3 2 5 7 4 9 11 6 Vemos que se trata de una reordenaci´n de la serie original, pero converge a o 3S/2.
  • 108.
    92 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o 2.6 Espacios de funciones Uno de los ´xitos de la topolog´ consiste en que sus t´cnicas, desarrolladas en e ıa e principio para estudiar espacios “geom´tricos” como Kn , se aplican igualmente e a objetos m´s abstractos, como son los conjuntos de funciones entre espacios a topol´gicos. Las definiciones siguientes no corresponden en realidad a conceptos o nuevos desde un punto de vista topol´gico: o Definici´n 2.52 Sea Y un espacio topol´gico y X un conjunto cualquiera. Una o o sucesi´n funcional de X en Y es una sucesi´n {fn }∞ en el espacio Y X de todas o o n=0 las aplicaciones de X en Y , es decir, para cada n se cumple fn : X −→ Y . Si Y es un espacio vectorial topol´gico (en especial si Y = K) cada sucesi´n o o P∞ funcional define la correspondiente serie funcional fn , es decir, la sucesi´n o n=0 P n cuyos t´rminos son las funciones Sn = e fk : X −→ Y . k=0 Diremos que una sucesi´n funcional {fn }∞ converge puntualmente a una o n=0 funci´n f ∈ Y X si para todo x ∈ X se cumple l´ fn (x) = f (x). En tal caso o ım n escribiremos l´ fn = f . Para series de funciones podemos definir de manera ım n obvia la convergencia puntual absoluta y la convergencia puntual condicional. En realidad no estamos introduciendo un nuevo concepto de convergencia. Notemos que Y X es el producto cartesiano del espacio Y por s´ mismo tantas ı veces como elementos tiene X, luego podemos considerarlo como espacio to- pol´gico con la topolog´ producto. Las sucesiones convergen en esta topolog´ o ıa ıa si y s´lo si convergen coordenada a coordenada, o sea, si y s´lo si convergen o o puntualmente. Por ello a la topolog´ producto en Y X se la llama tambi´n ıa e topolog´ de la convergencia puntual. ıa Sin embargo, la convergencia puntual no es la convergencia m´s natural que a puede definirse sobre las sucesiones funcionales. De hecho presenta grandes inconvenientes. Ejemplo Para cada n ≥ 1 sea fn : R −→ R la funci´n dada por o   0 si x ≤ 0 fn (x) = nx si 0 ≤ x ≤ 1/n  1 si 1/n ≤ x 1/n Si x ≤ 0 entonces fn (x) es constante igual a 0 y si x > 1 entonces fn (x) es finalmente constante igual a 1, luego esta sucesi´n funcional converge puntualmente a la o funci´n f que muestra la figura de la izquierda. Tenemos, o pues, una sucesi´n de funciones continuas cuyo l´ o ımite puntual no es continuo.
  • 109.
    2.6. Espacios defunciones 93 En general el hecho de que una funci´n sea l´ o ımite puntual de una sucesi´n de funciones aporta muy o poca informaci´n. La raz´n es que los entornos de o o la topolog´ puntual son muy grandes. En efecto, en ıa el caso de RR no es dif´ ver que un entorno b´sico ıcil a x1 x2 x3 de una funci´n f es un conjunto de la forma o © Ø ™ g ∈ RR Ø |g(xi ) − f (xi )| < ≤, i = 1, . . . , n , donde ≤ > 0 y x1 , . . . , xn ∈ R, es decir, si una sucesi´n funcional tiende a f , lo o m´ximo que podemos garantizar tomando un ´ a ındice grande es que los t´rminos e de la sucesi´n se parecer´n a f en un n´mero finito de puntos, pero dos funciones o a u pueden parecerse en un n´mero finito de puntos y ser muy diferentes. u Es mucho m´s natural considerar que dos funciones est´n pr´ximas cuando a a o distan menos de un ≤ en todos los puntos a la vez. Por ello, si Y es un espacio m´trico, definimos la topolog´ de la convergencia uniforme en Y X como la que e ıa tiene por base de entornos abiertos de una funci´n f a los conjuntos de la forma o X ° ¢ B(f, ≤) = {g ∈ Y | d f (x), g(x) < ≤ para todo x ∈ X}. De este modo, cuando una funci´n g est´ en un entorno de f suficientemente o a peque˜o, ambas funciones se parecen realmente. Es f´cil comprobar que los n a conjuntos B(f, ≤) cumplen las condiciones del teorema 1.14 y por tanto definen, seg´n hemos dicho, una topolog´ en Y X . u ıa Es inmediato comprobar que una sucesi´n funcional {fn }∞ converge uni- o n=0 formemente (es decir, en la topolog´ de la convergencia uniforme) a una funci´n ıa o f° si y s´lo si para todo ≤ > 0 existe un n0 tal que si n ≥ n0 , entonces o ¢ d fn (x), f (x) < ≤ para todo x ∈ X. La diferencia, pues, entre la convergencia uniforme y la convergencia puntual es que cuando la convergencia es uniforme hay un n0 a partir del cual todos los fn (x) distan de su l´ ımite menos de un ≤ dado, mientras que si la convergencia es puntual cada punto x puede requerir un n0 mayor para acercarse a su l´ ımite en menos de ≤, de manera que ning´n n0 sirva simult´neamente para todos los u a puntos. Es obvio que si una sucesi´n funcional converge uniformemente a una fun- o ci´n, tambi´n converge puntualmente a dicha funci´n. Tanto la topolog´ de o e o ıa la convergencia uniforme como la topolog´ de la convergencia puntual son de ıa Hausdorff, luego los l´ ımites son unicos. ´ Si en el espacio Y tomamos la distancia d0 (x, y) = m´ ın{1, d(x, y)}, los con- juntos B(f, ≤) son los mismos cuando ≤ < 1, luego d0 induce la misma topolog´ ıa de convergencia uniforme en Y X . La ventaja de esta m´trica es que no toma valores mayores que 1, por lo que e podemos definir © ° ¢Ø ™ d(f, g) = sup d0 f (x), g(x) Ø x ∈ X , y es claro que esta d es una distancia en Y X para la cual B(f, ≤) es simplemente la bola abierta de centro f y radio ≤. Esto convierte a Y X en un espacio m´trico e cuya topolog´ es precisamente la de la convergencia uniforme. ıa
  • 110.
    94 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Teorema 2.53 Sea X un espacio topol´gico e Y un espacio m´trico. Entonces o e el conjunto C(X, Y ) de las aplicaciones continuas de X en Y es cerrado en Y X , cuando en ´ste consideramos la topolog´ de la convergencia uniforme. e ıa Demostracion: Sea {fn }∞ una sucesi´n de aplicaciones continuas que ´ n=0 o converja uniformemente a una funci´n f . Basta ver que f es continua. ¢ o ° Sea ≤ > 0. Sea n0 tal que si n ≥ n0 y x ∈ X, entonces d fn (x), f (x) < ≤/3. Sea x0 ∈ X (vamos a probar que f es continua en x0 ). Como fn0 es continua ° ¢ existe un entorno U de x0 tal que si x ∈ U , entonces d fn0 (x), fn0 (x0 ) < ≤/3. Por lo tanto, si x ∈ U , se cumple que ° ¢ ° ¢ ° ¢ ° ¢ d f (x), f (x0 ) ≤ d f (x), fn0 (x) + d fn0 (x), fn0 (xo) + d fn0 (x0 ), f (x0 ) < ≤. ´ Este es un primer ejemplo del buen comportamiento de la convergencia uni- forme. Veamos otros: Teorema 2.54 Sea Y un espacio m´trico completo y X un conjunto. Entonces e Y X es completo con la m´trica inducida a partir de la m´trica de Y . Por lo e e tanto si X es un espacio topol´gico, C(X, Y ) tambi´n es completo. o e ´ Demostracion: Ante todo notemos que si Y es completo con su m´trica e d, tambi´n lo es con la m´trica d0 que resulta de tomar el m´ e e ınimo con 1, luego podemos suponer que la m´trica en Y est´ acotada. e a Sea {fn }∞ una sucesi´n de Cauchy en Y X . Esto significa que para¢ todo n=0 o ° ≤ > 0 existe un n0 tal que si m, n ≥ n0 y x ∈ X, entonces d fm (x), fn (x) < ≤. En particular esto implica que cada sucesi´n {fn (x)}∞ es de Cauchy en Y , o n=0 luego converge a un cierto punto f (x). Con esto tenemos una funci´n f ∈ Y X o a la cual {fn }∞ converge puntualmente. Basta ver que tambi´n converge n=0 e uniformemente. Sea ≤ > °0 y tomemos un natural n0 como antes. As´ si n0 ≤ n ≤ m, ¢ ı, se cumple d fm (x), fn (x) < ≤, luego fm (x) est´ en la bola cerrada de centro a fn (x) y radio ¢ luego el l´ ° ≤, ımite f (x) estar´ en esta misma bola, o sea, se cumplir´ a a d f (x), fn (x) ≤ ≤, y esto para todo n ≥ n0 y todo x ∈ X. Esto significa que la sucesi´n converge uniformemente a f . La completitud de C(X, Y ) se sigue de o que es un cerrado. En general no podemos convertir a Y X en un espacio normado aunque Y lo sea. El problema es que no podemos transformar la norma en una norma acotada. Lo unico que podemos hacer es definir (Y X )∗ como el espacio de ´ las funciones acotadas de X en Y , es decir, las funciones f tales que f [X] est´ acotado. En este conjunto podemos definir la norma supremo dada por a © Ø ™ kf k∞ = sup kf (x)k Ø x ∈ X , que obviamente genera las bolas que definen la topolog´ de la convergencia uniforme (restringida a (Y X )∗ ). As´ pues, si Y ıa ı es un espacio normado, (Y X )∗ tambi´n lo es, y como es f´cil ver que el l´ e a ımite uniforme de funciones acotadas est´ acotado, resulta que (Y X )∗ es cerrado en a Y X , luego si Y es un espacio de Banach, (Y X )∗ tambi´n lo es. e
  • 111.
    2.6. Espacios defunciones 95 Si X es un espacio topol´gico e Y es un espacio normado, definimos C ∗ (X, Y ) o como el espacio de las funciones continuas y acotadas de X en Y . Obviamente se trata de la intersecci´n de dos cerrados, luego es cerrado, es un espacio normado o y si Y es un espacio de Banach, C ∗ (X, Y ) tambi´n lo es. e En particular C ∗ (X, K) es un espacio de Banach. En general no podemos dotar a C(X, K) de estructura de espacio normado. De hecho no es un espacio vectorial topol´gico porque no es conexo. En efecto, es f´cil ver que C ∗ (X, K) o a es abierto y cerrado en C(X, K). La unica excepci´n es precisamente cuando ´ o C(X, K) = C ∗ (X, K). Esto ocurre por ejemplo si X es un compacto. Es decir, si X es compacto, entonces C(X, K) es un espacio de Banach con la norma supremo y la topolog´ es la de la convergencia uniforme. ıa Sea L(E, F ) el conjunto de las aplicaciones lineales continuas entre dos espa- cios normados. Teniendo en cuenta 2.37, la aplicaci´n L(E, F ) −→ C ∗ (B1 (0), F ) o definida por restricci´n es claramente lineal e inyectiva (pues B1 (0) contiene una o base de E). Si transportamos la norma de este segundo espacio al primero ob- tenemos que, para cada aplicaci´n lineal y continua f : E −→ F , su norma es o el supremo de f en B1 (0), y por lo tanto cumple kf (v)k ≤ kf k kvk para todo v ∈ E. Ejercicio: Probar que L(E, F ) es un subespacio cerrado de C ∗ (B1 (0), F ). Por consi- guiente, si F es un espacio de Banach, L(E, F ) tambi´n lo es. e Terminamos con un resultado importante sobre convergencia de series funcio- P ∞ nales. Previamente notemos lo siguiente: si una serie fn converge absoluta n=0 P∞ y uniformemente en un conjunto X, es decir, si la serie |fn | converge uni- P∞ n=0 formemente, entonces fn converge uniformemente. La prueba es la misma que la de 2.46. n=0 P ∞ Teorema 2.55 (Criterio de Mayoraci´n de Weierstrass) Sea o fn una n=0 serie funcional en un espacio X y {Mn }∞ una sucesi´n en el intervalo [0, +∞[ n=0 o tal que para todo natural n y todo x ∈ X se cumpla |fn (x)| ≤ Mn . Si la P ∞ serie Mn es convergente, entonces la serie fn es absoluta y uniformemente n=0 convergente en X. ´ Demostracion: La serie Mn es de Cauchy, luego dado ≤ > 0 existe un n0 p P tal que si n0 ≤ m ≤ p, entonces Mn < ≤. As´ ı n=m Ø p Ø ØX Ø p X Xp Ø Ø Ø |fn (x)|Ø = |fn (x)| ≤ Mn < ≤ Øn=m Ø n=m n=m P ∞ para todo x ∈ X. Esto significa que la serie |fn | es de Cauchy en C(X, K), n=0
  • 112.
    96 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o P ∞ luego (uniformemente) convergente, luego fn es absoluta y uniformemente n=0 convergente. 2.7 Ap´ndice: El teorema de Baire e Terminamos el cap´ ıtulo con un resultado que no nos va a hacer falta m´s a adelante, pero que es util en algunos contextos m´s avanzados. Necesitamos ´ a algunos resultados previos: Definici´n 2.56 Si M es un espacio m´trico y C ⊂ M , se define el di´metro o e a de C como d(C) = sup{d(x, y) | x, y ∈ C} ∈ [0, +∞]. Es f´cil calcular el di´metro de una bola abierta: a a d(Br (x)) = 2r. Tambi´n se comprueba sin dificultad que el di´metro de un conjunto coincide e a con el de su clausura. Por ultimo, necesitamos el siguiente hecho elemental: ´ Teorema 2.57 Sea M un espacio m´trico completo. Toda familia decreciente e {Cn }n de cerrados en M no vac´ tal que l´ d(Cn ) = 0 tiene intersecci´n no ıos ım o n vac´ ıa. ´ Demostracion: Para cada n tomamos xn ∈ Cn . Como l´ n d(Cn ) = 0, es ım claro que la sucesi´n (xn )n es de Cauchy. Su l´ o ımite x est´ en cada Cn por ser a ´ste cerrado y {Cn }n decreciente. e Teorema 2.58 (Teorema de Baire) En un espacio m´trico completo, la in- e tersecci´n de una familia numerable de abiertos densos es un conjunto denso. o T ∞ ´ Demostracion: Sea M un espacio m´trico completo y G = e Gn una n=1 intersecci´n numerable de abiertos Gn densos en M . Basta probar que G corta o a toda bola abierta Br (x). Como G1 es denso en M existe x1 ∈ G1 ∩ Br (x). Como G1 ∩ Br (x) es abierto, existe un r1 > 0, que podemos tomar menor que r/2, tal que B r1 (x1 ) ⊂ G1 ∩ Br (x). G2 Inductivamente podemos construir una sucesi´n {xn }n o de puntos de M y una sucesi´n {rn }n de n´meros reales o u r positivos de modo que x x2 x1 r1 B rn (xn ) ⊂ Gn ∩ Brn−1 (xn−1 ) (2.2) G1 y rn < r/n para todo n.
  • 113.
    2.7. Ap´ndice: Elteorema de Baire e 97 T ∞ Por el teorema anterior, B rn (xn ) 6= ∅, luego (2.2) implica que n=1 ∞ G ∩ Br (x) ⊃ (Gn ∩ Brn−1 (xn−1 )) 6= ∅. n=1 Sin m´s que tener en cuenta que el complementario de un conjunto denso es a un conjunto con interior vac´ tenemos una forma equivalente del teorema de ıo Baire: Teorema 2.59 (Teorema de Baire) En un espacio m´trico completo, toda e uni´n numerable de cerrados de interior vac´ tiene interior vac´ o ıo ıo. Conviene observar que la tesis del teorema de Baire (en cualquiera de sus dos formas equivalentes) se cumple tambi´n sobre espacios topol´gicos localmente e o compactos, no necesariamente metrizables. La prueba es, de hecho, m´s sencilla, a y se obtiene sustituyendo el teorema 2.57 por el hecho de que la intersecci´n de o una familia decreciente de compactos no vac´ es no vac´ ıos ıa. Aunque, seg´n hemos indicado, no necesitaremos el teorema de Baire, vamos u a tratar de explicar su inter´s. Para ello necesitamos algunas definiciones: e Definici´n 2.60 Sea X un espacio topol´gico. Un subconjunto A de X es o o diseminado si X A contiene un abierto denso o, equivalentemente, si A est´ a contenido en un cerrado de interior vac´ o, tambi´n, si int A = ∅. ıo e Informalmente, la idea es que un abierto denso (y cualquier conjunto que lo contenga) es un conjunto “muy grande” desde el punto de vista topol´gico, o pues todo abierto contiene un abierto contenido en tal conjunto; los conjuntos diseminados son topol´gicamente “muy peque˜os”. Como todo conjunto que o n contenga a un conjunto que contenga a un abierto denso contiene un abierto denso, tomando complementarios obtenemos que los subconjuntos de los conjun- tos diseminados son diseminados. Esta noci´n de conjunto diseminado resulta o ser muy restrictiva, esencialmente a causa de que no se conserva por uniones numerables, por ello se definen los conjuntos de primera categor´ ıa: Definici´n 2.61 Un subconjunto A de un espacio topol´gico X es de primera o o categor´ si es uni´n numerable de conjuntos diseminados. A es de segunda ıa o categor´ si no es de primera categor´ ıa ıa. Es evidente que toda uni´n numerable de conjuntos de primera categor´ o ıa es de primera categor´ As´ los conjuntos de primera categor´ son conjun- ıa. ı, ıa tos topol´gicamente “peque˜os”, aunque no necesariamente “muy peque˜os”, o n n mientras que los conjuntos de segunda categor´ son los topol´gicamente “gran- ıa o des”. No obstante, estas nociones no sirven de nada sin el teorema de Baire, que puede enunciarse en una tercera forma equivalente:
  • 114.
    98 Cap´ ıtulo 2. Compacidad, conexi´n y completitud o Teorema 2.62 (Teorema de Baire) En un espacio m´trico completo, los con- e juntos de primera categor´ tienen interior vac´ ıa ıo. ´ Demostracion: Consideremos un conjunto C de primera categor´ En- ıa. tonces S S C = An ⊂ An = C 0 , n n donde los conjuntos An son diseminados, luego sus clausuras son cerrados de interior vac´ luego C 0 tiene interior vac´ (por la versi´n que ya hemos probado ıo, ıo o del teorema de Baire) y C tambi´n. e As´ pues, si probamos que un conjunto C es “peque˜o”, en el sentido de ı n que es de primera categor´ el teorema de Baire nos da que todo abierto va a ıa, a ´ contener puntos que no est´n en C. Este es esencialmente el inter´s del teorema e de Baire. Terminaremos con una aplicaci´n del teorema de Baire, que no es de las m´s o a t´ ıpicas, pero tal vez la m´s sencilla: a Ejemplo Q no puede expresarse como una intersecci´n numerable de abiertos o de R. En efecto, en tal caso ser´ una intersecci´n numerable de abiertos densos, ıa o luego R Q ser´ una uni´n numerable de cerrados de interior vac´ al igual que ıa o ıo, R = Q ∪ (R Q). El teorema de Baire nos dar´ entonces que R tiene interior ıa vac´ (en s´ mismo), lo cual es absurdo. ıo ı Los conjuntos que pueden expresarse como intersecci´n numerable de abier- o tos se llaman conjuntos Gδ . El ejemplo anterior, junto con el teorema siguiente, muestra que no puede existir una funci´n f : R −→ R continua en los puntos o Q y discontinua en los de R Q. (Si el lector cree que esto es evidente, deber´ ıa pensar en el ejercicio que sigue al teorema.) Teorema 2.63 Sea M un espacio m´trico completo. El conjunto de puntos de e continuidad de toda funci´n f : M −→ R es un Gδ . o ´ Demostracion: Para cada natural no nulo n definimos Gn = {x ∈ M | existe δ > 0 tal que sup f (y) − ´ ınf f (y) < 1/n}. y∈Bδ (x) y∈Bδ (x) Claramente los conjuntos Gn son abiertos. Basta probar que el conjunto de T ∞ puntos de continuidad de f es G = Gn . n=1 Si f es continua en x, dado un n > 0 existe un δ > 0 tal que si y ∈ Bδ (x) entonces |f (x) − f (y)| < 1/(4n). Por lo tanto, si y, y 0 ∈ Bδ (x) se cumple que |f (y) − f (y 0 )| < 1/(2n) y, tomando el supremo en y y el ´ ınfimo en y 0 , concluimos que x ∈ Gn .
  • 115.
    2.7. Ap´ndice: Elteorema de Baire e 99 Rec´ ıprocamente, supongamos que x ∈ G. Dado ≤ > 0 tomamos n tal que 1/n < ≤. Como x ∈ Gn , existe δ > 0 tal que sup f (y) − ´ ınf f (y) < 1/n. y∈Bδ (x) y∈Bδ (x) Entonces si y ∈ Bδ (x) se tiene que |f (x) − f (y)| ≤ sup f (y) − ´ ınf f (y) < 1/n < ≤, y∈Bδ (x) y∈Bδ (x) luego f es continua en x. Ejercicio: Consideremos la funci´n f : R −→ R dada por o n f (x) = 1/q si x = p/q con p, q ∈ Z, (p, q) = 1, q > 0, 0 en caso contrario. Demostrar que l´ f (x) = 0 para todo x0 ∈ R. Deducir que f es continua en R Q ım x→x0 y discontinua en Q.
  • 117.
    Cap´ ıtulo III C´lculo diferencial de una a variable En este cap´ıtulo estudiaremos una de las ideas m´s importantes y fruct´ a ıferas que posee la matem´tica actual. Su n´cleo est´ en la observaci´n de que mu- a u a o chas curvas se parecen localmente a rectas. Por ejemplo, visto suficientemente de cerca, un arco de circunferencia es indistinguible de un segmento de recta. Una prueba de ello est´ en el horizonte que separa el cielo del mar en un d´ a ıa despejado. Se trata de un arco de circunferencia, pero ¿se ve que es as´ı? La raz´n por la que el horizonte parece recto no es que la Tierra sea muy o grande, sino que la vemos muy de cerca. Vista desde la Luna es claramente esf´rica y cualquier circunferencia al microscopio parece una recta. Lo mismo e sucede con muchas curvas, que si las vemos muy de cerca parecen rectas. Pero esto no es cierto para todas. Pensemos en la curva de la figura. Vista de cerca podr´ pasar por una recta en un en- ıa torno de cualquiera de sus puntos excepto el se˜alado n con el c´ ırculo, donde tiene un “pico”. Por m´s que nos a acerquemos nunca dejaremos de ver ese pico que delatar´ a que no se trata de una recta. Vamos a estudiar las curvas que localmente se parecen a rectas. Pero ¿qu´ es exactamente parecerse a una recta? e 3.1 Derivaci´n o Consideremos una funci´n f definida en un entorno o r de un punto a ∈ R y con imagen en R. Supongamos f que su gr´fica se parece mucho a una recta en un en- a torno del punto. La pregunta es ¿a qu´ recta se parece? e ° ¢ Por lo pronto a una que pasa por el punto a, f (a) . Las rectas que pasan por dicho punto (a excepci´n de o a la vertical, que no nos va a interesar) son de la forma r(x) = m(x − a) + f (a), donde m ∈ R. 101
  • 118.
    102 Cap´ ıtulo 3. C´lculo diferencial de una variable a La interpretaci´n geom´trica de m es sencilla. En general, si tenemos una o e recta r(x) = mx + n, en un punto a tomar´ el valor r(a) = ma + n. Si nos a trasladamos a un punto a + h con h 6= 0 obtendremos r(a + h) = ma + mh + n. El incremento que ha experimentado la funci´n es r(a + h) − r(a) = mh, y si lo o dividimos por el desplazamiento h obtenemos, independientemente de cu´l sea a h, el valor m. Es decir, r(a + h) − r(a) m= . h Geom´tricamente esto no es sino el teorema de Tales. En definitiva, m expresa lo e que aumenta la funci´n por unidad de avance: si nos desplazamos h = 1 unidad, o la recta aumenta en m unidades, si avanzamos h = 2 unidades, la recta aumenta 2m, etc. Por lo tanto, si el valor de m es grande la recta subir´ muy r´pidamente, a a ser´ una recta muy empinada. Si m = 0 la recta no sube, es constante. Si m a es negativo la recta baja, m´s r´pidamente cuanto mayor sea m en m´dulo. El a a o n´mero m se llama pendiente de la recta. Una recta viene determinada por u dos de sus puntos o bien por uno de sus puntos y su pendiente (pues conocido un punto (a, b) y la pendiente m conocemos m´s puntos: (a + 1, b + m), por a ejemplo). Volviendo a nuestro problema, tenemos la recta r(x) = m(x−a)+f (a), cuya pendiente es m. Nos falta determinar m para que sea la recta que se parece a f . Consideremos la expresi´n o f (a + h) − f (a) m(h) = . (3.1) h Esto no es una constante (salvo que f sea una recta), pero si ciertamente f se parece a una recta r, esta expresi´n deber´ parecerse a la pendiente de r. o ıa Si f se parece m´s a r cuanto m´s de cerca la miramos, esto es, cuando consi- a a deramos puntos m´s cercanos al punto a, el valor m(h) deber´ parecerse m´s a ıa a a la pendiente de r cuanto menor es h. Por ello definimos: Definici´n 3.1 Sea f : A −→ R y a un punto interior de A. Diremos que f es o derivable en a si existe (en R) f (a + h) − f (a) f 0 (a) = l´ ım . h→0 h Cuando esto sucede, a la recta r(x) = f 0 (a)(x − a) + f (a) se le llama recta ° ¢ tangente a f en el punto a, f (a) (o para abreviar, en el punto a). El n´mero u f 0 (a) es la derivada de f en el punto a. Seg´n hemos dicho, una funci´n es derivable en un punto cuando su gr´fica u o a se confunde en un entorno de dicho punto con la de una recta, la recta tangente a la funci´n en el punto. Esto no es exacto, pues en realidad hay funciones o que se parecen a rectas en los alrededores de un punto y pese a ello no son derivables. Esto ocurre cuando la recta tangente es vertical, con lo que su pendiente es infinita y no existe (en R) el l´ √ ımite que define la derivada. Un ejemplo lo proporciona la funci´n 3 x en x = 0. o
  • 119.
    3.1. Derivaci´n o 103 1 0.5 -2 -1 1 2 -0.5 -1 Observamos que el eje vertical es tangente a la funci´n en 0, pese a lo cual, o seg´n veremos, la funci´n no es derivable en 0. u o Diremos que una funci´n es derivable en un abierto A si es derivable en o todos los puntos de A. Una funci´n es derivable si su dominio es un abierto y o es derivable en todos sus puntos. Si f : A −→ R es derivable, tenemos definida otra funci´n f 0 : A −→ R que o a cada punto a ∈ A le asigna su derivada f 0 (a). A esta funci´n la llamamos o (funci´n) derivada de f en A. o Teniendo en cuenta la motivaci´n que hemos dado para el concepto de de- o rivada, es claro que toda recta no vertical, f (x) = mx + n es derivable en R y su derivada es su pendiente, o sea, m. La raz´n es que, seg´n hemos visto, o u el cociente (3.1) es en este caso constante igual a m, luego el l´ ımite cuando h tiende a 0 es igualmente m. En particular, la derivada de una funci´n constante, o f (x) = a, es f 0 (x) = 0. Ejemplo Calculemos la derivada de la funci´n f (x) = x2 . o (x + h)2 − x2 x2 + 2xh + h2 − x2 f 0 (x) = l´ ım = l´ ım = l´ 2x + h = 2x. ım h→0 h h→0 h h→0 Enseguida veremos que es muy f´cil reconocer las funciones derivables as´ a ı como calcular sus derivadas. Primero demostremos un hecho b´sico. Obvia- a mente, lo primero que ha de hacer una funci´n para parecerse a una recta es ser o continua. Teorema 3.2 Si una funci´n es derivable en un punto a, entonces es continua o en a. Demostracion: Sea f : A −→ R derivable en a. Entonces existe ´ f (a + h) − f (a) f 0 (a) = l´ ım . h→0 h Como l´ h = 0, multiplicando obtenemos que ım h→0 l´ (f (a + h) − f (a)) = f 0 (a)0 = 0. ım h→0
  • 120.
    104 Cap´ ıtulo 3. C´lculo diferencial de una variable a Por lo tanto l´ f (a + h) = f (a). Teniendo en cuenta la definici´n de l´ ım o ımite, h→0 es f´cil ver que esto equivale a que l´ f (x) = f (a). Esto significa que f es a ım x→a continua en a. En particular, las funciones derivables son continuas, pero no toda funci´n o continua es derivable. √ Ejemplos Ya hemos dicho que 3 x no es derivable en 0. Es f´cil probarlo. La a derivada en 0 ser´ ıa √ 3 h−0 1 l´ ım = l´ √ = +∞. ım 3 h→0 h h→0 h2 Aqu´ la raz´n es que la pendiente de la funci´n se ı o o |x| vuelve infinita en 0. Otra causa de no derivabilidad (a pe- sar de la continuidad) es que la funci´n forme un “pico”. o Por ejemplo f (x) = |x| en x = 0. La derivada ser´ıa |h| − 0 l´ ım = l´ sig h, ım h→0 h h→0 pero es claro que el l´ ımite por la izquierda es −1 y el l´ ımite por la derecha es +1, luego no existe tal l´ ımite. 3.2 C´lculo de derivadas a El teorema siguiente recoge las propiedades b´sicas que nos permiten derivar a las funciones m´s simples: a Teorema 3.3 Sean f , g : A −→ R funciones derivables en un punto a ∈ A y α ∈ R. a) f + g es derivable en a y (f + g)0 (a) = f 0 (a) + g 0 (a). b) α f es derivable en a y (α f )0 (a) = α f 0 (a). c) f g es derivable en a y (f g)0 (a) = f 0 (a)g(a) + f (a)g 0 (a). d) Si g(a) 6= 0, f /g es derivable en a y f 0 (a)g(a) − f (a)g 0 (a) (f /g)0 (a) = . g 2 (a) En particular, las funciones derivables en A forman una sub´lgebra de C(A). a
  • 121.
    3.2. C´lculo dederivadas a 105 ´ Demostracion: Las propiedades a) y b) son muy sencillas. Veamos c). g(a + h)g(a + h) − f (a)g(a) (f g)0 (a) = l´ ım h→0 h f (a + h)g(a + h) − f (a)g(a + h) + f (a)g(a + h) − f (a)g(a) = l´ ım h→0 h µ ∂ f (a + h) − f (a) g(a + h) − g(a) = l´ ım g(a + h) + f (a) h→0 h h 0 0 = f (a)g(a) + f (a)g (a), donde hemos usado la continuidad de g en a al afirmar que l´ g(a + h) = g(a). ım h→0 La prueba de d) es similar. Aplicando inductivamente la propiedad c) se obtiene que (xn )0 = nxn−1 , para todo natural n ≥ 1. Aplicando ahora d) resulta que esto es cierto para todo entero n 6= 0. En particular todos los polinomios y fracciones algebraicas son derivables en sus dominios. Por ejemplo, la derivada de 3x4 −2x3 +x2 +5x−3 es igual a 12x3 −6x2 +2x+5. Observar que la derivada de un polinomio coincide con su derivada formal en el sentido algebraico. La derivaci´n de las ra´ o ıces se√ seguir´ un resultado general sobre funciones a inversas. Por ejemplo, la funci´n 3 x es la inversa de la funci´n x3 . Esto significa o √ o que un punto (x, y) est´ en la gr´fica de 3 x si y s´lo si el punto (y, x) est´ en a a o a la de x3 . La gr´fica de una se obtiene de la de la otra cambiando x por y. a Geom´tricamente esto equivale a girar la gr´fica respecto a la diagonal: e a 2 x3 1.5 1 √ 3 x 0.5 -2 -1 1 2 -0.5 -1 -1.5 -2 Es claro geom´tricamente que si una funci´n tiene tangente en el punto e o (x, y), su inversa tendr´ tangente en el punto (y, x), y que la recta tangente a la a inversa resultar´ de girar respecto a la diagonal la recta tangente a la funci´n a o original. Ahora bien, ¿qu´ relaci´n hay entre la pendiente de una recta y la e o pendiente de la recta que resulta de girarla respecto a la diagonal?. Si una recta es y = mx + n (con pendiente m), girar respecto a la diagonal es cambiar y por x, o sea, pasar a x = my + n. Despejando y obtenemos y = (1/m)x − n/m.
  • 122.
    106 Cap´ ıtulo 3. C´lculo diferencial de una variable a Por lo tanto la pendiente es 1/m. Si la recta original tiene pendiente 0 (es horizontal), la recta girada es vertical, tiene pendiente infinita. Por lo tanto es de esperar que si una funci´n biyectiva f cumple f (a) = b y o tiene derivada m 6= 0 en a, entonces su inversa tiene derivada 1/m en b. Antes de probarlo anal´ ıticamente damos un sencillo resultado t´cnico. e Definici´n 3.4 Sea A un intervalo y f : A −→ R, diremos que f es creciente en o A si cuando x < y son dos puntos de A, se cumple f (x) ≤ f (y). Si de hecho se cumple f (x) < f (y) diremos que f es estrictamente creciente en A. Se dice que f es decreciente en A si cuando x < y son puntos de A, se cumple f (y) ≤ f (x). Si se cumple f (y) < f (x) se dice que es estrictamente decreciente en A. La funci´n f es (estrictamente) mon´tona en A si es (estrictamente) creciente o o o decreciente en A. Por ejemplo, la funci´n x3 es estrictamente creciente en R. o Teorema 3.5 Sea A un intervalo y f : A −→ R una funci´n inyectiva y conti- o nua. Entonces f es estrictamente mon´tona en A. o ´ Demostracion: Sean a < b dos puntos cualesquiera de A. Supongamos que f (a) < f (b). Entonces todo a < x < b ha de cumplir f (a) < f (x) < f (b), pues si, por ejemplo, f (x) < f (a) < f (b), por el teorema de los valores intermedios, en el intervalo ]x, b[ habr´ un punto cuya imagen ser´ f (a), y f no ser´ inyectiva. ıa ıa ıa De aqu´ se sigue que f es creciente en [a, b], pues si a ≤ x < y ≤ b, hemos ı visto que f (a) < f (x) < f (b), y aplicando lo mismo a los puntos x, b, resulta que f (x) < f (y) < f (b). Igualmente, de f (b) < f (a) llegar´ ıamos a que f es decreciente en [a, b]. Por lo tanto f es mon´tona en cualquier intervalo [a, b] o contenido en A. Pero si f no fuera mon´tona en A existir´ puntos u < v y r < s tales o ıan que f (u) < f (v) y f (s) < f (r). Tomando el m´ ınimo y el m´ximo de estos a cuatro puntos obtendr´ ıamos los extremos de un intervalo en el que f no ser´ ıa mon´tona. o Teorema 3.6 (Teorema de la funci´n inversa) Sea A un intervalo abierto o y f : A −→ R una funci´n inyectiva y derivable en A tal que f 0 no se anule en o ning´n punto de A. Entonces u a) B = f [A] es un intervalo abierto. b) La funci´n inversa g = f −1 : B −→ A es derivable en B. o c) Para todo a ∈ A, si f (a) = b, se cumple que g 0 (b) = 1/f 0 (a). ´ Demostracion: Por el teorema anterior sabemos que f es estrictamente mon´tona. Digamos que es mon´tona creciente. Si a < b son dos puntos de o £ § o A, por conexi´n£ f ]a,§b[ ha de ser un intervalo, y de la monoton´ se sigue o ıa f´cilmente que f ]a, b[ = ]f (a), f (b)[. a
  • 123.
    3.2. C´lculo dederivadas a 107 Dado a ∈ A, podemos tomar un ≤ > 0 tal que [a − ≤, a + ≤] ⊂ A, con lo que £ § f (a) ∈ ]f (a − ≤), f (a − ≤)[ = f ]a − ≤, a + ≤[ ⊂ B. As´ pues B es un entorno de f (a) para todo a ∈ A, o sea, para todos los ı puntos de B. Por lo tanto B es abierto. Por conexi´n es un intervalo. Adem´s o a hemos visto que f env´ abiertos b´sicos ]a, b[ a abiertos b´sicos, y esto significa ıa a a que g es continua. Sea ahora f (a) = b. Por la monoton´ si h 6= 0, entonces g(b + h) 6= g(b). ıa, Sea k = g(b + h) − g(b) 6= 0. As´ g(b + h) = k + a, luego b + h = f (k + a), y ı h = f (k + a) − f (a). Por lo tanto g(b + h) − g(b) 1 = f (a+k)−f (a) h k Ahora, k es una funci´n de h y, como g es continua, l´ k(h) = 0. La o ım h→0 derivabilidad de f en el punto a nos da que g(b + h) − g(b) 1 g 0 (b) = l´ ım = 0 . h→0 h f (a) Ejemplo Sea n un n´mero natural no nulo y consideremos f (x) = xn definida u en ]0, +∞[. Sabemos que es inyectiva y derivable. Su derivada es nxn−1 , que √ no se anula en ]0, +∞[. Por lo tanto su inversa, que es g(x) = n x, es derivable √ en su dominio y si y n = x (con lo que y = n x), entonces g 0 (x) = 1/f 0 (y), o sea, √ 1 1 1 ( n x)0 = = √ n−1 = x−1+1/n . ny n−1 n x n n As´ pues, tenemos probado que la regla de derivaci´n xr 7→ rxr−1 es v´lida ı o a cuando r es entero o de la forma 1/n, donde n es un n´mero natural no nulo. u Aplicando la regla del producto se concluye por inducci´n que vale de hecho o para todo n´mero racional r. u √ Con todo lo anterior, todav´ no sabemos derivar funciones como x2 + 1. ıa Con el teorema siguiente estaremos en condiciones de derivar cualquiera de las funciones que podemos construir a partir de polinomios y ra´ ıces. Teorema 3.7 (regla de la cadena) Sean f : A −→ R y g : B −→ R. Sea un punto a ∈ A tal que f sea derivable en a y g sea derivable en f (a). Entonces la funci´n compuesta f ◦ g es derivable en a y (f ◦ g)0 (a) = g 0 (f (a))f 0 (a). o ´ Demostracion: Notemos que B es un entorno de f (a) y f es continua en a, luego f −1 [B] es un entorno de a sobre el que est´ definida f ◦ g. a Sea b = f (a). Para k 6= 0, llamemos g(b + k) − g(b) G(k) = − g 0 (b). k
  • 124.
    108 Cap´ ıtulo 3. C´lculo diferencial de una variable a La funci´n G est´ definida para los puntos k tales que b + k ∈ B. Como B o a es abierto, G est´ definida al menos para h en un intervalo ]−≤, ≤[ {0}. Como a g es derivable en b, existe l´ G(k) = 0, luego si definimos G(0) = 0 tenemos ım k→0 que G es continua en un entorno de 0. Claramente adem´s a ° 0 ¢ g(b + k) − g(b) = g (b) + G(k) k. Ahora tomamos h 6= 0 tal que a + h ∈ A y k = f (a + h) − f (a), con lo que se cumple f (a + h) = b + k, luego b + k ∈ B y est´ definido G(k). Entonces a ° ¢ ° ¢ ° 0 ¢ g f (a + h) − g f (a) = g (f (a)) + G(k) k ° ¢° ¢ = g 0 (f (a)) + G(k) f (a + h) − f (a) . En consecuencia (f ◦ g)(a + h) − (f ◦ g)(a) ° 0 ¢ f (a + h) − f (a) = g (f (a)) + G(f (a + h) − f (a)) . h h Usando la continuidad de f en a y la de G en 0, tomamos el l´ ımite cuando h tiende a 0 y queda que existe (f ◦ g)0 (a) = g 0 (f (a))f 0 (a). √ Ejemplo La funci´n h(x) = x2 + 1 es derivable en R, pues es la composici´n o √ o del polinomio f (x) = x2 + 1 con la funci´n g(x) = x, y ambas funciones son o √ derivables en sus dominios. Sabemos que f 0 (x) = 2x y g 0 (x) = 1/(2 x). La regla de la cadena nos da que 2x x h0 (x) = g 0 (x2 + 1)f 0 (x) = √ =√ . 2 x2 + 1 x2 + 1 El lector que no est´ familiarizado con el c´lculo de derivadas deber´ prac- e a ıa ticar hasta que la derivaci´n le resultara un acto mec´nico. Hay muchos libros o a adecuados para ello, por lo que en adelante dejaremos de justificar los c´lculos a de derivadas. 3.3 Propiedades de las funciones derivables La derivada de una funci´n contiene mucha informaci´n sobre ´sta. Consi- o o e deremos por ejemplo x5 x3 x4 3 f (x) = − + 2, f 0 (x) = − x2 . 10 2 2 2 La figura de la p´gina siguiente muestra las gr´ficas. Fij´monos en el signo a a e de la derivada. Es f´cil ver que f 0 tiene una ra´ doble en 0 y dos ra´ √ £ √ a ız § ıces sim- ples en ± 3. La restricci´n de f 0 a cada uno de los intervalos −∞, − 3 , o § √ £ § √ £ §√ £ − 3, 0 , 0, 3 y 3, +∞ es una funci´n continua que no se anula, luego o por el teorema de los valores intermedios f 0 tiene signo constante en cada uno de ellos. Es f´cil ver entonces que el signo de f 0 var´ como indica la gr´fica, es a ıa a decir, f 0 es positiva en los dos intervalos no acotados y negativa en los acotados.
  • 125.
    3.3. Propiedades delas funciones derivables 109 f 0 (x) 7.5 5 2.5 -4 -2 2 4 -2.5 -5 f (x) -7.5 En los puntos donde f 0 es positiva la tangente a f tiene pendiente positiva, y vemos en la gr´fica que esto se traduce en que f es creciente. Por el contrario, a en los intervalos donde f 0 es negativa la funci´n f es decreciente. o √ En los puntos donde f 0 se anula la tangente a f es horizontal. En − 3, la derivada pasa de ser positiva a ser negativa, luego f pasa de ser creciente a ser decreciente, y por ello el punto es un m´ximo relativo, en el sentido de que f √ a toma en − 3 un valor mayor que en los puntos de alrededor. En cambio, en √ 3 la derivada pasa de negativa a positiva, f pasa de decreciente a creciente y el punto es un m´ ınimo relativo. El caso del 0 es distinto, pues f 0 es negativa a la izquierda, toca el 0 y vuelve a bajar, con lo que sigue siendo negativa. Por ello f es creciente en 0 y no tiene ni un m´ximo ni un m´ a ınimo en 0. Vemos as´ que conociendo la derivada podemos formarnos una idea de la ı funci´n: d´nde crece, d´nde decrece, d´nde tiene m´ximos y m´ o o o o a ınimos, y m´sa cosas de las que no hemos hablado. Vamos a desarrollar todas estas ideas. Definici´n 3.8 Sea f : A ⊂ R −→ R. Diremos que f tiene un m´ximo relativo o a en un punto a ∈ A si existe un entorno V de a contenido en A de modo que para todo x ∈ V se cumple f (x) ≤ f (a). Diremos que f tiene un m´ ınimo relativo en a si existe un entorno V de a contenido en A tal que para todo x ∈ V se cumple f (a) ≤ f (x). La funci´n f tiene un extremo relativo en a si tiene un m´ximo o o a un m´ ınimo relativo en a. Teorema 3.9 Si f : A −→ R es una funci´n derivable en un punto a ∈ A y f o tiene un extremo relativo en a, entonces f 0 (a) = 0. Demostracion: Supongamos, por reducci´n al absurdo, que f 0 (a) > 0. ´ o (El caso f 0 (a) < 0 se razona an´logamente.) Entonces ]0, +∞[ es un entorno de a f 0 (a), luego por definici´n de l´ o ımite y de derivada existe un ≤ > 0 de manera que ]a − ≤, a + ≤[ ⊂ A y si 0 < |h| < ≤ entonces f (a + h) − f (a) > 0. h
  • 126.
    110 Cap´ ıtulo 3. C´lculo diferencial de una variable a Esto se traduce en que f (a + h) > f (a) si h > 0 y f (a + h) < f (a) si h < 0, lo que contradice que f tenga un extremo relativo en a. La funci´n del ejemplo anterior muestra que f 0 (a) = 0 no implica que a o sea un extremo relativo. M´s adelante volveremos sobre este punto. Ahora a probemos una consecuencia sencilla de este teorema: Teorema 3.10 (Teorema de Rolle) Sea f : [a, b] −→ R una funci´n conti- o nua en [a, b] y derivable en ]a, b[. Si f (a) = f (b), entonces existe un c ∈ ]a, b[ tal que f 0 (c) = 0. ´ Demostracion: Como [a, b] es compacto, la funci´n f alcanza un valor o m´ınimo m y un valor m´ximo M . Si se cumpliera que m = M = f (a) = f (b), a entonces f ser´ constante y su derivada ser´ nula, luego cualquier c ∈ ]a, b[ ıa ıa cumplir´ el teorema. ıa Supongamos que m < M . Entonces, o bien m 6= f (a) o bien M 6= f (a). Digamos por ejemplo M 6= f (a). Sea c ∈ [a, b] el punto donde f (c) = M . Como M 6= f (a) = f (b), ha de ser a < b < c, y como f toma en c su valor m´ximo, en a particular c es un m´ximo relativo de f , luego por el teorema anterior f 0 (c) = 0. a Como aplicaci´n podemos relacionar la derivabilidad y el crecimiento global o de una funci´n. o Teorema 3.11 Sea A un intervalo abierto y f : A −→ R una funci´n derivable o en A tal que f 0 no se anule. Entonces f es estrictamente mon´tona en A y o adem´s se da uno de estos dos casos: a a) o bien f 0 (x) > 0 para todo x ∈ A, y entonces f es estrictamente creciente en A, b) o bien f 0 (x) < 0 para todo x ∈ A, y entonces f es mon´tona decreciente o en A. ´ Demostracion: En primer lugar, f es inyectiva, pues si a < b son dos puntos de A tales que f (a) = f (b), entonces existe un c ∈ ]a, b[ ⊂ A tal que f 0 (c) = 0, en contra de la hip´tesis. o Por el teorema 3.5, f es estrictamente mon´tona en A. Si es mon´tona decre- o o ciente, la prueba del teorema 3.9 muestra que no puede ser f 0 (a) > 0 en ning´n u punto a ∈ A, luego ha de ser f 0 (a) < 0 en todos los puntos. An´logamente, si a f es mon´tona creciente ha de ser f 0 (a) > 0 en toco a ∈ A. o Veamos ahora un resultado t´cnico: e Teorema 3.12 (Teorema de Cauchy) Sean f , g : [a, b] −→ R funciones continuas en [a, b] y derivables en ]a, b[. Entonces existe un c ∈ ]a, b[ tal que ° ¢ ° ¢ g 0 (c) f (b) − f (a) = f 0 (c) g(b) − g(a) .
  • 127.
    3.3. Propiedades delas funciones derivables 111 ´ Demostracion: Consideremos la funci´n dada por o ° ¢ ° ¢ h(x) = f (x) g(b) − g(a) − g(x) f (b) − f (a) . Se cumple que h(a) = h(b) = f (a)g(b) − g(a)f (b). Adem´s h es continua en a [a, b] y derivable en ]a, b[. Por el ° teorema de ¢Rolle existe un punto¢ c ∈ ]a, b[ tal ° que h0 (c) = 0, pero h0 (x) = f 0 (x) g(b) − g(a) − g 0 (x) f (b) − f (a) , luego ° ¢ ° ¢ f 0 (c) g(b) − g(a) − g 0 (c) f (b) − f (a) = 0 M´s adelante tendremos ocasi´n de usar este resultado en toda su genera- a o lidad, pero de momento nos basta con el caso particular que resulta de tomar como funci´n g la dada por g(x) = x. Entonces tenemos: o Teorema 3.13 (Teorema del valor medio) Sea f : [a, b] −→ R una funci´n o continua en [a, b] y derivable en ]a, b[. Entonces existe un c ∈ ]a, b[ tal que f (b) − f (a) = f 0 (c)(b − a). Notar que el teorema de Rolle es un caso particular del teorema del valor medio. Este teorema tiene una interpretaci´n geom´trica. La expresi´n o e o f (b) − f (a) b−a puede interpretarse como la “pendiente media” de f en [a, b], es decir, es el cociente de lo que aumenta f cuando la variable x pasa de a a b dividido entre lo que ha aumentado la variable. Lo que dice el teorema del valor medio es que hay un punto en el intervalo donde la funci´n toma el valor medio de su o pendiente. La importancia de este teorema es que nos relaciona una magnitud global, la pendiente media, con una magnitud local, la derivada en un punto. Las consecuencias son muchas. Una aplicaci´n t´ o ıpica es el siguiente refinamiento del teorema 3.11: Teorema 3.14 Si f : [a, b] −→ R es continua en [a, b], derivable en ]a, b[ y su derivada es positiva (negativa) en ]a, b[, entonces f es estrictamente creciente (decreciente) en [a, b]. ´ Demostracion: El teorema 3.11 nos da que f es estrictamente mon´tona o en ]a, b[. S´lo falta probar que es creciente o decreciente en a y en b. o Si x ∈ ]a, b[, entonces f (x) − f (a) = f 0 (c)(x − a), para cierto punto c ∈ ]a, x[. Por lo tanto, si f 0 es positiva, f (x) − f (a) > 0 para todo x ∈ ]a, b[, e igualmente se prueba que f (b) − f (x) > 0 para todo x ∈ ]a, b[, luego f es creciente en [a, b].
  • 128.
    112 Cap´ ıtulo 3. C´lculo diferencial de una variable a Sabemos que las funciones constantes tienen derivada nula. El teorema del valor medio nos da el rec´ ıproco: Teorema 3.15 Si una funci´n tiene derivada nula en todos los puntos de un o intervalo abierto, entonces es constante. ´ Demostracion: Sea f una funci´n derivable en un intervalo A con derivada o nula. Sean a < b dos puntos cualesquiera de A. Entonces f (b) − f (a) = f 0 (c)(b − a) = 0, donde c es un punto de ]a, b[. Por lo tanto f es constante. Una consecuencia inmediata es el teorema siguiente, que afirma que una funci´n derivable est´ un´ o a ıvocamente determinada por su derivada y su valor en un punto cualquiera. Teorema 3.16 Si f y g son funciones derivables en un intervalo abierto y f 0 = g 0 , entonces existe un k ∈ R tal que f = g + k. ´ Demostracion: La funci´n f − g tiene derivada nula, luego f − g = k. o Las derivadas proporcionan un teorema muy util para el c´lculo de l´ ´ a ımites. De momento no podemos estimar su valor porque los l´ ımites de las funciones que conocemos (polinomios, fracciones algebraicas. etc.) son f´ciles de calcular a directamente, pero m´s adelante tendremos ocasi´n de aprovecharlo. a o Teorema 3.17 (Regla de L’Hˆpital) Sean f , g : ]a, b[ −→ R funciones de- o rivables tales que l´ f (x) = l´ g(x) = 0 y de modo que g y g 0 no se anulen ım ım x→a x→a en ]a, b[. Si existe f 0 (x) l´ ım = L, x→a g 0 (x) entonces tambi´n existe e f (x) l´ ım = L. x→a g(x) ´ Demostracion: Extendamos f y g al intervalo [a, b[ estableciendo que f (a) = g(a) = 0. As´ siguen siendo continuas. ı Si a < x < b, por el teorema de Cauchy existe un punto c ∈ ]a, x[ tal que ° ¢ ° ¢ f (x) − f (a) g 0 (c) = g(x) − g(a) f 0 (c), o sea, f (x)g 0 (c) = g(x)f 0 (c), y como g(x) 6= 0 6= g 0 (c), podemos escribir f (x) f 0 (c) = 0 . (3.2) g(x) g (c) Por definici´n de l´ o ımite, si ≤ > 0, existe un δ > 0 tal que si 0 < c − a < δ, entonces Ø 0 Ø Ø f (c) Ø Ø Ø Ø g 0 (c) − LØ < ≤. (3.3)
  • 129.
    3.3. Propiedades delas funciones derivables 113 As´ tenemos que si 0 < x − a < δ, existe un c ∈ ]a, x[ que cumple (3.2) y ı (3.3). Por consiguiente, para todo x ∈ ]a, a + δ[ se cumple Ø Ø Ø f (x) Ø Ø − LØ < ≤. Ø g(x) Ø Esto significa que f (x) l´ ım = L. x→a g(x) Obviamente la regla de L’Hˆpital tambi´n es v´lida cuando en las hip´tesis o e a o cambiamos a por b. Combinando las dos versiones obtenemos la regla de L’Hˆpital para funciones definidas en intervalos ]a − ≤, a + ≤[ {a} y tomando o l´ ımites en a (si existe el l´ ımite del cociente de derivadas, existen los l´ ımites por la derecha y por la izquierda y coinciden, por los casos correspondientes de la regla, existen los l´ ımites de los cocientes de las funciones por ambos lados y coinciden, luego existe el l´ ımite y coincide con el de las derivadas). Los teoremas siguientes demuestran otras variantes de la regla de L’Hˆpital o de no menor inter´s. e Teorema 3.18 (Regla de L’Hˆpital) Sean f , g : ]a, +∞[ −→ R dos funcio- o nes derivables tales que l´ ım g(x) = 0 y de modo que g y g 0 no ım f (x) = l´ x→+∞ x→+∞ se anulan en ]a, +∞[. Si existe f 0 (x) l´ ım = L, x→+∞ g 0 (x) entonces tambi´n existe e f (x) l´ ım = L. x→+∞ g(x) ´ Demostracion: Consideremos las funciones F (x) = f (1/x) y G(x) = g(1/x), definidas en ]0, 1/a[. Claramente F y G son continuas, y l´ F (x) = ım x→0 l´ G(x) = 0. Adem´s por la regla de la cadena son funciones derivables y sus ım a x→0 derivadas son f 0 (1/x) g 0 (1/x) F 0 (x) = − , G0 (x) = − . x2 x2 Tambi´n es claro que ni G ni G0 se anulan en su dominio y e F 0 (x) f 0 (1/x) 0 (x) = 0 , G g (1/x) luego existe F 0 (x) l´ ım = L. x→0 G0 (x)
  • 130.
    114 Cap´ ıtulo 3. C´lculo diferencial de una variable a El caso ya probado de la regla de L’Hˆpital nos da ahora que tambi´n existe o e F (x) l´ ım = L. x→0 G(x) Obviamente entonces f (x) l´ ım = L. x→+∞ g(x) Igualmente se prueba la regla de L’Hˆpital para funciones definidas en in- o tervalos ]− nf ty, b[ y cuando x tiende a −∞. As´ pues, si tenemos una indeterminaci´n de tipo 0/0 y al derivar nume- ı o rador y denominador podemos calcular el l´ ımite, la funci´n original tiene ese o mismo l´ ımite. Ahora veremos que la regla de L’Hˆpital es aplicable tambi´n a o e indeterminaciones del tipo ∞/∞. Teorema 3.19 (Regla de L’Hˆpital) Sean f , g : ]a, +∞[ −→ R dos funcio- o nes derivables tales que l´ ım g(x) = ∞ y de modo que g y g 0 no ım f (x) = l´ x→+∞ x→+∞ se anulan en ]a, +∞[. Si existe f 0 (x) l´ ım = L, x→+∞ g 0 (x) entonces tambi´n existe e f (x) l´ ım = L. x→+∞ g(x) ´ Demostracion: Por definici´n de l´ o ımite, dado ≤ > 0, existe un M > a tal que si x > M entonces Ø 0 Ø Ø f (x) Ø Ø Ø Ø g 0 (x) − LØ < ≤. Por el teorema de Cauchy, si x > M , existe un y ∈ ]M, x[ de modo que f (x) − f (M ) f 0 (y) = 0 , g(x) − g(M ) g (y) luego Ø Ø Ø f (x) − f (M ) Ø Ø − LØ < ≤. Ø g(x) − g(M ) Ø (Notar que, como g 0 no se anula, la funci´n g es mon´tona, luego el denominador o o es no nulo). Puesto que l´ım f (x) = ∞, existe un N > M tal que si x > N entonces x→+∞ |f (x)| > |f (M )|, y en particular f (x) − f (M ) 6= 0. Por ello, para x > N podemos escribir f (x) f (x) − f (M ) f (x) g(x) − g(M ) = . g(x) g(x) − g(M ) f (x) − f (M ) g(x)
  • 131.
    3.4. La diferencialde una funci´n o 115 Si en los dos ultimos factores dividimos numerador y denominador entre f (x) ´ y g(x) respectivamente, queda claro que tienden a 1 cuando x → +∞, luego tomando N suficientemente grande podemos suponer que si x > N entonces el producto de ambos dista de 1 menos de ≤. De este modo, para x suficientemente grande, el cociente f (x)/g(x) se puede expresar como producto de dos n´meros u reales, uno arbitrariamente pr´ximo a L y otro arbitrariamente pr´ximo a 1. o o De la continuidad del producto se sigue que f (x) l´ ım = L. x→+∞ g(x) Naturalmente la regla de L’Hˆpital tambi´n es v´lida en el caso ∞/∞ cuando o e a x → −∞. El mismo argumento que nos ha permitido pasar del caso finito al caso infinito en la indeterminaci´n 0/0 nos permite pasar ahora al caso finito. o Es f´cil probar: a Teorema 3.20 (Regla de L’Hˆpital) Sean f , g : ]a, b[ −→ R derivables tales o que l´ f (x) = l´ g(x) = ∞ y de modo que g y g 0 no se anulan en ]a, b[. Si ım ım x→a x→a existe f 0 (x) l´ ım 0 = L, x→a g (x) entonces tambi´n existe e f (x) l´ ım = L. x→a g(x) Tambi´n se cumple la versi´n correspondiente cuando x tiende a b y cuando e o x tiende a un punto por la izquierda y la derecha a la vez. 3.4 La diferencial de una funci´n o Consideremos una funci´n f : A −→ R derivable en un punto a ∈ A. Sea o ∆x un n´mero pr´ximo a 0 de modo que a + ∆x ∈ A (el t´rmino ∆x se lee u o e “incremento de x”, porque representa un peque˜o aumento de la variable x n en el punto a). Al calcular f en el punto a + ∆x obtenemos una variaci´n o o incremento de f dado por ∆a (f ) = f (a + ∆x) − f (a). La expresi´n ∆a (f ) o representa a una funci´n de la variable ∆x, definida en un entorno de 0. La o derivada de f en a es, por definici´n, o ∆a (f ) f 0 (a) = l´ ım . ∆x→0 ∆x Llamemos ∆a (f ) ≤a (∆x) = − f 0 (a). ∆x As´ l´ ≤a (∆x) = 0. ı, ım ∆x→0
  • 132.
    116 Cap´ ıtulo 3. C´lculo diferencial de una variable a Desarrollando las definiciones tenemos que ∆a (f ) = f (a + ∆x) − f (a) = f 0 (a)∆x + ≤(∆x)∆x. La figura muestra la situaci´n: o ≤a (∆x)∆x f 0 (a)∆x ∆a (f ) ∆x f a a + ∆x El hecho de que ≤a (∆x) tienda a 0 expresa simplemente el hecho de que, para valores peque˜os de ∆x, se cumple f (a + ∆x) − f (a) ≈ f 0 (a)∆x, donde el n signo ≈ significa “aproximadamente igual”, es decir, que el valor de la funci´n o f (a + ∆x) es similar al de la recta tangente f (a) + f 0 (a)∆x. En la figura ambos valores son muy diferentes porque hemos tomado un ∆x grande para mayor claridad. Llamaremos diferencial de f en el punto a a la aplicaci´n df (a) : R −→ R o dada por df (a)(∆x) = f 0 (a)∆x. As´ df (a) es una aplicaci´n lineal en R de ı o modo que f (a + ∆x) − f (a) ≈ df (a)(∆x), o sea, la funci´n df (a) aproxima las o diferencias entre las im´genes de f en puntos cercanos al punto a y la imagen a de a. De aqu´ su nombre. ı Si consideramos la funci´n polin´mica x, su derivada es 1, luego la diferencial o o de x es simplemente dx(a)(∆x) = ∆x. Por ello podemos escribir df (a)(∆x) = f 0 (a) dx(a)(∆x), luego tenemos la igualdad funcional df (a) = f 0 (a) dx(a). Si la funci´n f es derivable en todo punto de A, la igualdad anterior se cumple o en todo punto, luego si consideramos a df y dx como aplicaciones de A en el espacio de aplicaciones lineales de R en R, tenemos la igualdad funcional df = f 0 dx, donde dx es la funci´n constante que a cada a ∈ A le asigna la funci´n identidad o o en R. Del mismo modo que la estructura topol´gica permite hablar de los puntos o de alrededor de un punto dado, pese a que ning´n punto en particular est´ u a alrededor de otro, as´ mismo la diferencial de una funci´n recoge el concepto ı o de “incremento infinitesimal” de una funci´n, pese a que ning´n incremento o u en particular es infinitamente peque˜o. Por ejemplo, la igualdad dx2 = 2x dx n
  • 133.
    3.4. La diferencialde una funci´n o 117 expresa que cuando la variable x experimenta un incremento infinitesimal dx, la funci´n x2 experimenta un incremento infinitesimal de 2x dx. Con rigor, dx2 o no es un incremento infinitesimal, sino la funci´n que a cada incremento ∆x o le asigna una aproximaci´n al incremento correspondiente de x2 , de modo que o lo que propiamente tenemos es la aproximaci´n que resulta de evaluar dx en o incrementos concretos, es decir, ∆x (x2 ) ≈ 2x∆x. El error de esta aproximaci´n o se puede hacer arbitrariamente peque˜o tomando ∆x suficientemente peque˜o. n n Por ejemplo, (1,1)2 ≈ 12 + dx2 (1)(0,1) = 1 + 2 · 0, 1 = 1,2. En realidad (1,1)2 = 1,21, luego el error cometido es de una cent´sima. e Dada la igualdad df = f 0 dx, representaremos tambi´n la derivada de f e mediante la notaci´n o df f 0 (x) = , dx que expresa que f 0 (x) es la proporci´n entre las funciones df y dx, o tambi´n que o e f 0 (x) es la raz´n entre un incremento infinitesimal de f respecto al incremento o infinitesimal de x que lo ocasiona. Es costumbre, especialmente en f´ ısica, nombrar las funciones, no por la ex- presi´n que las determina, sino por la magnitud que determinan. Por ejemplo, o supongamos que la posici´n e de un objeto depende del tiempo viene dada por o la relaci´n e(t) = t2 Entonces la velocidad del m´vil es o o de v(t) = = 2t, dt lo que nos permite expresar t en funci´n de v, mediante t(v) = v/2. A su vez, o esto nos permite calcular la posici´n en funci´n de la velocidad, mediante la o o funci´n e(v) = v 2 /4. o De este modo, llamamos e tanto a la funci´n e(t) como a la funci´n e(v), o o que son funciones distintas. La letra v representa a una funci´n en v = 2t y a o una variable en t = v/2. Estos convenios no provocan ninguna ambig¨edad, al u contrario, en muchos casos resultan m´s claros y permiten expresar los resul- a tados de forma m´s elegante. Por ejemplo, si tenemos dos funciones y = y(x) a y z = z(y), entonces la funci´n compuesta se expresa, en estos t´rminos, como o e z = z(x). Si las funciones son derivables en sus dominios, la regla de la cadena se convierte en dz dz dy = . dx dy dx La primera derivada es la de la funci´n compuesta z(x), mientras que la o segunda es la de z(y). No es necesario indicar que dicha derivada ha de calcularse en y(x), pues esto ya est´ impl´ a ıcito en el hecho de que se trata de una funci´n o de y (no de x). Por ejemplo, de de dv v = = · 2 = v = 2t, dt dv dt 2 como cab´ esperar. ıa
  • 134.
    118 Cap´ ıtulo 3. C´lculo diferencial de una variable a Similarmente, si y(x) es una funci´n inyectiva y derivable con derivada no o nula, su inversa se representa por x(y), y el teorema de la funci´n inversa se o expresa as´ı: dy 1 = dx . dx dy Por ejemplo, dv 1 1 = dt = = 2. dt dv 1/2 Vemos, pues, que en estos t´rminos las propiedades de las derivadas son e formalmente an´logas a las de las fracciones. a 3.5 El teorema de Taylor Sea f : A −→ R una funci´n derivable en el abierto A y tal que f 0 : A −→ R o tambi´n sea derivable en A. Entonces a la derivada de f 0 se la denomina derivada e segunda de f en A, y se representa por f 00 . A su vez la derivada segunda puede ser derivable, y entonces est´ definida la a derivada tercera, y as´ sucesivamente. Si una funci´n admite n derivadas en A, ı o a la derivada n-sima se la representa por f n) : A −→ R. Conviene usar la notaci´n f 0) para referirse a la propia funci´n f . o o Llamaremos C n (A) al conjunto de las funciones definidas en A que admiten n derivadas y todas ellas son continuas en A. Si llamamos C 0 (A) = C(A), es decir, al conjunto de las funciones continuas en A, entonces tenemos C 0 (A) ⊃ C 1 (A) ⊃ C 2 (A) ⊃ C 3 (A) ⊃ C 4 (A) ⊃ · · · Llamaremos C ∞ (A) al conjunto de las funciones infinitamente derivables en A. Por ejemplo, los polinomios y las fracciones algebraicas son de clase C ∞ en su dominio. Es inmediato que estos conjuntos son todos sub´lgebras de C(A). a Las inclusiones son todas estrictas. Por ejemplo, si a ∈ A es f´cil ver que la a funci´n dada por o Ω (x − a)n+1 si x ≥ a f (x) = −(x − a)n+1 si x ≤ a es una funci´n de clase C n (A) pero no de clase C n+1 (A). o Seg´n sabemos, si una funci´n f es derivable en un punto a, entonces alre- u o dedor de a la funci´n f puede ser aproximada por su recta tangente, esto es, o por el polinomio f (a) + f 0 (a)(x − a). La recta tangente es el unico polinomio ´ P (x) de grado 1 que cumple P (a) = f (a) y P 0 (a) = f 0 (a). Cabe suponer que si una funci´n f admite dos derivadas y tomamos un o polinomio P de grado 2 tal que P (a) = f (a), P 0 (a) = f 0 (a) y P 00 (a) = f 00 (a), el polinomio P nos dar´ una aproximaci´n mejor de la funci´n f que la recta a o o tangente. Esto no siempre es as´ pero hay bastante de verdad en ello. Vamos ı, a investigarlo.
  • 135.
    3.5. El teoremade Taylor 119 Ante todo, si K es un cuerpo y a ∈ K, la aplicaci´n u : K[x] −→ K[x] dada o por u(p) = p(x − a) es un isomorfismo de K-espacios vectoriales. Como los polinomios 1, x, x2 , x3 , . . . son una K-base de K[x], resulta que los polinomios 1, (x − a), (x − a)2 , (x − a)3 , (x − a)4 , . . . son tambi´n una K-base, es decir, que todo polinomio de K[x] se expresa de e forma unica como ´ P (x) = c0 + c1 (x − a) + c2 (x − a)2 + · · · + cn (x − a)n , (3.4) para cierto natural n y ciertos coeficientes co , . . . , cn ∈ K. Si una funci´n f admite n derivadas en un punto a, las ecuaciones o f (a) = P (a), f 0 (a) = P 0 (a), ... f n) (a) = P n) (a) son satisfechas por un unico polinomio de grado ≤ n. En efecto, si P (x) viene ´ dado por (3.4), entonces P (a) = c0 , luego ha de ser c0 = f (a). Derivando obtenemos P 0 (x) = c1 + 2c2 (x − a) + · · · + ncn (x − a)n−1 , de donde P 0 (a) = c1 , y ha de ser c1 = f 0 (a). Similarmente, P 00 (a) = 2c2 , luego c2 = f 00 (a)/2. Igualmente se obtiene c3 = f 000 (a)/6 y, en general, ck = f k) (a)/k!. En resumen: n X f k) P (x) = (x − a)k . k! k=0 Rec´ ıprocamente, es f´cil ver que el polinomio P (x) as´ definido cumple que a ı P k) (a) = f k) (a) para k = 0, . . . , n. Definici´n 3.21 Sea f una funci´n derivable n veces en un punto a. Llamare- o o mos polinomio de Taylor de grado n de f en a al polinomio n X f k) Pn (f )(x) = (x − a)k ∈ R[x]. k! k=0 El polinomio de Taylor es el unico polinomio P de grado menor o igual ´ que n que cumple P k) (a) = f k) (a) para k = 0, . . . , n. En particular si f es un polinomio de grado menor o igual que n se ha de cumplir Pn (f ) = f . Notar tambi´n que P0 (f ) = f (a), y que P1 (f ) = f (a) + f 0 (a)(x − a) es la e recta tangente a f en a. Nuestra conjetura es que Pn (f ) es el polinomio de grado menor o igual que n que m´s se parece a f alrededor de a. a
  • 136.
    120 Cap´ ıtulo 3. C´lculo diferencial de una variable a Ejemplo Consideremos la funci´n f (x) = x1/2 y a = 1. Calculemos sus o derivadas: Orden Derivada en 1 0 x1/2 1 1 −1/2 1 1 2x 2 2 − 1 1 x−3/2 2 2 −1 2 1 2 1 1 3 −5/2 1 1 3 3 2 2 2x 2 2 2 4 −1 2 1 3 5 −7/2 2 2 2x −1 2 1 3 5 2 2 2 En general se prueba que las derivadas en 1 van alternando el signo, en el numerador tienen el producto de los primeros impares y en el denominador las sucesivas potencias de 2. Con esto podemos calcular cualquier polinomio de Taylor en 1: P0 (f )(x) = 1, 1 P1 (f )(x) = 1 + (x − 1), 2 1 1 P2 (f )(x) = 1 + (x − 1) − (x − 1)2 , 2 8 1 1 1 P3 (f )(x) = 1 + (x − 1) − (x − 1)2 + (x − 1)3 . 2 8 16 Aqu´ est´n sus gr´ficas junto a la de la funci´n. Vemos que el intervalo en ı a a o que se confunden con la gr´fica de f es cada vez mayor. a 2 2 1.75 1.75 1.5 1.5 1.25 1.25 1 1 0.75 0.75 0.5 0.5 0.25 0.25 0 0.5 1 1.5 2 2.5 3 0 0.5 1 1.5 2 2.5 3 2 2 1.75 1.75 1.5 1.5 1.25 1.25 1 1 0.75 0.75 0.5 0.5 0.25 0.25 0 0.5 1 1.5 2 2.5 3 0 0.5 1 1.5 2 2.5 3 El polinomio de grado 8 es bastante representativo de lo que sucede cuando n es grande:
  • 137.
    3.5. El teoremade Taylor 121 2 1.75 1.5 1.25 1 0.75 0.5 0.25 0 0.5 1 1.5 2 2.5 3 Vemos que la aproximaci´n es cada vez mejor en el intervalo [0, 2], pero a o partir del 2 el polinomio se aleja bruscamente. Un ejemplo num´rico: e p P8 (f )(1, 5) = 1, 224729895, mientras que 1, 5 = 1, 224744871. . . La aproximaci´n tiene 5 cifras exactas. o Los polinomios de Taylor plantean varios problemas importantes. La cues- ti´n principal es si el error producido al aproximar una funci´n de clase C ∞ por o o sus polinomios de Taylor puede reducirse arbitrariamente aumentando suficien- temente el grado. Definici´n 3.22 Si f es una funci´n de clase C ∞ en un entorno de un punto o o a, llamaremos serie de Taylor de f en a a la serie funcional ∞ X f k) (a) (x − a)k . k! k=0 La cuesti´n es si la serie de Taylor de f converge a f . El ejemplo anterior o √ sugiere que la serie de x en 1 converge a la funci´n en el intervalo ]0, 2[, pero no o parece converger m´s all´ de 2. Tambi´n hemos de tener presente la posibilidad a a e de que la serie de Taylor de una funci´n f converja a una funci´n distinta de f . o o Para estudiar estos problemas introducimos el concepto de resto de Taylor: Sea f una funci´n derivable n veces en un punto a. Llamaremos resto de o Taylor de grado n de f en a, a la funci´n Rn (f )(x) = f (x) − Pn (f )(x), donde o Pn (f ) es el polinomio de Taylor de grado n de f en a. Nuestro problema es determinar el comportamiento del resto de una funci´n. o Para ello contamos con el siguiente teorema, que es una generalizaci´n del teo- o rema del valor medio. Teorema 3.23 (Teorema de Taylor) Sea f : A −→ R una funci´n derivable o n + 1 veces en un intervalo abierto A y a ∈ A. Entonces para cada x ∈ A existe un λ ∈ ]0, 1[ tal que si c = λa + (1 − λ)x, se cumple f n+1) (c) Rn (f )(x) = (x − a)n+1 . (n + 1)!
  • 138.
    122 Cap´ ıtulo 3. C´lculo diferencial de una variable a ´ Demostracion: Para x = a es evidente, pues se cumple Pn (f )(a) = f (a) y Rn (f )(x) = 0. Supongamos que x 6= a. Sea 1 Q(x) = Rn (f )(x). (x − a)n+1 Sea F : A −→ R dada por ≥ x−t 0 (x − t)2 00 (x − t)n n) F (t) = f (x) − f (t) + f (t) + f (t) + · · · + f (t) 1! ¥ 2! n! +(x − t)n+1 Q(x) . La funci´n f y sus n primeras derivadas son continuas y derivables, luego F o tambi´n es continua y derivable en A. Adem´s F (x) = f (x) − f (x) = 0 y e a ° n+1 ¢ F (a) = f (a) − Pn (f )(a) + (x − a) Q(x) = Rn (f )(x) − Rn (f )(x) = 0. Por el teorema de Rolle existe un punto entre a y x, o sea, de la forma c = λa + (1 − λ)x, tal que F 0 (c) = 0. Calculemos en general F 0 (t): ≥ x − t 00 2(x − t) 00 (x − t)2 000 F 0 (t) = 0 − f 0 (t) − f 0 (t) + f (t) − f (t) + f (t) 1! 2! 2! n(x − t)n−1 n) (x − t)n n+1) ¥ ··· − f (t) + f (t) − (n + 1)(x − t)n Q(x) . n! n! Los t´rminos consecutivos se cancelan entre s´ y queda e ı, (x − t)n n+1) F 0 (t) = − f (t) + (n + 1)(x − t)n Q(x). n! Como F 0 (c) = 0, evaluando en c queda f n+1) (c) Q(x) = , (n + 1)! y por definici´n de Q: o f n+1) (c) Rn (f )(x) = (x − a)n+1 . (n + 1)! As´ pues, la diferencia entre Pn (f )(x) y f (x) tiene la forma de un monomio ı m´s del polinomio de Taylor salvo por el hecho de que la derivada (n + 1)-´sima a e no se eval´a en el punto a, sino en un punto intermedio entre a y x. u Por ejemplo, si las derivadas de f est´n uniformemente acotadas en un in- a tervalo A, es decir, si existe una misma constante K tal que |f n) (x)| ≤ K para todo natural n y para todo x ∈ A, entonces Ø n+1) Ø Øf (c) Ø K|x − a|n+1 Ø |f (x) − Pn (f )(x)| = Ø (x − a)n+1 Ø (n + 1)! Ø ≤ (n + 1)! . En el ejemplo de la p´gina 56 probamos que la sucesi´n M n /n! converge a 0, a o luego la sucesi´n {Pn (f )(x)}∞ tiende a f (x). As´ pues: o n=0 ı
  • 139.
    3.6. Series depotencias 123 Teorema 3.24 Si A es un intervalo abierto, a ∈ A, f ∈ C ∞ (A) y las derivadas de f est´n uniformemente acotadas en A, entonces para cada punto x ∈ A se a cumple ∞ X f n) (a) f (x) = (x − a)n . n=0 n! √ Este teorema no es aplicable a x. En muchos casos, entre ellos el de esta funci´n, los problemas de convergencia de las series de Taylor se vuelven o evidentes en el contexto de la teor´ de funciones de variable compleja (ver el ıa cap´ıtulo XII). Los resultados de la secci´n siguiente resultan de gran ayuda en o muchos casos, como tendremos ocasi´n de comprobar m´s adelante. o a 3.6 Series de potencias Definici´n 3.25 Sea a ∈ C y {an }∞ una sucesi´n en C. La serie de potencias o n=0 o de coeficientes {an }∞ y centro a es la serie funcional n=0 ∞ X an (z − a)n . n=0 Las series de Taylor son, pues, series de potencias. En muchos casos es f´cil determinar en qu´ puntos converge una serie de potencias. Para verlo a e necesitamos el concepto de l´ ımite superior de una sucesi´n de n´meros reales. o u Se trata de lo siguiente: Sea {an }∞ una sucesi´n de n´meros reales. Su l´ n=0 o u ımite superior es el supremo (en R) del conjunto de sus puntos adherentes. Lo representaremos mediante l´ an . ım n Se cumple que l´ an = ´ sup an . ım ınf n k≥0 n≥k En efecto, sea p un punto adherente de {an }∞ . Dados ≤ > 0 y k ≥ 0, existe n=0 un n ≥ k tal que an ∈ ]p − ≤, p + ≤[, luego p − ≤ ≤ sup an . Esto vale para todo n≥k ≤ > 0, luego p ≤ sup an para todo k ≥ 0, luego p ≤ ´ sup an . Como el l´ ınf ımite n≥k k≥0 n≥k superior es el supremo de estos p, tenemos que l´ an ≤ ´ sup an . ım ınf n k≥0 n≥k Sea L = ´ sup an . Dado ≤ > 0, existe un k ≥ 0 tal que L ≤ sup an ≤ L + ≤. ınf k≥0 n≥k n≥k Si L = sup an , entonces existe un n ≥ k tal que L − ≤ < an ≤ L. Si por el n≥k contrario L < sup an < L + ≤, entonces existe un n ≥ k tal que L ≤ an < L + ≤. n≥k En cualquier caso existe un n ≥ k tal que an ∈ ]L − ≤, L + ≤[. Esto significa que L es un punto adherente de la sucesi´n, luego L ≤ l´ an y tenemos la o ım n igualdad.
  • 140.
    124 Cap´ ıtulo 3. C´lculo diferencial de una variable a Por la propia definici´n es claro que si una sucesi´n converge en R entonces o o su l´ ımite, que es su unico punto adherente, coincide con su l´ ´ ımite superior. Ahora podemos probar: P ∞ p Teorema 3.26 Sea an (z−a)n una serie de potencias, sea R = 1/ l´ ım n |an | n=0 n (entendiendo que 1/0 = +∞ y 1/(+∞) = 0). Entonces la serie converge abso- luta y uniformemente en todo compacto contenido en BR (a) y diverge en todo punto de C B R (a) (las bolas se toman respecto a la norma eucl´ ıdea. Conveni- mos que B+∞ (a) = C). En particular la serie converge absoluta y puntualmente en BR (a) a una funci´n continua. o ´ Demostracion: Sea K un compacto en BR (a). Veamos que la serie con- verge absoluta y uniformemente en K. La funci´n |x − a| es continua en K, o luego alcanza su m´ximo r en un punto x ∈ K, es decir, |x − a| = r y para todo a y ∈ K se cumple |y − a| ≤ r. As´ K ⊂ B r (a). ı p Como x ∈ BR (a) ha de ser r < R, luego r l´ n |an | < 1. Tomemos ρ tal ım p p n p que r l´ n |an | < ρ < 1. Como l´ n |an | = ´ sup n |an |, existe un natural ım ım ınf n n k≥0 n≥k p p k tal que sup |an | < ρ/r, luego si n ≥ k se cumple n |an | < ρ/r y por lo n n≥k tanto |an |rn < ρn . Si y ∈ K entonces |y − a| ≤ r, luego |y − a|n ≤ rn , luego |an (y − a)n | ≤ P ∞ P n ∞ |an |rn < ρn . As´ pues, la serie ı an (y − a)n est´ mayorada en K por a ρ , n=k n=k que es convergente por ser geom´trica de raz´n menor que 1. El criterio de e o Weierstrass nos da que la serie de potencias converge absoluta y uniformemente a una funci´n continua en K. Todo punto de BR (a) tiene un entorno compacto o contenido en BR (a) (una bola cerrada de radio adecuado), luego la suma es continua en BR (a). Ahora veamos que la serie diverge en CB R (a). Sea x ∈ C tal que |x−a| > R. p Entonces 1 < |x − a| l´ n |an |. Por lo tanto, para todo natural k se cumple ım p n p 1/|x − a| < sup n |an |, luego existe un n ≥ k tal que n |an ||x − a| > 1, o sea, n≥k |an (y − a)n | > 1. Esto significa que an (y − a)n no tiende a 0, luego la serie diverge. El n´mero R se llama radio de convergencia de la serie de potencias. La bola u BR (a) se llama disco de convergencia. Tenemos, pues que una serie de potencias converge absolutamente en su disco de convergencia y diverge en los puntos exteriores a ´l (los puntos interiores de su complementario). En cada punto de e la frontera del disco la serie puede converger absolutamente, condicionalmente o diverger, seg´n los casos. u A la hora de determinar el radio de convergencia de una serie suele ser util ´ el teorema siguiente:
  • 141.
    3.6. Series depotencias 125 P ∞ Teorema 3.27 Sea an (z − a)n una serie de potencias tal que exista n=0 |an+1 | l´ ım = L. n |an | Entonces su radio de convergencia es 1/L. ´ Demostracion: Por el teorema anterior, el radio de convergencia de la P ∞ serie dada es el mismo que el de la serie |an |z n . Si x > 0, tenemos que n=0 |an+1 |xn+1 l´ ım = Lx, n |an |xn luego el criterio de D’Alembert implica que la serie converge cuando Lx < 1 y diverge si LX > 1. Consecuentemente el radio de convergencia ha de ser 1/L. Las series de potencias se pueden derivar t´rmino a t´rmino. Conviene pro- e e bar un resultado un poco m´s general: a Teorema 3.28 Sea {fn }∞ una sucesi´n de funciones fn : ]a, b[ −→ R que n=1 o converge uniformemente a una funci´n f . Supongamos que todas ellas son de- o rivables en ]a, b[ y que la sucesi´n de derivadas converge uniformemente a una o funci´n g. Entonces f es derivable y g = f 0 . o ´ Demostracion: Fijemos un punto x ∈ ]a, b[ y consideremos las funciones Ω fn (x)−fn (y) si y 6= x Fn (y) = 0 x−y fn (x) si y = x Similarmente definimos F : ]a, b[ −→ R mediante Ω f (x)−f (y) si y 6= x F (y) = x−y g(x) si y = x El hecho de que fn sea derivable en x implica que Fn es continua en ]a, b[. Basta probar que para todo ≤ > 0 existe un n´mero natural n0 tal que si m, n ≥ u n0 e y ∈ ]a, b[ entonces |Fm (y)−Fn (y)| < ≤. En efecto, esto significa que {Fn }∞ n=1 es (uniformemente) de Cauchy, luego seg´n el teorema 2.54 la sucesi´n ha de u o converger uniformemente a alguna funci´n continua, pero dado que converge o puntualmente a F , de hecho converger´ uniformemente a F . Tenemos, pues, a que F es continua y a su vez esto implica que f es derivable en x y f 0 (x) = g(x). Existe un n´mero natural n0 tal que si m, n > n0 entonces u 0 0 ≤ |fn (u) − fm (u)| < para todo u ∈ ]a, b[ . 2
  • 142.
    126 Cap´ ıtulo 3. C´lculo diferencial de una variable a Entonces, dados y ∈ ]a, b[ y m, n ≥ n0 , si y 6= x se cumple Ø Ø Ø fn (x) − fn (y) fm (x) − fm (y) Ø |Fn (y) − Fm (y)| = Ø Ø − Ø x−y x−y Ø Ø Ø Ø 1 Ø ≤ Ø Ø Ø x − y Ø |fn (x) − fm (x) − fn (y) + fm (y)| Aplicamos el teorema del valor medio a la funci´n fn − fm en el intervalo o [y, x] (suponemos, por ejemplo, y < x). Entonces existe un u ∈ ]a, b[ tal que ° 0 0 ¢ fn (x) − fm (x) − fn (y) + fm (y) = fn (u) − fm (u) (x − y). As´ pues, ı Ø Ø Ø 1 Ø 0 Ø |Fn (y) − Fm (y)| ≤ Ø Ø |fn (u) − fm (u)| |x − y| < ≤ . 0 x − yØ 2 As´ mismo, si y = x tenemos ı 0 0 ≤ |Fn (x) − Fm (x)| = |fn (x) − fm (x)| < < ≤. 2 Como consecuencia tenemos: P ∞ Teorema 3.29 Sea an (x − a)n una serie de potencias con centro y coe- n=0 P ∞ ficientes reales. Supongamos que tanto ella como la serie nan (x − a)n−1 n=1 convergen en un intervalo ]a − ≤, a + ≤[. Entonces la segunda serie es la deri- vada de la primera. Llamemos f (x) a la funci´n definida sobre ]a − ≤, a + ≤[ por la serie dada y o g(x) a la funci´n definida por la segunda serie. Hemos de probar que f 0 (x) = o g(x) para todo x en el intervalo. Pn Sea fn (x) = an (x − a)n . Se trata de una sucesi´n de polinomios cuyas o k=0 0 derivadas fn (x) son las sumas parciales de la segunda serie. Dado un punto x ∈ ]a − ≤, a + ≤[, tomamos un intervalo cerrado [x − δ, x + δ] ⊂ ]a − ≤, a + ≤[. 0 Por el teorema 3.26, en este intervalo las sucesiones fn (x) y fn (x) convergen absoluta y uniformemente a f y g respectivamente. El lector puede demostrar que, en realidad, las dos series del teorema anterior tienen el mismo radio de convergencia, con lo que la hip´tesis sobre la conver- o gencia de la segunda es redundante. En la pr´ctica no necesitaremos este hecho, a pues es obvio que si existe l´ |an+1 | = L, entonces el l´ ım |an | ımite correspondiente a n la segunda serie tambi´n existe y vale lo mismo. e Con los resultados que veremos en la secci´n siguiente sobre la funci´n expo- o p o nencial es f´cil probar esto mismo pero sobre l´ n |an |, con lo que obtenemos a ım n
  • 143.
    3.7. La funci´nexponencial o 127 la igualdad de los radios de convergencia en el caso general. De aqu´ se sigue ı inmediatamente que una serie de potencias con coeficientes y centro reales es una funci´n de clase C ∞ en su intervalo real de convergencia, y adem´s coincide o a con su serie de Taylor. 3.7 La funci´n exponencial o Vamos a aplicar las ideas de las secciones precedentes a la construcci´n de o las funciones m´s importantes del an´lisis: la exponencial, la logar´ a a ıtmica y las trigonom´tricas. En esta secci´n nos ocuparemos de la funci´n exponencial. e o o Hasta ahora tenemos definido ar cuando a es un n´mero real positivo y r u es un n´mero racional. No es dif´ probar que la funci´n r 7→ ar admite una u ıcil o unica extensi´n continua a R que sigue conservando la propiedad ax+y = ax ay . ´ o Adem´s esta funci´n es infinitamente derivable y coincide en todo punto con a o su serie de Taylor en 0. En lugar de probar todos estos hechos lo que haremos ser´ definir la funci´n exponencial a partir de su serie de Taylor, para lo cual a o no necesitaremos siquiera el hecho de que ya la tenemos definida sobre Q. No obstante, ahora vamos a suponer la existencia de la funci´n ax , as´ como que es o ı derivable, y vamos a calcular su serie de Taylor. As´ obtendremos la serie que ı deberemos tomar como definici´n. o Sea f (x) = ax . Entonces, ax+h − ax ah − 1 f 0 (x) = l´ ım = ax l´ım = ax f 0 (0). h→0 h h→0 h Llamemos k = f 0 (0). Entonces hemos probado que f 0 (x) = kf (x), luego por inducci´n concluimos que f es infinitamente derivable y f n) (x) = kn f (x). No o puede ser k = 0, o de lo contrario f ser´ constante. Sea e = a1/k = f (1/k). ıa Entonces la funci´n g(x) = ex = ax/k = f (x/k) cumple g 0 (x) = f 0 (x/k)(1/k) = o f (x/k) = g(x), es decir, escogiendo adecuadamente la base e obtenemos una funci´n exponencial que coincide con su derivada. Su serie de Taylor en 0 es o entonces f´cil de calcular: todas las derivadas valen e0 = 1, lo cual nos lleva a a la definici´n siguiente: o Definici´n 3.30 Llamaremos funci´n exponencial a la definida por la serie de o o potencias ∞ X zn ez = . n=0 n! Puesto que 1/(n + 1)! 1 l´ ım = l´ ım = 0, n 1/n! n n el radio de convergencia es infinito, luego la exponencial est´ definida sobre a todo n´mero complejo z. El ultimo teorema de la secci´n anterior implica que u ´ o la exponencial real es derivable, y su derivada en un punto x es ∞ X nxn−1 ∞ X xn−1 ∞ X xn = = = ex . n=1 n! n=1 (n − 1)! n=0 n!
  • 144.
    128 Cap´ ıtulo 3. C´lculo diferencial de una variable a Es claro que e0 = 1. Definimos el n´mero u ∞ X 1 1 e=e = = 2, 7182818284590452353602874. . . n=0 n! Ahora probamos la ecuaci´n que caracteriza a la funci´n exponencial: o o Teorema 3.31 Si z1 , z2 ∈ C, entonces ez1 +z2 = ez1 ez2 . ´ Demostracion: Usamos la f´rmula del producto de Cauchy: o ∞ ∞ X zn X zn ∞ n XX 1 2 1 ez1 ez2 = = z k z n−k n=0 n! n=0 n! n=0 k=0 k! (n − k)! 1 2 X X 1 µn∂ ∞ n ∞ X (z1 + z2 )n k n−k = z1 z2 = = ez1 +z2 . n=0 n! k n=0 n! k=0 De aqu´ obtenemos muchas consecuencias. Por una parte, si n es un n´mero ı u n n n 1+···+1 natural no nulo entonces e = e = e · · · e, es decir, la funci´n exponencial o sobre n´meros naturales (incluido el 0) coincide con la exponenciaci´n usual u o con base e. As´ mismo, 1 = e0 = ex−x = ex e−x , luego e−x = 1/ex , con lo que ı la funci´n exponencial coincide tambi´n con la usual cuando el exponente es o e entero. Como los coeficientes de la serie exponencial son positivos, vemos que si x ≥ 0 entonces ex > 0, y si x < 0 entonces ex = 1/e−x > 0. As´ pues, ex > 0 ı para todo n´mero real x. u √ Como, (e1/n )n√ e1/n+···+1/n = e1 = e, resulta que e1/n = n e. Es f´cil ver = a ahora que ep/q = q ep , luego la funci´n exponencial coincide con la que ten´ o ıamos definida para exponentes racionales. Puesto que la derivada es positiva en todo punto, vemos que la funci´n expo- o nencial es estrictamente creciente en R. En particular es inyectiva. Separando los dos primeros t´rminos de la serie vemos que si x ≥ 0 entonces 1 + x ≤ ex , e luego l´ım ex = +∞. A su vez esto implica que x→+∞ 1 ım ex = l´ l´ ım e−x = l´ ım = 0. x→−∞ x→+∞ x→+∞ ex Por el teorema de los valores intermedios, la funci´n exponencial biyecta R o con el intervalo ]0, +∞[. Ejemplo Aplicando n veces la regla de L’Hˆpital se concluye claramente que o xn l´ ım = 0, x→+∞ ex
  • 145.
    3.7. La funci´nexponencial o 129 y cambiando x por 1/x llegamos a que e−1/x l´ + ım = 0, n = 0, 1, 2, . . . (3.5) x→0 xn Esto implica que la funci´n h : R −→ R dada por o Ω h(x) = e−1/x si x > 0 0 si x ≤ 0 es de clase C ∞ en R. En efecto, una simple inducci´n prueba que las derivadas o de h para x > 0 son de la forma e−1/x P (x), xn donde P (x) es un polinomio. De aqu´ que las derivadas sucesivas de h en 0 ı existen y valen todas 0. En efecto, admitiendo que existe hk) (0) = 0 (para k ≥ 0) la derivada hk+1) (0) se obtiene por un l´ ımite cuando ∆x → 0 que por la izquierda es claramente 0 y por la derecha es de la forma e−1/∆x l´ + ım P (∆x), ∆x→0 ∆xn de modo que el primer factor tiende a 0 por (3.5) y el segundo est´ acotado en a un entorno de 0. Por lo tanto existe hk+1) (0) = 0. En particular, la funci´n h(x2 ) es de clase C ∞ , sus derivadas son todas nulas o en 0 pero es no nula en todo punto distinto de 0. Tenemos as´ un ejemplo de ı funci´n de clase C ∞ cuya serie de Taylor en 0 s´lo converge (a ella) en 0. o o La funci´n h del ejemplo anterior permite construir una familia de funciones o que nos ser´n de gran utilidad m´s adelante: a a Teorema 3.32 Dados n´meros reales 0 ≤ a < b existe una funci´n f : R −→ R u o de clase C ∞ tal que f (x) > 0 si x ∈ ]a, b[ y f (x) = 0 en caso contrario. ´ Demostracion: En efecto, la funci´n h1 (x) = h(x − a) se anula s´lo en o o los puntos x ≤ a y la funci´n h2 (b − x) se anula s´lo en los puntos x ≥ b. Su o o producto se anula s´lo en los puntos exteriores al intervalo x ∈ ]a, b[. o Definici´n 3.33 Llamaremos funci´n logar´ o o ıtmica a la inversa de la funci´n o exponencial, log : ]0, +∞[ −→ R. He aqu´ las gr´ficas de las funciones exponencial y logar´ ı a ıtmica.
  • 146.
    130 Cap´ ıtulo 3. C´lculo diferencial de una variable a 4 ex 3 2 log x 1 -4 -2 2 4 -1 -2 -3 -4 El teorema de la funci´n inversa nos da que y = log x es derivable, y su o derivada es y 0 = 1/(ey )0 = 1/ey = 1/x. De las propiedades de la funci´n exponencial se deducen inmediatamente las o de la funci´n logar´ o ıtmica. Obviamente es una funci´n estrictamente creciente, o adem´s verifica la ecuaci´n funcional log(xy) = log x + log y. Tambi´n es claro a o e que log 1 = 0, log e = 1 y l´ ım log x = +∞, l´ log x = −∞. ım x→+∞ x→0 Veamos c´mo puede calcularse en la pr´ctica un logaritmo. Es decir, vamos o a a calcular el desarrollo de Taylor de la funci´n log. Obviamente no hay un o desarrollo en serie sobre todo ]0, +∞[. Si desarrollamos alrededor del 1 a lo sumo podemos obtener una serie convergente en ]0, 2[. Como las series de potencias centradas en 0 son m´s f´ciles de manejar, a a vamos a desarrollar en 0 la funci´n log(1 + x). Sus derivadas son o (1 + x)−1 , −(1 + x)−2 , 2(1 + x)−3 , −2 · 3(1 + x)−4 , . . . y en general, la derivada n-sima es (−1)n+1 (n − 1)!(1 + x)−n . Puesto que log(1 + 0) = 0, la serie de Taylor queda: ∞ X (−1)n xn . n=1 n Como 1/(n + 1) n l´ ım = l´ ım = 1, n 1/n n n+1 el radio de convergencia es 1 (como era de esperar), luego la serie converge en ]−1, 1[. De hecho en x = −1 obtenemos una serie divergente, pero en x = 1 P (−1)n ∞ queda n , que es convergente luego, con exactitud, la serie converge en n=1 el intervalo ]−1, 1].
  • 147.
    3.7. La funci´nexponencial o 131 Seg´n hemos visto en la secci´n anterior, la funci´n definida por la serie es u o o derivable, y su derivada se obtiene derivando cada monomio, es decir, se trata de la serie geom´trica e ∞ X ∞ X 1 (−1)n+1 xn−1 = (−x)n = . n=1 n=0 1+x Resulta, pues, que la serie de Taylor y la funci´n log(1 + x) tienen la misma o derivada en ]−1, 1[. Por lo tanto la diferencia entre ambas funciones es una constante, pero como ambas toman el valor 0 en 0, se concluye que ∞ X (−1)n log(1 + x) = xn n=1 n para todo n´mero x ∈ ]−1, 1[. u Ejercicio: Estudiando el resto de Taylor de la funci´n log(1 + x), probar que o X (−1)n ∞ = log 2. n n=1 Para calcular el logaritmo de un n´mero x > 2 podemos usar la relaci´n u o log(1/x) = − log x. Ahora podemos definir ax para cualquier base a > 0. La forma m´s f´cil de a a hacerlo es la siguiente: Definici´n 3.34 Sea a > 0 y x ∈ R. Definimos ax = ex log a . o Notar que, como log e = 1, en el caso a = e la exponencial que acabamos de definir coincide con la que ya ten´ıamos definida. Sin embargo la funci´n o ex se diferencia de las otras exponenciales en que est´ definida sobre todo el a plano complejo y no s´lo sobre la recta real. M´s adelante interpretaremos o a esta extensi´n compleja. Las funciones exponenciales verifican las propiedades o siguientes: ax+y = e(x+y) log a = ex log a ey log a = ax ay , log ax = log ex log a = x log a, x (ax )y = ey log a = exy log a = axy a0 = 1, a1 = a, a−x = 1/ax . As´ mismo es claro que ax coincide con la exponenciaci´n usual cuando x es ı o √ un n´mero entero y que sobre n´meros racionales es ap/q = q ap . La funci´n u u o y x considerada como funci´n de dos variables en ]0, +∞[ × R es continua. o La derivada de ax es (log a)ax , la derivada de xb es b 1 eb log x = bxb = bxb−1 . x x
  • 148.
    132 Cap´ ıtulo 3. C´lculo diferencial de una variable a Finalmente, puesto que la derivada de ax es siempre positiva si a > 1 y siempre negativa si a < 1, tenemos que ax es mon´tona y biyecta R con el o intervalo ]0, +∞[. Por lo tanto tiene una inversa, que representaremos por loga x y se llama logaritmo en base a de x. Las propiedades algebraicas de estos logaritmos son las mismas que las de la funci´n log y se demuestran igual. A o estas hay que a˜adir las siguientes, ambas elementales: n loga x loga xb = b loga x, logb x = . loga b En particular log x loga x = . log a Hay una caracterizaci´n importante del n´mero e: o u Teorema 3.35 Se cumple µ ∂x 1 e = l´ ım 1+ . x→+∞ x ´ Demostracion: Por definici´n o µ ∂x 1 1+ = ex log(1+1/x) , x luego basta probar que µ ∂ 1 l´ ım x log 1 + = 1. x→+∞ x Pasamos la x al denominador como 1/x y aplicamos la regla de L’Hˆpital, o con lo que el l´ ımite se transforma en −x−2 1+1/x 1 l´ ım = l´ ım = 1. x→+∞ −x−2 x→+∞ 1 + 1/x Ejercicio: Probar que, para todo x ∈ R, ≥ ¥n x ex = l´ ım 1 + . n n Terminamos la secci´n con una aplicaci´n de los logaritmos junto a t´cnicas o o e anal´ ıticas.
  • 149.
    3.8. Las funcionestrigonom´tricas e 133 Ejemplo Se define la media aritm´tica de n n´meros reales x1 , . . . , xn como e u (x1 + · · · + xn )/n. Si son mayores o iguales que 0 se define su media geom´trica e √ como n x1 · · · xn . Vamos a probar que la media geom´trica siempre es menor e o igual que la media geom´trica. A su vez, deduciremos esto de la desigualdad e log t ≤ t − 1, v´lida para todo t > 0. a Para probar esta desigualdad vemos que la derivada de f (t) = t − 1 − log t es 1 − 1/t, que es negativa si t < 1 y positiva si t > 1. Por el teorema 3.14, f es decreciente en ]0, 1] y creciente en [1, +∞[. Puesto que f (1) = 0, es claro entonces que f (t) ≥ 0 para todo t > 0. Respecto a la desigualdad entre las medias, si uno de los n´meros es nulo la u media geom´trica es nula y el resultado es obvio. Supongamos que son todos e no nulos y sea x = x1 · · · xn . Entonces x x √i − 1 ≥ log √i , n x n x luego sumando obtenemos P n xi x · · · xn √ − n ≥ log 1 i=1 = 0, n x x con lo que P n xi i=1 √ n ≥ x. n 3.8 Las funciones trigonom´tricas e En geometr´ se definen varias funciones de inter´s, entre las que destacan ıa e las funciones seno y coseno. Si llamamos R a la medida de un ´ngulo recto, a entonces la funci´n sen x est´ definida sobre R y tiene periodo 4R, es decir, o a sen(x + 4R) = sen x para todo x ∈ R. As´ definido, el valor de R es arbitrario, ı pues podemos tomar cualquier n´mero real como medida de un ´ngulo recto. u a Si queremos que existan ´ngulos unitarios deberemos exigir que R > 1/4. Por a ejemplo, si tomamos como unidad de ´ngulo el grado sexagesimal, entonces a R = 90. Supongamos que las funciones seno y coseno son derivables as´ como ı sus propiedades algebraicas y vamos a calcular su serie de Taylor. Con ello obtendremos una definici´n anal´ o ıtica alternativa. En primer lugar, como el coseno tiene un m´ximo en 0, ha de ser cos0 0 = 0. a En cualquier otro punto tenemos cos(x + h) − cos x cos x cos h − sen x sen h − cos x cos0 x = l´ ım = l´ım h→0 h h→0 h cos h − 1 sen h = cos x l´ ım − sen x l´ ım h→0 h h→0 h = cos x cos0 0 − sen x sen0 0 = − sen x sen0 0.
  • 150.
    134 Cap´ ıtulo 3. C´lculo diferencial de una variable a Si llamamos k = sen0 0 concluimos que cos0 x = −k sen x, y similarmente llegamos a que sen0 x = k cos x. Del mismo modo que hicimos con la exponencial, podemos normalizar las funciones seno y coseno cambi´ndolas por sen(x/k) y cos(x/k). Geom´tricamen- a e te esto significa fijar una unidad de ´ngulos. Entonces tenemos sen0 x = cos x y a cos0 x = − sen x. Vemos entonces que las funciones seno y coseno son infinitamente derivables, y sus derivadas est´n uniformemente acotadas por 1, luego las series de Taylor a deben converger en R a las funciones respectivas. Puesto que sen 0 = 0 y cos 0 = 1, las series han de ser las que consideramos en la definici´n siguiente: o Definici´n 3.36 Llamaremos seno y coseno a las funciones definidas por las o series de potencias ∞ X (−1)n ∞ X (−1)n sen z = z 2n+1 , cos z = z 2n . n=0 (2n + 1)! n=0 (2n)! No es dif´ probar directamente la convergencia de estas series sobre todo el ıcil plano complejo. El teorema siguiente muestra una sorprendente conexi´n entre o las funciones trigonom´tricas as´ definidas y la funci´n exponencial. Observar e ı o que la prueba contiene otra demostraci´n alternativa de la convergencia de estas o series. Teorema 3.37 Para todo z ∈ C se cumple eiz − e−iz eiz + e−iz sen z = , cos z = . 2i 2 ´ Demostracion: P ∞ n P ∞ n iz −iz in z + n! (−i)n z n! ∞ X in + (−i)n z n e +e n=0 n=0 = = . 2 2 n=0 2 n! Ahora bien, la sucesi´n (in +(−i)n )/2 es simplemente 1, 0, −1, 0, 1, 0, −1, 0. . ., o luego queda la serie del coseno. Similarmente se razona con el seno. Derivando t´rmino a t´rmino las series de Taylor se concluye f´cilmente que e e a sen0 x = cos x, cos0 x = − sen x. Las f´rmulas siguientes son todas consecuencias sencillas del teorema ante- o rior: sen2 z + cos2 z = 1 sen(x + y) = sen x cos y + cos x sen y, cos(x + y) = cos x cos y − sen x sen y, eiz = cos z + i sen z,
  • 151.
    3.8. Las funcionestrigonom´tricas e 135 La primera f´rmula implica que si x ∈ R entonces −1 ≤ sen x, cos x ≤ 1. De o la ultima se sigue que para todo x, y ∈ R se cumple ´ ex+iy = ex (cos y + i sen y), con lo que tenemos descrita la exponencial compleja en t´rminos de la exponen- e cial real y de las funciones seno y coseno reales. El hecho de que sen0 0 = cos 0 = 1 equivale a sen x l´ ım = 1, x→0 x que es otra propiedad del seno que conviene recordar. Vamos a probar ahora la periodicidad de las funciones trigonom´tricas reales. e El punto m´s delicado es demostrar que cos x se anula en alg´n x 6= 0. Para ello a u probaremos que el coseno es menor o igual que los cuatro primeros t´rminos de e su serie de Taylor: x2 x4 cos x ≤ 1 − + . 2 24 2 4 Esto equivale a probar que 1 − x /2 + x /24 − cos x ≥ 0 para x ≥ 0. Puesto que esta funci´n vale 0 en 0, basta probar que su derivada es positiva. Dicha o derivada es sen x−x+x3 /6. Esta funci´n vale tambi´n 0 en 0, luego para probar o e que es positiva (para x ≥ 0) basta ver que su derivada lo es. Dicha derivada es cos x − 1 + x2 /2. Por el mismo argumento derivamos una vez m´s y obtenemos a x − sen x. Al derivar una vez m´s llegamos a 1 − cos x, que sabemos que es a positiva. Vemos que la gr´fica del polinomio de Taylor de a 4 grado 4 en 0 de cos x toma valores negativos. De √ hecho un simple c´lculo nos da que en 3 toma el a √ 3 valor −1/8, luego cos 3 ≤ −1/8. Como√ 0 = 1,cos 2 por continuidad existe un punto 0 < x < 3 tal que cos x = 0. 1 Sea A = {x > 0 | cos x = 0}. El conjunto A es la antiimagen de {0} por la aplicaci´n coseno restringida -1 o 1 2 3 4 a [0, +∞[. Como {0} es cerrado y cos es continua, A es un cerrado. El ´ ınfimo de un conjunto est´ en su a -1 clausura, luego F = ´ A ∈ √ y as´ cos F = 0. Es obvio que F ≥ 0, y como ınf A ı cos 0 6= 0, ha de ser 0 < F < 3. √ Es costumbre llamar π = 2F . As´ se cumple 0 < π < 2 3, cos(π/2) = 0, ı, pero cos x > 0 en el intervalo [0, π/2[. Ahora, como el coseno es la derivada del seno, resulta que sen x es estricta- mente creciente en el intervalo [0, π/2]. Como sen 0 = 0, resulta que sen x ≥ 0 en [0, π/2]. Concretamente, sen(π/2) es un n´mero positivo que cumple u sen2 (π/2) + cos2 (π/2) = sen2 (π/2) + 0 = 1, luego sen(π/2) = 1.
  • 152.
    136 Cap´ ıtulo 3. C´lculo diferencial de una variable a Adem´s, cos0 x = − sen x ≤ 0 en [0, π/2], luego el coseno es estrictamente a decreciente en [0, π/2]. En resumen, tenemos demostrado lo que refleja la gr´fica a siguiente: 1 0.8 0.6 0.4 0.2 -0.5 0.5 1 1.5 2 -0.2 -0.4 Incidentalmente hemos probado una desigualdad que a veces es de inter´s: e si x ≥ 0 entonces sen x ≤ x. M´s en general, | sen x| ≤ |x|. a El comportamiento de las funciones seno y coseno fuera del intervalo [0, π/2] se deduce de las relaciones trigonom´tricas que ya hemos probado. Por ejemplo, e expresando π = π/2 + π/2 obtenemos sen π = 0, cos π = −1, y a su vez de aqu´ ı sen 2π = 0, cos 2π = 1. Ahora sen(x + 2π) = sen x, cos(x + 2π) = cos x, lo que prueba que ambas funciones son peri´dicas y basta estudiarlas en el o intervalo [0, 2π]. Dejamos a cargo del lector completar la descripci´n de estas o funciones. A partir de lo que ya hemos probado es f´cil obtener todos los a resultados que se demuestran en geometr´ ıa. Nos limitaremos a mostrar sus gr´ficas en [0, 2π]: a 1 0.5 1 2 3 4 5 6 -0.5 -1 El teorema siguiente se demuestra de forma m´s natural en geometr´ pero a ıa, vamos a probarlo para tener una construcci´n completamente anal´ o ıtica de las funciones trigonom´tricas: e Teorema 3.38 Sea z ∈ C, z 6= 0 y sea a ∈ R. Entonces existe un unico n´mero ´ u real θ ∈ [a, a + 2π[ tal que z = |z|eiθ = |z|(cos θ + i sen θ). Demostracion: Sea z/|z| = x + iy. Entonces x2 + y 2 = 1. Distinguimos ´ cuatro casos: seg´n el signo de x e y. Todos son an´logos, as´ que supondremos u a ı por ejemplo x ≤ 0, y ≥ 0. M´s concretamente tenemos −1 ≤ x ≤ 0. En el a intervalo [π, 3π/2] se cumple cos π = −1, cos 3π/2 = 0, luego por continuidad existe un n´mero φ ∈ [π, 3π/2] tal que cos φ = x. Entonces 1 = x2 + y 2 = u cos2 φ + sen2 φ, por lo que y 2 = sen2 φ y, como ambos son negativos, ha de ser y = sen φ. As´ pues, z = |z|(cos φ + i sen φ) = |z|eiφ . ı Existe un n´mero entero p tal que θ = 2pπ + φ ∈ [a, a + 2π[. Entonces, u teniendo en cuenta que e2pπi = 1, resulta que z = |z|eiφ e2pπi = |z|eiθ .
  • 153.
    3.8. Las funcionestrigonom´tricas e 137 La unicidad se debe a que si |z|eiθ1 = |z|eiθ2 , entonces ei(θ1 −θ2 ) = 1, luego cos(θ1 − θ2 ) = 1 y sen(θ1 − θ2 ) = 0, ahora bien, cos x = 1 y senx = 0 s´lo ocurre o en x = 0 en el intervalo [0, 2π[, luego s´lo ocurre en los n´meros reales de la o u forma 2kπ, con k ∈ Z. As´ pues θ1 − θ2 = 2kπ, y si ambos est´n en el intervalo ı a [a, a + 2π[, ha de ser θ1 = θ2 . Un argumento de un n´mero complejo z 6= 0 es un n´mero real θ tal que u u z = |z|eiθ . Hemos probado que cada n´mero complejo no nulo tiene un unico u ´ argumento en cada intervalo [a, a + 2π[. En particular en el intervalo [0, 2π[. Recordemos que para conseguir que la derivada del seno fuera el coseno hemos tenido que fijar una medida de ´ngulos concreta. El ´ngulo de medida 1 a a respecto a esta unidad, es decir, el ´ngulo que forman a los vectores (1, 0) y (cos 1, sen 1), recibe el nombre de radi´n1 La figura muestra un radi´n. a a Las funciones seno y coseno nos permiten mostrar algunos ejemplos de inter´s sobre derivabilidad. e Ejemplo La funci´n f : R −→ R dada por o Ω 2 1 x sen x si x 6= 0 f (x) = 0 si x = 0 es derivable en R. El unico punto donde esto no es evidente es x = 0, pero ´ 1 f 0 (0) = l´ h sen ım = 0. h→0 h Para probar esto observamos en general que el producto de una funci´n o acotada por otra que tiende a 0 tiende a 0 (basta aplicar la definici´n de l´ o ımite). Sin embargo la derivada no es continua, pues en puntos distintos de 0 vale 1 1 f 0 (x) = 2x sen − cos , x x y es f´cil ver que el primer sumando tiende a 0 en 0 (como antes), mientras que a el segundo no tiene l´ ımite, luego no existe l´ f 0 (x). ım x→0 Los mismos c´lculos que acabamos de realizar prueban una limitaci´n de la a o regla de L’Hˆpital. Consideremos la funci´n g(x) = x. Entonces o o f (x) l´ ım = 0, x→0 g(x) 1 Elnombre se debe a que, seg´n probaremos en el cap´ u ıtulo siguiente, si un arco de circun- ferencia mide un radi´n, entonces su longitud es igual al radio. Ser´ m´s adecuado llamarlo a ıa a a ´ngulo “radiante”.
  • 154.
    138 Cap´ ıtulo 3. C´lculo diferencial de una variable a pero si intentamos calcular el l´ ımite por la regla de L’Hˆpital nos encontramos o con f 0 (x) l´ ım 0 = l´ f 0 (x), ım x→0 g (x) x→0 y ya hemos visto que este l´ımite no existe. La regla de L’Hˆpital s´lo afirma que o o si existe el l´ ımite del cociente de derivadas tambi´n existe el l´ e ımite original y ambos coinciden, pero es importante recordar que si el segundo l´ ımite no existe de ah´ no podemos deducir que el primero tampoco exista. ı Otra funci´n trigonom´trica importante es la tangente, definida como o e sen z tan z = . cos z No es dif´ probar que la funci´n coseno se anula unicamente sobre los ıcil o ´ m´ltiplos enteros de π/2 (no tiene ceros imaginarios). En efecto, si cos z = 0, u por definici´n eiz +e−iz = 0, luego e2iz = −1. Si z = a+bi, queda e2ia e−2b = −1 o y tomando m´dulos, e−2b = 1, luego b = 0 y z es real. Igualmente ocurre con el o seno. Por lo tanto la tangente est´ definida sobre todos los n´meros complejos a u que no son m´ltiplos enteros de π/2. Claramente su restricci´n a R es derivable u o en su dominio, y su derivada es 1/ cos2 x = 1 + tan2 x. En particular es siempre positiva, luego la tangente es creciente. Su gr´fica es: a 6 4 2 -6 -4 -2 2 4 6 -2 -4 -6 Es f´cil ver que la funci´n tangente biyecta el intervalo ]−π/2, π/2[ con la a o recta real. Junto con ´sta, tenemos tambi´n las biyecciones siguientes: e e h π πi sen : − , −→ [−1, 1], cos : [0, π] −→ [−1, 1]. 2 2 Por lo tanto podemos definir las funciones inversas, llamadas respectiva- mente, arco seno, arco coseno y arco tangente: h π πi arcsen : [−1, 1] −→ − , , arccos : [−1, 1] −→ [0, π], 2 2 arctan : R −→ ]−π/2, π/2[ . El teorema de la funci´n inversa permite calcular sus derivadas: o 1 −1 1 arcsen0 x = √ , arccos0 x = √ , arctan0 x = . 1 − x2 1 − x2 1 + x2
  • 155.
    3.8. Las funcionestrigonom´tricas e 139 dx Por ejemplo, si y = arcsen x, entonces x = sen y, luego dy = cos y, luego dy 1 1 1 = =p =√ . dx cos y 1 − sen2y 1 − x2 Vamos a calcular la serie de Taylor de la funci´n arco tangente. No podemos o calcular directamente las derivadas, pues las expresiones que se obtienen son cada vez m´s complicadas y no permiten obtener una f´rmula general. En su a o lugar emplearemos la misma t´cnica que hemos usado en la secci´n anterior e o para calcular la serie del logaritmo. Claramente ∞ X 1 1 = = (−1)n x2n , para |x| < 1. 1 + x2 1 − (−x2 ) n=0 Ahora es f´cil obtener una serie cuya derivada sea la serie anterior, a saber: a ∞ X (−1)n x2n+1 . n=0 2n + 1 Es f´cil ver que su radio de convergencia es 1. a Por lo tanto esta serie se diferencia en una constante de la funci´n arctan x o en el intervalo ]−1, 1[, pero como ambas funciones toman el valor 0 en x = 0, concluimos que son iguales, o sea: ∞ X (−1)n arctan x = x2n+1 , para |x| < 1. n=0 2n + 1 Cuando x = ±1 la serie se convierte en una serie alternada cuyo t´rmino e general es decreciente y tiende a 0, luego por el criterio de Leibniz tambi´n e converge. No vamos a demostrarlo aqu´ (ver la p´g. 237), pero el l´ ı a ımite resulta ser arctan(±1). Puesto que arctan 1 = π/4, esto nos lleva a la conocida f´rmula o de Leibniz para el c´lculo de π: a µ ∂ 1 1 1 1 1 π =4 1− + − + − + ··· . 3 5 7 9 11 Esta f´rmula converge muy lentamente a π, en el sentido de que es necesario o calcular muchos t´rminos para obtener pocas cifras exactas. Hay otras expresio- e nes m´s complicadas pero m´s eficientes. Veamos una de ellas. Es f´cil probar a a a la f´rmula de la tangente del ´ngulo doble: o a 2 tan α tan 2α = . 1 − tan2 α De aqu´ se sigue que ı µ ∂ µ ∂ 1 5 1 120 tan 2 arctan = , tan 4 arctan = . 5 12 5 119
  • 156.
    140 Cap´ ıtulo 3. C´lculo diferencial de una variable a Teniendo en cuenta que arctan(−x) = − arctan x resulta µ ∂ 120 1 1 − 1 tan 4 arctan − arctan = 119 120239 = 1, 1 5 239 1 + 119 239 con lo que, finalmente, µ ∂ 1 1 π = 4 4 arctan − arctan , 5 239 o sea, X (−1)n 4 µ 4 ∞ 1 ∂ π= − . n=0 2n + 1 52n+1 2392n+1 Esta serie converge muy r´pidamente. Veamos sus primeras sumas parciales: a 0 3,18326359832635983263598326360 1 3,14059702932606031430453110658 2 3,14162102932503442504683251712 3 3,14159177218217729501821229111 4 3,14159268240439951724025983607 5 3,14159265261530860814935074767 6 3,14159265362355476199550459382 7 3,14159265358860222866217126049 8 3,14159265358983584748570067225 9 3,14159265358979169691727961962 10 3,14159265358979329474737485772 11 3,14159265358979323639184094467 12 3,14159265358979323853932459267 13 3,14159265358979323845978816126 14 3,14159265358979323846275020768 15 3,14159265358979323846263936981 Vemos que con 6 sumas tenemos ya una aproximaci´n con diez cifras exactas, o y con 15 superamos las 20 cifras. *Las funciones hiperb´licas El lector que est´ familiarizado con la geo- o e metr´ hiperb´lica habr´ notado la similitud formal entre las f´rmulas del teo- ıa o a o rema 3.37 y las definiciones de las razones trigonom´tricas hiperb´licas. Esta e o similitud se traduce en las relaciones siguientes: ex − e−x ei(−ix) − e−i(−ix) sen ix senh x = = = i sen(−ix) = , 2 2 i ex + e−x ei(−ix) + e−i(−ix) cosh x = = = cos(−ix) = cos ix. 2 2 En definitiva, tenemos sen(ix) = i senh x, cos(ix) = cosh x, tan(ix) = i tanh x.
  • 157.
    3.8. Las funcionestrigonom´tricas e 141 De aqu´ se siguen, por ejemplo, las relaciones cosh2 x − senh2 x = 1, o las ı f´rmulas del seno y el coseno de una suma, etc. o Ejercicio: Deducir de las relaciones anteriores las series de Taylor de las funciones senh x y cosh x. A partir de las definiciones es f´cil probar a 1 senh0 x = cosh x, cosh0 x = senh x, tanh0 x = 1 − tanh2 x. cosh2 x Puesto que cosh x ≥ 0, el seno hiperb´lico es creciente. De hecho es una o funci´n biyectiva, como puede probarse a partir de la propia definici´n: Si o o x = senh y entonces p ey − e−y − 2x = 0, ⇒ e2y − 2xey − 1 = 0, ⇒ ey = x + x2 + 1, luego la inversa del seno hiperb´lico es la funci´n argumento del seno hiperb´lico o o o dada por p ° ¢ arg senh x = log x + x2 + 1 . Teniendo en cuenta su derivada, el coseno hiperb´lico es decreciente en o ]−∞, 0] y creciente en [0, +∞[. Como cosh 0 = 1, la imagen est´ en [1, +∞[. a Existe la inversa arg cosh : [1, +∞[ −→ [0, +∞[ dada por ° p ¢ arg cosh x = log x + x2 − 1 . Teniendo en cuenta las relaciones 1 tan2 x = 1 − , tanh(−x) = − tanh x, cosh2 x es claro que tanh : R −→ ]−1, 1[ es biyectiva, luego tiene como inversa a la funci´n arg tanh : ]−1, 1[ −→ R. o Dejamos a cargo del lector el c´lculo de las derivadas de los argumentos a hiperb´licos. o *Geometr´ no eucl´ ıas ıdeas Los resultados de esta secci´n nos permiten o mostrar una conexi´n importante entre la geometr´ eucl´ o ıa ıdea y las geometr´ıas el´ ıptica e hiperb´lica. Antes de entrar en ello, observemos que en la geometr´ o ıa eucl´ ıdea existe una asimetr´ entre la medida de longitudes y la medida de ıa a ´ngulos. En efecto, no es posible definir geom´tricamente una unidad de longi- e tud. El metro se define actualmente en t´rminos del segundo y de la velocidad e de la luz, y a su vez el segundo se define en t´rminos de una propiedad f´ e ısica del ´tomo de kript´n; antiguamente el metro se defin´ como la longitud del a o ıa patr´n de platino que se hallaba en Par´ En cualquier caso, si alguien quiere o ıs. construir un metro con precisi´n se ve obligado a observar ´tomos de kript´n, o a o a viajar a Par´ o algo similar. En cambio, no es necesario viajar a Par´ para ıs ıs construir un ´ngulo recto, o un radi´n, o un grado sexagesimal con precisi´n. a a o
  • 158.
    142 Cap´ ıtulo 3. C´lculo diferencial de una variable a Podr´ haber un ´ngulo patr´n en Par´ pero no es necesario porque existen ıa a o ıs, unidades naturales de ´ngulo, en el sentido de que pueden definirse por medios a puramente geom´tricos. Nosotros hemos definido el radi´n y no hemos tenido e a que aludir a ning´n ´tomo. u a Esta asimetr´ no se da en las geometr´ no eucl´ ıa ıas ıdeas. Pensemos por ejemplo en la geometr´ el´ ıa ıptica. Los segmentos pueden medirse tambi´n en radianes, o e en rectos, o en grados sexagesimales. Una longitud de un recto es simplemente la mitad de la longitud de una recta cualquiera. Una longitud de un radi´n a es simplemente 2/π rectos. Desde un punto de vista m´s conceptual, esto se a refleja en que la geometr´ eucl´ ıa ıdea tiene semejanzas que no son isometr´ (apli- ıas caciones que conservan ´ngulos pero no longitudes, de modo que dos segmentos a cualesquiera son semejantes), mientras que en las geometr´ no eucl´ ıas ıdeas todas las semejanzas son isometr´ ıas. La ausencia de unidades naturales de longitud (o la presencia de semejanzas) hace que la geometr´ eucl´ ıa ıdea sea invariante a escala. La geometr´ de Liliput ıa es exactamente la misma que la nuestra, y as´ ser´ aunque los liliputienses ı ıa midieran una millon´sima de mil´ e ımetro. No habr´ ning´n argumento objetivo ıa u para concluir que ellos son “peque˜os” y nosotros “grandes” o “normales”. Las n nociones de “grande” y “peque˜o” son relativas a la unidad de medida, y ´sta es n e arbitraria. No ocurre lo mismo en las geometr´ no eucl´ ıas ıdeas. Supongamos que la superficie de la Tierra fuera completamente esf´rica, sin hoyos ni elevaciones. e Ahora s´ tiene sentido decir que un metro es objetivamente “peque˜o”, con ı n respecto a una unidad natural de longitud, pues un metro es 20 millones de veces m´s peque˜o que un meridiano (una recta el´ a n ıptica). Quiz´ el lector piense a que esta noci´n de peque˜ez no deja de ser subjetiva. Ciertamente no es rigurosa o n en el sentido de que no podemos determinar cu´ndo una longitud deja de ser a peque˜a, pero es la forma m´s natural de expresar un hecho objetivo que vamos n a a explicar a continuaci´n. o Supongamos que trazamos un tri´ngulo en nuestra Tierra perfecta. Digamos a que uno de sus lados mide un metro. Entonces podemos aplicarle el teorema del coseno para un lado, es decir, la f´rmula: o cos α = − cos β cos γ + sen β sen γ cos a. Ahora bien, si entendemos que las funciones trigonom´tricas que aparecen e son las que hemos estudiado en este cap´ ıtulo, los ´ngulos han de estar en ra- a dianes. Si el lado a mide un metro, su medida en radianes es aproximadamente a ≈ 1,6 · 10−7 , y entonces cos a ≈ 0,9999999999999872. Por consiguiente nuestro tri´ngulo cumple a cos α ≈ − cos β cos γ + sen β sen γ = − cos(β + γ) = cos(π − β − γ), de donde se sigue que α + β + γ ≈ π + 2kπ. Como la suma de los ´ngulos de un a tri´ngulo el´ a ıptico est´ entre π y 3π, concluimos que la suma ha de parecerse a a π o a 3π. Enseguida descartaremos el segundo caso y concluiremos α + β + γ ≈ 2π.
  • 159.
    3.8. Las funcionestrigonom´tricas e 143 Si hacemos c´lculos concretos veremos que esta aproximaci´n excede nues- a o tra capacidad de discernimiento, por lo que aparentemente nuestro tri´ngulo a cumplir´ la ley eucl´ a ıdea de que la suma de sus ´ngulos es igual a π. a La raz´n por la que la suma de los ´ngulos no puede acercarse a 3π nos la o a da el teorema del coseno para un ´ngulo: a cos a = cos b cos c + sen b sen c cos α. Si ahora sustituimos cos a ≈ 1, cos b ≈ 1, cos b ≈ 1 obtenemos la relaci´n o sen b sen c cos α ≈ 0, que no expresa m´s que el hecho de que cuando b y c son a peque˜os sen b ≈ 0 ≈ sen c. Vamos a aproximar las razones trigonom´tricas por n e sus polinomios de Taylor de grado 2 en 0. Consideramos grado 2 porque, para el coseno, el polinomio de Taylor de grado 1 es tambi´n P1 (x) = 1, luego estamos en el mismo caso de antes. En e cambio el de grado 2 nos da la aproximaci´n: o x2 cos x ≈ 1 − . 2 Respecto al seno, el polinomio de grado 1 coincide con el de grado 2. Ambos nos dan la aproximaci´n sen x ≈ x. o Ejercicio: Comprobar que para a ≈ 1,6 · 10−7 el resto del polinomio de Taylor de grado 3 (que es el mismo que el de grado 2) del coseno en 0 es menor que 3 · 10−29 . El resto de grado 2 del seno es menor que 7 · 10−22 . Por consiguiente b2 c2 b2 c2 cos b cos c ≈ 1 − − + . 2 2 4 ´ Esta es una aproximaci´n de cuarto grado. Podemos despreciar el ultimo o ´ t´rmino y quedarnos con e b2 c2 cos b cos c ≈ 1 − − . 2 2 Aunque no hemos definido este concepto, lo cierto es que 1−x2 /2−y 2 /2 es el polinomio de Taylor de segundo grado de la funci´n de dos variables cos x cos y. o Con estas aproximaciones el teorema del coseno se convierte en a2 b2 c2 1− ≈1− − + bc cos α, 2 2 2 o equivalentemente, a2 ≈ b2 + c2 − 2bc cos α, que es el teorema del coseno eucl´ıdeo. Esto significa que los ´ngulos de nuestro a tri´ngulo ser´n aproximadamente los mismos que los del tri´ngulo eucl´ a a a ıdeo de lados a, b, c, luego su suma se parecer´ a π y no a 3π. a
  • 160.
    144 Cap´ ıtulo 3. C´lculo diferencial de una variable a En general, todas las f´rmulas de la geometr´ el´ o ıa ıptica aproximan a f´rmulas o eucl´ ıdeas cuando las longitudes involucradas son peque˜as. La aproximaci´n n o sen x ≈ x transforma el teorema de los senos el´ ıptico en el correspondiente eucl´ ıdeo. Ejercicio: Comprobar que el teorema de Pit´goras el´ a ıptico: cos a = cos b cos c se convierte aproximadamente en el eucl´ ıdeo para tri´ngulos peque˜os. a n Resulta as´ que la geometr´ el´ ı ıa ıptica a gran escala es muy diferente de la geo- metr´ el´ ıa ıptica a peque˜a escala, pues ´sta ultima es aproximadamente eucl´ n e ´ ıdea. Esto se expresa diciendo que la geometr´ el´ ıa ıptica es localmente eucl´ ıdea. La interpretaci´n geom´trica es clara: la geometr´ el´ o e ıa ıptica es localmente igual a la geometr´ de una esfera, y la geometr´ de una esfera se aproxima localmente a ıa ıa la de cualquiera de sus planos tangentes, que es eucl´ ıdea. Todo lo dicho vale igualmente para la geometr´ hiperb´lica. En primer ıa o lugar hemos de observar que tambi´n en esta geometr´ hay unidades naturales e ıa de longitud, definibles geom´tricamente. Por ejemplo, si un tri´ngulo equil´tero e a a tiene todos sus lados unitarios, el teorema del coseno nos permite calcular sus a ´ngulos. Todos miden e2 + 1 α = arccos ≈ 0,92 rad. e2 + 2e + 1 Por lo tanto podemos definir la unidad de longitud hiperb´lica como la o longitud del lado del tri´ngulo equil´tero cuyos ´ngulos miden α. La selecci´n a a a o de esta unidad de longitud se lleva a cabo en el momento en que definimos la distancia entre dos puntos mediante la f´rmula o 1 d(P, Q) = log R(P, Q, Q∞ , P∞ ). 2 Si cambiamos la base del logaritmo o si cambiamos la constante 1/2 estamos cambiando de unidad de longitud (ambos cambios son equivalentes). Para transformar las f´rmulas hiperb´licas en f´rmulas eucl´ o o o ıdeas basta usar las aproximaciones de Taylor: x2 senh x ≈ x, cosh x ≈ 1 + . 2 Dejamos los detalles a cargo del lector. 3.9 Primitivas El teorema 3.16 afirma que una funci´n derivable est´ completamente de- o a terminada por su derivada y su valor en un punto. A menudo se plantea el problema pr´ctico de determinar una funci´n a partir de estos datos. a o Definici´n 3.39 Diremos que una funci´n F : I −→ R definida en un intervalo o o abierto I es una primitiva de una funci´n f : I −→ R si F es derivable en I y o F0 = f.
  • 161.
    3.9. Primitivas 145 No estamos en condiciones de decir mucho sobre cu´ndo una funci´n tiene a o primitiva. Nos limitaremos a hacer algunas observaciones te´ricas que en casos o concretos nos permitir´n encontrar primitivas de funciones dadas. En estos a t´rminos, lo que afirma el teorema 3.16 es que si una funci´n f admite una e o primitiva F , entonces el conjunto de todas las primitivas de f est´ formado por a las funciones de la forma F + c, para cada c ∈ R. Esto hace que, aunque F no est´ un´ e ıvocamente determinada por f , dados a, b ∈ I, el incremento F (b)−F (a) s´ lo est´. Conviene introducir la notaci´n ı a o £ §b F (x) a = F (b) − F (a). En el lenguaje del c´lculo infinitesimal, si sabemos que dy = f (x)dx, esto a significa que la funci´n y experimenta un incremento infinitesimal de f (x)dx o cada vez que la variable se incrementa en dx. Supongamos que y est´ definida a en [a, b] y conocemos y(a). Entonces y(b) ≈ y(a) + f (a)(b − a). En realidad ´ste es el valor que toma en b la recta tangente a y en a. Obtendremos una e aproximaci´n mejor si dividimos el intervalo [a, b] en partes iguales, digamos o a = x0 < x1 < · · · < xn = b, todas de longitud ∆x, y vamos calculando: y(x0 ) = y(a), y(x1 ) ≈ f (x0 )∆x + y(a), y(x2 ) ≈ f (x0 )∆x + f (x1 )∆x + y(a), ··· ············ En definitiva, n X y(b) − y(a) ≈ f (xi−1 )∆x i=1 La aproximaci´n ser´ mejor cuantas m´s partes consideremos, es decir, o a a cuanto menor sea ∆x. As´ el incremento de la primitiva puede pensarse como ı, una suma de infinitos sumandos correspondientes a un incremento infinitesimal dx. Por ello la notaci´n cl´sica para el incremento de una primitiva F de una o a funci´n f (x) en un intervalo [a, b] es o Z b £ §b f (x) dx = F (x) a (3.6) a donde el s´ımbolo proviene de una S de “suma” (en realidad del lat´ summa) ın y se lee integral de la funci´n f respecto a x en [a, b] (porque es el incremento o “entero” que se obtiene al sumar sus incrementos infinitesimales). Los n´meros u a y b se llaman l´ımites de la integral. Para convertir al c´lculo integral en una a teor´ matem´tica eficaz es necesario tener en cuenta estas ideas y tratarlas ıa a con rigor, pero de momento no vamos a entrar en ello y vamos a limitarnos a considerar la integraci´n como la operaci´n inversa a la derivaci´n. As´ pues, o o o ı tomamos (3.6) como definici´n de la integral de f . Notemos que si dejamos el o l´ ımite superior como variable obtenemos una primitiva concreta G de f , a saber,
  • 162.
    146 Cap´ ıtulo 3. C´lculo diferencial de una variable a la unica que cumple G(a) = 0: ´ Z x G(t) = f (x) dx = F (x) − F (a). a Cuando queremos referirnos a una primitiva arbitraria de una funci´n usa- o mos esta misma notaci´n integral, pero omitimos los l´ o ımites de integraci´n, as´ o ı, Z f (x) dx = F (x) + c, donde c ∈ R. Veremos que esta notaci´n es consistente con los otros usos que venimos o haciendo de los s´ ımbolos dx. De la propia definici´n de primitiva se sigue que o Z y 0 (x) dx = y(x) + c. Con la notaci´n dy = y 0 dx esto se escribe as´ o ı: Z dy = y + c. Cada regla de derivaci´n da lugar a una regla de integraci´n. Por ejemplo, o o el hecho de que la derivada de una suma es la suma de las derivadas implica que una suma tiene por primitiva a la suma de las primitivas. M´s en general, a dadas dos funciones u, v, Z Z Z (α u + β v) dx = α u dx + β v dx, para α, β ∈ R. Uniendo esto a la regla evidente: Z xn+1 xn = + c, n 6= −1, n+1 podemos integrar cualquier polinomio. El caso exceptuado es claro: Z x−1 dx = log x + c. La regla de derivaci´n del producto requiere m´s atenci´n: dadas dos funcio- o a o nes derivables u y v tenemos que d(uv) = udv + vdu, luego integrando tenemos Z Z u dv = uv − v du. Esta f´rmula se conoce como “regla de integraci´n por partes”. Obviamente o o de aqu´ se sigue a su vez la versi´n con l´ ı o ımites: Z b Z b b u dv = [uv]a − v du. a a
  • 163.
    3.9. Primitivas 147 R Ejemplo Vamos a calcular xex dx. Para R llamamos u = x y dv = ex dx. R ello Claramente entonces du = dx y v = dv = ex dx = ex . La f´rmula anterior o nos da Z Z xex dx = xex − ex dx = xex − ex + c. Observar que hemos omitido la constante al calcular v = ex . Es claro que para aplicar la regla podemos tomar como v una primitiva fija cualquiera. R Ejemplo Sea Im,n = senm x cosn x dx. Vamos a encontrar unas expresiones recurrentes que nos permitan calcular estas integrales. Integramos por partes tomando u = cosn−1 x, dv = senm x cos x dx. De este modo: Z senm+1 x cosn−1 x n−1 Im,n = + senm+1 x cosn−2 x sen x dx m+1 m+1 Z senm+1 x cosn−1 x n−1 = + senm x cosn−2 x(1 − cos2 x) dx m+1 m+1 senm+1 x cosn−1 x n−1 = + (Im,n−2 − Im,n ). m+1 m+1 Despejando llegamos a senm+1 x cosn−1 x n−1 Im,n = + Im,n−2 . m+n m+n Similarmente se prueba senm−1 x cosn+1 x m−1 Im,n = − + Im−2,n . m+n m+n Estas f´rmulas reducen el c´lculo de cualquier integral Im,n al c´lculo de las o a a cuatro integrales Z Z Z Z dx, sen x dx, cos x dx, sen x cos x dx, y todas ellas son inmediatas (para la ultima aplicamos la f´rmula del seno del ´ o a ´ngulo doble). Por ultimo veamos en Rqu´ se traduce la regla de la cadena. Supongamos ´ e que tenemos una integral u(x) dx, que F (x) es una primitiva de u(x) (la que queremos calcular) y que x = x(t) es una funci´n derivable con derivada no nula o (que por consiguiente tiene inversa derivable t = t(x)). Entonces por la regla de la cadena F (x(t))0 = F 0 (x(t)) x0 (t) = u(x(t))x0 (t), luego Z u(x(t)) x0 (t) dt = F (x(t)) + c. R As´ pues, para calcular u(x) dx podemos sustituir x por x(t) y dx por x0 (t) dt y ı calcular una primitiva G(t) de la funci´n resultante, ´sta ser´ F (x(t)) + c, luego o e a
  • 164.
    148 Cap´ ıtulo 3. C´lculo diferencial de una variable a si sustituimos G(t(x)) = F (x(t(x))) + c = F (x) + c, obtenemos una primitiva de la funci´n original. A esta t´cnica se la llama integraci´n por sustituci´n. La o e o o versi´n con l´ o ımites es: Z t(b) Z b u(x(t)) x0 (t) dt = F (x(t(b))) − F (x(t(a))) = F (b) − F (a) = u(x) dx, t(a) a o sea: Z Z b t(b) u(x) dx = u(x(t)) x0 (t) dt. a t(a) R√ Ejemplo Vamos a calcular 1 − x2 dx. El integrando est´ definido en el a intervalo ]−1, 1[. Consideramos la funci´n x = sen t, definida y biyectiva en o ]0, π[. Entonces dx = cos t dt y se cumple Z p Z p Z Z 1 + cos 2t 1 − x2 dx = 1 − sen2 t cos t dt = cos2 t dt = dt 2 Z Z 1 1 t 1 t 1 = dt + 2 cos 2t dt = + sen 2t + c = + sen t cos t + c 2 4 2 4 2 2 √ arcsen x x 1 − x2 = + + c. 2 2 En general, si la primitiva de una funci´n en un intervalo ]a, b[ se extiende o continuamente al intervalo [a, b], dicha extensi´n es obviamente unica, por lo o ´ que podemos calcular la integral desde a hasta b, que se interpreta como el incremento completo de la primitiva. As´ en el ejemplo anterior tenemos ı, Z 1p π 1 − x2 dx = . −1 2 3.10 Ap´ndice: La trascendencia de e y π e Para acabar el cap´ ıtulo probaremos que las constantes e y π que nos han aparecido son n´meros trascendentes (sobre Q). Supondremos al lector familia- u rizado con la teor´ de n´meros algebraicos. Aunque es muy sencillo probar que ıa u casi todos los n´meros reales son trascendentes, pues el conjunto de n´meros u u algebraicos es numerable y R no lo es. No es f´cil, en cambio, probar la tras- a cendencia de un n´mero particular. Hermite fue el primero en demostrar la u trascendencia de e y Lindemann prob´ despu´s la de π. Aqu´ veremos unas o e ı pruebas m´s sencillas, pero hay que se˜alar que la prueba de Lindemann se ge- a n neraliza a un teorema m´s potente, en virtud del cual los valores que toman las a funciones sen x, cos x, ex , log x, etc. sobre n´meros algebraicos son—salvo los u casos triviales— n´meros trascendentes. Por ello a estas funciones se les llama u tambi´n funciones trascendentes. e
  • 165.
    3.10. Ap´ndice: Latrascendencia de e y π e 149 Comenzamos introduciendo unos convenios utiles de notaci´n: ´ om P r Definici´n 3.40 Escribiremos h = r!, de modo que si f (z) = o cr z r ∈ C[z], r=0 entonces f (h) representar´ a m X m X f (h) = cr hr = cr r! r=0 r=0 Igualmente, f (z + h) ser´ el polinomio que resulta de sustituir y r por hr = r! a en la expresi´n desarrollada de f (z + y). Concretamente: o √m ! Xm X X µr ∂ m r X X µr ∂ m f (z + y) = cr (z + y)r = cr z r−k y k = cr z r−k y k , r=0 r=0 k k k=0 k=0 r=k luego m √m µ ∂ ! m √m ! m X X r r−k X X r! X r−k f (z + h) = cr z k! = cr z = f k) (z), k (r − k)! k=0 r=k k=0 r=k k=0 k) donde f (z) es la k-´sima derivada formal del polinomio f . Observar que e m X f (z + h) = cr (z + h)r , r=0 pues m m m m √m !k) X X X X X r r k) r cr (z + h) = cr (z ) = cr z r=0 r=0 k=0 k=0 r=0 Xm = f k) (z) = f (z + h). k=0 As´ mismo, ı m X m X f (0 + h) = f k) (0) = cr r! = f (h). k=0 r=0 Sea ∞ X zn ur (z) = r! . n=1 (r + n)! Teniendo en cuenta que |z|n |z|n (r+n)! < , n! r! es claro que la serie converge en todo C y que |ur (z)| < e|z| . Llamaremos ur (z) ≤r (z) = . e|z| As´ |≤r (z)| < 1. ı,
  • 166.
    150 Cap´ ıtulo 3. C´lculo diferencial de una variable a P s Ps Teorema 3.41 Sea φ(z) = cr z r ∈ C[z]. Sea ψ(z) = cr ≤r (z)z r . Enton- r=0 r=0 ces ez φ(h) = φ(z + h) + ψ(z)e|z| . ´ Demostracion: En primer lugar X µr ∂ r r X r! r X zk (z + h)r = z k hr−k = z k = r! , k k! k! k=0 k=0 k=0 y por otro lado ∞ X zk ∞ X ∞ X zk ∞ X zk z r zn r r!e − ur (z)z = r! − r! z = r! − r! k! n=1 (r + n)! k! k! k=0 k=0 k=r+1 Xr zk = r! , k! k=0 o sea, (z + h)r = r!ez − ur (z)z r , y por lo tanto ez hr = (z + h)r + ur (z)z r = (z + h)r + e|z| ≤r (z)z r . Multiplicando por cr y sumando en r obtenemos la igualdad buscada. Teorema 3.42 Sea m ≥ 2 y f (x) ∈ Z[x]. Definimos los polinomios F1 y F2 mediante: xm−1 xm F1 (x) = f (x), F2 (x) = f (x). (m − 1)! (m − 1)! Entonces F1 (h), F2 (h) ∈ Z, F1 (h) ≡ f (0) (m´d m) y F2 (h) ≡ 0 (m´d m). o o P r ´ Demostracion: Sea f (x) = ar xr , con ar ∈ Z. Entonces r=0 s X s X xr+m−1 (r + m − 1)! F1 (x) = ar , F1 (h) = ar ∈Z r=0 (m − 1)! r=0 (m − 1)! y m divide a cada sumando excepto quiz´ al primero, que es a0 = f (0). Por lo a tanto F1 (h) ≡ f (0) (m´d m). Con F2 se razona an´logamente. o a Como ultimo preliminar recordemos que p(x1 , . . . , xn ) ∈ A[x1 , . . . , xn ] es un ´ polinomio sim´trico si para toda permutaci´n σ de las variables se cumple que e ° ¢ o p(x1 , . . . , xn ) = p σ(x1 ), . . . , σ(xn ) . Los polinomios sim´tricos elementales de e n variables son los polinomios e0 , . . . , en tales que ei es la suma de todos los mo- nomios posibles formados por i variables distintas. Por ejemplo, los polinomios sim´tricos elementales de tres variables son e e0 = 1, e1 = x + y + z, e2 = xy + xz + yz, e3 = xyz. Vamos a usar los dos resultados siguientes sobre polinomios elementales:
  • 167.
    3.10. Ap´ndice: Latrascendencia de e y π e 151 Todo polinomio sim´trico p(x1 , . . . , xn ) es de la forma q(e1 , . . . , en ), e para cierto polinomio q(x1 , . . . , xn ). Los coeficientes (x − α1 ) · · · (x − αn ) son (−1)i ei (α1 , . . . , αn ), para i = 0, . . . , n. Teorema 3.43 El n´mero e es trascendente. u ´ Demostracion: Si e fuera algebraico ser´ la ra´ de un polinomio con ıa ız P n coeficientes enteros. Digamos ct e = 0, con n ≥ 1, ct ∈ Z, c0 6= 0 (si c0 t t=0 fuera 0 podr´ ıamos dividir entre e y quedarnos con un polinomio menor). Sea p un primo tal que p > n y p > |c0 |. Sea xp−1 ° ¢p φ(x) = (x − 1)(x − 2) · · · (x − n) . (p − 1)! Por el teorema 3.41: n X n X n X 0= ct et φ(h) = ct φ(t + h) + ct ψ(t)et = S1 + S2 . t=0 t=0 t=0 Tomando m = p, el teorema 3.42 nos da que φ(h) ∈ Z y φ(h) ≡ (−1)pn (n!)p (m´d p). o Si 1 ≤ t ≤ n, entonces (x + t)p−1 ° ¢p φ(t + x) = (x + t − 1)(x + t − 2) · · · x · · · (x + t − n) , (p − 1)! y sacando el factor x queda xp φ(t + h) = f (x), (p − 1)! con f (x) ∈ Z[x]. Por el teorema 3.42 tenemos que φ(t + h) ∈ Z y es un m´ltiplo u de p. Ahora, n X S1 = ct φ(t + h) ≡ c0 φ(h) ≡ c0 (−1)pn (n!)p 6≡ 0 (m´d p), o t=0 ya que c0 6= 0 y p > n, |c0 |. As´ pues, S1 ∈ Z y S1 6= 0, luego |S1 | ≥ 1. Como ı S1 + S2 = 0, lo mismo vale para S2 , es decir, |S2 | ≥ 1. Por otro lado, sea Ps φ(x) = ar xr . Entonces r=0 Ø s Ø ØX Ø X s s X Ø rØ |ψ(t)| = Ø ar ≤r (t)t Ø ≤ |ar | |≤r (t)|tr ≤ |ar |tr . Ø Ø r=0 r=0 r=0
  • 168.
    152 Cap´ ıtulo 3. C´lculo diferencial de una variable a Observemos que |ar | es el coeficiente de grado r del polinomio xp−1 ° ¢p (x + 1) · · · (x + n) . (p − 1)! ° ¢p Basta ver que si bi es el coeficiente de grado i de (x − 1) · · · (x − n) , ° ¢p entonces |bi | es el coeficiente de grado i de (x + 1) · · · (x + n) , pero |bi | = |(−1)pn−i enp−i (1, . . . , n, . . . , 1, . . . , n)| = (−1)pn−i enp−i (−1, . . . , −n, . . . , −1, . . . , −n). Por lo tanto podemos concluir: s X tp−1 ° ¢p |ψ(t)| ≤ |ar |tr = (t + 1)(t + 2) · · · (t + n) , r=0 (p − 1)! y en definitiva: ° ¢p−1 t(t + 1) · · · (t + n) |ψ(t)| ≤ (t + 1)(t + 2) · · · (t + n) . (p − 1)! Pero esta expresi´n tiende a 0 cuando p tiende a infinito (por la convergencia o de la serie de la funci´n exponencial). En consecuencia, tomando p suficiente- o P n mente grande podemos exigir que S2 = ct ψ(t)et cumpla |S2 | < 1, cuando t=0 hemos demostrado lo contrario para todo p. Esto prueba que e es trascendente. La trascendencia de π es algo m´s complicada de probar. Adem´s de los a a teoremas 3.41 y 3.42 necesitaremos otro resultado auxiliar: Teorema 3.44 Sea p(x) = dxm + d1 xm−1 + · · · + dm−1 x + dm ∈ Z[x], sean ıces en C y sea q(x1 , . . . , xm ) ∈ Z[x1 , . . . , xm ] un polinomio α1 , . . . , αm sus ra´ sim´trico. Entonces q(dα1 , . . . , dαm ) ∈ Z. e ´ Demostracion: Claramente dm−1 p(x) = (dx)m + d1 (dx)m−1 + dd2 (dx)m−2 + · · · + dm−2 dm−1 (dx) + dm−1 dm . O sea, dm−1 p(x) = r(dx), donde r(x) = xm + d1 xm−1 + dd2 xm−2 + · · · + dm−2 dm−1 x + dm−1 dm ∈ Z[x] es un polinomio m´nico y sus ra´ o ıces son obviamente dα1 , . . . , dαm . Conse- cuentemente, r(x) = (x − dα1 ) · · · (x − dαm ) y los coeficientes de r(x) son (−1)i ei (dα1 , . . . , dαm ) para i = 0, . . . m. As´ pues, ei (dα1 , . . . , dαm ) ∈ Z para ı i = 1, . . . , m. Por otro lado sabemos que q(x1 , . . . , xm ) = r(e1 , . . . , em ) para cierto polino- mio r(x1 , . . . , xm ) ∈ Z[x1 , . . . , xm ], luego ° ¢ q(dα1 , . . . , dαm ) = r e1 (dα1 , . . . , dαm ), . . . , em (dα1 , . . . , dαm ) ∈ Z.
  • 169.
    3.10. Ap´ndice: Latrascendencia de e y π e 153 Teorema 3.45 El n´mero π es trascendente. u ´ Demostracion: Si π es algebraico tambi´n lo es iπ. Sea e dxm + d1 xm−1 + · · · + dm−1 x + dm ∈ Z[x] un polinomio tal que d 6= 0 y con ra´ iπ. Sean ω1 , . . . , ωm sus ra´ ız ıces en C. Como una de ellas es iπ y eiπ + 1 = 0, tenemos que (1 + eω1 ) · · · (1 + eωm ) = 0, o sea, m 2X −1 1+ eαt = 0, t=1 donde α1 , . . . , α2m −1 son ω1 , . . . , ωm , ω1 + ω2 , . . . , ωm−1 + ωm , . . . , ω1 + · · · + ωm . Supongamos que c − 1 de ellos son nulos y n = 2m − 1 − (c − 1) no son nulos. Orden´moslos como α1 , . . . , αn , 0, . . . , 0. As´ c ≥ 1 y e ı n X c+ eαt = 0. (3.7) t=1 Notemos lo siguiente: ei (x1 , . . . , xn ) = ei (x1 , . . . , xn , 0, . . . , 0), donde ei es a la izquierda el polinomio sim´trico elemental de n variables y a la e derecha el de 2m − 1 variables. Por lo tanto ei (dα1 , . . . , dαn ) = ei (dα1 , . . . , dα2m −1 ) = ei (dω1 , . . . , dωm , dω1 + dω2 , . . . , dωm−1 + dωm , . . . , dω1 + · · · + dωm ). Sea qi (x1 , . . . , xm ) = ei (x1 , . . . , xm , x1 +x2 , . . . , xm−1 +xm , . . . , x1 +· · ·+xm ). Claramente se trata de polinomios sim´tricos con coeficientes enteros y e ei (dα1 , . . . , dαn ) = qi (dω1 , . . . , dωm ), luego el teorema anterior nos permite afirmar que ei (dα1 , . . . , dαn ) ∈ Z. Si s(x1 , . . . , xn ) ∈ Z[x1 , . . . , xn ] es sim´trico, entonces s depende polin´mi- e o camente de los ei , luego s(dα1 , . . . , dαn ) ∈ Z. Sea p un primo tal que p > |d|, p > c, p > |dn α1 · · · αn |. Sea dnp+p−1 xp−1 ° ¢p φ(x) = (x − α1 ) · · · (x − αn ) . (p − 1)! Multiplicamos (3.7) por φ(h) y aplicamos el teorema 3.41. Nos queda n X n X cφ(h) + φ(αt + h) + ψ(αt )e|αt | = S0 + S1 + S2 = 0. t=1 t=1 Ahora, xp−1 p−1 ° ¢p φ(x) = d (dx − dα1 ) · · · (dx − dαn ) . (p − 1)!
  • 170.
    154 Cap´ ıtulo 3. C´lculo diferencial de una variable a Los coeficientes de (y − dα1 ) · · · (y − dαn ) son polinomios sim´tricos elemen- e tales sobre dα1 , . . . , dαn , luego son enteros, seg´n hemos visto antes. De aqu´ u ı se sigue que tambi´n son enteros los coeficientes de (dx − dα1 ) · · · (dx − dαn ), e con lo que np xp−1 X φ(x) = gr xr , donde cada gr ∈ Z. (p − 1)! r=0 Por el teorema 3.42 tenemos que φ(h) ∈ Z y φ(h) ≡ g0 (m´d p). Concre- o tamente, g0 = (−1)pn dp−1 (dα1 · · · dαn )p , luego por la elecci´n de p resulta que o p - g0 (aqu´ es importante que dα1 · · · dαn ∈ Z porque es el t´rmino indepen- ı e diente de (y − dα1 ) · · · (y − dαn ). Como p - c, resulta que p - S0 = cφ(h). Nos ocupamos ahora de S1 . Tenemos que dnp+p−1 (αt + x)p−1 ° φ(αt + x) = (x + αt − α1 ) · · · (x + αt − αt−1 ) (p − 1)! ¢p x(x + αt − αt+1 ) · · · (x + αt − αn ) xp ° = dp (dαt + dx)p−1 (dx + dαt − dα1 ) · · · (dx + dαt − dαt−1 ) (p − 1)! ¢p (dx + dαt − dαt+1 ) · · · (dx + dαt − dαn ) np−1 X xp = frt xr , (p − 1)! r=0 donde frt = fr (dαt , dα1 , . . . , dαt−1 , dαt+1 , . . . , dαn ) y fr es un polinomio sim´- e trico respecto a todas las variables excepto la primera, con coeficientes enteros y que no depende de t. En efecto, consideramos el polinomio ° ¢p−1 ≥° ¢ ° ¢¥p y − (−x1 ) y − (x2 − x1 ) · · · (y − (xn − x1 ) . Sus coeficientes son los polinomios sim´tricos elementales actuando sobre −x1 e (p−1 veces) y sobre x2 −x1 , . . . , xn −x1 (p veces cada uno), luego son polinomios np−1 P sim´tricos en x2 , . . . , xn . Digamos que el polinomio es e sr (x1 , . . . , xn )y r . r=0 Entonces np−1 X xp φ(αt + x) = dp sr (dαt , dα1 , . . . , dαt−1 , dαt+1 , . . . , dαn )dr xr , (p − 1)! r=0 es decir, fr = dr+p sr (x1 , . . . , xn ). Por lo tanto, n √ n np−1 X ! X xp X φ(αt + x) = frt xr , t=1 (p − 1)! r=0 t=1
  • 171.
    3.10. Ap´ndice: Latrascendencia de e y π e 155 pero n X n X frt = fr (dαt , dα1 , . . . , dαt−1 , dαt+1 , . . . , dαn ), t=1 t=1 P n y el polinomio fr (xt , x1 , . . . , xt−1 , xt+1 , . . . xn ) es sim´trico (respecto a todas e t=1 Pn las variables), luego Fr = frt depende sim´tricamente de dα1 , . . . , dαn y por e t=1 lo tanto es un entero. As´ pues, ı n X np−1 X xp φ(αt + x) = Fr xr , t=1 (p − 1)! r=0 P n y por el teorema 3.42 concluimos que S1 = φ(αt + h) ∈ Z y es m´ltiplo de p u t=1 (aqu´ hemos usado que (φ1 + φ2 )(h) = φ1 (h) + φ2 (h), lo cual es evidente). ı Esto nos da que S0 + S1 ∈ Z y no es un m´ltiplo de p. En particular u |S0 + S1 | ≥ 1 y, por la ecuaci´n S0 + S1 + S2 = 0 resulta que tambi´n S2 ∈ Z y o e |S2 | ≥ 1. Como en el caso de e, ahora probaremos lo contrario. np+p−1 P Sea ψ(x) = cr ≤r (x)xr . Entonces r=0 Ønp+p−1 Ø np+p−1 Ø X Ø X Ø rØ |ψ(x)| = Ø cr ≤r (x)x Ø ≤ |cr | |xr | Ø Ø r=0 r=0 |d|np+p−1 |x|p−1 ° ¢p ≤ (|x| + |α1 |) · · · (|x| + |αn |) (p − 1)! (por el mismo razonamiento que en la prueba de la trascendencia de e) y as´ ı M 2np+2p−2 |ψ(x)| ≤ , (p − 1)! donde M es una cota que no depende de p. Como M 2np+2p−2 ≤ M 2np+2p = M (2n+2)p = K p = KK p−1 , tenemos que K p−1 |ψ(x)| ≤ K (p − 1)! y la sucesi´n converge a 0 cuanto p tiende a infinito, pues la serie converge o a KeK . Esto para cada x fijo. Tomando un primo p suficientemente grande P n podemos exigir que |S2 | ≤ |ψ(αt )|e|αt | < 1, con lo que llegamos a una con- t=1 tradicci´n. o
  • 173.
    Cap´ ıtulo IV C´lculo diferencial de varias a variables Este cap´ıtulo est´ dedicado a generalizar a funciones de varias variables las a ideas que introdujimos en el cap´ ıtulo anterior. B´sicamente se trata de estudiar a c´mo var´ una funci´n de varias variables cuando incrementamos ´stas infinite- o ıa o e simalmente. M´s concretamente estudiaremos una funci´n f : A ⊂ Rn −→ Rm , a o donde A es un abierto, aunque a efectos de interpretar la teor´ nos centraremos ıa de momento en el caso en que m = 1. 4.1 Diferenciaci´n o Pensemos por ejemplo en una funci´n f : R2 −→ R. Mientras una funci´n de o o una variable derivable en un punto tiene asociada una unica recta tangente que ´ la aproxima, una funci´n de dos variables tiene (o puede tener) una tangente o distinta para cada direcci´n. La figura muestra (a la izquierda) una tangente a o la gr´fica de f en un punto, y a la derecha vemos varias tangentes distintas en a ese mismo punto. f (a) a + hv a Intuitivamente est´ claro qu´ es la recta tangente a una superficie en un a e punto y en una direcci´n. Ahora vamos a caracterizar matem´ticamente este o a 157
  • 174.
    158 Cap´ ıtulo 4. C´lculo diferencial de varias variables a ´ concepto. Tenemos un punto a ∈ Rn y una recta que pasa por a. Esta queda determinada por un vector v ∈ Rn no nulo. Podemos suponer kvk = 1 (mientras no se indique lo contrario, todas las normas que consideraremos ser´n eucl´ a ıdeas). Los puntos de la recta son los de la forma a+hv, con h ∈ R. M´s concretamente, a el punto a + hv es el que se encuentra a una distancia |h| de a sobre dicha recta (el signo de h distingue los dos puntos en estas condiciones). Buscamos una recta que se parece a la gr´fica de f alrededor del punto a. a Si la gr´fica fuera rectil´ a ınea en la direcci´n considerada, su pendiente vendr´ o ıa dada por f (a + hv) − f (a) , h para cualquier h 6= 0. Si no es as´ entonces esta expresi´n se parecer´ m´s a ı, o a a la pendiente que buscamos cuanto menor sea h. Ello nos lleva a la definici´n o siguiente: Definici´n 4.1 Dada una funci´n f : A ⊂ Rn −→ Rm definida en un abierto, o o un punto a ∈ A y un vector v ∈ Rn no nulo, llamaremos derivada direccional de f en a y en la direcci´n de v al vector o f (a + hv) − f (a) f 0 (a; v) = l´ ım ∈ Rm . h→0 h Es f´cil ver que si existe f 0 (a; v) entonces existe f 0 (a; λv) = λf 0 (a, v) para a todo λ ∈ R {0}. Por lo tanto no perdemos generalidad si suponemos kvk = 1. Si existe f 0 (a; v), para valores peque˜os de h tenemos la aproximaci´n n o f (a + hv) ≈ f (a) + h f 0 (a; v), con lo que la expresi´n h f 0 (a; v) aproxima el incremento que experimenta f (a) o cuando la variable se incrementa h unidades en la direcci´n de v. o En el caso m = 1 la funci´n a+hv 7→ f (a)+h f 0 (a; v) se llama recta tangente o a la gr´fica de f en a. Es claro que se trata de la recta que pretend´ a ıamos caracterizar. Como en el caso de una variable, si una funci´n f : A ⊂ Rn −→ Rn admite o derivada direccional en la direcci´n de v y en todo punto de A, entonces tenemos o definida una funci´n o f 0 ( ; v) : A −→ Rm . Respecto al c´lculo de derivadas direccionales, las propiedades de los l´ a ° ¢ ımites nos dan en primer lugar que si f (x) = f1 (x), . . . , fm (x) , entonces ° 0 ¢ f 0 (a; v) = f1 (a; v), . . . , fm (a; v) , 0 entendiendo que la derivada de f existe si y s´lo si existen las derivadas de o todas las funciones coordenadas fi . Por consiguiente el c´lculo de derivadas a direccionales se reduce al caso de funciones f : A ⊂ Rn −→ R. A su vez ´stas e se reducen al c´lculo de derivadas de funciones de una variable. Efectivamente, a basta considerar la funci´n φ(h) = f (a + hv). El hecho que que A sea abierto o implica claramente que φ est´ definida en un entorno de 0 y comparando las a definiciones es claro que f 0 (a; v) = φ0 (0).
  • 175.
    4.1. Diferenciaci´n o 159 Ejemplo Vamos a calcular la derivada de f (x, y) = x2 y 2 en el punto (2, 1) y en la direcci´n (−1, 1). Para ello consideramos o φ(h) = f (2 − h, 1 + h) = (2 − h)2 (1 + h)2 . Entonces φ0 (h) = −2(2 − h)(1 + h)2 + 2(2 − h)2 (1 + h) y φ0 (0) = 4. Existen unas derivadas direccionales especialmente simples de calcular y es- pecialmente importantes en la teor´ Se trata de las derivadas en las direcciones ıa. de la base can´nica de Rn . o Definici´n 4.2 Sea f : A ⊂ Rn −→ Rm una funci´n definida en un abierto y o o a ∈ A. Se define la derivada parcial de f respecto a la i-´sima variable en el e punto a como ∂f Di f (a) = (a) = f 0 (a; ei ), ∂xi donde ei = (0, . . . , 1, . . . , 0) es el vector con un 1 en la posici´n i-´sima. o e Expl´ ıcitamente: f (a1 , . . . , ai + h, . . . , an ) − f (a) Di f (a) = l´ ım , h→0 h luego si h es peque˜o n f (a1 , . . . , ai + h, . . . , an ) ≈ f (a) + h Di f (a). En otras palabras, la expresi´n h Di f (a) aproxima el incremento que experi- o menta f (a) cuando incrementamos h unidades la variable xi . Si f admite derivada parcial i-´sima en todos los puntos de A entonces e tenemos definida la funci´n Di f : A −→ Rm . o El c´lculo de las derivadas parciales de una funci´n f : A ⊂ Rn −→ R a o es mucho m´s simple que el de las derivadas direccionales en general, pues a podemos considerar la funci´n φ(xi ) = f (a1 , . . . , xi , . . . , an ) y entonces es claro o que Di f (a) = φ0 (ai ). Notar que si f es una funci´n de una variable, entonces o φ = f , luego la derivada parcial respecto de la unica variable coincide con la ´ derivada de f en el sentido del cap´ ıtulo anterior. Un poco m´s en general, si a f : A ⊂ R −→ Rm llamaremos tambi´n derivada de f a su unica derivada e ´ parcial en un punto a, y la representaremos tambi´n por f 0 (a). e Ejemplo Las derivadas parciales de la funci´n f (x, y) = x2 y 3 son o ∂f ∂f = 2xy 3 , = 3x2 y 2 . ∂x ∂y En efecto, para calcular la parcial respecto de x en un punto (x0 , y0 ) hay que derivar la funci´n x 7→ x2 y0 en x0 . La derivada es obviamente 2x0 y0 . En o 3 3 2 3 la pr´ctica podemos ahorrarnos los sub´ a ındices: para derivar x y respecto de x
  • 176.
    160 Cap´ ıtulo 4. C´lculo diferencial de varias variables a basta considerar a y como una constante (la segunda coordenada del punto en que derivamos) y derivar respecto de x. Lo mismo vale para y. Es claro que todas las reglas de derivaci´n de funciones de una variable o pueden ser usadas en el c´lculo de derivadas parciales. a Ejercicio: Sean dos funciones derivables f, g : I ⊂ R −→ Rn . Probar la regla de derivaci´n (f g)0 = f 0 g + f g 0 . Si n = 3 se cumple tambi´n (f ∧ g)0 = f 0 ∧ g + f ∧ g 0 . o e El hecho de que una funci´n admita derivadas direccionales en un punto no o puede ser equiparado a la derivabilidad de una funci´n de una variable. Por o ejemplo, la existencia de derivadas direccionales no implica siquiera la conti- nuidad de la funci´n en el punto. La generalizaci´n adecuada del concepto de o o funci´n derivable es el concepto de “funci´n diferenciable”, que vamos a intro- o o ducir ahora. Recordemos que si una funci´n de una variable f tiene derivada en un o punto a, entonces podemos definir su diferencial en a, que es una aplicaci´n o lineal df (a) : R −→ R con la propiedad de que f (a) + df (a)(x − a) es una recta que “se confunde” con f alrededor de a. Una funci´n de varias variables ser´ o a diferenciable cuando exista una aplicaci´n lineal que juegue un papel an´logo: o a Definici´n 4.3 Sea f : A ⊂ Rn −→ Rm una funci´n definida en un abierto A. o o Sea a ∈ A. Diremos que f es diferenciable en A si existe una aplicaci´n lineal o φ : Rn −→ Rm tal que f (a + v) − f (a) − φ(v) l´ ım = 0. v→0 kvk Para analizar esta definici´n conviene comenzar probando lo siguiente: o Teorema 4.4 Sea f : A ⊂ Rn −→ Rm una funci´n diferenciable en un punto o a ∈ A. Sea φ : Rn −→ Rm una aplicaci´n lineal que cumpla la definici´n o o anterior. Entonces, para cada vector v ∈ Rn no nulo existe f 0 (a; v) y adem´s a φ(v) = f 0 (a; v). ´ Demostracion: Obviamente hv tiende a 0 cuando h tiende a 0. Por lo tanto, restringiendo el l´ ımite de la definici´n de diferenciabildad concluimos que o f (a + hv) − f (a) − φ(hv) l´ ım = 0. h→0 khvk Usando que φ y la norma son lineales vemos que µ ∂ 1 f (a + hv) − f (a) h l´ ım − φ(v) = 0. h→0 kvk |h| |h| Claramente podemos eliminar el factor 1/kvk sin que el l´ ımite var´ Ahora ıe. multiplicamos por la funci´n R {0} −→ {±1} dada por h 7→ |h|/h y usamos o que el producto de una funci´n que tiende a 0 por otra acotada tiende a 0: o f (a + hv) − f (a) l´ ım − φ(v) = 0, h→0 h
  • 177.
    4.1. Diferenciaci´n o 161 Por lo tanto existe f (a + hv) − f (a) f 0 (a; v) = l´ ım = φ(v). h→0 h En particular vemos que si f es diferenciable en a existe una unica aplicaci´n ´ o lineal φ que cumple la definici´n de diferenciabilidad, a saber, la dada por o φ(v) = f 0 (a; v). Definici´n 4.5 Sea f : A ⊂ Rn −→ Rm una funci´n diferenciable en un punto o o a ∈ A. Llamaremos diferencial de f en a a la unica aplicaci´n lineal, represen- ´ o tada por df (a) : Rn −→ Rm , que cumple f (a + v) − f (a) − df (a)(v) l´ ım = 0. v→0 kvk El teorema anterior afirma que para todo v ∈ Rn {0} se cumple df (a)(v) = f 0 (a; v). Consideremos el caso m = 1. Entonces, para un vector unitario v, la funci´n o a + hv 7→ f (a) + df (a)(hv) = f (a) + h df (a)(v) = f (a) + hf 0 (a; v) es la recta tangente a f por a y en la direcci´n de v. Cuando h var´ en R o ıa y v var´ entre los vectores unitarios, el punto x = a + hv var´ en todo Rn ıa ıa y la aplicaci´n x 7→ f (a) + df (a)(x − a) recorre todos los puntos de todas las o rectas tangentes a f por a. Puesto que se trata de una aplicaci´n af´ dichas o ın, tangentes forman un hiperplano. En resumen, hemos probado que para que una aplicaci´n (con m = 1) sea o diferenciable en un punto a es necesario que tenga rectas tangentes por a en to- das las direcciones y que adem´s ´stas formen un hiperplano. A este hiperplano a e se le llama hiperplano tangente a la gr´fica de f en a. De la propia definici´n a o de diferencial (haciendo v = x − a) se sigue que para puntos x cercanos a a se cumple f (x) ≈ f (a) + df (a)(x − a). El miembro derecho es precisamente el hiperplano tangente a f en a. Esta expresi´n indica, pues, que dicho hiperplano aproxima a f alrededor de a. o
  • 178.
    162 Cap´ ıtulo 4. C´lculo diferencial de varias variables a La figura de la derecha muestra la gr´fica de la funci´n a o ( 3 3 y −x x2 +y 2 si (x, y) 6= (0, 0) f (x, y) = 0 si (x, y) = (0, 0) Vemos tambi´n cuatro tangentes en (0, 0). Como no se encuentran sobre el e mismo plano, concluimos que esta funci´n no es diferenciable en (0, 0). o Pasamos ahora al c´lculo de la diferencial de una funci´n. Como primeras a o observaciones elementales notamos que si f es lineal entonces df (a) = f y si f es constante (alrededor de a) entonces df (a) = 0 (la aplicaci´n nula). Ambos o hechos se demuestran comprobando que con las elecciones indicadas para φ se cumple trivialmente la definici´n de diferencial. o ° ¢ Para una funci´n f (x) = f1 (x), . . . , fm (x) , las propiedades de los l´ o ımites nos dan que f es diferenciable en un punto a si y s´lo si lo es cada funci´n o o coordenada fi , y en tal caso ° ¢ df (a)(v) = df1 (a)(v), . . . , dfm (a)(v) . Para determinar df (a) es suficiente conocer su matriz en las bases can´nicas o de Rn y Rm . Dicha matriz tiene por filas las im´genes de los vectores ei de la a base can´nica. o Definici´n 4.6 Sea f : A ⊂ Rn −→ Rm una funci´n diferenciable en un punto o o a ∈ A. Llamaremos matriz jacobiana de f en a a la matriz Jf (a) que tiene por filas a las derivadas parciales Di f (a). ° ¢ M´s concretamente, si f (x) = f1 (x), . . . , fm (x) , el coeficiente de la fila i, a columna j de Jf (a) es Di fj (a). Si m = 1, se llama vector gradiente de f en a al vector formado por las derivadas parciales de f en a. Se representa: ° ¢ ∇f (a) = D1 f (a), . . . , Dn f (a) . Si ei es el vector i-´simo de la base can´nica, sabemos que e o df (a)(ei ) = f 0 (a; ei ) = Di f (a), luego la matriz jacobiana de f es simplemente la matriz de df (a) en las bases can´nicas de Rn y Rm . As´ pues, o ı df (a)(v) = vJf (a). Cuando m = 1, usando el producto escalar en lugar del producto de matrices tenemos tambi´n e ∂f ∂f df (a)(v) = ∇f (a)v = (a) v1 + · · · + (a) vn . ∂x1 ∂xn
  • 179.
    4.1. Diferenciaci´n o 163 Consideremos en particular la funci´n polin´mica xi , es decir, la funci´n o o o Rn −→ R dada por (x1 , . . . , xn ) 7→ xi . Es claro que ∇xi (a) = ei , luego dxi (a)(v) = vi . Por consiguiente, la ecuaci´n anterior puede escribirse como o ∂f ∂f df (a)(v) = (a) dx1 (a)(v) + · · · + (a) dxn (a)(v). ∂x1 ∂xn Como esto es v´lido para todo v, tenemos la ecuaci´n funcional a o ∂f ∂f df (a) = (a) dx1 (a) + · · · + (a) dxn (a). ∂x1 ∂xn Si f : A ⊂ Rn −→ R es diferenciable en todos los puntos de A podemos considerar df , dxi como funciones de A en el espacio de aplicaciones lineales de Rn en R y la ecuaci´n anterior nos da o ∂f ∂f df = dx1 + · · · + dxn . ∂x1 ∂xn Esta f´rmula expresa que si cada variable experimenta un incremento infi- o nitesimal dxi entonces la funci´n f experimenta un incremento df de la forma o que se indica. Como en el caso de una variable, la expresi´n ha de enten- o derse en realidad como una igualdad funcional que a cada vector de incrementos (∆x1 , . . . , ∆xn ) le asigna una aproximaci´n del incremento ∆f que experimenta o la funci´n. o Similarmente, en el caso m > 1 tenemos df = (df1 , . . . , dfm ) = (dx1 , . . . , dxn ) Jf. Ejemplo Consideremos la funci´n ]0, +∞[ × ]−π, π[ −→ R2 dada por o x = ρ cos θ, y = ρ sen θ. Podr´ıamos demostrar que es diferenciable aplicando la definici´n, pero m´s o a adelante ser´ inmediato (teorema 4.11), as´ que vamos a aceptar que lo es y a ı calcularemos su diferencial. Para ello calculamos la matriz jacobiana:  ∂x ∂y  µ ∂  ∂ρ ∂ρ  cos θ sen θ J(x, y)(ρ, θ) =  = ∂x ∂y −ρ sen θ ρ cos θ ∂θ ∂θ Por consiguiente µ ∂ cos θ sen θ (dx, dy) = (dρ, dθ) −ρ sen θ ρ cos θ = (cos θ dρ − ρ sen θ dθ, sen θ dρ + ρ cos θ dθ),
  • 180.
    164 Cap´ ıtulo 4. C´lculo diferencial de varias variables a o m´s claramente: a dx = cos θ dρ − ρ sen θ dθ, dy = sen θ dρ + ρ cos θ dθ. Tambi´n podr´ e ıamos haber calculado dx y dy de forma independiente. 4.2 Propiedades de las funciones diferenciables Vamos a estudiar las funciones diferenciables. Entre otras cosas obtendremos un criterio sencillo que justificar´ la diferenciabilidad de la mayor´ de funcio- a ıa nes de inter´s. Comenzamos observando que en funciones de una variable la e diferenciabilidad equivale a la derivabilidad. Teorema 4.7 Sea f : A ⊂ R −→ Rm una funci´n definida en un abierto A y o sea a ∈ A. Entonces f es diferenciable en a si y s´lo si existe la derivada de f o en a. Adem´s en tal caso df (a)(h) = f 0 (a)h. a ´ Demostracion: Si f es derivable en a entonces existe f (a + h) − f (a) f 0 (a) = l´ ım = k, h→0 h luego f (a + h) − f (a) − kh l´ ım = 0, h→0 h y si multiplicamos por la funci´n acotada h/|h| el l´ o ımite sigue siendo 0, es decir, tenemos f (a + h) − f (a) − kh l´ ım = 0, h→0 |h| lo que indica que f es diferenciable y que df (a)(h) = f 0 (a)h. El rec´ ıproco se prueba igualmente, partiendo de que df (a)(h) = kh se llega a que existe f 0 (a) = k. Teorema 4.8 Si f : A ⊂ Rn −→ Rm es diferenciable en un punto a, entonces f es continua en a. ´ Demostracion: Tenemos que f (a + v) − f (a) − df (a)(v) l´ ım = 0. v→0 kvk Multiplicamos por kvk, que tambi´n tiende a 0, con lo que e l´ f (a + v) − f (a) − df (a)(v) = 0. ım v→0
  • 181.
    4.2. Propiedades delas funciones diferenciables 165 La aplicaci´n df (a) es lineal, luego es continua, luego tiende a 0, luego o l´ f (a + v) − f (a) = 0, ım v→0 y esto equivale a l´ f (x) = f (a), ım x→a luego f es continua en a. Las propiedades algebraicas de la derivabilidad de funciones son v´lidas a tambi´n para la diferenciabilidad: e Teorema 4.9 Sean f y g funciones diferenciables en un punto a. Entonces a) f + g es diferenciable en a y d(f + g)(a) = df (a) + dg(a). b) Si α ∈ R entonces αf es diferenciable en a y d(αf )(a) = α df (a). c) f g es diferenciable en a y d(f g)(a) = g(a)df (a) + f (a)dg(a). d) si g(a) 6= 0 entonces f /g es diferenciable en a y g(a)df (a) − f (a)dg(a) d(f /g)(a) = . g 2 (a) ´ Demostracion: Veamos por ejemplo la propiedad c). Llamemos f (a + v) − f (a) − df (a)(v) g(a + v) − g(a) − dg(a)(v) E(v) = , F (v) = . kvk kvk Ambas funciones est´n definidas en un entorno de 0 y tienden a 0. Adem´s a a f (a + v) − f (a) = df (a)(v) + kvkE(v), g(a + v) − g(a) = dg(a)(v) + kvkF (v). Entonces (f g)(a + v) − (f g)(a) = f (a + v)g(a + v) − f (a)g(a + v) + f (a)g(a + v) − f (a)g(a) ° ¢ ° ¢ = f (a + v) − f (a) g(a + v) + f (a) g(a + v) − g(a) . Sustituimos f (a + v) − f (a), g(a + v) y g(a + v) − g(a) usando las igualdades anteriores. Al operar queda ° ¢ (f g)(a + v) − (f g)(a) − g(a)df (a) + f (a)dg(a) = df (a)(v)dg(a)(v) ° ¢ +kvk df (a)(v)F (v) + E(v)g(a) + E(v)dg(a)(v) + f (a)F (v) + kvk2 E(v)F (v). Hay que probar que el miembro derecho dividido entre kvk tiende a 0. El unico t´rmino para el que esto no es inmediato es ´ e df (a)(v)dg(a)(v) , kvk
  • 182.
    166 Cap´ ıtulo 4. C´lculo diferencial de varias variables a pero kdf (a)(v)dg(a)(v)k ≤ kdf (a)k kdg(a)k kvk2 , luego la norma del cociente est´ mayorada por a kdf (a)k kdg(a)k kvk, que tiende a 0. Veamos ahora la versi´n en varias variables de la regla de la cadena. o Teorema 4.10 (Regla de la cadena) Consideremos f : A ⊂ Rn −→ Rm y g : B ⊂ Rm −→ Rk de modo que f [A] ⊂ B. Si f es diferenciable en un punto a ∈ A y g es diferenciable en f (a), entonces f ◦ g es diferenciable en a y ° ¢ d(f ◦ g)(a) = df (a) ◦ dg f (a) . Demostracion: Llamemos h = f ◦ g y b = f (a). Dado un v ∈ Rn tal que ´ a + v ∈ A, tenemos h(a + v) − h(a) = g(f (a + v)) − g(f (a)) = g(b + u) − g(b), donde u = f (a + v) − f (a). Consideremos las funciones f (a + v) − f (a) − df (a)(v) g(b + u) − g(b) − dg(b)(u) E(v) = , F (u) = , kvk kuk definidas en un entorno de 0 y con l´ ımite 0. Se cumple ° ¢ h(a + v) − h(a) = dg(b)(u) + kukF (u) = dg(b) df (a)(v) + kvkE(v) + kukF (u) ≥ ° ¢¥ ° ¢ = df (a) ◦ dg f (a) (v) + kvk dg(b) E(v) + kukF (u). Basta probar que ° ¢ kuk l´ dg(b) E(v) + ım F (u) = 0, v→0 kvk para lo cual basta a su vez probar que la funci´n kuk/kvk est´ acotada en un o a entorno de 0. Ahora bien, ∞ ∞ kuk ∞df (a)(v) + kvkE(v)∞ = ≤ kdf (a)k + kE(v)k, kvk kvk y, como E tiende a 0 en 0, est´ acotada en un entorno de 0. a Como consecuencia, J(f ◦ g)(a) = Jf (a)Jg(f (a)). Equivalentemente, supongamos que tenemos una funci´n z = z(y1 , . . . , ym ), o donde a su vez yi = yi (x1 , . . . , xn ). Entonces la regla de la cadena nos dice que, si las funciones son diferenciables, ∇z t (x1 , . . . , xn ) = Jy(x1 , . . . , xn )∇z t (y1 , . . . , ym ),
  • 183.
    4.2. Propiedades delas funciones diferenciables 167 luego ∂z ∂z ∂y1 ∂z ∂ym = + ··· + . ∂xi ∂y1 ∂xi ∂ym ∂xi ´ Esta es la forma expl´ ıcita de la regla de la cadena. En otros t´rminos, si tenemos dz expresado como combinaci´n lineal de e o dy1 , . . . , dym y cada dyi como combinaci´n lineal de dx1 , . . . , dxn , es decir, o dz = (dy1 , . . . , dyn )∇z(y1 , . . . , ym )t , (dy1 , . . . , dyn ) = (dx1 , . . . , dxn )Jy(x1 , . . . , xn ), entonces, para expresar a dz como combinaci´n lineal de dx1 , . . . , dxn basta o sustituir el segundo grupo de ecuaciones en la primera, pues as´ obtenemos ı (dx1 , . . . , dxn )Jy(x1 , . . . , xn )∇z(y1 , . . . , ym )t = (dx1 , . . . , dxn )∇z t (x1 , . . . , xn ), es decir, dz(x1 , . . . , xn ). p Ejemplo Consideremos las funciones z = x2 + y 2 , x = ρ cos θ, y = ρ sen θ. Suponemos ρ > 0, con lo que (x, y) 6= (0, 0) y todas las funciones son diferen- ciables (ver el teorema 4.11, m´s abajo). Claramente a x y dz p = dx + p dy, x2 + y 2 x2 + y 2 dx = cos θ dρ − ρ sen θ dθ, dy = sen θ dρ + ρ cos θ dθ. Entonces ρ cos θ ° ¢ ρ sen θ ° ¢ dz = cos θ dρ − ρ sen θ dθ + sen θ dρ + ρ cos θ dθ = dρ, ρ ρ que es el mismo resultado que se obtiene si diferenciamos directamente la funci´n o compuesta z(ρ, θ) = ρ. Es importante comprender que el paso del primer grupo de ecuaciones a la expresi´n de dz en funci´n de ρ y θ no es una mera manipulaci´n algebraica, o o o sino que se fundamenta en la regla de la cadena. En este caso particular, lo que dice la regla de la cadena es: Si llamamos z(ρ, θ) a la funci´n que resulta de sustituir x e y en o z(x, y) por sus valores en funci´n de ρ y θ, entonces la diferencial o de esta funci´n es la que resulta de sustituir x, y, dx, dy en dz(x, y) o por sus valores en funci´n de ρ, θ, dρ, dθ, respectivamente. o Y esto no es evidente en absoluto. El teorema siguiente es el unico criterio de diferenciabilidad que necesitare- ´ mos en la pr´ctica: a
  • 184.
    168 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Teorema 4.11 Sea f : A ⊂ Rn −→ Rm , donde A es un abierto en Rn . Si f tiene derivadas parciales continuas en A entonces f es diferenciable en A. ´ Demostracion: Podemos suponer m = 1, pues si f tiene derivadas par- ciales continuas en A lo mismo vale para sus funciones coordenadas, y si ´stas e son diferenciables f tambi´n lo es. e Sea a ∈ A. Vamos a probar que f es diferenciable en a. Para ello basta probar que Pn f (a + v) − f (a) − Di f (a)vi i=1 l´ ım = 0, v→0 kvk lo que a su vez equivale a que, dado ≤ > 0, exista un δ > 0 de modo que si kvk < δ entonces Ø Ø Ø Ø Øf (a + v) − f (a) − P Di f (a)vi Ø < ≤kvk. n Ø Ø i=1 Por la continuidad de las derivadas parciales tenemos que existe un δ > 0 tal que si ky − ak < δ entonces y ∈ A y |Di f (y) − Di f (a)| < ≤/n para i = 1, . . . , n. Fijemos un v tal que kvk < δ. Definimos Fi = f (a1 + v1 , . . . , ai + vi , ai+1 , . . . , an ). En particular, vemos que f (a + v) = Fn y f (a) = F0 , luego Ø Ø Øn Ø Ø Ø Ø Ø Øf (a + v) − f (a) − P Di f (a)vi Ø = Ø P (Fi − Fi−1 − Di f (a)vi )Ø n Ø Ø Ø Ø i=1 i=1 P n ≤ |Fi − Fi−1 − Di f (a)vi |. i=1 As´ pues, (teniendo en cuenta que |vi | ≤ kvk) basta probar que ı ≤ |Fi − Fi−1 − Di f (a)vi | < |vi |, n para i = 1, . . . , n. Esto resulta de aplicar el teorema del valor medio a la funci´n o de una variable dada por gi (t) = f (a1 + v1 , . . . , ai−1 + vi−1 , ai + tvi , ai+1 , . . . , an ). Esta funci´n est´ definida en un intervalo abierto que contiene al intervalo o a [0, 1], y el hecho de que f tenga derivadas parciales implica que gi es derivable en su dominio. En particular es derivable en ]0, 1[ y continua en [0, 1]. Adem´s, a es claro que 0 gi (t) = Di f (a1 + v1 , . . . , ai−1 + vi−1 , ai + tvi , ai+1 , . . . , an )vi . El teorema del valor medio nos da que existe 0 < t0 < 1 tal que 0 Fi − Fi−1 = gi (1) − gi (0) = gi (t0 )(1 − 0).
  • 185.
    4.2. Propiedades delas funciones diferenciables 169 Notemos que y = (a1 + v1 , . . . , ai−1 + vi−1 , ai + t0 vi , ai+1 , . . . , an ) cumple ky − ak = k(v1 , . . . , vi−1 , t0 vi , 0, . . . , 0)k ≤ kvk < δ, luego ≤ |Fi − Fi−1 − Di f (a)vi | = |Di f (y) − Di f (a)| |vi | < |vi |, n como hab´ que probar. ıa Definici´n 4.12 Supongamos que una funci´n f : A ⊂ Rn −→ Rm admite o o derivada parcial respecto a una variable xi en todo el abierto A. Si a su vez la funci´n Di f admite derivada parcial respecto a la variable xj en A, a esta o derivada se la representa por Dij f . Tambi´n se usa la notaci´n e o ∂2f Dij f = . ∂xi ∂xj Cuando el ´ ındice es el mismo se escribe ∂2f Dii f = . ∂x2 i Las funciones Dij f se llaman derivadas segundas de f . M´s generalmente, la a funci´n Di1 ···ik f ser´ la funci´n que resulta de derivar f respecto de i1 , derivar o a o dicha parcial respecto a i2 , etc. Alternativamente, ∂kf , ∂xk11 · · · ∂xkrr i i donde k1 + · · · + kr = k, representar´ la funci´n que resulta de derivar k1 veces a o f respecto a i1 , luego k2 veces la funci´n resultante respecto a i2 , etc. Estas o funciones de llaman derivadas parciales de orden k de la funci´n f . o Diremos que f es de clase C k en A si existen todas sus derivadas parciales de orden k en A y todas ellas son continuas en A. En particular, las funciones de clase C 0 son las funciones continuas. Obviamente una funci´n es de clase C k+1 si y s´lo si todas sus derivadas o o parciales son de clase C k . El teorema anterior afirma que todas las funciones de clase C 1 son diferenciables. Si una funci´n f es de clase C 2 , entonces su o derivadas parciales son de clase C 1 , luego son diferenciables, luego son continuas y por lo tanto f es tambi´n de clase C 1 . Por el mismo argumento se prueba en e general que si k ≤ r entonces toda funci´n de clase C r es de clase C k . o Las reglas de derivaci´n justifican inmediatamente que la suma y el producto o por un escalar de funciones de clase C k es una funci´n de clase C k . El producto o de funciones de clase C k (con valores en R) es de clase C k . Lo mismo vale para el cociente si exigimos que el denominador no se anule. Ejercicio: Probar que la composici´n de dos funciones de clase C k es de clase C k . o Ahora vamos a probar un teorema muy importante sobre derivadas sucesivas, pues nos dice que el orden de derivaci´n no importa: o
  • 186.
    170 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Teorema 4.13 (Teorema de Schwarz) Si f : A ⊂ Rn −→ Rm es una funci´n o de clase C 2 en el abierto A, entonces Dij f (a) = Dji f (a). ´ Demostracion: No perdemos generalidad si suponemos m = 1. Tambi´n e podemos suponer que n = 2, pues en general podemos trabajar con la funci´n o F (xi , xj ) = f (a1 , . . . , xi , . . . , xj , . . . an ). As´ pues, probaremos que D12 f (a) = D21 f (a). Sea a = (a1 , a2 ). Considere- ı mos la funci´n o ∆f (h) = f (a1 + h, a2 + h) − f (a1 + h, a2 ) − f (a1 , a2 + h) + f (a1 , a2 ), definida en un entorno de 0. Vamos a probar que ∆f (h) D12 f (a) = l´ + ım . h→0 h2 Por simetr´ este l´ ıa ımite ser´ tambi´n D21 f (a) y el teorema estar´ probado. a e a Dado ≤ > 0, la continuidad de D12 f en a implica que existe un h0 > 0 tal que si 0 < k, k0 < h, entonces |D12 f (a1 + k, a2 + k0 ) − D12 f (a1 , a2 )| < ≤. Podemos tomar h0 suficientemente peque˜o para que si 0 < h < h0 la funci´n n o G(t) = f (t, a2 + h) − f (t, a2 ) est´ definida en el intervalo [a1 , a1 + h]. Por el teorema del valor medio existe e un n´mero 0 < k < h tal que u ∆f (h) = G(a1 + h) − G(a1 ) = hG0 (a1 + k) ° ¢ = h D1 f (a1 + k, a2 + h) − D1 f (a1 + k, a2 ) . Ahora aplicamos el teorema del valor medio a la funci´n o H(x) = D1 f (a1 + k, t) en el intervalo [a2 , a2 + h], que nos da un n´mero 0 < k0 < h tal que u D1 f (a1 + k, a2 + h) − D1 f (a1 + k, a2 ) = D12 f (a1 + k, a2 + k0 )h. En total tenemos que ∆f (h) = D12 f (a1 + k, a2 + k0 )h2 , luego Ø Ø Ø ∆f (h) Ø Ø Ø 0 Ø h2 Ø = |D12 f (a1 + k, a2 + k )| < ≤, siempre que 0 < h < h0 . El teorema de Schwarz implica claramente que al calcular cualquier derivada parcial de orden k de una funci´n de clase C k es irrelevante el orden en que o efectuemos las derivadas.
  • 187.
    4.2. Propiedades delas funciones diferenciables 171 Ahora vamos a encaminarnos a probar el teorema de la funci´n inversa. o Esencialmente se trata de probar que las inversas de las funciones biyectivas y diferenciables son diferenciables. La situaci´n es m´s complicada que en el caso o a de una variable, pues en el cap´ ıtulo anterior vimos que toda funci´n derivable o cuya derivada no se anula es mon´tona, mientras que no hay ning´n resultado o u an´logo para el caso de varias variables. Por ello vamos a necesitar varios a resultados previos. Entre otras cosas, nos apoyaremos en el concepto de extremo relativo y su relaci´n con la diferenciabilidad. La situaci´n en esto s´ es an´loga o o ı a a la de una variable. Definici´n 4.14 Sea f : A ⊂ Rn −→ R y a ∈ A. Diremos que f tiene un o m´ınimo relativo en a si existe un entorno G de a tal que para todo p ∈ G se cumple f (p) ≥ f (a). Similarmente se define un m´ximo relativo. Diremos que a a es un extremo relativo si es un m´ximo o un m´ a ınimo relativo. Teorema 4.15 Sea f : A ⊂ Rn −→ R una funci´n diferenciable en un punto o a ∈ A. Si f tiene un extremo relativo en a, entonces df (a) = 0. Demostracion: Sea v ∈ Rn y consideremos la funci´n φ(h) = f (a + hv), ´ o para un cierto vector v ∈ Rn , definida en un entorno de 0. Es claro que φ tiene un extremo relativo en 0. Sea g(h) = a + hv. Por la regla de la cadena ° ¢° ¢ 0 = φ0 (0) = dφ(0)(1) = df φ(0) dg(0)(1) = df (a)(v). Teorema 4.16 Sea f : Bδ (a) ⊂ Rn −→ Rn una aplicaci´n continua, diferen- o ciable en Bδ (a), y tal que para todo y ∈ Bδ (a) se cumpla |Jf (y)| 6= 0. Su- pongamos adem´s que para todo x ∈ ∂Bδ (a) se cumple f (x) 6= f (a). Entonces £ § a f Bδ (a) es un entorno de f (a). Demostracion: Sea g : ∂Bδ (a) −→ R la aplicaci´n definida mediante ´ o g(x) = kf (x) − f (a)k. Por compacidad alcanza su m´ınimo en un punto x. Por hip´tesis m = g(x) > 0. Tenemos, pues, que¢g(z) £≥ g(x), para todo z tal que o ° § kz − ak = δ. Vamos a probar que Bm/2 f (a) ⊂ f Bδ (a) . ° ¢ Sea y ∈ Bm/2 f (a) . Consideremos la funci´n h : Bδ (a) −→ R dada por o h(x) = kf (x) − yk. Por compacidad alcanza su m´ınimo en un punto z y, puesto que h(a) = kf (a) − yk < m/2, vemos que h(z) < m/2. Si x ∈ ∂Bδ (a), entonces m m m h(x) = kf (x) − yk ≥ kf (x) − f (a)k − kf (a) − yk > g(x) − ≥m− = , 2 2 2 luego h(x) no es el m´ ınimo de h. En otros t´rminos, z ∈ ∂Bδ (a), luego z ∈ Bδ (a) e / Es claro que h2 tambi´n alcanza su m´ e ınimo en z y n X h2 (x) = (fk (x) − yk )2 . k=1
  • 188.
    172 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Por consiguiente, n X Dj h2 (z) = 2(fk (z) − yk )Dj fk (z) = 0, k=1 ° ¢ pues z es un extremo. Matricialmente tenemos f (z) − y Jf (z)t £= 0 y § como el determinante de la matriz es no nulo por hip´tesis, y = f (z) ∈ f Bδ (a) . o Teorema 4.17 Sea f : A ⊂ Rn −→ Rn una aplicaci´n inyectiva, diferenciable o en el abierto A y tal que |Jf (x)| 6= 0 para todo x ∈ A. Entonces f es abierta, luego f : A −→ f [A] es un homeomorfismo. ´ Demostracion: Sea U un abierto en A. Veamos que f [U ] es abierto en Rn . Tomemos un punto a ∈ U y veamos que f [U ] es entorno de f (a). Existe un δ > 0 tal que Bδ (a) ⊂ U , y la restricci´n de f a esta bola cerrada est´ en las o £ § a hip´tesis del teorema anterior. Por consiguiente f Bδ (a) ⊂ f [U ] es un entorno o de f (a). Ahora ya podemos probar el teorema de la funci´n inversa. o Teorema 4.18 (Teorema de la funci´n inversa) Sea f : A ⊂ Rn −→ Rn o una funci´n inyectiva de clase C k , con k ≥ 1, en el abierto A y tal que se cumpla o |Jf (x)| 6= 0 para todo x ∈ A. Entonces B = f [A] es abierto y f −1 : B −→ A es de clase C k en B. Demostracion: Llamemos g = f −1 . Por el teorema anterior f y g son ´ homeomorfismos. Veamos que tiene g parciales continuas. Sea ei el i-´simo e vector de la base can´nica de Rn . Sea b ∈ B y a = g(b). Tomemos una bola o abierta Bη (a) ⊂ A y un α > 0 suficientemente peque˜o tal que el segmento de n extremos b y b + αei est´ contenido en f [Bη (a)]. Sea a0 = g(b + αei ). Entonces e a0 ∈ Bη (a), luego el segmento de extremos a y a0 est´ contenido en A. a Claramente f (a0 ) − f (a) = αei . Si fj es la j-´sima funci´n coordenada de e o f , tenemos fj (a0 ) − fj (a) = αδij , donde (δij ) es la matriz identidad. Aplicamos el teorema del valor medio a la ° ¢ funci´n φ(t) = fj a + t(a0 − a) , definida en [0, 1], en virtud del cual existe o 0 < t < 1 tal que ° ¢ αδij = φ(1) − φ(0) = dφ(t)(1) = dfj a + t(a0 − a) (a0 − a). Sea z j = a + t(a0 − a). As´ ı n X αδij = Dk fj (z j )(a0 − ak ). k k=1 Matricialmente tenemos ° ¢ αI = (a0 − a) Dk fj (z j ) .
  • 189.
    4.2. Propiedades delas funciones diferenciables 173 Ø Ø La funci´n h : An −→ R dada por h(z 1 , . . . , z n ) = Ø(Dk fj (z j ))Ø es continua, o pues las derivadas parciales son continuas y el determinante es un polinomio. Por hip´tesis tenemos que h(a, . . . , a) 6= 0, luego existe un entorno de (a, . . . , a) o en el cual h no se anula. Tomando α suficientemente peque˜o podemos exigirn que (a0 , . . . , a0 ) est´ en una bola de centro (a, . . . , a) contenida en dicho entorno, e con lo que el punto (z 1 , . . Ø , z n ) que hemos construido tambi´n est´ en dicho Ø . e a entorno, luego Ø(Dk fj (z j ))Ø 6= 0 y podemos calcular la matriz inversa, cuyos coeficientes se expresan como un cociente de determinantes de matrices cuyos coeficientes son derivadas parciales. En definitiva obtenemos una expresi´n de o la forma ° ¢ a0 − ak k Pk Dk fj (z j ) = ° ¢, α Qk Dk fj (z j ) donde Pk y Qk son polinomios. Por definici´n de a y a0 tenemos o ° ¢ gk (b + αei ) − gk (b) Pk Dk fj (z j ) = ° ¢. α Qk Dk fj (z j ) Tomando α suficientemente peque˜o podemos conseguir que kz i − ak se n haga arbitrariamente peque˜o. Por la continuidad de las derivadas parciales n podemos exigir que |Dk fj (z j )−Dk fj (a)| se haga arbitrariamente peque˜o y por n la continuidad de los polinomios Pk y Qk podemos hacer que el miembro derecho de la ecuaci´n anterior se aproxime cuanto queramos al t´rmino correspondiente o e con a en lugar de los puntos z i . En definitiva, existe ° ¢ gk (b + αei ) − gk (b) Pk Dk fj (g(b)) Di gk (b) = l´ ım = ° ¢. α→0 α Qk Dk fj (g(b)) M´s a´n, los polinomios Pk y Qk son los que expresan las soluciones de una a u ecuaci´n lineal en t´rminos de sus coeficientes, luego no dependen de b, luego esta o e expresi´n muestra tambi´n que Di gk es una composici´n de funciones continuas, o e o luego es continua. M´s en general, si f es de clase C k , entonces g tambi´n lo a e es. Si f est´ en las condiciones del teorema anterior tenemos que f ◦ f −1 = a −1 f ◦ f = 1, luego por la regla de la cadena df (a) ◦ df −1 (b) = df −1 (b) ◦ df (a) = 1, luego las dos diferenciales son biyectivas y df −1 (b) = df (a)−1 . Equivalentemente, si yi (x1 , . . . , xn ) es una transformaci´n biyectiva y dife- o renciable con determinante jacobiano no nulo y llamamos xi (y1 , . . . , yn ) a la funci´n inversa, entonces el sistema de ecuaciones o ∂y1 ∂y1 dy1 = dx1 + · · · + dxn ∂x1 ∂xn . . . . . . . . . ∂yn ∂yn dyn = dx1 + · · · + dxn ∂x1 ∂xn
  • 190.
    174 Cap´ ıtulo 4. C´lculo diferencial de varias variables a tiene por matriz de coeficientes a la matriz jacobiana de la transformaci´n, o luego podemos despejar dx1 , . . . , dxn en funci´n de dy1 , . . . , dyn y as´ obtenemos o ı precisamente la diferencial de la funci´n inversa. o Ejemplo Como ya advert´ ıamos, al contrario de lo que sucede en una variable, el hecho de que una aplicaci´n tenga diferencial no nula en todo punto (o incluso o determinante jacobiano no nulo) no garantiza que sea biyectiva. Por ejemplo, consideremos f (x, y) = (ex cos y, ex sen y) (vista como aplicaci´n de C en C, se o trata simplemente de la exponencial compleja). La matriz jacobiana de f es µ ∂ ex cos y ex sen y −ex sen y ex cos y y su determinante en cada punto (x, y) es ex 6= 0. Por otro lado es f´cil ver que a f no es biyectiva. Lo m´ximo que podemos deducir del hecho de que el determinante jacobiano a no se anule es que la funci´n es localmente inyectiva. La prueba se basa en un o argumento que hemos usado en la prueba del teorema de la funci´n inversa. o Teorema 4.19 (Teorema de inyectividad local) Sea f : A ⊂ Rn −→ Rn una funci´n de clase C 1 en el abierto A y sea a ∈ A tal que |Jf (a)| 6= 0. o Entonces existe un entorno B de a tal que |Jf (x)| 6= 0 para todo x ∈ B y f es inyectiva sobre B. Demostracion: La funci´n h : An −→ R dada por ´ o Ø Ø h(z , . . . , z n ) = Ø(Dk fj (z j ))Ø 1 es continua, pues las derivadas parciales son continuas y el determinante es un polinomio. Por hip´tesis tenemos que h(a, . . . , a) 6= 0, luego existe un entorno o de (a, . . . , a) en el cual h no se anula. Este entorno lo podemos tomar de la forma Bδ (a) × · · · × Bδ (a). Tomaremos B = Bδ (a). Veamos que si x, y ∈ Bδ (a) y f (x) = f (y) entonces x = y. Consideremos la funci´n φ(t) = fi (x + t(y − x)), definida en [0, 1]. Claramente es derivable. Por o el teorema del valor medio, fi (y) − fi (x) = dφ(ti )(1) = dfi (x + ti (y − x))(y − x) = dfi (z i )(y − x), donde z i es un punto entre x e y, luego z i ∈ Bδ (a). Por lo tanto n X fi (y) − fi (x) = Dk fi (z i )(yk − xk ), k=1 lo que matricialmente se expresa como 0 = f (y) − f (x) = (y − x)(Dk fi (z i )). La matriz tiene determinante h(z 1 , . . . , z n ) 6= 0, luego ha de ser x = y. Para terminar generalizamos a varias variables un hecho que tenemos pro- bado para el caso de una:
  • 191.
    4.3. Curvas parametrizables 175 Teorema 4.20 Si f : A ⊂ Rn −→ Rm es una funci´n diferenciable en un o abierto conexo A y df = 0, entonces f es constante. ´ Demostracion: Podemos suponer m = 1. Dados dos puntos a, b ∈ A, existe una poligonal contenida en A con extremos a y b. Basta probar que f toma el mismo valor en los v´rtices de la poligonal, luego en definitiva basta e probar que si a y b son los extremos de un segmento contenido en A entonces f (a) = f (b). Consideramos la funci´n φ(t) = f (a + t(b − a)) en [0, 1] y le o aplicamos el teorema del valor medio. Concluimos que f (b) − f (a) = φ0 (t) = df (a + t(b − a))(b − a) = 0. 4.3 Curvas parametrizables Las t´cnicas de este cap´ e ıtulo nos capacitan para estudiar curvas m´s efi- a cientemente que las del cap´ ıtulo anterior. En efecto, all´ estudi´bamos curvas ı a consider´ndolas como gr´ficas de funciones de una variable, pero esto no per- a a mite trabajar con curvas cualesquiera. Por ejemplo, una elipse no es la gr´fica a de ninguna funci´n. Ahora podemos aplicar la derivabilidad al estudio de curvas o en el sentido de aplicaciones x : I −→ Rn , donde I es un intervalo en R. Para que una tal aplicaci´n x pueda ser llamada “curva” razonablemente, debere- o mos exigir al menos que sea continua. Aqu´ nos centraremos en las curvas que ı adem´s son derivables. Si una curva est´ definida en un intervalo cerrado [a, b], a a exigiremos que sea derivable en ]a, b[. A estas curvas las llamaremos arcos. Si x : [a, b] −→ Rn , los puntos x(a) y x(b) se llaman extremos del arco. Concreta- mente, x(a) es el extremo inicial y x(b) es el extremo final. La gr´fica de una a ° ¢ funci´n continua f : [a, b] −→ R puede identificarse con el arco x(t) = t, x(t) . o De este modo, el tratamiento de los arcos que estamos dando aqu´ generaliza al ı del cap´ ıtulo anterior. Seg´n lo dicho, una curva no es un mero conjunto de puntos en Rn , sino un u conjunto de puntos recorridos de un modo en concreto. Si x(t) es una curva, la variable t se llama par´metro de la misma. Conviene imaginarse a t como una a variable temporal, de modo que x(t) es la posici´n en el instante t de un punto o m´vil que recorre la curva. La imagen de x es la trayectoria del m´vil. o o Vamos a interpretar la derivabilidad de una curva x(t) en un punto t. Si existe x0 (t) = v 6= 0, entonces para valores peque˜os de h tenemos n x(t + h) − x(t) ≈ v, (4.1) h luego x(t+h) ≈ x(t)+hv. La curva x(t)+hv, cuando var´ h, recorre los puntos ıa de una recta, y estamos diciendo que para valores peque˜os de h la curva x se n parece a dicha recta. As´ pues, la recta de direcci´n x0 (t) se confunde con la ı o curva alrededor de x(t), y por ello la llamamos recta tangente a x en x(t). Esto
  • 192.
    176 Cap´ ıtulo 4. C´lculo diferencial de varias variables a interpreta la direcci´n de x0 (t). Es f´cil ver que su sentido es el sentido de avance o a al recorrer la curva. Observemos que si f : I −→ R es una funci´n derivable en ° ¢ o un punto t, entonces la tangente del arco x(t) = t, f (t) es la recta de direcci´n ° ¢ o 1, f 0 (t) , luego su pendiente es f 0 (t), luego coincide con la tangente tal y como la definimos en el cap´ ıtulo anterior. Ya tenemos interpretados la direcci´n y el sentido de x0 (t). Falta interpretar o su m´dulo. Claramente se trata del l´ o ımite del m´dulo de (4.1). La cantidad o kx(t + h) − x(t)k es la distancia que recorremos en h unidades de tiempo desde el instante t, luego al dividir entre |h| obtenemos la distancia media recorrida por unidad de tiempo en el intervalo de extremos t y t + h, es decir, la velocidad media en dicho intervalo. El l´ ımite cuando h → 0 es, pues, la velocidad con que recorremos la curva en el instante t. En realidad los f´ ısicos prefieren llamar velocidad a todo el vector x0 (t), de modo que la direcci´n indica hacia d´nde o o nos movemos en el instante t y el m´dulo indica con qu´ rapidez lo hacemos. o e Conviene precisar estas ideas. La primera ley de Newton afirma que si un cuerpo est´ libre de toda acci´n externa, permanecer´ en reposo o se mover´ en a o a a l´ ınea recta a velocidad constante. Todo esto se resume en que su velocidad en sentido vectorial permanece constante. Ejemplo Consideremos la curva x(t) = (cos t, sen t), definida en el intervalo [0, +∞[. Esta curva recorre infinitas veces la circunferencia de centro (0, 0) y radio 1. Su velocidad es x0 (t) = (− sen t, cos t), cuyo m´dulo es constante igual a o 1, esto significa que recorremos la circunferencia a la misma velocidad, digamos de un metro por segundo. Para que un objeto siga esta trayectoria es necesario que una fuerza lo obligue a mantenerse a la misma distancia del centro. Por ejemplo, el m´vil podr´ ser un cuerpo que gira atado a una cuerda. El hecho o ıa de que x0 (2π) = (0, 1) significa que si en el instante 2π se cortara la cuerda entonces el cuerpo, libre ya de la fuerza que le reten´ saldr´ despedido hacia ıa, ıa arriba a raz´n de un metro por segundo. o Consideremos ahora la curva x(t) = (cos t2 , sen t2 ). Su trayectoria es la misma, pero ahora la velocidad es x0 (t) = (−2t sen t2 , 2t cos t2 ), cuyo m´dulo es o 2t, lo que significa que ahora el m´vil gira cada vez m´s r´pido. Comienza a o a a velocidad 0, al dar una vuelta alcanza la velocidad de 2 metros por segundo, a la segunda vuelta de 4, etc. Las consideraciones anteriores muestran que la derivabilidad de una curva se traduce en la existencia de una recta tangente salvo que la derivada sea nula. La existencia de una recta tangente en x(t) significa que el arco se confunde con una recta alrededor de x(t), con lo que el arco no puede formar un “pico” en x(t). Esto ya no es cierto si x0 (t) = 0. Por ejemplo, la curva x(t) = (t3 , |t3 |) es derivable en 0, pues su derivada por la izquierda coincide con la de (t3 , −t3 ) y su derivada por la derecha coincide con la de (t3 , −t3 ), y ambas son nulas, pero su gr´fica es la misma que la de (t, |t|), es decir, la de la funci´n |x|, que tiene a o un pico en 0. Esto nos lleva a descartar las curvas con derivada nula.
  • 193.
    4.3. Curvas parametrizables 177 Definici´n 4.21 Una curva parametrizada regular x : I −→ Rn es una apli- o caci´n definida sobre un intervalo abierto I ⊂ R derivable y con derivada no o nula en ning´n punto. u El vector x0 (t) T (t) = kx0 (t)k se llama vector tangente a x en el punto x(t). La recta que pasa por x(t) con direcci´n T (t) se llama recta tangente a x por x(t). o Hemos visto un ejemplo de una misma trayectoria recorrida a velocidades distintas. Desde un punto de vista geom´trico, lo que importa de una curva e es su forma, y no la velocidad con la que se recorre. Vamos a explicitar esta distinci´n. o Dado un arco parametrizado x : [a, b] −→ Rn , un cambio de par´metro es a una aplicaci´n t : [u, v] −→ [a, b] que se extiende a un intervalo abierto mayor o donde es derivable y la derivada no se anula. Por consiguiente t es biyectiva y t0 tiene signo constante. Diremos que t es un cambio de par´metro directo o a inverso seg´n si t0 > 0 o t0 < 0. El arco parametrizado y(s) = x(t(s)) se llama u reparametrizaci´n de x mediante el cambio de par´metro t. o a Diremos que dos arcos parametrizados regulares x e y son (estrictamente) equivalentes si existe un cambio de par´metro (directo) que transforma uno en a otro. Es claro que la identidad es un cambio de par´metro directo, la inversa a de un cambio de par´metro (directo) es un cambio de par´metro (directo) y la a a composici´n de dos cambios de par´metro (directos) es un cambio de par´metro o a a (directo). De aqu´ se sigue que la equivalencia y la equivalencia estricta son ı relaciones de equivalencia entre los arcos parametrizados. Llamaremos arcos regulares a las clases de equivalencia estricta de arcos parametrizados regulares, de modo que dos elementos de la misma clase se considerar´n dos parametrizaciones de un mismo arco. a Todas las parametrizaciones de un arco tienen la misma imagen, a la que podemos llamar imagen del arco. Los cambios de par´metro directos son cre- a cientes, por lo que dos parametrizaciones de un mismo arco tienen los mismos extremos, a los que podemos llamar extremos del arco. Consideremos dos parametrizaciones x : [a, b] −→ Rn , y : [c, d] −→ Rn de un mismo arco. Entonces y(s) = x(t(s)) para un cierto cambio de par´metro a directo t. Consideremos ahora dos cambios de par´metro inversos a u : [a0 , b0 ] −→ [a, b], v : [c0 , d0 ] −→ [c, d] y las reparametrizaciones x(u(r)), y(v(r)). Entonces y(v(r)) = x(t(v(r)) = x(u(u−1 (t(v(r)))) y v ◦ t ◦ u−1 es un cambio de par´metro directo, luego las a dos reparametrizaciones corresponden a un mismo arco. Por lo tanto, podemos definir el arco inverso de un arco x al arco resultante de componer con un cambio de par´metro inverso cualquiera de las parametrizaciones de x. Lo a
  • 194.
    178 Cap´ ıtulo 4. C´lculo diferencial de varias variables a representaremos por −x. Es claro que x y −x tienen la misma imagen, pero el extremo inicial de x es el extremo final de −x y viceversa. De este modo, la noci´n de arco como clase estricta de arcos parametrizados o recoge el concepto geom´trico de arco regular independiente del modo en que e se recorre, pero conservando el sentido del recorrido. Si consideramos clases no estrictas identificamos cada arco con su inverso, y con ello hacemos abstracci´n o incluso del sentido en que lo recorremos. Todos estos conceptos se aplican igualmente a curvas cualesquiera. Longitud de un arco Consideremos el arco x(t) = (r cos t, r sen t), con r > 0. Su derivada tiene m´dulo r, lo que se interpreta como que el arco recorre la cir- o cunferencia de centro (0, 0) y radio r a una velocidad constante de r unidades de longitud por unidad de tiempo. Puesto que recorre la circunferencia completa en 2π unidades de tiempo, concluimos que el espacio que recorre, es decir, la longitud de la circunferencia, es 2πr. M´s en general, mediante esta parame- a trizaci´n recorremos un arco de α radianes en α unidades de tiempo, luego la o longitud de un arco de α radianes es αr, tal y como anticip´bamos en el cap´ a ıtulo anterior. Vamos a generalizar este argumento para definir la longitud de un arco arbitrario. Sea x : [a, b] −→ Rn un arco y vamos a definir la funci´n s : [a, b] −→ R o tal que s(t) es la longitud de arco entre x(a) y x(t). Obviamente ha de cumplir s(a) = 0. Supongamos que es derivable y vamos a calcular su derivada en un punto t. El arco x se confunde con una recta alrededor de x(t). Esto significa que si h es suficientemente peque˜o el arco entre x(t) y x(t + h) es indistinguible n del segmento que une ambos puntos, luego tendremos s(t + h) − s(t) ≈ ±kx(t + h) − x(t)k, donde el signo es el de h. La aproximaci´n ser´ mejor cuanto menor sea h. o a Dividiendo entre h queda ∞ ∞ s(t + h) − s(t) ∞ x(t + h) − x(t) ∞ ∞ ∞. ≈∞ ∞ h h Estos dos cocientes se parecer´n m´s cuanto menor sea h, lo que se traduce a a en que los l´ ımites cuando h → 0 han de coincidir. As´ ı: ds = kx0 (t)k, (4.2) dt luego Z t s(t) = kx0 (u)k du. a En particular, la longitud del arco completo ser´ a Z b L(x) = kx0 (t)k dt. a
  • 195.
    4.3. Curvas parametrizables 179 Definici´n 4.22 Diremos que un arco parametrizado regular x : [a, b] −→ Rn o es rectificable si la funci´n kx0 (t)k tiene primitiva en [a, b] (es decir, si tiene o primitiva en el intervalo abierto y ´sta se extiende continuamente al intervalo e cerrado), y entonces llamaremos longitud de x al n´mero real u Z b L(x) = kx0 (t)k dt. a Notar que como el integrando es positivo, su primitiva ha de ser estricta- mente creciente, luego L(x) > 0. La longitud de un arco parametrizado coincide con la de cualquiera de sus reparametrizaciones. En efecto, si y(s) = x(t(s)), entonces y 0 (s) = x0 (t(s))t0 (s), luego Z b Z s(b) Z s(b) L(x) = kx0 (t)k dt = kx0 (t(s))kt0 (s) ds = ky 0 (s)k ds = L(y). a s(a) s(a) Ejercicio: Comprobar que la longitud de un arco coincide con la de su opuesto, y que la longitud es invariante por isometr´ ıas. Ahora es inmediato comprobar que la longitud de un arco de circunferencia de radio r y amplitud α es α. En particular la longitud de una circunferencia de radio r es 2πr. De hecho, los griegos llamaron π a esta constante por ser la proporci´n entre el per´ o ımetro de la circunferencia y su di´metro. a Sea x : [a, b] −→ Rn un arco rectificable y sea s(t) la longitud de arco entre x(a) y x(t). Hemos visto que se trata de una funci´n derivable y que s0 (t) = o kx0 (t)k. Por lo tanto s es creciente y biyectiva. Su inversa t : [0, L] −→ [a, b] es un cambio de par´metro, la funci´n x(s) = x(t(s)) es una reparametrizaci´n a o o del arco y x0 (t) x0 (s) = x0 (t)t0 (s) = 0 , kx (t)k luego kx0 (s)k = 1 y as´ x0 (s) = T (s). M´s concretamente, x(s) se caracteriza ı a por que la longitud de arco entre x(0) y x(s) es s. A esta parametrizaci´n o del arco la llamaremos parametrizaci´n natural. Tambi´n diremos entonces o e que x est´ parametrizado por el arco Desde un punto de vista cinem´tico, la a a parametrizaci´n natural se interpreta como la que recorre el arco a velocidad o constante igual a 1 (constante en m´dulo). o Ejemplo La trayectoria de un clavo de una rueda que gira se conoce con el nombre de cicloide. Vamos a calcular la longitud de una vuelta de cicloide. Primeramente necesitamos encontrar una parame- trizaci´n de la curva. Supongamos que la rueda gira o y sobre el eje y = 0 y que el clavo parte de la posici´n o (0, 0). Si llamamos r al radio de la circunferencia, ve- t mos que cuando la rueda ha girado t radianes su centro r se encuentra en el punto (rt, r), luego el clavo se en- x rt cuentra en x(t) = (rt − r sen t, r − r cos t).
  • 196.
    180 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Por consiguiente x0 (t) = r(1 − cos t, − sen t), √ t kx0 (t)k = r 2 − 2 cos t = 2r sen . 2 Vemos que los m´ltiplos de 2π son puntos singulares de la cicloide. Corres- u ponden a los momentos en que el clavo toca el suelo. Entonces se para y cambia de sentido. Es f´cil calcular a Z 2π ∑ ∏2π t t L= 2r sen dt = 4r − cos = 8r. 0 2 2 0 Ejercicio: Calcular la longitud de la astroide, dada por x(t) = (a cos3 t, a sen3 t). Ejemplo La trayectoria de un clavo de una rueda que gira sobre una circun- ferencia se llama epicicloide. El caso m´s simple lo tenemos cuando ambas a circunferencias tienen el mismo radio. La curva se llama entonces cardioide, porque su forma recuerda a un coraz´n. o Supongamos que la circunferencia fija tiene centro en (a/4, 0) y radio a/4 y que el clavo parte θ de la posici´n (0, 0). Cuando la rueda ha girado α o ρ α radianes la situaci´n es la que indica la figura. El o cuadril´tero tiene dos ´ngulos y dos lados iguales, a a por lo que los otros dos ´ngulos tambi´n tienen la a e θα misma amplitud θ. Es claro entonces que a a ρ= + 2 cos θ, 2 4 luego a ρ= (1 + cos θ), 2 ´ donde θ ∈ ]−π, π[. Esta es la ecuaci´n de la cardioide en coordenadas polares. o
  • 197.
    4.3. Curvas parametrizables 181 Vamos a ver en general cu´l es la ° a expresi´n¢de la longitud de una curva o parametrizada en coordenadas polares ρ(t), θ(t) . Notemos que (4.2), para el caso de dos variables puede escribirse tambi´n como e ds2 = dx2 + dy 2 . Se dice que ´sta es la expresi´n del elemento de longitud (es decir, de una e o longitud infinitesimal) en coordenadas cartesianas. Se trata de la versi´n infi- o nitesimal del teorema de pit´goras. Si diferenciamos las relaciones x = ρ cos θ, a y = ρ sen θ obtenemos dx = cos θ dρ − ρ sen θ dθ, dy = sen θ dρ + ρ cos θ dθ. Sustituyendo queda ds2 = dρ2 + ρ2 dθ2 . (4.3) ´ Esta es la expresi´n del elemento de longitud de un arco en coordenadas o polares. Aplicado a la cardioide resulta a2 a2 ds2 = + cos θ dθ2 , 4 4 de donde θ ds = a cos dθ. 2 As´ pues, la longitud de la cardioide es ı Z π ∑ ∏π θ θ L= a cos dθ = 2a sen = 4a. −π 2 2 −π
  • 198.
    182 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Ejemplo Consideremos un cuerpo puntual situado en (l, 0) atado a una cuerda de longitud l con su otro ex- tremo en (0, 0). Estiramos de la cuerda de modo que su extremo suba por el eje Y . La trayectoria del cuerpo arrastrado por la cuerda recibe el nombre de tractriz. Vamos a obtener una parametrizaci´n de la tractriz. Un o cuerpo estirado por una cuerda se mueve en la direcci´n o de la cuerda, luego ´sta ha de ser tangente a la trayec- e toria. Si llamamos y = f (x) a la tractriz, definida para 0 < x < l, entonces su recta tangente es Y = f (x) + f 0 (x)(X − x). ° ¢ a ´ Cortar´ al eje Y en el punto 0, f (x) − f 0 (x)x . Este es el punto donde est´ a ° ¢ el extremo de la cuerda cuando el otro extremo est´ en x, f (x) . La distancia a entre ambos debe ser, pues, igual a l. Por consiguiente: x2 + f 0 (x)2 x2 = l2 . Despejando obtenemos r l2 dy = − − 1 dx. x2 El signo negativo se debe a que, tal y como hemos planteado el problema, la funci´n y ha de ser decreciente. El cambio x = l sen θ biyecta los n´meros o u 0 < x ≤ l con los n´meros π/2 ≤ θ < π. La igualdad anterior se transforma en u r 1 cos2 θ l dθ dy = −l 2θ − 1 cos θ dθ = l dθ = − l sen θ dθ. sen sen θ sen θ La posici´n inicial corresponde a x = l, luego a θ = π/2, es decir, y(π/2) = 0, o luego Z θ Z θ dt y(θ) = l −l sen t dt. π/2 sen t π/2 Existen reglas de integraci´n que permiten calcular met´dicamente la pri- o o mera primitiva. Como no nos hemos ocupado de ellas nos limitaremos a dar el resultado. El lector puede comprobar sin dificultad que es correcto derivando la soluci´n que presentamos. o ∑ ∏θ t θ θ y(θ) = l log tan + l [cos t]π/2 = l log tan + l cos θ. 2 π/2 2 As´ pues, la tractriz viene dada por ı θ T (θ) = (l sen θ, l log tan + l cos θ), θ ∈ [π/2, π[ . 2
  • 199.
    4.3. Curvas parametrizables 183 Su derivada es µ ∂ 0 cos2 θ cos θ T (θ) = l cos θ, l , kT 0 (θ)k = −l . sen θ sen θ La tractriz es regular en ]π/2, π[. La longitud de un arco de tractriz es Z θ cos t s(θ) = −l dt = −l [log sen t]θ = −l log sen θ. π/2 π/2 sen t Vector normal y curvatura Sea x(s) un arco parametrizado por la longitud de arco. Supongamos que admite derivada segunda. Derivando la igualdad x0 (s)x0 (s) = 1 obtenemos que 2x00 (s)x0 (s) = 0, luego x00 (s) ⊥ x0 (s). Supuesto que x00 (s) 6= 0 podemos definir el vector normal del arco como x00 (s) N (s) = , kx00 (s)k y la curvatura del arco como κ(s) = kx00 (s)k. Para interpretar la curvatura llamemos ∆θ al ´ngulo entre los vectores x0 (s) a y x0 (s + ∆s), donde ∆θ es una funci´n de ∆s. Puesto que x0 tiene m´dulo o o constante igual a 1, la trigonometr´ nos da que ıa ∆θ kx0 (s + ∆s) − x0 (s)k = 2 sen . 2 sen(∆θ/2) 2 Por consiguiente, kx0 (s + ∆s) − x0 (s)k sen ∆θ ∆θ 2 = . |∆s| ∆θ/2 |∆s| Es claro que ∆θ → 0 cuando ∆s → 0, luego ∆θ κ(s) = l´ ım . ∆s→0 |∆s| As´ pues, la curvatura mide la variaci´n del ´ngulo del vector tangente por ı o a unidad de arco recorrido. Es claro que cuanto mayor sea la curvatura “m´s a curvado” estar´ el arco. a Ejemplo La parametrizaci´n natural de una circunferencia de radio r es ° o ¢ x(s) = r cos(s/r), r¢sen(s/r) . El vector tangente es, por lo tanto, x0 (s) = ° − sen(s/r), cos(s/r) . De aqu´ obtenemos ı µ ∂ 00 1 s 1 s x (s) = − cos , − sen , r r r r
  • 200.
    184 Cap´ ıtulo 4. C´lculo diferencial de varias variables a ° ¢ con lo que el vector normal es N (s) = − cos(s/r), sen(s/r) y la curvatura es κ(s) = 1/r. Intuitivamente es claro que una circunferencia est´ menos curvada a cuanto mayor es su radio, tal y como se pone de manifiesto en la f´rmula que o hemos obtenido. Dada una curva x de curvatura no nula en un punto dado x(s), la circunfe- rencia de radio r = 1/κ(s) y centro x(s) − κN (n) pasa por x(s) y tiene el mismo vector tangente, el mismo vector normal y la misma curvatura en este punto. Esto hace que sea la circunferencia que m´s se parece a x en un entorno de x(s) a y se la llama circunferencia osculatriz a x por x(s). El radio r(s) = 1/κ(s) se llama radio de curvatura de x en x(s). Veamos ahora f´rmulas expl´ o ıcitas para calcular el vector normal y la curva- tura cuando la parametrizaci´n no es la natural. Conviene usar el lenguaje de la o cinem´tica. Supongamos que x(t) representa la posici´n de un m´vil puntual en a o o funci´n del tiempo. Llamaremos x(s) a la parametrizaci´n natural. Entonces la o o velocidad del m´vil es V = x0 (t). Si llamamos v = kvk, entonces sabemos que o v = s0 (t), con lo que v es la velocidad sobre la trayectoria, que mide la distancia recorrida por unidad de tiempo. Adem´s V = x0 (t) = x0 (s)s0 (t), es decir, a V = vT. Se define el vector aceleraci´n como A = V 0 = X 00 (t). Derivando en la o relaci´n anterior tenemos o A = v 0 (t)T (t) + v(t)T 0 (t). Llamaremos a(t) = v 0 (t), que es la aceleraci´n sobre la trayectoria, es decir la o variaci´n de la velocidad sobre la trayectoria por unidad de tiempo. Aplicando o la regla de la cadena a T (t) = T (s(t)) obtenemos T 0 (t) = T 0 (s)s0 (t) = κvN , luego v2 A = aT + κv 2 N = aT + N. r Vemos, pues, que la aceleraci´n se descompone de forma natural en una o componente tangencial, que mide la variaci´n del m´dulo de la velocidad, y una o o componente normal, que determina la curvatura. Ahora multiplicamos esta igualdad por s´ misma: kAk2 = a2 + κ2 v 4 , de ı donde kAk2 − a2 κ2 = . v4 Ahora bien, VV0 VV0 a = v 0 = kV k0 = = , kV k v luego kAk2 v 2 − (V V 0 )2 kV ∧ Ak2 κ2 = 6 = , v v6 lo que nos da kV ∧ Ak κ= . v3
  • 201.
    4.3. Curvas parametrizables 185 Las dos ultimas igualdades suponen que la imagen de x est´ en R3 . En el ´ a lenguaje geom´trico hemos obtenido las f´rmulas siguientes: e o x0 kx0 k2 x00 − (x0 x00 )x0 kx0 ∧ x00 k T = , N= , κ= (4.4) kx0 k kx0 k kx0 ∧ x00 k kx0 k3 . En el caso de curvas planas es conveniente modificar como sigue el vector normal y la curvatura. Fijada una orientaci´n en el plano, definimos el vector o normal de una curva x(s) parametrizada por el arco como el vector unitario N (s) ° ¢ que es perpendicular a T (s) y de modo que la base T (s), N (s) est´ orientada e positivamente. Esta definici´n puede diferir de la anterior en cuanto al signo o de N (s), por lo que redefinimos la curvatura de modo que x00 (s) = κ(s)N (s). Notemos que ahora el vector normal est´ definido incluso en los puntos donde a la curvatura es nula. Con el convenio usual de orientaci´n, el vector N apunta hacia la izquierda si o miramos en el sentido de T . La curvatura es positiva si cuando la curva avanza se desv´ hacia la izquierda y negativa si se desv´ hacia la derecha (o nula si no ıa ıa se desv´ ıa). Diremos que la curva gira en sentido positivo o en sentido negativo seg´n el signo de su curvatura. El sentido de giro positivo es el contrario a las u agujas del reloj. De este modo, la orientaci´n distingue los dos sentidos de giro. o Vector binormal y torsi´n La teor´ de curvas en R3 se completa con la o ıa introducci´n del vector binormal y la torsi´n. El vector binormal de una curva o o x(s) tres veces derivable en un punto de curvatura no¢nula es B(s) = T (s)∧N (s). ° La base formada por los vectores T (s), N (s), B(s) se conoce como triedro de Frenet. Definimos la torsi´n de x en cada punto como τ (s) = −N 0 (s)B(s). o Para interpretar la torsi´n empezaremos por determinar N 0 . Digamos que o N 0 = aT + bN + cB. (4.5) Multiplicando por T obtenemos c = N 0 T , y como T N = 0, derivando resulta T 0 N + T N 0 = 0, luego c = −T 0 N = −κN N = −κ. Si multiplicamos (4.5) por N resulta b = N 0 N , pero al derivar en N N = 1 resulta 2N N 0 = 0, luego b = 0. Por ultimo, es claro que c = N 0 B = −τ . Por ´ consiguiente N 0 = −κT − τ B. La misma t´cnica nos da una expresi´n para B 0 . Sea B 0 = aT + bN + cB. e o Multiplicando por T obtenemos a = T B 0 , pero de BT = 0 se concluye que T B 0 = −T 0 B = −κN B = 0. Similarmente b = N B 0 = −N 0 B = τ . Al multiplicar por B llegamos a c = B 0 B = 0, pues BB = 1. Tenemos as´ las llamadas f´rmulas de Frenet: ı o T0 = κN, N0 = −κT − τ B, B0 = τ N.
  • 202.
    186 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Vemos que si τ = 0 en todo punto entonces B es constante, luego (xB)0 = 0 x B = T B = 0 implica que xB es constante, luego x est´ contenido en un plano a perpendicular a B, luego la curva es plana. El rec´ ıproco es claro. As´ pues, ı las curvas sin torsi´n son exactamente las curvas planas. En general, el plano o x(s)+hT (s), N (s)i recibe el nombre de plano osculante a la curva. Si la curva es plana, su plano osculante es el mismo en todo punto, y la curva est´ contenida a en ´l. En caso contrario, puede probarse que el plano osculante en un punto es e el plano m´s pr´ximo a la curva en un entorno del punto. La tercera f´rmula a o o de Frenet muestra que la torsi´n mide la rapidez con que var´ B o, lo que es o ıa lo mismo, la rapidez con la que var´ el plano osculante. ıa A continuaci´n derivamos una f´rmula expl´ o o ıcita para la torsi´n de una curva. o Si x est´ parametrizada por la longitud de arco, entonces a x00 x000 κ − x00 κ0 N= , N0 = . κ κ2 luego, 1 (x0 ∧ x00 )x000 (x0 , x00 , x000 ) τ = −BN 0 = (T ∧ N )N 0 = − (x0 ∧ x00 )N 0 = − =− , κ κ2 κ2 donde (u, v, w) = u(v∧w) es el producto mixto de vectores. Si la parametrizaci´n o no es la natural tenemos evidentemente x0 ∧ x00 B= , kx0 ∧ x00 k y un c´lculo rutinario nos lleva de la expresi´n que tenemos para τ (s) a a o (x0 , x00 , x000 ) τ =− . kx0 ∧ x00 k2 Ejercicio: Calcular la curvatura y la torsi´n de la h´lice (r sen t, r cos t, kt). o e Para acabar probaremos que la curvatura y la torsi´n determinan una curva o salvo por su posici´n en el espacio. o Teorema 4.23 Sean x, x : I −→ R3 dos curvas con las mismas funciones κ y ¯ ° ¢ τ . Entonces existe una isometr´ f : R3 −→ R3 tal que x(s) = f x(s) para ıa ¯ todo s ∈ I. ´ Demostracion: Es f´cil comprobar que los vectores del triedro de Frenet, a as´ como la curvatura y la torsi´n se conservan por isometr´ en el sentido de ı o ıas, ~ que, por ejemplo, si f es una isometr´ se cumple Tx◦f (s) = f ◦ Tx , donde f es ıa ~ la isometr´ lineal asociada a f . Igualmente κx◦f (s) = κ(s), etc. ıa Sea s0 ∈ I. Aplicando una isometr´ a x podemos exigir que x(s0 ) = x(s0 ), ıa ¯ ¯ ¯ ¯ ¯ T (s0 ) = T (s0 ), N (s0 ) = N (s0 ), B(s0 ) = B(s0 ), κ(s0 ) = κ(s0 ), τ (s0 ) = τ (s0 ). ¯ ¯ Probaremos que en estas condiciones x = x. ¯
  • 203.
    4.3. Curvas parametrizables 187 Es claro que 1d ° ¯ ¯ ¯ ¢ kT − T k2 + kN − N k2 + kB − Bk2 2 ds ¯ ¯ ¯ ¯ ¯ ¯ = (T − T )(T 0 − T 0 ) + (N − N )(N 0 − N 0 ) + (B − B)(B 0 − B 0 ) Aplicando las f´rmulas de Frenet queda o ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ κ(T − T )(N − N )−κ(N − N )(T − T )−τ (N − N )(B − B)+τ (B − B)(N − N ) = 0, ¯ ¯ ¯ luego T = T , N = N , B = B, pues las diferencias son constantes y se anulan en s0 . La primera igualdad es x0 = x0 , y como ambas funciones coinciden en s0 ¯ ha de ser x = x. ¯ Como consecuencia, si una curva plana tiene curvatura constante κ, entonces es un arco de circunferencia de radio r = 1/κ, pues su curvatura y su torsi´no (nula) coinciden con las de la circunferencia. Las curvas de curvatura nula son las rectas. Sistemas de referencia no inerciales A la hora de medir la posici´n de un o objeto f´ısico es necesario tomar a otro como referencia. Aunque en la pr´ctica a las coordenadas cartesianas no son siempre las m´s apropiadas, te´ricamente a o podemos imaginar que seleccionamos un objeto r´ ıgido en el que marcamos cuatro puntos a los que asignamos las coordenadas (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1) y con respecto a ellos determinamos la posici´n de cualquier otro punto del o espacio. Podr´ parecer conveniente exigir que el objeto mediante el cual definimos ıa nuestro sistema de referencia est´ en reposo, para evitar que las coordenadas de e un cuerpo var´ por causa del movimiento del sistema de referencia y no por ıen su propio movimiento. Sin embargo la Tierra, el Sol y las estrellas se mueven por el espacio, luego no tenemos a nuestra disposici´n ning´n objeto del que o u podamos garantizar que est´ en reposo. M´s a´n, la f´ a a u ısica ense˜a que el requisito n mismo no tiene sentido, pues no existe forma de dar sentido al concepto de “reposo absoluto”, sino que el concepto de movimiento es esencialmente relativo al sistema de referencia que adoptemos. Pese a ello, no todos los sistemas de referencia son equivalentes. Una clase especial de ellos la forman los determinados por objetos libres de toda influencia externa. Uno de los postulados b´sicos de la f´ a ısica es que si dos objetos est´n a libres de toda influencia externa, su movimiento relativo ser´ uniforme, es decir, a al tomar como referencia a uno de ellos el otro se mover´ (en l´ a ınea recta) con velocidad constante, tal vez nula. A los sistemas de referencia en estas condicio- nes se les llama inerciales, de modo que la primera ley de Newton, de la que ya hemos hablado, afirma en realidad que la velocidad de un cuerpo libre de toda influencia exterior medida desde un sistema de referencia inercial permanece constante. Esta ley no es aplicable a sistemas no inerciales. Por ejemplo, enseguida justificaremos que un tren que se mueve con velocidad constante puede ser
  • 204.
    188 Cap´ ıtulo 4. C´lculo diferencial de varias variables a considerado como un sistema de referencia inercial, pero en el momento en que el tren acelera o frena deja de serlo. En efecto, imaginemos una esfera en reposo sobre el pasillo del tren. Visto desde la tierra, tanto el tren como la esfera est´n a movi´ndose a la misma velocidad. Cuando el tren frena, los frenos act´an sobre e u ´l haci´ndolo parar, pero no act´an sobre la esfera, que sigue movi´ndose a la e e u e misma velocidad. Desde un sistema de referencia determinado por el tren, la esfera en reposo pasa a moverse hacia delante sin que nada haya influido sobre ella. Esto es una violaci´n de la primera ley de Newton. o La Tierra no es un sistema de referencia inercial a causa de sus movimientos de rotaci´n y traslaci´n. No obstante, la traslaci´n alrededor del Sol sigue una o o o o ´rbita de radio tan grande que localmente es casi recta, y las consecuencias de este movimiento son inapreciables. En cuanto a la rotaci´n, sus efectos s´ son o ı detectables mediante experimentos f´ ısicos que falsean la ley de Newton, pero en muchas ocasiones tambi´n resulta despreciable (una bola encima de una e mesa nunca empieza a moverse sola como en el tren). Un sistema de referencia determinado por un objeto que se mueva a velocidad constante respecto a un sistema de referencia inercial cumple igualmente la ley de Newton y las leyes restantes de la din´mica, por lo que puede ser considerado inercial. Es el caso a del tren que coment´bamos antes. Lo que sucede es que aunque el tren est´ a a sometido a la acci´n de su motor, ´sta se emplea unicamente en contrarrestar o e ´ las fuerzas de rozamiento que se oponen a su avance, con lo que las dos acciones que ´ste experimenta se cancelan mutuamente, y el resultado es el mismo que e si ninguna fuerza actuara sobre ´l.e Con m´s detalle: los cuerpos act´an unos sobre otros alterando su estado a u de movimiento. Por ejemplo, si dejamos en el aire un objeto en reposo ´ste noe permanecer´ en tal estado, sino que caer´, y esto no es una violaci´n de la ley a a o de Newton. Lo que sucede es que el cuerpo no est´ libre de acciones externas, a sino que sufre la acci´n de la gravedad terrestre. La segunda ley de Newton o afirma que la acci´n que un cuerpo ejerce sobre otro se traduce siempre en o una aceleraci´n sobre el mismo. M´s detalladamente, a dicha acci´n se le puede o a o asociar un vector llamado fuerza, de modo que si sumamos todas las fuerzas que produce sobre un cuerpo cada uno de los cuerpos externos que le influyen, el vector fuerza resultante es el producto de una constante, llamada masa inercial del cuerpo, por la aceleraci´n que experimenta. o Ahora vamos a estudiar qu´ consecuencias tiene la rotaci´n de la tierra en e o el movimiento de los objetos. En general, consideremos los vectores i = (cos ωt, sen ωt, 0), j = (− sen ωt, cos ωt, 0), k = (0, 0, 1). En cada instante t, estos vectores forman una base ortonormal positivamente orientada (notar que k = i ∧ j). Podemos suponer que hemos fijado un sistema de referencia inercial con origen en el centro de la tierra y que k apunta hacia el norte. Si ω es la velocidad angular de la Tierra, es decir, π/12 radianes por hora, entonces los tres vectores se mueven con la Tierra, y est´n en reposo respecto a a ella. Consideremos un objeto de masa m que se mueve seg´n la trayectoria x(t). u Esto significa que la fuerza resultante que act´a sobre ´l en cada instante t es u e
  • 205.
    4.3. Curvas parametrizables 189 F = mx00 . Expresemos x(t) = xr (t)i(t) + yr (t)j(t) + zr (t)k. As´ (xr , yr , zr ) son las coordenadas del m´vil respecto a un sistema de refe- ı, o rencia relativo a la Tierra. Derivemos: x0 = Vr − ωyr i + ωxr j = Vr + ωk ∧ x, donde Vr = x0 i+yr j +zr k es la velocidad relativa del m´vil. Volvemos a derivar: r 0 0 o x00 = Ar + ωk ∧ Vr + ωk ∧ x0 = Ar + 2ωk ∧ Vr + ω 2 k ∧ (k ∧ x), donde Ar = x00 i + yr j + zr k es la aceleraci´n relativa. Multiplicamos por la r 00 00 o masa m del m´vil y despejamos o mAr = F + 2mωVr ∧ k + mω 2 (k ∧ x) ∧ k. ´ Esta es la expresi´n de la segunda ley de Newton en un sistema de referencia o en rotaci´n con velocidad angular constante. La masa de un objeto por la o aceleraci´n que experimenta no es la resultante de las fuerzas que act´an sobre o u el objeto, sino la suma de esta resultante m´s dos “fuerzas ficticias”, llamadas a fuerza centr´ıfuga y fuerza de Coriolis, dadas por Fcen = mω 2 (k ∧ x) ∧ k, Fcor = 2mωVr ∧ k. Se las llama fuerzas ficticias (o inerciales) porque se comportan formalmente como fuerzas que hay que sumar a las dem´s, pero que no se corresponden con a ninguna acci´n de ning´n objeto sobre el m´vil (como en el caso de la esfera o u o que se mueve sola). Si el m´vil se encuentra en la superficie de la tierra a una latitud α (el ´ngulo o a que forma con el ecuador) entonces la fuerza centr´ ıfuga tiene la direcci´n y o el sentido de x, es decir, apunta hacia arriba (recordemos que el origen de coordenadas est´ en el centro de la Tierra) y su m´dulo es mω 2 R cos α, donde a o R es el radio de la Tierra, luego es nula en los polos y m´xima en el ecuador. a Para hacernos una idea de su intensidad, sobre un cuerpo de 1kg de masa act´a una fuerza centr´ u ıfuga de 1 · (7,29 · 10−5 )2 6,3 · 106 ≈ 0,03N, mientras1 que su peso es de 9,8N , unas 326 veces mayor. Por consiguiente la fuerza centr´ ıfuga es generalmente despreciable. Si la Tierra girara mucho m´s a r´pido los cuerpos pesar´ menos por causa de esta fuerza y llegado a un punto a ıan podr´ salir despedidos hacia el cielo. ıan La fuerza de Coriolis s´lo act´a sobre cuerpos en movimiento respecto a la o u Tierra. Por ejemplo, si un cuerpo cae su velocidad Vr apunta al centro de la 1 La unidad de fuerza es el Newton. Un Newton es la fuerza que aplicada a un cuerpo de 1Kg de masa le produce una aceleraci´n de 1m/s2 . o
  • 206.
    190 Cap´ ıtulo 4. C´lculo diferencial de varias variables a Tierra y Vr ∧ k apunta hacia el este, por lo que los cuerpos que caen sufren una desviaci´n hacia el este, nula en los polos y m´xima en el ecuador. o a Si el movimiento se realiza sobre la superficie de la Tierra observamos que k apunta hacia el exterior de la misma en el hemisferio norte y hacia el interior en el hemisferio sur, por lo que Vr ∧k apunta hacia la derecha de Vr en el hemisferio norte y hacia la izquierda en el hemisferio sur. Si descomponemos esta fuerza en dos vectores, uno en la direcci´n del centro de la Tierra y otro tangente a la o misma, la gravedad hace inadvertible la primera componente, pero la segunda ´ es apreciable. Esta es nula en el ecuador y m´xima en los polos. Puesto que se a dirige siempre hacia el mismo lado, la fuerza de Coriolis hace girar los objetos, y se pone de manifiesto en los l´ ıquidos y gases, por ejemplo, el agua que cae por un desag¨e gira en sentido horario en el hemisferio norte, en sentido antihorario u en el hemisferio sur y no gira en las proximidades del ecuador. Tambi´n puede e apreciarse su efecto sobre un p´ndulo suficientemente largo y pesado (p´ndulo e e de Foucault). *Longitud de arcos no eucl´ ıdeos Veamos ahora c´mo se generalizan los o resultados sobre longitud de arcos a las geometr´ hiperb´lica y el´ ıas o° ıptica. ¢Co- mencemos por la primera. Consideremos un arco X(t) = x(t), y(t), z(t) en el plano proyectivo P2 (R) contenido en el interior de una c´nica de ecuaci´n o o f (X, X) = 0. Llamamos s(t) a la longitud de arco que queremos definir. Lo haremos determinando su derivada como en el caso eucl´ ıdeo. La idea central es que si d representa la distancia hiperb´lica entre dos puntos, entonces o ° ¢ s(t + h) − s(t) d X(t + h), X(t) ≈ , h |h| y la aproximaci´n ser´ mejor cuanto menor sea h, pues si X es derivable se parece o a a una recta alrededor de X(t), luego el l´ ımite cuando h → 0 en el cociente de la izquierda nos dar´ la derivada de s. Para calcular este l´ a ımite usaremos que senh v l´ ım =1 v→0 v y que s f 2 (X, Y ) − f (X, X)f (Y, Y ) senh d(X, Y ) = . f (X, X)f (Y, Y ) As´ pues, ı s ° ¢ ° ¢ ° ¢ ds 1 f 2 X(t), X(t + h) − f X(t), X(t) f X(t + h), X(t + h) = l´ ım ° ¢ ° ¢ . dt h→0 |h| f X(t), X(t) f X(t + h), X(t + h) Sea X(t + h) = X(t) + ∆X(t, h). Usando que f es bilineal la expresi´n o anterior se simplifica: s ds 1 f 2 (X, ∆X) − f (X, X)f (∆X, ∆X) = l´ım ° ¢ dt h→0 |h| f (X, X) f (X, X) + 2f (X, ∆X) + f (∆X, ∆X)
  • 207.
    4.3. Curvas parametrizables 191 s f 2 (X, ∆X ) − f (X, X)f ( ∆X , ∆X ) h h h = l´ ım ° ¢ h→0 f (X, X) f (X, X) + 2f (X, ∆X) + f (∆X, ∆X) s f 2 (X, X 0 ) − f (X, X)f (X 0 , X 0 ) = . f 2 (X, X) Vamos a particularizar esta f´rmula para el caso del plano de Klein, es decir, o tomando como f la circunferencia unidad f (X1 , X2 ) = z1 z2 − x1 x2 − y1 y2¢ y el ° ¢ ° arco de la forma X(t) = x(t), y(t), 1 , de modo que X 0 (t) = x0 (t), y 0 (t), 0 . El resultado es: µ ∂2 ds (xx0 − yy 0 )2 + (1 − x2 − y 2 )(x02 + y 02 ) = . dt (1 − x2 − y 2 )2 Operando y multiplicando por dt2 obtenemos una expresi´n para el elemento o de longitud hiperb´lica en el plano de Klein: o dx2 + dy 2 − (x dy − y dx)2 ds2 = , (1 − x2 − y 2 )2 que ha de entenderse como una ecuaci´n funcional, para cada punto t, entre o la diferencial de la longitud de arco ds(t) y las diferenciales dx(t), dy(t) de las funciones coordenadas del arco. Formalmente, si X : [a, b] −→ R2 , definimos s(t) como la integral desde a hasta t de la ra´ cuadrada del miembro derecho ız de la igualdad anterior, con lo que obtenemos una funci´n que satisface dicha o relaci´n. Informalmente ds as´ calculado es el incremento infinitesimal que ex- o ı perimenta la longitud de arco cuando el par´metro se incrementa en dt y la a integral de ds nos da el incremento completo de la longitud de arco entre dos l´ ımites dados. Observemos que la longitud hiperb´lica es invariante por isometr´ o ıas. En efecto, a cada arco X : [a, b] −→ R2 le hemos asociado la funci´n s determinada o por s(a) = 0 y ° ¢ ds d X(t + h), X(t) = l´ ım dt h→0 |h| y es obvio que el miembro derecho es invariante por isometr´ ıas. La expresi´n que hemos obtenido no es muy manejable, y las integrales a que o da lugar resultan complicadas. Las coordenadas polares nos dan una expresi´n o m´s sencilla. Si diferenciamos (x, y) = (r cos θ, r sen θ) y sustituimos en la a expresi´n de ds obtenemos o dr2 r2 ds2 = + dθ2 . (1 − r2 )2 1 − r2 Si un punto se encuentra a una distancia hiperb´lica ρ del centro del plano o de Klein, la distancia eucl´ ıdea es r = tanh ρ. Al diferenciar esta relaci´n y o
  • 208.
    192 Cap´ ıtulo 4. C´lculo diferencial de varias variables a sustituir en la expresi´n anterior obtenemos el elemento de longitud hiperb´lico o o en coordenadas polares hiperb´licas, que resulta ser o ds2 = dρ2 + senh2 ρ dθ2 , (4.6) relaci´n an´loga a (4.3). o a Por ejemplo, consideremos una circunferencia cuyo centro coincida con el del plano de Klein y de radio (hiperb´lico) r. Entonces su longitud hiperb´lica es o o Z 2π senh r dθ = 2π senh r. 0 Observemos que si el radio es peque˜o la longitud es aproximadamente la n eucl´ ıdea 2πr. La f´rmula (4.6) es intr´ o ınseca, en el sentido de que las coordenadas (ρ, θ) de un punto P representan la distancia hiperb´lica de P a un punto fijo O y el o −− → a ´ngulo de la semirrecta OP con una semirrecta fija de origen O, y nada de esto depende del plano de Klein. Por lo tanto la f´rmula ha de ser v´lida tambi´n o a e en el c´ ırculo de Poincar´. La relaci´n entre la distancia eucl´ e o ıdea r y la distancia hiperb´lica ρ de un punto P al punto 0 en el c´ o ırculo de Poincar´ es e 1+r ρ = log , 1−r de donde 2r 2dr senh ρ = 2 , dρ = . 1−r 1 − r2 Por consiguiente, el elemento de longitud en coordenadas polares (eucl´ ıdeas) en el c´ ırculo de Poincar´ resulta ser e √ dr2 + r2 dθ2 ds = 2 . 1 − r2 Seg´n (4.3), el numerador es el elemento de longitud eucl´ u ıdea en coordenadas polares. Si usamos la notaci´n compleja para el arco z(t) = x(t) + i y(t) y p o llamamos |dz| = dx2 + dy 2 al elemento de longitud eucl´ ıdea, entonces tenemos 2 |dz| ds = . 1 − |z|2 Esta expresi´n diferencial muestra la naturaleza de la distancia hiperb´lica o o mucho m´s claramente que la f´rmula de la distancia entre dos puntos. Vemos a o que la distancia hiperb´lica es infinitesimalmente la eucl´ o ıdea dividida entre el factor m´s simple posible que hace que se “dilate” al acercarnos al borde del a c´ ırculo de radio 1, de modo que las peque˜as distancias eucl´ n ıdeas son cada vez m´s grandes desde el punto de vista hiperb´lico. La expresi´n tambi´n es muy a o o e clara en el semiplano de Poincar´. La transformaci´n circular e o iw + 1 z= w+i
  • 209.
    4.3. Curvas parametrizables 193 ırculo |z| < 1 en el semiplano Im w > 0. Se comprueba2 que convierte el c´ −2 dw 2 |dw| 4y dz = , |dz| = , 1 − |z|2 = . (w + i)2 |w + i|2 |w + i|2 De todo esto resulta |dw| ds = , y es decir, que el elemento de longitud hiperb´lico en el semiplano de Poincar´ es o e el eucl´ ıdeo dividido entre la parte imaginaria, de modo que cuando ´sta tiende e a 0 las longitudes tienden a infinito. Todos los argumentos anteriores valen igualmente para la geometr´ el´ ıa ıptica, partiendo ahora de una c´nica imaginaria f (X1 , X2 ). La unica diferencia es un o ´ signo en la f´rmula o s −f 2 (X, Y ) + f (X, X)f (Y, Y ) sen d(X, Y ) = , f (X, X)f (Y, Y ) debido a que la relaci´n fundamental entre los senos y cosenos circulares difiere o en un signo respecto a la hiperb´lica. Como consecuencia llegamos a o µ ∂2 ds −f 2 (X, X 0 ) + f (X, X)f (X 0 , X 0 ) = . dt f 2 (X, X) En el modelo esf´rico, o sea, si suponemos f (X1 , X2 ) = x1 x2 + y1 y2 + z1 z2 e y f (X, X) = 1, al derivar respecto de t queda f (X, X 0 ) = 0, y la expresi´n se o reduce a µ ∂2 ds = f (X 0 , X 0 ) = x02 + y 02 + z 02 , dt es decir, ds2 = dx2 + dy 2 + dz 2 , luego la longitud el´ ıptica de un arco contenido en la esfera unitaria coincide con su longitud eucl´ ıdea. En coordenadas polares el´ ıpticas: (x, y, z) = (sen ρ cos θ, cos ρ sen θ, sen θ), la expresi´n es o ds2 = dρ2 + sen2 ρ dθ. La longitud de una circunferencia el´ ıptica de radio (el´ ıptico) r es 2π sen r. 2 La teor´ de funciones de variable compleja justifica que es l´ ıa ıcito calcular dz derivando la expresi´n anterior como si w fuera una variable real y tratando las constantes imaginarias o como constantes reales. Nosotros no hemos probado esto, por lo que el lector puede, si lo desea, hacer los c´lculos en t´rminos de las dos variables reales x, y, pero est´ avisado de que a e a llegar´ al mismo resultado. a
  • 211.
    Cap´ ıtulo V Introducci´n a las o variedades diferenciables En este cap´ıtulo aplicaremos el c´lculo diferencial al estudio de las superfi- a cies. Si bien todos los ejemplos que consideraremos ser´n bidimensionales, la a mayor parte de la teor´ la desarrollaremos sobre un concepto general de “su- ıa perficie de n dimensiones”. La idea b´sica es que una superficie es un espacio a topol´gico que localmente se parece a un plano. El ejemplo t´ o ıpico es la superficie terrestre: tenemos que alejarnos mucho de ella para darnos cuenta de que no es plana, sino esf´rica. Una definici´n topol´gica que recoja estas ideas ser´ la e o o ıa siguiente: Un subconjunto S de Rn es una superficie si para cada punto p ∈ S existe un entorno V de p, un abierto U en R2 y un homeomorfismo X : U −→ V ∩ S. Es decir, S es una superficie si alrededor de cada punto es homeomorfa a un abierto de R2 . Notar que no pedimos que S sea homeomorfa a un abierto de R2 , sino s´lo que lo sea alrededor de cada punto. Basta pensar en una esfera o para comprender la importancia de este hecho. Una esfera no es homeomorfa a un abierto de R2 , pero un peque˜o trozo de esfera es como un trozo de plano n abombado, homeomorfo a un trozo de plano “llano”. Sin embargo nosotros estamos interesados en superficies diferenciables, en el sentido de que se parezcan a planos afines alrededor de cada punto. Podr´ pensarse que para conseguir esto ıa bastar´ exigir que el homeomorfismo X sea diferenciable, pero no es as´ Por ıa ° ¢ ı. ejemplo, pensemos en X(u, v) = u3 , v, |u3 | . La aplicaci´n X es diferenciable, o y es un homeomorfismo entre R2 y un conjunto S ⊂ R3 cuya forma es la de una hoja de papel doblada por la mitad. Alrededor de los puntos de la forma (0, v, 0) no se parece a ning´n plano, sino que u tiene un “pico”. Si la Tierra tuviera esta forma no necesitar´ıamos alejarnos de ella para darnos cuenta de que estar´ “doblada”. ıa 195
  • 212.
    196 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o La raz´n es que dX(0, b) = (0, dv(0, b), 0), de modo que alrededor de un o punto (0, b) la funci´n X se parece a la aplicaci´n af´ f (u, v) = (0, v, 0), cuya o o ın imagen es la recta x = z = 0. As´ pues, aunque topol´gicamente la imagen de ı o X es homeomorfa a un plano, desde el punto de vista del c´lculo diferencial la a imagen de X alrededor de un punto (0, y, 0) se parece a la recta x = z = 0, y no a un plano. Para evitar esto hemos de exigir que la imagen de dX(u, v) sea un plano y no una recta. Esto es tanto como decir que la matriz jacobiana tenga rango 2. 5.1 Variedades Definici´n 5.1 Un conjunto S ⊂ Rm es una variedad diferenciable de di- o mensi´n n ≤ m y de clase C q si para cada punto p ∈ S existe un entorno o V de p, un abierto U en Rn y una funci´n X : U −→ Rm de clase C q de modo o que el rango de la matriz JX sea igual a n en todo punto y X : U −→ S ∩ V sea un homeomorfismo. Una aplicaci´n X en estas condiciones se llama carta o de S alrededor de p. En lo sucesivo supondremos que las variedades con las que trabajamos son de clase C q para un q suficientemente grande como para que existan las derivadas que consideremos (y sean continuas). Rara vez nos har´ falta suponer q > 3, a aunque de hecho todos los ejemplos que consideraremos ser´n de clase C ∞ . a La palabra “carta” hay que entenderla en el sentido de “mapa”. En efecto, podemos pensar en U como un mapa “plano” de una regi´n de S, y la aplicaci´n o o X es la que hace corresponder cada punto del mapa con el punto real que representa. S X U Alternativamente, podemos pensar en X −1 como una aplicaci´n que asigna o a cada punto p ∈ S ∩ V unas coordenadas x = (x1 , . . . , xn ) ∈ U ⊂ Rn , de forma an´loga a los sistemas de coordenadas en un espacio af´ 1 Dentro de poco a ın. ser´ equivalente trabajar con cartas o con sistemas de coordenadas, pero por el a momento podemos decir que las cartas son diferenciables y en cambio no tiene sentido decir que las funciones coordenadas lo sean, pues no est´n definidas a sobre abiertos de Rm . 1 Etimol´gicamente, una “variedad” no es m´s que un conjunto cuyos elementos vienen o a determinados por “varias” coordenadas. En los resultados generales llamaremos x1 , . . . , xn a las coordenadas para marcar la analog´ con Rn , aunque en el caso de curvas seguiremos ıa usando la variable t (o s si la parametrizaci´n es la natural) y en el caso de superficies S ⊂ R3 o usaremos x, y, z para las coordenadas en R3 y u, v para las coordenadas en S.
  • 213.
    5.1. Variedades 197 Ejemplo Todo abierto U en Rn es una variedad diferenciable de dimensi´n n o y clase C ∞ . Basta tomar como carta la identidad en U . De este modo, todos los resultados sobre variedades valen en particular para Rn y sus abiertos. Ejercicio: Refinar el argumento del teorema 2.21 para concluir que dos puntos cua- lesquiera de una variedad conexa S de clase C q pueden ser unidos por un arco de clase C q contenido en S. El teorema siguiente proporciona una clase importante de variedades dife- renciables, pues a continuaci´n vemos que toda variedad es localmente de este o tipo. Teorema 5.2 Sea f : U ⊂ Rn −→ Rk una aplicaci´n de° clase C q sobre un o ¢ abierto U y X : U −→ Rn+k la aplicaci´n dada por X(x) = x, f (x) . Entonces o X[U ] es una variedad diferenciable de dimensi´n n y clase C q . o ´ Demostracion: Basta observar que X es obviamente un homeomorfismo en su imagen (su inversa es una proyecci´n) y JX(x) contiene una submatriz o de orden n igual a la identidad, luego su rango es n. La definici´n se satisface o tomando V = Rn+k . Observar que X[U ] es la gr´fica de f , luego el teorema anterior afirma que a la gr´fica de una funci´n diferenciable es siempre una variedad diferenciable. a o Ahora veamos que todo punto de una variedad diferenciable tiene un entorno en el que la variedad es la gr´fica de una funci´n. a o Teorema 5.3 Sea S ⊂ Rn+k una variedad de clase C q y de dimensi´n n. Sea o p ∈ S. Entonces existe un entorno V de p, un abierto U en Rn y una funci´n o f : U −→ Rk de¢clase C q de modo que la aplicaci´n X : U −→ Rn+k dada por ° o X(x) = x, f (x) es una carta alrededor de p. En realidad hemos de entender que las coordenadas de x y f (x) se intercalan en un cierto orden que no podemos elegir, tal y como muestra la prueba. Demostracion: Sea Y : W −→ Rn+k una carta alrededor de p. Sea V un ´ entorno de p tal que Y : W −→ S ∩ V sea un homeomorfismo. Sea t0 ∈ W el vector de coordenadas de p, es decir, Y (t0 ) = p. Puesto que JY (t0 ) tiene rango n, reordenando las funciones coordenadas de Y podemos suponer que el determinante formado por las derivadas parciales de las n primeras es no nulo. ° ¢ Digamos que Y (t) = Y1 (t), Y2 (t) , donde |JY1 (t0 )| 6= 0. Sea p1 = Y1 (t0 ). Por el teorema de inyectividad local y el teorema de la funci´n inversa, existe o un entorno abierto G ⊂ W de t0 tal que Y1 es inyectiva en G, Y1 [G] = U es abierto en Rn y la funci´n Y1−1 : U −→ G es de clase C q . o El conjunto Y [G] es un entorno abierto de p en S ∩V , luego existe un entorno abierto V 0 de p en Rn+k tal que Y [G] = S ∩ V ∩ V 0 . Cambiando V 0 por V ∩ V 0 podemos suponer que V 0 ⊂ V y que Y [G] = S ∩ V 0 . De este modo, cada punto p ∈ S ∩ V 0 est´ determinado por sus coordenadas a t ∈ G, las cuales a su vez est´n determinadas por x = Y1 (t) ∈ U , con la particu- a laridad de que x es el vector de las primeras componentes de p. Concretamente
  • 214.
    198 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o ° ¢ p est´ formado por x y f (x) = Y2 Y1−1 (x) . La funci´n f es de clase C q en U . a o −1 De este modo, si x ∈ U y t = Y1 (x) ∈ G, tenemos que ° ¢ ° ¢ X(x) = x, f (x) = Y1 (t), Y2 (t) = Y (t) ∈ S ∩ V 0 . Rec´ıprocamente, si (x, y) ∈ ° ∩ V 0 ,¢entonces x = Y1 (t), y = Y2 (t) para S un cierto t ∈ G, luego (x, y) = x, f (x) = X(x). En definitiva tenemos que X : U −→ S ∩ V 0 es biyectiva. Su inversa es la proyecci´n en las primeras o componentes, luego X es un homeomorfismo. En las condiciones de la prueba anterior, sea π : Rm −→ Rn la proyecci´n o en las n primeras componentes y g : V 0 −→ G la aplicaci´n dada por g(x) = ° ¢ o Y1−1 π(x) . Notemos que si x ∈ V 0 entonces π(x) ∈ U , luego g est´ bien definida a y es de clase C q . Si t ∈ G entonces ° ¢ ° ¢ ° ¢ g Y (t) = g Y1 (t), Y2 (t) = Y1−1 Y1 (t) = t, luego (Y |G )−1 es la restricci´n a V 0 ∩ S de g. Con esto hemos probado: o Teorema 5.4 Sea Y : U −→ S ⊂ Rm una carta de una variedad diferenciable de dimensi´n n y clase C q . Para cada punto t ∈ U existe un entorno G ⊂ U o de t, un entorno V de Y (t) y una aplicaci´n g : V −→ G de clase C q tal que o (Y |G )−1 = g|V ∩S . De aqu´ se sigue una propiedad fundamental de las cartas: ı Teorema 5.5 Sea S ⊂ Rm una variedad diferenciable de dimensi´n n y de o clase C q . Sea p ∈ S y X : U −→ S ∩ V , Y : U 0 −→ S ∩ V 0 dos cartas alrededor de p. Sean V0 = V ∩ V 0 , U0 = X −1 [V0 ], U0 = Y −1 [V0 ]. Entonces la aplicaci´n 0 o −1 X ◦Y : U0 −→ U0 es biyectiva, de clase C q y con determinante jacobiano no 0 nulo, con lo que su inversa es tambi´n de clase C q . e ´ Demostracion: Si t ∈ U0 , por el teorema anterior existe una funci´n g de o clase C q definida en un entorno de X(t) de modo que X ◦ Y −1 = X ◦ g (en un entorno de t), luego X ◦ Y −1 es de clase C q en un entorno de t, luego en todo U0 . Lo mismo vale para su inversa Y ◦ X −1 , luego la regla de la cadena nos da que sus diferenciales son mutuamente inversas, luego los determinantes jacobianos son no nulos. Veremos ahora otro ejemplo importante de variedades diferenciables. Pri- meramente consideraremos el caso lineal al cual generaliza. Ejemplo Una variedad af´ de dimensi´n n en Rm es tambi´n una variedad ın o e diferenciable de la misma dimensi´n y de clase C ∞ . En efecto, una tal variedad o est´ formada por los puntos que satisfacen un sistema de m − n ecuaciones a lineales linealmente independientes. Esto implica que la matriz de coeficientes del sistema tiene un determinante de orden m − n no nulo, luego agrupando adecuadamente las variables podemos expresar el sistema como xA + yB = c, donde x ∈ Rn , y ∈ Rm−n , |B| 6= 0, luego podemos despejar y = f (x) =
  • 215.
    5.1. Variedades 199 (c − xA)B −1 , donde la funci´n f es obviamente de clase C ∞ . Esto significa que o la variedad lineal est´ formada por los puntos (x, y) tales que y = f (x), luego a es la gr´fica de f y por consiguiente es una variedad de clase C ∞ . a Ahora probamos que las soluciones de un sistema de k = m−n ecuaciones di- ferenciables con m inc´gnitas constituyen una variedad de dimensi´n n supuesto o o que se cumpla una condici´n de independencia similar a la independencia lineal o que exig´ ıamos en el ejemplo anterior. Definici´n 5.6 Si f : A ⊂ Rn+k −→ Rk es diferenciable en (x, y) ∈ A, donde o x ∈ Rn , y ∈ Rk , definimos Ø Ø Ø Dn+1 f1 (x, y) · · · Dn+1 fk (x, y) Ø ∂(f1 · · · fk ) Ø Ø Ø . . . . Ø (x, y) = Ø . . Ø. ∂(y1 · · · yk ) Ø Ø Ø Dn+k f1 (x, y) · · · Dn+k fk (x, y) Ø Teorema 5.7 (Teorema de la funci´n impl´ o ıcita) Consideremos una apli- caci´n f : A ⊂ Rn+k −→ Rk de clase C q en el abierto A, con q ≥ 1. Sea o (x0 , y 0 ) ∈ A tal que f (x0 , y 0 ) = 0 y supongamos que ∂(f1 · · · fk ) 0 0 (x , y ) 6= 0. ∂(y1 · · · yk ) Entonces existen abiertos V ⊂ A, U ⊂ Rn de modo que (x0 , y 0 ) ∈ A, x0 ∈ U y una funci´n g : U −→ Rk de clase C q tal que o {(x, y) ∈ V | f (x, y) = 0} = {(x, y) ∈ Rn+k | x ∈ U, y = g(x)}. Demostracion: Sea F : A −→ Rn+k la funci´n F (x, y) = (x, f (x, y)). Sus ´ o funciones coordenadas son las proyecciones en las componentes de Rn m´s lasa funciones coordenadas de f , luego F es de clase C q . Su determinante jacobiano es Ø Ø Ø 1 ··· 0 D1 f1 (x, y) ··· D1 fk (x, y) Ø Ø Ø Ø . . . . Ø Ø . . . . . . . . Ø Ø Ø Ø 0 ··· 1 Dn f1 (x, y) ··· Dn fk (x, y) Ø Ø Ø Ø Ø, Ø 0 ··· 0 D Ø Ø n+1 f1 (x, y) · · · Dn+1 fk (x, y) Ø Ø . . . . Ø Ø . . . . Ø Ø . . . . Ø Ø 0 ··· 0 D f (x, y) · · · D f (x, y) Ø n+k 1 n+k k que claramente coincide (salvo signo) con ∂(f1 · · · fk ) (x, y). ∂(y1 · · · yk ) As´ |JF (x0 , y 0 )| 6= 0. Por el teorema de inyectividad local existe un entorno ı V de (x0 , y 0 ) donde F es inyectiva y su determinante jacobiano no se anula. Por
  • 216.
    200 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o el teorema de la funci´n inversa tenemos que W = F [V ] es abierto en Rn+k y o la funci´n G = F −1 : W −→ V es de clase C q . o ° ¢ Podemos expresar G(x, y) = G1 (x, y), G2 (x, y) . Claramente G1 y G2 son ambas de clase C q . Si (x, y) ∈ W , entonces ° ¢ ° ¢ ° ° ¢¢ (x, y) = F G(x, y) = F G1 (x, y), G2 (x, y) = G1 (x, y), f G(x, y) , ° ¢ luego G1 (x, y) = x, con lo que en general G(x, y) = x, G2 (x, y) . Definimos U = {x ∈ Rn | (x, 0) ∈ W }. Es claro que se trata de un abierto. Adem´s, F (x0 , y 0 ) = (x0 , 0) ∈ W , luego x0 ∈ U . Definimos g : U −→ Rk a mediante g(x) = G2 (x, 0). Claramente g es de clase C q . Tomemos ahora x ∈ U e y = g(x). Hemos de probar que (x, y) ∈ V y f (x, y) = 0. En efecto, por definici´n de U es (x, 0) ∈ W , luego G(x, 0) ∈ V , o pero ° ¢ ° ¢ G(x, 0) = x, G2 (x, 0) = x, g(x) = (x, y). ° ¢ ° ¢ Adem´s (x, 0) = F G(x, 0) = F (x, y) = x, f (x, y) , luego f (x, y) = 0. a Rec´ıprocamente, si (x, y) ∈ V y f (x, y) = 0 entonces ° ¢ F (x, y) = x, f (x, y) = (x, 0) ∈ W, ° ¢ ° ¢ ° ¢ luego x ∈ U y (x, y) = G F (x, y) = G(x, 0) = x, G2 (x, 0) = x, g(x) , con lo que g(x) = y. Lo que afirma este teorema es que si S = {x ∈ Rn+k | f (x) = 0} es un conjunto determinado por un sistema de k ecuaciones de clase C q y p ∈ S cumple la hip´tesis entonces V ∩ S = X[U ], donde X(x) = (x, g(x)), de donde o se sigue que X cumple las condiciones para ser una carta de S alrededor de p. Si la hip´tesis se cumple en todo punto entonces S es una variedad diferenciable o de dimensi´n n. o Por ejemplo, si f (x, y, z) = x2 + y 2 + z 2 − r2 , entonces el conjunto S es una esfera. Para comprobar que se trata de una superficie de clase C ∞ basta comprobar que en cada punto al menos una de las derivadas ∂f ∂f ∂f = 2x, = 2y, = 2z, ∂x ∂y ∂z es no nula, pero las tres s´lo se anulan simult´neamente en (0, 0, 0), que no es o a un punto de S, luego, efectivamente, la esfera es una superficie diferenciable. Es importante observar que la derivada que no se anula no siempre es la misma. Por ejemplo, en el polo norte (0, 0, r) la unica derivada que no se anula ´ es la de z, luego en un entorno podemos expresar z como funci´n z(x, y). Con- p o cretamente, z = r 2 − x2 − y 2 . Similarmente, la porci´n de esfera alrededor o p del polo sur es la gr´fica de la funci´n z = − r2 − x2 − y 2 . En cambio, alrede- a o dor de (r, 0, 0) la esfera no es la gr´fica de ninguna funci´n z(x, y). Es f´cil ver a o a que dado cualquier entorno U de (r, 0, 0) y cualquier entorno V de (r, 0) siempre hay puntos (x, y) en U para los cuales hay dos puntos distintos (x, y, ±z) en U
  • 217.
    5.1. Variedades 201 (con lo que (x, y) deber´ tener dos im´genes) y puntos (x, y) con x2 + y 2 > r2 ıa a para los que no existe ning´n z tal que (x, y, z) ∈ UpSin embargo, alrededor de u . este punto la esfera es la gr´fica de la funci´n x = r2 − y 2 − z 2 . a o El mismo argumento prueba en general que la esfera de dimensi´n no S n = {x ∈ Rn+1 | kxk2 = 1} 2 es una variedad diferenciable. Ejemplo: superficies de revoluci´n Sea C una variedad diferenciable de o dimensi´n 1 en R2 . Supongamos que todos sus puntos (x, z) cumplen x > 0. o Llamaremos superficie de revoluci´n generada por C al conjunto o © °p ¢ ™ S = (x, y, z) ∈ R3 | x2 + y 2 , z ∈ C . El conjunto S est´ formado por todos los puntos que resultan de girar al- a rededor del eje Z los puntos de C. Vamos a ver que se trata de una variedad diferenciable de dimensi´n 2. o p Tomemos (x0 , ¢ 0 , z0 ) ∈ S y x0 = x2 + y0 . Entonces (¯0 , z0 ) ∈ C. Sea ° y ¯ 0 2 x α(u) = r(u), z(u) una carta de C alrededor de este punto, digamos r(u0 ) = x0 , ¯ z(u0 ) = z0 . Por definici´n existe un entorno V0 de u0 y un entorno U0 de (¯0 , z0 ) o x de modo que C ∩ U0 = α[V0 ]. Sea ° ¢ X(u, v) = r(u) cos v, r(u) sen v, z(u) , (u, v) ∈ V0 × R. Claramente X es diferenciable (de la misma clase que α) y su matriz jaco- biana es µ ∂ r0 (u) cos v r0 (u) sen v z 0 (u) JX(u, v) = . −r(u) sen v r(u) cos v 0 El menor formado por las dos primeras columnas es r(u)r0 (u). Por hip´tesis o r no se anula y, por ser α una carta, su matriz jacobiana (r0 , z 0 ) no puede ser nula tampoco, luego si r0 (u) = 0, entonces z 0 (u) 6= 0, luego uno de los menores r(u)z 0 (u) sen v o −r(u)z 0 (u) cos v es no nulo. En cualquier caso el rango de JX es 2. Es claro que existe un v0 ∈ R tal que X(u0 , v0 ) = (x0 , y0 , z0 ). La aplicaci´n o X no es inyectiva, pero s´ lo es su restricci´n a V = V0 ×]v0 − π, v0 + π[. Veamos ı o que es una carta para el punto dado. Sea U = {(x cos v, x sen v, z) | (x, z) ∈ U0 , |v − v0 | < π}. Sin la restricci´n sobre v, elp o ° conjunto U¢ ser´ la antiimagen de U0 por la ıa aplicaci´n continua (x, y, z) 7→ o x2 + y 2 , z . En realidad U es la intersecci´n o de este abierto con el complementario del semiplano formado por los puntos (x cos v0 , x sen v0 , z), con x ≥ 0, que es un cerrado, luego U es abierto. Es f´cil a ver que X[V ] = U ∩ S. Falta probar que X −1 es continua, ahora bien, dado p (x, y, z) ∈ U ∩ S podemos obtener su coordenada u como u = α−1 ( x2 + y 2 , z), que es una aplicaci´n continua, y su coordenada v se obtiene aplicando a o
  • 218.
    202 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o ° ¢ x/r(u), y/r(u) la inversa del homeomorfismo v 7→ (cos v, sen v) definido para |v − v0 | < π. Por lo tanto X|V es una carta alrededor de (x0 , y0 , z0 ). ° ¢ Si la variedad C es cubrible por una unica carta r(u), z(u) , lo que se traduce ´ en que C es una curva regular, entonces tenemos una unica funci´n X, de modo ´ o que todo punto de S admite como carta a una restricci´n de X. Expresaremos o esto diciendo simplemente que X es una carta de S. Las l´ıneas de la forma X(u, v0 ) y X(u0 , v), donde u0 y v0 son constantes, se llaman meridianos y paralelos de la superficie S. Los paralelos son siempre circunferencias paralelas entre s´ los meridianos son giros de la curva C. ı, Los ejemplos m´s simples de superficies de revoluci´n se obtienen al girar a o una recta. Si ´sta es paralela al eje de giro obtenemos un cilindro, y en caso e contrario un cono.° En el caso del cono hemos de considerar en realidad una ¢ semirrecta abierta r(u), z(u) = (mu, u), para u > 0, pues para u = 0 tenemos el v´rtice del cono, donde S no es diferenciable. Una carta del cilindro es e X(u, v) = (r cos v, r sen v, u), y para el cono tenemos X(u, v) = (mu cos v, mu sen v, u). Las figuras muestran algunos de los meridianos y paralelos del cilindro y el cono. Los meridianos son rectas y los paralelos circunferencias. Un caso m´s sofisticado aparece al girar una circunferencia de radio r cuyo a centro est´ a una distancia R del eje Z, es decir, tomando e ° ¢ r(u), z(u) = (R + r cos u, r sen u), con 0 < r < R. Todo punto de la circunferencia admite como carta a una restricci´n de o esta curva. As´ obtenemos un tubo de secci´n circular cerrado sobre s´ mismo. ı o ı Recibe el nombre de toro.2 En este caso X(u, v) = (R cos v + r cos u cos v, R sen v + r cos u sen v, r sen u). 2 Del lat´ torus, que es el nombre dado en arquitectura a los salientes tubulares de las ın columnas. Obviamente no tiene nada que ver con taurus, el animal del mismo nombre en castellano.
  • 219.
    5.2. Espacios tangentes,diferenciales 203 Obviamente X es de clase C ∞ . Su restricci´n a ]0, 2π[ × ]0, 2π[ es inyectiva o y cubre todos los puntos del toro excepto los de las circunferencias u = 0 y v = 0. Si llamamos U al complementario de la uni´n de estas dos circunferencias o tenemos un abierto en R3 , y es claro que con ´l se cumple la definici´n de e o variedad. Igualmente se prueba que la restricci´n a ]−π, π[ × ]−π, π[ constituye o una carta para los puntos exceptuados. As´ pues, el toro es una superficie ı diferenciable de clase C ∞ . Sus meridianos son circunferencias de radio r. La esfera menos dos puntos ant´ ıpodas puede considerarse como la super- ficie de revoluci´n generada por la semicircunferencia (r sen φ, r cos φ), para o φ ∈ ]0, π[. La carta correspondiente es X(φ, θ) = (r sen φ cos θ, r sen φ sen θ, r cos φ), φ ∈ ]0, π[ , θ ∈ ]0, 2π[ . Si p = X(φ, θ) entonces θ es la longitud de p en el sentido geogr´fico y φ a es la “colatitud”, es decir, el ´ngulo respecto al polo norte. Los meridianos y a paralelos coinciden con los geogr´ficos. La carta no cubre los polos, aunque a girando la esfera obtenemos otra carta similar que los cubra. Ejemplo: Producto de variedades Si S1 ⊂ Rm1 y S2 ⊂ Rm2 son variedades entonces S1 × S2 ⊂ Rm1 +m2 es tambi´n una variedad. Si X1 : U1 −→ V1 ∩ S1 e es una carta alrededor de un punto p1 ∈ S1 y X2 : U2 −→ V2 ∩ S2 es una carta alrededor de p2 ∈ S2 , entonces X1 × X2 : U1 × U2 −→ (V1 × V2 ) ∩ (S2 × S2 ) dada ° ¢ por (X1 × X2 )(u1 , u2 ) = X1 (u1 ), X2 (u2 ) es una carta alrededor de (p1 , p2 ). Sean πi : S1 × S2 −→ Si las proyecciones. Si la carta X1 tiene coordenadas x1 , . . . , xn1 y la carta X2 tiene coordenadas y1 , . . . , yn2 , entonces las coordenadas de X1 × X2 son las funciones π1 ◦ xi y π2 ◦ yi , a las que podemos seguir llamando xi e yi sin riesgo de confusi´n. o 5.2 Espacios tangentes, diferenciales Al principio de la secci´n anterior anticip´bamos que los sistemas de coor- o a denadas en una variedad son un an´logo a los sistemas de coordenadas en un a espacio af´ La diferencia principal es que en el caso af´ las coordenadas est´n ın. ın a definidas sobre todo el espacio, mientras que en una variedad las tenemos defi- nidas s´lo en un entorno de cada punto. En esta secci´n desarrollaremos esta o o analog´ mostrando que toda variedad diferenciable se confunde en un entorno ıa de cada punto con una variedad af´ Para empezar, si p es un punto de una ın. variedad S, X es una carta alrededor de p y x es su sistema de coordenadas
  • 220.
    204 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o asociado, sabemos que ¢ un entorno de x(p) el punto X(x) se confunde con ° ¢° en p + dX° x(p)¢ x − x(p) , con lo que los puntos de S se confunden con los de p + dX x(p) [Rn ]. Definici´n 5.8 Sea S ⊂ Rm una variedad diferenciable de dimensi´n n y sea o o X : U −→ S una carta alrededor de un punto p ∈ S. Sea x ∈ U tal que X(x) = p. Llamaremos espacio tangente a S en p a la variedad lineal Tp (S) = dX(x)[Rn ]. Llamaremos variedad tangente a S por p a la variedad af´ p+Tp (S). ın Puesto que JX(x) tiene rango n, es claro que las variedades tangentes tienen dimensi´n n. El teorema 5.5 prueba que el espacio tangente no depende de la o carta con la que se construye, pues si X e Y son dos cartas alrededor de p, digamos X(x) = Y (y) = p, sabemos que g = X ◦ Y −1 es diferenciable en un entorno de x y X = g ◦ Y , luego dX(x) = dg(x) ◦ dY (y), luego dX(x) y dY (y) tienen la misma imagen (pues dg(x) es un isomorfismo). El teorema siguiente muestra m´s expl´ a ıcitamente que Tp (S) s´lo depende de S. o Teorema 5.9 Sea S ⊂ Rm una variedad diferenciable de dimensi´n n. En- o tonces Tp (S) est´ formado por el vector nulo m´s los vectores tangentes en p a a a todas las curvas regulares que pasan por p contenidas en S. ´ Demostracion: Sea X : U −→ S ¢ ° una carta alrededor de p. Podemos supo- ner que es de la forma X(x) = x, f (x) , para una cierta funci´n diferenciable f . o Sea X(p1 ) = p. Sea v ∈ Rn no nulo. Consideremos la curva x(t) = p1 + tv. Para valores suficientemente peque˜os de t se cumple que x(t) ∈ U . Consideremos la n curva α(t) = X(x(t)). Claramente α est´ contenida en S y cumple α(0) = p. a Su vector tangente en p es ° ¢ α0 (0) = dX x(0) (x0 (0)) = dX(p1 )(v). Esto prueba que todo vector de Tp (S) es de la forma indicada. Rec´ ıproca- mente, si α(t) es una curva regular contenida en S que pasa por p, digamos α(t0 ) = p, sea x(t) = X −1 (α(t)), definida en un entorno de t0 . Se cumple que x(t) es derivable, pues X −1 no es m´s que la restricci´n de la proyecci´n a o o π : Rm −→ ° n , que es diferenciable, luego x = α ◦ π. Tenemos α = x ◦ X, luego R ¢ α0 (t) = dX x(t) (x0 (t)). Esta relaci´n prueba que x0 (t) 6= 0 o de lo contrario o tambi´n se anular´ α0 (t). Por¢lo tanto x es regular. Adem´s la tangente de α e ıa ° a en p es α0 (t0 ) = dX(p1 ) x0 (t0 ) ∈ Tp (S). En la prueba de este teorema hemos visto un hecho importante: si α es una curva contenida en una variedad S y pasa por un punto p, dada una carta X : U −→ S alrededor de p, podemos trasladar a la carta el arco de curva alrededor de p, es decir, existe otra curva x en U de modo que α = x ◦ X (en un entorno de las coordenadas de p). En otras palabras, x es la representaci´n o de α en el mapa de S determinado por X. Ejercicio: Probar que el plano tangente a una gr´fica vista como variedad diferen- a ciable coincide con el que ya ten´ ıamos definido.
  • 221.
    5.2. Espacios tangentes,diferenciales 205 Precisemos la interpretaci´n geom´trica de la variedad tangente. Ya hemos o e justificado que los puntos de S se confunden con los de la variedad tangente Tp (S) en un entorno de p, pero m´s exactamente, si X es una carta alrededor a de p y x es su sistema de coordenadas, hemos visto que cada punto q ∈ S suficientemente pr´ximo a p se confunde con el punto o ° ¢° ¢ p + dX x(p) x(q) − x(p) ∈ p + Tp (S). Definici´n 5.10 Sea S ⊂ Rm , p ∈ S, sea X : U −→ V ∩ S una carta alrededor o de p y sea x su sistema de coordenadas. Llamaremos proyecci´¢° asociada a ¢ ° on X a la aplicaci´n πp : S ∩ V −→ Tp (S) dada por πp (q) = dX x(p) x(q) − x(p) . o Seg´n hemos visto, la interpretaci´n geom´trica de estas proyecciones con- u o e siste en que el paso q 7→ πp (q) es imperceptible si tomamos puntos q suficien- temente pr´ximos a p. Ahora veamos que las coordenadas de q en la carta o coinciden con las coordenadas de πp (q) asociadas a un cierto sistema de refe- rencia af´ en Tp (S). ın Sea X : U −→ S una carta de una variedad S. Sea X(x) = p. Entonces dX(x) : Rn −→ Tp (S) es un isomorfismo. Por consiguiente, si e1 , . . . , en son los vectores de la base can´nica en Rn , sus im´genes dX(x)(ei ) = Di X(x) forman o a una base de Tp (S). El espacio tangente no tiene una base can´nica pero, seg´n o u acabamos de ver, cada carta alrededor de p determina una base en Tp (S). Es claro que si q ∈ S est´ en el entorno de p cubierto por la carta, las coordenadas a de πp (q) en la base asociada en Tp (S) son x(q) − x(p), luego si con dicha base formamos un sistema de referencia af´ en p + Tp (S) cuyo origen sea el punto ° ¢° ¢ ın O = p − dX x(p) x(p) , tenemos que las coordenadas de πp (q) en este sistema son precisamente x(q). Cuando hablemos del sistema de referencia af´ asociado ın a la carta nos referiremos a ´ste. En conclusi´n, cada punto q de un entorno e o de p en S se confunde con el punto πp (q) de id´nticas coordenadas afines en la e variedad tangente p + Tp (S). Ejercicio: Probar que si S1 y S2 son variedades diferenciables y (p, q) ∈ S1 × S2 entonces T(p,q) (S1 × S2 ) = Tp (S1 ) × Tq (S2 ). Seguidamente generalizamos la noci´n de diferenciabilidad al caso de apli- o caciones entre variedades cualesquiera (no necesariamente abiertos de Rn ). Definici´n 5.11 Diremos que una aplicaci´n continua f : S −→ T entre dos o o variedades es diferenciable (de clase C q ) en un punto p ∈ S si existen cartas X e Y alrededor de p y f (p) respectivamente de modo que X ◦ f ◦ Y −1 sea diferenciable (de clase C q ) en X −1 (p). El teorema 5.5 implica que la diferenciabilidad de f en p no depende de la elecci´n de las cartas X e Y , en el sentido de que si unas cartas prueban que f o es diferenciable, otras cualesquiera lo prueban igualmente. Es f´cil ver que la composici´n de aplicaciones diferenciables es diferenciable. a o Una aplicaci´n f : U −→ Rm definida en un abierto U de Rn es diferenciable o
  • 222.
    206 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o en el sentido que ya ten´ ıamos definido si y s´lo si lo es considerando a U y a o Rm como variedades diferenciables (con la identidad como carta). Por el teorema 5.4, si S ⊂ T ⊂ Rm son variedades diferenciables, la inclusi´n o i : S −→ T es diferenciable, lo que se traduce en que las restricciones a S de las funciones diferenciables en T son funciones diferenciables en S. Es claro que todas estas propiedades valen tambi´n si sustituimos la diferen- e ciabilidad por la propiedad de ser de clase C q . Una aplicaci´n f : S −→ T entre dos variedades es un difeomorfismo si o es biyectiva, diferenciable y su inversa es diferenciable. Dos variedades son difeomorfas si existe un difeomorfismo entre ellas. Es obvio que las cartas de una variedad son difeomorfismos en su imagen. M´s a´n: a u Teorema 5.12 Todo difeomorfismo entre un abierto de Rn y un abierto de una variedad S en Rm es una carta para S. ´ Demostracion: Sea f : U −→ W un difeomorfismo, donde W ⊂ S es abierto en S. Entonces existe un abierto V en Rm tal que f [U ] = W = V ∩ S. Obviamente df tiene rango m´ximo en cada punto, con lo que se cumple la a definici´n de carta. o En particular tenemos que las coordenadas xi : S ∩ V −→ R asociadas a una carta X son funciones diferenciables (son la composici´n de X −1 con las o proyecciones πi : Rn −→ R). Ahora definimos la diferencial de una funci´n o diferenciable. Supongamos que f : S −→ T es una aplicaci´n entre dos variedades diferen- o ciable en un punto p. Sean X : U −→ S e Y : W −→ T cartas alrededor de p y f (p). Digamos que U (x) = p, Y (y) = f (p). Entonces j = X ◦ f ◦ Y −1 es diferenciable en x y tenemos las aplicaciones lineales siguientes: Tp (S) Tf (p) (T ) x x   dX(x) dY (y) dj(x) Rn − − − → Rm −−− Las flechas verticales representan isomorfismos, luego podemos definir la diferencial de f en p como la aplicaci´n lineal df (p) : Tp (S) −→ Tf (p) (T ) dada o por df (p) = dX(x)−1 ◦ dj(x) ◦ dY (y). Teniendo en cuenta que las diferenciales aproximan localmente a las funciones correspondientes no es dif´ convencerse ıcil de que df (p) se confunde con f cuando los puntos de Tp (S) se confunden con los de S. El teorema siguiente prueba que df (p) no depende de la elecci´n de o las cartas X e Y . Teorema 5.13 Sea f : S −→ T una aplicaci´n diferenciable en un punto p ∈ S. o Sea v ∈ Tp (S). Si α es cualquier curva contenida en S que pase por p con tangente v, entonces α ◦ f es una curva contenida en T que pasa por f (p) con tangente df (p)(v).
  • 223.
    5.2. Espacios tangentes,diferenciales 207 ´ Demostracion: Sean X e Y cartas alrededor de p y f (p) respectivamente. Digamos que X(x) = p e Y (y) = f (p). Sea β la representaci´n de α en la ° o¢ carta X, es decir, α = β ◦ X. Entonces v = α0 (t0 ) = dX(x) β 0 (t0 ) . Podemos descomponer α ◦ f = α ◦ X −1 ◦ X ◦ f ◦ Y −1 ◦ Y . Con la notaci´n o que hemos empleado en la definici´n de df (p) tenemos α ◦ f = β ◦ j ◦ Y . Esto o prueba que α ◦ f es derivable en t0 y adem´s a ≥ ° ¢¥ ≥ ° ¢¥ (α ◦ f )0 (t0 ) = dY (y) dj(x) β 0 (t0 ) = dY (y) dj(x) dX(x)−1 (v) = df (p)(v). Es inmediato comprobar que la regla de la cadena sigue siendo v´lida para a aplicaciones diferenciables entre variedades, es decir, ° ¢ d(f ◦ g)(p) = df (p) ◦ dg f (p) . De aqu´ se sigue en particular que si f es un difeomorfismo, entonces df (p) ı ° ¢ es un isomorfismo y df −1 f (p) = df (p)−1 . Si S ⊂ T ⊂ Rm son variedades diferenciables entonces el teorema anterior prueba que la diferencial de la inclusi´n i : S −→ T en cada punto p ∈ S es o simplemente la inclusi´n de Tp (S) en Tp (T ). De aqu´ se sigue que la diferencial o ı en un punto p de la restricci´n a S de una funci´n f diferenciable en T es o o simplemente la restricci´n de df (p) a Tp (S), pues la restricci´n no es m´s que o o a la composici´n con la inclusi´n. o o Si X : U −→ S es una carta de una variedad S alrededor de un punto p, entonces sus coordenadas asociadas xi son ciertamente diferenciables. M´s a concretamente, si πi : Rn −→ R es la proyecci´n en la i-´sima coordenada, o e tenemos que xi = X −1 ◦ πi , luego dxi (p) = dX(p)−1 ◦ dπi (x) y en particular Ω 1 si i = j dxi (p) (Dj X(x)) = dπi (x)(ej ) = 0 si i 6= j es decir, las aplicaciones dxi (p) forman la base dual de D1 X(x), . . . , Dn X(x). Por consiguiente, para cada v ∈ Tp (S) se cumple que dxi (p)(v) es la coordenada correspondiente a Di X(x) en la expresi´n de v como combinaci´n lineal de las o o derivadas de X. Ejemplo Consideremos el plano tangente a R2 en el punto p = (1, 1) (que es el propio R2 ). La base asociada a la carta identidad es simplemente la base can´nica (e1 , e2 ), y su base dual es la dada por las proyecciones dx(p), dy(p). o Tambi´n podemos considerar tambi´n la carta determinada por las coordenadas e e polares (ρ, θ), es decir, (x, y) = (ρ cos θ, ρ sen θ). Su base asociada es la formada por las derivadas parciales: v1 (ρ, θ) = (cos θ, sen θ), v2 (ρ, θ) = (−ρ sen θ, ρ cos θ).
  • 224.
    208 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o En particular, en el punto (1, 1) queda µ ∂ v1 1 1 v1 = √ , √ , v2 = (−1, 1). v2 dρ 2 2 dx p Dado un vector u ° R , sus coordenadas (en ∈ 2 ¢ dy la base can´nica) son dx(p)(u), dy(p)(u) , mien- ° o ¢ dθ u tras que dρ(p)(u), dθ(p)(u) son sus coordena- das en la base (v1 , v2 ). Conocemos la relaci´n entre las diferenciales: o dx = cos θ dρ − ρ sen θ dθ, dy = sen θ dρ + ρ cos θ dθ. Concretamente, en el punto (1, 1) se cumple √ √ 2 2 dx = dρ − dθ, dy = dρ + dθ. (5.1) 2 2 √ Sea ahora S la circunferencia de radio 2. Tres posibles cartas de S alrededor de (1, 1) son ° p ¢ °p ¢ √ g1 (x) = x, 2 − x2 , g2 (y) = 2 − y 2 , y , g3 (θ) = 2 (cos θ, sen θ). Sus funciones coordenadas son respectivamente (las restricciones de) las funciones x, y, θ, luego sus diferen- V ciales asociadas son las restricciones de las diferencia- les correspondientes, que seguiremos llamando dx(p), dy(p), dθ(p). Es f´cil ver que las bases asociadas a las a p tres cartas son respectivamente S vx = (1, −1), vy = (−1, 1), vθ = (−1, 1). Obviamente no podemos tomar a ρ como coordenada, pues ρ es constante en S. Esto se traduce en que dρ(p) = 0 (sobre Tp (S)). Alternativamente, vemos que los vectores de Tp (S) tienen nula la primera coordenada de su expresi´n en la o base (v1 , v2 ). Como consecuencia, de (5.1) se sigue ahora que dy = dθ = −dx. Ejemplo Consideremos el toro T de carta X(u, v) = (R cos v + r cos u cos v, R sen v + r cos u sen v, r sen u). Ya hemos comentado que X no es exactamente una carta de T , sino que las cartas de T son restricciones de X a dominios adecuados. Consideremos la circunferencia unidad S 1 = {x ∈ R2 | kxk = 1}. Entonces la aplicaci´n o f : S 1 × S 1 −→ T dada por f (x, y) = (Ry1 + rx1 y1 , Ry2 + rx1 y2 , rx2 )
  • 225.
    5.2. Espacios tangentes,diferenciales 209 es un difeomorfismo. Notemos que si x = (cos u, sen u), y = (cos v, sen v), enton- ces f (x, y) = X(u, v). Teniendo esto en cuenta es f´cil ver que f es biyectiva. a Adem´s es diferenciable porque sus funciones coordenadas son polin´micas (es a o la restricci´n de una funci´n diferenciable en R4 ). En un entorno de cada punto o o de T , la funci´n f −1 puede expresarse como (cos u, sen u, cos v, sen v), donde u, o v son las funciones coordenadas de la carta de T alrededor de punto obtenida por restricci´n de X. Por consiguiente f es un difeomorfismo. o Ejercicio: Probar que un cilindro es difeomorfo al producto de un segmento por una circunferencia y que una bola abierta menos su centro es difeomorfa al producto de un segmento por una esfera. Definici´n 5.14 Sea f : S −→ R una funci´n definida sobre una variedad y o o sea p ∈ S un punto donde f sea diferenciable. Sea X una carta de S alrededor de p y sean x1 , . . . , xn sus coordenadas asociadas. Definimos la derivada parcial de f respecto a xi en p como ∂f ° ¢ (p) = df (p) Di X(x) , ∂xi donde x es el vector de coordenadas de p en la carta dada. Es claro que esta noci´n de derivada parcial generaliza a la que ya ten´ o ıamos para el caso de funciones definidas en abiertos de Rn . En el caso general sea j = X ◦ f . Seg´n la definici´n de df (p) resulta que u o ∂f ∂j (p) = dj(x)(ei ) = (x), ∂xi ∂xi donde ei es el i-´simo vector de la base can´nica de Rn . Si f es diferenciable en e o un entorno de p tenemos ∂f ∂j = X −1 ◦ . ∂xi ∂xi Ahora es claro que una funci´n f es de clase C q en S si y s´lo si tiene o o derivadas parciales continuas de orden q. Puesto que dx1 (p), . . . , dxn (p) es la base dual de D1 X(x), . . . , Dn X(x), de la propia definici´n de derivada parcial se sigue que o ∂f ∂f df = dx1 + · · · + dxn . ∂x1 ∂xx Tambi´n es f´cil ver que las reglas usuales de derivaci´n de sumas y productos e a o siguen siendo v´lidas, as´ como el teorema de Schwarz. Adem´s a ı a Ω ∂xj 1 si i = j = ∂xi 0 si i 6= j. Es importante observar que la derivada de una funci´n f respecto a una o coordenada xi no depende s´lo de f y xi , sino de la carta de la cual forma o
  • 226.
    210 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o parte xi . Por ejemplo, si en la esfera de centro 0 y radio 1 consideramos un punto cuyas tres coordenadas (x, y, z) sean no nulas, en un entorno podemos considerar la carta de coordenadas (x, y), respecto a la cual ∂z x = −p . ∂x 1 − x2 − y 2 Sin embargo, tambi´n podemos considerar la carta de coordenadas (x, z) y en- e tonces resulta que ∂z = 0. ∂x 5.3 La m´trica de una variedad e Todas las propiedades m´tricas de Rn se derivan de su producto escalar, que e es una forma bilineal Rn × Rn −→ R. En una variedad S ⊂ Rm no tenemos definido un producto escalar, pero s´ tenemos uno en cada uno de sus espacios ı tangentes: la restricci´n del producto escalar en Rm . o Conviene introducir ciertos hechos b´sicos sobre formas bilineales. Puesto a que son puramente algebraicas las enunciaremos para un espacio vectorial arbi- trario E, pero en la pr´ctica E ser´ siempre el espacio tangente Tp (S) de una a a variedad S en un punto p. Fijada una base (v1 , . . . , vn ) de E, representare- mos su base dual por (dx1 , . . . , dxn ). Esta notaci´n —puramente formal en un o principio— se ajusta al unico ejemplo que nos interesa, pues si E = Tp (S) y ´ (v1 , . . . , vn ) es la base asociada a una carta X, entonces la base dual que en general hemos llamado (dx1 , . . . , dxn ) es concretamente la formada por las dife- renciales dx1 (p), . . . , dxn (p), donde x1 , . . . , xn son las funciones en S que a cada punto le asignan sus coordenadas respecto a X. Definici´n 5.15 Sea E un espacio vectorial de dimensi´n n. Llamaremos B(E) o o al conjunto de todas las formas bilineales F : E × E −→ R, que es claramente un espacio vectorial con la suma y el producto definidos puntualmente.3 Si f, g : E −→ R son aplicaciones lineales, definimos su producto tensorial como la forma bilineal f ⊗ g ∈ B(E) dada por (f ⊗ g)(u, v) = f (u)g(v). Las propiedades siguientes son inmediatas: a) f ⊗ (g + h) = f ⊗ g + f ⊗ h, (f + g) ⊗ h = f ⊗ h + g ⊗ h. b) (αf ) ⊗ g = f ⊗ (αg) = α(f ⊗ g), para α ∈ R. Teorema 5.16 Todo elemento de B(E) se expresa de forma unica como ´ n X F = αij dxi ⊗ dxj , con αij ∈ R. i,j=1 Concretamente αij = F (vi , vj ). 3 Los elementos de B(E) se llaman tensores dos veces covariantes, pero aqu´ no vamos a ı entrar en el c´lculo tensorial. a
  • 227.
    5.3. La m´tricade una variedad e 211 ´ Demostracion: Basta observar que n 1 si i = r, j = s (dxi ⊗ dxj )(vr , vs ) = 0 en caso contrario. De aqu´ se sigue que F y el miembro derecho de la igualdad act´an igual sobre ı u todos los pares de vectores b´sicos. La unicidad es clara. a Por ejemplo, en estos t´rminos el producto escalar en Rn viene dado por e dx1 ⊗ dx1 + · · · + dxn ⊗ dxn . Definici´n 5.17 Un campo tensorial (dos veces covariante) en una variedad o S ⊂ Rm es una aplicaci´n que a cada p ∈ S le hace corresponder una forma o bilineal en Tp (S). El tensor m´trico de S es el campo g que a cada punto p le e asigna la restricci´n a Tp (S) del producto escalar en Rm . o Si llamamos T (S) al conjunto de los campos tensoriales en S seg´n la defi- u nici´n anterior, es claro que se trata de un espacio vectorial con las operaciones o definidas puntualmente. M´s a´n, podemos definir el producto de una funci´n a u o f : S −→ R por un campo F ∈ T (S) como el campo f F ∈ T (S) dado por (f F )(p) = f (p)F (p). Sea X : U −→ S una carta de S. Representaremos por x1 , . . . , xn las funciones coordenadas respecto a X. Si x ∈ U y p = X(x), sabemos que D1 X(x), . . . , Dn X(x) es una base de Tp (S) y dx1 (p), . . . , dxn (p) es su base dual. Por consiguiente, todo w ∈ Tp (S) se expresa como w = dx1 (p)(w)D1 X(x(p)) + · · · + dxn (p)(w)Dn X(x(p)). As´ pues, si w1 , w2 ∈ Tp (S), su producto escalar es ı n X gp (w1 , w2 ) = Di X(x(p))Dj X(x(p))dxi (p)(w1 )dxj (p)(w2 ), i,j=1 luego n X gp = gij (p)dxi (p) ⊗ dxj (p), con gij (p) = Di X(x(p))Dj X(x(p)), i,j=1 o, m´s brevemente, como igualdad de campos: a n X g= gij dxi ⊗ dxj , (5.2) i,j=1 Esta expresi´n recibe el nombre de expresi´n en coordenadas del tensor o o m´trico de S en la carta X. Las funciones gij se llaman coeficientes del tensor e m´trico en la carta dada. Claramente son funciones diferenciables. Notemos e que la expresi´n coordenada no est´ definida en toda la variedad S, sino s´lo o a o sobre los puntos del rango V de la carta X.
  • 228.
    212 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o La matriz (gij (p)) es la matriz del producto escalar de Tp (S) en una cierta base. Es claro entonces que su determinante es no nulo. Este hecho ser´ rele- a vante en varias ocasiones. A trav´s del difeomorfismo X : U −→ V juntamente con los isomorfismos e dX(x) : Rn −→ Tp (S) podemos transportar la restricci´n a V del tensor m´trico o e de S hasta un campo tensorial en U , concretamente el dado por ° ¢ hX (w1 , w2 ) = gp dX(x)(w1 ), dX(x)(w2 ) n X = gij (X(x)) dxi (X(x))(dX(x)(w1 )) dxj (X(x))(dX(x)(w2 )) i,j=1 n X = gij (X(x)) d(X ◦ xi )(x)(w1 ) d(X ◦ xj )(x)(w2 ) i,j=1 n X = gij (x) dxi (x)(w1 ) dxj (x)(w2 ), i,j=1 donde en el ultimo t´rmino xi es simplemente la proyecci´n en la i-´sima coor- ´ e o e denada de U y gij (x) = (X ◦ gij )(x). Por lo tanto hX tiene la misma expresi´n o (5.2) interpretando convenientemente las funciones. Al transportar a la carta el tensor m´trico, podemos calcular el producto e de dos vectores tangentes a dos curvas α y β que ° cortan en p a partir ¢de se ¢ ° sus representaciones en X. Digamos que α(t) = X x(t) y β(t) = X x(t) y ¯ supongamos que en t0 pasan por p. Entonces gp (α0 (t0 ), β 0 (t0 )) = hX (x0 (t0 ), x0 (t0 )). ¯ Del mismo modo que el tensor m´trico de una variedad S asigna a cada e punto p el producto escalar de Tp (S), tambi´n podemos considerar la aplicaci´n e o ´ que a cada punto p le asigna la norma en Tp (S). Esta recibe el nombre de elemento de longitud de S y se representa por ds. As´ pues, ı q ds(p)(v) = kvk = gp (v, v). El tensor m´trico y el elemento de longitud se determinan mutuamente por e la relaci´n o ds2 (p)(u + v) = ds2 (p)(u) + ds2 (p)(v) + 2gp (u, v), luego en la pr´ctica es equivalente trabajar con uno o con otro y ds suele dar a lugar a expresiones m´s simples. Por ejemplo, la expresi´n de ds2 en una carta a o es Xn ds2 = gij dui duj . (5.3) i,j=1
  • 229.
    5.3. La m´tricade una variedad e 213 La misma expresi´n es v´lida para el campo que resulta de transportarlo al o a dominio de la carta interpretando adecuadamente las funciones. El nombre de elemento de longitud se debe a que si α : [a, b] −→ S es una curva regular cuya imagen est´ contenida en el rango de una carta X y a α(t) = X(x(t)), entonces ds2 (x0 (t)) = kα0 (t)k2 , luego la longitud de α es v Z b Z buX u n L = kα0 (t)k dt = t gij (x(t))x0 (t)x0 (t) dt i j a a i,j=1 v Z buX Z u n b = t gij (x(t)) x0 (t)dt x0 (t)dt = i j ds, a i,j=1 a entendiendo ahora que en (5.3) x = x(t) y dxi = x0 (t)dt. En el caso de una superficie S ⊂ R3 es costumbre representar las derivadas parciales de una carta X(u, v) mediante Xu , Xv y los coeficientes del tensor m´trico como E = Xu Xu , F = Xu Xv , G = Xv Xv , de modo que la expresi´n e o en coordenadas del tensor m´trico es e E du ⊗ du + F (du ⊗ dv + dv ⊗ du) + G dv ⊗ dv. (5.4) El elemento de longitud es ds2 = E du2 + 2F dudv + G dv 2 . Ejemplo Vamos a calcular los coeficientes del tensor m´trico de la superficie e de revoluci´n dada por o ¢ X = (r(u) cos v, r(u) sen v, z(u) . Tenemos ° 0 ¢ Xu = r (u) cos v, r0 (u) sen v, z 0 (u) ° ¢ Xv = −r(u) sen v, r(u) cos v, 0 , luego E = r0 (u)2 + z 0 (u)2 , F = 0, G = r(u)2 . Observemos que E es el m´dulo al cuadrado de la curva que genera la su- o perficie, luego si su parametrizaci´n es la natural tenemos simplemente E = 1. o ° ¢ En el caso del toro tenemos r(u), z(u) = (R + r cos u, r sen u), luego E = r2 , F = 0, G = (R + r cos u)2 . ° Por lo¢tanto la longitud de una curva que sobre la carta venga dada por u(t), v(t) se calcula integrando ds2 = r2 du2 + (R + r cos u)2 dv 2 .
  • 230.
    214 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o Por ejemplo, la longitud de un arco de paralelo (u0 , t), donde t ∈ [0, k] es Z k Z k ds = (R + r cos u0 ) dt = (R + r cos u0 )k, 0 0 como era de esperar, dado que el paralelo es un arco de circunferencia de radio R + r cos u0 . Ejercicio: Calcular los coeficientes del tensor m´trico del cilindro, el cono y la esfera. e Definici´n 5.18 Diremos que un difeomorfismo f : S −→ T entre dos varie- o dades es una isometr´ si para todo arco α contenido en S se cumple que α ◦ f ıa tiene la misma longitud.4 Expl´ıcitamente, si f es una isometr´ y α : [a, b] −→ S es un arco y α(t0 ) = p, ıa entonces Z Z t t kα0 (x)k dx = k(α ◦ f )0 (x)k dx, a a y derivando resulta ° ¢ kα0 (t0 )k = k(α ◦ f )0 (t0 )k = kdf (p) α0 (t0 ) k. Ahora bien, todo vector no nulo de Tp (S) es de la forma α0 (t0 ) para un cierto arco α, luego tenemos que df (p) : Tp (S) −→ Tf (p) (T ) es una isometr´ para todo ıa punto p. Igualmente se prueba el rec´ ıproco. Ejercicio: Probar que las isometr´ de Rn en Rn en el sentido que acabamos de ıas definir coinciden con las isometr´ en el sentido del ´lgebra lineal. ıas a Si f es una isometr´ X es una carta alrededor de p con X(x) = p y llamamos ıa, Y = X ◦ f , es claro que Y es una carta alrededor de f (p). Adem´s tenemos que ° ¢ a Di Y (x) = dY (x)(ei ) = df (p) dX(x)(ei ) = df (p)(Di X(x)), de donde se sigue que los coeficientes del tensor m´trico son iguales en ambas cartas, es decir, e gij (x) = Di X(x)Dj X(x) = Di Y (x)Dj Y (x). Similarmente se concluye que si dos variedades tienen cartas con un mismo domi- nio y con los mismos coeficientes gij del tensor m´trico entonces los fragmentos e de superficie cubiertos por las cartas son superficies isom´tricas. e Ejemplo Consideremos la carta del cilindro dada por ° v v ¢ X(u, v) = r cos , r sen , u . r r El elemento de longitud del cilindro es, en esta carta, ds2 = du2 + dv 2 , que es exactamente la misma que la del plano con la identidad como carta. La aplicaci´n X no es una isometr´ porque no es biyectiva, pero s´ es una isometr´ o ıa ı ıa local, en el sentido de que todo punto del plano tiene un entorno V de modo que la restricci´n de X es una isometr´ entre U y X[U ]. As´ pues, un cilindro o ıa ı es localmente isom´trico a un plano. e 4 En ıtulo siguiente probaremos que toda curva de clase C 1 es rectificable. Conside- el cap´ raremos que esta definici´n se aplica a curvas y aplicaciones de clase C 1 , con lo que siempre o tendremos garantizado el car´cter rectificable. a
  • 231.
    5.4. Geod´sicas e 215 *Ejemplo Observemos que las distintas expresiones que hemos obtenido para la longitud de un arco en el plano hiperb´lico son de la forma (5.4) para ciertas o funciones E, F , G. El caso m´s simple es el del semiplano de Poincar´, donde a e E = G = 1/v 2 , F = 0. Sucede que los distintos modelos del plano hiperb´lico o se comportan como cartas de una superficie que no conocemos, pero de la que tenemos su elemento de longitud. Existe una teor´ abstracta de variedades ıa diferenciales que permite tratar como tales a espacios topol´gicos dotados de o una “estructura diferenciable”, definida adecuadamente, sin necesidad de que est´n sumergidos en Rn . El plano hiperb´lico es una variedad en este sentido e o abstracto. ıptico casi puede considerarse como una superficie en R3 : la esfera El plano el´ de radio 1. En realidad una esfera no es un plano el´ıptico, pues hemos de identi- ficar los puntos ant´ ıpodas. Sin embargo, un “fragmento” no demasiado grande de plano el´ıptico es isom´trico a un fragmento de esfera. Por ello podemos con- e siderar a las cartas de una esfera que no cubran m´s de una semiesfera como a cartas del plano el´ ıptico. Un tratamiento completamente riguroso requerir´ el ıa concepto abstracto de variedad diferenciable. 5.4 Geod´sicas e Imaginemos la superficie S de un planeta cuyos habitantes creen que es plano. Cuando ´stos creen caminar en l´ e ınea recta en realidad sus trayectorias son curvas, sin embargo su distinci´n entre rectas y curvas tiene un significado o objetivo. Tratemos de explicitarlo. Sea Np (S) el espacio normal a S en p, es decir, el complemento ortogonal de Tp (S). Consideremos una curva α contenida en S. Entonces α0 (t) ∈ Tα(t) (S). Podemos descomponer α00 (t) = vt (t) + vn (t), donde vt (t) ∈ Tα(t) (S) y vn (t) ∈ Nα(t) (S). La descomposici´n es unica. El o ´ vector vn contiene la parte de la aceleraci´n que mantiene a los habitantes del o planeta pegados a su superficie (la gravedad) y es “invisible” para ellos, pues si el planeta fuera realmente plano la gravedad no curvar´ sus trayectorias. El ıa vector vt contiene la variaci´n de la velocidad que ellos detectan: determina si o la trayectoria se curva a la izquierda o a la derecha. Ellos llaman rectas a las curvas que cumplen vt = 0. A continuaci´n desarrollamos estas ideas en un o contexto m´s general: a Definici´n 5.19 Sea S ⊂ Rm una variedad de dimensi´n n, sea α : I −→ S una o o curva regular y V : I −→ Rm una funci´n de clase C 1 tal que para todo t ∈ I o se cumpla V (t) ∈ Tα(t) (S). En estas condiciones diremos que V es un campo de vectores sobre α. Llamaremos derivada covariante de V en cada punto t a la proyecci´n ortogonal de V 0 (t) sobre Tα(t) (S). La representaremos por DV (t). o En la situaci´n que describ´ o ıamos antes, el vector vt es la derivada covariante del campo dado por V (t) = α0 (t). Para ilustrar el caso general podemos pensar en un habitante del planeta S que camina rumbo norte con su brazo derecho apuntando hacia el noreste. Si interpretamos el brazo como un campo de vec- tores sobre su trayectoria, desde el punto de vista del caminante ´ste apunta e
  • 232.
    216 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o siempre en la misma direcci´n, pues ´l camina “recto”, es decir, sin desviarse ni o e hacia el este ni hacia el oeste, y su brazo forma un ´ngulo fijo con su direcci´n a o de avance. En otras palabras, considera que el campo vectorial es constante y su derivada es nula. Esto es falso, pues en realidad su trayectoria no es recta, sino una circunferencia y su brazo s´ cambia de direcci´n (el unico caso en que ı o ´ la direcci´n no variar´ ser´ si apuntara al este o al oeste, con lo que siem- o ıa ıa pre marcar´ la direcci´n perpendicular al plano de la circunferencia en que se ıa o mueve). La que en realidad es nula es la derivada covariante del campo, que los habitantes confunden con la derivada total al desconocer la curvatura de su planeta. En las condiciones de la definici´n anterior, sea X : U ¢ o ° −→ S una carta de S y expresemos la curva (localmente) como α(t) = X x(t) . Entonces una base de Tα(t) (S) en cada punto es D1 X(x(t)), . . . , Dn X(x(t)), luego podremos expresar V (t) = a1 (t)D1 X(x(t)) + · · · + an (t)Dn X(x(t)), (5.5) para ciertas funciones ai (t). Multiplicando la igualdad por Di X(x(t)) se obtiene un sistema de ecuaciones lineales con coeficientes gij (x(t)). Como el determi- nante es no nulo, resolviendo el sistema concluimos que las funciones ai (t) son derivables. Entonces n X n X V 0 (t) = a0 (t)Di X(x(t)) + i ai (t)Dij X(x(t))x0 (t). j (5.6) i=1 i,j=1 El primer t´rmino es tangente a S, luego no se altera al tomar la proyecci´n e o ortogonal. Para calcular la proyecci´n del segundo conviene introducir un nuevo o concepto: Definici´n 5.20 Sea X : U −→ S una carta de una variedad S. Llamaremos o ımbolos de Christoffel de S en la carta X a las funciones Γk : U −→ R que s´ ij cumplen Xn Dij X = Γk Dk X + Nij , ij (5.7) k=1 donde Nij (x) ∈ Np (S) (con p = X(x)). Observemos que Γk = Γk . ij ji Las proyecciones de las segundas parciales Dij X se obtienen eliminando la componente Nij , con lo que al calcular la proyecci´n de (5.6) llegamos a que la o derivada covariante de V viene dada por X≥ n n X ¥ DV = a0 + k ai Γk x0 Dk X. ij j (5.8) k=1 i,j=1
  • 233.
    5.4. Geod´sicas e 217 Un hecho muy importante es que los s´ ımbolos de Christoffel, y por consi- guiente la derivada covariante, dependen unicamente de los coeficientes gij de la ´ primera forma fundamental de S. En efecto, multiplicando las ecuaciones (5.7) por Dl X obtenemos X n Dij XDl X = gkl Γk . ij k=1 Una simple comprobaci´n nos da que o 1 Dij XDl X = (Di gjl + Dj gil − Dl gij ), 2 luego en total resulta n X 1 gkl Γk = ij (Di gjl + Dj gil − Dl gij ). (5.9) 2 k=1 Fijando i, j y variando l obtenemos un sistema de n ecuaciones lineales con o ımbolos Γk en n inc´gnitas y coeficientes (gkl ), que nos permite despejar los s´ ij t´rminos de los coeficientes gij y sus derivadas, como quer´ e ıamos probar. Ahora nos ocupamos con detalle del caso particular que describ´ ıamos al principio de la secci´n: o Definici´n 5.21 Sea α(t) una curva contenida en una variedad S. Llamaremos o aceleraci´n geod´sica5 de α a la derivada covariante del campo vectorial α0 . o e Supongamos que α est´ parametrizada por el arco. Entonces kα0 (s)k = 1, a luego derivando resulta α00 (s)α0 (s) = 0, y esta ortogonalidad se conserva al proyectar sobre Tp (S), de modo que Dα0 (s) es perpendicular al vector tangente de α. Llamaremos curvatura geod´sica de α a κg = kDα0 k. Si κg 6= 0 definimos el e vector normal geod´sico de α como el vector κ−1 Dα0 , de modo que Dα0 = κg ng . e g En el caso de que α no est´ parametrizada por el arco el vector normal e geod´sico y la curvatura geod´sica se definen a trav´s de su parametrizaci´n e e e o natural. Expl´ıcitamente, si α(t) es una curva contenida en S y s(t) es su longitud de arco, usando la notaci´n v = s0 (t) = kα0 (t)k, a = v 0 (t) para la velocidad y o aceleraci´n sobre la trayectoria y T = α0 (s) para el vector tangente, tenemos o α0 (t) = vα0 (s), α00 (t) = aT + v 2 α00 (s). Al proyectar sobre el espacio tangente resulta Dα0 (t) = aT + v 2 κg ng . De este modo, la aceleraci´n geod´sica de α se descompone en una acele- o e raci´n tangencial, cuyo m´dulo a es la tasa de variaci´n de la velocidad v, y una o o o 5 La geodesia (gr. = divisi´n de la tierra) estudia la forma de la Tierra, deducida a partir de o mediciones realizadas desde su superficie. La geometr´ diferencial ha adoptado este adjetivo ıa para referirse en general a los conceptos que puede medir un “habitante” de una variedad arbitraria sin salir de ella.
  • 234.
    218 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o aceleraci´n normal, cuyo m´dulo es v 2 κg . Un habitante del planeta S que “crea” o o vivir en Tp (S) confundir´ la aceleraci´n geod´sica, el vector normal geod´sico y a o e e la curvatura geod´sica de α con la aceleraci´n, el vector normal y la curvatura e o de α. Por lo tanto llamar´ rectas a las curvas sin aceleraci´n geod´sica: a o e Definici´n 5.22 Una curva α contenida en una variedad S es una geod´sica6 si o e cumple κg = 0, o equivalentemente, si Dα0 es proporcional a α0 en cada punto. En tal caso el factor de proporcionalidad es simplemente a = s00 (t), donde s es la longitud de arco, por lo que si α est´ parametrizada por el arco entonces α a es una geod´sica si y s´lo si Dα0 = 0. e o Vamos a particularizar las ecuaciones que determinan la derivada covariante de un campo al caso de la aceleraci´n geod´sica de una curva. Si α(t) = X(x(t)), o e entonces n X α0 (t) = Di X(x(t))x0 (t), i i=1 luego si en (5.5) hacemos V = α0 tenemos ai = x0 , luego la f´rmula (5.8) se i o convierte en X≥ n Xn ¥ DV = x00 + k Γk x0 x0 Dk X. ij i j k=1 i,j=1 El vector ≥ n X ¥n x00 + k Γk x0 x0 ij i j k=1 i,j=1 es la antiimagen por dX de Dα0 , es decir, la representaci´n en el mapa de la o aceleraci´n geod´sica de α. Lo llamaremos expresi´n en coordenadas de dicha o e o aceleraci´n geod´sica. o e La condici´n necesaria y suficiente para que una curva parametrizada por el o arco de coordenadas x(s) sea una geod´sica es e n X x00 + k Γk x0 x0 = 0, ij i j k = 1, . . . , n. (5.10) i,j=1 Si la parametrizaci´n es arbitraria s´lo hemos de exigir que el vector formado o o por los miembros izquierdos sea proporcional a x0 . Ejemplo Si una carta X(u, v) de una superficie S ⊂ R3 cumple F = 0, las ecuaciones (5.9) se reducen a Eu Ev Ev Γ1 11 = , Γ2 = − 11 , Γ1 = 12 , 2E 2G 2E Gu Gu Gv Γ2 12 = , Γ1 22 =− , Γ2 22 = . (5.11) 2G 2E 2G 6 Deber´ıamos decir “recta geod´sica”, es decir, el equivalente en S a una recta, pero es e preferible contraer el t´rmino pues, al fin y al cabo, normalmente las geod´sicas no son rectas. e e
  • 235.
    5.4. Geod´sicas e 219 Ejemplo En un plano (tomando como carta la identidad) todos los s´ ımbolos de Christoffel son nulos, por lo que las geod´sicas parametrizadas por el arco e son las curvas que cumplen (u00 , v 00 ) = (0, 0), es decir, las rectas. ° ¢ Ejemplo En la superficie de revoluci´n generada por la curva r(u), z(u) , o suponiendo a ´sta parametrizada por el arco, los unicos s´ e ´ ımbolos de Christoffel no nulos son r0 (u) Γ2 = 12 , Γ1 = −r(u)r0 (u). 22 r(u) Por lo tanto las ecuaciones de las geod´sicas parametrizadas por el arco son e r0 (u) u00 = v 02 r(u)r0 (u), v 00 = −2u0 v 0 . r(u) Es inmediato comprobar que los meridianos (t, v0 ) cumplen estas ecuaciones, luego son geod´sicas. Si se cumple r0 (u) = 0, (por ejemplo en los extremos e locales de r) entonces el paralelo (u0 , t) tambi´n cumple las ecuaciones, luego es e una geod´sica. e En el caso concreto de la esfera los meridianos son los arcos de circunferencia de radio m´ximo que unen los polos. Dada la simetr´ de la esfera, que permite a ıa tomar cualquier par de puntos ant´ ıpodas como polos, podemos afirmar que todas las circunferencias m´ximas son geod´sicas. Para una carta dada, el unico a e ´ paralelo (u0 , t) que cumple r0 (u0 ) = 0 es el ecuador de la esfera, que tambi´n es e una circunferencia m´xima, luego ya sab´ a ıamos que es una geod´sica. e *Ejemplo Las f´rmulas que determinan los s´ o ımbolos de Christoffel a partir de los coeficientes del tensor m´trico hacen que tenga sentido calcularlos en el caso e de los planos el´ıptico e hiperb´lico, donde la definici´n de derivada covariante o o que hemos dado no es aplicable. El hecho de que las circunferencias m´ximas de a una esfera sean geod´sicas se traduce en que las rectas el´ e ıpticas sean geod´sicas e del plano el´ıptico (pues ´ste es localmente isom´trico a una esfera de radio 1). e e Veamos ahora que las rectas hiperb´licas son geod´sicas del plano hiperb´lico. o e o Para ello trabajaremos con el semiplano de Poincar´, donde los s´ e ımbolos de Christoffel son m´s sencillos. Teniendo en cuenta que E = G = 1/v 2 y F = 0 a es f´cil ver que los unicos s´ a ´ ımbolos no nulos son 1 1 1 Γ2 = 11 , Γ1 = − , 12 Γ2 = − . 22 v v v La aceleraci´n covariante de una curva de coordenadas (u, v) tiene coorde- o nadas µ ∂ u0 v 0 00 u02 − v 02 u00 − 2 , v + . v v Para las rectas verticales (u, v) = (u0 , t) la aceleraci´n es (0, −1/t), que o efectivamente es proporcional a (u0 , v 0 ) = (0, 1), luego son geod´sicas. Las rectas e
  • 236.
    220 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o proyectivas restantes son las semicircunferencias (u, v) = (u0 + r cos t, r sen t). Un simple c´lculo nos da que la aceleraci´n en este caso es a o µ ∂ cos2 t cos t r cos t, −r =− (−r sen t, r cos t), sen t sen t proporcional a (u0 , v 0 ), luego todas las rectas proyectivas son geod´sicas. e 5.5 Superficies Terminaremos el cap´ ıtulo con algunos resultados espec´ ıficos sobre superficies S ⊂ R3 . Si X es una carta de una superficie S, entonces Xu , Xv son en cada punto (u, v) una base del plano tangente en X(u, v), luego el vector Xu ∧ Xv es no nulo y perpendicular a dicho plano. Si llamamos α al ´ngulo formado por a Xu y Xv en un punto dado, entonces kXu ∧ Xv k2 = kXu k2 kXv k2 (1 − cos2 α) = Xu Xu Xv Xv − (Xu Xv )2 = EG − F 2 . √ As´ pues, kXu ∧ Xv k = EG − F 2 . ı Definici´n 5.23 La aplicaci´n de Gauss asociada a una carta X : U −→ S de o o una superficie S es la aplicaci´n n : U −→ R3 dada por o Xu ∧ Xv Xu ∧ Xv n(u, v) = =√ . kXu ∧ Xv k EG − F 2 De este modo, n(u, v) es en cada punto un vector unitario perpendicular a S en X(u, v). Esto lo determina completamente salvo en su sentido. Si cambiamos de carta, el sentido de n puede cambiar. ¯ Si X y X son dos cartas que cubren una misma regi´n conexa de una va- o riedad, entonces n(u, v) = ≤(u, v)¯ (u, v), donde ≤(u, v) = ±1. Es claro que ≤ es n una funci´n continua en un conexo, luego ha de ser constante. En definitiva, o n(u, v) = ±¯ (u, v). Resulta, pues, que en un entorno de cada punto de S existen n exactamente dos determinaciones opuestas del vector normal. A cualquiera de ellas la llamaremos tambi´n aplicaci´n de Gauss de la superficie. e o Si llamamos G ⊂ S a la imagen de X, la aplicaci´n n induce otra aplicaci´n o o n : G −→ S 2 , donde S 2 es la esfera de centro (0, 0, 0) y radio 1, que est´ a un´ıvocamente determinada en un entorno de cada punto excepto por su signo. Es importante notar que no siempre es posible extender esta aplicaci´n n a toda o la superficie S (sin perder la continuidad). De momento no vamos a entrar en detalles, pero la figura muestra un ejemplo de variedad sobre la cual no es posible definir un vector normal. Se la conoce como banda de M¨bius. Es una cinta pegada por sus extre- o mos tras haberla girado media vuelta. Si la aplicaci´n o de Gauss pudiera definirse sobre toda la banda M , al componerla con una curva α : R −→ M que d´ una e
  • 237.
    5.5. Superficies 221 vuelta completa obtendr´ ıamos un vector normal sobre α que variar´ de forma ıa continua, pero es claro que al dar una vuelta completa el vector normal termina en sentido inverso a como empez´, cuando por continuidad deber´ tender al o ıa vector de partida. La aplicaci´n de Gauss aporta informaci´n importante sobre las superficies o o y simplifica algunos de los conceptos que hemos estudiado para variedades ar- bitrarias. Por ejemplo, en la secci´n anterior hemos estudiado la componente o tangencial (o geod´sica) de la curvatura de una curva contenida en una varie- e dad. Del mismo modo podemos definir la curvatura normal como el m´dulo deo la componente normal de la segunda derivada. En el caso de las superficies en R3 podemos apoyarnos en la aplicaci´n de Gauss. o Definici´n 5.24 Sea S una superficie (al menos de clase C 2 ) y α una curva o contenida en S parametrizada por el arco y que pase por un punto p. Fijada una determinaci´n n del vector normal a S alrededor de p, llamaremos curvatura o normal de α a κn = α00 n. Definimos Nn = κn n y Nt = α00 − Nn . Notemos que el signo de κn depende de la determinaci´n que elijamos de la o ° ¢ aplicaci´n de Gauss. Supongamos que sobre una carta la curva es u(t), v(t) . o Entonces α0 = Xu u0 + Xv v 0 , α00 = Xuu u02 + Xu u00 + Xuv u0 v 0 + Xuv u0 v 0 + Xvv v 02 + Xv v 00 , luego κn = α00 n = (Xuu n)u02 + 2(Xuv n)u0 v 0 + (Xvv n)v 02 . Llamamos e = Xuu n, f = Xuv n, g = Xvv n, que son funciones de la carta X (salvo por el signo, que depende de la elecci´no del sentido de n). Si la parametrizaci´n de la curva no es la natural y s(t) es la o longitud de arco, usamos la regla de la cadena: du du ds dv dv ds = , = , dt ds dt dt ds dt con la que la f´rmula, llamando ahora u0 , v 0 , s0 a las derivadas respecto de t o (hasta ahora eran las derivadas respecto de s), se convierte en e u02 + 2f u0 v 0 + g v 02 κn = . s02 Observemos que esta expresi´n no depende de la curva (u, v), sino s´lo de o o su derivada (u0 , v 0 ) (recordemos que s0 = k(u0 , v 0 )k). De aqu´ deducimos: ı Teorema 5.25 (Teorema de Meusnier) Si S es una superficie, todas las curvas contenidas en S que pasan por un punto p con un mismo vector tan- ´ gente tienen la misma curvatura normal. Esta viene dada por e du2 + 2f dudv + g dv 2 κn = . E du2 + 2F dudv + G dv 2
  • 238.
    222 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o ´ Demostracion: Es claro que X es una carta alrededor de p y α es una curva contenida en S que pasa por p con vector tangente w, entonces la re- presentaci´n de α en la carta X es X −1 ◦ α, luego el vector tangente de esta o representaci´n —el que en la discusi´n previa al teorema llam´bamos (u0 , v 0 )— ° o ¢ o a es du(p)(w), dv(p)(w) , donde ahora u y v son las funciones coordenadas de X. As´ pues, la f´rmula que hab´ ı o ıamos obtenido nos da que e(p) du(p)2 (w) + 2f (p) du(p)(w)dv(p)(w) + g(p) dv(p)2 (w) κn (p)(w) = , E(p) du(p)2 (w) + 2F (p) du(p)(w)dv(p)(w) + G dv(p)2 (w) entendiendo aqu´ a e, f , g como las composiciones con X −1 de las funciones del ı mismo nombre que ten´ ıamos definidas. Definici´n 5.26 El elemento de longitud de una superficie S se conoce tambi´n o e con el nombre que le dio Gauss: la primera forma fundamental de S. Definimos la segunda forma fundamental de S como la aplicaci´n que a p ∈ S y cada vector o w ∈ Tp (S) le asigna la curvatura normal en p de las curvas contenidas en S que pasan por p con tangente w multiplicada por kwk2 . El teorema anterior prueba que la segunda forma fundamental es en cada punto puna forma cuadr´tica definida sobre Tp (S). Concretamente, si fijamos a una carta tenemos F 1 = E du2 + 2F dudv + G dv 2 , F 2 = e du2 + 2f dudv + g dv 2 . Ambas formas cuadr´ticas pueden considerarse definidas tanto sobre la su- a perficie S como sobre el dominio de la carta (en cuyo caso du y dv representan simplemente las proyecciones de R2 ). Sin embargo, una diferencia importante es que, aunque las expresiones anteriores son v´lidas unicamente sobre el rango de a ´ una carta, la primera forma fundamental est´ definida sobre toda la superficie a y est´ completamente determinada por la misma, mientras que la segunda s´lo a o la tenemos definida en un entorno de cada punto y adem´s salvo signo. a Para calcular expl´ ıcitamente la segunda forma fundamental de una superficie notamos que Xu ∧ Xv (Xuu , Xu , Xv ) e = Xuu n = Xuu = √ , kXu ∧ Xv k EG − F 2 e igualmente (Xuv , Xu , Xv ) (Xvv , Xu , Xv ) f= √ , g= √ . EG − F 2 EG − F 2 Ejemplo Los coeficientes de la segunda forma fundamental de la superficie de ° ¢ revoluci´n generada por la curva r(u), z(u) son o z 00 (u)r0 (u) − z 0 (u)r00 (u) z 0 (u)r(u) e= p , f = 0, g=p . r0 (u)2 + z 0 (u)2 r0 (u)2 + z 0 (u)2
  • 239.
    5.6. La curvaturade Gauss 223 ° ¢ Para el caso del toro tenemos r(u), z(u) = (R +r cos v, r sen v) luego queda e = r, f = 0, g = R cos u + r cos2 u. Ejercicio: Comprobar que la curvatura normal en todo punto de la esfera de radio r y en toda direcci´n es igual a ±1/r, donde el signo es positivo si elegimos el vector o normal que apunta hacia dentro de la esfera y negativo en caso contrario. 5.6 La curvatura de Gauss Es un hecho conocido que si F es una forma bilineal sim´trica en un espa- e cio eucl´ ıdeo existe una base ortonormal en la que la matriz de F es diagonal. Podemos aplicar esto a un plano tangente Tp (S) de una superficie tomando el producto escalar determinado por la primera forma fundamental y como F la segunda forma fundamental. Entonces concluimos que existe una base (e1 , e2 ) de Tp (S) en la cual las expresi´n en coordenadas de las formas fundamentales o es F 1 (x, y) = x2 + y 2 y F 2 (x, y) = λ1 x2 + λ2 y 2 . Los n´meros λ1 y λ2 son los valores propios de cualquiera de las matrices u de F 2 en cualquier base ortonormal de Tp (S), luego est´n un´ a ıvocamente de- terminados salvo por el hecho de que un cambio de carta puede cambiar sus signos. Podemos suponer λ1 ≤ λ2 . Entonces se llaman respectivamente curva- tura m´ınima y curvatura m´xima de S en p. En efecto, se trata del menor y el a mayor valor que toma F 2 entre los vectores de norma 1, pues λ1 = λ1 (x2 + y 2 ) ≤ λ1 x2 + λ2 y 2 = F 2 (x, y) ≤ λ2 (x2 + y 2 ) = λ2 . Si w ∈ Tp (S) tiene norma arbitraria entonces aplicamos esto a w/kwk y concluimos que F 2 (w) λ1 ≤ 1 ≤ λ2 , F (w) es decir, λ1 ≤ κn ≤ λ2 . As´ pues, λ1 y λ2 son la menor y la mayor curvatura ı normal que alcanzan las curvas que pasan por p. Adem´s se alcanzan en direc- a ciones perpendiculares e1 y e2 , llamadas direcciones principales en p. Notemos que puede ocurrir λ1 = λ2 , en cuyo caso la curvatura normal es la misma en todas direcciones y no hay direcciones principales distinguidas. Los puntos de S donde λ1 = λ2 se llaman puntos umbilicales. Veamos ahora c´mo calcular las direcciones principales en una carta. Consi- o deremos la f´rmula de Meusnier como funci´n (diferenciable) de dos variables. o o Si (du, dv) marca una direcci´n principal7 entonces κn es m´ximo o m´ o a ınimo 7 Aqu´ podemos considerar (du, dv) ∈ R2 . La notaci´n diferencial est´ motivada por lo ı o a siguiente: Fijada una carta con coordenadas u, v, una curva regular en la superficie viene determinada por una representaci´n coordenada (u(t), v(t)). El vector tangente a la curva en o un punto dado marcar´ una direcci´n principal si y s´lo si la f´rmula de Meusnier evaluada a o o o en (u0 (t), v 0 (t)) toma un valor m´ximo o m´ a ınimo, pero dicha f´rmula depende s´lo de las o o diferenciales (du(t), dv(t)), por lo que en realidad buscamos una relaci´n entre du y dv. o
  • 240.
    224 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o en este punto, luego el teorema 4.15 afirma que sus derivadas parciales han de anularse en ´l. As´ pues, se ha de cumplir e ı ∂κn 2(e du + f dv) 2(E du + F dv) 2 = − F (du, dv) = 0, ∂du F 1 (du, dv) F 1 (du, dv)2 ∂κn 2(f du + g dv) 2(F du + G dv) 2 = − F (du, dv) = 0. ∂dv F 1 (du, dv) F 1 (du, dv)2 Despejando obtenemos F 2 (du, dv) e du + f dv κn = 1 (du, dv) = , (5.12) F E du + F dv F 2 (du, dv) f du + g dv κn = 1 (du, dv) = . F F du + G dv Al igualar ambas ecuaciones obtenemos una condici´n necesaria para que un o vector indique una direcci´n principal. Es f´cil ver que puede expresarse en la o a forma: Ø Ø Ø dv 2 −dudv du2 Ø Ø Ø Ø E F G Ø = 0. Ø Ø Ø e f g Ø Si (E, F, G) (en un punto) es m´ltiplo de (e, f, g) entonces la ecuaci´n se u o cumple trivialmente, pero por otra parte es claro que la curvatura normal es constante y no hay direcciones principales. En caso contrario es claro tenemos una forma cuadr´tica con al menos dos coeficientes no nulos. Si suponemos, a por ejemplo, que el coeficiente de dv 2 es no nulo, entonces du 6= 0, y al dividir entre du2 la forma cuadr´tica se convierte en una ecuaci´n de segundo grado a o en la raz´n dv/du. Esta ecuaci´n tiene a lo sumo dos soluciones linealmente o o independientes, luego ´stas han de ser necesariamente las direcciones principales. e Por consiguiente la ecuaci´n caracteriza dichas direcciones. o Definici´n 5.27 Se llama curvatura media y curvatura total o de Gauss de una o superficie S en un punto p a los n´meros u λ1 + λ2 H= , K = λ1 λ2 . 2 Notemos que el signo de H depende de la carta, mientras que el de K es invariante. Si operamos en (5.12) obtenemos (e − Eκn )du + (f − F κn )dv = 0, (f − F κn )du + (g − Gκn )dv = 0. Puesto que el sistema tiene una soluci´n no trivial en (du, dv) se ha de o cumplir Ø Ø Ø e − Eκn f − F κn Ø Ø Ø Ø f − F κn g − Gκn Ø = 0,
  • 241.
    5.6. La curvaturade Gauss 225 o equivalentemente (EG − F 2 )κ2 − (eG − 2F f + gE)κn + (eg − f 2 ) = 0. n Esta ecuaci´n la cumplen las curvaturas principales κn = λ1 , λ2 y por otro o lado tiene s´lo dos soluciones, luego o eG − 2F f + gE H = , 2(EG − F 2 ) eg − f 2 K = . (5.13) EG − F 2 En particular vemos que la curvatura de Gauss es el cociente de los deter- minantes de las dos formas fundamentales. Ejercicio: Calcular la curvatura media y la curvatura de Gauss del cilindro, el cono, el toro y la esfera. Definici´n 5.28 Un punto p de una superficie S es el´ o ıptico o hiperb´lico seg´n o u si K(p) > 0 o K(p) < 0. Si K(p) = 0 distinguiremos entre puntos parab´licos, o cuando s´lo una de las curvaturas extremas es nula y puntos planos, cuando las o dos curvaturas extremas son nulas. Si un punto es el´ ıptico todas las curvas que pasan por ´l tienen la curvatura e normal del mismo signo, por lo que la superficie se curva toda hacia el mismo lado del plano tangente, como es el caso de la esfera o del toro. Si un punto es hiperb´lico entonces hay curvas (perpendiculares, de hecho) que pasan por ´l o e con curvaturas en sentidos opuestos, luego la superficie tiene puntos pr´ximos o a ambos lados del plano tangente. Es el caso del hiperboloide√ = x2 − y 2 , cuya z curvatura en la carta (u, v, u2 − v 2 ) viene dada por K = −4/ 4u2 + 4v 2 + 1 3 . Los puntos de un cilindro son parab´licos. Las curvas u =cte. y v =cte. o son circunferencias de radio r y rectas, respectivamente. Las primeras tienen curvatura normal λ2 = 1/r y las segundas λ1 = 0. Es f´cil ver que se trata de a las curvaturas principales. Todos los c´lculos son sencillos. a Todos los puntos de un plano son puntos planos. Otro ejemplo es el punto (0, 0) en la gr´fica de x3 + y 3 . a z = x2 − y 2 z = x3 + y 3
  • 242.
    226 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o Probamos ahora una caracterizaci´n algebraica de la curvatura de Gauss que o m´s adelante nos dar´ una interpretaci´n geom´trica de la misma. Observemos a a o e que si n es una determinaci´n del vector normal alrededor de un punto p en o una superficie S y llamamos S 2 a la esfera de centro (0, 0, 0) y radio 1, enton- ces dn(p) : Tp (S) −→ Tn(p) (S 2 ), pero como n(p) es perpendicular a Tp (S), en realidad Tn(p) (S 2 ) = Tp (S), luego podemos considerar a dn(p) como un endo- morfismo de Tp (S). Teorema 5.29 Sea S una superficie y n una determinaci´n del vector normal o alrededor de un punto p. Entonces K(p) = |dn(p)|. ´ Demostracion: Sea X una carta alrededor de p. Entonces una base de Tp (S) la forman los vectores Xu y Xv . Llamemos n(u, v) a X ◦ n. Entonces dn(p)(Xu ) = dn(p)(dX(u, v)(1, 0)) = dn(u, v)(1, 0) = nu , dn(p)(Xv ) = dn(p)(dX(u, v)(0, 1)) = dn(u, v)(0, 1) = nv . Si expresamos nu = aXu + bXv nv = cXu + dXv entonces el determinante de dn(p) es el de la matriz formada por a, b, c, d. Notemos que derivando las igualdades nXu = nXv = 0 se deduce la relaci´n o nu Xu = −nXuu = −e y similarmente nu Xv = nv Xu = −f , nv Xv = −g. Por consiguiente al multiplicar las ecuaciones anteriores por Xu y Xv obtenemos −e = aE + bF, −f = aF + bG, −f = cE + dF, −g = cF + dG, de donde µ ∂ µ ∂µ ∂ e f a b E F − = . f g c d F G Tomando determinantes concluimos que eg − f 2 = |dn(p)| (EG − F 2 ), luego efectivamente |dn(p)| = K(p). Consideremos ahora las f´rmulas (5.7) que definen los s´ o ımbolos de Christof- fel. Al particularizarlas al caso de una superficie se convierten en Xuu = Γ1 Xu + Γ2 Xv + en, 11 11 Xuv = Γ1 Xu + Γ2 Xv + f n, 12 12 Xvv = Γ1 Xu + Γ2 Xv + gn, 22 22 (en principio la componente normal ha de ser de la forma αn para cierto α, y multiplicando la igualdad por n se sigue que α = e, f, g seg´n el caso.) u
  • 243.
    5.6. La curvaturade Gauss 227 De estas ecuaciones se sigue ° 1 1 ¢ Xuu Xvv − Xuv = eg − f 2 2 + Γ11 Γ22 − (Γ1 )2 E 12 ° ¢ + Γ1 Γ2 + Γ2 Γ1 − 2Γ1 Γ2 F 11 22 11 22 12 12 ° ¢ + Γ2 Γ2 − (Γ2 )2 G. 11 22 12 Por otra parte, derivando respecto a v y u respectivamente las relaciones 1 1 Xuu Xv = Fu − Ev , Xuv Xv = Gu 2 2 y restando los resultados obtenemos 2 1 1 Xuu Xvv − Xuv = − Evv + Fuv − Guu . 2 2 En definitiva resulta la expresi´n o 1 1 ° 1 1 ¢ eg − f 2 = − Evv + Fuv − Guu − Γ11 Γ22 − (Γ1 )2 E 12 2 2 ° ¢ − Γ1 Γ2 + Γ2 Γ1 − 2Γ1 Γ2 F 11 22 11 22 12 12 ° ¢ − Γ2 Γ2 − (Γ2 )2 G. 11 22 12 La f´rmula (5.13) muestra ahora que la curvatura de Gauss de un punto o depende unicamente de los coeficientes E, F , G de la primera forma fundamental ´ y sus derivadas. Puesto que dos superficies localmente isom´tricas tienen cartas e con los mismos coeficientes E, F , G, hemos probado el resultado que Gauss, en sus Diquisitiones generales circa superficies curuas, present´ con el nombre de o theorema egregium: Teorema 5.30 (Gauss) Las isometr´ locales conservan la curvatura. ıas Las ecuaciones (5.11) nos dan la siguiente expresi´n para la curvatura res- o pecto a una carta con F = 0: 2 Eu Gu + Ev Ev Gv + G2 u Evv + Guu K= + − , si F = 0. 4E 2 G 4EG2 2EG Desde aqu´ es f´cil deducir a su vez los siguientes casos particulares: ı a µ 2 ∂ 1 ∂ log A ∂ 2 log A K=− + , si F = 0, E = G = A, 2A ∂u2 ∂v 2 √ 1 ∂2 G K = −√ , si F = 0, E = 1. G ∂u2 En° particular, la curvatura de la superficie de revoluci´n definida por la ¢ o curva r(u), z(u) es r00 (u) K=− . r(u)
  • 244.
    228 Cap´ ıtulo 5. Introducci´n a las variedades diferenciables o *Ejemplo Notemos que sin el teorema de Gauss no tendr´ sentido hablar ıa de la curvatura del plano hiperb´lico, pues lo unico que sabemos de ´l es que o ´ e sus modelos se comportan como cartas de una variedad desconocida de la que tenemos su primera forma fundamental. Sin embargo, las f´rmulas anteriores o nos permiten calcular su curvatura a partir de estos datos. Por ejemplo, en el caso del semiplano de Poincar´, donde E = G = 1/v 2 y F = 0, ahora es f´cil e a calcular que K = −1. As´ pues, si pudi´ramos identificar el plano hiperb´lico ı e o con una superficie en R3 , ´sta tendr´ que tener curvatura constante igual a e ıa −1. En el caso del plano el´ ıptico sabemos que localmente es como la esfera de radio 1, luego si pudi´ramos identificar el plano el´ e ıptico con una superficie de R3 , ´sta tendr´ que tener curvatura constante igual a 1. Ahora vamos a probar e ıa que existen variedades cuya relaci´n con el plano hiperb´lico es la misma que o o hay entre la esfera y el plano el´ıptico. Ejemplo Se llama pseudoesfera a la superficie de revoluci´n P generada por o la tractriz. Recordemos que la tractriz es ° ¢ ≥ u¥ r(u), z(u) = l sen u, l cos u + l log tan . 2 Por lo tanto la pseudoesfera est´ dada por a ≥ u¥ X(u, v) = l sen u cos v, l sen u sen v, l cos u + l log tan . 2 Recordemos tambi´n que la longitud de arco es s = e −l log sen u, luego sen u = e−s/l . La carta de P que resulta de tomar la tractriz parametrizada por el arco tiene la primera forma fundamental determinada por E = 1, F = 0, G = r(s)2 = l2 e−2s/l . De aqu´ se sigue f´cilmente que K = −1/l2 . ı a Por lo tanto un ejemplo de superficie de curvatura constante igual a K < 0 es la pseudoesfera 1 ≥ u¥ √ sen u cos v, sen u sen v, cos u + log tan . −K 2 *Nota La pseudoesfera es al plano hiperb´lico lo que un cilindro es al plano o eucl´ ıdeo. En efecto, hemos visto que si parametrizamos por el arco la tractriz obtenemos una carta de la pseudoesfera cuya primera forma fundamental es (para l = 1) ds2 = dw2 + e−2u dv 2 , donde w ∈ ]0, +∞[ es la longitud de arco de la tractriz (que arriba repre- sent´bamos por s). Las cartas de la pseudoesfera tienen dominios de la forma a (w, v) ∈ ]0, +∞[×]v0 − π, v0 + π[. Si ahora hacemos el cambio (w, v) = (log y, x)
  • 245.
    5.6. La curvaturade Gauss 229 obtenemos cartas con dominios de la forma ]x0 − π, x0 + π[ × ]1, +∞[ de modo que la primera forma fundamental pasa a ser dx2 + dy 2 ds2 = , y2 es decir, exactamente la del semiplano de Poincar´. Un c´lculo rutinario nos da e a la forma expl´ıcita de estas cartas: √ p ! cos x sen x y2 − 1 1 1 ° p ¢ X(x, y) = , ,− + log(y − 1) + log y + y 2 − 1 . y y y 2 2 Esto significa que un fragmento del semiplano de Poincar´ de la forma e ]x0 − π, x0 + π[ × ]1, +∞[ puede verse como un mapa de la pseudoesfera de modo que la longitud hiperb´lica en el mapa coincide con la longitud eucl´ o ıdea sobre la superficie. Por lo tanto la porci´n de pseudoesfera cubierta por la o carta (toda ella menos un meridiano x =cte.) puede identificarse con un frag- mento de plano hiperb´lico exactamente igual que una porci´n de esfera puede o o identificarse con un fragmento de plano el´ ıptico. La situaci´n es, como dec´ o ıamos, an´loga a la del cilindro dado por a ° ¢ r cos(v/r), r sen(v/r), u , cuya primera forma fundamental es ds2 = dx2 + dy 2 , igual que la del plano. La diferencia es que, en este caso, al quitarle una recta x =cte. podemos desplegarlo hasta hacerlo plano sin modificar su primera forma fundamental, mientras que la pseudoesfera no puede desplegarse sin sufrir estiramientos que alteren su m´trica y su curvatura. Por ello no podemos extenderla a un plano hiperb´lico e o completo.
  • 247.
    Cap´ ıtulo VI Ecuaciones diferenciales ordinarias Una ecuaci´n diferencial ordinaria es una relaci´n de la forma o o ° ¢ f t, y(t), y 0 (t), . . . , y n) (t) = 0, donde f : D ⊂ Rn+2 −→ R e y : I −→ R es una funci´n definida en un o intervalo I derivable n veces. Normalmente la funci´n y es desconocida, y o entonces se plantea el problema de integrar la ecuaci´n, es decir, encontrar o todas las funciones y que la satisfacen. El adjetivo “ordinaria” se usa para indicar que la funci´n inc´gnita tiene una sola variable. Las ecuaciones que o o relacionan las derivadas parciales de una funci´n de varias variables se llaman o ecuaciones diferenciales en derivadas parciales, pero no vamos a ocuparnos de ellas. Dentro de las ecuaciones ordinarias, nos vamos a ocupar unicamente de un ´ caso m´s simple pero suficientemente general: aquel en que tenemos despejada a la derivada de orden mayor, es decir, una ecuaci´n de la formao ° ¢ y n) (t) = f t, y(t), y 0 (t), . . . , y n−1) (t) . El n´mero n se llama orden de la ecuaci´n. El caso m´s simple es la ecuaci´n u o a o de primer orden y 0 = f (t). Sabemos que si la ecuaci´n tiene soluci´n de hecho o o hay infinitas de ellas pero, en un intervalo dado, cada una se diferencia de las dem´s en una constante, de modo que una soluci´n queda completamente a o determinada cuando se especifica un valor y(t0 ) = y0 . Veremos que esto sigue siendo v´lido para todas las ecuaciones de primer orden. Por ello se define un a problema de Cauchy como æ y 0 = f (t, y) y(t0 ) = y0 Resolver el problema significa encontrar una funci´n y definida alrededor de o t0 de modo que satisfaga la ecuaci´n diferencial y cumpla la condici´n inicial o o y(t0 ) = y0 . Probaremos que bajo condiciones muy generales los problemas de Cauchy tienen soluci´n unica. o ´ 231
  • 248.
    232 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias Toda la teor´ se aplica igualmente al caso de sistemas de ecuaciones diferen- ıa ciales. De hecho un sistema de ecuaciones puede verse como una unica ecuaci´n ´ o vectorial. Basta considerar que y : I −→ Rn y f : D ⊂ Rn+1 −→ Rn . Son muchas las ocasiones en las que el unico conocimiento que tenemos de ´ una o varias funciones es el hecho de que satisfacen un sistema de ecuaciones diferenciales. Por ejemplo, las ecuaciones (5.10) del cap´ ıtulo anterior son un sistema de ecuaciones de segundo orden que determinan cu´ndo una curva x(s) a representa a una geod´sica de una variedad en una carta dada. Los resultados e que probaremos en este cap´ ıtulo nos asegurar´n en particular la existencia de a geod´sicas. De momento no tenemos garantizada la existencia de soluci´n ni en e o ´ el caso m´s simple: y 0 = f (x). Este es el primer punto que hemos de estudiar, a lo que nos lleva a profundizar un poco m´s en el c´lculo integral. a a 6.1 La integral de Riemann Recordemos que hemos definido la expresi´n o Z b f (x) dx a como F (b) − F (a), donde F es una primitiva de f , pero la interpretaci´n o geom´trica era el n´mero que resulta de dividir el intervalo [a, b] en intervalos e u infinitesimales de longitud dx y sumar los incrementos infinitesimales f (x) dx. Vamos a dar rigor a esta idea, lo que nos llevar´ a una construcci´n de la integral a o que no postule la existencia de la primitiva. La t´cnica ser´, por supuesto, sustituir la divisi´n en infinitos intervalos in- e a o finitesimales por particiones en intervalos de longitud arbitrariamente peque˜a. n Puede probarse que no importa c´mo escojamos estas particiones, por lo que o trabajaremos concretamente con intervalos de longitud 2−n . Para cada n´mero natural n sea Pn = {2−n k | k ∈ Z}. Para cada x ∈ Pn u sea x0 = x + 2−n . De este modo, la recta real se divide en una uni´n disjunta n o de intervalos de longitud 2−n [ R= [x, x0 [ . n x∈Pn Llamaremos F al conjunto de todas las funciones f : R −→ R tales que el conjunto {x ∈ R | f (x) 6= 0} est´ acotado. Para cada f ∈ F definimos a X Sn (f ) = f (x)2−n . x∈Pn Notar que f se anula en todos los puntos de Pn salvo a lo sumo en un n´mero finito de ellos, luego la suma anterior es en realidad una suma finita. u La suma Sn (f ) es la aproximaci´n de la integral de f que resulta de aproximar o el incremento infinitesimal dx por el incremento finito 2−n .
  • 249.
    6.1. La integralde Riemann 233 Diremos que f es integrable Riemann si existe Z f (x) dx = l´ Sn (f ) ∈ R. ım n A esta cantidad la llamaremos integral de Riemann de f . Llamaremos R al conjunto de todas las funciones de F que son integrables Riemann. Si A ⊂ R, llamaremos funci´n caracter´ o ıstica de A a la funci´n χA : R −→ R o dada por Ω 1 si x ∈ A χA (x) = 0 si x ∈ A / Dado un intervalo [a, b] y una funci´n f : R −→ R, es claro que f χ[a,b] ∈ F. o Diremos que f es integrable Riemann en [a, b] si f χ[a,b] es integrable Riemann. En tal caso llamaremos Z b Z f (x) dx = f (x)χA (x) dx. a Es obvio que la integrabilidad de f en [a, b] y, en su caso, el valor de la integral s´lo dependen de la restricci´n de f al intervalo considerado. Por lo o o tanto, si f es una funci´n definida en [a, b], diremos que es integrable Riemann o en [a, b] si lo es la extensi´n a R que toma el valor 0 en todos los puntos exteriores o a [a, b]. As´ una funci´n es integrable en [a, b] si y s´lo si lo es, en este sentido, ı, o o su restricci´n a dicho intervalo. o Llamaremos R(a, b) al conjunto de todas las funciones integrables Riemann en [a, b]. Observemos que si f ∈ R, entonces existe un intervalo [a, b] tal que f se anula fuera de [a, b], con lo que f = f χ[a,b] y por lo tanto f ∈ R(a, b) y Z Z b f (x) dx = f (x) dx. a Por consiguiente no perdemos generalidad si trabajamos con funciones inte- grables en un intervalo fijo. Teorema 6.1 Sea [a, b] un intervalo. Se cumplen las propiedades siguientes: a) Si f , g ∈ R(a, b) y α, β ∈ R entonces αf + βg ∈ R(a, b) y Z b° Z b Z b ¢ αf (x) + βg(x) dx = α f (x) dx + β f (x) dx. a a a b) Si f , g ∈ R(a, b) y f ≤ g entonces Z b Z b f (x) dx ≤ g(x) dx. a a
  • 250.
    234 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias c) Si f ∈ R(a, b) y |f | tambi´n es integrable entonces e ØZ Ø Z Ø b Ø b Ø Ø Ø f (x) dxØ ≤ |f (x)| dx. Ø a Ø a d) Si k ∈ [a, b] entonces χ{k} ∈ R(a, b) y Z b χ{k} dx = 0. a e) Si a < c < b, f ∈ R(a, c) y f ∈ R(c, b) entonces f ∈ R(a, b) y Z b Z c Z b f (x) dx = f (x) dx + f (x) dx. a a c f ) La funci´n constante igual a 1 es integrable en [a, b] y o Z b dx = b − a. a ´ Demostracion: Las tres primeras propiedades son obvias para las sumas Sn y se trasladan a las integrales por las propiedades de los l´ımites. Para probar d) observamos que si k ∈ Pn para alg´n n0 entonces Sn (χ{k} ) = 2−n , u para n ≥ n0 y en caso contrario Sn (χ{k} ) = 0 para todo n. En cualquier caso el l´ ımite cuanto n tiende a infinito vale 0. Para probar e) observamos que f χ[a,b] = f χ[a,c] + f χ[c,b] − f (c)χ{c} . El resultado es inmediato a partir de los apartados anteriores. Para demos- trar f) consideramos la suma X Sn (χ[a,b] ) = χ[a,b] (x)2−n . x∈Pn Si los puntos de Pn contenidos en [a, b] son a ≤ x0 < · · · < xk ≤ b, es claro que k2−n = xk − x0 ≤ b − a y (b − a) − k2−n = x0 − a + b − xk ≤ 2−n+1 . Por lo tanto |Sn (χ[a,b] ) − (b − a)| = |(k + 1)2−n − (b − a)| ≤ 2−n+1 + 2−n , luego existe l´ Sn (χ[a,b] ) = b − a. ım n El teorema anterior puede mejorarse considerablemente. Por ejemplo, puede probarse que si f es integrable entonces |f | tambi´n lo es, con lo que sobra la e
  • 251.
    6.1. La integralde Riemann 235 hip´tesis correspondiente en el apartado c). As´ mismo, si a < c < b, la integra- o ı bilidad de f en [a, b] implica la integrabilidad en [a, c] y [c, b]. Tambi´n puede e probarse que el producto de funciones integrables es integrable. No entraremos en todo esto porque vamos a trabajar unicamente con funciones continuas, y ´ estos hechos resultan triviales en este caso una vez probado el teorema siguiente. Teorema 6.2 Toda funci´n continua en un intervalo [a, b] es integrable Rie- o mann en [a, b]. ´ Demostracion: En la prueba usaremos la siguiente observaci´n sobre las o sumas Sn (f ): Si una funci´n f es constante sobre cada intervalo [x, x0 [ con o n x ∈ Pn , entonces Sn (f ) = Sn+1 (f ). En efecto, los puntos de Pn+1 son los de Pn y los de la forma x + 2−n−1 , con x ∈ Pn . Por consiguiente X° ¢ X Sn+1 (f ) = f (x) + f (x + 2−n−1 ) 2−n−1 = 2f (x)2−n−1 = Sn (f ). x∈Pn x∈Pn De aqu´ se sigue a su vez que Sn (f ) = Sm (f ) para m ≥ n. ı Consideremos ahora una funci´n f continua en [a, b] y sea ≤ > 0. Por el o teorema 2.36 sabemos que f es uniformemente continua en [a, b], luego existe un δ > 0 tal que si x, x0 ∈ [a, b] cumplen |x − x0 | < δ entonces ≤ |f (x) − f (x0 )| < . 2(b − a) Sea n0 un n´mero natural tal que 1/n0 < δ. Podemos exigir adem´s que u a 2−n0 +1 < b − a. Para cada x ∈ Pn0 sea £ £ mx = ´ {f (t) | t ∈ x, x0 0 ∩ [a, b]}, ınf n £ £ Mx = sup{f (t) | t ∈ x, x0 0 ∩ [a, b]}. n Estos supremos e ´ınfimos existen£porque f est´ acotada en [a, b] (por com- £ a pacidad). Entendemos que si x, x0 0 ∩ [a, b] = ∅ entonces mx = Mx = 0. n Puesto que x0 0 − x < 2−n0 < δ tenemos que la distancia entre dos valores n £ £ de f en un intervalo x, x0 0 ∩ [a, b] no es superior a ≤/2(b − a), de donde se n concluye inmediatamente que Mx − mx ≤ ≤/2(b − a). £ £ Llamemos g y h a las funciones que en cada intervalo x, x0 0 toman el n valor constante mx y Mx respectivamente. Entonces es claro que g ≤ f ≤ h y 0 ≤ h − g ≤ ≤/2(b − a). Para todo n ≥ n0 se cumple Sn0 (g) = Sn (g) ≤ Sn (f ) ≤ Sn (h) = Sn0 (h), luego para n, m ≥ n0 se cumple X |Sn (f ) − Sm (f )| ≤ Sn0 (h − g) = (Mx − mx )2−n0 x∈Pn0
  • 252.
    236 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias £ £ Si llamamos k al n´mero de puntos x ∈ Pn0 tales que x, x0 0 ⊂ [a, b] es u n claro que k2−n0 ≤ b − a. Puede ocurrir que haya dos puntos adicionales y ∈ Pn £ 0 £ tal que y, yn0 no est´ contenido en [a, b] pero corte a [a, b]. En cualquier caso e hay a lo sumo k + 2 intervalos que cortan a [a, b] y por lo tanto la suma anterior tiene a lo sumo k + 2 sumandos no nulos. As´ pues ı ≤ |Sn (f ) − Sm (f )| ≤ (k + 2)2−n0 < ≤. 2(b − a) Esto prueba que la sucesi´n Sn (f ) es de Cauchy, luego converge, luego f es o integrable Riemann. Conviene introducir el convenio de que Z b Z a Z a f (x) dx = − f (x) dx, f (x) dx = 0. a b a De este modo la f´rmula del apartado e) del teorema 6.1 se cumple para tres o puntos cualesquiera a, b, c independientemente de c´mo est´n ordenados o de o e si son iguales o no. En particular, si f es una funci´n continua en un intervalo o I (no necesariamente acotado) y a ∈ I podemos definir Z x F (x) = f (t) dt a para todo x ∈ I. Ahora probamos que la integral de Riemann de una funci´n o continua coincide con la integral calculada mediante una primitiva. Teorema 6.3 Sea f una funci´n continua en un intervalo I y sea a ∈ I. En- o tonces la funci´n o Z x F (x) = f (t) dt a 0 es derivable en el interior de I y F = f . ´ Demostracion: Sea x un punto interior de I y sea J ⊂ I un intervalo cerrado y acotado que contenga a a y a x (a ´ste ultimo en su interior). Por e ´ el teorema 2.36 la funci´n f es uniformemente continua en J, luego para cada o ≤ > 0 existe un δ > 0 tal que si u, u0 ∈ J, |u−u0 | < δ entonces |f (u)−f (u0 )| < ≤. Sea h ∈ R tal que |h| < δ y x + h ∈ J. Sean m y M el m´ ınimo y el m´ximo a de f en el intervalo cerrado de extremos x y x + h. Si h > 0 Z x+h Z x+h Z x+h mh = m dt ≤ f (t) dt ≤ M dt = M h. x x x Si h < 0 se invierten las desigualdades, pero en ambos casos resulta R x+h x f (t) dt m≤ ≤ M. h
  • 253.
    6.1. La integralde Riemann 237 Por el teorema de los valores intermedios existe un α entre x y x + h de modo que R x+h f (t) dt F (x + h) − F (x) f (α) = x = . h h Claramente |α − x| < |h| < δ, luego Ø Ø Ø F (x + h) − F (x) Ø Ø − f (x)Ø = |f (α) − f (x)| < ≤, Ø h Ø por lo que existe F 0 (x) = f (x). Como consecuencia obtenemos: Teorema 6.4 (Regla de Barrow) Si f es una funci´n continua en un inter- o valo [a, b] entonces F tiene una primitiva F en [a, b] y Z b f (x) dx = F (b) − F (a). a ´ Demostracion: Cuando decimos que F es una primitiva de f en [a, b] queremos decir que F es continua en [a, b], derivable en ]a, b[ y F 0 = f en ]a, b[. Basta tomar como F la funci´n o Z x F (x) = f (t) dt, c donde a < c < b. S´lo falta probar que F es continua en a y en b, lo cual es o sencillo: Sea |f (x)| ≤ M en [a, b]. Entonces Z b Z b |F (b) − F (x)| ≤ |f (t)| dt ≤ M dt = M (b − x), x x luego si |b − x| < δ = ≤/M se cumple |F (b) − F (x)| < ≤, lo que prueba la continuidad en b, e igualmente sucede con a. Puesto que toda funci´n continua tiene primitiva, todo arco x de clase C 1 o es rectificable, pues la funci´n kx0 k es continua. o Ejemplo Vamos a demostrar el resultado que dejamos pendiente en el cap´ ı- tulo III, a saber, la convergencia de la serie de Taylor del arco tangente incluso en los puntos frontera ±1. Para ello partimos de la suma parcial de la serie geom´trica de raz´n −t2 : e o 1 t2n+2 = 1 − t2 + t4 + · · · + (−1)n t2n + (−1)n+1 . 1 + t2 1 + t2 Integrando ambos miembros resulta Z x 1 x3 x5 x2n+1 arctan x = 2 dt = x − + − · · · + (−1)n 0 1+t 3 5 2n + 1 Z x 2n+2 t + (−1)n+1 2 dt. 0 1+t
  • 254.
    238 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias El polinomio de la derecha es el polinomio de Taylor del arco tangente, luego ØZ x 2n+2 Ø ØZ x Ø Ø t Ø Ø Ø |x|2n+3 |R2n+1 (x)| = Ø Ø 2 dtØ ≤ Ø Ø Ø t2n+2 dtØ = Ø , 0 1+t 0 2n + 3 de donde se sigue que el resto tiende a cero incluso si x = ±1, como hab´ que ıa probar. Finalmente definimos la integral de una funci´n f : [a, b] −→ Rn como o Z b √Z Z b ! b f (x) dx = f1 (x) dx, . . . , fn (x) dx , a a a entendiendo que f es integrable Riemann en [a, b] si y s´lo si lo son todas sus o funciones coordenadas fi . 6.2 Ecuaciones diferenciales de primer orden Nos ocupamos ahora de asegurar la existencia y unicidad de la soluci´n de o los problemas de Cauchy. Nos basaremos en un resultado general sobre espacios m´tricos completos: e Teorema 6.5 (Teorema de punto fijo de Banach) Sea M un espacio m´- e trico completo y T : M −→ M una aplicaci´n tal que existe un n´mero real o u 0 < α < 1 de modo que ° ¢ d T (x), T (y) < α d(x, y), para todo x, y ∈ M. Entonces existe un unico x ∈ M tal que T (x) = x. ´ Las aplicaciones T que cumplen la propiedad indicada se llaman contractivas. Los puntos x que cumplen T (x) = x se llaman puntos fijos de T . El teorema afirma, pues, que toda aplicaci´n contractiva en un espacio m´trico completo o e tiene un unico punto fijo. ´ ´ Demostracion: Tomamos un punto arbitrario x0 ∈ M y consideramos la sucesi´n dada por xn+1 = T (xn ). Por la propiedad de T , tenemos que o ° ¢ d(x1 , x2 ) = d T (x0 ), T (x1 ) < α d(x0 , x1 ), ° ¢ d(x2 , x3 ) = d T (x1 ), T (x2 ) < α d(x1 , x2 ) = α2 d(x0 , x1 ), y en general concluimos d(xn , xn+1 ) < αn d(x0 , x1 ). Aplicando la desigualdad triangular resulta, para n < m, √m−1 ! √∞ ! X X αn i d(xn , xm ) < α d(x0 , x1 ) < αi d(x0 , x1 ) = d(x0 , x1 ). i=n i=n 1−α
  • 255.
    6.2. Ecuaciones diferencialesde primer orden 239 El t´rmino de la derecha tiende a 0, lo que significa que la sucesi´n xn es de e o Cauchy. Como el espacio M es completo existe x = l´ xn ∈ M . Veamos que x ım n es un punto fijo de T . Para ello observamos que ° ¢ ° ¢ d x, T (x) ≤ d(x, xn ) + d(xn , xn+1 ) + d xn+1 , T (x) < (1 + α)d(x, xn ) + αn d(x0 , x1 ). ° ¢ El ultimo t´rmino tiende a 0, luego ha de ser ° x, T (x) ¢ 0, es decir, ´ e d = T (x) = x. Si y es otro punto fijo de T , entonces d T (x), T (y) = d(x, y), en contradicci´n con la propiedad contractiva, luego el punto fijo es unico. o ´ Es frecuente que una ecuaci´n diferencial dependa de uno m´s par´metros. o a a Por ejemplo, la fuerza F (t, x) que afecta a un m´vil de masa m es, por lo general, o funci´n del tiempo t y de la posici´n x. La segunda ley de Newton afirma que o o su trayectoria x(t) obedece la ecuaci´n diferencial de segundo orden o F (t, x) = m x00 (t), donde la masa m es un par´metro. En casos como este podemos considerar a la soluci´n como funci´n de los par´metros, es decir, x(t, m) es la posici´n en o o a o el instante t de un cuerpo de masa m sometido a la fuerza F (t, x) (y en unas condiciones iniciales dadas). En el teorema de existencia y unicidad que damos a continuaci´n contemplamos la existencia de estos par´metros y probamos que o a la soluci´n depende continuamente de ellos. o 0 0 Teorema 6.6 Sean t0 , a, b1 , . . . , bn , y1 , . . . , yn n´meros reales. Consideremos u una aplicaci´n continua o n Y f : [t0 − a, t0 + a] × [yi − bi , yi + bi ] × K −→ Rn , 0 0 i=1 donde K es un espacio m´trico compacto. Sea M una cota de f respecto a la e norma k k∞ en Rn . Supongamos que existe una constante N tal que kf (t, y, µ) − f (t, z, µ)k∞ ≤ N ky − zk∞ . Entonces el problema de Cauchy æ y 0 (t, µ) = f (t, y, µ) y(t0 , µ) = y0 tiene soluci´n unica y : [t0 − h0 , t0 + h0 ] × K −→ Rn , continua en su dominio, o ´ donde h0 es cualquier n´mero real tal que u Ω æ b1 bn 1 0 < h0 ≤ m´ a, , . . . , ın , h0 < . M M N
  • 256.
    240 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias Se entiende que derivada de y que aparece en el problema de Cauchy es respecto de la variable t. Te´ricamente deber´ o ıamos usar la notaci´n de derivadas o parciales, pero es costumbre usar la notaci´n del an´lisis de una variable para o a evitar que el problema parezca una ecuaci´n diferencial en derivadas parciales, o cuando en realidad no lo es. ´ Demostracion: Sea h0 en las condiciones indicadas, sea I = [t−h0 , t+h0 ], Q 0 n 0 sea D = [yi −bi , yi +bi ] y sea M = C(I ×K, D), que es un espacio de Banach i=1 con la norma supremo. Definimos el operador T : M −→ M mediante Z t ° ¢ T (y)(t, µ) = y 0 + f t, y(t, µ), µ dt. t0 Hemos de probar que T (y)(t, µ) ∈ D y que T (y) es una aplicaci´n continua. o En primer lugar, ØZ t Ø ØZ t Ø ØZ t Ø Ø Ø Ø Ø Ø Ø Ø Ø ØT (y)i (t, µ) − yi Ø = Ø 0 Ø≤Ø fi (t, y, µ) dtØ Ø Ø≤MØ |fi (t, y, µ)| dtØ dtØ Ø Ø Ø t0 t0 t0 = M |t − t0 | ≤ M h0 ≤ bi . Esto prueba que T (y)(t, µ) ∈ D. La continuidad es consecuencia de un c´lculo rutinario: a ØZ t1 Z t2 Ø Ø Ø Ø kT (y)(t1 , µ1 ) − T (y)(t2 , µ2 )k∞ = m´x Ø a fi (t, y, µ1 ) dt − fi (t, y, µ2 ) dtØ i Ø t0 t0 µØZ t1 Z t1 Ø Ø Ø ≤ m´x Ø a Ø fi (t, y, µ1 ) dt − fi (t, y, µ2 ) dtØ + Ø i t0 t0 ØZ t1 Z t2 Ø∂ Ø Ø Ø fi (t, y, µ2 ) dt − fi (t, y, µ2 ) dtØ Ø Ø t0 t0 µØZ t1 ° Ø ØZ t1 Ø∂ Ø ¢ Ø Ø Ø ≤ m´x Ø a Ø fi (t, y, µ1 ) − fi (t, y, µ2 ) dtØ + Ø Ø Ø fi (t, y, µ2 ) dtØ Ø i t0 t2 ØZ t1 Ø Ø Ø Ø Ø ≤ m´x Ø a Øfi (t, y, µ1 ) − fi (t, y, µ2 )Ø dtØ + M |t1 − t2 |. i Ø t0 Ø Sea ≤ > 0. La funci´n fi (t, y(t, µ), µ) es uniformemente continua en el o compacto I × K, luego existe un δ > 0 tal que si d(µ1 , µ2 ) < δ, entonces |fi (t, y, µ1 ) − fi (t, y, µ2 )| < ≤/2h0 . Podemos suponer que esto vale para todo i = 1, . . . , n, y si suponemos tambi´n que |t1 − t2 | < ≤/2M concluimos que e kT (y)(t1 , µ1 ) − T (y)(t2 , µ2 )k∞ < ≤. Esto prueba la continuidad de T (y) en el punto (t1 , µ1 ).
  • 257.
    6.2. Ecuaciones diferencialesde primer orden 241 Ahora probamos que T es contractivo, con constante α = N h0 < 1. En efecto, ØZ t Ø Ø ° ¢ Ø kT (y)(t, µ) − T (z)(t, µ)k∞ Ø = m´x Ø a fi (t, y(t, µ), µ) − fi (t, z(t, µ), µ) dtØ i Ø t0 ØZ t Ø ØZ t Ø Ø Ø Ø Ø ≤ m´x Ø a Ø N ky(t, µ) − z(t, µ)k∞ dtØ ≤ N m´x Ø Ø a Ø ky − zk dtØ ≤ N h0 ky − zk. Ø i t0 i t0 Por definici´n de norma supremo resulta kT (y) − T (z)k ≤ αky − zk. El o teorema anterior implica ahora la existencia de una unica funci´n y ∈ M tal ´ o que Z t y(t, µ) = y 0 + f (t, y, µ) dt, t0 pero es claro que esto equivale a ser soluci´n del problema de Cauchy, luego ´ste o e tiene soluci´n unica. o ´ En la pr´ctica, hay una hip´tesis m´s fuerte que la condici´n de Lipschitz a o a o que hemos exigido en el teorema anterior pero que es m´s f´cil de comprobar. a a Se trata de exigir simplemente que la funci´n f sea de clase C 1 . o Teorema 6.7 Sea f : D ⊂ Rn −→ Rm una funci´n de clase C 1 en un abierto o D. Para todo subconjunto compacto convexo C ⊂ D existe una constante N tal que si y, z ∈ C entonces kf (y) − f (z)k∞ ≤ N ky − zk∞ . ´ Demostracion: Si llamamos f1 , . . . , fm a las funciones coordenadas de f , basta probar que |fi (y) − fi (z)| ≤ Ni ky − zk∞ para todo y, z ∈ C, pues to- mando como N la mayor de las constantes Ni se cumple la desigualdad buscada. Equivalentemente, podemos suponer que m = 1. ° ¢ Dados y, z ∈ C, consideramos la funci´n g(h) = f y + h(z − y) , definida en o [0, 1], pues C es convexo. Se cumple g(0) = f (y), g(1) = f (z). Por el teorema del valor medio existe 0 < h0 < 1 tal que f (z) − f (y) = g 0 (h0 ) = df (ξ)(z − y) = ∇f (ξ)(z − y), donde ξ = y + h0 (z − y) ∈ C. Sea N0 una cota del m´dulo de las derivadas o parciales de f (que por hip´tesis son continuas) en el compacto C. Entonces o Ø n Ø ØX Ø X n Ø Ø |f (z) − f (y)| = Ø Di f (ξ)(zi − yi )Ø ≤ N0 kz − yk∞ = nN0 kz − yk∞ . Ø Ø i=1 i=1 En realidad, si tomamos como hip´tesis que la ecuaci´n diferencial sea o o de clase C 1 obtenemos no s´lo la continuidad de la soluci´n respecto de los o o par´metros, sino tambi´n la derivabilidad. a e
  • 258.
    242 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias Teorema 6.8 Sea f : D ⊂ R × Rn × Rm −→ Rn una funci´n de clase C 1 en el o abierto D. Sea (t0 , y0 , µ) ∈ D. Entonces el problema de Cauchy æ y 0 (t, µ) = f (t, y, µ) y(t0 , µ) = y0 tiene soluci´n unica definida y de clase C 1 en un entorno de (t0 , µ). o ´ ´ Demostracion: Tomamos un entorno C de (t0 , y0 , µ) que est´ contenido en e D y sea producto de intervalos cerrados de centro cada una de las componentes del punto. En particular es convexo y compacto. El teorema anterior garantiza que se cumplen las hip´tesis del teorema de existencia y unicidad. Falta probar o que la funci´n y(t, µ) es de clase C 1 en su dominio. o Obviamente y es derivable respecto de t y la derivada es continua. Veamos que lo mismo sucede con las dem´s variables. Sea ei un vector de la base a can´nica de Rm . Consideramos un punto (t1 , µ1 ) del dominio de y. La funci´n o o y(t, µ + hei ) − y(t, µ) Q(t, µ, h) = h est´ definida en los puntos de un entorno de (t1 , µ1 , 0) para los que h 6= 0. a Hemos de probar que tiene l´ ımite cuando h tiende a 0. Claramente ∂Q f (t, y(t, µ + hei ), µ + hei ) − f (t, y(t, µ), µ) = . ∂t h Llamemos   f (p + x) − f (p) − df (p)(x) si x 6= 0 E(p, x) = kxk  0 si x = 0 Se comprueba que es continua en un entorno de (t1 , y(t1 , µ1 ), µ1 , 0). S´lo o hay que ver la continuidad en los puntos de la forma (q, 0). Se demuestra para cada funci´n coordenada independientemente, y a su vez para ello se aplica el o teorema del valor medio la la funci´n fj (p + tx). El resultado es que o ° ¢ x Ej (p, x) = ∇fj (p0 ) − ∇fj (p) , kxk donde p0 es un punto entre p y p + x, y ahora basta aplicar la continuidad de las derivadas parciales de f . En t´rminos de E tenemos e ∂Q ° ¢ = df (t, y(t, µ), µ) 0, Q(t, µ, h), ei ∂t |h| +k(0, Q(t, µ, h), 1)k E(0, y(t, µ + hei ) − y(t, µ), h). h
  • 259.
    6.2. Ecuaciones diferencialesde primer orden 243 M´s brevemente a ∂Q ° ¢ = df (t, y(t, µ), µ) 0, Q(t, µ, h), ei + k(0, Q(t, µ, h), 1)k E ∗ (t, µ, h), ∂t entendiendo que E ∗ (t, µ, h) es continua en un entorno de (t1 , µ1 , 0) y se anula en los puntos donde h = 0. Esto significa que Q es la soluci´n de una ecuaci´n diferencial determinada o o por la funci´n continua o ° ¢ g(t, Q, µ, h) = df (t, y(t, µ), µ) 0, Q, ei + k(0, Q, 1)k E ∗ (t, µ, h), donde µ y h son par´metros. Esta funci´n no es diferenciable, pero cumple a o claramente la hip´tesis del teorema 6.6. Concretamente la consideramos definida o en un producto de intervalos de centros t1 , Q(t1 , µ1 , h) (para un h fijo) por un entorno compacto K de (µ1 , h) que contenga a (µ1 , 0). Si tomamos como condici´n inicial en el punto (t1 , µ1 , h) la determinada por la funci´n Q que ya o o tenemos definida, el teorema 6.6 nos garantiza la existencia de soluci´n continua o en un conjunto de la forma [t1 − r, t1 + r] × K. Por la unicidad la soluci´n debe o coincidir con la funci´n Q que ya ten´ o ıamos. En particular coincidir´ con ella a en los puntos de un entorno de (t1 , µ1 , 0) tales que h 6= 0. De aqu´ se sigue que ı existe ∂y l´ Q(t1 , µ1 , h) = ım (t1 , µ1 ). h→0 ∂µi M´s a´n, esta derivada satisface la ecuaci´n diferencial a u o µ ∂ ∂ ∂y ° ¢ ∂y = df t, y(t, µ), µ 0, , ei . ∂t ∂µi ∂µi Esto implica que es continua, luego y es de clase C 1 . Hemos probado que las derivadas respecto a los par´metros de una ecuaci´n a o diferencial determinada por una funci´n de clase C k satisfacen una ecuaci´n o o diferencial de clase C k−1 . Una simple inducci´n prueba entonces que la soluci´n o o y de una ecuaci´n de clase C k es una funci´n de clase C k . o o Notemos que la soluci´n y de un problema de Cauchy puede considerarse o tambi´n como funci´n de las condiciones iniciales, es decir, y(t, µ, t0 , y0 ). Del e o teorema anterior se deduce que y es continua respecto a todas las variables, es decir, como funci´n definida en un entorno de (t0 , µ, t0 , y0 ) en R × Rm × R × Rn . o Para ello basta ver que si hacemos z = y(t, µ, t0 , y0 )−y0 y r = t−t0 , el problema æ y 0 (t) = f (t, y, µ) y(t0 ) = y0 es equivalente a æ z 0 (r) = f (r + t0 , z + y0 , µ) z(0) = 0 en el sentido de que una soluci´n de uno da una del otro mediante los cambios de o variable indicados. El segundo miembro del segundo problema es una funci´n o
  • 260.
    244 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias g(r, z, ν), donde ν = (t0 , y0 , µ) ∈ D. Concretamente, el dominio de g es el abierto {(r, z, t0 , y0 , µ) | (r + t0 , z + y0 , µ) ∈ D, (t0 , y0 , µ) ∈ D}. Una soluci´n z del segundo problema definida en un entorno de (0, t0 , y0 , µ) o se traduce en una soluci´n y(t, µ, t0 , y0 ) del primer problema definida en un o entorno de (t0 , µ, t0 , y0 ). En definitiva tenemos el siguiente enunciado, m´s a completo, del teorema de existencia y unicidad: Teorema 6.9 Sea f : D ⊂ R × Rn × Rm −→ Rn una funci´n de clase C ko (k ≥ 1) en el abierto D. Sea (t0 , y0 , µ) ∈ D. Entonces el problema de Cauchy æ y 0 (t, µ, t0 , y0 ) = f (t, y, µ) y(t0 , µ, t0 , y0 ) = y0 tiene soluci´n unica de clase C k en un entorno de (t0 , µ, t0 , y0 ). o ´ Conviene interpretar las ecuaciones diferenciales de primer orden en t´rminos e cercanos a las aplicaciones f´ ısicas. Supongamos que D es una regi´n del espacio o ocupada por un fluido en movimiento, como puede ser el aire o un caudal de agua. Podemos considerar entonces la funci´n V : I × D ⊂ R × Rn −→ Rn que o determina la velocidad del fluido Vt (x) en cada instante t ∈ I y en cada punto x ∈ D. Es lo que se llama un campo de velocidades variable. Si V no depende de t tenemos un campo de velocidades estacionario. Entonces, la soluci´n del o problema de Cauchy ° ¢æ x0 (t) = Vt x(t) x(t0 ) = x0 se interpreta como la trayectoria que seguir´ un cuerpo de masa despreciable (un a papel en el aire) abandonado en el punto x0 en el instante t0 . Las soluciones se llaman l´ ıneas de flujo del campo de velocidades. Estos problemas son el objeto de estudio de la hidrodin´mica, o mec´nica de fluidos. Observemos que a a cualquier problema de Cauchy puede interpretarse de este modo, lo cual es conveniente en muchas ocasiones. La funci´n x(t, µ, t0 , y0 ) dada por el teorema o anterior se conoce como flujo del campo de velocidades. Cuando el campo es estacionario el instante inicial t0 es irrelevante, pues claramente x(t, µ, t0 , y0 ) = x(t−t0 , µ, 0, y0 ), por lo que podemos suponer siempre que t0 = 0 y entender que el flujo x(t, µ, y0 ) indica la posici´n de un objeto sometido al campo t unidades o de tiempo despu´s de que se encontrara en la posici´n y0 . e o Otra cuesti´n importante es el dominio de la soluci´n y(t) (para unos par´- o o a metros y condiciones iniciales dados). En principio hemos probado que la ecuaci´n tiene soluci´n unica en un entorno de t0 , pero una soluci´n dada en un o o ´ o entorno dado puede admitir prolongaciones a un intervalo mayor. Haciendo uso de las estimaciones expl´ ıcitas del teorema 6.6 junto con la unicidad de las solu- ciones es f´cil ver que dos prolongaciones de una misma soluci´n han de coincidir a o en su dominio com´n, luego la uni´n de todas las prolongaciones constituye una u o soluci´n m´xima, no prolongable, de la ecuaci´n diferencial. El dominio de esta o a o soluci´n m´xima ha de ser un intervalo abierto, sin que pueda prolongarse por o a
  • 261.
    6.2. Ecuaciones diferencialesde primer orden 245 continuidad a sus extremos, o de lo contrario podr´ ıamos usar el teorema de existencia para prolongar la soluci´n un poco m´s tomando como condiciones o a iniciales los valores en dicho extremo. Si el dominio de la soluci´n m´xima est´ o a a acotado superior o inferiormente, ello se debe necesariamente a que la curva obtenida tiende a infinito en el extremo o bien se acerca a la frontera del abierto donde est´ definido el problema. No entraremos en detalles sobre esto. a Como ejemplo de aplicaci´n del teorema anterior demostramos lo siguiente: o Teorema 6.10 Dadas dos funciones κ, τ : I −→ R de clase C 2 de modo que κ ≥ 0 y un punto t0 ∈ I, existe una curva regular x : ]t0 − ≤, t0 + ≤[ −→ R3 parametrizada por el arco tal que κ y τ son respectivamente su curvatura y su torsi´n. La curva es unica salvo isometr´ o ´ ıas. ´ Demostracion: La unicidad nos la da el teorema 4.23. Para probar la existencia consideramos el sistema de ecuaciones diferenciales determinado por las f´rmulas de Frenet: o T 0 = κN, N 0 = −κT − τ B, B 0 = τ N. Se trata de un sistema de nueve ecuaciones diferenciales con inc´gnitas las o nueve funciones coordenadas de T , N y B. Tomamos unas condiciones iniciales cualesquiera T0 , N0 , B0 tales que formen una base ortonormal positivamente orientada. Por el teorema anterior existen unas unicas funciones (T, B, N ) que ´ satisfacen las ecuaciones. Un simple c´lculo nos da a (T N )0 = κN N − κT T − τ T B, (T B)0 = κN B + τ T N, (N B)0 = −κT B − τ BB + τ N N (T T )0 = 2κT N, (N N )0 = −2κT N − 2τ N B (BB)0 = 2τ N B. Vemos que las seis funciones T N , T B, N B, T T , N N , BB satisfacen un sistema de ecuaciones diferenciales con la condici´n inicial (0, 0, 0, 1, 1, 1) que por o otra parte es claro que tiene por soluci´n a la funci´n constante (0, 0, 0, 1, 1, 1). o o La unicidad implica que (T, N, B) es una base ortonormal de R3 . Definimos Z s x(s) = T (s) ds. t0 0 Entonces es claro que x (s) = T (s), luego en particular x est´ parametrizada a por el arco. Adem´s x00 (s) = κN , luego κ es la curvatura de x. Un simple c´lculo a a nos da que la torsi´n es τ . o Veamos ahora una aplicaci´n a las variedades diferenciables. Sea S ⊂ Rm o una variedad de dimensi´n n y α : I −→ S una curva parametrizada por el o arco. Sea α(s0 ) = p. Sea X una carta de S alrededor de p. Entonces α¢tiene ° asociada una representaci´n en la carta x(s) de modo que α(s) = X x(s) . Un o vector arbitrario w0 ∈ Tp (S) es de la forma w0 = dX(x(s0 ))(a0 ). Teniendo en cuenta las ecuaciones (5.8) del cap´ ıtulo anterior es claro que la soluci´n a(s) del o problema Xn a0 + k ai Γk x0 = 0 ij j i,j=1
  • 262.
    246 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias con la condici´n inicial a(s0 ) = a0 determina un campo de vectores o ° ¢ ° ¢ w(s) = a1 (s) D1 X x(s) + · · · + an (s) Dn X x(s) con derivada covariante nula. Con esto casi tenemos demostrado el teorema siguiente: Teorema Sea S una variedad y α : I −→ S una curva parametrizada por el arco. Sea α(s0 ) = p y sea w0 ∈ Tp (S). Entonces existe un unico campo ´ w : I −→ R3 tal que w(s) ∈ Tα(s) (S), w(s0 ) = w0 y Dw = 0. Lo llamaremos transporte paralelo de w0 a trav´s de α. e En realidad hemos probado la existencia de w en un entorno de s0 . Vamos a justificar que la soluci´n puede prolongarse a todo I. Para ello conviene o observar que al ser Dw = 0 tenemos que w0 (s) es perpendicular a Tα(s) (S), luego (ww)0 = 2ww0 = 0, es decir, kwk es constante. De aqu´ se sigue que el ı transporte paralelo es unico: si w y w0 son transportes paralelos de un mismo ´ vector, entonces w − w0 es un transporte paralelo del vector nulo (porque su derivada covariante es la resta de las de los dos campos, luego es nula), luego es la aplicaci´n constantemente nula. o Acabamos de usar la linealidad de la derivada covariante. M´s en general, a 0 si tenemos dos vectores w0 , w0 ∈ Tp (S) y ambos tienen transporte paralelo w y w0 , entonces αw + βw0 es un transporte paralelo de αw0 + βw0 . Seg´n lo que 0 u sabemos, existe un entorno de s0 a lo largo del cual todos los vectores de una base de Tp (S) tienen transporte paralelo, con lo que de hecho todos los vectores de Tp (S) lo tienen. Dado cualquier s ∈ I, es claro que el intervalo [s0 , s] (o [s, s0 ] si s < s0 ) puede cubrirse con un n´mero finito de estos entornos donde existe transporte u paralelo, de donde se sigue inmediatamente la existencia de transporte paralelo desde s0 hasta s, luego el transporte paralelo existe sobre todo I. Definici´n 6.11 Sea S una variedad y α : [s0 , s1 ] −→ S una curva parametri- o zada por el arco de extremos p y q. Seg´n el teorema anterior, para cada vector u w0 ∈ Tp (S) tenemos definido el transporte paralelo w(s) a lo largo de α de modo que w(s0 ) = w0 . Al vector tpα (w0 ) = w(s1 ) ∈ Tq (S) lo llamaremos trasladado pq de w0 a lo largo de α. Esto nos define una aplicaci´n tpα : Tp (S) −→ Tq (S) a o pq la que llamaremos transporte paralelo de Tp (S) a Tq (S) a lo largo de α. Ejercicio: Probar que el transporte paralelo tpα : Tp (S) −→ Tq (S) es una isometr´ pq ıa. 6.3 Ecuaciones diferenciales de orden superior Las ecuaciones diferenciales que aparecen con mayor frecuencia en f´ ısica y en geometr´ son de orden 2. Afortunadamente, toda la teor´ sobre existencia y ıa ıa unicidad que vamos a necesitar para ecuaciones diferenciales de orden superior se deduce inmediatamente del caso de orden 1. En efecto:
  • 263.
    6.3. Ecuaciones diferencialesde orden superior 247 Teorema 6.12 Sea f : D ⊂ R × Rnm × Rk −→ Rn una funci´n de clase C k o con k ≥ 1 en un abierto D. Entonces la ecuaci´n diferencial o  y m) (t) = f (t, y, y 0 , . . . , y m−1) , µ)   y(t0 ) = y0    0 0 y (t0 ) = y0 ······ ···     m−1) m−1)  y (t0 ) = y0 0 m−1) tiene soluci´n unica y(t, µ, t0 , y0 , y0 , . . . , y0 o ´ ) de clase C k en un entorno de 0 m−1) cada punto (t0 , µ, t0 , y0 , y0 , . . . , y0 ). ´ Demostracion: Basta observar que el problema equivale al sistema de ecuaciones de primer orden  y 0 (t) = y1   0   y1 (t) = y2    ······ ··· 0 ym−2 (t) = ym−1    ym−1 (t) = f (t, y, y1 , . . . , ym−1 , µ)  0   0 m−1  (y, y1 , . . . , ym−1 )(t0 ) = (y0 , y0 , . . . , y0 ) donde hemos introducido las variables auxiliares yi , que representan funciones con valores en Rn . Todo este sistema se puede expresar como una unica ecuaci´n ´ o vectorial en las condiciones de la secci´n anterior. o Ejemplo Vamos a calcular todas las soluciones de la ecuaci´n o k 0 y 00 (t) = y (t), k ∈ R, t > 0. t Obviamente las funciones constantes son soluciones de la ecuaci´n. Si y no o es constante existe un punto t0 > 0 tal que y 0 (t0 ) 6= 0. Llamemos y1 = y 0 (t). En un entorno de t0 tenemos 0 y1 (t) k = , y1 (t) t luego integrando entre t0 y t queda log y1 (t) − log y(t0 ) = log xk , de donde y1 (t) = y1 (t0 )xk , es decir, y 0 (t) = y 0 (t0 )xk . Integrando de nuevo concluimos que  0  y (t0 ) xk+1 + y(t ) si k 6= −1 0 y(t) = k+1  0 y (t0 ) log t + y(t0 ) si k = −1
  • 264.
    248 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias Ahora es claro que las soluciones de la ecuaci´n dada est´n todas definidas o a en ]0, +∞[ y vienen dadas por Ω Axk+1 + B si k 6= −1 y(t) = A log t + B si k = −1 Estas expresiones incluyen las funciones constantes, que hab´ ıamos dejado aparte. El an´logo de segundo orden a un campo de velocidades ser´ un campo de a ıa aceleraciones, pero en f´ ısica resulta m´s natural hablar de campos de fuerzas. a Es frecuente que la fuerza Ft (x) que act´a sobre un cuerpo en un instante dado u dependa unicamente de su posici´n en el espacio, con lo que tenemos una funci´n ´ o o F : I × D −→ Rn . El campo de fuerzas ser´ estacionario si no depende del a tiempo. De acuerdo con la segunda ley de Newton, la trayectoria x(t) de un cuerpo de masa m sometido a este campo vendr´ determinada por la ecuaci´n a o diferencial Ft = m x00 . La soluci´n depende de la posici´n inicial x0 y la velocidad inicial v0 . o o Ejemplo La ley de la gravitaci´n universal de Newton afirma que la fuerza o con que se atraen mutuamente dos cuerpos es directamente proporcional a sus masas e inversamente proporcional al cuadrado de la distancia que los separa. Consideremos una regi´n del espacio donde haya un cuerpo S de masa M tan o grande que la masa de cualquier otro cuerpo en las proximidades resulte despre- ciable. Es el caso del Sol, rodeado de planetas de masa insignificante a su lado, o de la Tierra y sus alrededores. En tal caso podemos suponer que la unica´ fuerza que act´a sobre un cuerpo es la provocada por S. En efecto, cuando de- u jamos caer un objeto nuestro cuerpo lo atrae por gravedad, pero esta atracci´n o es completamente inapreciable frente a la gravitaci´n terrestre. Igualmente, o J´piter atrae gravitatoriamente a la Tierra, pero la fuerza con que lo hace es u insignificante frente a la del Sol. Si tomamos un sistema de referencia con origen en el punto donde se halla el objeto masivo S, la fuerza que experimenta otro cuerpo de masa m situado en un punto x viene dada por GM m F =− x, kxk3 donde G = 6,672 · 10−11 N · m2 /Kg2 es la constante de gravitaci´n universal. El o hecho de que su valor sea tan peque˜o hace que la gravedad no se manifieste n salvo en presencia de grandes masas, como las estrellas y los planetas. Tras estudiar minuciosamente una gran cantidad de observaciones astron´- o micas, en 1610 Kepler public´ su astronomia nova, donde conclu´ que los pla- o ıa netas se mueven siguiendo ´rbitas el´ o ıpticas, de modo que el Sol ocupa uno de ´ los focos. Esta es la primera ley de Kepler. Newton mostr´ que ´ste y muchos o e otros hechos sobre el movimiento de los astros pueden deducirse a partir de las
  • 265.
    6.3. Ecuaciones diferencialesde orden superior 249 leyes b´sicas de la din´mica y de su ley de gravitaci´n. Vamos a comprobar a a o que las trayectorias de los objetos sometidos a un campo de fuerzas como el que estamos considerando son rectas o secciones c´nicas. o En primer lugar, es claro que si un cuerpo se encuentra en un punto x0 en las proximidades del Sol con una velocidad v0 , su trayectoria no saldr´ del a plano determinado por los vectores x0 y v0 (o de la recta que determinan, si son linealmente dependientes). Por ello podemos tomar el sistema de referencia de modo que el eje Z sea perpendicular a este plano, con lo que la trayectoria cumplir´ z = 0 y podemos trabajar unicamente con las coordenadas (x, y). a ´ Conviene introducir coordenadas polares, r = (x, y) = (ρ cos θ, ρ sen θ). En general, cuando la trayectoria de un m´vil viene dada en coordenadas polares o por unas funciones ρ(t), θ(t), se llama velocidad angular a la derivada ω = θ0 . La segunda derivada α = ω 0 = θ00 se conoce como aceleraci´n angular. o La ecuaci´n de Newton puede expresarse en t´rminos de la cantidad de mo- o e vimiento, definida como p = mv, donde v = r0 es la velocidad del m´vil y m es o su masa. Admitiendo que ´sta es constante, la segunda ley de Newton afirma e que dp F = , dt donde F es la fuerza total que act´a sobre el cuerpo. En particular, la cantidad u de movimiento de un cuerpo sobre el que no act´a ninguna fuerza permanece u constante. Existen magnitudes an´logas a la cantidad de movimiento y la fuerza en a coordenadas polares. Se llama momento angular de un m´vil a la magnitud o L = r ∧ p = m r ∧ v. Si la trayectoria est´ contenida en un plano el vector L a es perpendicular a ´l. Veamos su expresi´n en coordenadas polares. Para ello e o calculamos: v = ρ0 (cos θ, sen θ) + ρω(− sen θ, cos θ), (6.1) de donde L = mρ(cos θ, sen θ, 0) ∧ ρω(− sen θ, cos θ, 0) = (0, 0, mρ2 ω). Para un movimiento plano podemos abreviar y escribir L = mρ2 ω. Se define el momento de una fuerza F que act´a sobre un m´vil de posici´n r como u o o M = r ∧ F . Es claro que si sobre un cuerpo act´an varias fuerzas el momento u de la fuerza resultante es la suma de los momentos. La versi´n angular de la o segunda ley de Newton es dL = mv ∧ v + r ∧ ma = r ∧ F = M, dt es decir, el momento total que act´a sobre un m´vil es la derivada de su momento u o angular. En particular, si un cuerpo est´ libre de toda fuerza su momento a angular permanece constante. Sin embargo, el momento angular se conserva incluso en presencia de fuerzas, con tal de que la fuerza resultante sea paralela a la posici´n, como ocurre en el caso de la fuerza gravitatoria que el Sol ejerce o sobre los planetas.
  • 266.
    250 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias Esto ya nos da una informaci´n sobre el movimiento de los planetas: puesto o que mρ2 ω ha de ser constante, los planetas giran m´s r´pidamente cuando est´n a a a m´s cerca del Sol. a Veamos ahora la expresi´n de la segunda ley de Newton para la gravitaci´n o o en coordenadas polares. Calculamos la aceleraci´n o a = v 0 = (ρ00 − ρω 2 )(cos θ, sen θ) + (2ρ0 ω + ρα)(− sen θ, cos θ). La fuerza gravitatoria es GM m F =− (cos θ, sen θ). ρ2 Teniendo en cuenta que los vectores (cos θ, sen θ) y (− sen θ, cos θ) son orto- gonales,la ecuaci´n F = ma equivale a las ecuaciones o GM ρ00 − ρω 2 = − , 2ρ0 ω + ρα = 0. (6.2) ρ2 La soluci´n es complicada, pero ahora estamos interesados unicamente en la o ´ forma de la trayectoria, aunque sea con otra parametrizaci´n. Por ello, en lugar o de calcular las funciones ρ(t) y θ(t) calcularemos la parametrizaci´n ρ(θ). Por o supuesto hay un caso en el que esta parametrizaci´n es imposible. Si ω0 = 0 o (lo cual equivale a que la velocidad inicial v0 sea nula o paralela a r0 )° entonces ¢ es f´cil ver que la soluci´n de las ecuaciones es una recta de la forma ρ(t), θ0 , a o donde ρ est´ determinada por la ecuaci´n a o GM ρ00 = − ρ2 con las condiciones iniciales ρ0 y ρ0 , determinadas a su vez por r0 y v0 . En 0 efecto, una trayectoria de este tipo cumple ω = α = 0 y satisface trivialmente las ecuaciones. En definitiva, el cuerpo se aleja del Sol en l´ ınea recta o bien cae sobre ´l. Hemos probado que si la trayectoria de un m´vil cumple ω(t) = 0 en e o un instante t entonces ω = 0 en todo instante, luego, rec´ ıprocamente, si ω0 6= 0 entonces ω no se anula nunca. Esto hace que la funci´n θ(t) sea un cambio de o par´metro, luego podemos considerar la reparametrizaci´n ρ(θ). Claramente a o ρ0 = ρ0 ω θ y ρ00 = ρ00 ω 2 + ρ0 α. θ θ Sustituimos estas igualdades en (6.2) y eliminamos α en la primera usando la segunda. El resultado es la ecuaci´n o µ ∂ 00 2ρ02 GM ρ − − ρ ω2 = − 2 , ρ ρ donde ahora todas las derivadas son respecto de θ y no respecto de t. No obs- tante, la presencia de ω nos obliga a considerar ambos miembros como funciones
  • 267.
    6.3. Ecuaciones diferencialesde orden superior 251 de t (la expresi´n entre par´ntesis es una funci´n de θ compuesta con la funci´n o e o o θ(t)). Sin embargo, al multiplicar ambos miembros por m2 ρ4 queda µ ∂ 1 2ρ02 GM m2 2 ρ00 − −ρ =− , (6.3) ρ ρ L2 donde L = mρ2 ω es una constante, luego todo el segundo miembro es constante y la igualdad sigue siendo v´lida si consideramos el primer miembro como funci´n a o de θ. Recordemos que si r es una recta y F un punto exterior, la c´nica de directriz o r y foco F est´ formada por los puntos tales que la raz´n entre las distancias a a o r y a F es constante (y recibe el nombre de excentricidad de la c´nica). Toda o c´nica que no sea una circunferencia es de esta forma. Si suponemos que el foco o es el origen y la directriz es la recta vertical x = p > 0, entonces la distancia de un punto de coordenadas polares (ρ, θ) a la directriz es |p − ρ cos θ|, luego la ecuaci´n de la c´nica de excentricidad ≤ es o o ρ = ≤. p − ρ cos θ En principio faltar´ un valor absoluto. Si ≤ ≤ 1 tenemos una elipse o ıa una par´bola y podemos suprimirlo, pues la curva queda al mismo lado de la a directriz que el foco. Si ≤ > 1 tenemos una hip´rbola, y al suprimir el valor e absoluto estamos qued´ndonos con una de sus ramas. Lo hacemos as´ porque a ı los cuerpos que se mueven siguiendo trayectorias hiperb´licas tienen al Sol en el o foco correspondiente a la rama que siguen o, dicho de otro modo, que la rama que eliminamos no va a ser soluci´n de la ecuaci´n diferencial. Despejando ρ y o o llamando r = p≤ queda r ρ= , 1 + ≤ cos(θ + k) La constante k equivale a girar la c´nica, de modo que ahora la directriz o es arbitraria. Cualquier curva de esta forma es una c´nica de excentricidad ≤. o Adem´s esta expresi´n incorpora tambi´n a las circunferencias, para las que a o e ≤ = 0. Es f´cil calcular a ≤ρ2 2≤2 ρ3 ≤ρ2 ρ0 = sen(θ + k), ρ00 = 2 sen2 (θ + k) + cos(θ + k). r r r Al sustituir en el miembro izquierdo de (6.3) se obtiene sin dificultad el valor −1/r, luego concluimos que la c´nica o L2 ° ¢−1 ρ= 2 1 + ≤ cos(θ + k) GM m satisface (6.3). S´lo queda probar que ´stas son las unicas soluciones posibles o, o e ´ lo que es equivalente, que hay una soluci´n de esta forma cualesquiera que sean o las condiciones iniciales ρ0 , θ0 , ρ0 , ω0 . Basta ver que las ecuaciones 0 L2 ° ¢−1 GM m2 ρ2 0 ρ0 = 2 1 + ≤ cos(θ0 + k) , ρ0 = 0 ≤ sen(θ0 + k) GM m L2
  • 268.
    252 Cap´ ıtulo 6. Ecuaciones diferenciales ordinarias tienen soluci´n en ≤ > 0, k para todos los valores de ρ0 , θ0 , ρ0 , ω0 , pero susti- o 0 tuyendo L = mρ2 ω0 estas ecuaciones equivalen a 0 µ 3 2 ∂ ° ¢ ρ0 ω0 ρ0 ρ2 ω 2 ≤ cos(θ0 + k), sen(θ0 + k) = − 1, 0 0 0 , GM GM que obviamente tienen soluci´n. Con esto hemos probado que las trayectorias o de los objetos sometidos a la atracci´n de una masa fija puntual son rectas o o secciones c´nicas. o Ejemplo Sea S una variedad diferenciable, sea p ∈ S y w ∈ Tp (S) un vector unitario. Sea X una carta alrededor de p, p = X(x0 ) y w = dX(x0 ). Entonces 0 existe una unica curva x(t) que verifica las ecuaciones (5.10) del cap´ ´ ıtulo anterior ° ¢ con las condiciones iniciales x(0) = x0 , x0 (0) = x0 . La curva g(t) = X x(t) 0 es una geod´sica de S parametrizada por el arco tal que g(0) = p y g 0 (0) = w. e Rec´ıprocamente, la representaci´n en la carta de cualquier geod´sica que cumpla o e esto ha de ser soluci´n de las ecuaciones (5.10), luego g es unica (salvo cambio o ´ de par´metro). En resumen: a En una variedad, por cada punto pasa una unica geod´sica en cada ´ e direcci´n. o Por ejemplo, en el cap´ ıtulo anterior probamos que los c´ ırculos m´ximos son a geod´sicas de la esfera. Puesto que por cada punto y en cada direcci´n pasa un e o c´ ırculo m´ximo, concluimos que los c´ a ırculos m´ximos son las unicas geod´sicas a ´ e de la esfera. *Ejemplo En el cap´ ıtulo anterior demostramos que las rectas el´ ıpticas e hi- perb´licas son geod´sicas de los planos el´ o e ıptico e hiperb´lico. Puesto que por o cada punto y en cada direcci´n pasa una unica recta, ahora podemos concluir o ´ que las rectas son las unicas geod´sicas. ´ e
  • 269.
    Cap´ ıtulo VII Teor´ de la medida ıa Pensemos en el concepto de ´rea de una figura plana F . Una primera apro- a ximaci´n consiste en definir dicha ´rea µ(F ) como el n´mero de veces que F o a u contiene al cuadrado de lado unidad, pero esta definici´n s´lo es aplicable si o o F es uni´n de un n´mero finito de cuadrados unitarios. Por ejemplo, si F es o u un rect´ngulo de lados m y n (naturales) entonces µ(F ) = mn. Si F es un a rect´ngulo de lados racionales r = p/q y r0 = p0 /q 0 , es f´cil concluir que el a a ´rea del rect´ngulo de lados p y q ha de ser qq 0 veces el ´rea de F , de donde a a a µ(F ) = rr0 . Si F es un rect´ngulo de lados arbitrarios α y β, ya no podemos a compararlo directamente con cuadrados unitarios y hemos de recurrir a un ar- gumento de continuidad: si r < α < r0 , s < β < s0 son n´meros racionales, u el ´rea de F ha de ser mayor que el ´rea de un rect´ngulo de lados r y s y a a a menor que la de un rect´ngulo de lados r0 y s0 , es decir, rs ≤ µ(F ) ≤ r0 s0 . El a unico n´mero real posible es µ(F ) = αβ. Una vez determinada el ´rea de un ´ u a rect´ngulo arbitrario, existen numerosos y elegantes argumentos que nos permi- a ten calcular el ´rea de muchas figuras, basados en que el ´rea se conserva por a a isometr´ as´ como en un principio elemental: ıas ı Si F ∩ G = ∅, entonces µ(F ∪ G) = µ(F ) + µ(G). (7.1) Es f´cil calcular el ´rea de un paralelogramo, de un tri´ngulo, de un pol´ a a a ıgono regular arbitrario, etc. Sin embargo, para calcular el ´rea de figuras m´s com- a a plicadas, como pueda ser un c´ ırculo, necesitamos de nuevo argumentos de con- tinuidad. Por ejemplo, si llamamos Pn al pol´ ıgono regular de 2n lados inscrito en un c´ırculo C y con un v´rtice en un punto prefijado, es f´cil ver que e a ∞ [ P2 ⊂ P3 ⊂ P4 ⊂ · · · C, y C= Pn , n=2 y en estas circunstancias es natural considerar que µ(C) = sup µ(Pn ). n 253
  • 270.
    254 Cap´ ıtulo 7. Teor´ de la medida ıa Admitiendo (7.1), es f´cil ver que el hecho de que el ´rea de la uni´n de a a o una sucesi´n creciente de conjuntos sea el supremo de las ´reas es equivalente o a a que el ´rea de una uni´n disjunta numerable de conjuntos sea la suma de a o sus ´reas. Este principio engloba a (7.1) y es suficiente para justificar todos a los razonamientos sobre c´lculo de ´reas. Con ´l como unica base podemos a a e ´ justificar la existencia y el c´lculo de ´reas de una amplia familia de figuras. a a Sin embargo no nos capacita para definir el ´rea de cualquier subconjunto de a R2 . Existen problemas t´cnicos para ello en los que no vamos a entrar, pero lo e cierto es que s´lo podremos definir una funci´n ´rea µ : M −→ [0, +∞] sobre o o a una cierta familia M, que contendr´ a todos los c´ a ırculos, tri´ngulos, etc., pero a que no ser´ todo el conjunto de partes de R2 . a Conviene introducir una nueva estructura matem´tica que recoja estas ideas a y nos permita extenderlas a otras situaciones an´logas (el volumen en R3 , el a a ´rea en una superficie, etc.) 7.1 Medidas positivas Definici´n 7.1 Sea X un conjunto. Un ´lgebra de subconjuntos de X es una o a familia A de subconjuntos de X tal que: a) ∅, X ∈ A. b) Si A ∈ A, entonces X A ∈ A. c) Si A, B ∈ A, entonces A ∪ B, A ∩ B ∈ A. Observar que la propiedad b) hace que la propiedad c) para uniones implique la parte para intersecciones y viceversa. Si dicha propiedad se cumple para familias numerables entonces se dice que A es una σ-´lgebra. a Una medida positiva (o simplemente una medida) en una σ-´lgebra A de sub- a conjuntos de X es una aplicaci´n µ : A −→ [0, +∞] que cumpla las propiedades o siguientes: a) µ(∅) = 0. b) Si {An }∞ es una familia de conjuntos de A disjuntos dos a dos, entonces n=0 √∞ ! ∞ [ X µ An = µ(An ). n=0 n=0 Los conjuntos de A se llaman subconjuntos medibles de X. Un espacio medida es una terna (X, A, µ), donde A es una σ-´lgebra de subconjuntos de X a y µ es una medida en A. En la pr´ctica escribiremos X en lugar de (X, A, µ). a La medida µ es unitaria si µ(X) = 1, es finita si 0 < µ(X) < +∞ y es σ-finita si µ(X) > 0 y existen conjuntos medibles {An }∞ de medida finita n=0 tales que ∞ [ X= An . n=0
  • 271.
    7.1. Medidas positivas 255 ´ Este ultimo es el caso del ´rea en el plano o el volumen en el espacio. El ´rea ´ a a del plano es infinita, pero podemos descomponerlo en una uni´n numerable de o bolas de ´rea finita. Tambi´n se habla de espacios medida unitarios, finitos o a e σ-finitos, seg´n sea la medida definida en ellos. u La σ-´lgebra m´s simple es la formada por todos los subconjuntos de X, pero a a ya hemos comentado que no podremos definir medidas interesantes sobre ella. Es claro que la intersecci´n de una familia de σ-´lgebras sobre un conjunto X o a es de nuevo una σ-´lgebra, por lo que dado G ⊂ X existe una m´ a ınima σ-´lgebra a que contiene a G. Se la llama σ-´lgebra generada por G. Si X es un espacio a topol´gico, la σ-´lgebra generada por los conjuntos abiertos recibe el nombre o a de σ-´lgebra de Borel. Una medida definida sobre la σ-´lgebra de Borel de un a a espacio topol´gico X recibe el nombre de medida de Borel en X. o Las propiedades siguientes de las medidas se deducen inmediatamente de la definici´n. Usamos el convenio de que si a ∈ R entonces a+∞ = +∞+∞ = +∞. o Teorema 7.2 Sea X un espacio medida. a) Si A ⊂ B son medibles entonces µ(A) ≤ µ(B). b) Si A ⊂ B son medibles y µ(A) < +∞, entonces µ(B A) = µ(B) − µ(A). c) Si A y B son conjuntos medibles disjuntos µ(A ∪ B) = µ(A) + µ(B). d) Si A y B son medibles entonces µ(A ∪ B) ≤ µ(A) + µ(B). e) Si {An }∞ son medibles entonces n=0 √∞ ! ∞ [ X µ An ≤ µ(An ). n=0 n=0 f ) Si {An }∞ son medibles y cada An ⊂ An+1 , entonces n=0 √∞ ! [ µ An = sup µ(An ). n n=0 g) Si {An }∞ son medibles, cada An+1 ⊂ An y µ(A0 ) < +∞, entonces n=0 √∞ ! µ An = ´ µ(An ). ınf n n=0 Por ejemplo, para probar el ultimo apartado aplicamos el anterior a los ´ conjuntos A0 An . Los conjuntos de medida cero se llaman conjuntos nulos. Si A es un conjunto nulo y B ⊂ A o bien B no es medible o bien es nulo. Sucede que siempre podemos suponer que es nulo, en el sentido de que la σ-´lgebra donde est´ definida una a a medida siempre se puede extender para que incluya a todos los subconjuntos de los conjuntos nulos. Antes de probar esto conviene definir una medida completa como una medida para la cual todos los subconjuntos de un conjunto nulo son medibles (y por lo tanto nulos).
  • 272.
    256 Cap´ ıtulo 7. Teor´ de la medida ıa Teorema 7.3 Sea X un conjunto µ : A −→ [0, +∞] una medida definida sobre una σ–´lgebra de subconjuntos de X. Sea a B = {A ⊂ X | existen B, C ∈ A tales que B ⊂ A ⊂ C y µ(C B) = 0}. Entonces B es una σ-´lgebra de subconjuntos de X que contiene a A y µ se a extiende a una unica medida en B, que es completa. ´ ´ Demostracion: Si A ∈ A es claro que A ∈ B. Basta tomar B = C = A. As´ pues A ⊂ A, luego en particular ∅, X ∈ B. ı Si A ∈ B, sean B, C ∈ A tales que B ⊂ A ⊂ C y µ(C B) = 0. Entonces X C ⊂ X A ⊂ X B, y claramente X C, X A ∈ A y ° ¢ µ (X C) (X B) = µ(B C) = 0. Por lo tanto X A ∈ B. Para probar que B es una σ-´lgebra basta probar que la a uni´n numerable de elementos de B est´ en B. Sea, pues, {An }∞ una familia o a n=0 de elementos de B. Sean {Bn }n y {Cn }n seg´n la definici´n de B. Entonces u o ∞ [ ∞ [ ∞ [ Bn ⊂ An ⊂ Cn , n=0 n=0 n=0 los conjuntos de los extremos est´n en A y a √√ ∞ ! √∞ !! √∞ ! [ [ [ 0≤µ Cn Bn ≤µ Cn Bn = 0. n=0 n=0 n=0 S ∞ Por lo tanto An ∈ B. Esto prueba que B es una σ-´lgebra. a n=0 Si A ∈ B y B, C son los conjuntos dados por la definici´n, es claro que o µ(B) = µ(C). Veamos que podemos extender la medida µ definiendo µ(A) = µ(B) = µ(C). Es claro que esta es la unica extensi´n posible. En efecto, ´ o si B 0 y C 0 tambi´n cumplen la definici´n, entonces B B 0 ⊂ C 0 B 0 , luego e o µ(B B 0 ) ≤ µ(C 0 B 0 ) = 0, de donde µ(B B 0 ) = 0 y µ(B) = µ(B 0 ), luego B y B 0 dan lugar al mismo valor de µ(A). Veamos que la extensi´n de µ que acabamos de definir es realmente una o medida. Para ello tomamos una familia {An }∞ de elementos de B disjuntos n=0 dos a dos. Sean {Bn } y {Cn } elementos de A que satisfagan la definici´n de B. o S ∞ S ∞ S ∞ Seg´n hemos visto, los conjuntos u Bn y Cn justifican que An ∈ B y n=0 n=0 n=0 es claro que los Bn son disjuntos dos a dos, luego √∞ ! √∞ ! ∞ ∞ [ [ X X µ An = µ Bn = µ(Bn ) = µ(An ). n=0 n=0 n=0 n=0 Es claro que la medida en B es completa, pues si A ∈ B es nulo y D ⊂ A, entonces tomamos B, C ∈ A tales que B ⊂ A ⊂ C con µ(B) = µ(C) = 0. Claramente ∅ ⊂ D ⊂ C y µ(C ∅) = 0, luego D ∈ B.
  • 273.
    7.1. Medidas positivas 257 La extensi´n construida en el teorema anterior se conoce como compleci´n o o de µ. En vista de esto, normalmente podremos suponer sin p´rdida de genera- e lidad que trabajamos con medidas completas. Otra propiedad importante que puede poseer una medida sobre un espacio topol´gico es la regularidad, que o definimos a continuaci´n. o Definici´n 7.4 Diremos que una medida µ en un espacio topol´gico X es regu- o o lar si todos los abiertos son medibles, los subespacios compactos tienen medida finita y para todo conjunto medible E se cumple µ(E) = ´ ınf{µ(V ) | E ⊂ V, V abierto} y µ(E) = sup{µ(K) | K ⊂ E, K compacto}. Diremos que la medida es casi regular si la segunda propiedad se cumple al menos cuando µ(E) < +∞ y cuando E es abierto. En definitiva una medida es regular si la medida de todo conjunto medible puede aproximarse por la medida de un abierto mayor y de un compacto menor. El concepto de medida casi regular lo introducimos por cuestiones t´cnicas, pero e a continuaci´n probamos que en todos los espacios que nos van a interesar es o equivalente a la regularidad. Diremos que un espacio topol´gico es σ-compacto si es uni´n numerable de o o conjuntos compactos. Por ejemplo, todo abierto Ω en Rn es σ-compacto, pues puede expresarse como uni´n de los compactos o Ωn = {x ∈ Ω | kxk ≤ n, d(x, Rn Ω) ≥ 1/n}, n = 1, 2, 3, . . . Teorema 7.5 Toda medida casi regular en un un espacio σ-compacto es regular. Demostracion: Supongamos que X es la uni´n de los compactos {Kn }∞ . ´ o n=1 Sustituyendo cada Kn por su uni´n con los precedentes podemos suponer que si o m ≤ n entonces Km ⊂ Kn . Dado un conjunto de Borel B tal que µ(B) = +∞, tenemos que ∞ [ B= B ∩ Kn , n=1 y como la uni´n es creciente sup µ(B ∩ Kn ) = µ(B) = +∞. Dado R > 0 existe o n un n tal que µ(B ∩ Kn ) > R + 1 y, como µ es casi regular, B ∩ Kn tiene medida finita y existe un compacto K ⊂ B ∩ Kn tal que µ(K) > R, lo que prueba que µ es regular. Ejercicio: Probar que la compleci´n de una medida regular es una medida regular. o
  • 274.
    258 Cap´ ıtulo 7. Teor´ de la medida ıa 7.2 Funciones medibles Si X es un espacio medida, a menudo tendremos que trabajar con subcon- juntos de X definidos a partir de una aplicaci´n f : X −→ Y y necesitaremos o garantizar que dichos conjuntos son medibles. Esto lo lograremos mediante el concepto de aplicaci´n medible. o Definici´n 7.6 Si X es un espacio medida e Y es un espacio topol´gico, una o o aplicaci´n f : X −→ Y es medible si las antiim´genes por f de los abiertos de o a Y son conjuntos medibles. Como las antiim´genes conservan las operaciones conjuntistas es muy f´cil a a probar que los conjuntos de Y cuyas antiim´genes son medibles forman una a σ-´lgebra, que en el caso de una funci´n medible contiene a los abiertos, luego a o contendr´ a todos los conjuntos de Borel, es decir, una aplicaci´n es medible si a o y s´lo si las antiim´genes de los conjuntos de Borel son conjuntos medibles. El o a siguiente caso particular nos interesar´ especialmente: a Teorema 7.7 Una aplicaci´n f : X −→ [−∞, +∞] es medible si y s´lo si lo o £ § o son todos los conjuntos f −1 ]x, +∞] , para todo x ∈ R. ´ Demostracion: Ya hemos comentado que los conjuntos con antiimagen medible forman una σ-´lgebra A. Hemos de ver que A contiene a los abiertos a de [−∞, +∞]. Por hip´tesis contiene a los intervalos ]x, +∞], luego tambi´n a o e sus complementarios [−∞, x]. Todo intervalo [−∞, x[ es intersecci´n numerable o de los intervalos [−∞, x + 1/n], luego tambi´n est´ en A. De aqu´ se sigue que e a ı A contiene tambi´n a los intervalos ]x, y[ = ]x, +∞] ∩ [−∞, y[. Finalmente, todo e abierto de [−∞, +∞] se expresa como uni´n numerable de intervalos abiertos, o luego est´ en A. a Es claro que la composici´n de una funci´n medible con una funci´n continua o o o es una funci´n medible. Esto nos da, por ejemplo, que si f : X −→ [−∞, +∞] o es medible, tambi´n lo es |f | y αf para todo n´mero real α, as´ como 1/f si f e u ı no se anula. Para probar resultados an´logos cuando intervienen dos funciones (suma de a funciones medibles, etc.) usaremos la observaci´n siguiente: o Si los espacios topol´gicos Y , Z tienen bases numerables (como o [−∞, +∞] y sus subespacios) y u : X −→ Y , v : X −→ Z son aplicaciones medibles, ° entonces la aplicaci´n u × v : X −→ Y × Z ¢ o dada por (u × v)(x) = u(x), v(x) es medible. Basta observar que los productos de abiertos b´sicos A × B forman una base a numerable de Y × Z, luego todo abierto de Y × Z es uni´n numerable de estos o conjuntos, por lo que es suficiente que sus antiim´genes sean medibles, pero a (u × v)−1 [A × B] = u−1 [B] ∩ v −1 [C]. Ahora, por ejemplo, si u, v : X −→ R son aplicaciones medibles, tambi´n lo e son f + g y f g, pues son la composici´n de u × v con la suma y el producto, que o son continuas.
  • 275.
    7.2. Funciones medibles 259 Nos interesa extender este resultado a funciones u, v : X −→ [−∞, +∞], pero entonces tenemos el problema de que no es posible extender la suma y el producto de modo que sean continuas en los puntos (+∞, −∞), (−∞, +∞) en el caso de la suma y en los puntos (±∞, 0), (0, ±∞) en el caso del producto. Hacemos esto: definimos u + v de modo que +∞ − ∞ = 0 (por ejemplo) y ahora observamos lo siguiente: Sea u : X −→ Y una funci´n medible, A un subconjunto medible de o X e y ∈ Y . Entonces la funci´n v : X −→ Y que coincide con u o fuera de A y toma el valor y en A es medible. La raz´n es que o Ω u−1 [B] A si y ∈ B / v −1 [B] = u−1 [B] ∪ A si y ∈ B As´ dadas u, v : X −→ [−∞, +∞] medibles tales que donde una vale +∞ ı, la otra no vale −∞, las modificamos para que valgan 0 donde toman valores infinitos, las sumamos y obtenemos una funci´n medible, luego modificamos o la suma para que tome el valor ∞ adecuado donde deba tomar dichos valores (claramente en un conjunto medible), con lo que obtenemos una funci´n medible. o Igualmente con el producto. Otra consecuencia del teorema sobre el producto cartesiano de funciones medibles es que si tenemos dos funciones medibles u, v : X −→ [−∞, +∞], los © ™ conjuntos del estilo de x ∈ X | u(x) < v(x) son medibles (por ejemplo en este © ™ caso se trata de la antiimagen por u × v del abierto (x, y) | x < y ). Dos operaciones definibles sobre todas las ™ © funciones f, g : X −→ [−∞, +∞] © ™ son las dadas por (f ∨ g)(x) = m´x f (x), g(x) y (f ∧ g)(x) = m´ f (x), g(x) . a ın Las funciones ∨, ∧ : [−∞, +∞] × [−∞, +∞] −→ [−∞, +∞] son ambas con- tinuas, pues lo son trivialmente cuando se restringen a los cerrados determina- dos por las condiciones x ≤ y e y ≤ x, respectivamente. Esto implica que si f, g : X −→ [−∞, +∞] son medibles, tambi´n lo son f ∨ g y f ∧ g. e En particular si f : X −→ [−∞, +∞] es una funci´n medible, definimos las o funciones f + = f ∨ 0 y f − = −(f ∧ 0), llamadas parte positiva y parte negativa de f , respectivamente. Tenemos que si f es medible tambi´n lo son f + y f − . El rec´ e ıproco es cierto porque claramente f = f + − f − . Adem´s |f | = f + + f − . a Seguidamente probaremos que la medibilidad se conserva al tomar l´ ımites. Si {an }∞ es una sucesi´n en [−∞, +∞], definimos sus l´ n=0 o ımites superior e inferior como l´ an = ´ sup an , l´ an = sup ´ an . ım ınf ım ınf n k≥0 n≥k n k≥0 n≥k En el cap´ ıtulo III demostr´bamos que el l´ a ımite superior de una sucesi´n es el o supremo de sus puntos adherentes. Igualmente se prueba que el l´ ımite inferior es el ´ ınfimo de sus puntos adherentes.
  • 276.
    260 Cap´ ıtulo 7. Teor´ de la medida ıa Una sucesi´n converge si y s´lo si tiene un unico punto adherente (su l´ o o ´ ımite), por lo que {an }∞ converge si y s´lo si l´ an = l´ an y entonces n=0 o ım ım n n l´ an = l´ an = l´ an . ım ım ım n n n Si {fn }∞ es una sucesi´n de funciones fn : X −→ [−∞, +∞], definimos n=0 o puntualmente las funciones sup fn , ´ fn , l´ fn y l´ fn . Si la sucesi´n es ınf ım ım o n n n n puntualmente convergente las dos ultimas funciones coinciden con la funci´n ´ o l´ ımite puntual l´ fn . ım n Teorema 7.8 Si las funciones fn son medibles, tambi´n lo son las funciones e sup fn , ´ fn , l´ fn y l´ fn . ınf ım ım n n n n ´ Demostracion: Claramente µ ∂−1 ∞ [ £ § −1 £ § sup fn ]x, +∞] = fn ]x, +∞] , n n=0 es medible. Igualmente se prueba con ´ınfimos y de aqu´ se deducen los resultados ı sobre l´ ımites superiores e inferiores. En particular, el l´ ımite puntual de una sucesi´n de funciones medibles es una funci´n medible. o o Si X es un espacio medida y E es un subconjunto medible, entonces los subconjuntos medibles de E forman una σ-´lgebra de subconjuntos de E y la a medida de X restringida a esta σ-´lgebra es una medida en E. En lo sucesivo a consideraremos a todos los subconjuntos medibles de los espacios medida como espacios medida de esta manera. S ∞ Notar que si X = En es una descomposici´n de X en subconjuntos o n=0 medibles (no necesariamente disjuntos), entonces f : X −→ Y es medible si y s´lo si lo son todas las funciones f |En , pues si f es medible y G es un abierto o en Y , (f |En )−1 [G] = f −1 [G] ∩ En , luego (f |En )−1 [G] es medible, y si las f |En son medibles, entonces f −1 [G] = (f |En )−1 [G], luego tambi´n es medible. e Si E es un subconjunto de X, su funci´n caracter´ o ıstica χE es medible si y s´lo si lo es E. o Si extendemos una funci´n medible f : E −→ [−∞, +∞] asign´ndole el va- o a lor 0 fuera de E, obtenemos una funci´n medible en X. Por ello identificaremos o las funciones medibles f : E −→ [−∞, +∞] con las funciones medibles en X que se anulan fuera de E. En particular identificaremos la restricci´n a E de o una funci´n f : X −→ [−∞, +∞] con la funci´n f χE . o o Los resultados que hemos dado son suficientes para garantizar que todas las funciones que manejaremos y los conjuntos definidos por ellas son medibles. No insistiremos en ello a menos que haya alguna dificultad inusual.
  • 277.
    7.3. La integralde Lebesgue 261 7.3 La integral de Lebesgue En todo espacio medida X podemos definir una integral que generaliza fuer- temente a la integral de Riemann que estudiamos en el cap´ ıtulo anterior para el caso de la recta real. M´s°adelante veremos que es posible definir una unica a ¢ ´ medida en R de modo que µ [a, b] = b − a. La integral asociada a esta medida coincide con la integral de Riemann sobre las funciones en las que ´sta est´ e a definida. La idea fundamental es que el papel que juegan los intervalos en la integral de Riemann lo juegan los conjuntos medibles en el caso general. Al considerar conjuntos m´s generales obtenemos muchas m´s funciones integrables, lo que a a se traduce en que la integrabilidad se conserva no s´lo por las operaciones al- o gebraicas (como en el caso de la integral de Riemann) sino tambi´n por pasos e al l´ ımite. En lugar de dar una definici´n de integral que muestre estas ideas, o aprovecharemos las propiedades de convergencia para dar una definici´n r´pida. o a Definici´n 7.9 Una funci´n simple en un espacio medida X es una funci´n o o o medible s : X −→ [0, +∞[ que s´lo toma un n´mero finito de valores α1 , . . . , αn . o u Si llamamos Ai = s−1 [αi ], entonces los conjuntos Ai son medibles disjuntos y Pn s= αi χAi . i=1 La base de nuestra construcci´n de la integral ser´ el teorema siguiente: o a Teorema 7.10 Si X es un espacio medida y f : X −→ [0, +∞] es una funci´n o medible, entonces existe una sucesi´n {sn }∞ de funciones simples en X tal o n=1 que 0 ≤ s1 ≤ s2 ≤ · · · ≤ f y f = l´ sn . ım n ´ Demostracion: Para cada n´mero na- u tural n > 0 y cada t ∈ R existe un unico´ 2 k = kn (t) ∈ N tal que k/2n ≤ t < (k + 1)/2n . Sea fn : [0, +∞] −→ [0, +∞] dada por f2 Ω kn (t)/2n si 0 ≤ t < n fn (t) = 1 n si n ≤ t ≤ +∞ La figura muestra la funci´n f2 . Claramente o fn toma un n´mero finito de valores y u f1 ≤ f2 ≤ f3 ≤ · · · ≤ I, 1 2 donde I es la funci´n identidad I(t) = t. Como t − 1/2n < fn (t) ≤ t para o 0 ≤ t ≤ n, es claro que {fn }∞ converge puntualmente a I. n=1 Sea sn = f ◦ fn . Claramente sn toma un n´mero finito de valores (a lo sumo u los que toma fn ) y las antiim´genes de estos valores son las antiim´genes por f a a de los intervalos donde los toma fn , luego son conjuntos medibles. Adem´s a 0 ≤ s1 ≤ s2 ≤ · · · ≤ f,
  • 278.
    262 Cap´ ıtulo 7. Teor´ de la medida ıa luego las funciones sn son simples y, tomando l´ ımites, es obvio que la sucesi´n o converge puntualmente a f . P n Definici´n 7.11 Sea X un espacio medida y s = o αi χAi una funci´n simple o i=1 en X. Definimos la integral de s en X como Z Xn s dµ = αi µ(Ai ) ∈ [0, +∞], X i=1 con el convenio de que +∞ · 0 = 0. P n Si E es un subconjunto medible de X, entonces s|E = αi χAi ∩E , donde i=1 las funciones caracter´ ısticas se toman ahora sobre E. Por lo tanto Z Xn s|E dµ = ai µ(Ai ∩ E). E i=1 P n Por otro lado sχE = αi χAi ∩E (con las funciones caracter´ ısticas en X), luego i=1 concluimos que Z Z n X s dµ = sχE dµ = αi µ(Ai ∩ E), E X i=1 es decir, que a efectos de integraci´n podemos adoptar consistentemente el con- o venio explicado antes por el que identificamos la funci´n s|E con sχE . o Ahora necesitamos el siguiente resultado t´cnico, que despu´s generalizare- e e mos notablemente. Teorema 7.12 Sea X un espacio medida. a) Sea s una funci´nRsimple en X. Para cada subconjunto medible E de X o definimos ν(E) = E s dµ. Entonces ν es una medida en X. b) Si s y t son funciones simples en X se cumple Z Z Z (s + t) dµ = s dµ + t dµ. X X X P n ´ Demostracion: a) Sea s = αi χAi . Claramente ν(∅) = 0. Sea E = i=1 S ∞ Ej una uni´n disjunta de conjuntos medibles. Entonces o j=1 n X n X ∞ X ν(E) = αi µ(Ai ∩ E) = αi µ(Ai ∩ Ej ) i=1 i=1 j=1 ∞ n XX ∞ X = αi µ(Ai ∩ Ej ) = ν(Ej ). j=1 i=1 j=1
  • 279.
    7.3. La integralde Lebesgue 263 P n P m b) Sean s = αi χAi y t = βj χBj . Llamemos Eij = Ai ∩ Bj . As´ tanto ı, i=1 j=1 s como t son constantes en los conjuntos Eij (s toma el valor αi y t el valor βj ). Por lo tanto Z Z Z (s + t) dµ = (αi + βj )µ(Eij ) = αi µ(Eij ) + βj µ(Eij ) = s dµ + t dµ. Eij Eij Eij Como los conjuntos Eij son disjuntos dos a dos y su uni´n es X, la parte a) o nos da que la igualdad se cumple para integrales en X. En particular notamos que si s ≤ t son funciones simples en un espacio medida X, entonces t − s tambi´n es una funci´n simple y e o Z Z Z Z s dµ ≤ s dµ + (t − s) dµ = t dµ. X X X X En particular se cumple que Z Z © ™ t dµ = sup s dµ | s es una funci´n simple, s ≤ t . o X X Esto hace consistente la siguiente definici´n: o Definici´n 7.13 Sea X un espacio medida y f : X −→ [0, +∞] una funci´n o o medible. Definimos la integral de f como Z Z © ™ f dµ = sup s dµ | s es una funci´n simple, s ≤ f ∈ [0, +∞]. o X X Observar que si E es un subconjunto medible de X, si s es una funci´n o simple en E por debajo de f |E , su extensi´n a X (nula fuera de E) es una o funci´n simple bajo f χE , y la restricci´n a E de una funci´n simple en X bajo o o o f χE es una funci´n simple en E bajo f |E . De aqu´ se sigue que o ı Z Z f dµ = f χE dµ, E X pues ambas integrales son el supremo del mismo conjunto de n´meros reales. u Las propiedades siguientes son inmediatas a partir de la definici´n: o Teorema 7.14 Sea X un espacio medida y E un subconjunto medible de X. R R a) Si 0 ≤ f ≤ g son funciones medibles en X, entonces X f dµ ≤ X g dµ. b) Si f ≥ 0 es una R funci´n medible en X y A ⊂ B son subconjuntos medibles o R de X, entonces A f dµ ≤ B f dµ. R c) Si f ≥ 0 es una funci´n medible en X y f |E = 0, entonces E f dµ = 0 o (aunque sea µ(E) = +∞).
  • 280.
    264 Cap´ ıtulo 7. Teor´ de la medida ıa R d) Si f ≥ 0 es una funci´n medible en X y µ(E) = 0, entonces o E f dµ = 0 (aunque sea f |E = +∞). El resultado siguiente es uno de los m´s importantes del c´lculo integral: a a Teorema 7.15 (de la convergencia mon´tona de Lebesgue) Sea X un o espacio medida y {fn }∞ una sucesi´n de funciones medibles en X tal que n=1 o 0 ≤ f1 ≤ f2 ≤ · · · ≤ f y f = l´ fn . ım n Entonces f es medible y Z Z f dµ = l´ ım fn dµ. X n X R R ´ Demostracion: Por el teorema anterior X fn dµ ≤ X fn+1 dµ. Toda sucesi´nRmon´tona creciente en [0, +∞] converge a su supremo, luego existe o o α = l´ X fn dµ ∈ [0, +∞]. ım n Sabemos que f es medible por ser l´ R puntual de funciones medibles. De R ımite R nuevo por el teorema anterior X fn dµ ≤ X f dµ, luego α ≤ X f dµ. Sea s una funci´n simple s ≤ f y sea 0 < c < 1. Definimos o En = {x ∈ X | fn (x) ≥ cs(x)}, para n = 1, 2, 3, . . . Claramente E1 ⊂ E2 ⊂ E3 ⊂ · · ·, son conjuntos medibles y, seg´n veremos S u enseguida, X = En . n En efecto, si x ∈ X y f (x) = 0, entonces x ∈ E1 y si, por el contrario, f (x) > 0 entonces cs(x) < s(x) ≤ f (x), luego x ∈ En para alg´n n. Claramente u Z Z Z fn dµ ≥ fn dµ ≥ c s dµ. X En En Ahora aplicamos el teorema 7.12 y el hecho de que la medida de la uni´n o de una sucesi´n creciente de conjuntos es el supremo de las medidas, con lo que o obtenemos Z Z Z α = l´ ım fn dµ ≥ c l´ ım s dµ = c s dµ. n X n En X R Como esto es cierto para todo c < 1 podemos concluir que α ≥ X s dµ para todaRfunci´n simple s ≤ f , luego tomando el supremo de estas integrales resulta o α ≥ X f dµ, con lo que tenemos la igualdad buscada. El teorema de la convergencia mon´tona permite en particular reducir pro- o piedades de la integral de funciones no negativas a propiedades de funciones simples. Por ejemplo, ahora es inmediato que si f : X −→ [0, +∞] es medible y α ∈ R, entonces Z Z αf dµ = α f dµ. X X
  • 281.
    7.3. La integralde Lebesgue 265 En efecto, por el teorema 7.10 existe una sucesi´n mon´tona de funciones o o simples {sn }∞ convergente a f y, por el teorema anterior, n=1 Z Z f dµ = l´ ım sn dµ. X n X R R Pero para funciones simples es inmediato que X αsn dµ = α X sn dµ, luego tomando l´ımites tenemos el mismo resultado para f . Otra aplicaci´n importante es que la integral conserva las sumas, incluso las o infinitas. Teorema 7.16 Sea X un espacio medida y sea {fn }∞ una sucesi´n de fun- n=1 o ciones no negativas medibles en X. Entonces Z X ∞ XZ ∞ fn dµ = fn dµ. X n=1 n=1 X ´ Demostracion: Probaremos en primer lugar que si f y g son medibles y no negativas, entonces Z Z Z (f + g) dµ = f dµ + g dµ. X X X Tomamos dos sucesiones mon´tonas {sn }∞ y {tn }∞ de funciones simples o n=1 n=1 convergentes a f y g respectivamente (existen por el teorema 7.10). R R R Por el teorema 7.12 sabemos que X (sn + tn ) dµ = X sn dµ + X tn dµ y, tomando l´ımites, el teorema de la convergencia mon´tona nos da la igualdad o buscada. En el caso general sabemos, por lo que acabamos de probar, que Z X k XZ k fn dµ = fn dµ para k = 1, 2, 3, . . . X n=1 n=1 X P k Las funciones fn forman una sucesi´n mon´tona de funciones medibles, o o n=1 luego por el teorema de la convergencia mon´tona o Z X ∞ ∞ X fn dµ = fn dµ. X n=1 n=1 Generalizamos ahora la primera parte del teorema 7.12. Teorema 7.17 Sea X un espacio medida y f : X −→ [0, +∞] una Rfunci´n o medible. Para cada subconjunto medible E de X definimos ν(E) = X f dµ. Entonces ν es una medida en X.
  • 282.
    266 Cap´ ıtulo 7. Teor´ de la medida ıa S ∞ ´ Demostracion: Claramente ν(∅) = 0. Sea E = En una uni´n disjunta o n=1 P ∞ de conjuntos medibles. Es claro que f χE = f χEn . Aplicando el teorema n=1 P ∞ anterior queda ν(E) = ν(En ). n=1 Despu´s necesitaremos el hecho siguiente: e Teorema 7.18 (Lema de Fatou) Sea X un espacio medida y sea {fn }∞ n=1 una sucesi´n de funciones medibles no negativas en X. Entonces o Z Z l´ fn dµ ≤ l´ ım ım fn dµ. X n n X ´ Demostracion: Sea gk = ´ fn . Entonces gk ≤ fn para n ≥ k, luego ınf R R n≥k g dµ ≤ ´ X k ınf X fn dµ. Adem´s las funciones gk forman una sucesi´n mon´- a o o n≥k tona creciente que converge a l´ fn , luego por el teorema de la convergencia ım n mon´tona o Z Z Z Z Z l´ fn dµ = l´ ım ım gk dµ = sup gk dµ ≤ sup ´ ınf fn dµ = l´ ım fn dµ. X n k X k≥1 X k≥1 n≥k X n X Ahora extendemos la integral a funciones medibles no necesariamente ma- yores o iguales que 0. Definici´n 7.19 Sea X un espacio medida y f : X −→ [−∞, +∞] una funci´n o o medible. Entonces f + y f − son funciones medibles no R negativas y f = R + − f − . f Diremos que f es integrable Lebesgue en X si tanto X f + dµ como X f − dµ son finitas. En tal caso definimos la integral de Lebesgue de f como Z Z Z f dµ = f + dµ − f − dµ ∈ R. X X X Llamaremos L1 (µ) al conjunto de las funciones integrables Lebesgue en X respecto a la medida µ. Si una funci´n f es no negativa, entonces f − = 0 y su integral es la que ya o ten´ıamos definida. Las propiedades siguientes son todas inmediatas a partir de los resultados que ya hemos demostrado. Teorema 7.20 Sea X un espacio medida y sean f , g : X −→ [−∞, +∞] fun- ciones medibles. R a) f es integrable si y s´lo si X |f | dµ < +∞, y en tal caso o ØZ Ø Z Ø Ø Ø f dµØ ≤ |f | dµ. Ø Ø X X
  • 283.
    7.3. La integralde Lebesgue 267 b) Si α, β ∈ R, y f , g son integrables, entonces αf + βg es integrable y Z Z Z (αf + βg) dµ = α f dµ + β g dµ. X X X R R c) Si f ≤ g y ambas son integrables, entonces X f dµ ≤ X g dµ. d) Si E es un subconjunto medibleR de X y f es integrable en X, entonces f R es integrable en E y E f dµ = X f χE dµ. e) Si E y F son subconjuntos medibles disjuntos de X, entonces la funci´n o f es integrable en E ∪ F si y s´lo si lo es en E y en F y, en tal caso, o Z Z Z f dµ = f dµ + f dµ. E∪F E F R f ) Si E es un subconjunto medible de X y f |E = 0, entonces E f dµ = 0. R g) Si E es un subconjunto nulo de X, entonces E f dµ = 0. h) Si f es integrable en X, entonces el conjunto de los puntos donde f toma los valores ±∞ es nulo. (La propiedad e sale de aplicar el teorema 7.17 a las partes positiva y negativa de f .) R R Algunas consecuencias: por d) vemos que E 1 dµ = X χE dµ = µ(E). Por a) tenemos que si |f | ≤ g y g es integrable entonces f tambi´n lo es. Toda e funci´n medible y acotada sobre un conjunto de medida finita es integrable. o Otra observaci´n de inter´s es la siguiente: si pasamos de una medida a su o e compleci´n, es claro que las funciones simples para la primera lo son tambi´n o e para la segunda y las integrales coinciden. El teorema de la convergencia mon´-o tona implica entonces que toda funci´n positiva integrable para una medida o sigue si´ndolo para su compleci´n, y de aqu´ se sigue inmediatamente el resultado e o ı para funciones arbitrarias. De este modo la integral respecto a la compleci´n o extiende a la integral respecto a la medida de partida. Veamos ahora un teorema de convergencia v´lido para funciones medibles a arbitrarias. Teorema 7.21 (de la convergencia dominada de Lebesgue) Sea X un espacio medida y sean {fn }∞ funciones medibles de X en [−∞, +∞] que n=1 convergen puntualmente a una funci´n f . Si existe una funci´n integrable o o g : X −→ [−∞, +∞] tal que |fn | ≤ g para todo n, entonces f es integrable y Z Z f dµ = l´ ım fn dµ. X n X Se dice que las funciones fn est´n dominadas por g. a
  • 284.
    268 Cap´ ıtulo 7. Teor´ de la medida ıa ´ Demostracion: Claramente |f | ≤ g, luego f es integrable. Puesto que |fn − f | ≤ 2g, podemos aplicar el lema de Fatou a las funciones no negativas 2g − |fn − f |, con lo que obtenemos que Z Z Z Z 2g dµ ≤ l´ım (2g − |fn − f |) dµ = 2g dµ + l´ ım (−|fn − f |) dµ. X n X X n X Es f´cil ver que el signo negativo sale del l´ a R ımite, pero cambiando ´ste por un R e l´ ımite superior, as´ − l´ X |fn − f | dµ ≥ 0, o sea, l´ X |fn − f | dµ ≤ 0. ı ım ım n R nR Pero es obvio que 0 ≤ l´ X |fn − f | dµ ≤ l´ X |fn − f | dµ = 0, luego ım ım n n R los l´ ımites superior e inferior coinciden, luego l´ X |fn − f | dµ = 0. Ahora ım n aplicamos que ØZ Z Ø ØZ Ø Z Ø Ø Ø Ø Ø fn dµ − Ø = Ø (fn − f ) dµØ ≤ f dµØ Ø |fn − f | dµ, Ø Ø X X X X de donde se sigue el teorema. Cuando una propiedad se verifica para todos los puntos de un espacio medida salvo los de un conjunto nulo se dice que la propiedad se verifica para casi todo punto, y lo abreviaremos p.c.t.p. Veamos un ejemplo: Teorema 7.22 RSi X es un espacio medida y f : X −→ [0, +∞] es una funci´n o medible tal que X f dµ = 0, entonces f = 0 p.c.t.p. de X. ´ Demostracion: Para cada natural n > 0 sea En = {x ∈ E | f (x) > 1/n}. Entonces Z Z 1 µ(En ) ≤ f dµ ≤ f dµ = 0, n En X luego µ(En ) = 0. La uni´n de los En es el conjunto E = {x ∈ X | f (x) > 0}, o luego f = 0 salvo en los puntos del conjunto nulo E. Cuando digamos que una funci´n f : X −→ [−∞, +∞] est´ definida p.c.t.p. o a esto significar´ que en realidad es f : X E −→ [−∞, +∞], donde E es un a conjunto nulo. Diremos que f es medible si loRes al extenderla a X tomando el valor 0 en E. En tal caso podemos hablar de X f dµ definida como la integral de dicha extensi´n. o Terminamos la secci´n con un importante teorema sobre integrales param´- o e tricas: Teorema 7.23 Sea U abierto en Rn , K un espacio m´trico compacto, µ una e medida de Borel finita en K, sean f : U × K −→ R una funci´n continua y o g : K −→ R una funci´n medible acotada. Definamos F : U −→ Rn como la o funci´n dada por o Z F (x) = f (x, y)g(y) dµ(y), K
  • 285.
    7.3. La integralde Lebesgue 269 donde dµ(y) indica que la integral se realiza respecto a la variable y ∈ K, con- siderando constante a x. Entonces F es continua en U y si existe ∂f : U × K −→ R ∂xi y es continua en U × K, entonces existe Z ∂F ∂f = (x, y)g(y) dµ(y) ∂xi K ∂xi y es continua en U . ´ Demostracion: Tomemos x0 ∈ U y sea B una bola cerrada de centro x0 contenida en U . Sea M una cota de g en K. Como f es uniformemente continua en B × K, dado ≤ > 0 existe un δ > 0 tal que si kx − x0 k < δ, entonces |f (x, y) − f (x0 , y)| < ≤/M µ(K), para todo y ∈ K. Por consiguiente, si kx − x0 k < δ se cumple Z |F (x) − F (x0 )| ≤ |f (x, y) − f (x0 , y)| |g(y)| dµ(y) ≤ ≤. K Esto prueba que F es continua en x0 . Supongamos ahora la hip´tesis de derivabilidad respecto a xi y sea ei el o i-´simo vector de la base can´nica de Rn . Como ∂f /∂xi es uniformemente e o continua en B × K, existe un δ > 0 tal que si |h| < δ entonces Ø Ø Ø ∂f ∂f Ø ≤ Ø Ø Ø ∂xi (x0 + hei , y) − ∂xi (x0 , y)Ø < M µ(K) , para todo y ∈ K. Si |h| < δ e y ∈ K, el teorema del valor medio nos da que existe un r ∈ R tal que |r| < |h| y ∂f f (x0 + hei , y) − f (x0 , y) = (x0 + rei , y)h. ∂xi (Notar que r depende de y.) Por consiguiente, Ø Ø Ø f (x0 + hei , y)g(y) − f (x0 , y)g(y) ∂f Ø Ø − (x0 , y)g(y)Ø Ø h ∂xi Ø Ø Ø Ø ∂f ∂f Ø ≤ =Ø Ø Ø ∂xi (x0 + rei , y) − ∂xi (x0 , y)Ø |g(y)| < µ(K) . De aqu´ se sigue claramente que ı Ø Z Ø Ø F (x0 + hei ) − F (x0 ) ∂f Ø Ø − (x0 , y)g(y) dµ(y)Ø < ≤. Ø h ∂xi Ø K siempre que |h| < δ, luego existe Z ∂F F (x0 + hei ) − F (x0 ) ∂f (x0 ) = l´ ım = (x0 , y)g(y) dµ(y). ∂xi h→0 h K ∂xi Adem´s la derivada es continua por la primera parte de este mismo teorema. a
  • 286.
    270 Cap´ ıtulo 7. Teor´ de la medida ıa 7.4 El teorema de Riesz Hasta ahora no tenemos ninguna medida de inter´s a la que aplicar los re- e sultados que acabamos de exponer. La construcci´n de medidas es el punto m´s o a delicado de toda la teor´ Puesto que el proceso es complicado cualquiera que ıa. sea el camino que tomemos, seguiremos uno que nos proporcionar´ un teorema a notable de la teor´ de la medida, el teorema de representaci´n de Riesz. Nece- ıa o sitamos unos preliminares topol´gicos sobre espacios localmente compactos. o Definici´n 7.24 Un espacio (de Hausdorff) X es localmente compacto si todo o punto de X tiene una base de entornos compactos. As´ pues, si p es un punto de un espacio localmente compacto X y V es un ı entorno abierto de p, existe un entorno compacto K ⊂ V . Por definici´n deo entorno existe un abierto W tal que p ∈ W ⊂ K ⊂ V y claramente W ⊂ K es un entorno compacto de p. En resumen, si X es localmente compacto, p ∈ X y V es un abierto tal que p ∈ V , existe otro abierto W con clausura compacta tal que p ∈ W ⊂ W ⊂ V . El teorema siguiente recoge un par de propiedades sencillas: Teorema 7.25 Sea X un espacio de Hausdorff. a) Si K ⊂ X es compacto y p ∈ X K, entonces existen abiertos disjuntos U y V tales que p ∈ U y K ⊂ V . b) Si X es localmente compacto, V es abierto en X y K ⊂ V es compacto, entonces existe un abierto W tal que K ⊂ W ⊂ W ⊂ V y W es compacto. ´ Demostracion: a) Por la propiedad de Hausdorff, para cada x ∈ K pode- mos encontrar abiertos disjuntos Ux y Vx tales que p ∈ Ux y x ∈ Vx . Entonces K est´ cubierto por los Vx , luego podemos tomar un subcubrimiento finito a Vx1 , . . . , Vxn . Basta tomar como U la intersecci´n de los Uxi y como V la uni´n o o de los Vxi . b) Para cada x ∈ K existe un abierto Wx de clausura compacta tal que x ∈ Wx ⊂ W x ⊂ V . Los abiertos Wx cubren a K. Tomamos un subcubrimiento finito y llamamos W a la uni´n de sus miembros. o Si X es un espacio localmente compacto y f : X −→ R, llamaremos soporte de f a la clausura del conjunto de puntos donde f toma el valor 0. Llamare- mos Cc (X) al conjunto de las aplicaciones continuas f : X −→ R con soporte compacto. Es claro que se trata de un subespacio vectorial de C(X). Usaremos las notaciones K ≺ f y f ≺ V para indicar que f : X −→ [0, 1], f ∈ Cc (X), K es compacto, V es abierto, f toma el valor 1 en K y f toma el valor 0 en X V . Teorema 7.26 (Lema de Urysohn) Sea X un espacio localmente compacto, sea V un abierto y K ⊂ V compacto. Entonces existe f ∈ Cc (X) tal que K ≺f ≺V.
  • 287.
    7.4. El teoremade Riesz 271 ´ Demostracion: Por el teorema anterior existe un abierto W0 de clausura compacta tal que K ⊂ W0 ⊂ W 0 ⊂ V . Sea W1 = X. Aplicamos de nuevo el teorema a W 0 ⊂ V , con lo que obtenemos un abierto W1/2 de clausura compacta tal que K ⊂ W0 ⊂ W 0 ⊂ W1/2 ⊂ W 1/2 ⊂ V ⊂ W1 . Dos nuevas aplicaciones del mismo teorema nos dan K ⊂ W0 ⊂ W 0 ⊂ W1/4 ⊂ W 1/4 ⊂ W1/2 ⊂ W 1/2 ⊂ W3/4 ⊂ W 3/4 ⊂ V ⊂ W1 . Inductivamente vamos obteniendo una familia de abiertos {Wr }r∈R , donde R = {k/2i | i ∈ N, 0 ≤ k ≤ 2i }, de manera que si r < r0 < 1 son puntos de R, entonces K ⊂ W r ⊂ Wr0 ⊂ V . Definimos g : X −→ [0, 1] mediante g(x) = ´ ınf{r ∈ R | x ∈ Wr }. As´ ı g[K] = {0} porque K ⊂ W0 y g[X V ] = {1} porque Ur ∩ (X V ) = ∅ si r < 1. Basta probar que g es continua, pues entonces f = 1 − g cumple lo pedido. Sea x ∈ X y ≤ > 0. Si g(x) 6= 0 y g(x) 6= 1, entonces existen r, r0 ∈ R tales que g(x) − ≤ < r < g(x) < r0 < g(x) + ≤, luego U = Wr0 − W r es un entorno de x que cumple g[U ] ⊂ [r, r0 ] ⊂ ]g(x) − ≤, g(x) + ≤[ . Si g(x) = 0 tomamos 0 = g(x) < r < g(x)+≤ y U = Wr cumple lo mismo. Si g(x) = 1 tomamos g(x) − ≤ < r < g(x) y el U buscado es X W r . En cualquier caso obtenemos la continuidad de g en x. Teorema 7.27 Si X es un espacio localmente compacto, V1 , . . . , Vn son abier- tos de X y K ⊂ V1 ∪ · · · ∪ Vn es compacto, entonces existen funciones hi ≺ Vi tales que h1 (x) + · · · + hn (x) = 1 para todo x ∈ K. Se dice que las funciones hi forman una partici´n de la unidad subordinada o a los abiertos dados. ´ Demostracion: Dado x ∈ K existe un i tal que x ∈ Vi . Existe un abierto Wx de clausura compacta tal que x ∈ Wx ⊂ W x ⊂ Vi . Los abiertos Wx cubren a K. Extraemos un subcubrimiento finito y llamamos Hi a la uni´n de todos o los abiertos del subcubrimiento cuya clausura est´ en Vi . De este modo los Hi a son abiertos de clausura compacta que cubren a K y H i ⊂ Vi . Por el teorema anterior existen funciones H i ≺ gi ≺ Vi . Definimos h1 = g1 , h2 = (1 − g1 )g2 , ... hn = (1 − g1 )(1 − g2 ) · · · (1 − gn−1 )gn . Es claro que hi ≺ Vi y una simple inducci´n prueba que o h1 + · · · + hn = 1 − (1 − g1 ) · · · (1 − gn ). Es claro entonces que la suma vale 1 sobre los puntos de K, pues una de las funciones gi ha de tomar el valor 1. Ya estamos en condiciones de demostrar el teorema de Riesz.
  • 288.
    272 Cap´ ıtulo 7. Teor´ de la medida ıa Teorema 7.28 (Teorema de representaci´n de Riesz) Sea X un espacio o localmente compacto y sea T : Cc (X) −→ R una aplicaci´n lineal tal que si o f ≥ 0 entonces T (f ) ≥ 0. Entonces existe una unica medida de Borel casi ´ regular µ en X tal que para toda funci´n f ∈ Cc (X) se cumple o Z T (f ) = f dµ. X ´ Demostracion: Veamos primero la unicidad. Es claro que una medida casi regular est´ completamente determinada por los valores que toma sobre los a conjuntos compactos, luego basta probar que si µ1 y µ2 representan a T en el sentido del teorema entonces µ1 (K) = µ2 (K) para todo compacto K. Por la regularidad existe un abierto V tal que K ⊂ V y µ2 (V ) < µ2 (K) + ≤. Por el lema de Urysohn existe una funci´n K ≺ f ≺ V . Entonces o Z Z Z µ1 (K) = χK dµ1 ≤ f dµ1 = T (f ) = f dµ2 X X X Z ≤ χV dµ2 = µ2 (V ) < µ2 (K) + ≤. X Por consiguiente µ1 (K) ≤ µ2 (K) e igualmente se prueba la desigualdad contraria. Para cada abierto V de X definimos µ(V ) = sup{T (f ) | f ≺ V }. Es obvio que si V1 ⊂ V2 entonces µ(V1 ) ≤ µ(V2 ), luego si definimos µ(E) = ´ ınf{µ(V ) | E ⊂ V, V abierto}, para todo E ⊂ X, es claro que la medida de un abierto es la misma en los dos sentidos en que la tenemos definida. Aunque hemos definido la medida de cualquier conjunto, ´sta s´lo cumplir´ e o a las propiedades de las medidas al restringirla a una cierta σ-´lgebra que contiene a a la σ-´lgebra de Borel. Concretamente, definimos MF como la familia de a subconjuntos E de X tales que µ(E) < +∞ y µ(E) = sup{µ(K) | K ⊂ E, K compacto}. Definimos M como la familia de todos los E ⊂ X tales que E ∩ K ∈ MF para todo compacto K. Probaremos que M es una σ-´lgebra que contiene a la a σ-´lgebra de Borel y que la restricci´n de µ a M es una medida casi regular. a o Veremos tambi´n que MF est´ formada por los conjuntos de M de medida finita. e a Dividimos la prueba en varios pasos. 1) Si {Ei }∞ son subconjuntos de X, entonces i=1 √∞ ! ∞ [ X µ Ei ≤ µ(Ei ). i=1 i=1
  • 289.
    7.4. El teoremade Riesz 273 Probamos primero que si V1 y V2 son abiertos µ(V1 ∪ V2 ) ≤ µ(V1 ) + µ(V2 ). Tomemos g ≺ V1 ∪ V2 arbitraria. Por el teorema 7.27 existen funciones h1 y h2 tales que hi ≺ Vi y h1 + h2 vale 1 sobre los puntos del soporte de g. Por lo tanto hi g ≺ Vi , g = h1 g + h2 g. T (g) = T (h1 g) + T (h2 g) ≤ µ(V1 ) + µ(V2 ). Como esto se cumple para toda g ≺ V1 + V2 , concluimos la desigualdad buscada. Podemos suponer que µ(Ei ) < +∞ para todo i, o la desigualdad que queremos probar se cumplir´ trivialmente. Dado ≤ > 0 la definici´n ıa o de µ implica que existen abiertos Vi que contienen a Ei de modo que µ(Vi ) < µ(Ei ) + ≤/2i . Sea V la uni´n de todos los Vi y tomemos f ≺ V . o Como f tiene soporte compacto en realidad f ≺ V1 ∪ · · · ∪ Vn para alg´n u n, luego ∞ X T (f ) ≤ µ(V1 ∪ · · · ∪ Vn ) ≤ µ(V1 ) + · · · + µ(Vn ) ≤ µ(Ei ) + ≤. i=1 Como esto vale para toda f ≺ V , resulta que ∞ X µ(V ) ≤ µ(Ei ) + ≤. i=1 Ahora bien, la uni´n de los Ei est´ contenida en V , y la funci´n µ es o a o claramente mon´tona por su definici´n, luego o o √∞ ! ∞ [ X µ Ei ≤ µ(Ei ) + ≤. i=1 i=1 Como esto vale para todo ≤ tenemos la desigualdad buscada. 2) Si K es compacto, entonces K ∈ MF y µ(K) = ´ ınf{T (f ) | K ≺ f }. En particular los compactos tienen medida finita. Si K ≺ f y 0 < α < 1, sea Vα = {x ∈ X | f (x) > α}. Entonces K ⊂ Vα y si g ≺ Vα se cumple αg ≤ f . Por lo tanto µ(K) ≤ µ(Vα ) = sup{T (g) | g ≺ Vα } ≤ α−1 T (f ). Si hacemos que α tienda a 1 concluimos que µ(K) ≤ T (f ) y es obvio que K est´ en MF . a Dado ≤ > 0 existe un abierto V tal que K ⊂ V y µ(V ) < µ(K) + ≤. Existe una funci´n K ≺ f ≺ V , luego o µ(K) ≤ T (f ) ≤ µ(V ) < µ(K) + ≤, lo que prueba que µ(K) = ´ ınf{T (f ) | K ≺ f }.
  • 290.
    274 Cap´ ıtulo 7. Teor´ de la medida ıa 3) MF contiene a todos los abiertos de medida finita. Sea V un abierto de medida finita y α un n´mero real tal que α < µ(V ). u Existe f ≺ V tal que α < T (f ). Si W es un abierto que contiene al soporte K de f entonces f ≺ W , luego T (f ) ≤ µ(W ), luego T (f ) ≤ µ(K). As´ ı hemos encontrado un compacto K ⊂ V tal que α < µ(K), lo que prueba que V ∈ MF . S ∞ 4) Si {Ei }∞ son elementos disjuntos de MF , y E = i=1 Ei entonces i=1 ∞ X µ(E) = µ(Ei ). i=1 Si adem´s µ(E) < +∞ entonces E ∈ MF . a Veamos primero que si K1 y K2 son compactos disjuntos µ(K1 ∪ K2 ) = µ(K1 ) + µ(K2 ). Dado ≤ > 0 existe K1 ≺ f ≺ X K2 . Por el paso 2) existe g tal que K1 ∪ K2 ≺ g y T (g) < µ(K1 ∪ K2 ) + ≤. Claramente K1 ≺ f g y K2 ≺ (1 − f )g, luego µ(K1 ) + µ(K2 ) ≤ T (f g) + T (g − f g) = T (g) < µ(K1 ∪ K2 ) + ≤, luego tenemos µ(K1 ) + µ(K2 ) ≤ µ(K1 ∪ K2 ) y el paso 1) nos da la otra desigualdad. Pasando al caso general, de nuevo por 1) basta probar una desigualdad. ´ Esta es trivial y µ(E) = +∞, luego podemos suponer que E tiene medida finita. Fijado ≤ > 0, puesto que Ei ∈ MF existen compactos Hi ⊂ Ei tales que µ(Hi ) > µ(Ei ) − ≤/2i . Sea Kn = H1 ∪ · · · ∪ Hn . Entonces n X n X µ(E) ≥ µ