1. REPUBLICA DE VENEZUELA
UNIVERSIDAD NACIONAL ABIERTA
CENTRO LOCAL ZULIA
FUNCIONES CONVEXAS
TRABAJO ESPECIAL DE GRADO PARA OPTAR AL TITULO DE LICENCIADO EN
MATEMÁTICA MENCION ANÁLISIS NUMÉRICO.
Realizado por :
Hernan Rafael Romero
C.I. : 5.803.158
MARACAIBO, DICIEMBRE DE 1.998
2. ii
APROBACIÓN DE LOS TUTORES
En nuestra condición de tutores del Trabajo de Grado presentado por el ciudadano
Hernan Rafael Romero para optar al Titulo de Licenciado en Matemática , Mención Análisis
Numérico , consideramos que dicho trabajo reúne los requisitos y méritos suficientes para
ser sometido a la presentación pública y evaluación por parte del jurado examinador que se
designe.
En la ciudad de Maracaibo, a los días del mes de de
1.999.
Prof. Jose Luis Flores MSc. Sergio Rivas
C.I. : C.I. :
3. iii
Trabajo de Grado aprobado en nombre de la muy ilustre Universidad Nacional
Abierta por el siguiente Jurado, a los días del mes de de 1.999.
Prof. Prof.
C.I. : C.I. :
Prof. Prof.
C.I. : C.I. :
4. iv
REPUBLICA DE VENEZUELA
UNIVERSIDAD NACIONAL ABIERTA
CENTRO LOCAL ZULIA
FUNCIONES CONVEXAS
TRABAJO ESPECIAL DE GRADO PARA OPTAR AL TITULO DE LICENCIADO EN
MATEMÁTICA MENCION ANÁLISIS NUMÉRICO.
Realizado por :
Hernan Rafael Romero
C.I. : 5.803.158
MARACAIBO, DICIEMBRE DE 1.998
5. v
DEDICATORIA
A la memoria de mi
padre a los quince años
de su muerte.
A la verdad objetiva y
no utópica.
6. vi
AGRADECIMIENTO
A Dios todopoderoso por sobre todas las cosas, por darme la inteligencia y sabiduría
necesarias para poder hacer el trabajo.
A toda mi familia por estimularme a seguir adelante.
A mis hermanos en general y muy especialmente a Nelson por su ayuda, a Iris y a
Magaly por haber hecho la transcripción al computador del trabajo.
A mis tutores los profesores Sergio Rivas y José Luis Flores quienes con su
experiencia, conocimientos, preocupada atención y excelente trato, supieron orientar éste
Trabajo Especial de Grado.
7. vii
RESUMEN
Romero, Hernan R. “Funciones Convexas”. Universidad Nacional Abierta. Centro Local
Zulia. Maracaibo. Diciembre. 1.998.
En la literatura castellana la Bibliografía sobre Funciones Convexas es muy escasa,
por no decir inexistente. Son muy pocos los libros de texto que tratan el tema no obstante la
gran importancia que tienen las Funciones Convexas en la Matemática, tanto pura como
aplicada. Se plantea así la necesidad de realizar un trabajo de investigación sobre las
Funciones Convexas que luego pueda ser útil como material de referencia en el desarrollo de
otras investigaciones.
Se utilizó como metodología de trabajo la investigación documental y consistió ésta
esencialmente en la recopilación de información de distintos materiales bibliográficos
aparecidos principalmente en lengua inglesa.
El resultado final es un trabajo escrito en el cual se desarrollan y amplían algunos de
los aspectos tratados en las fuentes originales y aunque no contiene nada nuevo puede
considerarse como un modesto aporte al estudio de las Funciones Convexas debido al
enfoque y tratamiento del tema y a que algunas demostraciones son de carácter original.
8. viii
INDICE GENERAL
Pág.
INTRODUCCION............................................................................................................. 1
CAPITULO I
Funciones Convexas Sobre IR............................................................................................. 3
1.1. Definición y Propiedades Básicas.................................... .....................................3
1.2. Continuidad y Diferenciabilidad...........................................................................15
1.3. Caracterización de las Funciones Convexas.........................................................26
1.4. Operaciones con Funciones Convexas.................................................................38
1.5. Funciones de Young y Funciones Convexas.........................................................50
1.6. Desigualdades Clásicas........................................................................................53
1.7. Funciones log-convexas.......................................................................................68
1.8. Funciones Aditivas y Funciones mid convexas.....................................................73
CAPITULO II
Funciones Convexas Sobre IRn
.........................................................................................83
2.1. Definición y Propiedades Básicas.........................................................................83
2.2. Hiperplanos y Propiedades Fundamentales de los Conjuntos Convexos................92
2.3. Continuidad de Funciones Convexas....................................................................96
2.4. Diferenciabilidad de Funciones..........................................................................107
2.5. Diferenciabilidad de Funciones Convexas..........................................................115
2.6. Caracterización de las Funciones Convexas.......................................................137
2.7. Extremos de Funciones Convexas......................................................................147
CAPITULO III
Funciones Convexas Sobre Espacios Vectoriales Normados............................................153
3.1. Definición y Propiedades Básicas.......................................................................153
9. ix
3.2. Continuidad de Funciones Convexas..................................................................155
3.3. Diferenciabilidad en Espacios Vectoriales Normados.........................................160
3.4. Caracterización de las Funciones Convexas.......................................................171
BIBLIOGRAFIA.............................................................................................................178
10. 1
INTRODUCCION
El estudio de las funciones convexas es de fundamental importancia en varios
campos de la Matemática, tanto pura como aplicada, pues ellas son requisito casi
indispensable para abordar estudios en campos tales como la teoría de la
optimización, la programación lineal y no lineal, la programación convexa, y además
aportan un tratamiento unificado para demostrar algunas de las desigualdades clásicas
de la Matemática, como por ejemplo, la desigualdad de la Media Geométrica - Media
Aritmética, la desigualdad de Hölder, la desigualdad de Cauchy-Schawrz y otras.
El objetivo central de ésta investigación es el estudio de las Funciones
Convexas a valores reales definidas sobre subconjuntos convexos de un espacio
vectorial.
El tratamiento del tema se desarrolla en tres capítulos.
En el primer capítulo se hace un estudio de las Funciones Convexas a valores
reales definidas sobre intervalos de la recta real y se tratan aspectos tales como la
continuidad y la diferenciabilidad, caracterización de las Funciones Convexas a partir
de propiedades de sus derivadas, operaciones que preservan la convexidad de las
funciones, desigualdades clásicas, funciones log-convexas y propiedades,
concluyendo el capítulo con un pequeño estudio sobre las funciones aditivas y
funciones mid convexas.
En el segundo capítulo se estudian las Funciones Convexas a valores reales
definidas sobre subconjuntos convexos de IRn
y se consideran las propiedades
básicas de estas funciones, la continuidad, la diferenciabilidad, la caracterización de
las Funciones Convexas a partir de sus propiedades de diferenciabilidad para
finalmente concluir el capítulo con el estudio de las propiedades de los extremos de
Funciones Convexas.
En el tercer y último capítulo se desarrollan las Funciones Convexas a valores
reales definidas sobre subconjuntos convexos de un espacio vectorial normado cuya
11. 2
dimensión puede ser finita o infinita, se analizan sus propiedades básicas y las
condiciones bajo las cuales dichas funciones son continuas, concluyéndose el capítulo
con la caracterización de las Funciones Convexas a partir de propiedades de su
primera y de su segunda derivada.
12. 3
Capítulo I
Funciones Convexas Sobre IR
Históricamente, el estudio de las funciones convexas f I: ⊂IR→IR , donde
I es un intervalo, se inicia con el trabajo de J. L. W. Jensen [10]. Realmente Jensen
llamó convexas a las funciones que ahora se conocen como midconvexas o convexas
en el punto medio, las cuales son definidas en la sección 8 de este capítulo. Iniciamos
el presente trabajo con el estudio de las funciones convexas f I: →IR, donde I es un
intervalo, ya que la teoría de estas es más fácil de asimilar y muchas de sus
propiedades se generalizan sin mayor dificultad.
1.1. Definición y Propiedades Básicas.
Iniciamos esta sección con la definición de función convexa que será utilizada
a lo largo de todo el capítulo para luego presentar un conjunto de propiedades de
carácter básico relacionadas con estas funciones.
Definición 1.1.1 : (Función Convexa). Sean I ⊂ IR un intervalo y f I: → IR una
función. Se dice que f es convexa sí y sólo si
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 (1.1)
para todo x, y ∈ I y λ ∈ [0, 1].
Si la desigualdad es estricta cuando x ≠ y, y λ ∈ (0, 1), se dice que f es
estrictamente convexa.
Obsérvese que para x y= = =, λ λ0 1o siempre se cumple la igualdad.
13. 4
Si se invierte la desigualdad en (1.1) se dice que f es cóncava. La función es
estrictamente cóncava si la desigualdad es estricta cuando x y≠ y λ ∈( , )0 1 .
Geométricamente, la definición de una función convexa f significa que para
cualesquiera dos puntos ( ) ( )x f x y f y Gra f, ( ) , , ( ) ∈ , donde Gra f es el gráfico de f ,
la cuerda que los une nunca está por debajo de la gráfica de la función, como
demostramos a continuación.
Sean x y I x y, , ,∈ < y considérese la ecuación de la recta que pasa por los
puntos ( ) ( )x f x y f y, ( ) , , ( ) , es decir
( )r t
f y f x
y x
t y f y t( )
( ) ( )
( ),=
−
−
− + ∈ IR..
Si ( ) ( )z x y= + − ∈λ λ λ1 0 1, , , entonces
( )( ) ( )( )
( )( ) ( )
( )
r z r x y
f y f x
y x
x y y f y
f y f x
y x
x y f y f x f y f y
f x f y
( )
( ) ( )
( )
( ) ( )
( ) ( ) ( ) ( )
( ) ( ).
= + − =
−
−
+ − − +
=
−
−
− + = − +
= + −
λ λ λ λ
λ λ
λ λ
1 1
1
Es decir ( )r z f x f y( ) ( ) ( )= + −λ λ1 , y así el punto ( )z r z, ( ) está sobre el segmento
de recta que une los puntos ( ) ( )x f x y f y, ( ) , , ( ) .
Además, como f es una función convexa se verifica
( ) ( )( ) ( )f z f x y f x f y r z= + − ≤ + − =λ λ λ λ1 1( ) ( ) ( )
14. 5
y por lo tanto f z r z( ) ( )≤ para todo [ ]z x y∈ , , de donde se concluye que el segmento
de recta que une los puntos ( ) ( )x f x y f y, ( ) , , ( ) nunca está por debajo de la gráfica
de la función. Gráficamente :
Figura 1.1
Análogamente, la interpretación geométrica de función cóncava establece que
si f I: → IR es una función cóncava entonces la cuerda que une los puntos
( ) ( )x f x y f y Gra f, ( ) , , ( ) ∈ nunca está por arriba de la gráfica de f . Gráficamente :
Figura 1.2
Por otra parte, si se multiplica la desigualdad (1.1) por −1 se obtiene
( )( ) ( )− + − ≥ − − −f x y f x f yλ λ λ λ1 1( ) ( )
Es decir
15. 6
( ) ( )( ) ( )( ) ( )( )( )− + − ≥ − + − −f x y f x f yλ λ λ λ1 1
para todo [ ]x y I, ,∈ ∈y λ 0 1 .
Esto permite deducir que f es convexa si y sólo si − f es cóncava.
Ahora podemos plantearnos la pregunta : ¿Cómo debe ser la gráfica de una
función que sea a la vez cóncava y convexa ?. La respuesta es : una función que es a
la vez cóncava y convexa es afín, es decir existen constantes m b, ∈IR , tales que
f x mx b x I( ) ,= + ∈ .
Demostración : Supóngase que f I: → IR es una función simultáneamente cóncava y
convexa, es decir
( )( ) ( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 1 2, ..
para todo [ ]x y I, , , .∈ ∈λ 0 1
Se probará que f es una función afín en el intervalo [ ]( )x y x y, .<
En efecto, si se verifica la igualdad (1.2) se tiene que para todo
[ ]x y I, ,∈ ∈y λ 0 1 se cumple
( )( ) ( )f y x y f y f x f y+ − = + −λ λ( ) ( ) ( ) ,
entonces si ( )x y z y x y
z y
x y
≠ = + − =
−
−
y tenemosλ λ y por lo tanto
( ) [ ]f z
f x f y
x y
z y f y z x y( )
( ) ( )
( ), ,=
−
−
− + ∈ .
Esta última expresión indica que f es una función afín en el intervalo [ ]x y, .
16. 7
Recíprocamente, si f I: → IR es una función afín, entonces existen constantes
m b, ∈IR , tales que f x mx b( ) = + . Luego, si [ ]λ ∈ 0 1, y x y I, ∈ resulta
( )( ) ( )( )
( ) ( )
( ) ( )( )
( ) ( ) ( )
f x y m x y b
m x m y b b
mx b my b
f x f y
λ λ λ λ
λ λ λ λ
λ λ
λ λ
+ − = + − +
= + − + + −
= + + − +
= + −
1 1
1 1
1
1 .
y en consecuencia f es cóncava y convexa. Además, se concluye que
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 , [ ]λ ∈ ∈0 1, , ,x y I , si y solo si f es afín
sobre I.
Es de hacer notar que si f I: → IR es una función convexa y alcanza un
mínimo en x Io ∈ entonces − f (cóncava) alcanza un máximo en dicho punto. Este
tipo de consideraciones hace inferir que el estudio de las funciones convexas permite
sacar conclusiones acerca de las funciones cóncavas.
Ejemplos de funciones convexas son :
1. ( )f x x= sobre I = IR ;
2. g x x( ) = 2
sobre I = IR ;
3. ( )h x x
= 1 sobre ( )0, .∞
Probemos que f y g son funciones convexas. En efecto sean x y, ∈IR y
[ ]λ ∈ 0 1, ,entonces :
( )( ) ( )
( )
( )
( )
1 1 1
1
1
1
)
( ) ( )
f x y x y
x y
x y
f x f y
λ λ λ λ
λ λ
λ λ
λ λ
+ − = + −
≤ + −
= + −
= + −
(desigualdad triangular)
17. 8
( )( ) ( )
( )( ) ( )
( ) ( )( ) ( )( )
( ) ( )
( )
2
2
2 0 0
2 2 2 2
) ( ) ( ) ( )g g y x y g y g x g y
y x y y x y
x y y x y x y x y
y x y x y x y
x y x y
es convexa
y
⇔ + − ≤ + −
⇔ + − − ≤ −
⇔ − + − ≤ − +
⇔ + − ≤ + ≠ − >
⇔ − ≤ −
λ λ
λ λ
λ λ λ
λ λ
λ
y esto último es cierto porque ( ]λ ∈ − >0 1 0, .y x y
3) Veamos ahora que h es convexa. En efecto, sean ( ) [ ]x y, , , ,∈ ∞ ∈0 0 1λ ,
entonces
( )( ) ( )
( )
( )
h x y h x h y
x y x y
λ λ λ λ
λ λ
λ λ
+ − ≤ + −
⇔
+ −
≤ + −
1 1
1
1
1
1
1
( ) ( )
( ) ( ) ( )⇔ ≤ + − + − + −xy y x y y x x y yλ λ λ λ λ λ1
( ) ( )
( ) ( )[ ]
⇔ ≤ + − + + − − − +
⇔ ≤ + + − + +
xy xy y y x xy xy x xy xy
xy x y x xy y
λ λ λ λ λ λ λ λ
λ λ λ λ λ λ
2 2 2 2 2 2
2 2 2 2 2
0 2 2
( ) ( )
( ) ( ) ( )
( )
( )
⇔ ≤ + + − + + ≠
⇔ ≤ − + − + −
⇔ ≤ − + + − >
⇔ ≤ −
0 2 2 0
0 2 1 1 1
0 2 1 0
0
2 2 2 2
2 2
2 2
2
λ λ λ λ
λ λ λ
λ
xy x y x xy y
xy x y
xy x y
x y ,
lo cual es cierto, y por lo tanto h es convexa.
18. 9
Comentario : como la relación (1.1) de la definición 1.1.1 siempre se cumple cuando
x=y, se puede suponer que x≠y, y sin pérdida de generalidad que x>y. Esto fue lo que
hicimos para demostrar que g es convexa. Análogamente se puede suponer λ≠0 y
λ≠1.
A continuación se verán otras formas equivalentes de definir las funciones
convexas.
Considerando [ ]λ ∈ 0 1, y haciendo α λ β λ= = −, 1 en la definición 1.1.1,
obtenemos que f I: → IR es una función convexa si y sólo si
( )f x y f x f yα β α β+ ≤ +( ) ( )
para todo [ ]x y I, , , ,∈ ∈y tales que + = 1.α β α β0 1
Además, para todo x y I p q p q, , , , ,∈ ≥ + >0 0 la desigualdad anterior es
equivalente a
f
px qy
p q
pf x qf y
p q
+
+
≤
+
+
( ) ( )
ya que se puede hacer α β=
+
=
+
p
p q
q
p q
, verificándose que
[ ]+ = 1 conα β α β, , ,∈ 0 1 y entonces
f
px qy
p q
f
p
p q
x
q
p q
y
p
p q
f x
q
p q
f y
pf x qf y
p q
+
+
=
+
+
+
≤
+
+
+
=
+
+
( ) ( )
( ) ( )
A continuación se presenta la desigualdad de Jensen, la cual es una
generalización de la desigualdad (1.1).
19. 10
Teorema 1.1.1 : (Desigualdad de Jensen). Sean I ⊂ IR un intervalo y f I: → IR una
función. Entonces f es convexa sí y sólo si
f x f xi i
i
n
i i
i
n
α α
= =
∑ ∑
≤
1 1
13( ) ( . )
para todo x I i ni i n∈ ≥ = + + =, , , , , .α α α0 1 11K Ktales que
Demostración : La condición necesaria se prueba por inducción. Para n=2 la relación
(1.3) es la desigualdad que define la convexidad de la función f. Supóngase que la
desigualdad (1.3) es cierta para n-1 sumandos (n>2), se probará que también es cierta
para n. Sin pérdida de generalidad se puede suponer que α αn n< − >1 1 0, luego y
entonces
( )
( )
f x f x x x
f
x x
x
i i
i
n
n n n n
n
n n
n
n n
α α α α
α
α α
α
α
=
− −
− −
∑
= + + +
= −
+ +
−
+
1
1 1 1 1
1 1 1 11
1
K
K
( )= −
−
+ +
−
+
−
−f x x xn
n
n
n
n n n1
1 1
1
1
1
1α
α
α
α
α
αK
( )
( )
( )
≤ −
−
+ +
−
+
= −
−
+
≤ −
−
+
= + =
−
−
=
−
=
−
=
−
=
∑
∑
∑ ∑
1
1 1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
α
α
α
α
α
α
α
α
α
α
α
α
α
α
α α α
n
n
n
n
n n n
n
i
n
i
i
n
n n
n
i
n
i
i
n
n n
i i n n
i
n
i i
i
n
f x x f x
f x f x
f x f x
f x f x f x
K ( ) ( )
( )
( ) ( ) (
( ) ( ) ( )
por convexidad
por hipotesis inductiva)
20. 11
Lo anterior implica que f x f xi i
i
n
i i
i
n
α α
= =
∑ ∑
≤
1 1
( ) , como se quería demostrar.
Comentario : En la demostración el punto
α
α
α
α
1
1
1
1
1 1−
+ +
−
−
−
n
n
n
nx xK está en el
intervalo I por ser combinación convexa de elementos de I (ver [8], pp. 66-67).
Además, la prueba del recíproco es inmediata porque la desigualdad (1.3) es válida
para todo n≥1 tal que n∈IN y en particular para n=2, que es precisamente la
desigualdad que define la convexidad.
De este teorema se deriva inmediatamente el corolario siguiente.
Corolario 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f es
convexa si y sólo si
f
x f xi i
i
n
i
i
n
i i
i
n
i
i
n
β
β
β
β
=
=
=
=
∑
∑
∑
∑
≤1
1
1
1
14
( )
( . )
para todo x I i ni i i
i
n
∈ ≥ = >
=
∑, , , , , .β β0 1 0
1
K tales que
Demostración : Se obtiene inmediatamente del teorema anterior haciendo
α
β
β
i
i
j
j
n
=
=
∑
1
, para todo i n= 1, , .K
El lema que sigue se usará luego en la demostración del teorema 1.2.2.
Lema 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f es
convexa sí y sólo si
21. 12
f z f x
z x
f y f x
y x
f y f z
y z
( ) ( ) ( ) ( ) ( ) ( )−
−
≤
−
−
≤
−
−
para todo x y z I x z y, , .∈ < <tal que
Demostración : Para probar la primera desigualdad, consideremos
( ) ( )z x y x= + − ∈λ λ, ,0 1 , luego λ =
−
−
z x
y x
. Dado que f es convexa se verifica
( )f z f x f y f x( ) ( ) ( ) ( )≤ + −λ ,
de donde
( )f z f x
z x
y x
f y f x( ) ( ) ( ) ( )− ≤
−
−
−
y en consecuencia
f z f x
z x
f y f x
y x
( ) ( ) ( ) ( )−
−
≤
−
−
que es la primera desigualdad.
Sea ahora ( )z y x y= + −λ , entonces ( )λ =
−
−
∈
z y
x y
0 1, y de la convexidad de la
función f se tiene
( )f z f y f x f y( ) ( ) ( ) ( )≤ + −λ
de donde se obtiene inmediatamente
( )
f z f y
z y
f x f y
x y
z y
( ) ( ) ( ) ( )−
−
≥
−
−
− < 0
22. 13
que es precisamente la segunda desigualdad. Recíprocamente, supóngase que f
verifica las desigualdades del lema con [ ]x z y< < ∈; ,y sea λ 0 1 tal que
( )z x y x= + −λ . Obsérvese que λ =
−
−
z x
y x
. Por la primera desigualdad
f z f x
z x
f y f x
y x
( ) ( ) ( ) ( )−
−
≤
−
−
,
luego
( )f z f x
z x
y x
f y f x( ) ( ) ( ) ( )≤ +
−
−
−
es decir
( )( ) ( )f x y x f x f y f x+ − ≤ + −λ λ( ) ( ) ( )
para todo [ ]x y I, , ,∈ ∈y λ 0 1 y por lo tanto f es una función convexa.
Comentario : Respecto a la figura 1.3, el lema expresa lo siguiente :
Pendiente de AB ≤ Pendiente de AC ≤Pendiente de BC
Figura 1.3
La proposición que sigue es otra propiedad de las funciones convexas.
23. 14
Proposición 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f
es convexa sí y sólo si para todo x z y I, , ∈ tal que x z y< < las siguientes
desigualdades son equivalentes :
( ) ( ) ( )1
1
1
1
0)
( )
( )
( )
( ) ( ) ( )
x f x
z f z
y f y
y z f x x y f z z x f y= − + − + − ≥
( )( ) ( )( ) ( )( )
2 0)
( ) ( ) ( )f x
x z x y
f z
z y z x
f y
y x y z− −
+
− −
+
− −
≥
Demostración : Se probará primero la condición necesaria. Sean x z y I, , ∈ tales que
x z y< < , entonces ( )z x y
y z
y x
z x
y x
= + ∈ + = =
−
−
=
−
−
α β α β α β α βcon y, , , , .0 1 1
Como f es convexa se cumple ( )f x y f x f yα β α β+ ≤ +( ) ( ), es decir
f z
y z
y x
f x
z x
y x
f y( ) ( ) ( ) ( . )≤
−
−
+
−
−
15
Pero esto es cierto si y sólo si ( ) ( ) ( )y x f z y z f x z x f y− ≤ − + −( ) ( ) ( ) y esta
desigualdad es equivalente a
( ) ( ) ( )y z f x x y f z z x f y− + − + − ≥( ) ( ) ( ) 0
que es precisamente la relación 1).
Ahora bien, esta desigualdad es cierta si y sólo si
( )( ) ( )( ) ( )( )
f x
x y z x
f z
y z z x
f y
y z x y
( ) ( ) ( )
− −
+
− −
+
− −
≤ 0
ya que ( )( )( )y z x y z x− − − < 0. Pero esto es cierto si y sólo si
24. 15
( )( ) ( )( ) ( )( )
f x
x z x y
f z
z y z x
f y
y x y z
( ) ( ) ( )
− −
+
− −
+
− −
≥ 0,
que es la relación 2).
Queda así probado que si f es una función convexa entonces las desigualdades
1) y 2) son equivalentes.
Recíprocamente, como para cualesquiera x z y I, , ∈ tales que x z y< < las
desigualdades 1) y 2) se pueden escribir en la forma dada por la relación (1.5), se
concluye que f es convexa.
1.2. Continuidad y Diferenciabilidad.
En esta sección se estudiarán las propiedades de continuidad y
diferenciabilidad de las funciones convexas. La sección se inicia con una proposición
que expresa que toda función convexa definida en un intervalo cerrado y acotado es
acotada.
Proposición 1.2.1 : (ver [17], Cap. 1, p. 3). Si [ ]f a b: , → IR es una función
convexa, entonces es acotada.
Demostración : Sea { }M max f a f b= ( ), ( ) . Considérese [ ]z a b∈ , , luego
existe [ ]λ ∈ 0 1, tal que ( )z a b= + −λ λ1 y como f es una función convexa se tiene
( )( ) ( )
( )
f z f a b f a f b
M M M
( ) ( ) ( )
.
= + − ≤ + −
≤ + − =
λ λ λ λ
λ λ
1 1
1
Es decir f es acotada superiormente.
25. 16
Para ver que f es acotada inferiormente tomemos t ∈IR de tal forma que los
puntos
x
a b
t y
a b
t=
+
− =
+
+
2 2
,
estén en [ ]a b, . Entonces
f
a b
f
a b
t
a b
t
f
a b
t f
a b
t
+
=
+
+
+
+
−
≤
+
+
+
+
−
2
1
2 2
1
2 2
1
2 2
1
2 2
,
de donde
f
a b
t f
a b
f
a b
t
f
a b
M m
+
+
≥
+
−
+
−
≥
+
− =
2
2
2 2
2
2
Como cualquier punto de [ ]a b, se puede escribir en la forma
a b
t
+
+
2
, para
algún t debidamente seleccionado, se deduce que f es acotada inferiormente.
En conclusión, para todo [ ]z a b∈ , se verifica que
m f z M≤ ≤( )
donde { }M max f a f b= ( ), ( ) y m f
a b
M=
+
−2
2
y por lo tanto f es acotada.
Comentario : Es indispensable que el intervalo en que está definida la función sea
cerrado y acotado ya que en caso contrario puede suceder que la función no sea
acotada. Como ejemplos de esto se tienen las funciones ( ]f : ,0 1 → IR definida por
26. 17
f x x( ) = −1
y [ )g: ,0 ∞ → IR definida por g x x( ) = 2
, que son convexas pero no son
acotadas superiormente.
A continuación se introduce la definición de función de Lipschitz para luego
demostrar que toda función convexa f I: → IR es Lipschitz en cualquier intervalo
[ ]a b, contenido en el interior de I.
Definición 1.2.1 : Se dice que una función [ ]f a b: , → IR satisface la condición de
Lipschitz (o es Lipschitz) si para todo [ ]x y a b, ,∈ existe una constante k tal que
f y f x k y x( ) ( )− ≤ − .
La constante k se denomina constante de Lipschitzidad.
El siguiente teorema expresa que toda función f I: ⊂ IR→IR convexa, donde I
es un intervalo, satisface una condición de Lipschitz en cualquier intervalo cerrado
contenido en el interior de I.
Teorema 1.2.1 : (ver [8], teorema 2, p. 26). Sean I ⊂ IR un intervalo y f I: → IR
una función convexa. Entonces f satisface una condición de Lipschitz en cualquier
intervalo cerrado [ ]a b I, ⊂
o
y, por lo tanto, f es continua en el interior de I.
Demostración : Sea ε > 0 tal que a b− +ε εy están en I, y sean m y M las cotas
inferior y superior de f en el intervalo [ ]a b− +ε ε, . Sean [ ]x y a b, ,∈ , con x y≠ .
Como ( )
1
1
y x
y x
−
− = , resulta que ( ) [ ]z y
y x
y x a b= +
−
− ∈ − +
ε
ε ε, . Luego,
27. 18
y
y x
y x
z
y x
x=
−
+ −
+
+ −ε
ε
ε
. En consecuencia, si tomamos ( )λ
ε
=
−
+ −
∈
y x
y x
0,1 ,
resulta que ( )y z x= + −λ λ1 y como f es convexa se tiene que
( ) [ ]f y f z f x f z f x f x( ) ( ) ( ) ( ) ( ) ( )≤ + − = − +λ λ λ1 .
Por lo tanto
( ) ( )f y f x M m
y x
M m k y x( ) ( )− ≤ − <
−
− = −λ
ε
,
donde ( )k M m= − / ε . Como esto es cierto para [ ]x y a b, ,∈ , x y≠ , se deduce que
f y f x k y x( ) ( )− < − y así f es Lipschitz en cualquier intervalo [ ]a b I, ⊂
o
. De la
arbitrariedad del intervalo[ ]a b, se concluye que f es continua en el interior de I.
Comentario : El teorema que se acaba de demostrar establece que toda función
f I: → IR convexa, es continua en el interior del intervalo I. Pero no se aclara la
situación en los puntos extremos del intervalo I. Con el fin de aclarar esto,
considérese la función [ ]g: ,− →1 1 IR definida por
[ )
g x
x si x
si x
( )
,
=
∈ −
=
2
1 1
2 1
Esta función es convexa, continua en x = −1 y discontinua en x = 1.
En este ejemplo se puede observar que si f I: → IR es una función convexa,
no se puede decir nada sobre la continuidad de f en los extremos del intervalo I. Sin
embargo, el número de discontinuidades que puede tener una función convexa nunca
excede de dos ya que en el interior de su dominio es continua.
28. 19
Antes de dar un corolario que se deriva del teorema 1.2.1 consideremos la
siguiente definición.
Definición 1.2.2 : Una función f I: → IR es absolutamente continua sobre I, si para
cada ε > 0 , existe δ > 0 tal que, para toda colección de intervalos abiertos
( )a b Ii i, ⊂ , disjuntos dos a dos, se tiene que
( )f b f a b ai i
i
n
i i
i
n
( ) ( ) ,− < − <
= =
∑ ∑
1 1
ε δcuando .
Corolario 1.2.1 : Si I es un intervalo en IR y f I: → IR es una función convexa,
entonces f es absolutamente continua sobre cualquier intervalo [ ]a b I, ⊂
o
.
Demostración : Sea ( ){ }a b i ni i, : , ,= 1 K una colección de intervalos abiertos
disjuntos dos a dos, contenidos en [ ]a b I, ⊂
o
. Por el teorema 1.2.1 se tiene que f es
Lipschitz sobre el intervalo cerrado [ ]a b, , esto es ; existe una constante k, tal que si
[ ]x y a b, ,∈ entonces f x f y k x y( ) ( )− ≤ − . Sea ε > 0 y considérese un δ > 0 tal
que
b ai i
i
n
− <
=
∑
1
δ .
Entonces
f b f a k b a k b a ki i
i
n
i i
i
n
i i
i
n
( ) ( )− ≤ − = − <
= = =
∑ ∑ ∑
1 1 1
δ .
Por lo tanto, f b f ai i
i
n
( ) ( )− <
=
∑
1
ε si consideramos 0 < <δ ε
k
y en consecuencia
toda función convexa f I: →IR es absolutamente continua en I
ο
.
29. 20
En lo que sigue de esta sección se tratará la diferenciabilidad de funciones
convexas. Recuérdese que si f I: → IR es una función, donde I es un intervalo en IR,
la derivada (lateral) izquierda de f en el punto x I∈ está definida por
f x lim
f y f x
y xy x
−
↑
=
−
−
'
( )
( ) ( )
donde y x↑ quiere decir y x y x→ <, y se supone que x no es el extremo izquierdo
de I y además y I∈ . Similarmente la derivada (lateral) derecha de f en x se define
como :
f x lim
f y f x
y xy x
+
↓
=
−
−
'
( )
( ) ( )
donde y x↓ quiere decir y x y x→ >, y suponemos que x no es el extremo derecho
de I e y I∈ .
El siguiente teorema establece que las derivadas laterales de una función
convexa existen, son monótonas y crecientes.
Teorema 1.2.2 : (ver [17], Cap. 1, teorema B, p. 5). Si I es un intervalo en IR y
f I: → IR es una función convexa (estrictamente convexa), entonces las derivadas
laterales f f−
′
+y '
existen, son crecientes (estrictamente crecientes) en
I f x f x
o
y − +≤' '
( ) ( ) , para todo x I∈
o
.
Demostración : Considérense cuatro puntos w x y z I, , , ∈
o
tales que w x y z< < < y
sean
30. 21
( ) ( ) ( ) ( )A w f w B x f x C y f y D z f z= = = =, ( ) , , ( ) , , ( ) , ( )y (ver figura 1.4).
Figura 1.4
Aplicando el lema 1.1.1 primero a los puntos A, B, C y luego a los puntos B,
C, D se tiene :
Pendiente de AB≤Pendiente de AC≤Pendiente de BC
≤Pendiente de BD≤Pendiente de CD
con desigualdades estrictas si f es estrictamente convexa. Esto equivale a las
siguientes desigualdades :
f w f x
w x
f w f y
w y
f x f y
x y
f x f z
x z
f y f z
y z
A
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
( )
−
−
≤
−
−
≤
−
−
≤
−
−
≤
−
−
De la segunda desigualdad de (A) se obtiene que
f w f y
w y
w w y B
( ) ( )
( ) ( )
−
−
<es creciente en
De las desigualdades segunda, tercera y cuarta se tiene
f w f y
w y
f y f z
y z
( ) ( ) ( ) ( )
,
−
−
≤
−
−
31. 22
es decir
f w f y
w y
( ) ( )−
−
está acotado superiormente por
f y f z
y z
C
( ) ( )
( )
−
−
para cualquier z y> .
De (B) y (C) resulta que lim
f w f y
w yw y↑
−
−
( ) ( )
existe y
lim
f w f y
w y
f w f y
w yw y w y↑ <
−
−
=
−
−
( ) ( )
sup
( ) ( )
.
Por lo tanto, si y I∈
o
, existe la derivada lateral f y−
'
( ) .
De manera similar, se comprueba que existe derivada lateral f x+
'
( ), para todo
x I∈
o
y
f x lim
f x f z
x z
f x f z
x zz x z x
+
↓ >
=
−
−
=
−
−
'
( )
( ) ( )
inf
( ) ( )
Además de las cuatro desigualdades de (A) se obtiene que
f x f x f y f y− + − +≤ ≤ ≤' ' ' '
( ) ( ) ( ) ( )
y por lo tanto
a f x f x) ( ) ( ),' '
− +≤ para todo x I∈
o
,
b f f) ,' '
− + son funciones crecientes.
Comentario : Considérense los tres puntos w x y I, , ∈
o
tales que w x y< < . Como
la función derivada lateral f+
'
es monótona, existe el límite de f x+
'
( ) cuando x w↓ .
32. 23
Además de la desigualdad
f x
f y f x
y x
+ ≤
−
−
'
( )
( ) ( )
y de la continuidad de f se obtiene
lim f x lim
f y f x
y x
f y f w
y wx w x w↓
+
↓
≤
−
−
=
−
−
'
( )
( ) ( ) ( ) ( )
.
Si se hace y w↓ se tiene que
lim f x lim
f y f w
y w
f w
x w y w↓
+
↓
+≤
−
−
=' '
( )
( ) ( )
( ) .
Esto implica que
lim f x f w
x w↓
+ +≤' '
( ) ( ) ( . )16
Por otra parte, como w x< , la monotonía de f+
'
implica que f w f x+ +≤' '
( ) ( ) y por lo
tanto
f w lim f x
x w
+
↓
+≤' '
( ) ( ) ( . )17
De (1.6) y (1.7) se deduce que
lim f x f w
x w↓
+ +=' '
( ) ( ) ( . )18 .
Supóngase ahora que los tres puntos x y w I, , ∈
o
son tales que y x w< < .
Dado que la función f+
'
es monótona creciente se verifica
f y f x
y x
f x
( ) ( )
( )'−
−
≤ +
33. 24
y de la continuidad de f se tiene
lim
f y f x
y x
lim f x
x w x w↑ ↑
+
−
−
≤
( ) ( )
( )'
es decir
f y f w
y w
lim f x
x w
( ) ( )
( )'−
−
≤
↑
+
Si ahora se hace que y w↑ , se obtiene
lim
f y f w
y w
lim f x
y w x w↑ ↑
+
−
−
≤
( ) ( )
( )'
,
es decir
f w lim f x
x w
−
↑
+≤' '
( ) ( ) ( . )19
Además, como x w< , la monotonía de las derivadas laterales implica que
f x f w+ −≤' '
( ) ( ) y en consecuencia
lim f x f w
x w↑
+ −≤' '
( ) ( ) ( . )110
De (1.9) y (1.10) se obtiene que
lim f x f w
x w↑
+ −=' '
( ) ( ) ( . )111
En resumen se tiene que
lim f x f w
x w↓
+ +=' '
( ) ( ) ( . )18
34. 25
y
lim f x f w
x w↑
+ −=' '
( ) ( ) ( . )111
con lo que concluye este comentario.
Las desigualdades (1.8) y (1.11) permiten demostrar el teorema siguiente
Teorema 1.2.3 : (ver [17], Cap. 1, teorema C, p.7). Si f I: → IR es una función
convexa sobre el intervalo abierto I, el conjunto E formado por los puntos en los
cuales f '
no existe, es numerable, y además f '
es continua en I E .
Demostración : Como f w f w− +≤' '
( ) ( ) , de (1.8) y (1.11) resulta
f w lim f x lim f x f w
x w x w
−
↑
+
↓
+ += ≤ =' ' ' '
( ) ( ) ( ) ( ).
Luego, f w f w− +=' '
( ) ( ) en aquellos puntos w tales que ( ) ( )lim f x lim f x
x w x w↑
+
↓
+=' '
, es
decir, los puntos donde la función monótona f+
'
es continua. Como f+
'
es creciente,
el conjunto de puntos donde f+
'
es discontinua es un conjunto numerable (Ver [8],
p.35) y así, si f es convexa, entonces es derivable salvo un conjunto numerable E y
además f '
es continua salvo este conjunto E
Comentario : Como en los puntos donde existe la derivada de f se tiene que
f x f x f x− += =' ' '
( ) ( ) ( ) y además esto se cumple para todos los puntos del dominio de
la función f si esta es diferenciable, se deduce teniendo en cuenta que las derivadas
laterales de cualquier función convexa son crecientes que : si f I: → IR es una
función convexa y diferenciable sobre el intervalo abierto I, entonces la derivada de f
es creciente en I.
35. 26
1.3. Caracterización de las Funciones Convexas
En las aplicaciones resulta muy útil poder reconocer las funciones convexas
por propiedades de sus derivadas. En esta sección se darán varias de estas
propiedades, la primera de las cuales se fundamenta en el teorema 1.2.2.
Teorema 1.3.1 : ( ver [8], teorema 5, p. 29 ). Sean I ⊂ IR un intervalo abierto y
f I: → IR una función diferenciable sobre I . Entonces f es convexa (estrictamente
convexa) si y sólo si la derivada f '
es creciente (estrictamente creciente) sobre I .
Demostración : Si f es convexa, el teorema 1.2.2 demuestra que f '
es creciente en I.
Recíprocamente, supongamos que f '
es creciente y sean x y z I, , ∈ tales que
x z y< < . Por el teorema del valor medio existen ( )ξ ∈ x z, y ( )η ∈ z y, tales que
( ) ( )f
f z f x
z x
y f
f y f z
y z
' '( ) ( ) ( ) ( )
ξ η=
−
−
=
−
−
.
Como f '
es creciente se verifica
( ) ( ) ( )f f' '
ξ η ξ η≤ <
es decir
f z f x
z x
f y f z
y z
( ) ( ) ( ) ( )−
−
≤
−
−
de donde
( )( ) ( )( )y z f z f x z x f y f z− − ≤ − −( ) ( ) ( ) ( )
lo cual es equivalente a
( ) ( ) ( )y x f z y z f x z x f y− ≤ − + −( ) ( ) ( )
36. 27
Dividiendo por y x− > 0, tenemos
f z
y z
y x
f x
z x
y x
f y( ) ( ) ( )≤
−
−
+
−
−
Haciendo
α β=
−
−
=
−
−
y z
y x
y
z x
y x
se cumple que
( )z x y= + ∈ + =α β α β α βcon y, ,0 1 1
y además
( )f x y f x f yα β α β+ ≤ +( ) ( )
para todo x y I, ∈ . Por lo tanto f es convexa.
Corolario 1.3.1 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función que tiene
segunda derivada f x''
( ), para todo x I∈ . Entonces f es convexa si y sólo si,
f x''
( ) ≥ 0, para todo x I∈ .
Demostración : Si f es una función convexa entonces la derivada f '
es creciente y,
por consiguiente, la segunda derivada f ''
es no negativa ( f x''
( ) ≥ 0, para todo
x I∈ ). Recíprocamente, si f x''
( ) ≥ 0, para todo x I∈ , entonces f '
es creciente y,
por el teorema 1.3.1, f es convexa.
37. 28
Corolario 1.3.2 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función que tiene
segunda derivada f x''
( ), para todo x I∈ . Si f x''
( ) > 0, para todo x I∈ , entonces f
es estrictamente convexa.
Demostración : Si f x''
( ) > 0, para todo x I∈ , entonces f '
es estrictamente
creciente y por lo tanto f es estrictamente convexa.
El recíproco del corolario 1.3.2 no es cierto, es decir : una función f puede ser
estrictamente convexa y sin embargo no verificarse que f x''
( ) > 0 para todo x I∈ .
Por ejemplo, la función ( )f : ,− →1 1 IR definida por f x x( ) = 4
es estrictamente
convexa pero la segunda derivada f x x''
( ) = 12 2
se anula en x = 0.
Como ejemplos de aplicación de lo visto en esta sección tenemos los siguientes :
1) La función f : IR→ IR definida por f x ex
( ) = es estrictamente convexa ya que
f x ex
'( ) = es estrictamente creciente ; o también porque f x ex''
( ) = > 0, para
todo x ∈ IR .
2) g: IR→IR definida por g x x( ) = 2
es estrictamente convexa porque g x x'
( ) = 2 es
estrictamente creciente, o bien ( )g x x'' ,= > ∈2 0 IR.
3) ( )h: ,0 ∞ → IR definida por h x x( ) = −1
es estrictamente convexa porque
h x x''
( ) = >−
2 03
, para todo ( )x ∈ ∞0, .
38. 29
4) ( )r: ,0 ∞ →IR definida por r x x pp
( ) ,= > 1, es estrictamente convexa ya que
r x pxp'
( ) = −1
es estrictamente creciente ; o también porque
r x p p xp''
( ) ( )= − >−
1 02
para todo ( )x ∈ ∞0, .
5) ( )s: ,0 ∞ → IR definida por s x x( ) = es cóncava porque ( )( )− = −s x x es
convexa ya que ( ) ( )− = >−
s x x
'' 1
4
03 2
, para todo ( )x ∈ ∞0, .
6) ( )t: ,0 ∞ →IR definida por t x Ln x( ) = es cóncava porque ( )( )− = −t x Ln x es
convexa ya que ( ) ( )− = >t x
x
'' 1
02
, para todo ( )x ∈ ∞0, .
39. 30
El próximo teorema presenta una forma de reconocer las funciones convexas
como integrales de funciones crecientes.
Teorema 1.3.2 : (ver [8], teorema 6, p. 30). Una función ( )f a b: , →IR es convexa
(estrictamente convexa) si y sólo si existe una función creciente (estrictamente
creciente) ( )g a b: , → IR y un punto ( )c a b∈ , , tales que para todo ( )x a b∈ ,
f x f c g t dt
c
x
( ) ( ) ( ) ( . )− = ∫ 112
Demostración : Supóngase que la relación (1.12) es cierta con g creciente y sean
α β, números positivos tales que α β+ = 1. Entonces, para todo ( )x y a b, ,∈ tales
que x y< , se tiene x x y y< + <α β . Luego :
( ) ( )α β α β α β α β α βf x f y f x y f x f y f x y( ) ( ) ( ) ( ) ( )+ − + = + − + +
( )( ) ( )( )= − + − + −β α β α α βf y f x y f x y f x( ) ( )
( )= −
+
+
∫ ∫β α
α β
α β
g t dt g t dt
x y
y
x
x y
( ) ( ) Por (1.12)
( ) ( )≥ + − +
+
+
∫ ∫β α β α α β
α β
α β
g x y dt g x y dt A
x y
y
x
x y
( )
( ) ( )( ) ( )( )= + − + − + + −β α β α β α α β α βg x y y x y g x y x y x
( ) ( )( ) ( )( )= + − + − + −g x y y x y x y xα β β α β α α β
( ) ( ) ( )( )= + − + − + +g x y y x y x y xα β β β α β α α β α
( ) ( )( )( )= + + − + +g x y x y x yα β α β α β α β
( ) ( )( )= + + − + =g x y x y x yα β α β α β 0
40. 31
Esto implica que
( )α β α βf x f y f x y B( ) ( ) ( )+ − + ≥ 0
para todo α β α β, [ , ],∈ + =0 1 1, y ( )x y a b, ,∈ . Por lo tanto f es convexa. Además,
como g es una función creciente se verifican
( )
( )
x t x y g t g x y
x y t y g x y g t
< < + ⇒ ≤ +
+ < < ⇒ + ≤
α β α β
α β α β
( )
( )
y si g es estrictamente creciente estas desigualdades son estrictas, y por lo tanto la
desigualdad (A) es estricta, de donde la desigualdad (B) también es estricta y así la
función f es estrictamente creciente.
Recíprocamente, supóngase que f es una función convexa (estrictamente
convexa). Por el teorema 1.2.2. se sabe que la derivada lateral f+
'
existe y es
creciente (estrictamente creciente). Consideremos una partición
{ }∏ = = < < < =c x x x xo n1 L del intervalo [ ]c x, . Como x xk k− <1 para todo
1 ≤ ≤k n, se tiene de acuerdo con el lema 1.1.1 y el teorema 1.2.2 que
( )f x
f x f x
x x
f xk
k k
k k
k+ −
−
−
+≤
−
−
≤' '( ) ( )
( )1
1
1
de donde se obtiene
( ) ( )f x x x f x f x f x x xk k k k k k k k+ − − − + −− ≤ − ≤ −' '
( ) ( ) ( ) ( )1 1 1 1
Sumando sobre k, se tiene
( ) ( )f x x x f x f x f x x xk k k
k
n
n o
k
n
k k k+ − −
=
+
=
−− ≤ − ≤ −∑ ∑' '
( ) ( ) ( ) ( )1 1
1 1
1
41. 32
Las dos sumas de estas ultimas desigualdades son las sumas de Riemann de la función
f+
'
asociadas a la partición Π y verifican las desigualdades independientemente de la
partición del intervalo [ ]c x, que se considere. Como la función f+
'
es creciente,
entonces es Riemann-integrable y al tomar el supremo de la suma de la izquierda y el
ínfimo de la suma de la derecha sobre todas las particiones se obtiene por definición
de integral de Riemann que
f t dt f x f c f t dt
c
x
c
x
+ +∫ ∫≤ − ≤' '
( ) ( ) ( ) ( )
es decir
f x f c f t dt
c
x
( ) ( ) ( )'
− = +∫
y así se puede tomar g t f t( ) ( )'
= + . La función f−
'
también se puede usar en lugar de
f+
'
ya que ambas funciones son crecientes (estrictamente crecientes) cuando f es
convexa (estrictamente convexa).
Comentario : El teorema 1.3.2 permite dar otra demostración del teorema 1.3.1. En
efecto, si f es convexa (estrictamente convexa) y diferenciable, entonces por el
teorema 1.2.2 la derivada f '
es creciente (estrictamente creciente). Además el
teorema fundamental del cálculo asegura que
f x f c f t dt
c
x
( ) ( ) ( ) ( . )'
− = ∫ 113
para cualquier ( )c a b∈ , .
42. 33
Recíprocamente, si la derivada f '
es creciente (estrictamente creciente) y existe en
todos los puntos del dominio de la función f, entonces de acuerdo con la relación
(1.13) y de la aplicación del teorema 1.3.2 con g t f t( ) ( )'
= para todo ( )t a b∈ , , se
concluye que f es convexa (estrictamente convexa).
Para algunos de los ejemplos que se dieron como aplicación del teorema 1.3.1, la
aplicación del teorema 1.3.2 y la relación (1.12) lleva a las siguientes expresiones :
e e e dt c xx c t
c
x
− = ∈∫ , , IR
x c tdt c x
c
x
2 2
2− = ∈∫ , , IR
( )
1 1 1
02x c t
dt c x
c
x
− = − ∈ ∞∫ , , ,
Antes de demostrar el próximo teorema se dará la definición siguiente.
Definición 1.3.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Se dice que f
tiene soporte en x Io ∈ si existe un número m ∈ IR tal que la función afín
( )A x f x m x xo o( ) ( )= + − verifica que A x f x( ) ( )≤ para todo x I∈ . La función A se
conoce como la función (o recta) de soporte de f en xo .
Si observamos una función convexa como la de la figura 1.5, podremos notar
que en cada punto del interior de su dominio tiene soporte.
43. 34
Figura 1.5
El próximo teorema provee una demostración de este hecho.
Teorema 1.3.3 : (ver [8], teorema 7, p. 32). Una función ( )f a b: , →IR es convexa,
si y sólo si existe al menos una recta de soporte para cada ( )x a bo ∈ , .
Demostración : Supongamos que f es convexa, entonces para cada ( )x a bo ∈ ,
podemos escoger [ ]m f x f xo o∈ − +
' '
( ), ( ) . Si ( )x a b∈ , es tal que x xo < , entonces
f x m f x
f x f x
x x
o o
o
o
− +≤ ≤ ≤
−
−
' '
( ) ( )
( ) ( )
de donde
( )f x f x m x xo o( ) ( )− ≥ − .
Por otra parte, si x xo< se verifica
f x f x
x x
f x m f xo
o
o o
( ) ( )
( ) ( )' '−
−
≤ ≤ ≤− +
y como x xo− < 0 resulta :
44. 35
( )f x f x m x xo o( ) ( )− ≥ − .
En cualquier caso se cumple que
( )f x f x m x x A xo o( ) ( ) ( )≥ + − =
y así A es una recta de soporte de f en xo .
Supongamos ahora que f tiene una recta de soporte en cada punto de ( )a b, y sean
( )x y a b, ,∈ . Si ( ) [ ]x x yo = + − ∈λ λ λ1 0 1, , , sea ( )A x f x m x xo o( ) ( )= + − la recta
de soporte f en xo , entonces
( )( ) ( )( )
( ) ( )
f x y f x A x A x y
A x A y f x f y
o oλ λ λ λ
λ λ λ λ
+ − = = = + −
= + − ≤ + −
1 1
1 1
( ) ( )
( ) ( ) ( ) ( )
Es decir :
( )( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1( ) ( )
para todo ( )x y a b, ,∈ y [ ]λ ∈ 0 1, . Por lo tanto f es convexa.
Comentario : La primera parte de la demostración de este teorema se puede hacer
también de la siguiente manera : Si f es convexa y [ ]m f x f xo o∈ − +
' '
( ), ( ) se tiene
que para ( )x x x a bo < ∈, , , y para todo ( )t x xo∈ , se verifica
f x m f x f t f xo o− + + −≤ ≤ ≤ ≤' ' ' '
( ) ( ) ( ) ( ) .
Luego, aplicando el teorema 1.3.2 :
45. 36
( )f x f x f t dt mdt m x xo
x
x
x
x
o
o o
( ) ( ) ( )'
− = ≥ = −+∫ ∫ .
Por otra parte, en el caso x xo< se tiene que para todo ( )t x xo∈ , se verifica
f x f t f x m f xo o+ + − +≤ ≤ ≤ ≤' ' ' '
( ) ( ) ( ) ( )
y aplicando el teorema 1.3.2 se obtiene
( )f x f x f t dt mdt m x xo
x
x
x
x
o
o o
( ) ( ) ( )'
− = ≤ = −+∫ ∫
es decir
( )f x f x m x xo o( ) ( )− ≤ −
y luego :
( )f x f x m x xo o( ) ( )− ≥ − .
En cualquier caso se verifica
( )f x f x m x xo o( ) ( )≥ + − .
El teorema que sigue, el último de esta sección, expresa que si una función
convexa f I: ⊂ IR→IR tiene derivada en el punto x Io ∈ , entonces la recta de soporte
de f en xo , tiene como pendiente el valor de la derivada en este punto.
Teorema 1.3.4 : (ver [8], teorema 8, p. 33). Sea ( )f a b: , →IR una función
convexa. Entonces la función f tiene derivada en xo , si y sólo si la recta de soporte
46. 37
de f en xo es única, y en este caso ( )A x f x f x x xo o o( ) ( ) ( )'
= + − es la recta de
soporte.
Demostración : En el comentario del teorema 1.3.3 se observó que para cada
[ ]m f x f xo o∈ − +
' '
( ), ( ) hay una recta de soporte de f en xo . Supóngase ahora que la
recta de soporte de f en xo es única, entonces el valor de la pendiente m es único y
se tiene f x f xo o− +=' '
( ) ( ) y por lo tanto f tiene derivada en xo .
Recíprocamente, supóngase que f xo
'
( ) existe. Para cualquier recta de soporte
( )A x f x m x xo o( ) ( )= + − , se tiene f x A x( ) ( )≥ , para todo ( )x a b∈ , . Por lo tanto, si
( )x y a b, ,∈ se verifica :
( )
( )
f x f x m x x
f y f x m y x
o o
o o
( ) ( ) ( . )
( ) ( ) ( . )
≥ + −
≥ + −
114
115
Si x x yo< < , de la relación (1.14) se obtiene
f x f x
x x
mo
o
( ) ( )−
−
≤
ya que x xo− < 0 ; y de (1.15)
f y f x
y x
mo
o
( ) ( )−
−
≥ .
Estas dos últimas desigualdades son equivalentes a :
f x f x
x x
m
f y f x
y x
o
o
o
o
( ) ( ) ( ) ( )−
−
≤ ≤
−
−
Tomando límites se tiene que
47. 38
lim
f x f x
x x
m lim
f y f x
y xx x
o
o y x
o
oo o↑ ↓
−
−
≤ ≤
−
−
( ) ( ) ( ) ( )
es decir
f x m f xo o− +≤ ≤' '
( ) ( ) .
Esto último implica que : si f tiene derivada en xo , entonces m es única y por lo
tanto la recta de soporte de f en xo es única, y es la recta tangente a la gráfica de f
en el punto ( )( )x f xo o, .
1.4. Operaciones con Funciones Convexas
En la sección 1.3 vimos formas de identificar las funciones convexas a partir
de propiedades de sus derivadas. En esta sección se verán otras formas de reconocer
estas funciones a partir de operaciones que preserven la convexidad. Por ejemplo, será
posible reconocer que la función f : ( , )0 ∞ → IR definida por f t t t( ) = +−1 3
es
convexa porque es una suma de funciones convexas y como veremos la suma de
funciones es una operación que preserva convexidad.
El siguiente teorema establece que la suma de funciones convexas y el
producto de una constante no negativa por una función convexa son funciones
convexas.
Teorema 1.4.1 : (ver [ 8 ], Teorema 9, p. 37 ). Sea I ⊂ IR un intervalo. Si f I: → IR
y g I: → IR son funciones convexas y α ≥ 0, entonces f g+ y α f son funciones
convexas sobre I.
Demostración : Sean x y I, ∈ y λ ∈[ , ].0 1 Entonces
48. 39
( )f g+ ( ( ) ) ( ( ) ) ( ( ) )λ λ λ λ λ λx y f x y g x y+ − = + − + + −1 1 1
≤ + − + + −λ λ λ λf x f y g x g y( ) ( ) ( ) ( ) ( ) ( )1 1
= + + − +λ λ( ( ) ( ) ) ( ) ( ( ) ( ) )f x g x f y g y1
= + + − +λ λ( )( ) ( )( )( ).f g x f g y1
Es decir
( )( ( ) ) ( )( ) ( ) ( )( )f g x y f g x f g y+ + − ≤ + + − +λ λ λ λ1 1
y por lo tanto f + g es convexa.
También se tiene
( ) ( ( ) ) ( ( ) )α λ λ α λ λf x y f x y+ − = + −1 1
≤ + −
= + −
α λ λ
λα λ α
( ( ) ( ) ( ) )
( ) ( ) ( )
f x f y
f x f y
1
1
= + −λ α λ α( ) ( ) ( ) ( ) ( )f x f y1
y por consiguiente α f es convexa.
Ejemplos :
1) Si f : IR→IR y g : IR→IR son las funciones definidas por f(x) = x y g(x) = x2
entonces ( )( )f g x x+ = + x2
, para todo x ∈IR , es convexa porque f y g lo
son.
2) Como la función h : (0, ∞ →) IR definida por h( )x = x −1
es convexa tenemos que
la función ( ) ( )3 3 1
h x x= −
definida sobre ( , )0 ∞ también es convexa.
49. 40
Corolario 1.4.1 : Sean Ι ⊂ IR un intervalo y { }fn n IN∈
una sucesión de funciones
f In : →IR convexas. Si la serie f xn
n
( )
=
∞
∑
1
converge a f x( ) para cada x I∈ ,
entonces f es una función convexa sobre I.
Demostración : Sea { }gn n IN∈ la sucesión de funciones gn : Ι → IR definidas como
sigue :
1) g x f x1 1( ) ( ),= para todo x I∈ ;
2) g x f x f x2 1 2( ) ( ) ( ),= + para todo x I∈ ;
3) g x f x f x f x x Im m( ) ( ) ( ) ( ) , .= + + + ∈1 2 L
Entonces
f x f x lim g x
n
n
n
n( ) ( ) ( ),= =
=
∞
→∞
∑
1
para todo x I∈ .
Luego, para todo [ ]λ ∈ 0 1, y x y I, ∈ se verifica :
f x y lim g x y
n
n( ( ) ) ( ( ) )λ λ λ λ+ − = + −
→∞
1 1
≤ + −
→∞
lim g x g y
n
n n( ( ) ( ) ( ))λ λ1
= + −
→∞ →∞
λ λlim g x lim g y
n
n
n
n( ) ( ) ( )1
= + −λ λf x f y( ) ( ) ( )1
lo cual implica que f fn
n
=
=
∞
∑
1
es convexa.
50. 41
Comentario : Se ha usado el hecho que gn es una función convexa, es decir, que la
suma de cualquier número finito de funciones convexas es una función convexa. Esto
se prueba por inducción usando el teorema 1.4.1.
En el teorema siguiente se presentan las condiciones que deben verificar dos
funciones para que su composición sea una función convexa o cóncava.
Teorema 1.4.2 : Sea I ⊂ IR un intervalo y sean f I: → IR y g f I: ( ) → IR
funciones. Entonces :
1) Si f es convexa y g es convexa y creciente, entonces g fo es convexa.
2) Si f es cóncava y g es convexa y decreciente, entonces g fo es convexa.
3) Si f es cóncava y g es cóncava y creciente, entonces g fo es cóncava.
4) Si f es convexa y g es cóncava y decreciente, entonces g fo es cóncava.
Demostración : Sean x y I, ∈ y λ ∈[ , ].0 1 Entonces :
1) ( )( ( ) ) ( ( ( ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≤ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f convexa y g creciente)
≤ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (ya que g es convexa)
= + −λ λ( )( ) ( ) ( )( )g f x g f yo o1
2) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≤ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f cóncava y g decreciente)
≤ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (porque g es convexa)
= + −λ λ( )( ) ( ) ( )( )g f x g f yo o1
3) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≥ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f cóncava y g creciente).
51. 42
≥ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (ya que g es cóncava)
= λ λ( )( ) ( ) ( ) ( )g f x g f yo o+ −1
4) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≥ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f convexa y g decreciente)
≥ + −λ λg f x g f y( ( )) ( ) ( ( ) )1 (porque g es cóncava)
= + −λ λ( )( ) ( )( ) ( ).g f x g f yo o1
Ejemplos :
1) Si ( )f : ,0 ∞ → IR y g: ( , )0 ∞ →IR son las funciones definidas por f x x( ) = −1
y
g x x( ) = 3
entonces ( )( )g f x xo = −3
es convexa sobre ( , )0 ∞ porque f es
convexa y g es convexa y creciente.
2) Como las funciones f : ( , )0 ∞ → IR y g: ( , )0 ∞ → IR definidas por f x x( ) = y
g x x( ) = −1
son tales que f es cóncava y g es convexa y decreciente se concluye
que la función ( )( )g f x xo = − 1
2
es convexa sobre ( , ).0 ∞
3) Si f : ( , )0 ∞ → IR y g: ( , )0 ∞ → IR son las funciones definidas por f x x( ) = y
g x Ln x( ) = entonces ( )( )g f x Ln xo = es cóncava sobre ( , )0 ∞ pues f es
cóncava y g cóncava y creciente.
En el próximo teorema se exhiben las condiciones bajo las cuales el producto
de funciones es una función convexa.
52. 43
Teorema 1.4.3 : (ver [ 8 ], Teorema 11, p. 38 ). Sea I ⊂ IR un intervalo y sean
f I: → IR y g I: → IR funciones no negativas, crecientes (decrecientes) y convexas,
entonces la función h f g= ⋅ también tiene estas tres propiedades.
Demostración : Si f y g son crecientes y no negativas, se tiene que para
cualesquiera x y I, ∈ tales que x < y se verifica
0 ≤ ≤f x f y( ) ( ) y 0 ≤ ≤g x g y( ) ( ). .
Entonces
0 ≤ = ≤ =h x f x g x f y g y h y( ) ( ) ( ) ( ) ( ) ( )
y por lo tanto h es creciente y no negativa.
Para el caso en que f y g son decrecientes se procede de manera análoga.
Para demostrar la convexidad se usa el hecho que si x < y se verifica
( ( ) ( ) ) ( ( ) ( ) )f x f y g y g x− − ≤ 0
es decir
f x g y f y g x f x g x f y g y( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ).+ ≤ +
Usando esta desigualdad se ve que para todo [ ]λ ∈ 0 1, y x y I, ∈ se cumple :
h x y f x y g x y( ( ) ) ( ( ) ) ( ( ) )λ λ λ λ λ λ+ − = + − + −1 1 1
53. 44
≤ + − + −
= + − + + −
≤ + − + + −
+
= + +
( ( ) ( ) ( ) )( ( ) ( ) ( ) )
( ) ( ) ( ) ( ( ) ( ) ( ) ( ) ) ( ) ( ) ( )
( ) ( ) ( )( ( ) ( ) ( ) ( ) ) ( ) ( ) ( ) ( )
( ) ( )
( ) ( ) ( ) ( ) ( )
λ λ λ λ
λ λ λ λ
λ λ λ λ
λ
λ λ λ
f x f y g x g y
f x g x f x g y f y g x f y g y
f x g x f x g x f y g y f y g y f y g y
f y g y
f x g x f x g x f y g
1 1
1 1
1 2
2 2
2
2
2
( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
( ) ( ) ( ).
y f x g x f y g y f y g y
f y g y f y g y
f x g x f y g y f y g y
f x g x f y g y
h x h y
− − +
− +
= + −
= + −
= + −
λ λ
λ λ
λ λ
λ λ
λ λ
2 2
2
2
1
1
Esto implica que
h x y h x h y( ( ) ) ( ) ( ) ( )λ λ λ λ+ − ≤ + −1 1
y por lo tanto h f g= • es convexa.
En el teorema siguiente se establece bajo qué condición el supremo de una
familia arbitraria de funciones convexas es una función convexa.
Teorema 1.4.4 : (ver [ 8 ], Teorema 12, p.38 ). Sea { fα } una familia arbitraria de
funciones convexas definidas sobre el intervalo I, y sea f x Sup f x( ) ( )= α . Si
J={ : ( ) }x I f x∈ < ∞ es un conjunto no vacío, entonces J es un intervalo y f es una
función convexa sobre J.
Demostración : Si λ ∈[ , ]0 1 y x y J, ∈ (es decir f x( ) < ∞ y f y( ) ),< ∞ entonces
f x y( ( ) )λ λ+ − =1 Sup f x yα λ λ( ( ) )+ −1
≤ + −
≤ + −
= + − < ∞
Sup f x f y
Sup f x Sup f y
f x f y
( ( ) ( ) ( ) )
( ) ( ) ( )
( ) ( ) ( ) .
λ λ
λ λ
λ λ
α α
α α
1
1
1
54. 45
Esto prueba que f es convexa sobre J y además que si x y J, ∈ entonces
f x y( ( ) ) ,λ λ+ − < ∞1 lo cual significa que λ λx y J+ − ∈( )1 y por lo tanto J es un
intervalo.
A continuación veremos que el límite de una sucesión de funciones convexas ,
que converge puntualmente a una función finita, es una función convexa.
Teorema 1.4.5 : ( ver [ 8 ], Teorema 13, p. 38 ). Sean I ⊂ IR un intervalo y
{ fn }n IN∈ una sucesión de funciones f In : → IR convexas que converge
puntualmente a una función finita f sobre I. Entonces f es convexa y además la
convergencia es uniforme en cualquier subintervalo de I
o
.
Demostración : Sean λ ∈[ , ]0 1 y x y I, ,∈ entonces
f x y lim f x y
n
n( ( ) ) ( ( ) )λ λ λ λ+ − = + −
→∞
1 1
≤ + −
= + −
→∞
lim f x f y
f x f y
n
n n( ( ) ( ) ( ) )
( ) ( ) ( )
λ λ
λ λ
1
1
y por lo tanto f es convexa.
Sean a b c I, , ∈
o
tales que a < c < b y definamos
α β γ= = =Sup f a Sup f b f c
n
n
n
n
n
n( ), ( ), inf ( ).
Consideremos además las funciones afines L, M y N tales que
L a L b M c M b N a N c( ) , ( ) ; ( ) , ( ) ; ( ) , ( ) .= = = = = =α β γ β α γ
55. 46
Se mostrará que la sucesión está uniformemente acotada por estas funciones afines, en
el intervalo [ a, b ].
Sea x a b∈[ , ], entonces existe λ ∈[ , ]0 1 tal que x a b= + −λ λ( ) .1 Para cualquier
n∈IN se verifica
f x f a b f a f bn n n n( ) ( ( ) ) ( ) ( ) ( )= + − ≤ + −λ λ λ λ1 1
≤ + − = + −
= + − =
λα λ β λ λ
λ λ
( ) ( ) ( ) ( )
( ( ) ) ( )
1 1
1
L a L b
L a b L x
Por otra parte, si x a c∈( , ) entonces c x b∈( , ) y existe λ ∈( , )0 1 tal que
c x b= + −λ λ( ) ,1 de donde
( )x c b= + − ≠1 11 0λ λ
λ, ( ).
Luego
M c f c f x bn n( ) ( ) ( ( ) )= ≤ = + −γ λ λ1
≤ + − ≤ + −
= + −
λ λ λ λ β
λ λ
f x f b f x
f x M b
n n n
n
( ) ( ) ( ) ( ) ( )
( ) ( ) ( ).
1 1
1
Es decir
M c f x M bn( ) ( ) ( ) ( )≤ + −λ λ1
de donde
f x M c M bn ( ) ( ) ( )≥ + −
1
1
1
λ λ
= + −
=M c b M x
1
1
1
λ λ
( ).
56. 47
Además, si x c b∈( , ) entonces c a x∈( , ) y para algún λ ∈( , )0 1 se verifica
c a x= − +( ) ,1 λ λ de donde
x c a= + −
≠
1
1
1
0
λ λ
λ, ( ).
Luego
N c f c f a xn n( ) ( ) ( ( ) )= ≤ = − +γ λ λ1
≤ − +
≤ − +
= − +
( ) ( ) ( )
( ) ( )
( ) ( ) ( ).
1
1
1
λ λ
λ α λ
λ λ
f a f x
f x
N a f x
n n
n
n
Es decir
N c N a f xn( ) ( ) ( ) ( )≤ − +1 λ λ
de donde
f x N c N an( ) ( ) ( )≥ + −
1
1
1
λ λ
= + −
=N c a N x
1
1
1
λ λ
( ) .
Como fn es convexa entonces es Lipschitz en cualquier subintervalo [ , ]a b I⊂
o
y
por lo tanto existe una constante k tal que
f x f y k x yn n( ) ( )− ≤ −
para todo x y a b, [ , ].∈
Además, como las cotas que se han obtenido para fn son independientes de n, la
demostración del teorema 1.2.1 permite deducir que se puede escoger k independiente
de n.
57. 48
Sea E a b⊂ [ , ] un subconjunto finito tal que cualquier punto de [ a, b ] se encuentra a
una distancia menor que
ε
3k
de algún punto de E, donde ε > 0 es arbitrario.
Como E es un conjunto finito y la sucesión de funciones { }fn converge puntualmente
a la función f, se tiene que para todo z E∈ , la sucesión de números reales
{ }f zn ( ) n IN∈ converge al número real f( )z y dado que toda sucesión convergente de
números reales es una sucesión de Cauchy se deduce que existe n ο ∈IN tal que si
m n n, ≥ ο entonces
f z f zn m( ) ( ) .− ≤
ε
3
Por lo tanto, si x a b∈[ , ], existe z ∈ E con z x
k
− <
ε
3
y en consecuencia, si
m, n ≥ nο se verifica :
f x f x f x f z f z f z f z f xn m n n n m m m( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )− ≤ − + − + −
≤ − + + −
< + + =
k x z k z x
k
k
k
k
ε
ε ε ε
ε
3
3 3 3
,
y como esta es la condición de Cauchy para convergencia uniforme en [ a , b ], queda
demostrado el teorema.
En el teorema que sigue y con el cual finaliza esta sección, se dan condiciones
para que la inversa de una función sea cóncava o convexa.
58. 49
Teorema 1.4.6 : Sean I ⊂ IR un intervalo abierto y f I: →IR una función
estrictamente monótona. Sea f f I I−
→1
: ( ) la función inversa de f . Entonces :
1) Si f es convexa y creciente, entonces f −1
es cóncava ;
2) Si f es convexa y decreciente, entonces f −1
es convexa ;
3) Si f es cóncava y creciente, entonces f −1
es convexa ;
4) Si f es cóncava y decreciente, entonces f −1
es cóncava.
Demostración : Sean x y f I, ( )∈ y λ ∈[ , ]0 1 . Si u = −
f x1
( ) y v = −
f y1
( ) ,
entonces :
1) Como f es convexa se verifica
f u v f u f v( ( ) ) ( ) ( ) ( )λ λ λ λ+ − ≤ + −1 1
= + −λ λx y( )1 ,
y por ser f −1
creciente, se tiene
( ) ( )f f u v f x y− −
+ − ≤ + −1 1
1 1( ( ) ) ( )λ λ λ λ
luego
λ λ λ λu v f x y+ − ≤ + −−
( ) ( ( ) )1 11
es decir
λ λ λ λf x f y f x y− − −
+ − ≤ + −1 1 1
1 1( ) ( ) ( ) ( ( ) )
y en consecuencia f −1
es cóncava.
2) De la convexidad de f
f u v x y( ( ) ) ( )λ λ λ λ+ − ≤ + −1 1 ,
y como f −1
es decreciente, se verifica
59. 50
(f f u v f x y− −
+ − ≥ + −1 1
1 1( ( ) ) ( ( ) )λ λ λ λ
luego
λ λ λ λu v f x y+ − ≥ + −−
( ) ( ( ) )1 11
es decir
λ λ λ λf x f y f x y− − −
+ − ≥ + −1 1 1
1 1( ) ( ) ( ) ( ( ) )
y por lo tanto f −1
es convexa.
De manera análoga se demuestran 3) y 4).
Por ejemplo, como la función f : IR→ IR definida por f( )x = ex
es convexa y
creciente, su inversa f −
∞ →1
0:( , ) IR definida por f x Ln x−
=1
( ) es cóncava.
Además, por ser la función g : IR→IR definida por g( )x = e x−
convexa y decreciente,
su inversa g−
∞1
0: ( , ) →IR definida por g x Ln x−
= −1
( ) es convexa.
1.5. Funciones de Young y Funciones Convexas.
Esta sección se inicia con la definición de ϕ − función o función de Young.
Veremos que toda función f :[ , ) [ , )0 0∞ → ∞ convexa que se anula sólo en t = 0 es
una ϕ − función. Se tiene la siguiente definición.
Definición 1.5.1 : (ϕ − función). Una ϕ − función es una función ϕ:[ , ) [ , )0 0∞ → ∞
que verifica las siguientes condiciones :
a) ϕ es continua en [ 0,∞ ) ;
b) ϕ ( )t = 0 sólo para t =0 ;
60. 51
c) ϕ es creciente ;
d) ϕ ( )t → ∞ cuando t → ∞ .
A continuación se introduce como lema un resultado que se usará en la demostración
de la proposición 1.5.1.
Lema 1.5.1 : Sea f :[ , ) [ , )0 0∞ → ∞ una función convexa tal que ( )f 0 0= .
Entonces se verifica :
1) f t f t( ) ( )λ λ≤ si λ ∈[ ,0 1 ] ;
2) f t f t( ) ( )λ λ≥ si λ ≥ 1.
Demostración :
1) Sea λ ∈[ , ]0 1 . Como f es convexa y f(0)=0 se tiene que
f t f t f t f( ) ( ( ) ) ( ) ( ) ( )λ λ λ λ λ= + − ≤ + −1 0 1 0 = λf t( ).
2) Sea λ ≥ 1, luego
1
0 1
λ
∈[ , ] y por 1) se cumple :
f t f t f t( ) ( ) ( )=
≤
1 1
λ
λ
λ
λ .
De donde
f t f t( ) ( )λ λ≥ .
El lema 1.5.1 permite demostrar la proposición principal de esta sección, la
cual presentamos a continuación.
Proposición 1.5.1 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que f(t)=0 sólo
para t=0. Entonces f es una ϕ −función.
Demostración :
a) f es continua en [ 0, ∞ ).
61. 52
Por el teorema 1.2.1 se sabe que f es continua en el intervalo ( 0, ∞ ).
Sólo se tiene que probar la continuidad en el extremo t=0 del intervalo. Sea ε > 0
dado y consideremos δ ∈ ( 0, 1 ). Si 0 ≤ <t δ se tiene
f t f f t f t f t t f f( ) ( ) ( ) ( ) ( ) ( ) ( )− = = = ⋅ ≤ <0 1 1 1δ
Por lo tanto, para que se verifique f t f( ) ( )− <0 ε basta que se cumpla
δ εf ( )1 < y esto es cierto con sólo tomar 0 < <
δ
ε
min
f ( )
,
1
1 .
b) ( )f t = 0 sólo para t=0.
Se verifica por hipótesis.
c) f es creciente.
Como el rango de f está contenido en el intervalo [ 0, ∞ ) se tiene que si 0 < t
entonces 0 0= ≤f f t( ) ( ) . Sean ahora t t1 2 0, [ , )∈ ∞ tales que 0 1 2< <t t . Luego,
existe λ > 0 tal que λt t1 2= .
Además λ > 1 por ser ( )t t t t1 2 2 1< =λ / . Entonces
f t f t f t f t( ) ( ) ( ) ( )2 1 1 1= ≥ >λ λ .
Es decir t t f t f t1 2 1 2< ⇒ <( ) ( ) y por lo tanto f es creciente.
d) lim f t
t→∞
= ∞( ) .
Como f es convexa y f(0)=0, se tiene por el lema 1.5.1 que, para todo t > 1 se
verifica f t t f( ) ( )≥ 1 . Tomando límites cuando t → ∞ a ambos lados de esta
desigualdad se obtiene que f t( ) → ∞ .
Finalizamos esta sección con la siguiente proposición.
62. 53
Proposición 1.5.2 : Sea f :[ , ) [ , )0 0∞ → ∞ una función convexa tal que ( )f 0 0= .
Entonces la función h : ( , ) [ , )0 0∞ → ∞ definida por h t
f t
t
( )
( )
= es creciente.
Demostración : Sean x y, ( , )∈ ∞0 tales que x < y. Entonces existe λ ∈( , )0 1 tal
que λ λy x x y= =( / ) . Luego :
( )( )h x h y h y
f y
y
( ) ( ) ( ( ) )= = + − =
+ −
λ λ λ
λ λ
λ
1 0
1 0
( )≤
+ −
= = =
λ λ
λ
λ
λ
f y f
y
f y
y
f y
y
h y
( ) ( ) ( ) ( )
( )
1 0
.
Es decir, x y h x h y< ⇒ ≤( ) ( ) y por lo tanto h es creciente.
1.6. Desigualdades Clásicas.
Las desigualdades desempeñan un papel importante en análisis, matemáticas
aplicadas, estadística, etc. La teoría de funciones convexas aporta un tratamiento
unificado de algunas de las desigualdades importantes en matemáticas.
En esta sección se verán algunas de las desigualdades clásicas de la
matemática y las mismas se han tomado casi en su totalidad de [17], Cap. 6, pp. 189-
192. Por ejemplo, la desigualdad de la media geométrica - media aritmética (M G -
M A) en su forma conocida es
( ) ( )/
x x x
n
x x xn
n
n1 2
1
1 2
1
⋅ ≤ + + +K L (1.16 )
para todo xi ≥ 0 y n entero positivo.
A continuación se presenta una forma más general de la desigualdad (1.16 ).
63. 54
Proposición 1.6.1 : (Desigualdad MG-MA). Sean x i ni i, , , , ,α = 1 L números reales
tales que, x yi i i
i
n
≥ > =
=
∑0 0 1
1
, α α , entonces
x x x x x xn n n
n
1 2 1 1 2 2
1 2α α α
α α αL L≤ + + + (1.17 )
Demostración : Sí xi = 0 para algún i la desigualdad se cumple. Supóngase entonces
que xi > 0 para todo i n∈{ , , , }1 2 K . Por lo tanto se puede escribir
y Ln x x ei i i
yi
= =( ).
Entonces
x x x yi i i i i i
i i
α α
α α= = =exp ( ) exp ( ) exp ( )Ln Ln .
Como et
es una función convexa se puede aplicar la desigualdad de Jensen (teorema
1.1.1) y escribir
Π Π
i
n
i
i
n
i i i i
i
n
x y yi
= = =
= =
∑1 1 1
α
α αexp( ) exp ≤ =
==
∑∑α αi i i i
i
n
i
n
y xexp( )
11
lo cual implica que
Π
i
n
i i i
i
n
x xi
= =
≤ ∑1 1
α
α
Comentario : En el caso especial donde n=2,
p p q> = = + =1 1 1 11 2 1 2, / , / ( )α α α α se tiene que
x x
p
x
q
xp q
1
1
2
1
1 2
1 1/ /
.≤ +
Si ahora se hace x x p
1 = y x yq
2 = se obtiene la desigualdad fundamental
64. 55
x y
p
x
q
yp q
⋅ ≤ +
1 1
( 1.18 )
La relación ( 1.18 ) permite demostrar la siguiente desigualdad.
Proposición 1.6.2 : ( Desigualdad de Hölder). Sean x y i ni i, , , , ,= 1 K números
reales tales que, x y pi i≥ ≥ >0 0 1, ; y 1 1 1/ /p q+ = . Entonces
x y x yi i
i
n
i
p
i
n p
i
q
i
n q
= = =
∑ ∑ ∑≤
1 1
1
1
1/ /
( 1.19 )
En particular se tiene la desigualdad de Cauchy-Schawrz :
x y x yi i
i
n
i
i
n
i
i
n
= = =
∑ ∑ ∑≤
1
2
1
1 2
2
1
1 2/ /
( 1.20 )
Demostración : Sin pérdida de generalidad se puede suponer que alguno de los xi y
alguno de los yi son mayores que cero. En este caso u xi
p
i
n p
=
=
∑
1
1/
y
v yi
q
i
n q
=
=
∑
1
1/
son números positivos. Usando la desigualdad (1.18) con
x x u y y vi i= =/ , / , se obtiene
x
u
y
v p
x
u q
y
v
i i i
p
i
q
⋅ ≤
+
1 1
Sumando se tiene
x
u
y
v p
x
u q
y
v
i
i
n
i
i
n
i
p
p
i
n
i
q
q
= = =
∑ ∑ ∑⋅ ≤ +
1 1 1
1 1
65. 56
es decir
x y
uv p
x
u q
y
v p q
i i
i
n
i
p
i
n
p
i
q
i
n
q
= = =
∑ ∑ ∑
≤ + = ⋅ + ⋅ =1 1 11 1 1
1
1
1 1
de donde x y u vi i
i
n
≤ ⋅
=
∑
1
, lo cual equivale a
x y x yi i i
p
i
n
i
n p
i
q
i
n q
≤
== =
∑∑ ∑
11
1
1
1/ /
Usando la desigualdad de Hölder se demuestra la siguiente desigualdad.
Proposición 1.6.3 : (Desigualdad de Minkowski). Sean x y i ni i, , , , ,= 1 K números
reales tales que, x yi i≥ ≥0 0, y p ≥ 1, entonces
( )x y x yi i
p
i
n p
i
p
i
n p
i
p
i
n p
+
≤
+
= = =
∑ ∑ ∑
1
1
1
1
1
1/ / /
(1.21)
Demostración : Cuando p = 1 se tiene la igualdad. Si p > 1, se puede escoger q > 1
tal que 1 1 1/ / ,p q+ = de donde ( )p q p− =1 . Además, sin pérdida generalidad se
puede suponer que x yi i+ > 0 para todo i n= 1, ,K . Si ahora se escribe
( ) ( ) ( )x y x x y y x yi i
p
i
n
i i i
p
i
n
i i i
p
i
n
+ = + + +
=
−
=
−
=
∑ ∑ ∑
1
1
1
1
1
y se aplica la desigualdad de Hölder al miembro derecho de esta igualdad, se tiene
66. 57
( ) ( )
( )
( )
x y x x y
y x y
x y x y
i i
p
i
n
i
p
i
n p
i i
p q
i
n q
i
p
i
n p
i i
p q
i
n q
i i
p
i
n q
i
p
i
n p
i
p
i
n p
+ ≤
+
+
+
= +
+
= =
−
=
=
−
=
= = =
∑ ∑ ∑
∑ ∑
∑ ∑ ∑
1 1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
/
( )
/
/
( )
/
/ / /
Dividiendo por ( )x yi i
p
i
n q
+
=
∑
1
1/
queda :
( )x y x yi i
p
i
n q
i
p
i
n p
i
p
i
n p
+
≤
+
=
−
= =
∑ ∑ ∑
1
1
1
1
1
1
1/ /
y como 1 1 1− =/ /q p , esto es equivalente a la relación (1.21).
A continuación se tiene la siguiente proposición.
Proposición 1.6.4 : Sean x y i ki i, , , , ,= 1 K números reales tales que, x yi i≥ ≥0 0, ;
y sea k un entero positivo. Entonces
( )Π Π Π
i
k
i i
k
i
k
i
k
i
k
i
k
x y x y
= = =
+
≥
+
1
1
1
1
1
1/ / /
(1.22)
Demostración : Sin pérdida de generalidad se puede suponer que x yi i+ > 0 para
todo i k= 1, ,K . Entonces
67. 58
( ) ( ) ( )
Π Π
Π
Π
Π
Π
Π
Π Π
i
k
i
k
i
k
i
k
i
k
i i
k
i
k
i
i
k
i i
k
i
k
i
i
k
i i
k
i
k
i
i i
k
i
k
i
i i
k
i
i ii
k
x y
x y
x
x y
y
x y
x
x y
y
x y
k
x
x y k
y
= =
=
=
=
=
=
= =
=
+
+
=
+
+
+
=
+
+
+
≤
+
+∑
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1 1
/ /
/
/ /
/ /
i
i ii
k
x y+
=
=
∑
1
1
Para la última desigualdad se ha usado la desigualdad MG-MA en su forma simple, es
decir la relación (1.16). Se tiene entonces que
( )
Π Π
Π
i
k
i
k
i
k
i
k
i
k
i i
k
x y
x y
= =
=
+
+
≤
1
1
1
1
1
1
1
/ /
/
lo cual es equivalente a (122).
Seguidamente presentamos una generalización de la desigualdad (1.22).
Proposición 1.6.5 : Sean x y i ki i i, , , , ,α = 1 K números reales, tales que
x yi i≥ ≥0 0, y αi > 0 con αi
i
k
=
∑ =
1
1. Entonces
( )Π Π Π
i
k
i
i
k
i
i
k
i ix y x yi i i
= = =
+ ≤ +
1 1 1
α α α
(1.23).
Demostración : Sin pérdida de generalidad supóngase que x yi i+ > 0 para todo
i k= 1, , .K Entonces
68. 59
( ) ( ) ( )
( ) ( )
Π Π
Π
Π
Π
Π
Π
Π Π
Π Π
i
k
i
i
k
i
i
k
i i
i
k
i
i
k
i i
i
k
i
i
k
i i
i
k
i
i i
i
k
i
i i
i
k
i
i i i
k
i
i i
i
i
k
i
i i
i
i
k
i
i i
x y
x y
x
x y
y
x y
x
x y
y
x y
x
x y
y
x y
x
x y
y
x y
i i
i
i
i
i
i
i
i
i
i
i i
= =
=
=
=
=
=
= =
= =
= =
+
+
=
+
+
+
=
+
+
+
=
+
+
+
≤
+
+
+
∑ ∑
1 1
1
1
1
1
1
1 1
1 1
1 1
α α
α
α
α
α
α
α
α
α
α
α α
α α ( )Por
x
x y
y
x y
x
x y
y
x y
i
i
i i
i
i
i ii
k
i
i
k
i
i i
i
i i
i
i
k
( . ) .117
1 1
1
1 1
=
+
+
+
=
+
+
+
= ⋅ =
=
= =
∑
∑ ∑
α α
α α
Esto implica que
( )
Π Π
Π
i
k
i
i
k
i
i
k
i i
x y
x y
i i
i
= =
=
+
+
≤1 1
1
1
α α
α
,
lo cual es equivalente a (1.23).
Como caso particular de la desigualdad (1.23) se tiene que si
x x y y1 2 1 2, , , , ,α β son números positivos con α β+ = 1 entonces
( ) ( )x x y y x y x y1 2 1 2 1 1 2 2
α β α β α β
+ ≤ + + (1.24)
Esta desigualdad la usaremos en la sección 1.7 para demostrar que la suma de
funciones log-convexas es una función log-convexa.
69. 60
A continuación se presenta la desigualdad de Hölder para integrales y su caso
particular la desigualdad de Cauchy-Schawrz que también será usada en la sección 1.7
con el fin de probar que la función Gamma es log-convexa.
Proposición 1.6.6 : (Desigualdad de Hölder para integrales). Sean
f g a b, : ( , ) →IR funciones no negativas y los números reales p > 1 y q > 1 tales que
1 1 1/ /p q+ = . Si las funciones f p
y gq
son integrables, entonces f g⋅ es
integrable y se verifica la desigualdad
( ) ( ) ( ) ( )f t g t dt f t dt g t dt
a
b
p
a
b p
q
a
b q
∫ ∫ ∫≤
1 1/ /
(1.25)
En particular se tiene para p=q=2 la desigualdad de Cauchy-Schawrz :
( ) ( ) ( ) ( )f t g t dt f t dt g t dt
a
b
a
b
a
b
≤
∫ ∫ ∫
2
1 2
2
1 2/ /
(1.26).
Demostración : Sean
( )f f t dtp
p
a
b p
=
∫
1/
y ( )g g t dtq
q
a
b q
=
∫
1/
.
Si f p
= 0 ó g q
= 0, entonces la desigualdad
( ) ( )0 ≤ ≤∫ f t g t dt f gp q
a
b
es cierta ya que f ó g son nulas, excepto posiblemente en un conjunto de medida de
Lebesgue nula. Supóngase que f p
> 0 y g q
> 0.
Si en la desigualdad (1.18) se hace
70. 61
( )x
f t
f p
= e
( )y
g t
g q
= ,
se verifica que
( ) ( ) ( ) ( )f t
f
g t
g p
f t
f q
g t
gp q
p
p
p
q
q
q
≤ +
1 1
para todo t a b∈( , ) , excepto posiblemente para t a b∈{ , } que es un conjunto de
medida de Lebesgue nula.
Como f p
y gq
son integrables por hipótesis, por la monotonía de la integral se tiene
( ) ( ) ( ) ( )f t g t dt
f g p
f t dt
f q
g t dt
g
p
f
f q
g
g p q
a
b
p q
p
a
b
p
p
q
a
b
q
q
p
p
p
p
q
q
q
q
∫ ∫ ∫
≤ +
= + = + =
1 1
1 1 1 1
1
De donde
( ) ( )f t g t dt f gp q
a
b
≤∫
es decir
( ) ( ) ( ) ( )f t g t dt f t dt g t dt
a
b
p
a
b p
q
a
b q
∫ ∫ ∫≤
1 1/ /
.
71. 62
Comentario : Se ha supuesto que f y g están definidas en un intervalo abierto (a, b)
para no descartar las posibilidades a = −∞ o b = +∞ . Sin embargo, si el intervalo es
cerrado también son válidos los argumentos anteriores. Sólo se requiere que f y g
sean no negativas y f p
y gq
sean integrables.
La desigualdad de la proposición siguiente se obtiene a partir de la
desigualdad (1.4) del corolario 1.1.1.
Proposición 1.6.7 : Sean f a b: ( , ) →IR una función convexa y ϕ: [ , ]c d → IR una
función Riemann-integrable con a t b< <ϕ( ) para todo t c d∈[ , ]. Si α:[ , ]c d → IR
es una función no negativa tal que α( )t dt
c
d
=∫ 1 y αϕ es integrable sobre el intervalo
[ , ]c d , entonces
( ) ( ) ( ) ( )( )f t t dt t f t dt
c
d
c
d
α ϕ α ϕ∫ ∫
≤ . (1.27)
Demostración : Dado un número n∈IN arbitrario hágase ∆ t
d c
n
=
−
y sea
t c t t i tiο ο= = +, ∆ para todo i n= 1, ,K una partición del intervalo [c, d]. De
acuerdo con la relación (1.4) se verifica
( )
f
t t
t
t f t
t
i i
i
n
i
i
n
i i
i
n
i
i
n
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
=
=
=
=
∑
∑
∑
∑
≤1
1
1
1
lo cual es equivalente a
72. 63
( )
f
t t t
t t
t f t t
t t
i i
i
n
i
i
n
i i
i
n
i
i
n
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∆
∆
∆
∆
=
=
=
=
∑
∑
∑
∑
≤1
1
1
1
Tomando límites cuando ( )n t→ ∞ →∆ 0 se tiene
( )
lim f
t t t
t t
lim
t f t t
t t
n
i i
i
n
i
i
n n
i i
i
n
i
i
n→∞
=
=
→∞
=
=
∑
∑
∑
∑
≤
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∆
∆
∆
∆
1
1
1
1
Como f es continua se cumple
( )
f lim
t t t
t t
lim t f t t
lim t t
n
i i
i
n
i
i
n
n
i i
i
n
n
i
i
n→∞
=
=
→∞ =
→∞ =
∑
∑
∑
∑
≤
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∆
∆
∆
∆
1
1
1
1
y por definición de integral de Riemann se obtiene
( )
f
t t dt
t dt
t f t dt
t dt
c
d
c
d
c
d
c
d
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∫
∫
∫
∫
≤
es decir
( )f t t dt t f t dt
c
d
c
d
α ϕ α ϕ( ) ( ) ( ) ( )∫ ∫
≤
73. 64
Por ejemplo, si f : ( , )0 ∞ → IR es la función definida por f x x pp
( ) ,= ≥ 1 y
ϕ: [ , ]c d → IR es positiva entonces ( )α ϕ α ϕ( ) ( ) ( ) ( )t t dt t t dt
c
d p
p
c
d
∫ ∫
≤ .
Comentario : La desigualdad (1.27) se conoce como “desigualdad de Jensen para
integrales”. La hemos obtenido suponiendo que
α( ) .t dt
c
d
=∫ 1
Sin embargo, si la integral no vale 1, se tiene el resultado más general :
( )
f
t t dt
t dt
t f t dt
t dt
c
d
c
d
c
d
c
d
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∫
∫
∫
∫
≤ .
Antes de concluir esta sección con la demostración de la desigualdad de
Young consideremos una ϕ − función g estrictamente creciente. En este caso la
función inversa g−1
existe y tiene las mismas propiedades que g. Si se define
f x g s ds f y g t dt
x y
( ) ( ) , ( ) ( )*
= =∫ ∫
−
0
1
0
entonces, por el teorema 1.3.2, ambas funciones son estrictamente convexas. La
función f *
recibe el nombre de función conjugada de f. Obsérvese que
f f( ) ( )*
0 0 0= = .
Estas consideraciones nos permiten introducir la siguiente proposición.
74. 65
Proposición 1.6.8 : (Desigualdad de Young). Sea g: [ , ) [ , )0 0∞ → ∞ una
ϕ − función estrictamente creciente. Entonces si
f x g s ds
x
( ) ( )= ∫
0
, para todo x ∈ ∞[ , )0
y
f y g t dt
y
*
( ) ( )= −
∫
1
0
para todo y ∈ ∞[ , )0 ,
donde g−1
es la función inversa de g, se tiene que cualesquiera sean a b, [ , )∈ ∞0 , se
cumple que
0 ≤ ≤ +ab f a f b( ) ( )*
(1.28)
y la igualdad vale, si y solamente si b g a= ( ) .
La desigualdad (1.28) es llamada desigualdad de Young.
Demostración : Sea a ∈ ∞[ , )0 . Si a=0 no hay nada que demostrar. Supóngase que
a ≠ 0, entonces a g a( ) es el área de un rectángulo de “base” el número a y altura el
número g a( ), luego se verifica
( )
a g a g s ds g t dt
f a f g a
g aa
( ) ( ) ( )
( ) ( ) .
( )
*
= +
= +
−
∫∫
1
00
Es decir
( )a g a f a f g a( ) ( ) ( )*
= + (1.29)
Esta relación se ilustra en la siguiente figura.
75. 66
Figura 1.6
Escojamos b o∈ ∞[ , ) y supongamos que b g a≠ ( ) . Se demostrará que
ab g s ds g t dt
ba
< + −
∫∫ ( ) ( ) .1
00
Supongamos primero que g a b( ) < . Como g−1
es estrictamente creciente en el
intervalo [ , )0 ∞ , se tiene que si g a t b( ) < < entonces a g t g b< <− −1 1
( ) ( ) . De la
propiedad de monotonía de la integral de Riemann se deduce que :
( )a b g a g t dt
g a
b
− < −
∫( ) ( ) .
( )
1
De esta desigualdad y de la relación (1.29) se obtiene
76. 67
( )ab ag a a b g a
g s ds g t g t dt
g s ds g t dt
f a f b
g a
bg aa
ba
= + −
< + +
= +
= +
− −
−
∫∫∫
∫∫
( ) ( )
( ) ( ) ( )
( ) ( )
( ) ( ).
( )
( )
*
1 1
00
1
00
Es decir
ab f a f b< +( ) ( ).*
Para concluir, supongamos que b g a< ( ). En este caso se tiene que
b t g a g t a< < ⇒ <−
( ) ( )1
.
Por lo tanto
( )g t dt a g a b
b
g a
−
< −∫
1
( ) ( )
( )
Usando esta desigualdad y la relación (1.29) se tiene
77. 68
( )ab ag a a g a b
g s ds g t dt g t dt
g s ds g t dt g t dt
g s ds g t dt f a f b
a g a
b
g a
g a
bg aa
ba
= − −
< + −
= + +
= + = +
∫ ∫ ∫
∫∫∫
∫∫
− −
− −
−
( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( ).
( ) ( )
( )
( )
*
0
1
0
1
1 1
00
1
00
Es decir
ab f a f b< +( ) ( ).*
1.7. Funciones log- convexas.
El contenido de esta sección lo hemos tomado casi en su totalidad de [8], pp.
53-54, a excepción de la parte relacionada con la función Gamma que fue tomada de
[4], pp. 560-561.
Una función f I: ⊂ IR→ IR, donde I es un intervalo, es log-convexa si es
positiva y Ln f es convexa sobre I.
Esta definición nos lleva a la siguiente proposición.
Proposición 1.7.1 : Sean I ⊂ IR un intervalo y f I: →IR una función. Entonces f es
log-convexa si y sólo si f es positiva y
( ) ( ) ( )f x y f x f yα β α β
+ ≤ ,
para todo x y I, , ,∈ >α β 0 y α β+ = 1.
78. 69
Demostración : Supongamos que f es log-convexa, entonces Ln f es convexa y se
verifica que
( ) ( ) ( )
( ) ( )
( ) ( )
Ln f x y Ln f x Ln f y
Ln f x Ln f y
Ln f x f y
α β α β
α β
α β
+ ≤ +
= +
=
para todo x y I, , ,∈ >α β 0 y α β+ = 1.
Como la función Ln es creciente se tiene que
( ) ( ) ( )f x y f x f yα β α β
+ ≤ (1.30)
para todo x y I, , ,∈ >α β 0 y α β+ = 1.
Recíprocamente, supongamos que la desigualdad (1.30) es cierta para todo
x y I, , , [ , ], ,∈ ∈ + =α β α β0 1 1 y que además f es positiva. Entonces
( ) ( ) ( )
( ) ( )
Ln f x y Ln f x f y
Ln f x Ln f y
α β
α β
α β
+ ≤
= +
lo cual implica que Ln f es una función convexa y por lo tanto f es log-convexa.
La siguiente proposición establece que toda función log-convexa es convexa.
Proposición 1.7.2 : Sean I ⊂ IR un intervalo y f I: → IR una función log-convexa.
Entonces f es convexa.
79. 70
Demostración : Supongamos que f es log-convexa. Entonces está definido ( )Ln f x
para todo x I∈ y se tiene ( ) ( )( ) ( )( )f x Ln f x goh x= =exp , donde ( )g x ex
= y
( ) ( )h x Ln f x= .
Como f es log-convexa se verifica que h Ln f= es convexa y dado que g es
convexa y además estrictamente creciente, se concluye aplicando el teorema 1.4.2
(parte 1) que f g oh= es convexa.
La siguiente proposición expresa que la suma y el producto de funciones log-
convexas es log-convexa.
Proposición 1.7.3 : Sean I ⊂ IR un intervalo y f I: →IR , g I: → IR funciones log-
convexas. Entonces f g⋅ y f+g son log-convexas.
Demostración : Supongamos que f y g son funciones log-convexas. Entonces f y g
son positivas y se verifica que
Ln f g Ln f Ln g⋅ = +
es una función convexa por ser la suma de dos funciones convexas y, por tanto, el
producto f g⋅ es log-convexo.
Verifiquemos ahora que la suma de funciones log-convexas es una función log-
convexa.
En efecto, como f y g son funciones log-convexas se tiene que f+g es positiva. Sean
α β, > 0 tales que α β+ = 1 y x y I, ∈ , entonces
80. 71
( )
( ) ( )
( ) ( )
f g x y f x y g x y
f x f y g x g y porque f y g son convexas
f x g x f y g y por
f g x f g y
+ + = + + +
≤ + −
≤ + +
= + +
( ) ( ) ( )
( ) ( ) ( ) ( ) ( log )
( ) ( ) ( ) ( ) ( . )
( ) ( ).
α β α β α β
α β α β
α β
α β
124
Es decir
( ) ( ) ( )f g x y f g x f g y+ + ≤ + +( ) ( ) ( )α β
α β
para todo x y I, , ,∈ >α β 0 tales que α β+ = 1. Luego, aplicando la proposición
1.7.1 se concluye que f + g es log - convexa.
Seguidamente se presenta una proposición que establece que si el límite de
una sucesión de funciones log-convexas existe y es positivo entonces también es una
función log-convexa.
Proposición 1.7.4 : Sean I ⊂ IR un intervalo y { }fn n IN∈
una sucesión de funciones
f In: → IR log-convexas para cada n∈IN . Si lim f
n
n existe y es positivo entonces es
una función log-convexa.
Demostración : Sea f x lim f x
n
n( ) ( )=
→∞
para cada x I∈ . Como cada fn , n∈IN , es
log-convexa se tiene que fn es positiva y dado que la función Ln es continua en
( )0, + ∞ se verifica que
( )lim Ln f x Ln lim f x Ln f x
n
n
n
n
→∞ →∞
=
=( ) ( ) ( ).
Por lo tanto, tenemos que :
81. 72
( )Ln f Ln lim f lim Ln f
n
n
n
n=
=
y del hecho que Ln fn es una función convexa se tiene que Ln f es el límite de una
sucesión de funciones convexas y, por el teorema 1.4.5, concluimos que Ln f es
convexa, es decir que f es log-convexa.
Para finalizar esta sección consideremos la función Γ (Gamma) definida para
todo x>0 por la integral impropia
Γ( ) .x e t dtt x
= − −
∞
∫
1
0
Demostraremos a continuación que la función Γ es log-convexa en ( , ).0 + ∞ Para
demostrarlo sólo necesitamos probar que LnΓ es convexa, es decir :
d Ln
dx
2
2
2
2
0
Γ Γ Γ Γ
Γ
=
−
≥
" '
(1.31)
En efecto
Γ
Γ
'( ) ( )
"( ) ( )
x
x
e t dt
e t Lnt dt
x e t Lnt dt
t x
t x
t x
=
=
=
∞
− −
− −
∞
− −
∞
∫
∫
∫
∂
∂
0
1
1
0
1 2
0
Aplicando ahora la desigualdad de Chauchy-Schawrz para las integrales (desigualdad
(1.26) ) tenemos que :
82. 73
( )
Γ
ΓΓ
'
".
/ /
/ /
2 1
0
2
2 1
0
2 1
2
2 1
2
2 1
2
00
1 1 2
00
=
=
≤
=
=
− −
∞
− −
∞
− −
− − − −
∞∞
− − − −
∞∞
∫
∫
∫∫
∫∫
e t Lnt dt
e t e t Lnt dt
e t dt e t Lnt dt
e t dt e t Lnt dt
t x
t x t x
t x t x
t x t x
Esto implica que
ΓΓ Γ" '− ≥2
0
y por consiguiente la desigualdad (1.31) es cierta, y así LnΓ es convexa, es decir Γ
es log-convexa.
1.8. Funciones Aditivas y Funciones mid convexas.
En esta sección presentaremos las definiciones de función aditiva y función
mid convexa. Veremos también que si f :IR→IR es una función aditiva y además
continua entonces es lineal y demostraremos que toda función mid convexa y
continua es convexa.
Lo expuesto aquí ha sido tomado casi completamente de [11], Capítulos 5 y 7,
exceptuando la parte relacionada con el teorema 1.8.3 que se encuentra en [8], p. 49.
Empezamos con la definición de función aditiva.
83. 74
Definición 1.8.1 : (Función aditiva)(1)
. Una función f :IR→IR se dice aditiva si
satisface la ecuación de Cauchy
f x y f x f y( ) ( ) ( )+ = + (1.32)
para todo x y, ∈IR..
Pasamos entonces a las siguientes proposiciones.
Proposición 1.8.1 : Sea f :IR→IR una función aditiva. Entonces
f x f xi
i
n
i
i
n
= =
∑ ∑
=
1 1
( ) (1.33)
para cada n∈IN y para cualesquiera x xn1, ,K ∈IR.
Demostración : Si n=2 tenemos la igualdad (1.32) que es la definición de función
aditiva.
Supongamos que la igualdad (1.33) es cierta para n −1 sumandos y probemos que
también es cierta para n. En efecto :
( )
( )
f x f x x
f x f x f es aditiva
f x f x
f x f x f x
i
i
n
i
i
n
n
i
i
n
n
i n
i
n
i i
i
n
i
i
n
i
n
= =
−
=
−
=
−
= ==
∑ ∑
∑
∑
∑ ∑∑
=
+
=
+
= +
= ⇒
=
1 1
1
1
1
1
1
1 11
( )
( ) ( )
( ) .
Proposición 1.8.2 : Sean f1: IR→IR y f2:IR→IR funciones aditivas. Entonces, para
cada a b, ∈IR la función f af bf= +1 2 es aditiva.
Demostración : Sean x y, ∈IR , entonces
(1)
Esta definición también es válida para funciones f :IRn
→IR
84. 75
( )
( ) ( )
( ) ( )
( )
f x y af x y bf x y
a f x f y b f x f y
af x bf x af y bf y
f x f y f x y f x f y
+ = + + +
= + + +
= + + +
= + ⇒ + = +
1 2
1 1 2 2
1 2 1 2
( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( ).
El teorema siguiente nos caracteriza las soluciones de la ecuación de Cauchy.
Teorema 1.8.1 : Sea f :IR→IR una función que satisface la ecuación de Cauchy.
Entonces,
f x f x( ) ( )λ λ=
para todo x ∈IR y λ ∈Q.
Demostración : Para x=y=0 tenemos según (1.32) que
f f f f( ) ( ) ( ) ( )0 0 0 0 0= + = +
es decir
f f f( ) ( ) ( )0 0 0= −
de donde
f ( )0 0= (1.34)
Por otra parte
( ) ( )( ) ( ) ( )0 0= = − = + − = + −f f x x f x x f x f x( ) ,
lo cual es equivalente a
f x f x( ) ( )− = − (1.35)
para todo x ∈ IR y, por lo tanto, f es una función impar.
Hagamos ahora en (1.33) x x xn1 = = =L , entonces tenemos que
85. 76
( )f x f x f x f xi
i
n
i
i
n
i
n
i
n
= = = =
∑ ∑ ∑ ∑
= ⇒
=
1 1 1 1
( )
y por lo tanto
f nx nf x( ) ( )= (1.36)
Ahora bien, si λ ∈Z se tiene para λ ≥ 0 que
f x f x( ) ( )λ λ=
y si λ < 0, como − >λ 0 se verifica
( ) ( )( )( ) ( )
( )( ) ( )
f x f x f x
f x f x
λ λ λ
λ λ
= − − = − −
= − − = .
En cualquier caso, si λ ∈Z entonces
( )f x f xλ λ= ( ).
Dado que para cualquier λ ∈Q existen k ∈Z y m ∈IN tales que λ = k m/ tenemos
que kx m x= ( )λ y por consiguiente
( ) ( )( ) ( )kf x f kx f m x mf x( ) = = =λ λ
de donde
( ) ( ) ( )f x
k
m
f x f xλ λ= =
para todo x ∈IR y λ ∈Q.
En el siguiente teorema probamos que toda solución de la ecuación de Cauchy
es lineal cuando la función además de aditiva es continua.
Teorema 1.8.2 : Sea f :IR→IR una función aditiva y continua. Entonces
86. 77
f x f x( ) ( )= 1
para todo x ∈IR..
Demostración: Sea x ∈IR y consideremos una sucesión { }λn tal que lim x
n
n
→∞
=λ , y
λn ∈Q para cada n ∈IN. Entonces
( ) ( ) ( )f f fn n nλ λ λ= ⋅ =1 1 .
Tomando límite cuando n → ∞ y usando la continuidad de f, tenemos
( ) ( )
( )
f x f lim lim f
lim f f lim
f x
n
n
n
n
n
n
n
n
=
=
= =
=
→∞ →∞
→∞ →∞
λ λ
λ λ1 1
1
( )
( ) .
Es decir f x f x( ) ( )= 1 para todo x ∈IR..
A continuación presentamos la definición de función mid-convexa o convexa
en el punto medio, llamadas también Jensen-convexas.
Definición 1.8.2 : (Función mid convexa). Sea I ⊂ IR un intervalo. Una función
f I: →IR se dice mid convexa (o convexa en el punto medio) si y sólo si satisface la
desigualdad
f
x y f x f y+
≤
+
2 2
( ) ( )
(1.37)
para todo x y I, ∈ . Si la desigualdad es estricta para x y≠ , f es llamada
estrictamente mid convexa.
Obsérvese que de acuerdo con la definición , toda función convexa es también
mid convexa. El recíproco en general no es cierto , sin embargo veremos que bajo
condiciones bastante generales, ambas definiciones son equivalentes.
87. 78
En primer lugar tenemos que si f :IR→IR es una función aditiva entonces
( )f
x y
f x y
f x f y+
= + =
+
2
1
2 2
( ) ( )
es decir, cualquier función aditiva es mid convexa.
Continuamos con el siguiente teorema.
Teorema 1.8.3 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa.
Entonces
( ) ( )( )f
x x
n n
f x f xn
n
1
1
1+ +
≤ + +
L
L (1.38)
para todo entero positivo n y cualesquiera x I i ni ∈ =, , , .1 K
Demostración : Si n=2 la desigualdad (1.38) es la definición de función mid
convexa. Supongamos que la relación es cierta para n m
= 2 y demostremos que
también es cierta para n m
= +
2 1
. En efecto, sean
x x x xm i
i
m i
i
m
m
m
' , " ,= =
= = +
∑ ∑
+
1
2
1
21
2
2 1
2 1
entonces
f
x x
n
f
x xn
m
m
1 1 2
1
1
2
+ +
=
+ +
+
+
L L
= +
+
=
+
= +
∑ ∑
+
f x xm i
i
m i
i
m
m
m
1
2
1
21
1
2
1
2 1
2 1
= +
= = +
∑ ∑
+
f x xm i
i
m i
i
m
m
m
1
2
1
2
1
21
2
2 1
2 1
88. 79
( )
( ) ( )
( ) ( )
( ) ( )
( )
= +
=
+
≤
+
=
+
≤
+
=
+
=
= = +
= = +
= = +
+
=
∑ ∑
∑ ∑
∑ ∑
∑
+
+
+
f x x f
x x
f x f x
f es mid convexa
f x f x
f x f x
Hipotesis inductiva
f x f x
n
f x
m i
i
m i
i
m i
i
m i
i
i
i
i
i
m i
i
n
m
m
m
m
m
m
m
m
m
1
2 2
2
1
2
1
2
2
1
2
1
2
2
2
1
1
2
2 1
2
1
2
2 1
2
1
2
2 1
2
1
1
1
1
1
' "
' "
' "
( )
( )
,
lo cual implica que sí n m
= 2 para algún m ∈IN se verifica
( )f
n
x
n
f xi
i
n
i
i
n
1 1
1 1= =
∑ ∑
≤ .
Supongamos ahora que n no es de esta forma, es decir n ∈IN es arbitrario (n>2), y
sea m ∈IN tal que n m
< 2 . Definiendo
y
x x
n
n=
+ +1 L
tenemos
( ) ( )y
x x n yn
m
m
=
+ + + −1 2
2
L
=
+
= +=
∑∑x yi
i ni
n
m
m
1
2
1
2
,
89. 80
es decir
y x ym i
i ni
n m
= +
= +=
∑∑
1
2 1
2
1
y por la primera parte de la demostración tenemos que
( ) ( )
( ) ( ) ( )
f y f x y
f x f y
f x n f y
m i
i ni
n
m i
i ni
n
m i
m
i
n
m
m
( )
.
= +
≤ +
= + −
= +=
= +=
=
∑∑
∑∑
∑
1
2
1
2
1
2
2
1
2
1
1
2
1
1
Es decir
( ) ( ) ( ) ( )2 2
1
m
i
m
i
n
f y f x f y n f y≤ + −
=
∑ ,
de donde
( ) ( )n f y f xi
i
n
≤
=
∑
1
y por consiguiente
( ) ( )f
x x
n
f x f x
n
n n1 1+ +
≤
+ +L L
,
con lo cual concluye la demostración.
Estamos en condiciones de demostrar el siguiente teorema.
90. 81
Teorema 1.8.4 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa.
Entonces
( )( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 ( ) (1.39)
para todo x y I, ∈ y λ ∈QI[ , ].0 1
Demostración : Sea λ = k n/ donde { }k n∈ 0 1 2, , , ,K y n ∈IN, es decir
λ ∈QI[ , ]0 1 . De acuerdo con la desigualdad (1.38) se tiene que para todo x y I, ∈
se verifica
( )
( ) ( ) ( )
( ) ( )
f
k
n
x
k
n
y f
kx n k y
n
k f x n k f y
n
k
n
f x
k
n
f y
+ −
=
+ −
≤
+ −
= + −
1
1
lo cual implica que
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 ,
para todo x y I, ∈ y λ ∈Q [ ]I 0 1, .
Finalizamos este capitulo con el siguiente teorema, el cual establece que toda
función mid convexa y continua es convexa.
Teorema 1.8.5 : Sean I ⊂ IR un intervalo y f I: →IR una función mid convexa y
continua. Entonces f es convexa.
Demostración : Sean x y I, ∈ y [ ]λ ∈ 0 1, . Sea { }λn una sucesión de números
racionales pertenecientes al intervalo cerrado [0, 1] (λn ∈Q [ ]I 0 1, , n ∈IN ) que
converge a λ λ λlim
n
n
→∞
=
.
91. 82
Entonces, por el teorema anterior, tenemos que
( )( ) ( )f x y f x f yn n n nλ λ λ λ+ − ≤ + −1 1( ) ( ).
Utilizando esto y el hecho que f es continua se obtiene
( )( ) ( )( )
( )( )
( ) ( ) ( )( )
( ) ( )
f x y f lim x y
lim f x y
lim f x f y
f x f y
n
n n
n
n n
n
n n
λ λ λ λ
λ λ
λ λ
λ λ
+ − = + −
= + −
≤ + −
= + −
→∞
→∞
→∞
1 1
1
1
1( ) .
Es decir
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1
para todo x y I, ∈ y [ ]λ ∈ 0 1, .
92. 83
Capítulo II
Funciones Convexas Sobre IRn
En el capítulo 1 tratamos funciones convexas definidas sobre un intervalo de
la recta real. En este capítulo consideraremos funciones convexas f D: ⊂ IRn
→ IR
donde D es un conjunto convexo no vacío. Utilizaremos algunas propiedades de los
conjuntos convexos, las cuales el lector puede encontrar en [1], [5], [8], [15] o [17].
Las funciones convexas sobre subconjuntos convexos de IRn
desempeñan un
papel muy importante en la teoría de la optimización, principalmente en la
programación lineal y la programación convexa. Por otra parte, cualquiera que se
interese en el estudio de la programación no lineal debe dominar primero la teoría
referente a estas funciones. De aquí la importancia de este capítulo que sirve de base
para el estudio mencionado.
2.1. Definición y Propiedades Básicas.
Los conceptos de conjunto convexo y función convexa están estrechamente
relacionados. Para destacar la relación que existe entre las propiedades analíticas y las
propiedades geométricas de la gráfica de una función convexa, empezaremos por
presentar la definición analítica de función convexa y luego veremos una definición
geométrica equivalente a la analítica.
A continuación se presenta la definición analítica de función convexa la cual
viene expresada por la desigualdad de Jensen.
Definición 2.1.1. (Función convexa). Sean D ⊂ IRn
un conjunto convexo y
f D: → IR una función. Se dice que f es convexa si y sólo si
93. 84
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 (2.1)
para todo λ ∈ ∈[ , ] ; , .0 1 x y D
Comentarios : La desigualdad (2.1) se conoce con el nombre de desigualdad de
Jensen. En la definición se requiere que el dominio D de la función f sea un conjunto
convexo porque esto garantiza que para cualesquiera x y D, , [ , ],∈ ∈λ 0 1 f está
definida en el punto ( )λ λx y+ −1 .
De manera similar al caso de funciones f I: ⊂IR →IR, donde I es un
intervalo, se demuestra que si D es un subconjunto convexo de IRn
, una función
f D: ⊂ IRn
→ IR es convexa si y sólo si
( )f x f xi i
i
n
i i
i
n
α α
= =
∑ ∑
≤
1 1
para todo x D i ni ∈ =, , , ;1 K y αi ≥ 0 tales que αi
i
n
=
=
∑ 1
1
.
Los detalles de la demostración se encuentran en el teorema 1.1.1.
Algunos ejemplos de funciones convexas son :
1) f x x D( ) ,= = IRn
;
2) f r s r s D( , ) ,= + =2 2
IR2
;
3) f r s r s D( , ) exp ( ) ,= + =2 2
IR2
;
4) f x x x xn n( , , ) ,1 1K L= + +α α
94. 85
si ( )α ≥ > =1 0 1, , , .x i ni K
La demostración de que las funciones dadas en 1), 2) y 4) son convexas se hace
directamente usando la desigualdad de Jensen expresada en la definición 2.1.1. En 1)
se aplica la desigualdad triangular ; en 2) se utiliza el hecho de que la función
g : IR→IR definida por ( )g t t= 2
es convexa ; y en 4) nos apoyamos en que la
función ( )h : ,0 ∞ → IR definida por ( )h t t= α
, con α ≥ 1, es convexa. Finalmente,
para demostrar que la función dada en 3) es convexa, se usa el criterio de la matriz
Hessiana, el cual exponemos en el teorema 2.6.2. El lector interesado en los detalles
de la demostraciones puede consultar [8], pp. 135 y 137.
Ahora definiremos un conjunto de gran interés cuando se estudian las
funciones convexas porqué a través del mismo podemos dar un tratamiento
geométrico a las funciones convexas.
Definición 2.1.2 : (Epígrafo). Sean D ⊂ IRn
un conjunto no vacío y f D: → IR una
función. El epígrafo de f (epí f) es el conjunto
epí ( ){f x D= ∈ ×, α IR ( ) }: .f x ≤ α
Geométricamente, en los casos D ⊂ IR y D ⊂ IR2
( )n y n= =1 2 el conjunto
epí f consiste en todos los puntos de la gráfica de f y en los puntos que están por
encima de dicha gráfica. En la figura 2.1 se puede observar el conjunto epí f para el
caso de una función f a b:[ , ] → IR.
95. 86
Figura 2.1
Sí [ ]f a b: , → IR es una función convexa se tiene que epí f es un conjunto
convexo (ver figura 2.2).
Figura 2.2
Esta afirmación la exponemos en la siguiente proposición.
epí f
epí f