Análisis de la Temporada Turística 2024 en Uruguay
Cálculo de sensibilidades de productos derivados financieros mediante diferenciación algorítmica
1. Máster en Matemática Industrial
Curso 2018/2019
Trabajo de Fin de Máster
Diferenciación algorítmica para el
cálculo de sensibilidades de productos
derivados nancieros mediante métodos
Monte Carlo
Alumno:
José Ramón Picos Varela
Directores:
José Antonio García Rodríguez (Universidade da Coruña)
Manuel Menéndez Sánchez (Banco Santander)
Jose Pedro Rivera Galicia (Banco Santander)
Ignacio Luján Fernández (Banco Santander)
Septiembre de 2019
2.
3. `Vivir satisfecho de uno mismo ha de ser muy aburrido,
por eso no hay mejor cosa que meterse en aventuras'
Juan Benet
Ingeniero de Caminos, Canales y Puertos y literato
Exención de responsabilidad: Las opiniones expresadas en el presente Trabajo de Fin
de Máster son las del autor del mismo. Por lo tanto, no reejan ni representan necesaria-
mente las opiniones ni la política ocial de Banco Santander, S.A.
José Ramón Picos Varela
Madrid, Septiembre de 2019
i
5. Agradecimientos
Puesto que es de bien nacidos ser agradecidos, sirvan estas humildes líneas para mos-
trar mi reconocimiento a todas las personas que, de algún modo u otro, han contribuido
al desarrollo del presente trabajo.
A los directores del presente Trabajo de Fin de Máster: José Antonio, Manolo, Jose
y especialmente a Nacho; el compañero de trabajo que todo el mundo querría tener.
Muchísimas gracias por la conanza depositada en mí, por vuestro constante apoyo,
por vuestras enseñanzas y lecciones magistrales y por vuestra profesionalidad y
dedicación para lograr que este trabajo llegue a buen puerto.
A mis compañeros de trabajo en el departamento de Validación Interna de Banco
Santander. Muchísimas gracias por el interés mostrado, por las siempre acertadas
opiniones y sugerencias y por vuestra ayuda desinteresada cuando más lo necesitaba.
Y por supuesto a las personas más importantes: a mi familia y a mis amigos y amigas.
Muchísimas gracias por todo lo que habéis hecho, hacéis por mí cada día y por lo
que presumo seguiréis haciendo durante mucho tiempo. Espero poder devolveros en
un futuro una pequeña parte de todo lo que me habéis dado. Soy lo que soy y he
llegado hasta aquí gracias a vosotros y vosotras.
iii
7. Resumen
Una de las tareas principales de los analistas cuantitativos (quants) es valorar los
distintos productos nancieros derivados de las carteras de las entidades nancieras. Sin
embargo, la mayor parte del tiempo de computación no se emplea en calcular el precio
de dichos productos, sino que se gasta en obtener unas magnitudes muy importantes
llamadas griegos o sensibilidades. Estas magnitudes se obtienen calculando la derivada
del precio de los productos con respecto a los distintos factores de riesgo de mercado.
El creciente nivel de sosticación de los instrumentos derivados y de los mercados -
nancieros ha reducido los modelos con fórmulas analíticas de forma cerrada a un pequeño
porcentaje del inventario general de modelos de instituciones nancieras. Consecuente-
mente, la mayor parte de los motores de jación de precios se basan en métodos Monte
Carlo, para los cuales los tiempos de computación de las griegas empleando métodos
tradicionales son muy altos. Estos métodos están basados principalmente en el método
de diferencias nitas, ampliamente utilizado en los equipos cuantitativos de las empresas
nancieras de todo el mundo debido principalmente a su sencillez y a su facilidad de im-
plementación. Sin embargo, el coste computacional de calcular el precio y las derivadas
asociados se multiplica aproximadamente por el número de derivadas más uno, con res-
pecto al coste computacional de calcular el precio únicamente, algo que para productos
con varios subyacentes puede ser una limitación importante. Además, los esquemas de di-
ferencias nitas llevan asociado un error de truncamiento y exigen de antemano establecer
un valor de bump, una decisión que puede ser trascendental en el cálculo de griegas.
La diferenciación algorítmica es un conjunto de técnicas para evaluar numéricamente
la derivada de una función especicada mediante un programa de ordenador. Esta técni-
ca tiene en cuenta que, cada software, ejecuta una secuencia de operaciones aritméticas
elementales (suma, resta, multiplicación, división, etc.) y funciones elementales (exp, log,
sin, cos, etc.). Al aplicar la regla de la cadena repetidamente a estas operaciones, las deri-
vadas de cualquier orden se pueden calcular con precisión de máquina y no exigen denir
un valor de bump. Además, empleando el método backward y diferenciación automática,
se puede reducir el coste computacional de calcular el precio y las derivadas a menos de
cuatro veces el coste computacional de calcular el precio únicamente.
Para analizar la idoneidad del empleo de las técnicas de diferenciación algorítmica
para el cálculo de griegas, se han seguido diferentes caminos para nalmente diseñar una
librería de valoración de productos derivados nancieros y calcular así estas sensibilidades
empleando la herramienta Autograd.
v
8. En lineas generales, el presente Trabajo de Fin de Máster titulado `Diferenciación
algorítmica para el cálculo de sensibilidades de productos derivados nancieros mediante
métodos Monte Carlo', intenta sentar las bases para la aplicación de las técnicas de dife-
renciación algorítmica en las librerías del departamento de Validación Interna de Banco
Santander. De este modo se evitaría el uso de las técnicas clásicas empleadas tradicio-
nalmente en la industria bancaria basadas en el método de diferencias nitas las cuales
llevan asociado un error de truncamiento, pueden aumentar considerablemente el tiem-
po de computación y exigen de antemano establecer un valor de bump que puede ser
trascendental.
José Ramón Picos Varela
Madrid, Septiembre de 2019
vi
9. Resumo
Unha das tarefas principais dos analistas cuantitativos (quants) é valorar os distintos
produtos nanceiros derivados das carteiras das entidades nanceiras. Non obstante, a
maior parte do tempo de computación non se emprega en calcular o prezo destes produtos,
senón que se gasta en obter cantidades moi importantes chamadas gregas ou sensibilidades.
Estas cantidades obtéñense calculando a derivada do prezo dos produtos con respecto aos
diferentes factores de risco do mercado.
O aumento do nivel de sosticación dos instrumentos derivados e mercados nancei-
ros reduciu os modelos con fórmulas analíticas pechadas a unha pequena porcentaxe do
inventario xeral de modelos de institucións nanceiras. Por conseguinte, a maioría dos
motores de prezos baséanse en métodos Monte Carlo, para os cales os tempos de cálculo
das gregas mediante métodos tradicionais son moi altos. Estes métodos baséanse prin-
cipalmente no método de diferenzas nitas, moi empregado en equipos cuantitativos de
empresas nanceiras de todo o mundo debido principalmente á súa sinxeleza e facilidade
de aplicación. Non obstante, o custo computacional de calcular o prezo e as derivadas aso-
ciadas multiplícase aproximadamente polo número de derivadas máis un, con respecto ao
custo computacional de calcular o prezo únicamente, algo que para produtos con varios
subxacentes pode ser unha limitación importante. Ademais, os esquemas de diferenzas
nitas levan asociado un erro de truncamento e requiren de antemán establecer un valor
de bump, unha decisión que pode ser transcendental no cálculo das gregas.
A diferenciación algorítmica é un conxunto de técnicas para avaliar numericamente a
derivada dunha función especicada mediante un programa de ordenador. Esta técnica
ten en conta que cada software executa unha secuencia de operacións aritméticas ele-
mentais (suma, resta, multiplicación, división, etc.) e funcións elementais (exp, log, sin,
cos, etc.). Ao aplicar repetidamente a regra de cadea a estas operacións, as derivadas de
calquera orde pódense calcular con precisión de máquina e non precisan denir un valor
de bump. Ademais, empregando o método backward e diferenciación automática, o custo
computacional do cálculo do prezo e as derivadas pode reducirse a menos de catro veces
o custo computacional de calcular o prezo unicamente.
Para analizar a idoneidade do uso de técnicas de diferenciación algorítmica para o
cálculo de gregas, seguíronse diferentes camiños para nalmente deseñar unha libraría de
valoración de produtos derivados nanceiros e calcular así estas sensibilidades usando a
ferramenta Autograd.
vii
10. En liñas xerais, o presente Traballo de Fin de Mestrado titulado `Diferenciación al-
gorítmica para o cálculo de sensibilidades de productos derivados nanceiros mediante
métodos Monte Carlo', trata de sentar as bases para a aplicación das técnicas de di-
ferenciación algorítmica nas librarías do departamento de Validación Interna de Banco
Santander. Deste modo evitaríase o uso das técnicas clásicas tradicionalmente emprega-
das na industria bancaria baseadas no método de diferenzas nitas as cales levan asociado
un erro de truncamento, poden aumentar considerablemente o tempo de computación e
requiren de antemán establecer un valor de bump o cal pode ser transcendental.
José Ramón Picos Varela
Madrid, Setembro de 2019
viii
11. Abstract
One of the main task for a quantitative analyst or quant is to price the dierent nan-
cial products in the portfolios of nancial institutions. However most of the computing
time is not used to calculate the product prices, but to obtain very signicant quantities
called greeks or sensitivities. These quantities are obtained by calculating the derivative
of the product prices with respect to dierent market risk factors.
Models with closed analytic formulas have been reduced to a small percentage of the
model inventories across nancial institutions due to the rising level of sophistication
of derivative instruments and nancial markets. Consequently, most pricing engines are
based on Monte Carlo methods, for which the computing time of the greeks using tra-
ditional methods is very high. These methods are mainly based on the nite dierences
method, widely used by quantitative teams of nancial rms around the world because of
its simplicity and its ease of implementation. However, the computational cost of compu-
ting prices and its associated sensitivities is approximately multiplied by the number of
derivatives plus one with respect to the computational cost of calculating the price alone.
This fact can be an important limitation for derivatives with several underlyings. Besides,
nite dierence schemes incorporate truncation error and require to dene a bump value
in advance, a decision that can be momentous in greeks computing.
Algorithmic Dierentiation is a set of techniques dedicated to the computation of the
derivatives of a specied function implemented in a computer program. These techniques
take into account that each software executes a sequence of elementary arithmetic opera-
tions (addition, subtraction, multiplication, division, etc.) and elementary functions (exp,
log, sin, cos, etc.). By repeatedly applying the chain rule to this operations, the derivative
of any order can be computed with epsilon-machine without the requirement of choosing a
bump value. In addition, by applying the backward method and automatic dierentiation
techniques, the computational cost of computing prices and its derivatives can be reduced
to less than four times the computational cost of calculating only the price.
In order to analyze the suitability of using Algorithmic Dierentiation techniques for
the computation of the greeks, several paths have been followed to nally design a nancial
derivatives pricing engine used to calculate these sensitivities using Autograd.
ix
12. Overall, this MSc Thesis entitled `Algorithmic Dierentiation for the calculation of
sensitivities of nancial derivative products using Monte Carlo methods', tries to lay the
groundwork for the future application of Algorithmic Dierentiation techniques in the
pricing libraries of the Internal Validation Department of Banco Santander. This way,
the use of more classic techniques traditionally used in the nancial industry would be
avoided. These conventional techniques, based mostly on the nite dierences method,
incorporates truncation error, can signicantly increase computing time and require to
dene a momentous bump value in advance.
José Ramón Picos Varela
Madrid, September 2019
x
15. Índice de guras
1.1. Principales datos de Banco Santander a diciembre de 2018. . . . . . . . . . 2
1.2. Balance de Banco Santander a diciembre de 2018. . . . . . . . . . . . . . . 2
1.3. Crecimiento de Banco Santander durante el último ejercicio. . . . . . . . . 3
1.4. Rentabilidad de Banco Santander durante el último ejercicio. . . . . . . . . 3
1.5. Diversicación geográca de Banco Santander a diciembre de 2017. . . . . 4
2.1. El mercado de derivados nancieros. Fuente: `Bank for International Settle-
ments'. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.1. Ejemplo de grafo para calcular el valor de una función y sus derivadas
empleando el método forward. . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.2. Ejemplo de grafo para calcular el valor de una función y sus derivadas
empleando el método backward. . . . . . . . . . . . . . . . . . . . . . . . . 55
5.3. Diferencias de cálculo entre el método forward y el método backward. . . . 58
5.4. Cálculo de las derivadas nodo a nodo con el método backward. . . . . . . . 58
6.1. Proling en MATLAB de una ejecución del método Monte Carlo por dife-
renciación algorítmica automática. . . . . . . . . . . . . . . . . . . . . . . . 65
6.2. Ejemplo de grafo para calcular el valor de una función y su gradiente em-
pleando el método backward con Autograd. . . . . . . . . . . . . . . . . . . 67
6.3. Ejemplo de aplicación de una función envuelta en Autograd. . . . . . . . . 68
6.4. Representación de la vinculación de los nodos para generar un grafo de
cálculo con la dependencia entre padres. . . . . . . . . . . . . . . . . . . . 69
6.5. Estructura de la librería desarrollada. . . . . . . . . . . . . . . . . . . . . . 79
7.1. Valores obtenidos en el cálculo de la vega de una opción call europea con
un esquema de diferencias nitas variando el valor del bump. . . . . . . . . 84
7.2. Comparativa entre el número de activos subyacentes y el ratio de cálculo
con el modelo de Black-Scholes. . . . . . . . . . . . . . . . . . . . . . . . . 87
7.3. Comparativa entre el número de activos subyacentes y el tiempo de cálculo
total con el modelo de Black-Scholes. . . . . . . . . . . . . . . . . . . . . . 88
7.4. Aplicación del algoritmo nearest correlation tras el bumpeo de una matriz
que se sale fuera del espacio de las matrices semidenidas positivas. . . . . 93
7.5. Sensibilidad a la correlación de un par de activos al aproximarse la matriz
de correlación de los activos subyacentes a la frontera del espacio denido
por el conjunto de matrices semidenidas positivas W. . . . . . . . . . . . 96
xiii
16. 7.6. Valor de una opción basket al aproximarse la matriz de correlación de los
activos subyacentes a la frontera del espacio denido por el conjunto de
matrices semidenidas positivasW. . . . . . . . . . . . . . . . . . . . . . . 97
7.7. Función de payo de una opción call digital cash-or-nothing europea. . . . 99
7.8. Función de payo suavizada de una opción call digital cash-or-nothing
europea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
7.9. Función de payo de una opción call europea. . . . . . . . . . . . . . . . . 102
7.10. Sesgo de la gamma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
7.11. Desviación típica de la gamma. . . . . . . . . . . . . . . . . . . . . . . . . 105
7.12. Sesgo de la delta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.13. Desviación típica de la delta. . . . . . . . . . . . . . . . . . . . . . . . . . . 106
7.14. Función de payo suavizada de una opción call europea. . . . . . . . . . . 107
xiv
17. Índice de tablas
6.1. Ratio de tiempos de cálculo en MATLAB para una opción call europea con
el modelo de Black-Scholes mediante el método Monte Carlo. . . . . . . . . 64
7.1. Inputs para el cálculo de una opción call europea. . . . . . . . . . . . . . . 82
7.2. Resultados para el cálculo de una opción call europea empleando la fórmula
analítica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.3. Resultados para el cálculo de una opción call europea empleando el método
Monte Carlo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.4. Errores obtenidos en el cálculo del precio y las griegas de una opción call
europea al emplear el método Monte Carlo. . . . . . . . . . . . . . . . . . . 84
7.5. Inputs para el cálculo de una opción basket best-of call europea. . . . . . . 86
7.6. Ratios de cálculo al variar el número de subyacentes para una opción basket
best-of call europea con un modelo de Black-Scholes. . . . . . . . . . . . . 87
7.7. Parámetros para el cálculo de una opción basket best-of call europea. . . . 89
7.8. Ratios de cálculo para una opción basket best-of call europea con un modelo
CEV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.9. Inputs para el cálculo de una opción basket call worst-of asiática con el
modelo CEV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.10. Parámetro del modelo CEV para la valoración de una basket call worst-of
asiática. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.11. Ratios de cálculo para una opción basket call worst-of asiática con un
modelo CEV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.12. Inputs para el cálculo de una opción basket best-of call europea. . . . . . . 94
7.13. Resultados para el cálculo de una opción basket best-of call europea em-
pleando Autograd y esquemas de diferencias nitas centradas con bump =
10e-02. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.14. Resultados para el cálculo de una opción basket best-of call europea em-
pleando Autograd y esquemas de diferencias nitas centradas con bump =
10e-04. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.15. Inputs para el cálculo de una opción call digital cash-or-nothing europea
con el payo suavizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.16. Resultados para el cálculo de una opción call digital cash-or-nothing euro-
pea con el payo suavizado con el modelo de Black-Scholes. . . . . . . . . 101
7.17. Inputs para el cálculo de la gamma de una opción call europea con el
modelo de Black-Scholes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
xv
18. 7.18. Resultados obtenidos para el cálculo de la gamma de una opción call eu-
ropea con un esquema de diferencias nitas centradas de segundo orden. . 103
7.19. Resultados obtenidos para el cálculo de la gamma de una opción call euro-
pea con Autograd y un esquema de diferencias nitas centradas de primer
orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
7.20. Resultados para el cálculo de la gamma de una opción call europea con el
payo suavizado empleando Autograd. . . . . . . . . . . . . . . . . . . . . 106
7.21. Inputs para el cálculo de un autocall. . . . . . . . . . . . . . . . . . . . . . 108
7.22. Parámetros del modelo de mixtura de lognormales para valorar un autocall. 108
7.23. Resultados obtenidos para el cálculo de la delta y de la gamma de un
autocall con esquemas de diferencias nitas centradas. . . . . . . . . . . . . 108
7.24. Resultados obtenidos para el cálculo de la delta y de la gamma de un
autocall con Autograd. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.25. Inputs para el cálculo de un dispersion trade. . . . . . . . . . . . . . . . . . 109
7.26. Parámetros del modelo de mixtura de lognormales para valorar un disper-
sion trade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.27. Resultados obtenidos para el cálculo de la delta y de la gamma de un
dispersion trade con esquemas de diferencias nitas centradas. . . . . . . . 110
7.28. Resultados obtenidos para el cálculo de la delta y de la gamma de un
dispersion trade con Autograd. . . . . . . . . . . . . . . . . . . . . . . . . 110
xvi
19. Motivación
Tal y como establece la Normativa del Trabajo de Fin de Máster (TFM) del Máster en
Matemática Industrial (M2i) por la Universidade da Coruña (UDC), la Universidade de
Santiago de Compostela (USC), la Universidade de Vigo (UVigo), la Universidad Carlos
III de Madrid (UC3M) y la Universidad Politécnica de Madrid (UPM); es condición
necesaria para la obtención del título de Máster en Matemática Industrial la elaboración
y la posterior defensa ante un tribunal de un Trabajo de Fin de Máster por parte de los
alumnos.
Además, en el Artículo 3 de dicha Normativa se establece lo siguiente:
`El objetivo del proyecto desarrollado por el estudiante en el TFM será la
resolución de un problema que debe de ser presentado [...] por personal de las
empresas colaboradoras.'
Por lo tanto, el presente Trabajo de Fin de Máster titulado `Diferenciación algorítmi-
ca para el cálculo de sensibilidades de productos derivados nancieros mediante métodos
Monte Carlo' y propuesto por el departamento de Validación Interna, un equipo de San-
tander Analytics, que a su vez es un área de la División de Riesgos de Banco Santander
(una empresa que se describirá someramente en el Capítulo 1), tiene como propósito
superar los créditos correspondientes y obtener así el título de Máster en Matemática
Industrial.
José Ramón Picos Varela
Madrid, Septiembre de 2019
xvii
21. Capítulo 1
Banco Santander
Nota importante: Las Figuras de este capítulo han sido tomadas del informe anual
de Banco Santander, S.A. a través de la página web corporativa a fecha de redacción del
presente Trabajo de Fin de Máster.
Banco Santander, S.A. (en adelante Banco Santander o simplemente Santander) es
un banco español. Es una de las mayores entidades nancieras del mundo y está presente
principalmente en Europa y América.
El banco fue fundado el 15 de mayo de 1857, en la ciudad de Santander (Cantabria,
España), donde tiene su sede social desde entonces. Su sede operativa se concentra en sus
ocinas centrales de la `Ciudad Grupo Santander' de Boadilla del Monte (Comunidad de
Madrid, España).
A 31 de diciembre de 2018, los activos del Santander eran de 1,459,271 millones de eu-
ros, siendo la primera entidad nanciera española. La banca minorista es su principal área
de negocio, aportando, a fecha de redacción del presente documento, aproximadamente
el 70 % del benecio para la entidad. Cuenta con un total de 13,217 ocinas, 202,713
empleados, 144 millones de clientes y 4.1 millones de accionistas.
Cotiza en la Bolsa de Madrid (SAN) y forma parte del IBEX 35 así como del Dow
Jones EURO STOXX 50. Cerró 2018 con una capitalización bursátil de 64,508 millones de
euros, situándose como el mayor banco de la eurozona y decimocuarto del mundo por capi-
talización. A cierre de ese mismo año, era la segunda empresa española por capitalización
y la sexagésimo novena del mundo.
Banco Santander cuenta con una diversicación geográca equilibrada entre sus diez
mercados principales, en los que alcanza cuotas de mercado elevadas: España, Alema-
nia, Polonia, Portugal, Reino Unido, Brasil, México, Chile, Argentina y Estados Unidos.
Además, tiene una cuota de mercado signicativa en Uruguay y Puerto Rico, negocios de
nanciación al consumo en otros países europeos y presencia en China a través del negocio
de banca mayorista y de nanciación al consumo.
Santander tiene también áreas de negocio globales que desarrollan productos que se
distribuyen en las redes comerciales del grupo y que atienden a clientes de ámbito global.
1
22. 2 Capítulo 1. Banco Santander
Figura 1.1: Principales datos de Banco Santander a diciembre de 2018.
Figura 1.2: Balance de Banco Santander a diciembre de 2018.
23. 3
Figura 1.3: Crecimiento de Banco Santander durante el último ejercicio.
Figura 1.4: Rentabilidad de Banco Santander durante el último ejercicio.
24. 4 Capítulo 1. Banco Santander
Figura 1.5: Diversicación geográca de Banco Santander a diciembre de 2017.
25. Capítulo 2
Conceptos previos
En este segundo capítulo, antes de describir en profundidad en qué consistirá el pro-
blema a analizar y tratar de resolver, se explicarán someramente conceptos básicos de
economía, nanzas y matemáticas para entender mejor los capítulos posteriores.
En primer lugar se responderá brevemente a la cuestión de qué es el riesgo, cómo
se mide y cómo se clasica y por qué es importante gestionarlo adecuadamente en una
entidad nanciera.
A continuación se explicará qué son los productos derivados nancieros, la tipología
más habitual de los mismos, su origen y evolución, dónde se negocian y su utilidad.
Por último se repasarán brevemente las matemáticas fundamentales que dan soporte
a las teorías de valoración de productos nancieros derivados y que sirven para entender
mejor ciertos conceptos que se abordarán al resolver el problema en cuestión objeto de
este Trabajo de Fin de Máster.
2.1. Riesgo
La Real Academia Española (RAE), en la 23a
edición de su Diccionario de la lengua
española (DLE), dene el riesgo como la contingencia o proximidad de un daño.
Esta denición está incompleta para explicar alguno de los conceptos que se mencio-
narán en capítulos posteriores ya que riesgo y probabilidad están íntimamente ligados.
Por lo tanto, de una manera más detallada, se puede denir el riesgo como la probabilidad
de que surja un evento adverso que acarree consigo ciertas consecuencias desfavorables.
En la industria, y en particular en la industria bancaria que es la que atañe a este
Trabajo de Fin de Máster, el riesgo se dene como la probabilidad de que los resultados
nancieros sean mayores (pérdidas) o menores (ganancias) de los esperados.
La existencia del riesgo está motivada por la incertidumbre en los mercados nancieros.
Y en general, el riesgo, que no está necesariamente relacionado con el tamaño de la pérdida
potencial, no se puede evaluar de forma completa ya que es imposible de medir de forma
controlada y precisa, aunque existen técnicas y herramientas para gestionarlo ecazmente.
La gestión de riesgos incluye la secuencia de actividades destinadas a reducir o eliminar
el potencial para incurrir en pérdidas esperadas y gestionar la variabilidad inesperada de
los costes. Esta gestión de riesgos implica una compensación entre riesgo y rendimiento.
5
26. 6 Capítulo 2. Conceptos previos
Es decir, es importante conocer cuánto riesgo adicional estará dispuesto a asumir una
entidad para generar ganancias adicionales.
Existe toda una teoría sobre como las instituciones nancieras gestionan ecazmente
el riesgo, la cual está perfectamente explicada en muchos textos, como por ejemplo [32].
El proceso de gestión de riesgos involucra los siguientes pasos:
1. Identicar los riesgos.
2. Cuanticar y estimar la exposición al riesgo o determinar métodos apropiados para
transferir estos riesgos.
3. Evaluar los efectos de la exposición al riesgo o evaluar los costes y benecios de los
métodos de transferencia.
4. Desarrollar una estrategia de mitigación del riesgo.
5. Evaluar la ecacia de la estrategia y redenirla si fuera necesario.
Aunque el riesgo no se pueda medir de forma controlada y precisa, existen una serie
de herramientas para medirlo y gestionar ecazmente en la medida de lo posible. Son las
siguientes:
Medidas cuantitativas:
• Valor en riesgo (Value at Risk o VaR): mide el monto de una pérdida y su
probabilidad de ocurrencia. Técnicamente es la máxima perdida probable en
un intervalo de tiempo determinado y para un nivel de conanza dado.
Es una medida útil para posiciones líquidas operando en condiciones de merca-
do normales dentro de un periodo corto de tiempo. Es menos útil y potencial-
mente peligroso cuando se intenta medir el riesgo en condiciones no normales,
posiciones ilíquidas o en largos periodos de tiempo.
• Capital económico: se reere a mantener sucientes reservas líquidas para cu-
brir una potencial pérdida.
Evaluación cualitativa:
• Análisis de escenarios: tiene en cuenta factores de riesgo potenciales con incer-
tidumbre que no suelen ser cuanticables.
• Stress testing: es una forma particular de análisis de escenarios que exami-
na el resultado nanciero basado en un stress dado en la entidad. Examina
situaciones de crisis.
Gestión de riesgos empresariales (Enterprise Risk Management o ERM): adopta
un enfoque integrado de gestión de riesgos dentro de una empresa haciendo uso de
medidas como capital económico y stress testing. Dentro del marco ERM, la entidad
y sus directores están de acuerdo en los límites de exposición al riesgo.
Las perdidas asociadas al riesgo pueden ser:
27. 2.1. Riesgo 7
Esperadas: relacionadas con cuánto espera perder una entidad en el curso normal
de los negocios habituales.
Inesperadas: relacionadas con cuánto podría perder una entidad fuera del curso
normal de los negocios habituales.
El riesgo, que siempre está presente ya que es inherente a la empresa y a su actividad
y se trata de minimizar día a día en cualquier organización, se puede clasicar en:
Riesgo nanciero, el cual se divide en:
• Riesgo de crédito: derivado del incumplimiento de las obligaciones acordadas
en una transacción.
• Riesgo de mercado: derivado de la posibilidad de cambios en variables de mer-
cado tales como precios de acciones e índices, inación, tipo de interés, tipo de
cambio, etc.
• Riesgo de liquidez: asociado al incumplimiento con las obligaciones de pago a
tiempo o de hacerlo con un coste excesivo.
• Riesgo estructural: ocasionado por la gestión de las diferentes partidas del
balance (activos y pasivos).
Riesgo no nanciero, muy tenido en cuenta a partir de la crisis económica de 20081
,
se puede clasicar en:
• Riesgo operacional: asociado a la no adecuación o al fallo de los procesos, las
personas y los sistemas internos o acontecimientos externos.
• Riesgo de cumplimiento y legal: debido al incumplimiento del marco legal, las
normas internas o los requerimientos de reguladores y supervisores.
• Riesgo de modelo: relacionado con errores por decisiones fundadas principal-
mente en los resultados de modelos matemáticos, debido a errores en su con-
cepción, aplicación o utilización.
• Riesgo reputacional: asociado a la percepción de una empresa por parte de la
opinión pública, sus clientes, inversores o cualquier otra parte interesada.
• Riesgo estratégico: asociado a que el modelo de negocio de una empresa se vea
afectado.
La metodología que se desarrolla en el presente Trabajo de Fin de Máster trata de
mitigar el riesgo de modelo en la medida de lo posible; ya que como se verá en sucesivos
capítulos, se explorará una nueva metodología para calcular una magnitudes importantes
Crisis económica de 2008: también conocida como Gran Recesión, fue originada en los Estados Unidos
y tuvo alcance mundial. Entre los principales factores que se atribuyen como causas de la crisis se encuen-
tran los fallos en la regulación económica, la sobrevalorización de productos, la crisis alimentaria mundial
y energética, y la amenaza de una recesión en todo el mundo, así como una crisis crediticia-hipotecaria y
de conanza en los mercados. Una de las consecuencias fue la crisis nanciera de 2008.
28. 8 Capítulo 2. Conceptos previos
asociadas a un tipo de productos que se negocian en las entidades bancarias de todo el
mundo.
Se puede encontrar más información sobre qué es el riesgo de modelo y sobre cómo se
gestiona en, por ejemplo, [28].
2.2. Derivados nancieros
2.2.1. Denición y tipología
Un producto derivado nanciero, instrumento derivado o simplemente derivado se
puede denir como un producto nanciero cuyo valor se basa en el precio de otro activo
(asset). Una denición más completa y todo lo que se expondrá a continuación, se puede
completar con, por ejemplo, [24].
El activo del que depende este producto derivado nanciero toma el nombre de activo
subyacente. Los subyacentes utilizados pueden ser muy diferentes y se clasican en:
Acciones (stocks): activos nancieros que representan una fracción del capital de
una sociedad, convirtiendo a su tenedor en socio de la misma y otorgándole una
serie de derechos económicos y políticos, tales como el derecho a participar en los
benecios de la sociedad mediante el cobro de un dividendo, el derecho de suscripción
preferente de nuevas acciones o el derecho a voto en las Juntas Generales. Las
acciones pueden negociarse en mercados regulados o bolsas de valores.
Índices bursátiles (indices): registros estadísticos compuestos usualmente de un nú-
mero, que trata de reejar las variaciones de valor o rentabilidades promedio de
las acciones que lo componen. Generalmente, las acciones que componen el índice
tienen características comunes tales como: pertenecer a una misma bolsa de valores,
tener una capitalización bursátil similar o pertenecer a una misma industria. Los
más importantes son: Dow Jones Industrial Average, SP 500, Nasdaq 100 (Nueva
York, Estados Unidos), EURO STOXX 50 (Europa) FTSE 100 (Londres, Gran Bre-
taña), DAX 30 (Frankfurt, Alemania), CAC 40 (París, Francia), Nikkei 225 (Tokyo,
Japón), Hang Seng (Hong Kong) e Ibex 35 (Madrid, España).
Valores de renta ja (xed income): instrumentos de deuda emitidos por empresas
privadas o instituciones públicas. Se caracterizan por ofrecer una remuneración ja
al inversor, que se determina en el momento de la emisión. Los productos típicos
de renta ja son los bonos soberanos (renta ja pública) y los bonos corporativos
(renta ja privada).
Tipo de interés (interest rates): precio del dinero. Se puede denir como la suma
que se paga por obtener en préstamo una cantidad de dinero (o que se recibe por
prestarlo), expresada como porcentaje de esa cantidad. Generalmente se expresa
como un porcentaje anual.
Divisa (foreing exchange o forex ): unidad de cambio que facilita la transferencia de
bienes y servicios.
29. 2.2. Derivados nancieros 9
Materias primas (commodities): bienes que tienen un cierto valor o utilidad y un
muy bajo nivel de diferenciación o especialización. Se clasican en:
• Granos: soja, trigo, maíz, avena, cebada, etc.
• Softs: algodón, café, azúcar, cacao, etc.
• Carnes: ganado bovino, ganado porcino, etc.
• Energía: petróleo crudo, gasolina, gas natural, etanol, etc.
• Metales: oro, plata, cobre, aluminio, etc.
Los productos derivados nancieros se pueden diseñar a la carta. Ejemplos de estos
productos son:
Derivados de inación (ination): empleados para transferir el riesgo de inación2
de una contraparte a otra.
Derivados de clima (weather ): usados para reducir el riesgo asociado con condiciones
climáticas adversas o inesperadas.
Los derivados nancieros pueden combinarse con otros productos en una sola estruc-
tura dando lugar a lo que se conoce como productos estructurados. Lo productos estruc-
turados más comunes suele estar formados por un producto de renta ja y uno o más
derivados.
Las principales características de los productos derivados nancieros son las siguientes:
Su valor cambia en respuesta a los cambios de precio del activo subyacente.
Se liquidarán en una o múltiples fechas futuras.
Pueden cotizarse en mercados organizados u `OTC' (extrabursátiles u Over The
Counter ). Esta información se ampliará en la Sección 2.2.2).
Los productos derivados nancieros más comunes son:
Swaps: contratos para intercambiar efectivo (ujos) en o antes de una fecha futura
especíca basada en el valor subyacente de los tipos de cambio de divisas, bonos/ti-
pos de interés, intercambio de productos, acciones u otros activos. Los más comunes
son:
• De tipo de interés o IRS (Interest Rate Swaps).
• De divisa o CS (Currency Swaps).
• De riesgo de crédito o CDS(Credit Default Swaps).
Inación: aumento generalizado y sostenido del nivel de precios existentes en el mercado durante un
período de tiempo.
30. 10 Capítulo 2. Conceptos previos
Futuros: contratos o acuerdos que obligan a las partes contratantes a comprar o
vender un número determinado de bienes o valores (activo subyacente) en una fecha
futura y determinada, y con un precio establecido de antemano. Además, los futuros
se `marginan'; es decir, hay que poner cada día dinero por valor de la diferencia de
valoración del futuro con respecto del día anterior.
Forwards: contratos a largo plazo entre dos partes para comprar (posición larga) o
vender (posición corta) un activo a precio jado y en una fecha determinada. La
diferencia con los contratos de futuros es que los forwards se contratan en operacio-
nes fuera de mercados organizados (en operaciones `OTC'). En contraposición están
los contratos al contado (spot), en el que la transacción tiene lugar en el instante
actual.
Opciones: instrumentos nancieros que se establecen en un contrato el cual da a su
comprador el derecho, pero no la obligación, a comprar o vender bienes o valores (el
activo subyacente o underlying, que pueden ser acciones, bonos, índices bursátiles,
etc.) a un precio predeterminado (strike o precio de ejercicio), antes de o en una
fecha concreta (fecha de vencimiento o maturity).
Según los derechos que otorga la opción, éstas se clasican en:
• Opciones de compra (call options): le da al poseedor de las mismas el derecho,
pero no la obligación, de comprar algo a un precio determinado en un período
de tiempo especíco.
• Opciones de venta (put options): le da al poseedor de las mismas el derecho,
pero no la obligación, de vender algo a un precio determinado en un período
de tiempo especíco.
Según el tipo, pueden ser:
• Europeas: sólo pueden ser ejercidas en la fecha de vencimiento. Antes de esa
fecha, pueden comprarse o venderse si existe un mercado donde se negocien.
• Americanas: pueden ser ejercidas en cualquier momento entre el día de la com-
pra y el día de vencimiento, ambos inclusive, y al margen del mercado en el
que se negocien.
• Exóticas: opciones más complejas que las anteriores, entre las que destacan:
◦ Bermudas: opciones que se pueden ejercer solo en fechas especicadas.
◦ Asiáticas: opciones cuyo pago está determinado por el precio subyacente
promedio durante un período de tiempo predeterminado.
◦ Barreras: opciones que se activan o desactivan si el valor del subyacente
alcanza un cierto nivel.
◦ Binarias o digitales: opciones que proporcionan al propietario un perl de
ganancias de todo o nada.
Según el número de subyacentes, se clasican en:
31. 2.2. Derivados nancieros 11
• Opciones simples: tienen un único subyacente.
• Cestas (baskets): tienen varios subyacentes.
Warrants: título corporativo muy parecido a una opción de compra. Ofrece al consu-
midor el derecho, pero no la obligación, de comprar acciones comunes directamente
de una compañía a un precio jo por un periodo determinado.
Swaptions: son opciones sobre swaps. Es decir, los swaptions otorgan al tenedor el
derecho, pero no la obligación, de entrar en un swap en una fecha futura.
Los derivados de renta variable (equity) son una clase de derivados cuyo valor se deriva,
al menos en parte, de uno o más valores de equity subyacentes (acciones y/o índices). Los
más populares son las opciones y son éstos los productos que se emplearán principalmente
en sucesivos capítulos para analizar la bondad de la metodología desarrollada en el pre-
sente documento para calcular sensibilidades con técnicas de diferenciación algorítmica.
Figura 2.1: El mercado de derivados nancieros. Fuente: `Bank for International Settle-
ments'.
2.2.2. Breve historia de los mercados nancieros
Los derivados nancieros se han vuelto muy populares desde los años 70 del siglo
pasado aunque su origen es muy anterior.
Estos productos han existido siempre y han evolucionado a la par que evolucionaba el
comercio. Así, existen evidencias de la existencia de este tipo de productos en la antigua
32. 12 Capítulo 2. Conceptos previos
Grecia y en la Europa Medieval y Moderna. Pero los antecedentes de los actuales mercados
organizados de productos nancieros derivados hay que ir a buscarlos a Chicago. Allí
surgió en 1848 el `Chicago Board Of Trade' (CBOT), un mercado dónde se negociaban
principalmente productos agrícolas como trigo, maíz o soja. En 1898 el mismo CBOT crea
una lial para la negociación de productos agrícolas elaborados llamado `Chicago Butter
and Egg Board', que luego en 1919 pasó a denominarse `Chicago Mercantile Exchange'
(CME). A partir de 1961, el CBOT empezó a ofrecer también contratos ganaderos.
Hasta los años 60 del Siglo XX, el CME era mucho menos importante que el CBOT
pero a partir de ese momento, el primero ganó popularidad al ofrecer nuevos productos
más sosticados y atractivos. Esto hizo que el segundo reaccionase aumentando también
la complejidad de los productos que ofertaba.
Debido a la popularidad y al aumento de operaciones, el CBOT creó una lial en 1976
que empezó a negociar opciones sobre acciones, el `Chicago Board Options Exchange'
(CBOE). Esto fue motivado a que en 1973, Robert Merton hubiera publicado un artículo
en el que recogía los avances hechos por Fischer Black y Myron Scholes para determinar
la famosa ecuación con la que poder valorar este tipo de productos3
. Esta ecuación y el
modelo asociado se describirán en la Sección 3.2.
En Europa los mercados de derivados no llegan hasta 1978, año en que la Bolsa de
Ámsterdam constituye `European Options Exchange'. El resto de mercados de derivados
europeos comenzaron a crearse durante estos años 80. Así en 1982 se crea el `London Inter-
national Financial Futures Exchange' (LIFFE) y en 1986 el `Marché à Terme International
de France' (MATIF) impulsado por el Tesoro francés.
En España la reforma de los mercados de valores de 1988 permitió la creación de los
mercados de derivados, en 1988 `OM Ibérica' en Madrid y en 1989 `MEFF' en Barcelona,
que posteriormente se unirían en el `Mercado ocial de futuros y opciones nancieros en
España' (Holding MEFF), un mercado organizado regulado, controlado y supervisado por
la Comisión Nacional del Mercado de Valores y el Ministerio de Economía de España en
el que se negocian distintos derivados nancieros.
Los mercados de derivados asiáticos iniciaron su actividad en las Bolsas que ya estaban
desarrolladas, como por ejemplo en las bolsas de Osaka (1878) y Tokio (1878) las cuales
se fusionaron en 2013 dando lugar al `Japan Exchanges Group' y donde se empezaron a
negociar futuros nancieros en 1988. En 1976 se creó la `Hong Kong Futures Exchange'
(al principio denominado `Hong Kong Commodity Exchange') que comenzó a negociar
futuros nancieros en 1986. El resto de los mercados asiáticos, nacen fundamentalmente
durante los años 90 del siglo pasado y la primera década del presente siglo.
Según The Economist, a partir de junio de 2011 el mercado `OTC' de derivados as-
cendió a aproximadamente 700 billones de dólares americanos4
y el tamaño del mercado
negociado en las bolsas alcanzó un total de 83 trillones de dólares americanos5
. Sin em-
bargo, estos son valores `nocionales' y algunos economistas argumentan que este valor
exagera en gran medida el valor de mercado y el verdadero riesgo crediticio al que se
!En 1997, Robert Merton y Myron Scholes fueron galardonados con el Premio en Ciencias Económicas
en memoria de Alfred Nobel por su nuevo método para determinar el valor de las instrumentos derivados.
(Fischer Black no obtuvo el galardón puesto que había fallecido en 1995 y dicho galardón no se entrega
a título póstumo).
Un billón de dólares americanos son 1,000,000,000 dólares.
#Un billón de dólares americanos son 1,000,000,000,000 dólares.
33. 2.2. Derivados nancieros 13
enfrentan las partes involucradas. De todos modos, incluso estas cifras reducidas repre-
sentan enormes cantidades de dinero. Para tener un orden de magnitud del volumen de
dinero que mueven estos mercados, el presupuesto para el gasto total del gobierno de los
Estados Unidos durante 2012 fue de 3.5 billones de dólares americanos y el valor actual
total del mercado de valores de los Estados Unidos es de aproximadamente 23 billones de
dólares americanos. Para tener un orden de magnitud, el Producto Interno Bruto anual
mundial es aproximadamente igual a 65 billones de dólares americanos.
2.2.3. Utilidad de los productos derivados nancieros
Los productos nancieros derivados se utilizan principalmente para lo siguiente:
Cubrir o mitigar el riesgo en el subyacente, mediante la contratación de un contrato
derivado cuyo valor se mueve en la dirección opuesta a su posición subyacente y
cancela una parte o la totalidad. Por ejemplo, si queremos eliminar el riesgo sobre
un paquete de acciones que poseemos de una cierta compañía, una buena estrategia
es comprar opciones de venta sobre las mismas.
Crear capacidad de opción cuando el valor del derivado está vinculado a una condi-
ción o evento especíco. Por ejemplo, el subyacente que alcanza un nivel de precio
especíco.
Obtener exposición al subyacente cuando no es posible comerciar con el subyacente
en cuestión. Por ejemplo, en productos derivados sobre el clima.
Proporcionar apalancamiento6
, de modo que un pequeño movimiento en el valor
subyacente puede causar una gran diferencia en el valor del derivado.
Especular y obtener ganancias si el valor del activo subyacente se mueve de la
manera que se espera. Por ejemplo, si el activo subyacente se mueve en una dirección
determinada o alcanza un cierto nivel.
Obtener benecios scales. Por ejemplo, un swap de equity le permite al poseedor
del mismo recibir pagos constantes evitando pagar impuestos sobre las ganancias de
capital y manteniendo las acciones.
Para nes de arbitraje7
, permitiendo un benecio sin riesgo al operar simultánea-
mente en dos o más mercados.
Es por ello que se identican tres tipos principales de participantes o traders en los
mercados nancieros:
$Apalancamiento: en nanzas se reere a utilizar mayor capital en una inversión respecto al saldo con
el que cuenta para invertir un determinado agente económico.
%Arbitraje: en nanzas, es la práctica de aprovechar ineciencias en uno o más mercados. El ejemplo
más típico de un arbitraje es el de tomar ventaja de una diferencia de precio entre dos o más mercados
realizando una combinación de transacciones complementarias que capitalizan el desequilibrio de precios
y obteniendo así un benecio sin riesgo.
34. 14 Capítulo 2. Conceptos previos
Coberturistas (hedgers): están en una posición en la que se enfrentan al riesgo re-
lacionado con el precio de un activo. Utilizan los contratos de futuros, a plazo o de
opciones para reducir o eliminar este riesgo.
Especuladores (speculators): apuestan sobre los cambios futuros en el precio de
un activo. Los contratos de futuros, a plazo y de opciones les proporcionan apa-
lancamiento adicional; es decir, estos contratos aumentan la posibilidad tanto de
ganancias como de pérdidas en una inversión especulativa.
Arbitrajistas (arbitrageurs): están en el negocio para aprovechar la discrepancia de
precios en dos mercados diferentes. Por ejemplo, si ven que el precio de futuros de un
activo diere del precio al contado (spot price), toman posiciones de compensación
en ambos mercados para asegurar un benecio sin riesgo.
2.3. Nociones de matemáticas
En esta sección se repasan conceptos de distintas ramas de las matemáticas (análisis
real, cálculo numérico, teoría de probabilidades y cálculo estocástico) que se emplearán
en capítulos posteriores para entender ciertos conceptos, tener una visión más amplia y
poder abordar con mayor seguridad el problema en cuestión objeto de este Trabajo de
Fin de Máster.
2.3.1. Análisis matemático
En esta sección se detallan algunas deniciones básicas y algunos teoremas básicos
de análisis real, tanto en una como en varias variables, que se emplearán en capítulos
posteriores. La explicación pormenorizada y la demostración rigurosa de los mismos puede
encontrarse, por ejemplo, en [7], [8].
Denición 2.1. Dada una función real de variable real f:
f : D ⊂ R → R
x → f(x)
diremos que es derivable en un punto x0 ∈ D, si existe el límite siguiente, que denotaremos
f′
(x0):
f′
(x0) = l´ım
x→x0
f(x) − f(x0)
x − x0
El límite f′
(x0) se denomina derivada, respecto de x, de la función f en el punto x0.
Si este límite existe cuando x → x−
0 o x → x+
0 , se les llama derivada por la izquierda
o por la derecha de f en x0 o derivadas laterales de f en x0 y se representan por f′
(x−
0 )
o f′
(x+
0 ) respectivamente. Se verica que f es derivable en x0 si y solo si existen f′
(x−
0 ) y
f′
(x+
0 ) y éstas son iguales.
Si la función f : D ⊂ R → R es derivable en todos los puntos del conjunto D, se
denomina función derivada de f a la aplicación:
35. 2.3. Nociones de matemáticas 15
f′
: D ⊂ R → R
x → f′
(x)
Denición 2.2. Dadas las funciones reales de variable real f : A ⊂ R → R, derivable
en x ∈ A, con f(A) ⊆ B, g : B ⊂ R → R, derivable en y = f(x) ⊆ B; la derivada de la
función compuesta g(f(x)) = (g ◦ f)(x), también llamada regla de la cadena, es:
dg(f(x))
dx
= (g ◦ f)′
(x) = g′
(f(x))f′
(x) =
dg
df
df
dx
Denición 2.3. Dada una función real de variable vectorial f:
f : D ⊂ Rn
→ R
x → f(x)
siendo D un conjunto abierto, se llama derivada de f en un punto x0 ∈ D y respecto de
un vector no nulo u ∈ Rn
al siguiente límite, si existe y es nito:
∂f(x0)
∂u
= l´ım
λ→0
f(x0 + λu) − f(x0)
λ
Si ∥u∥ = 1, se dice que f′
u(x0) es la derivada direccional de f en x0, respecto de la
recta que pasa por x0 y está orientada por u.
Si ei es la base canónica de Rn
, a la derivada
∂f(x0)
∂ei
(para i = 1, 2, . . . , n) se la llama
derivada parcial de f en x0 y se la representa como:
∂f(x0)
∂xi
siendo xi la coordenada i-ésima de la variable genérica x ∈ D.
Si la función f : D ⊂ Rn
→ R es derivable respecto de un vector u ̸= 0 en todos los
puntos del conjunto abierto D, entonces se llama función derivada (parcial) de f respecto
a u a la aplicación:
∂f
∂u
: C ⊂ Rn
→ R
x →
∂f(x)
∂u
Denición 2.4. Sean la función vectorial de variable vectorial f y la función real de
variable vectorial g:
f : C ⊂ Rn
→ Rm
x → f(x)
36. 16 Capítulo 2. Conceptos previos
g : D ⊂ Rm
→ R
x → g(x)
denidas en sendos conjuntos abiertos C ∈ Rn
y D ∈ Rm
, siendo f(C) ⊆ D (por lo que
existe g ◦ f). Entonces, si f es diferenciable en un punto dado x respecto de xi y si g es
diferenciable en el punto y = f(x), entonces g ◦ f es derivable en x respecto de xi y su
derivada vale (regla de la cadena):
∂(g ◦ f)(x)
∂xi
=
m∑
j=1
∂g
∂fj
∂fj
∂xi
Denición 2.5. Dada una función vectorial de variable vectorial F tal que:
F : D ⊂ Rn
→ Rm
x → F(x)
siendo D un conjunto abierto, se llama matriz jacobiana J, a la matriz formada por las
derivadas parciales de la función. Es decir
J =
∂F1
∂x1
· · ·
∂F1
∂xn
...
...
...
∂Fm
∂x1
· · ·
∂Fm
∂xn
Denición 2.6. Dada una matriz jacobiana J, se dene el determinante jacobiano o
jacobiano como el determinante de la matriz jacobiana. Es decir:
det(J) =
∂F1
∂x1
· · ·
∂F1
∂xn
...
...
...
∂Fm
∂x1
· · ·
∂Fm
∂xn
Teorema 2.1. [Teorema de Taylor para una función real de variable real]. Sea una función
f tal que:
f : [a, b] ⊂ R → R
x → f(x)
Si f es una función de clase Cn
(es decir, tal que f, f′
, . . . , fn
son continuas) en el intervalo
cerrado [a, b] y si admite derivada (n + 1)-ésima en el intervalo abierto (a, b), entonces
existe algún punto λ ∈ (a, b) tal que:
f(b) =
n∑
i=0
f(i)
(a)
i!
(b − a)i
+
f(n+1)
(λ)
(n + 1)!
(b − a)n+1
37. 2.3. Nociones de matemáticas 17
Teorema 2.2. [Teorema de Taylor para una función real de variable vectorial]. Sea una
función f tal que:
f : C ⊂ Rn
→ R
x → f(x)
siendo C un conjunto abierto y sean a y b dos puntos de C tales que el segmento [a, b]
está totalmente incluido en C. Si f es de clase Cn
en todos los puntos de [a, b], entonces
existe un punto λ ∈ (a, b) tal que:
f(b) =
n−1∑
i=0
1
i!
di
f(a)(b − a) +
1
n!
dn
f(λ)(b − a)
Denición 2.7. La función de Heaviside H es una función real de variable real tal que:
H(x) =
{
0 x 0
1 x ≥ 0
Denición 2.8. La delta de Dirac δ es una distribución denida como:
∫ ∞
−∞
δ(x − a)f(x)dx = f(a)
A veces, informalmente, se expresa la delta de Dirac como el límite de una sucesión de
funciones que tiende a cero en todo punto del espacio excepto en un punto para el cual
divergiría hacia innito. Es decir:
δ(x) =
{
∞ x = 0
0 x ̸= 0
Se cumple que la derivada de la función de Heaviside está denida en el sentido de las
distribuciones es la delta de Dirac, de modo que:
d(H(x − a))
dx
= δ(x − a)
Denición 2.9. Una función real de variable real f(x) es un spline de clase Cj
en el
intervalo [a, b] si existe una partición P = {a = x0 x1 . . . xn = b} de dicho intervalo
tal que f(x) es un polinomio derivable hasta orden j en [xi, xi+1] con i = 0, 1, . . . , n − 1.
Los puntos xi se llaman nodos del spline.
2.3.2. Cálculo numérico
El cálculo numérico es la rama de las matemáticas encargada de diseñar algoritmos
para simular aproximaciones de la solución a problemas del análisis matemático.
Se distingue del cálculo simbólico en que no manipula expresiones algebraicas, sino
números. Ha cobrado especial importancia con la llegada de los ordenadores ya que éstos
38. 18 Capítulo 2. Conceptos previos
son herramientas muy útiles para realizar cálculos matemáticos extremadamente comple-
jos, pero que en última instancia operan con números binarios y operaciones matemáticas
simples.
Para ampliar la información que aquí se expone, se pueden consultar por ejemplo [10],
[14], [16].
Denición 2.10. Una diferencia nita es una expresión matemática de la forma f(x+b)
f(x + a). Si una diferencia nita se divide por b a se obtiene una expresión simi-
lar al cociente diferencial, que diere en que se emplean cantidades nitas en lugar de
innitesimales.
Las diferencias nitas se pueden relacionar con el concepto de derivada denido an-
teriormente. Para una función real de variable real, desarrollando la misma mediante el
Teorema de Taylor (y suponiendo que se cumplen las hipótesis del mismo):
f(x + h) = f(x) + f′
(x)h + O[h2
]
Siendo O[h2
] el resto de Lagrange de orden 2. Manipulando adecuadamente esta ex-
presión se obtiene lo siguiente:
f′
(x) =
f(x + h) − f(x)
h
+ O[h]
Por lo tanto, para un valor del paso8
h pequeño, el valor de la derivada de una función
en un punto se puede aproximar mediante la expresión anterior. Esta expresión se cono-
ce comúnmente como aproximación de la derivada por diferencias nitas hacia delante
(forward dierences).
Análogamente, la derivada de una función real de variable real también se puede
aproximar como:
f′
(x) =
f(x) − f(x − h)
h
+ O[h]
f′
(x) =
f(x + h) − f(x − h)
2h
+ O[h2
]
Estas expresiones son conocidas como aproximación de la derivada por diferencias
nitas hacia atrás (backward dierences) y por diferencias nitas centradas (centered
dierences), respectivamente.
Por lo tanto, truncando las expresiones anteriores, se puede aproximar el valor de la
derivada de una función real de variable real en un punto como:
f′
(x) ≈
f(x + h) − f(x)
h
f′
(x) ≈
f(x) − f(x − h)
h
A este paso también se le llama bump.
39. 2.3. Nociones de matemáticas 19
f′
(x) ≈
f(x + h) − f(x − h)
2h
Como se puede apreciar, de los tres métodos expuestos el que incurre en un menor
error de truncamiento para aproximar la derivada de una función en un punto es el método
de diferencias nitas centradas, puesto que tiene un resto de Lagrange de orden superior
al de los otros dos (diferencias hacia delante y diferencias hacia atrás).
También existen diferencias nitas para aproximar derivadas de orden superior. Por
ejemplo, para aproximar derivadas de segundo orden, se pueden obtener también esquemas
de diferencias nitas hacia delante, hacia atrás y centradas de modo que:
f′′
(x) =
f(x + 2h) − 2f(x + h) + f(x)
h2
+ O[h]
f′′
(x) =
−f(x − 2h) + 2f(x − h) − f(x)
h2
+ O[h]
f′′
(x) =
f(x + h) − 2f(x) + f(x − h)
h2
+ O[h2
]
Despreciando el error de truncamiento:
f′′
(x) ≈
f(x + 2h) − 2f(x + h) + f(x)
h2
f′′
(x) ≈
−f(x − 2h) + 2f(x − h) − f(x)
h2
f′′
(x) ≈
f(x + h) − 2f(x) + f(x − h)
h2
Como para el caso de derivadas de primer orden, de los tres métodos expuestos el que
incurre en un menor error de truncamiento para aproximar la segunda derivada de una
función en un punto vuelve a ser el método de diferencias nitas centradas, ya que tiene
un resto de Lagrange de orden superior al de los otros dos esquemas.
En el caso de querer obtener diferencias nitas de funciones reales de variable vectorial
el procedimiento es análogo.
Las expresiones para esquemas de diferencias nitas hacia delante, hacia atrás y cen-
tradas, tanto para derivadas de primer orden como para derivadas de segundo orden, son
las siguientes:
∂f
∂xi
≈
f(x1, . . . , xi + h, . . . , xn) − f(x1, . . . , xi, . . . , xn)
h
∂f
∂xi
≈
f(x1, . . . , xi, . . . , xn) − f(x1, . . . , xi − h, . . . , xn)
h
∂f
∂xi
≈
f(x1, . . . , xi + h, . . . , xn) − f(x1, . . . , xi − h, . . . , xn)
2h
40. 20 Capítulo 2. Conceptos previos
∂2
f
∂x2
i
≈
f(x1, . . . , xi + 2h, . . . , xn) − 2f(x1, . . . , xi + h, . . . , xn) + f(x1, . . . , xi, . . . , xn)
h2
∂2
f
∂x2
i
≈
−f(x1, . . . , xi − 2h, . . . , xn) + 2f(x1, . . . , xi − h, . . . , xn) − f(x1, . . . , xi, . . . , xn)
h2
∂2
f
∂x2
i
≈
f(x1, . . . , xi + h, . . . , xn) − 2f(x1, . . . , xi, . . . , xn) + f(x1, . . . , xi − h, . . . , xn)
h2
Denición 2.11. Se dice que una matriz cuadrada de elementos complejos es una matriz
hermítica si tiene la característica de ser igual a su propia traspuesta conjugada. Es decir,
dada una matriz cuadrada A se cumple que:
ai,j = aj,i
para todos los índices i y j.
Denición 2.12. Se dice que una matriz hermítica es una matriz denida positiva si
todos sus autovalores λi cumplen lo siguiente:
λi 0
Denición 2.13. Se dice que una matriz hermítica es una matriz semidenida positiva
si todos sus autovalores λi cumplen lo siguiente:
λi ≥ 0
Denición 2.14. [Factorización de Cholesky para matrices denidas positivas]. Si A es
una matriz hermítica y denida positiva, entonces A puede ser descompuesta como:
A = LLT
donde L es una matriz triangular inferior con entradas diagonales estrictamente positivas
y LT
representa la conjugada traspuesta de L. Esta factorización es única.
Denición 2.15. [Factorización de Cholesky para matrices semidenidas positivas]. Si
A es una matriz hermítica y semidenida positiva, entonces A puede ser descompuesta
como:
A = LLT
donde L es una matriz triangular inferior con entradas diagonales estrictamente positivas
y LT
representa la conjugada traspuesta de L. Esta factorización, en general, no es única.
41. 2.3. Nociones de matemáticas 21
2.3.3. Teoría de probabilidades
Tal y como se ha explicado en la Sección 2.1, probabilidad y riesgo son dos conceptos
íntimamente ligados.
La teoría de probabilidades es una rama de las matemáticas que estudia los fenómenos
aleatorios, es decir, fenómenos que se contraponen a los fenómenos deterministas, los
cuales son resultados únicos y/o previsibles de experimentos realizados bajo las mismas
condiciones determinadas. Los fenómenos aleatorios, por el contrario, son aquellos que se
obtienen de experimentos realizados, otra vez, bajo las mismas condiciones determinadas
pero como resultado posible poseen un conjunto de alternativas.
Esta ramas de las matemáticas es fundamental para entender el cálculo estocástico, el
cual se presenta en 2.3.4 y es una herramienta fundamental para la valoración de los pro-
ductos derivados nancieros. Para profundizar en el estudio de la teoría de probabilidades,
se pueden consultar por ejemplo [2], [11], [31].
Denición 2.16. Una σ-álgebra en un espacio muestral Ω es una colección F de subcon-
juntos de Ω que verica lo siguiente:
1. ∅ ∈ F, Ω ∈ F
2. Si A ∈ F ⇒ A ∈ F; con A = Ω − A
3. Si Ai ∈ F, i ∈ N, entonces:
∞∪
i=1
Ai ∈ F
∞∩
i=1
Ai ∈ F
Denición 2.17. Sea Ω un conjunto no vacío y sea F una σ-álgebra de subconjuntos
de Ω. Una medida de probabilidad P es una función que, para cada conjunto A ∈ F, le
asigna un número perteneciente al intervalo [0, 1], llamado la probabilidad de A y escrito
P(A). Se requiere que:
1. P(Ω) = 1
2. Si A1, A2, . . . es una secuencia de conjuntos disjuntos en F, entonces:
P
( ∞∪
n=1
An
)
=
∞∑
n=1
P (An)
La terna (Ω, F, P) se llama espacio de probabilidad.
Denición 2.18. La σ-álgebra de Borel de Rn
se dene como la menor σ-álgebra que
contiene los subconjuntos de la forma {x ∈ Rn
: xi a} para algún a ∈ R y algún 1 ≤
i ≤ n.
Denición 2.19. Sean Ft con t ≥ 0; y F una colección de σ-álgebras en Ω con Ft ⊆ F.
La colección Ft, t ≥ 0 es una ltración cuando verica que Fs ⊆ Ft; 0 ≤ s ≤ t.
42. 22 Capítulo 2. Conceptos previos
Denición 2.20. Dado un espacio de probabilidad (Ω, F, P), una variable aleatoria (v.a.)
X es una función X : Ω → Rn
tal que f−1
(B) está en la σ-álgebra F ∀B en la σ-álgebra
de Borel.
Es decir, una variable aleatoria X es una función denida en el espacio de probabilidad
(Ω, F, P), asociado a un experimento aleatorio.
Denición 2.21. Se llama rango de una variable aleatoria X (y se denotará como RX)
a la imagen o rango de la función X, es decir, al conjunto de los valores reales que ésta
puede tomar, según la aplicación X.
RX = {x ∈ Rn
| ∃ ω ∈ Ω : X(ω) = x}
Las variables aleatorias se clasican usualmente como:
Variable aleatoria discreta: una v.a. es discreta si su recorrido es un conjunto dis-
creto.
Variable aleatoria continua: una v.a. es continua si su recorrido es un conjunto no
numerable.
En el presente Trabajo de Fin de Máster, las variables aleatorias continuas son las
únicas con las que se trabajará puesto que son las variables empleadas para modelizar
ciertos comportamientos de especial interés en matemática nanciera.
Denición 2.22. La función de distribución de probabilidad de una v.a. X o función de
distribución de X es la función FX(x), que asigna a cada evento denido sobre X una
probabilidad dada por la siguiente expresión:
FX(x) = P(X ≤ x) = P{ω ∈ Ω|X(ω) ≤ x}
La función de distribución de probabilidad tiene las siguientes propiedades:
1. l´ım
x→−∞
F(x) = 0 y l´ım
x→∞
F(x) = 1
2. Es continua por la derecha.
3. Es monótona no decreciente.
Denición 2.23. La función de densidad de probabilidad es la derivada (si existe) de la
función de distribución de probabilidad:
fX(x) =
dFX(x)
dx
FX(x) =
∫ x
−∞
fX(u)du
siendo FX(x) la función de distribución de probabilidad de la variable aleatoria X.
43. 2.3. Nociones de matemáticas 23
Denición 2.24. La esperanza matemática de una variable aleatoria se dene como la
siguiente integral:
E [X] =
∫
Ω
XdP
Para una variable aleatoria continua que tenga densidad:
E [X] =
∫ ∞
−∞
xf(x)dx
Denición 2.25. La varianza de una variable aleatoria se dene como:
σ2
X = E
[
(X − E [X])2
]
Para una variable aleatoria continua que tenga densidad:
σ2
X =
∫ ∞
−∞
(x − µX)2
f(x)dx
siendo µX = E [X].
Denición 2.26. La desviación típica de una variable aleatoria se dene como:
σX =
√
σ2
X
Denición 2.27. La distribución uniforme es una distribución de probabilidad continua
cuya función de distribución asociada es:
Ua,b(x) =
0 x a
x − a
b − a
a ≤ x b
1 x ≥ b
Denición 2.28. La distribución normal o distribución Gaussiana es una distribución de
probabilidad continua cuya función de distribución asociada es:
FX(x) =
1
σ
√
2π
∫ x
−∞
exp
(
−
(u − µ)2
2σ2
)
du, x ∈ R
siendo la media µ y la varianza σ2
.
La función de distribución normal estándar es aquella función de distribución normal
donde µ = 0 y σ = 1. Se suele denotar como Φ(x).
Denición 2.29. La distribución lognormal es una distribución de probabilidad conti-
nua cuyo logaritmo neperiano está normalmente distribuido. Es decir, si Y es una variable
aleatoria con una distribución normal, entonces X = exp(Y ) tiene una distribución log-
normal.
44. 24 Capítulo 2. Conceptos previos
Su función de distribución asociada es:
FX(x) =
1
σ
√
2π
∫ x
−∞
exp
(
−(ln(u)−µ)2
2σ2
)
x
du, x ∈ R+
siendo µ la media y σ la desviación típica del logaritmo neperiano de la variable aleatoria
Y .
Denición 2.30. La función de distribución de probabilidad de una v.a. multidimen-
sional continua X es la función FX(x), que asigna a cada evento denido sobre X una
probabilidad dada por la siguiente expresión:
FX(x) = P(X1 ≤ x1, . . . , Xn ≤ xn) = P{ω ∈ Ω|X(ω) ≤ x}
Denición 2.31. La función de densidad de probabilidad es la derivada (si existe) de la
función de distribución de probabilidad:
FX(x) =
∫ x1
−∞
· · ·
∫ xn
−∞
fX(u)du1 · · · dun
siendo FX(x) la función de distribución de probabilidad de la variable aleatoria multidi-
mensional X.
Denición 2.32. La esperanza matemática de una variable aleatoria multidimensional
se dene como:
E [X] = (E [X1] , . . . , E [Xn])
Denición 2.33. Dadas dos variables aleatorias Xi, Xj la covarianza entre ambas se
dene como:
σij = E
[
(Xi − µXi
)
(
Xj − µXj
)]
= E [XiXj] − µXi
µXj
A partir de la denición, se verica que σii = σ2
Xi
Denición 2.34. Dadas dos variables aleatorias Xi, Xj el coeciente de correlación de
Pearson entre ambas se dene como:
ρij =
σij
σiσj
Es fácil de comprobar que ρij ∈ [−1, 1]. Además, a diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las variables. Es decir,
es una magnitud adimensional.
Denición 2.35. La distribución normal multivariante con esperanza matemática µ y
matriz de covarianza Σ es una distribución de probabilidad continua cuya función de
densidad asociada es:
fX(x) =
1
(2π)n/2
(det (Σ))1/2
exp
{
−
1
2
(x − µ) Σ−1
(x − µ)t
}
, x ∈ Rn
45. 2.3. Nociones de matemáticas 25
Con:
µ = (µ1 . . . µn)
Σ =
σ1 σ12 σ13 · · · σ1n
σ21 σ2 σ13 · · · σ2n
σ31 σ32 σ3 · · · σ3n
...
...
...
...
...
σn1 σn2 σn3 · · · σn
Teorema 2.3. [Ley débil de los grandes números]. Si X1, X2, X3, . . . es una sucesión
innita de variables aleatorias independientes que tienen el mismo valor esperado µ y
varianza σ2
, entonces el promedio:
Xn =
1
n
n∑
i=1
Xi
converge en probabilidad a µ. Es decir, para cualquier número positivo ϵ se cumple lo
siguiente:
l´ım
n→∞
P
(
Xn − µ ϵ
)
= 1
Teorema 2.4. [Ley fuerte de los grandes números]. Si X1, X2, X3, . . . es una sucesión
innita de variables aleatorias independientes e idénticamente distribuidas tal que E (|Xi|)
y con el mismo valor esperado µ, entonces:
P
(
l´ım
n→∞
Xn = µ
)
= 1
Teorema 2.5. [Teorema Central del Límite]. Sea X1, X2, . . . , Xn un conjunto de n varia-
bles aleatorias, independientes e idénticamente distribuidas de una distribución con media
µ y varianza σ2
̸= 0 y nita. Entonces, si n es sucientemente grande, la variable aleatoria
Zn =
Xn − µ
σ/
√
n
converge en distribución a una distribución normal estándar. Es decir,
l´ım
n→∞
Pr (Zn ≤ z) = N(z)
2.3.4. Cálculo estocástico
En matemática nanciera es de gran importancia el estudio y la comprensión del
denominado cálculo estocástico. El cálculo estocástico es la rama de las matemáticas que
opera con procesos estocásticos y que es de gran utilidad para modelar sistemas en los
que existe alguna fuente de aleatoriedad, como por ejemplo la valoración de los productos
derivados nancieros.
46. 26 Capítulo 2. Conceptos previos
Por lo tanto, se dedicará esta sección a dar unas pinceladas básicas de conceptos
tratados en esta disciplina del cálculo para entender mejor el resto de secciones del presente
Trabajo de Fin de Máster. Para ampliar la información recogida a continuación, se puede
consultar, por ejemplo, [11], [29], [34], [35].
Denición 2.36. Un proceso estocástico X es una colección de variables aleatorias
{Xt, t ∈ I}, denidas sobre un mismo espacio muestral Ω.
Si I es numerable entonces X se llama proceso estocástico en tiempo discreto.
Si I es un intervalo entonces X se llama proceso estocástico en tiempo continuo.
Además, se puede demostrar que para cada t ∈ I, Xt = {Xt(ω), ω ∈ Ω} es una variable
aleatoria; y que para cada suceso ω ∈ Ω, Xω = {Xt(ω), t ∈ I} es un función del tiempo
(que se conoce como camino aleatorio o trayectoria del proceso X).
Denición 2.37. Un proceso estocástico Gaussiano X es una colección de variables
aleatorias tal que todas las Xt son Gaussianas.
Denición 2.38. Un movimiento Browniano o proceso de Wiener W = Wt, con t ≥ 0,
es un proceso estocástico en tiempo continuo que verica lo siguiente:
1. W0 = 0
2. Tiene incrementos independientes estacionarios. Es decir, para 0 = t0 t1 . . .
tm, los incrementos Wt1 − Wt0 , Wt2 − Wt1 , . . . , Wtm − Wtm−1 son variables aleatorias
independientes.
3. Wt −Ws ∼ N(0, t−s) (para cada 0 ≤ s ≤ t), siendo N(µ, σ2
) la distribución normal
cuya esperanza matemática es µ y cuya varianza es σ2
.
A partir de la primera y de la tercera propiedad se demuestra que: Wt ∼ N(0, t).
Además, se cumple que:
1. E [Wt] = 0.
2. σt,s = min(t, s).
3. dWtdWt = dt
Denición 2.39. Sea Ft, t ≥ 0 una colección de σ-álgebras en Ω. La colección Ft, t ≥ 0
es una ltración cuando verica que Fs ⊂ Ft, 0 ≤ s ≤ t.
Denición 2.40. Un proceso estocástico X = (Xt, t ≥ 0) está adaptado a la ltración
Ft, t ≥ 0 si para cada t ≥ 0, Xt es una variable aleatoria Ft-medible.
Denición 2.41. Un proceso estocástico X = (Xt, t ≥ 0) es una martingala en tiempo
continuo con respecto de la ltración Ft, t ≥ 0 si se verica:
1. E(|Xt|) ∞, t ≥ 0.
47. 2.3. Nociones de matemáticas 27
2. X está adaptado a F.
3. E(Xt|Fs) = Xs.
Se puede demostrar que el movimiento Browniano es una martingala. Es decir, dado un
movimiento Browniano Wt y dada una ltración Ft, t ≥ 0, E(Wt|Fs) = Ws, con 0 ≤ s ≤ t.
Denición 2.42. Sea P una partición de [a, b] y sean f y g dos funciones acotadas
denidas en [a, b]. Una suma de la forma:
S(f, g, P) =
n∑
i=1
f(ti) [(g(xi) − g(xi−1)]
donde ti ∈ [xi−1, xi], ∀i = 1, 2, . . . , n se denomina suma de Riemann-Stieltjes de f con
respecto a g sobre la partición P.
Denición 2.43. Supongamos que f y g son dos funciones reales denidas sobre el
intervalo cerrado y acotado [a, b] ⊆ R. Decimos que la función f es Riemann-Stieltjes
integrable respecto de la función g sobre el intervalo [a, b], si para algún número I ∈ R se
tiene que ∀ϵ 0, ∃δ = δ(ϵ) 0/|S(f, g, P) − I| ϵ, ∀P ∈ P[a, b]/||P|| δ, ti ∈ [xi−1, xi].
En este caso decimos que I es la integral de Riemann-Stieltjes de f respecto de g sobre
[a, b]:
I =
∫ b
a
f(x)dg(x)
Si g(x) es diferenciable, se obtiene la integral de Riemann:
I =
∫ b
a
f(x)g′
(x)dx
Denición 2.44. Dados Wt, t ≥ 0 un movimiento Browniano y ∆(t) un proceso estocás-
tico adaptado a la ltración F(t) generada por Wt; se denota la Integral de Itô9
como:
IT =
∫ T
0
∆(t)dWt
La denición formal de la Integral de Itô para un integrando general consiste en un
argumento de paso al límite a partir de la denición para integrandos simples. Para un
integrando simple, es decir, un proceso estocástico constante en cada subintervalo de una
partición P = {0, t1, t2, . . . , T} de [0, T] la integral se dene como:
It =
k−1∑
j=0
∆(tj) [W(tj+1) − W(tj)] + ∆(tk) [W(t) − W(tk)]
Es una generalización de la integral de Riemann-Stieltjes en análisis en la que los
integrandos y los integradores son ahora procesos estocásticos. Esta integral cumple, entre
otras, las siguientes propiedades:
'La integral de Itô es el concepto central del cálculo de Itô, el cual extiende los métodos de cálculo a
procesos estocásticos.
48. 28 Capítulo 2. Conceptos previos
1. It es martingala respecto de la ltración F(t) generada por Wt.
2. E(It) = 0.
3. Propiedad de isometría: E
[(∫ t
0
∆(u)dWu
)2
]
=
∫ t
0
E(∆2
(u))du
Se puede demostrar que: dItdIt = ∆2
(t)dt
Denición 2.45. El Lema de Itô es una identidad empleada en el cálculo de Itô para
encontrar el diferencial de una función dependiente del tiempo y de un proceso estocástico.
Es el equivalente estocástico a la regla de la cadena del cálculo diferencial.
Dados Wt, t ≥ 0 un movimiento Browniano y una función f, se puede demostrar
empleando el Teorema de Taylor y despreciando los términos de orden superior que:
df(Wt) = f′
(Wt)dWt +
1
2
f′′
(Wt)dt
df(t, Wt) = ft(t, Wt)dt + fx(t, Wt)dWt +
1
2
fxx(t, Wt)dt
Para un proceso estocástico Xt general:
df(t, Xt) = ft(t, Xt)dt + fx(t, Xt)dXt +
1
2
fxx(t, Xt)dXtdXt
Denición 2.46. Una ecuación diferencial estocástica (stochastic dierential equation o
SDE) es una ecuación de la forma:
dXt = µ(t, Xt)dt + σ(t, Xt)dWt
Siendo:
µ(t, Xt): la deriva (drift).
σ(t, Xt): la difusión (diusion).
Además de la ecuación, hay una condición inicial de al forma Xu = x
Resolver esta ecuación diferencial estocástica consiste en hallar un proceso estocástico
Xv, con v ≥ u tal que:
Xu = x
Xv = Xu +
∫ v
u
µ(t, Xt)dt +
∫ v
u
σ(t, Xt)dWt
Denición 2.47. Dados i activos, se dene un modelo de mercado (market model) como:
dβt = rtβtdt
dSi
t = µ(t, Si
t)dt + σ(t, Si
t)dWi
t
dWi
t dWj
t = ρijdt
siendo:
49. 2.3. Nociones de matemáticas 29
β: una cuenta corriente.
rt: el tipo de interés.
Denición 2.48. Sea Ω un conjunto no vacío y sea F una σ-álgebra de subconjuntos de
Ω. Dos medidas de probabilidad P y P∗
en (Ω, F) se dice que son equivalentes si:
P(A) = 0 ⇔ P∗
(A) = 0
para todos los conjuntos A ∈ F.
Teorema 2.6. [Teorema de Girsanov]. Sea W = Wt, con t ≥ 0 un movimiento Browniano
en un espacio de probabilidad (Ω, F, P), y sea Ft con t ≥ 0 una ltración para dicho
movimiento Browniano. Dado Θt un proceso adaptado y deniendo:
Zt = exp
{
−
∫ t
0
ΘtdWu −
1
2
∫ t
0
Θ2
t du
}
W∗
t = Wt +
∫ t
0
Θtdu
y asumiendo que:
E
[∫ t
0
Θ2
t Z2
udu
]
+∞
Entonces el proceso W∗
t es un movimiento Browniano bajo la medida de probabilidad
equivalente P∗
denida por P∗
(A) = E[ZIA].
Denición 2.49. Dado el siguiente modelo de mercado:
dDt = −rtDtdt
dSt = µtStdt + σtStdWt
tal que:
Dt =
β0
βt
El precio del activo descontado está dado por:
d (DtSt) = σtDtSt (Θtdt + dWt)
donde se dene el precio de mercado de riesgo como:
Θt =
µt − rt
σt
A partir del Teorema de Girsanov, el precio del activo descontado se puede expresar como:
d (DtSt) = σtDtStdW∗
t
siendo P∗
la medida libre de riesgo (risk neutral measure).
50. 30 Capítulo 2. Conceptos previos
Una consecuencia importante es que:
d (DtSt) = E∗
[DT ST |Ft]
Nota importante: en el presente Trabajo de Fin de Máster se trabajará únicamente
con la medida de probabilidad libre de riesgo para estimar los precios descontados de los
activos.
Denición 2.50. Un arbitraje es un proceso γt representando el valor de una cartera que
satisface γ0 = 0 y que para T 0:
P(γT ≥ 0) = 1, P(γT 0) 0
Teorema 2.7. [Primer Teorema Fundamental de Valoración de Activos]. Si un mercado
tiene una medida de probabilidad libre de riesgo entonces no admite arbitraje.
Denición 2.51. Un mercado se dice completo si cada derivado puede ser replicado con
una cartera formada por los activos y la cuenta corriente.
Teorema 2.8. [Segundo Teorema Fundamental de Valoración de Activos]. Dado un mer-
cado que tiene una medida de probabilidad libre de riesgo, dicho mercado es completo si
y solo si la probabilidad libre de riesgo es única.
De estos resultados se deduce que dada una medida libre de riesgo, el valor descontado
de una cartera es una martingala respecto de dicha medida. Por lo tanto, si el valor V de
un derivado a tiempo t puede replicarse, se cumplirá:
V (t, x) = E [D(t, T, X)V (T, X)|Ft]
Teorema 2.9. [Teorema de Feynman-Kac]. Dada la siguiente ecuación en derivadas par-
ciales:
∂V
∂t
+ µ(t, x)
∂V
∂x
+
1
2
σ2
(t, x)
∂2
V
∂x2
− r(x, t)V = 0
La función:
V (t, x) = E [D(t, T, X)V (T, X)|Ft]
con:
dXt = µ(t, Xt)dt + σ(t, Xt)dWt
es solución de la ecuación en derivadas parciales.
Siendo:
V (T, x) la condición nal, o en términos nancieros, la función de payo del pro-
ducto derivado nanciero que representa como se comporta el producto a fecha de
vencimiento.
D(t, T, x) = e−
∫ T
t r(u,x)du
el descuento que está relacionado con el valor temporal del
dinero.
51. Capítulo 3
Valoración de opciones nancieras
En este capítulo se presentan los modelos de valoración de opciones nancieras de
equity a partir de los cuales se han desarrollado los algoritmos descritos en el presente
Trabajo de Fin de Máster. Estos productos son, esencialmente, los únicos derivados -
nancieros que se han empleado para analizar la idoneidad del empleo de las técnicas de
diferenciación algorítmica para el cálculo de sensibilidades.
Se empieza describiendo qué inputs son necesarios para construir un modelo de valo-
ración.
A continuación se describen los fundamentos del modelo de Black-Scholes, el primer
modelo empleado en la valoración de opciones nancieras.
Luego se explica detalladamente qué son los modelos de volatilidad local, unos modelos
más sosticados que el anterior ampliamente utilizados en la industria bancaria.
Posteriormente se describen los modelos de volatilidad estocástica y se explica por qué
no se han implementado en este trabajo.
Por último se denen las sensibilidades o griegas, unas magnitudes muy importantes
que se emplean fundamentalmente para operaciones de cobertura y gestión de riesgos.
Éstas se desean calcular en el presente Trabajo de Fin de Máster con una novedosa
técnica como se verá en sucesivos capítulos.
3.1. Inputs
En esta sección se denen las magnitudes usuales en economía y nanzas que alimentan
los modelos para valorar, entre otros, los productos denidos en la Sección 2.2.1. Para más
información, se puede consultar por ejemplo [37].
Valor del activo subyacente (spot): valor determinista que toma el activo subyacente
en un instante determinado.
Tipo de interés de descuento (discount rate): coste de capital que se aplica para
determinar el valor actual de un pago futuro.
Volatilidad (volatility): es una medida de dispersión de una variable estocástica. Se
clasica en:
31
52. 32 Capítulo 3. Valoración de opciones nancieras
• Volatilidad histórica: se reere a la volatilidad de un instrumento nanciero
durante un período especíco pero con la última observación en una fecha
pasada.
• Volatilidad implícita: es la volatilidad que hace que la fórmula de Black-Scholes
(más información en la Sección 3.2) estime el precio cotizado o precio de mer-
cado de una opción nanciera. Ésta a su vez puede ser:
◦ Volatilidad determinista: cuando en la volatilidad no se producen cambios
o si se producen se pueden estimar sin ningún error de medida.
◦ Volatilidad local: es la volatilidad que hace que un modelo valore bien
todo el conjunto de instrumentos vanilla de distintos strikes y distintos
vencimientos (más información en la Sección 3.3).
◦ Volatilidad estocástica: cuando la volatilidad de los diferentes activos cam-
bia a lo largo del tiempo de forma incierta (ver Sección 3.4).
La volatilidad es una magnitud muy importante, puesto que se utilizará como una
medida del riesgo del activo: cuanto más volátil sea un activo, mayor riesgo tendrá. Ade-
más, es la magnitud con la que suelen operar los traders de equity ya que las opciones
nancieras cotizan en volatilidad y no en precio. Esto es así porque la comparación de
opciones diferentes entre sí es más sencilla.
La gráca de la volatilidad implícita de una opción en función de su strike se conoce
como curva smile. Este fenómeno apareció a raíz del lunes negro de 19871
y está moti-
vado porque las técnicas existentes en esa época no modelizaban adecuadamente ciertas
fenómenos de mercado.
Sobre las causas del smile hay múltiples teorías, que se pueden consultar en, por
ejemplo, [33]. Las más extendidas son:
Es un fenómeno nanciero que se produce por la sobreprotección en strikes bajos.
Puesto que el mercado cotiza con el modelo de Black-Scholes, es complicado ajustar
los retornos a una normal.
Con frecuencia en el mercado se observa una estructura temporal de la volatilidad.
En este caso, la volatilidad implícita de una opción depende de su vida. Por lo que si se
combinan la estructura temporal y el smile de volatilidad, se obtiene lo que se conoce
como supercie de la volatilidad (más información en [24]).
3.2. Modelo de Black-Scholes
Tal y como se ha comentado en la Sección 2.2.2, Robert Merton publicó en 1973 un
artículo en el que detallaba los avances hechos por Fischer Black y Myron Scholes para
determinar una ecuación general con la que poder valorar derivados nancieros. Por lo
Lunes negro de 1987: el lunes 19 de octubre de 1987 los mercados de valores de todo el mundo se
desplomaron en un intervalo de tiempo muy breve. Fue el segundo mayor derrumbe porcentual sucedido
en un mismo día en la historia de los mercados de valores.
53. 3.2. Modelo de Black-Scholes 33
tanto, el modelo de Black-Scholes es un modelo matemático para valorar el precio de una
opción nanciera.
Este modelo destaca ya que ha sido el primero que independiza el precio de la opción
de las expectativas que tengan los distintos agentes de mercado sobre el comportamiento
futuro de los distintos subyacentes. Es decir, demuestra la existencia de un precio matemá-
ticamente objetivo replicando su valor mediante una cartera autonanciada cuyo precio
se conoce en todo momento (más información en [37], por ejemplo).
3.2.1. Ecuación de Black-Scholes
Para obtener la ecuación de Black-Scholes se adoptan las siguientes hipótesis previas:
El tipo de interés de descuento r y la volatilidad σ son funciones deterministas y
constantes.
No se consideran ni costes de transacción ni scales.
No existe oportunidad de arbitraje.
Se pueden negociar cantidades no enteras de activos nancieros, aunque no se po-
sean, en tiempo continuo.
Las opciones son europeas y el subyacente (la acción en este caso) no paga dividendos
en el horizonte de valoración.
El modelo de Black-Scholes asume que el mercado consiste en un modelo de mercado
compuesto por al menos un activo S con riesgo y una cuenta corriente sin riesgo.
El valor del activo a tiempo t, St, verica la siguiente ecuación diferencial estocástica:
dSt = rStdt + σStdWt
Siendo:
µ: la deriva (es un valor constante).
σ: la volatilidad (es un valor constante).
Wt: el movimiento Browniano asociado.
Puede demostrarse empleando la fórmula de Itô-Doeblin (ver [35]) que la solución de
la anterior ecuación diferencial estocástica es:
St = S0exp
((
r −
1
2
σ2
t
)
+ σWt
)
Siendo:
S0: el precio del activo en el momento actual o precio spot.
54. 34 Capítulo 3. Valoración de opciones nancieras
Para obtener la ecuación diferencial que gobierna el modelo, la idea clave es cubrir
la opción comprando y vendiendo el activo subyacente de la manera correcta para, como
consecuencia, eliminar el riesgo (una demostración completa se puede encontrar en [37]).
La ecuación de Black-Scholes es la siguiente:
∂V
∂t
+
1
2
σ2
S2 ∂2
V
∂S2
+ rS
∂V
∂S
− rV = 0
Esta ecuación estará denida en D = {(S, t) : S 0, t ∈ [0, T)}.
En el caso particular de una opción europea, para que el problema esté bien formulado
desde el punto de vista matemático, habrá que imponer una condición nal a fecha de
vencimiento T. Es decir, habrá que denir su función de payo (que es única para cada
producto), la cual es la siguiente:
V (S, T) =
max(S − K, 0) opción call
max(K − S, 0) opción put
Siendo:
K: el valor del strike.
Para una opción digital cash-or-nothing europea, para que el problema esté bien for-
mulado desde el punto de vista matemático, habrá que imponer la siguiente condición
nal a fecha de vencimiento T:
V (S, T) =
BH(S − K) opción call digital cash-or-nothing
BH(K − S) opción put digital cash-or-nothing
Siendo:
H: la función de Heaviside.
B: un cupón jo denido por contrato.
A pesar de que el modelo de Black-Scholes ofrece una solución analítica para calcular
el precio de ciertos derivados nancieros (en la Sección 7.1 se detalla el caso particular de
una opción call europea), tiene las siguientes limitaciones:
Como todo modelo, es una adaptación a la realidad, por lo que no representa esta
realidad de forma perfecta.
A priori, el modelo no tiene en cuenta la posibilidad de que la acción pague divi-
dendos2
, aunque esto modelo se puede adaptar fácilmente para tenerlos en cuenta.
Dividendo: es la parte del benecio social que se reparte entre los accionistas de una sociedad. Junto
con las posibles plusvalías obtenidas por la revalorización, es la principal fuente de rentabilidad de las
acciones, y constituye el derecho económico por excelencia de sus titulares. Su importe debe ser aprobado
por la Junta General de Accionistas de la sociedad, a propuesta del consejo de administración.
55. 3.2. Modelo de Black-Scholes 35
Debido a la existencia del smile, no se pueden valorar opciones correctamente con
un modelo de volatilidad constante como el de Black-Scholes.
En general, el tipo de interés de descuento r cambia con el tiempo. El modelo de
Black-Scholes no contempla esto.
3.2.2. Ecuación de Black-Scholes para varios subyacentes
En el caso de que una opción nanciera dependa de varios subyacentes, la teoría
presentada anteriormente puede ser adaptada teniendo en cuenta que ahora los activos
estarán correlados.
Dados n activos con i = 1, . . . , n, sus valores a tiempo t, Si
t, verican la siguiente
ecuación diferencial estocástica:
dSi
t = riSi
tdt + σiSi
tdWi
t
Siendo:
ri: el tipo de interés de descuento de cada activo i.
σi: la volatilidad de cada activo i.
Wi
t : el movimiento Browniano asociado a cada activo i.
Además, se cumple que:
dWi
t dWj
t = ρijdt
Siendo:
ρij: el coeciente de correlación instantánea entre los movimientos Brownianos Wi
t ,
Wj
t .
Como en el caso de un único activo subyacente (ver Sección 3.2.1), puede demostrarse
a partir de la fórmula de Itô-Doeblin que ecuación diferencial estocástica asociada para
una opción con varios activos subyacentes es:
dV =
(
∂V
∂t
+
1
2
n∑
i=1
n∑
j=1
σiσjρijSiSj
∂2
V
∂Si∂Sj
)
dt +
n∑
i=1
∂V
∂Si
dSi
Esta ecuación estará denida en D = {(Si, t) : Si 0, ∀i = 1, . . . , n; t ∈ [0, T)}.
En el caso particular de una opción europea, para que el problema esté bien formulado
desde el punto de vista matemático, habrá que imponer una función de payo para tener
así una condición de contorno a fecha de vencimiento.
56. 36 Capítulo 3. Valoración de opciones nancieras
3.3. Modelos de volatilidad local
Tal y como se ha visto en la Sección 3.2, el modelo de Black-Scholes es un modelo con
unas ciertas limitaciones.
Una de ellas es que en este modelo la volatilidad es un valor constante y es el único
parámetro disponible para replicar los precios de las opciones nancieras. En esencia,
la ecuación de Black-Scholes es una herramienta para transformar precio en volatilidad
y viceversa. Esto tiene unas limitaciones que se pueden ver claramente con el siguiente
ejemplo.
Dada una volatilidad σ, con el modelo de Black-Scholes se puede obtener el precio una
opción call VBS a cualquier vencimiento T y para cualquier strike K.
Para determinar la volatilidad σ se procede de forma inversa. Es decir, si se dispone
del precio de mercado Vmarket de una opción call con vencimiento T y strike K, se puede
calcular la volatilidad despejando en la siguiente igualdad:
VBS(K, T, σ) = Vmarket(K, T)
El problema se complica cuando existen dos opciones call con vencimiento T1 y T2 y
strike K. En este caso la volatilidad se calcula despejando de las siguientes igualdades:
VBS(K, T1, σ) = Vmarket(K, T1)
VBS(K, T2, σ) = Vmarket(K, T2)
En general, no existe un único valor de volatilidad σ que cumpla a la vez las dos
igualdades anteriores, por lo que el modelo de Black-Scholes no es adecuado para calibrar
esta volatilidad de mercado.
Dada una opción nanciera, la volatilidad implícita σimp(K, T) es la volatilidad que
hace que la fórmula de Black-Scholes estime el precio cotizado de la opción. Es decir:
VBS(K, T, σimp(K, T)) = Vmarket(K, T)
Existen muchos modelos que tratan de hallar la supercie de volatilidades implícita.
Pero sin duda, algunos de los más importantes son los modelos de volatilidad local. Éstos
tratan de recoger todos los precios de mercado de las opciones generalizando el modelo
de Black-Scholes de manera que se cumpla la siguiente ecuación diferencial estocástica:
dSt = µ(t)Stdt + σlocal(t, St)StdWt
El concepto de una volatilidad local se desarrolló cuando Bruno Dupire, Emanuel
Derman e Iraj Kani señalaron la existencia de un único un proceso de difusión consistente
con lo observado en los mercados para los precios de las opciones europeas (para más
información, ver [15]).
El objetivo de estos modelos de volatilidad local es determinar la forma de la supercie
σlocal(K, T) para que el modelo valore bien todo el conjunto de instrumentos vanilla para
distintos strikes y distintos vencimientos.
Se puede demostrar que:
57. 3.4. Modelos de volatilidad estocástica 37
σ2
local(x, t) =
∂
∂t
Vmarket(x, t) + rx
∂
∂x
Vmarket(x, t)
1
2
x2 ∂2
∂x2
Vmarket(x, t)
Esta expresión de la volatilidad local tiene dos inconvenientes importantes:
1. Es muy sensible a la forma en que se parametrice la supercie de precios de mercado
Vmarket(K, T).
2. El término que aparece en el denominador puede tender a cero fácilmente.
Puesto que la supercie de precios Vmarket(K, T) se expresa, a través de la fórmula de
Black-Scholes en función de la supercie de volatilidades implícitas σimp(K, T), se puede
obtener una expresión de la supercie de volatilidad local σlocal(K, T) en función de la
supercie de volatilidades implícitas como:
σ2
local(x, t) =
σimp(x, t)
t
+ 2
∂
∂t
σimp(x, t) + 2rx
∂
∂x
σimp(x, t)
x2
[
∂2
∂x2
σimp(x, t) − y
√
t
(
∂
∂x
σimp(x, t)
)2
+
1
σimp(x, t)
(
1
x
√
t
+ y
∂
∂x
σimp(x, t)
)2
]
Con:
y =
ln
(
S0
x
)
+ rt +
t
2
σ2
imp(x, t)
σimp(x, t)
√
t
La gran ventaja de los modelos de volatilidad local es que son fáciles de calibrar puesto
que la única fuente de aleatoriedad es el precio del subyacente.
En la Sección 6.3.1 se describen brevemente el modelo CEV y el modelo de mixtura de
lognormales, los dos modelos de volatilidad local que se han implementado en el presente
Trabajo de Fin de Máster para valorar los derivados que se han empleado para obtener
las griegas mediante diferenciación algorítmica.
Se han escogido estos dos ya que son dos modelos sencillos con pocos grados de li-
bertad y ampliamente usados en la industria bancaria para valorar productos derivados
nancieros.
3.4. Modelos de volatilidad estocástica
Los modelos de volatilidad local pueden modelar correctamente el smile a fechas pró-
ximas. Pero a medida que pasa el tiempo, los smiles obtenidos con estos modelos son
menos realistas debido a que `aplanan' el smile forward.
Por este motivo surgen una serie nuevos modelos conocidos como modelos de volati-
lidad estocástica que tratan de modelizar mejor los mercados nancieros y anar así los
precios de los derivados.
58. 38 Capítulo 3. Valoración de opciones nancieras
El nombre deriva del tratamiento de los modelos de la volatilidad del valor subyacente
como un proceso aleatorio. Para ampliar información sobre este tipo de modelos, se pueden
consultar [1], [5].
Estos modelos son de la forma:
dSt = µStdt +
√
νtStdWt
dνt = α(St, νt, t)dt + νβ(St, νt, t)
√
νtdBt
dWtdBt = ρdt
Siendo:
S: el precio del activo subyacente.
µ: la deriva.
ν: la volatilidad del precio del activo subyacente.
ρ: la correlación entre las variaciones del precio del activo y de la volatilidad.
Wt, Bt: los movimientos Brownianos asociados al activo y a la volatilidad del activo
respectivamente.
α, β: funciones particulares de cada modelo de volatilidad estocástica.
La característica principal de los modelos de volatilidad estocástica es que intentan
mejorar las características propias de la volatilidad para obtener con ello mejores estima-
ciones de los precios de las opciones. Estos modelos, entre otras cosas:
Permiten explicar de forma consistente el motivo de que distintas opciones con
diferentes strikes y vencimientos tengan diferentes volatilidades implícitas calculadas
con el modelo de Black-Scholes. Es decir, simulan bien el smile de volatilidad que
se observa en los mercados.
Asumen que, al igual que hacen muchos traders, la distribución de probabilidades
del precio de una acción tiene una cola izquierda más pesada y una cola derecha
menos pesada que la distribución lognormal, que es la que se asume en el modelo
de Black-Scholes para el modelizar el activo subyacente.
Actualmente existen muchos modelos de volatilidad estocástica, como por ejemplo el
modelo de Heston, el modelo SABR y el modelo GARCH.
En el presente Trabajo de Fin de Máster no se ha implementado ninguno dada la com-
plejidad computacional de estos modelos y la dicultad para ajustar ciertos parámetros
que repliquen correctamente los precios de mercado de las derivados nancieros.