Este documento describe un sistema de compra-venta bursátil que predice el índice S&P500 utilizando ondículas y redes neurales desarrollado en MatLab. La metodología utiliza ondículas para suavizar datos históricos del índice y entrenar una red neuronal con los resultados. Las pruebas muestran que la red puede predecir el índice con un rendimiento del 59% sobre el rendimiento perfecto y una volatilidad negativa de USD -9.
Each technological age has been marked by a shift in how the industrial platform enables companies to rethink their business processes and create wealth. In the talk I argue that we are limiting our view of what this next industrial/digital age can offer because of how we read, measure and through that perceive the world (how we cherry pick data). Companies are locked in metrics and quantitative measures, data that can fit into a spreadsheet. And by that they see the digital transformation merely as an efficiency tool to the fossil fuel age. But we need to stretch further…
Each technological age has been marked by a shift in how the industrial platform enables companies to rethink their business processes and create wealth. In the talk I argue that we are limiting our view of what this next industrial/digital age can offer because of how we read, measure and through that perceive the world (how we cherry pick data). Companies are locked in metrics and quantitative measures, data that can fit into a spreadsheet. And by that they see the digital transformation merely as an efficiency tool to the fossil fuel age. But we need to stretch further…
This presentation is about the competition of Kaggle "Otto-group". It describes the techniques of data mining and preprocessing used by Jesus Fernandez Carlos Basso and Ismael Gonzalez Marin.
Web: http://mldgr.github.io/Kaggle_Otto_Group/
This presentation is about the competition of Kaggle "Otto-group". It describes the techniques of data mining and preprocessing used by Jesus Fernandez Carlos Basso and Ismael Gonzalez Marin.
Web: http://mldgr.github.io/Kaggle_Otto_Group/
1. 1
Sistema de Compra-Venta
Bursátil que predice el índice
S&P500
Ondículas y Redes Neurales
Metodología 100% basada en MatLab
realizado por Pedro Araujo y Cecilio Gibbs
2. 2
Teoría 1/2
• Las ondículas son una representación en traslación
(tiempo) y escala de una función f(t)
• Ondículas o wavelets: Haar, Daubechies, Symetric,
Coiflets, BiorSplines, ReverseBior y Dmeyer
• Discrete Stationary Wavelet Transform (o SWT)
Daubechies db10 Level 5
3. 3
Teoría 2/2
• Red Neural: inputs, output, entrenamientos,
validación, pruebas, backward
4. 4
Metodología
• Utilizar solo el histórico del índice, ninguna otra
variable es requerida
• Preprocesar el close histórico del S&P500 con cada
una de las ondículas mencionadas y hacer
suavizado (o denoised) utilizando el método SWT.
Se construye una matriz N x 15, con el histórico + 14
suavizados (ruta: start/Toolboxes/Wavelets/SWT Denoising 1-D)
• Entrenar la Red Neural básica (o Backward) de
MatLab, dándole los inputs obtenidos y la salida
conocida (ruta: start/Toolboxes/Neural Network/NFTool)
• Probar la Red y entrenarla dos o tres veces mas
• Obtener el Equity Curve de las corridas y observar.
• Elegir la mejor corrida
5. 5
Evaluación y Resultados 1/3
1ra Corrida
0 50 100 150 200 250 300
0
500
1000
1500
2000
2500
3000
3500
4000
Días de Trading (260 días)
RendimientodelÍndice
Perfecto vs. Real (Predicho por la Red Neural)
Rendimiento Perfecto
Predicción Red Neural
6. 6
Evaluación y Resultados 2/3
2da Corrida
0 50 100 150 200 250 300
0
500
1000
1500
2000
2500
3000
3500
4000
Días de Trading (260 días)
RendimientodelÍndice
Perfecto vs. Real (Predicho por la Red Neural)
Rendimiento Perfecto
Predicción Red Neural
7. 7
Evaluación y Resultados 3/3
Corrida1 Corrida2
Inversión Inicial (USD) 100 100
Rendimiento Perfecto 3662,92 3662,92
Rendimiento sobre Inversión Inicial (USD) 1792,6 2056,3
Rendimiento sobre el rendimiento perfecto (%) 51,67 58,87
Volatilidad Negativa (USD) -10,8 -9,3
Datos de entrada Red Neural (unidades) 1052 1052
Datos de Predichos Red Neural (unidades) 260 260
Datos para graficar (unidades) 259 259
Cantidad de desaciertos sobre los datos predichos
(unidades) 82 81
8. 8
Conclusión
• La metodología utilizada es altamente
efectiva para predecir el índice S&P500
• El rendimiento obtenido sobre el Perfect
Equity es alto 59% y la volatilidad negativa
de USD -9
• Se recomienda probar con redes neurales
mas complejas, específicamente las
dedicadas a resolver series temporales