2. OBJETIVO: Estudiar el comportamiento de diversas ruletas
de juego de un casino, para analizar la tendencia que tienen
diversos números a salir.
3. TEORÍA: Las ruletas son un medio físico, y por lo tanto
tendrán leves imperfecciones (“montañas y valles”) en su
fabricación. Entonces las ruletas, poseerán cierta tendencia y
esto provoca que la bola caiga en ciertos números de manera
repetitiva.
TENDENCIA: Es la frecuencia con la que aparecen ciertos
números al ser jugados.
4. EL DESCUBRIDOR: Gonzalo García Pelayo
Jugador profesional que descubrió esta
teoría, e hizo de este estudio su profesión
y su talento, llegando a diseñar un
método infalible contra la banca de los
casinos.
6. Propiedades de los números y los tipos de apuestas
-Numeros (0,1-36)
-Color (rojo, negro, verde)
-Paridad (para, impar, sin paridad)
-Falta(1-18) y Pasa (19-36)
-Veces
-Docena (1ª:1-12, 2ª:13-24, 3ª: 25-36)
-Columna (1ª,2ª,3ª)
-Seisena (1-6, 7-12...)
-Sector del Cilindro (3 partes)
-Transversal (3 números)
Atributos para los
ficheros de entrada.
*.arff
7. Para todos los atributos: Con los histogramas se comprueba
cuales tienden a salir más.
EJEMPLO: RULETA 1
12. - Cuanto más altura tengan las montañas, más clara es la
tendencia.
- Cuanto más ancha sea, más números vecinos poseerán
mayor tendencia y esto ayudará a apostar.
- Cuantas más montañas haya en el gráfico, mayor cantidad
de números tendrán una tendencia a salir.
Observamos en las gráficas, que todas las ruletas disponen
de una tendencia por algunos números no existe una
aleatoriedad en las ruletas. Por tanto poseemos cierta ventaja
frente al casino.
FACTORES A TENER EN CUENTA:
13. Para el resto de atributos: COLOR
NegroRojo
Verde
El color negro
tiende a salir
más veces.
ruleta1
rojo 1304 46,50499
negro 1423 50,74893
verde 77 2,746077
2804
Porcentajes
EJEMPLO: RULETA 1
14. Para el resto de atributos: PARIDAD
El atributo par
tiende a salir
más veces.
Porcentajes
ruleta1
par 1389 49,53638
impar 1338 47,71755
sinparidad 77 2,746077
2804
Par Impar
Sin Paridad
EJEMPLO: RULETA 1
15. - Los números por los que se debería jugar son en
orden de mayor prioridad:
24, 33, 13, 20, 32, 2, 14.
- El color por el que se debería jugar es el negro. Con
un 4,2% más de posibilidades.
- La paridad por la que se debería jugar es par.
- Entre falta o pasa jugaríamos por: pasa.
- Entre las docenas escogeríamos en orden de
prioridad: 3ª, 2ª, 1ª.
- Entre las columnas jugaríamos en orden de
prioridad por las del: 35, 34, 36.
- Para las seisenas elegiríamos las: 6ª y 4ª.
- Los vecinos del cero salen la mayoría de las veces.
- Entre las transversales jugaríamos a las: 11ª, 5ª y 8ª.
Comprobando los histogramas de los demás atributos podemos
deducir que:
17. A la vista de los resultados de los histogramas concluimos que:
- Las mejores apuestas corresponderían a los números de la
zona marcada.
- Para los sectores la opción de apuesta sería
apostar a los números de Tercera parte del
cilindro, porque a pesar de que los
histogramas muestran que tenemos que
apostar a los Vecinos del cero, debemos tener
en cuenta que el sector de los Vecinos del
cero abarca más números.
- Para el resto de atributos no podemos
concluir de manera clara que nos decantemos
por uno u otro a la hora de apostar, ya que la
diferencia de probabilidad de que toque uno u
otro, es muy pequeña.
18. ALGORITMOS PARA EL ANÁLISIS:
FUNCIÓN DE REGRESIÓN LINEAL(Modelo de predicción)
Sobre la clase (Num)veces
A partir de los datos, saca constantes que,
multiplicadas por los datos que le proporcionamos,
nos da el valor de un determinado atributo.
-veces +veces
Mejores valores de los atributos
6.3534 * numero=24 +
0.2114 * color=negro +
0.0765 * paridad=par +
-0.1935 * faltaOpasa=pasa +
0.1183 * docena = terceraDocena,
segundaDocena +
0.1593 * columna=del35 +
0.6243 * seisena=cuartaSeisena +
0.0951 * sectorCilindro =
terceraParteDelCilindro +
-0.8057 * transversal =
undecimaTransversal +
EJEMPLO: RULETA 1
19. Observamos la evaluación:
- Coeficiente de correlación = 1 Relación de máxima precisión.
- 0% de error.
Coeficiente de correlación y los
errores medio y medio cuadrático
en términos absolutos y relativos.
20. J48 (Árbol de clasificación)
ALGORITMOS PARA EL ANÁLISIS:
EJEMPLO: RULETA 1
21. Este árbol se corresponde con el clasificador J48
en el que se puede observar que cada dato queda
perfectamente definido en un nodo hoja. Este
resultado no es extraño ya que, dado un número,
el resto de atributos nominales se deducen
fácilmente.
22. Así pues, este algoritmo comienza clasificando los datos por seisenas
para continuar por columnas.
23. Llegados a este punto en cada rama se tiene únicamente dos números
posibles y la forma de clasificar que utiliza este algoritmo es
primeramente comprobar si tienen el mismo color y en caso de no
tener el mismo los distingue mediante este atributo. Si el color es el
mismo entonces pasa a comprobar el siguiente atributo, en nuestro
caso la paridad, y los clasifica por éste en caso de ser distintos.
Para el conjunto de nuestros datos, algunos atributos no
son requeridos por el algoritmo; a pesar de ello, no los
consideramos redundantes ya que nos proporcionan
otro tipo de información por tratarse de un tipo de
apuesta concreto de la ruleta.