Conferencia presentada en el Segundo Congreso Andino de Computación, Informática y Educación (CACIED 2015)
Contienen resultados y persepectivas del Grupo de Bases de Datos Difusas de la Universidad Simón Bolívar, Venezuela
1. DATOS DIFUSOS EN UN DBMS:
SEMÁNTICA Y PRAGMÁTICA
Prof. Leonid TINEO, PhD
UNIVERSIDAD SIIMÓN BOLÍVAR
VENEZUELA
Segundo Congreso Andino de
Computación. Informática y Educación
CACIED 2015
2. Esquema del Contenido
• El grupo de investigación
• Preliminares
• Resultados obtenidos
• Librería 2013-Extensión-Esquemas de Traducción
• Aplicación web 2013
• Datos tipo 2. 2014
• Página web 2014 Análisis de desempeño
• Ordenamiento de diferentes tipos de datos difusos
• Distintos tipos de ordenamientos
• Trabajos futuros
ResultadosdeInvestigaci´onGrupo de Base de Datos Difusos (USB) 2/50
3. Grupo de Bases de Datos Difusas - USB
Grupo de Base de Datos Difusos (USB) 3/50
Leonid
TINEO
leonid@
usb.ve
Rosseline
RODRÍGUEZ
crodrig@
usb.ve
Ricardo
MONASCAL
rmonascal
@usb.ve
David
CORONADO
dcoronado
@usb.ve
Soraya
CARRASQUEL
scarrasquel
@usb.ve
Darwin
ROCHA
darwinrocha
@usb.ve
José Tomás
CADENAS
jtcadenas
@usb.ve
Josué
RAMÏREZ
ramirezjosue
@usb.ve
4. Grupo de Bases de Datos Difusas - USB
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 3/50
Leonid
TINEO
leonid@
usb.ve
Rosseline
RODRÍGUEZ
crodrig@
usb.ve
Ricardo
MONASCAL
rmonascal
@usb.ve
David
CORONADO
dcoronado
@usb.ve
Soraya
CARRASQUEL
scarrasquel
@usb.ve
Darwin
ROCHA
darwinrocha
@usb.ve
José Tomás
CADENAS
jtcadenas
@usb.ve
Josué
RAMÏREZ
ramirezjosue
@usb.ve
David
Alejandro
5. L´ıneas de Investigaci´on
[Proyecto: Desaf´ıos del Modelo
Relacional Difuso]
Resolver problemas abiertos del
Modelo Relacional Difuso,
particularmente vinculados a
1
relaciones de similitud
distribuciones de posibilidad y
operaciones con atributos
2
3
difusos
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 4/50
6. L´ıneas de Investigaci´on
[Proyecto: Desaf´ıos del Modelo
Relacional Difuso]
Resolver problemas abiertos del
Modelo Relacional Difuso,
particularmente vinculados a
1
relaciones de similitud
distribuciones de posibilidad y
operaciones con atributos
2
3
difusos
2
[Bases de Datos
Sensibles al Contexto]
Las BD permiten flexibilizar
la representacio´n de los datos
mediante t´erminos lingu¨´ısticos
Los t´erminos lingu¨´ısticos
son elementos fuertemente
sensibles al contexto
La sensibilizacio´n al contexto
mejora el uso de las BD
1
3
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 4/50
9. Preliminares
Conjunto difuso
Un conjunto difuso S en un uni-
verso X
µS : X → [0,1] Relacio´n de similitud
µS : X × X → [0,1]
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 6/50
10. Preliminares
Conjunto difuso
Un conjunto difuso S en un uni-
verso X
µS : X → [0,1] Relacio´n de similitud
µS : X × X → [0,1]
µS(x,x) = 1,∀x ∈X
µS(x,y) = µS(y,x),∀x,y ∈X
µS(x,z) =
m´axy (m´ın(µS(x,y),µS(y,z)))
∀x,y,z ∈X
1
2
3
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 6/50
11. Nu´meros Difusos-Distribucio´n de Posibilidad
Distribuci´on de posibilidad Es el conjunto difuso de los
posibles valores de una variable.
πa = { πa(x)/x,x ∈ U}
πa = { πa(x1)/x1,πa(x2)/x2,...,πa(xn)/xn}
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 7/50
12. Nu´meros Difusos-Distribucio´n de Posibilidad
Distribuci´on de posibilidad Es el conjunto difuso de los
posibles valores de una variable.
πa = { πa(x)/x,x ∈ U}
πa = { πa(x1)/x1,πa(x2)/x2,...,πa(xn)/xn}
Nu´mero Difuso Es un caso particular de un conjunto
difuso, donde el dominio es ordenado y la funcio´n es
convexa y normalizada
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 7/50
1
x1 x2 x3 x4
1
1 2 3 4
13. Proyecto: Desaf´ıos del Modelo Relacional Difuso
Se trabaj´o con los diferentes tipos de datos del modelo relacional FUZZY
EER
Tipo 1: atributos con valores de datos precisos.
Tipo 2: atributos con valores de datos difusos
representados como nu´meros difusos.
Tipo 3: atributos con valores en un dominio formado por
etiquetas provisto de una relaci´on de similitud entre las
etiquetas y distribuciones de posibilidad sobre ellasa.
Tipo 4: similar a los atributos del tipo 3, pero sin las
relaciones de similitud.
a
Como estudiaremos estas distribuciones de posibilidad por separado, las
llamaremos Tipo 5
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 8/50
14. Resultados obtenidos: Librer´ıa 2013 1
Librer´ıa
Se cre´o un librer´ıa que implementa
consultas difusas usando software libre para
atributos Tipo 3 con
1
Ordenamiento
Agrupamiento2
Se posee la definici´on formal de ellas.
1
A. Gyomrey, B. Stornelli R. Rodr´ıguez, L. Tineo, S. Carrasquel
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 9/50
15. Extensio´n 2013 2
Extensio´n
Se extiende MariaDB usando una arquitectura de
acoplamiento medio que consiste en una implementaci´on
intermedia donde la l´ogica de la extensio´n fue programada en
el lenguaje nativo del SGBD
Esta extensio´n posee una capa externa programada en JAVA
que implementa los esquemas de traducci´on entre el lenguaje
extendido y el lenguaje nativo del SGBD
2
A. Gyomrey, B. Stornelli R. Rodr´ıguez, L. Tineo, S. Carrasquel
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 10/50
16. Esquemas de Traducci´on 2015 3
Esquemas de Traducci´on
Traducen sentencias de manipulacio´n y consulta
de BD con cualidades difusas a Postgre SQL
extendiendo el cat´alogo de datos
3
R. Rodr´ıguez, L. Tineo, S. Carrasquel, R. Monascal
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 11/50
17. Sentencias soportadas
SELECT
CREATE TABLE
ALTER TABLE
DROP TABLE
CREATE FUZZY DOMAIN
ALTER FUZZY DOMAIN
◮ ADD VALUES
◮ DROP VALUES
◮ ADD SIMILARITY
◮ DROP SIMILARITY
DROP FUZZY DOMAIN
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 12/50
22. Aplicacio´n 4
Aplicacio´n web 2013
Se construyo´ una aplicaci´on Web, sobre una base de
datos real usando MariaDB extendido, con consultas
difusas.
4
S. Moreau, C. Timaury, R. Rodr´ıguez, L. Tineo, S. Carrasquel (2013)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 17/50
23. Cercan´ıa ciudades 5
5
S. Moreau, C. Timaury, R. Rodr´ıguez, L. Tineo, S. Carrasquel (2013)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 18/50
24. Categor´ıa empresas 6
6
S. Moreau, C. Timaury, R. Rodr´ıguez, L. Tineo, S. Carrasquel (2013)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 19/50
25. Resultado de una consulta 7
7
S. Moreau, C. Timaury, R. Rodr´ıguez, L. Tineo, S. Carrasquel (2013)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 20/50
26. Datos tipo 2. 20148
2014
Se migro´ el proyecto anterior a PostgreSQL sin afectar la
funcionalidad
Se cre´o sintaxis de literales difusos
Se extendi´o el cat´alogo, el parser, las operaciones
Se us´o la base de datos de de Opinio´n Estudiantil (USB)
Se agreg´o a las materias 3 atributos difusos calculados sobre las
respuestas a las siguientes preguntas
◮ Calificacio´n que esperas obtener al final del curso
◮ As´ıgnale un puntaje al grado de dificultad del curso
◮ Preparaci´on previa para cursar esta asignatura
8
J. Melian, J. Antonini, J. Goncalves, R. Monascal, D. Coronado, L. Tineo, S.
Carrasquel (2014)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 21/50
27. Portal web. 2014
9
9
L. Esparragoza, J. Lovera, C. Nardone, R. Porras, R. Monascal, R. Rodr´ıguez, D.
Coronado, L. Tineo, S. Carrasquel (2014)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 22/50
28. Casos de uso
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 23/50
29. Diagrama de base de datos
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 24/50
30. El nombre, mascota y disen˜o seleccionados
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 25/50
33. An´alisis de Desempen˜o 2014: Bases de datos
Pokem´on (creada)
10
P. Zambrano, V. Balleste, A. Marcano, L. M. Garc´ıa, R. Monascal, R. Rodr´ıguez, D.
Coronado, L. Tineo, S. Carrasquel (2014)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 28/50
34. An´alisis de Desempen˜o 2014: Bases de datos
Pokem´on (creada) World
10
10
P. Zambrano, V. Balleste, A. Marcano, L. M. Garc´ıa, R. Monascal, R. Rodr´ıguez, D.
Coronado, L. Tineo, S. Carrasquel (2014)
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 28/50
35. Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 29/50
36. Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 30/50
38. Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 32/50
39. Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 33/50
40. Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 34/50
41. Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 35/50
42. Ordenamiento de diferentes tipos de datos difusos
Datos Tipo 1 atributos con valores de datos precisos
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 36/50
Nombre · ·
·
Edad
Ju´an 28
Jos´e 20
Mar´ıa 25
Marta 19
Alberto 21
43. Ordenamiento de diferentes tipos de datos difusos
Datos Tipo 1 atributos con valores de datos precisos
Se puede ordenar de forma cl´asica.
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 36/50
Nombre · ·
·
Edad
Ju´an 28
Jos´e 20
Mar´ıa 25
Marta 19
Alberto 21
Nombre · ·
·
Edad
Marta 19
Jos´e 20
Alberto 21
Mar´ıa 25
Ju´an 28
44. Ordenamiento de diferentes tipos de datos difusos
Datos Tipo 1 atributos con valores de datos precisos
Se puede consultar de acuerdo a algu-
na etiqueta difusa, por ejemplo
16 18 20 22
Joven = { 1/Marta, 1/Jos´e, 0,5/Alberto}
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 36/50
Nombre · ·
·
Edad
Ju´an 28
Jos´e 20
Mar´ıa 25
Marta 19
Alberto 21
1 Joven
45. Datos Tipo 3
Atributos con valores en un dominio formado por etiquetas provisto de una
relaci´on de similitud entre las etiquetas
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 37/50
Nombre · ·
·
Edad
Ju´an Mayor
Jos´e Joven
Mar´ıa Adulto
Marta Mayor
Alberto Adulto
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,5
Ma – – 1
46. Datos Tipo 3
Atributos con valores en un dominio formado por etiquetas provisto de una
relaci´on de similitud entre las etiquetas
Se puede ordenar usando la relaci´on
de similitud, escogiendo la primera
clase de la lista (Joven):
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 37/50
Nombre · ·
·
Edad
Ju´an Mayor
Jos´e Joven
Mar´ıa Adulto
Marta Mayor
Alberto Adulto
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,5
Ma – – 1
Nombre · ·
·
Edad
Jos´e Joven
Mar´ıa Adulto
Alberto Adulto
Marta Mayor
Ju´an Mayor
47. Datos Tipo 3
Atributos con valores en un dominio formado por etiquetas provisto de una
relaci´on de similitud entre las etiquetas
Se puede agrupar igualmente
Joven = { 1/Jos´e,
0,75/Mar´ıa, 0,75/Alberto}
Adulto = { 1/Mar´ıa, 1/Alberto,
0,75/Jos´e,
0,5/Ju´an, 0,5/Marta}
Mayor = { 1/Ju´an, 1/Marta,
0,5/Mar´ıa, 0,5/Alberto}
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 37/50
Nombre · ·
·
Edad
Ju´an Mayor
Jos´e Joven
Mar´ıa Adulto
Marta Mayor
Alberto Adulto
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,5
Ma – – 1
48. Datos Tipo 3
Atributos con valores en un dominio formado por etiquetas provisto de una
relaci´on de similitud entre las etiquetas
Las distribuciones de posibilidad so-
bre etiquetas lingu¨´ısticas no ordena-
das provistas de una relaci´on de simi-
litud las llamaremos datos Tipo 5 y se
estudiar´an posteriormente
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 37/50
Nombre · ·
·
Edad
Ju´an Mayor
Jos´e Joven
Mar´ıa Adulto
Marta Mayor
Alberto Adulto
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,5
Ma – – 1
49. Datos Tipo 2
Atributos con valores de datos difusos representados como nu´meros difusos
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on 38/50
Nombre · ·
·
Edad · ·
·
Ju´an - {0, 75/16, 1/18, 1/20,
0,75/22}
-
Jos´e - {0,75/18, 1/20, 0,75/25} -
Mar´ıa - (22, 25, 28, 30) -
Marta - (25, 28, 30, 32) -
Alberto - {1/30} -
50. Datos Tipo 2
Atributos con valores de datos difusos representados como nu´meros difusos
Para este tipo de datos
Existen varios tipos de ordenamiento: estamos implement´andolos y compa-
rando.
Grupo de Base de DatosResultadosdeInvestigaci´on 38/50
Nombre · · · Edad · · ·
Ju´an - {0, 75/16, 1/18, 1/20,
0,75/22}
-
Jos´e - {0,75/18, 1/20, 0,75/25} -
Mar´ıa - (22, 25, 28, 30) -
Marta - (25, 28, 30, 32) -
Alberto - {1/30} -
51. Datos Tipo 2
Atributos con valores de datos difusos representados como nu´meros difusos
Para este tipo de datos
Con cada ordenamiento, se puede definir un agrupamiento.
Grupo de Base de DatosResultadosdeInvestigaci´on 38/50
Nombre · · · Edad · · ·
Ju´an - {0, 75/16, 1/18, 1/20,
0,75/22}
-
Jos´e - {0,75/18, 1/20, 0,75/25} -
Mar´ıa - (22, 25, 28, 30) -
Marta - (25, 28, 30, 32) -
Alberto - {1/30} -
52. Datos Tipo 5
Las distribuciones de posibilidad sobre etiquetas lingu¨´ısticas no ordenadas
provistas de una relaci´on de similitud
Grupo de Base de DatosResultadosdeInvestigaci´on 39/50
Nombre · · · Edad
Ju´an {1/Jo}
Jos´e {0,75/Jo, 1/Ad, 0,75/Ma}
Mar´ıa {0,75/Ad, 1/Ma}
Marta {1/Ad, 0,75/Ma}
Alberto {1/Ad}
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,75
Ma – – 1
53. Datos Tipo 5
Las distribuciones de posibilidad sobre etiquetas lingu¨´ısticas no ordenadas
provistas de una relaci´on de similitud
Este caso
Tambi´en se est´a implementan-
do.
Grupo de Base de DatosResultadosdeInvestigaci´on 39/50
Nombre · · · Edad
Ju´an {1/Jo}
Jos´e {0,75/Jo, 1/Ad, 0,75/Ma}
Mar´ıa {0,75/Ad, 1/Ma}
Marta {1/Ad, 0,75/Ma}
Alberto {1/Ad}
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,75
Ma – – 1
54. Datos Tipo 5
Las distribuciones de posibilidad sobre etiquetas lingu¨´ısticas no ordenadas
provistas de una relaci´on de similitud
Este caso
Por ser una combinaci´on de ca-
sos, existen varias formas de or-
denar/agrupar.
Grupo de Base de DatosResultadosdeInvestigaci´on 39/50
Nombre · · · Edad
Ju´an {1/Jo}
Jos´e {0,75/Jo, 1/Ad, 0,75/Ma}
Mar´ıa {0,75/Ad, 1/Ma}
Marta {1/Ad, 0,75/Ma}
Alberto {1/Ad}
Jo Ad Ma
Jo 1 0.75 0
Ad – 1 0,75
Ma – – 1
55. Datos Tipo 4
Atributos con valores en un dominio formado por etiquetas sin relaci´on de
similitud
Actualmente, en estudio.
Grupo de Base de DatosResultadosdeInvestigaci´on 40/50
Nombre · · · Edad
Ju´an {1/Jo}
Jos´e {0,75/Jo, 1/Ad, 0,75/Ma}
Mar´ıa {0,75/Ad, 1/Ma}
Marta {1/Ad, 0,75/Ma}
Alberto {1/Ad}
Nombre · · · Edad
Ju´an Joven
Jos´e Joven
Mar´ıa Adulto
Marta Mayor
Alberto Adulto
56. Datos Tipo 4
Atributos con valores en un dominio formado por etiquetas sin relaci´on de
similitud
Es una combinaci´on de casos pre-
vios, por lo que esperamos resolver
este caso una vez ´estos est´en con-
cluidos.
Grupo de Base de DatosResultadosdeInvestigaci´on 40/50
Nombre · · · Edad
Ju´an {1/Jo}
Jos´e {0,75/Jo, 1/Ad, 0,75/Ma}
Mar´ıa {0,75/Ad, 1/Ma}
Marta {1/Ad, 0,75/Ma}
Alberto {1/Ad}
Nombre · · · Edad
Ju´an Joven
Jos´e Joven
Mar´ıa Adulto
Marta Mayor
Alberto Adulto
57. Tipos de Ordenamiento: Sugeno
Tineo, S. Carrasquel (2014)
11
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Grupo de Base de DatosResultadosdeInvestigaci´on 41/50
58. Tipos de Ordenamiento: Sugeno
Tineo, S. Carrasquel (2014)
11
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Grupo de Base de DatosResultadosdeInvestigaci´on 41/50
59. Tipos de Ordenamiento: Sugeno
Tineo, S. Carrasquel (2014)
11
11
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Grupo de Base de DatosResultadosdeInvestigaci´on 41/50
60. Tipos de Ordenamiento: Choquet
12
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Tineo, S. Carrasquel (2014)
Grupo de Base de DatosResultadosdeInvestigaci´on 42/50
61. Tipos de Ordenamiento: Choquet
12
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Tineo, S. Carrasquel (2014)
Grupo de Base de DatosResultadosdeInvestigaci´on 42/50
62. Tipos de Ordenamiento: Choquet
12
12
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Tineo, S. Carrasquel (2014)
Grupo de Base de DatosResultadosdeInvestigaci´on 42/50
63. Tipos de Ordenamiento: Riemann
13
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Tineo, S. Carrasquel (2014)
Grupo de Base de DatosResultadosdeInvestigaci´on 43/50
64. Tipos de Ordenamiento: Riemann
13
13
S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodr´ıguez, D. Coronado, L.
Tineo, S. Carrasquel (2014)
Grupo de Base de DatosResultadosdeInvestigaci´on 43/50
69. Grupo de Base de DatosResultadosdeInvestigaci´on 48/50
70. Trabajos futuros
Para datos tipo 4
ORDER BY
GROUP BY
Esquemas de traducci´on
Aplicaciones
An´alisis de desempen˜o
Grupo de Base de DatosResultadosdeInvestigaci´on 49/50
71. Para Datos Tipo 1-2-3-4
Se plantea para todos los Tipos de datos
Extender la cl´ausula
WINDOW BY
Grupo de Base de DatosResultadosdeInvestigaci´on 50/50
72. Contáctanos …
Grupo de Base de Datos Difusos (USB) ResultadosdeInvestigaci´on
Leonid
TINEO
leonid@
usb.ve
Rosseline
RODRÍGUEZ
crodrig@
usb.ve
Ricardo
MONASCAL
rmonascal
@usb.ve
David
CORONADO
dcoronado
@usb.ve
Soraya
CARRASQUEL
scarrasquel
@usb.ve
Darwin
ROCHA
darwinrocha
@usb.ve
José Tomás
CADENAS
jtcadenas
@usb.ve
Josué
RAMÏREZ
ramirezjosue
@usb.ve
David
Alejandro