O documento descreve as atividades de pesquisa e desenvolvimento do Grupo de Bancos de Dados da UFSC, focando em soluções para problemas de gerenciamento de dados complexos e não convencionais. O grupo trabalha com dados complexos como documentos, XML, dados na web, espaço-temporais e multimídia.
Segurança, gestão e sustentabilidade para cloud computing
PD&E em Bancos de Dados Complexos
1. 05/11/2012
GBD/UFSC
PD&E em Bancos de Dados Complexos Objetivo: Pesquisa e desenvolvimento de soluções para
problemas de gerenciamento de dados
no GBD-UFSC
Ênfase: Dados complexos e não-convencionais (documentos,
XML, Web, espaciais, temporais, multimídia, redes, …)
Corpo Docente
Carina F. Dorneles
Ronaldo S. Mello Carina F. Dorneles
Renato Fileto Dr., UFRGS, 2002 Dra., UFRGS, 2006
Pos-doc, University of Utah, 2010
Ronaldo S. Mello BDs Web, dataspaces,
BDs Web, cloud DBs, NO-SQL, dados semi-estruturados,
Vânia Bogorny dados semi-estruturados similaridade
Renato Fileto Vania Bogorny
Dr., UNICAMP, 2003 Dra., UFRGS, 2006
Pos-doc, USP 2011-2012 Pos-doc, Hasselt Univ., 2007
Pos-doc, UFRGS, 2008
Recup. informação, semântica,
contextos, DWs espaço-temporais Trajetórias de objetos móveis,
BDs espaço-temporais
1
Case study: dermatology
Analytical procedures vary with the equipment used to gather the
image, body part, age of the patient, history, etc.
• Individual: woman
Prof. Renato Fileto •
•
Body part: tight
Age: 28 years old
• History: tuning booth use
Profa. Vania Bogorny • Change: darkening color
• Biopsy result: Early Melanoma
• Body part: cheek
• Change: darkening color
fileto@inf.ufsc.br • Diagnose: Early Melanoma
2012 / 2
A particular focus: human faces Complex data retrieval
Associated
conventional Complex
data Objects
R = { < a1 , … , ad , s1 , … , sn > }
Where:
• ai ∈ Di is a set of values from the domain Di (1 ≤ i ≤ d )
used to identify and describe the tuple
• sj ∈ Sj is a complex data object, with associated
metadata and extracted features, from a collection S
(1 ≤ j ≤ n , 1 ≤ n < N = |S|)
1
2. 05/11/2012
Consultas por similaridade e metadados
SELECT id, Name, Age, Pic
FROM SocialWebTab
WHERE 20 <= Age < 30 AND Pic NEAR
( SELECT Pic
FROM SocialWebTab
WHERE name = “Pelé” ) STOP AFTER 10;
SELECT E.diagnosis, E.Img
FROM Exam E INNER JOIN Patient P ON E.idP = P.idP
WHERE P.Age < 30 and Exam.bodyPart = “tight” AND
E.Img NEAR 'D:Imagessk_11424_0.jpg'
BY Texture RANGE 0.0265;
Fragmentos de dados Bases de dados e ferramentas
CoPhIR – 110 milhões de imagens e metadados do FLICKR
MIRFLICKR – milhares de imagens anotadas do FLICKR
CLEF – imagens médicas e da Wikipedia anotadas
Base de Telemedicina de Santa Catarina – fragmentos
SISAP – bases de dados e biblioteca de índices métricos
SIREN – sistema que suporta consultas por similaridade
FMI-SIR – biblioteca suportando consultas por similaridade via
índices métricos no Oracle
Oracle Intermedia – extensões do Oracle para tratamento de
dados multimídia
Cooperações DW Celesc
LAPIX/UFSC, LabTelemed/UFSC
ICMC/USP – São Carlos – SP
IC/UNICAMP – Campinas – SP
UEL – Londrina – PR
ISTI/CNR – Pisa – Itália
2
3. 05/11/2012
Análise de informação (drill-down) Temporal analysis
Maio / 2010
Spatial temporal DBs and
Análise de informação (Trace)
semantic tractories
Abril / 2010 Junho / 2010
Feature Type: Hotel Feature Type:
Feature Type: Cafe
Goal Types:
Restaurant
DayStaying,
Goal Types:
Goal Types: Extending SMoT for nested sites
RiverScenery, ItalianCuisine,
HistoricScenery, TuscanCuisine, RiverScenery,
EuropeanCuisine HistoricScenery LiveMusic
3
4. 05/11/2012
Performance comparison Bases de dados e ferramentas
Milan – trajetórias GPS de veículos privados
Tuscany Mobility – trajetórias GSM de pessoas
Rio – trajetórias GPS de veículos
Florianópolis – colhendo trajetórias via GPS
Stops found Weka – com extensões para tratar trajetórias
Running time with Running time without Ferramentas para DWs
nested regions nested regions
Ferramentas para BDs geográficos
Ferramentas para gerência de ontologias e anotações
Cooperações
ISTI/CNR – Pisa – Itália
Un. Ca’ Foscari – Veneza - Itália
UPRC – Atenas - Grécia
Prof. Ronaldo S. Mello
Univ. New Brunswick – Fredericton – Canada Profa. Carina F. Dornelles
UFPE – Recife – PE
UFCE – Fortaleza – CE
PUC-Rio – Rio de Janeiro – RJ
ronaldo@inf.ufsc.br
Embrapa, Epagri, Celesc, Defesa Civil
2012 / 2
Tópicos Gerais de Pesquisa Dados na Web - TCCs
● Dados na Web ● Web Forms (Deep Web)
● Atividades ➔ Interface gráfica para um sistema de busca por similaridade para
– Extração, integração e consulta por similaridade a dados Web forms (WF-Sim - já implementado)
relevantes em fontes de dados na Web ➔ Definição de consultas (filtros) e exibição ranqueada do resultado
– Principais fontes de dados ➔ Incorporação do WF-Sim ao DeepPeep
● Web forms (“Deep web” ou BDs escondidos), Web tables, Docs XML ➔ Tornar o WF-Sim um módulo do DeepPeep
● BDs nas Nuvens (BDs No-SQL) ➔ DeepPeep: máquina de busca para Web forms mais popular
● Atividades ● Web Tables
– Integração, consulta por similaridade, mapeamento relacional- ➔ Descoberta (usando similaridade) e catalogação de equivalências
NoSQL (mapeamentos) entre tabelas heterogêneas no mesmo domínio
● Ferramentas para gerência de dados de propósito ➔ Integração de tabelas heterogêneas (em tabelas globais)
geral ➔ Decomposição de consultas sobre tabelas globais
➔ Integração de resultados de consultas sobre cada Web table
4
5. 05/11/2012
BDs nas Nuvens - TCCs Ferramentas de Propósito Geral- TCCs
● Integração de BDs No-SQL ● Ferramentas de apoio ao ensino de BD
➔ Descoberta (usando similaridade) de BDs No-SQL
equivalentes ➔ Exemplos:
➔ Com o mesmo modelo de dados ou com modelos ➔ Simuladores de SGBDs relacionais
diferentes (chave-valor, multi-coluna, documento, ...) ➔ otimização de consultas, recovery, scheduler, ...
➔ Integração de BDs No-SQL equivalentes ➔ Interfaces gráficas para aprendizado de linguagens
de acesso a BDs relacionais
➔ Consulta integrada a BDs No-SQL heterogêneos
➔ SQL, álgebra relacional, ...
● Mapeamento de BDs relacionais ↔ BDs No- ➔ Normalização
SQL ➔ Engenharia reversa de BDs relacionais
➔ Descoberta de equivalências
➔ Definição/catalogação de mapeamentos
Perguntas?
5