SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
05/11/2012




                                                      GBD/UFSC

PD&E em Bancos de Dados Complexos                       Objetivo: Pesquisa e desenvolvimento de soluções para
                                                        problemas de gerenciamento de dados
                           no GBD-UFSC
                                                        Ênfase: Dados complexos e não-convencionais (documentos,
                                                        XML, Web, espaciais, temporais, multimídia, redes, …)

                                                        Corpo Docente
                           Carina F. Dorneles
                                                            Ronaldo S. Mello                                    Carina F. Dorneles
                                  Renato Fileto             Dr., UFRGS, 2002                                    Dra., UFRGS, 2006
                                                            Pos-doc, University of Utah, 2010
                               Ronaldo S. Mello                                                                 BDs Web, dataspaces,
                                                            BDs Web, cloud DBs, NO-SQL,                         dados semi-estruturados,
                                Vânia Bogorny               dados semi-estruturados                             similaridade

                                                            Renato Fileto                                       Vania Bogorny
                                                            Dr., UNICAMP, 2003                                  Dra., UFRGS, 2006
                                                            Pos-doc, USP 2011-2012                              Pos-doc, Hasselt Univ., 2007
                                                                                                                Pos-doc, UFRGS, 2008
                                                            Recup. informação, semântica,
                                                            contextos, DWs espaço-temporais                     Trajetórias de objetos móveis,
                                                                                                                BDs espaço-temporais
                                                  1




                                                      Case study: dermatology

                                                      Analytical procedures vary with the equipment used to gather the
                                                      image, body part, age of the patient, history, etc.

                                                                                         •   Individual: woman
     Prof. Renato Fileto                                                                 •
                                                                                         •
                                                                                             Body part: tight
                                                                                             Age: 28 years old
                                                                                         •   History: tuning booth use
    Profa. Vania Bogorny                                                                 •   Change: darkening color

                                                                                         • Biopsy result: Early Melanoma



                                                                                          • Body part: cheek
                                                                                          • Change: darkening color
          fileto@inf.ufsc.br                                                              • Diagnose: Early Melanoma


              2012 / 2




A particular focus: human faces                       Complex data retrieval

                                                                  Associated
                                                                 conventional                Complex
                                                                     data                     Objects

                                                      R = { < a1 , … , ad , s1 , … , sn > }

                                                        Where:
                                                         • ai   ∈ Di is a set of values from the domain Di (1 ≤ i ≤ d )
                                                            used to identify and describe the tuple

                                                         • sj   ∈ Sj is a complex data object, with associated
                                                            metadata and extracted features, from a collection S
                                                            (1 ≤ j ≤ n , 1 ≤ n < N = |S|)




                                                                                                                                                 1
05/11/2012




Consultas por similaridade e metadados


  SELECT id, Name, Age, Pic
  FROM SocialWebTab
  WHERE 20 <= Age < 30 AND Pic NEAR
  ( SELECT Pic
    FROM SocialWebTab
    WHERE name = “Pelé” ) STOP AFTER 10;

  SELECT E.diagnosis, E.Img
  FROM Exam E INNER JOIN Patient P ON E.idP = P.idP
  WHERE P.Age < 30 and Exam.bodyPart = “tight” AND
  E.Img NEAR 'D:Imagessk_11424_0.jpg'
   BY Texture RANGE 0.0265;




Fragmentos de dados                                   Bases de dados e ferramentas

                                                      CoPhIR – 110 milhões de imagens e metadados do FLICKR

                                                      MIRFLICKR – milhares de imagens anotadas do FLICKR

                                                      CLEF – imagens médicas e da Wikipedia anotadas

                                                      Base de Telemedicina de Santa Catarina – fragmentos

                                                      SISAP – bases de dados e biblioteca de índices métricos

                                                      SIREN – sistema que suporta consultas por similaridade

                                                      FMI-SIR – biblioteca suportando consultas por similaridade via
                                                      índices métricos no Oracle

                                                      Oracle Intermedia – extensões do Oracle para tratamento de
                                                      dados multimídia




Cooperações                                           DW Celesc


 LAPIX/UFSC, LabTelemed/UFSC

 ICMC/USP – São Carlos – SP

 IC/UNICAMP – Campinas – SP

 UEL – Londrina – PR

 ISTI/CNR – Pisa – Itália




                                                                                                                          2
05/11/2012




   Análise de informação (drill-down)                               Temporal analysis




                          Maio / 2010




                                                                    Spatial temporal DBs and
   Análise de informação (Trace)
                                                                    semantic tractories




          Abril / 2010                       Junho / 2010




Feature Type: Hotel                             Feature Type:
                         Feature Type:            Cafe
Goal Types:
                           Restaurant
  DayStaying,
                         Goal Types:
                                                Goal Types:         Extending SMoT for nested sites
  RiverScenery,                                   ItalianCuisine,
  HistoricScenery,         TuscanCuisine,         RiverScenery,
  EuropeanCuisine          HistoricScenery        LiveMusic




                                                                                                          3
05/11/2012




              Performance comparison                                                    Bases de dados e ferramentas

                                                                                         Milan – trajetórias GPS de veículos privados

                                                                                         Tuscany Mobility – trajetórias GSM de pessoas

                                                                                         Rio – trajetórias GPS de veículos

                                                                                         Florianópolis – colhendo trajetórias via GPS



     Stops found                                                                         Weka – com extensões para tratar trajetórias

                               Running time with        Running time without             Ferramentas para DWs
                                nested regions            nested regions
                                                                                         Ferramentas para BDs geográficos

                                                                                         Ferramentas para gerência de ontologias e anotações




    Cooperações

         ISTI/CNR – Pisa – Itália

         Un. Ca’ Foscari – Veneza - Itália

         UPRC – Atenas - Grécia
                                                                                              Prof. Ronaldo S. Mello
         Univ. New Brunswick – Fredericton – Canada                                         Profa. Carina F. Dornelles
         UFPE – Recife – PE

         UFCE – Fortaleza – CE

         PUC-Rio – Rio de Janeiro – RJ
                                                                                                                ronaldo@inf.ufsc.br
         Embrapa, Epagri, Celesc, Defesa Civil

                                                                                                                         2012 / 2




    Tópicos Gerais de Pesquisa                                                      Dados na Web - TCCs

●   Dados na Web                                                                    ●   Web Forms (Deep Web)
     ●   Atividades                                                                     ➔   Interface gráfica para um sistema de busca por similaridade para
          –   Extração, integração e consulta por similaridade a dados                      Web forms (WF-Sim - já implementado)
              relevantes em fontes de dados na Web                                           ➔   Definição de consultas (filtros) e exibição ranqueada do resultado

          –   Principais fontes de dados                                                ➔   Incorporação do WF-Sim ao DeepPeep
               ●   Web forms (“Deep web” ou BDs escondidos), Web tables, Docs XML            ➔   Tornar o WF-Sim um módulo do DeepPeep

●   BDs nas Nuvens (BDs No-SQL)                                                                    ➔   DeepPeep: máquina de busca para Web forms mais popular

     ●   Atividades                                                                 ●   Web Tables
          –   Integração, consulta por similaridade, mapeamento relacional-             ➔   Descoberta (usando similaridade) e catalogação de equivalências
              NoSQL                                                                         (mapeamentos) entre tabelas heterogêneas no mesmo domínio
●   Ferramentas para gerência de dados de propósito                                     ➔   Integração de tabelas heterogêneas (em tabelas globais)
    geral                                                                               ➔   Decomposição de consultas sobre tabelas globais
                                                                                        ➔   Integração de resultados de consultas sobre cada Web table




                                                                                                                                                                              4
05/11/2012




    BDs nas Nuvens - TCCs                                            Ferramentas de Propósito Geral- TCCs

●   Integração de BDs No-SQL                                          ●   Ferramentas de apoio ao ensino de BD
    ➔   Descoberta (usando similaridade) de BDs No-SQL
        equivalentes                                                      ➔   Exemplos:
        ➔   Com o mesmo modelo de dados ou com modelos                        ➔   Simuladores de SGBDs relacionais
            diferentes (chave-valor, multi-coluna, documento, ...)                 ➔   otimização de consultas, recovery, scheduler, ...
    ➔   Integração de BDs No-SQL equivalentes                                 ➔   Interfaces gráficas para aprendizado de linguagens
                                                                                  de acesso a BDs relacionais
    ➔   Consulta integrada a BDs No-SQL heterogêneos
                                                                                   ➔ SQL, álgebra relacional, ...

●   Mapeamento de BDs relacionais ↔ BDs No-                                   ➔   Normalização
    SQL                                                                       ➔   Engenharia reversa de BDs relacionais
    ➔   Descoberta de equivalências
    ➔   Definição/catalogação de mapeamentos




     Perguntas?




                                                                                                                                                   5

Más contenido relacionado

Destacado

Processamento e visualização tridimensional de imagens de Satelite e Radar
Processamento e visualização tridimensional de imagens de Satelite e RadarProcessamento e visualização tridimensional de imagens de Satelite e Radar
Processamento e visualização tridimensional de imagens de Satelite e RadarPET Computação
 
Biografia da cronista e blogueira Tati Bernardi
Biografia da cronista e blogueira Tati BernardiBiografia da cronista e blogueira Tati Bernardi
Biografia da cronista e blogueira Tati Bernardielaniasf
 
Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...
Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...
Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...OPITZ CONSULTING Deutschland
 
Quiero Poder Volar
Quiero Poder VolarQuiero Poder Volar
Quiero Poder Volarguest176b14
 
Corpus Christi Cruz BordóN
Corpus Christi Cruz BordóNCorpus Christi Cruz BordóN
Corpus Christi Cruz BordóNYeyi Cabrera
 
NATPET (training) certificate
NATPET (training) certificateNATPET (training) certificate
NATPET (training) certificateAnas Kaaki
 
Ganz Huxley, Schöne neue SOA-Welt - Jax 2010 - OPITZ CONSULTING - Niko Köbler
Ganz Huxley, Schöne neue SOA-Welt  - Jax 2010 - OPITZ CONSULTING - Niko KöblerGanz Huxley, Schöne neue SOA-Welt  - Jax 2010 - OPITZ CONSULTING - Niko Köbler
Ganz Huxley, Schöne neue SOA-Welt - Jax 2010 - OPITZ CONSULTING - Niko KöblerOPITZ CONSULTING Deutschland
 

Destacado (10)

Processamento e visualização tridimensional de imagens de Satelite e Radar
Processamento e visualização tridimensional de imagens de Satelite e RadarProcessamento e visualização tridimensional de imagens de Satelite e Radar
Processamento e visualização tridimensional de imagens de Satelite e Radar
 
Biografia da cronista e blogueira Tati Bernardi
Biografia da cronista e blogueira Tati BernardiBiografia da cronista e blogueira Tati Bernardi
Biografia da cronista e blogueira Tati Bernardi
 
Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...
Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...
Flashback - früher war alles besser – Einsatzmöglichkeiten der Oracle Databas...
 
Quiero Poder Volar
Quiero Poder VolarQuiero Poder Volar
Quiero Poder Volar
 
Corpus Christi Cruz BordóN
Corpus Christi Cruz BordóNCorpus Christi Cruz BordóN
Corpus Christi Cruz BordóN
 
NATPET (training) certificate
NATPET (training) certificateNATPET (training) certificate
NATPET (training) certificate
 
Ganz Huxley, Schöne neue SOA-Welt - Jax 2010 - OPITZ CONSULTING - Niko Köbler
Ganz Huxley, Schöne neue SOA-Welt  - Jax 2010 - OPITZ CONSULTING - Niko KöblerGanz Huxley, Schöne neue SOA-Welt  - Jax 2010 - OPITZ CONSULTING - Niko Köbler
Ganz Huxley, Schöne neue SOA-Welt - Jax 2010 - OPITZ CONSULTING - Niko Köbler
 
Phpbased realestate script
Phpbased realestate scriptPhpbased realestate script
Phpbased realestate script
 
Job Fair Flyer
Job Fair FlyerJob Fair Flyer
Job Fair Flyer
 
Deans List Cert Fall 2015
Deans List Cert Fall 2015Deans List Cert Fall 2015
Deans List Cert Fall 2015
 

Más de PET Computação

Testes de escalabilidade usando cloud
Testes de escalabilidade usando cloudTestes de escalabilidade usando cloud
Testes de escalabilidade usando cloudPET Computação
 
Bancos de dados nas nuvens: uma visão geral
Bancos de dados nas nuvens: uma visão geralBancos de dados nas nuvens: uma visão geral
Bancos de dados nas nuvens: uma visão geralPET Computação
 
Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...
Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...
Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...PET Computação
 
Cloud computing: evolution or redefinition
Cloud computing: evolution or redefinitionCloud computing: evolution or redefinition
Cloud computing: evolution or redefinitionPET Computação
 
Rastreamento de objetos utilizando ar drone
Rastreamento de objetos utilizando ar droneRastreamento de objetos utilizando ar drone
Rastreamento de objetos utilizando ar dronePET Computação
 
Processamento e visualização tridimensional de imagens de satelite e radar
Processamento e visualização tridimensional de imagens de satelite e radarProcessamento e visualização tridimensional de imagens de satelite e radar
Processamento e visualização tridimensional de imagens de satelite e radarPET Computação
 
Evoluindo dot project em alinhamento ao pmbok
Evoluindo dot project em alinhamento ao pmbokEvoluindo dot project em alinhamento ao pmbok
Evoluindo dot project em alinhamento ao pmbokPET Computação
 
Apresentação geral do gqs - Usabilidade na convergência digital - Customizaç...
Apresentação geral do gqs -  Usabilidade na convergência digital - Customizaç...Apresentação geral do gqs -  Usabilidade na convergência digital - Customizaç...
Apresentação geral do gqs - Usabilidade na convergência digital - Customizaç...PET Computação
 
Com a cabeça nas nuvens: montando ambientes para aplicações elásticas
 Com a cabeça nas nuvens: montando ambientes para aplicações elásticas Com a cabeça nas nuvens: montando ambientes para aplicações elásticas
Com a cabeça nas nuvens: montando ambientes para aplicações elásticasPET Computação
 
Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios
 Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios
Redes de sensores sem fio autonômicas: abordagens, aplicações e desafiosPET Computação
 
Teste combinatório de software
Teste combinatório de softwareTeste combinatório de software
Teste combinatório de softwarePET Computação
 
Google app engine para lean startups: the good, the bad and the ugly
Google app engine para lean startups: the good, the bad and the uglyGoogle app engine para lean startups: the good, the bad and the ugly
Google app engine para lean startups: the good, the bad and the uglyPET Computação
 
Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...
Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...
Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...PET Computação
 
Métodos formais aplicados a segurança da informação
Métodos formais aplicados a segurança da informaçãoMétodos formais aplicados a segurança da informação
Métodos formais aplicados a segurança da informaçãoPET Computação
 
Segurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computingSegurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computingPET Computação
 
Segurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computingSegurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computingPET Computação
 

Más de PET Computação (20)

Testes de escalabilidade usando cloud
Testes de escalabilidade usando cloudTestes de escalabilidade usando cloud
Testes de escalabilidade usando cloud
 
Bancos de dados nas nuvens: uma visão geral
Bancos de dados nas nuvens: uma visão geralBancos de dados nas nuvens: uma visão geral
Bancos de dados nas nuvens: uma visão geral
 
Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...
Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...
Uma reflexão sobre os 28 anos de pesquisa no laboratório de integração de sof...
 
Cloud computing: evolution or redefinition
Cloud computing: evolution or redefinitionCloud computing: evolution or redefinition
Cloud computing: evolution or redefinition
 
Rastreamento de objetos utilizando ar drone
Rastreamento de objetos utilizando ar droneRastreamento de objetos utilizando ar drone
Rastreamento de objetos utilizando ar drone
 
Processamento e visualização tridimensional de imagens de satelite e radar
Processamento e visualização tridimensional de imagens de satelite e radarProcessamento e visualização tridimensional de imagens de satelite e radar
Processamento e visualização tridimensional de imagens de satelite e radar
 
Evoluindo dot project em alinhamento ao pmbok
Evoluindo dot project em alinhamento ao pmbokEvoluindo dot project em alinhamento ao pmbok
Evoluindo dot project em alinhamento ao pmbok
 
Ensinar com jogos
Ensinar com jogosEnsinar com jogos
Ensinar com jogos
 
Apresentação geral do gqs - Usabilidade na convergência digital - Customizaç...
Apresentação geral do gqs -  Usabilidade na convergência digital - Customizaç...Apresentação geral do gqs -  Usabilidade na convergência digital - Customizaç...
Apresentação geral do gqs - Usabilidade na convergência digital - Customizaç...
 
Latex
LatexLatex
Latex
 
Ferramenta git
Ferramenta gitFerramenta git
Ferramenta git
 
Com a cabeça nas nuvens: montando ambientes para aplicações elásticas
 Com a cabeça nas nuvens: montando ambientes para aplicações elásticas Com a cabeça nas nuvens: montando ambientes para aplicações elásticas
Com a cabeça nas nuvens: montando ambientes para aplicações elásticas
 
Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios
 Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios
Redes de sensores sem fio autonômicas: abordagens, aplicações e desafios
 
Teste combinatório de software
Teste combinatório de softwareTeste combinatório de software
Teste combinatório de software
 
1+1=0
1+1=01+1=0
1+1=0
 
Google app engine para lean startups: the good, the bad and the ugly
Google app engine para lean startups: the good, the bad and the uglyGoogle app engine para lean startups: the good, the bad and the ugly
Google app engine para lean startups: the good, the bad and the ugly
 
Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...
Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...
Identificando seu estilo pessoal de aprendizagem através da aplicação de dois...
 
Métodos formais aplicados a segurança da informação
Métodos formais aplicados a segurança da informaçãoMétodos formais aplicados a segurança da informação
Métodos formais aplicados a segurança da informação
 
Segurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computingSegurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computing
 
Segurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computingSegurança, gestão e sustentabilidade para cloud computing
Segurança, gestão e sustentabilidade para cloud computing
 

PD&E em Bancos de Dados Complexos

  • 1. 05/11/2012 GBD/UFSC PD&E em Bancos de Dados Complexos Objetivo: Pesquisa e desenvolvimento de soluções para problemas de gerenciamento de dados no GBD-UFSC Ênfase: Dados complexos e não-convencionais (documentos, XML, Web, espaciais, temporais, multimídia, redes, …) Corpo Docente Carina F. Dorneles Ronaldo S. Mello Carina F. Dorneles Renato Fileto Dr., UFRGS, 2002 Dra., UFRGS, 2006 Pos-doc, University of Utah, 2010 Ronaldo S. Mello BDs Web, dataspaces, BDs Web, cloud DBs, NO-SQL, dados semi-estruturados, Vânia Bogorny dados semi-estruturados similaridade Renato Fileto Vania Bogorny Dr., UNICAMP, 2003 Dra., UFRGS, 2006 Pos-doc, USP 2011-2012 Pos-doc, Hasselt Univ., 2007 Pos-doc, UFRGS, 2008 Recup. informação, semântica, contextos, DWs espaço-temporais Trajetórias de objetos móveis, BDs espaço-temporais 1 Case study: dermatology Analytical procedures vary with the equipment used to gather the image, body part, age of the patient, history, etc. • Individual: woman Prof. Renato Fileto • • Body part: tight Age: 28 years old • History: tuning booth use Profa. Vania Bogorny • Change: darkening color • Biopsy result: Early Melanoma • Body part: cheek • Change: darkening color fileto@inf.ufsc.br • Diagnose: Early Melanoma 2012 / 2 A particular focus: human faces Complex data retrieval Associated conventional Complex data Objects R = { < a1 , … , ad , s1 , … , sn > } Where: • ai ∈ Di is a set of values from the domain Di (1 ≤ i ≤ d ) used to identify and describe the tuple • sj ∈ Sj is a complex data object, with associated metadata and extracted features, from a collection S (1 ≤ j ≤ n , 1 ≤ n < N = |S|) 1
  • 2. 05/11/2012 Consultas por similaridade e metadados SELECT id, Name, Age, Pic FROM SocialWebTab WHERE 20 <= Age < 30 AND Pic NEAR ( SELECT Pic FROM SocialWebTab WHERE name = “Pelé” ) STOP AFTER 10; SELECT E.diagnosis, E.Img FROM Exam E INNER JOIN Patient P ON E.idP = P.idP WHERE P.Age < 30 and Exam.bodyPart = “tight” AND E.Img NEAR 'D:Imagessk_11424_0.jpg' BY Texture RANGE 0.0265; Fragmentos de dados Bases de dados e ferramentas CoPhIR – 110 milhões de imagens e metadados do FLICKR MIRFLICKR – milhares de imagens anotadas do FLICKR CLEF – imagens médicas e da Wikipedia anotadas Base de Telemedicina de Santa Catarina – fragmentos SISAP – bases de dados e biblioteca de índices métricos SIREN – sistema que suporta consultas por similaridade FMI-SIR – biblioteca suportando consultas por similaridade via índices métricos no Oracle Oracle Intermedia – extensões do Oracle para tratamento de dados multimídia Cooperações DW Celesc LAPIX/UFSC, LabTelemed/UFSC ICMC/USP – São Carlos – SP IC/UNICAMP – Campinas – SP UEL – Londrina – PR ISTI/CNR – Pisa – Itália 2
  • 3. 05/11/2012 Análise de informação (drill-down) Temporal analysis Maio / 2010 Spatial temporal DBs and Análise de informação (Trace) semantic tractories Abril / 2010 Junho / 2010 Feature Type: Hotel Feature Type: Feature Type: Cafe Goal Types: Restaurant DayStaying, Goal Types: Goal Types: Extending SMoT for nested sites RiverScenery, ItalianCuisine, HistoricScenery, TuscanCuisine, RiverScenery, EuropeanCuisine HistoricScenery LiveMusic 3
  • 4. 05/11/2012 Performance comparison Bases de dados e ferramentas Milan – trajetórias GPS de veículos privados Tuscany Mobility – trajetórias GSM de pessoas Rio – trajetórias GPS de veículos Florianópolis – colhendo trajetórias via GPS Stops found Weka – com extensões para tratar trajetórias Running time with Running time without Ferramentas para DWs nested regions nested regions Ferramentas para BDs geográficos Ferramentas para gerência de ontologias e anotações Cooperações ISTI/CNR – Pisa – Itália Un. Ca’ Foscari – Veneza - Itália UPRC – Atenas - Grécia Prof. Ronaldo S. Mello Univ. New Brunswick – Fredericton – Canada Profa. Carina F. Dornelles UFPE – Recife – PE UFCE – Fortaleza – CE PUC-Rio – Rio de Janeiro – RJ ronaldo@inf.ufsc.br Embrapa, Epagri, Celesc, Defesa Civil 2012 / 2 Tópicos Gerais de Pesquisa Dados na Web - TCCs ● Dados na Web ● Web Forms (Deep Web) ● Atividades ➔ Interface gráfica para um sistema de busca por similaridade para – Extração, integração e consulta por similaridade a dados Web forms (WF-Sim - já implementado) relevantes em fontes de dados na Web ➔ Definição de consultas (filtros) e exibição ranqueada do resultado – Principais fontes de dados ➔ Incorporação do WF-Sim ao DeepPeep ● Web forms (“Deep web” ou BDs escondidos), Web tables, Docs XML ➔ Tornar o WF-Sim um módulo do DeepPeep ● BDs nas Nuvens (BDs No-SQL) ➔ DeepPeep: máquina de busca para Web forms mais popular ● Atividades ● Web Tables – Integração, consulta por similaridade, mapeamento relacional- ➔ Descoberta (usando similaridade) e catalogação de equivalências NoSQL (mapeamentos) entre tabelas heterogêneas no mesmo domínio ● Ferramentas para gerência de dados de propósito ➔ Integração de tabelas heterogêneas (em tabelas globais) geral ➔ Decomposição de consultas sobre tabelas globais ➔ Integração de resultados de consultas sobre cada Web table 4
  • 5. 05/11/2012 BDs nas Nuvens - TCCs Ferramentas de Propósito Geral- TCCs ● Integração de BDs No-SQL ● Ferramentas de apoio ao ensino de BD ➔ Descoberta (usando similaridade) de BDs No-SQL equivalentes ➔ Exemplos: ➔ Com o mesmo modelo de dados ou com modelos ➔ Simuladores de SGBDs relacionais diferentes (chave-valor, multi-coluna, documento, ...) ➔ otimização de consultas, recovery, scheduler, ... ➔ Integração de BDs No-SQL equivalentes ➔ Interfaces gráficas para aprendizado de linguagens de acesso a BDs relacionais ➔ Consulta integrada a BDs No-SQL heterogêneos ➔ SQL, álgebra relacional, ... ● Mapeamento de BDs relacionais ↔ BDs No- ➔ Normalização SQL ➔ Engenharia reversa de BDs relacionais ➔ Descoberta de equivalências ➔ Definição/catalogação de mapeamentos Perguntas? 5