SlideShare una empresa de Scribd logo
1 de 72
WEB SEMÂNTICA
   Renan Oliveira
AGENDA

•   Web atual: hipertexto

•   Web semântica

•   Ontologias

•   Modelagem de dados

•   Linked Open Data
WEB ATUAL


•   Apresentação do conteúdos

•   Formatação, não significado

•   Pouca ou nenhuma estruturação
CONTEÚDO MULTIMÍDIA

•   Vários elementos na página

•   Fotos, vídeos e animações

•   Qual a relação entre eles?

•   Quem é mencionado no texto?

•   Quem, Quando, Onde...
COMO ISSO AFETA
    ALGO COMUM?
Busca por Gols do Roberto Carlos no Maracanã
NA GLOBO.COM
E... NO GOOGLE
PROBLEMAS

•   Busca feita por palavras (dados, não informações)

•   Falta de contexto (como fotos e vídeos se relacionam com o texto?)

•   Ambiguidade (qual Roberto Carlos?)

•   Pouca relevância (gol???)
MELHORIAS


•   Registrar de forma precisa

•   Organizar corretamente

•   Transmitir significado
WEB SEMÂNTICA



“I have a dream for the web in which computers become
capable of analyzing all the data on the web - the content,
links, and transactions between people and computers.”
Tim Berners-Lee
HOMEM + MÁQUINA


•   Cada um desempenha seu melhor papel

•   Homem - desambiguar, relacionar e definir regras

•   Máquina - organizar, indexar e inferir
REGISTRAR INFORMAÇÃO


•   Produtor do conteúdo

•   Sabe o que, quem, quando, onde...

•   Resolve ambiguidade
GOL DO ROBERTO CARLOS
ONTOLOGIAS



• “Uma  ontologia é um modelo de dados que representa um
 conjunto de conceitos dentro de um domínio e os
 relacionamentos entre eles” - Wikipedia
MONTAGEM

•   Identificar os indivíduos

•   Descrever seus atributos

•   Agrupar os indivíduos em classes

•   Enumerar as relações entre indivíduos

•   Definir regras sobre atributos e relações
CONTRUÇÃO DE
                    ONTOLOGIAS

•   Linguagens para definir ontologias

    •   OWL (Web Ontology Language)

    •   RDF (Resource description framework)
REPRESENTAÇÃO EM TRIPLAS
VANTAGENS
•   Modelagem natural

    •   muito próximo da orientação a objetos

•   Expressividade

    •   representa qualquer relacionamento possível

    •   restrições, cardinalidade

•   Capacidade de inferência

    •   regras sobre as classes e relacionamentos
EXIBIR INFORMAÇÃO

•   HTML e XML não são suficientes

•   Estrutura, mas não significado

    <document type="progressive rock">
    <name>Another Brick in the Wall</name>
    <author>Roger Waters</author>
    </document>
REPRESENTAÇÃO
                    ESTRUTURADA
•   “Tags” com estrutura semântica

•   Padronização dos elementos

    <music type="rock">
    <title>Another Brick in the Wall</title>
    <composer>Roger Waters</composer>
    </music>
COMO PADRONIZAR?

•   Vocabulários controlados

•   Exemplo: Dublin Core Metadata Initiative (DCMI)

    •   termos com significado bem definido:

        •   title, creator, contributor, creator, ...
OUTROS VOCABULÁRIOS
•   FOAF (Friend of a Friend)

    •   informações sobre as pessoas

    •   orginalmente usado para redes sociais

•   Core Ontology for Multimedia (COMM)

    •   informações sobre arquivos de mídia

    •   dimensões, encoding, histórico de produção
XML USANDO DUBLIN CORE

      <music type="rock">
         <dc:title>
           Another Brick in the Wall
          </dc:title>
          <dc:creator>
           Roger Waters
          </dc:creator>
      </music>
HTML + RDFA

<span property="foaf:name">
 Roger Waters
</span>
 nasceu em
<span property="foaf:dateOfBirth" content="1943-09-06"
datatype="xsd:date">
 6 de setembro de 1943
</span>
SCHEMA.ORG


•   Iniciativa Google, Bing e Yahoo!

•   Gera Rich Snippet

•   Grande melhoria em SEO.
BENEFÍCIOS


•   Significado explícito

•   Sem ambiguidades

•   Entendido por máquinas de busca
LINKED DATA

•   Referências cruzadas globais

•   Embutidas em páginas HTML

    •   RDFa, schema.org

•   Identificadores único (URIs) para conceitos

•   Bases de dados de referência
LINKED OPEN DATA CLOUD
•   Repositório de uso geral

    •   DBPedia (conceitos extraídos da Wikipedia)

    •   FreeBase

•   Repositório sobre domínios específicos

    •   GeoNames

    •   MusicBrainz

•   Novos sites com autoridade sobre o domínio
BUSCAS SEMÂNTICAS

•   Encontram e analisam meta-informação

    •   tags com RDFa, microdata

    •   repositório de triplas

•   Relacionam informações em sites diferentes

•   Exemplo: Sindice e Google*
como usamos?
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
CONHECIMENTO
        ÚNICO
     Menor risco de duplicidade dos dados
Simplificação do uso e da manutenção dos dados
       Agilidade na recuperação dos dados
cita a entidade
            Materia                     Pessoa
ONTOLOGIA
TRIPLA
                      cita a entidade
            Matéria                     Romário
CASES RELEVANTES
    Modelos de uso da
     Web Semântica
•   Best Buy

•   BBC

•   New York Times
AÇÕES REALIZADAS


•   Uso da ontologia GoodRelations

•   Adição de metadados: RDFa
RESULTADOS ALCANÇADOS


•   Tráfego originado por motores de busca: + 30%

•   Taxa de cliques no Yahoo!: + 15%

•   Aumento significativo do Google PageRank
AÇÕES REALIZADAS


•   Ontologias públicas

•   Interligação com repositórios de dados externos

•   Criação de categorias e agregadores úteis
Domínios representados
Ontologias públicas
    utilizadas
Ontologia de programas
RESULTADOS ALCANÇADOS


•   Proliferação de links relevantes: potencialização de SEO

•   Reuso das informações: menor desperdício de pessoal

•   Navegação interligada e escalável para toda a BBC
AÇÕES REALIZADAS


•   Anotação e indexação do conteúdo baseado em indivíduos

•   Ontologia pública

•   Interligação com repositórios de dados externos

•   Adição de metadados: Open Graph
NYT Index Abstract
                              ✓ Assuntos: Livestock; Goats;
Jenny Brown, owner of          Amputation; Prosthesis; Legs
Woodstock (NY) Farm Animal
Sanctuary, forms special      ✓ Organizações:Woodstock Farm

bond with Albie, goat that     Animal Sanctuary
probably escaped from New
                              ✓ Lugares:Woodstock (NY); New
York City slaughterhouse;
                               York City
Albie injured leg in escape
and it had to be amputated;
                              ✓ Pessoas: Santos, Fernanda; Brown,
Brown had leg amputated as
Apresentação:
www.renanoliveira.net

Contato:
renan@corp.globo.com
@renan_oliveira

globo.com
Renan Oliveira

Más contenido relacionado

La actualidad más candente

Linked Open Data (LOD)の基礎講座
Linked Open Data (LOD)の基礎講座Linked Open Data (LOD)の基礎講座
Linked Open Data (LOD)の基礎講座Kouji Kozaki
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組Recruit Technologies
 
データ基盤グループを支えるチームビルディング
データ基盤グループを支えるチームビルディングデータ基盤グループを支えるチームビルディング
データ基盤グループを支えるチームビルディング株式会社MonotaRO Tech Team
 
Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...
Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...
Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...Databricks
 
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜MicroAd, Inc.(Engineer)
 
Comparing three data ingestion approaches where Apache Kafka integrates with ...
Comparing three data ingestion approaches where Apache Kafka integrates with ...Comparing three data ingestion approaches where Apache Kafka integrates with ...
Comparing three data ingestion approaches where Apache Kafka integrates with ...HostedbyConfluent
 
[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network
[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network
[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep NetworkDeep Learning JP
 
[DL輪読会]Inverse Constrained Reinforcement Learning
[DL輪読会]Inverse Constrained Reinforcement Learning[DL輪読会]Inverse Constrained Reinforcement Learning
[DL輪読会]Inverse Constrained Reinforcement LearningDeep Learning JP
 
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話MicroAd, Inc.(Engineer)
 
異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j昌桓 李
 
日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023
日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023
日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023Matlantis
 
MongoDB概要:金融業界でのMongoDB
MongoDB概要:金融業界でのMongoDBMongoDB概要:金融業界でのMongoDB
MongoDB概要:金融業界でのMongoDBippei_suzuki
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みRecruit Technologies
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点Taiji Suzuki
 
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling ProblemDeep Learning JP
 
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤Google Cloud Platform - Japan
 
Matlantisに込められた 技術・思想_高本_Matlantis User Conference
Matlantisに込められた 技術・思想_高本_Matlantis User ConferenceMatlantisに込められた 技術・思想_高本_Matlantis User Conference
Matlantisに込められた 技術・思想_高本_Matlantis User ConferenceMatlantis
 
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)幸太朗 岩澤
 
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSSYahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSSYahoo!デベロッパーネットワーク
 

La actualidad más candente (20)

Linked Open Data (LOD)の基礎講座
Linked Open Data (LOD)の基礎講座Linked Open Data (LOD)の基礎講座
Linked Open Data (LOD)の基礎講座
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
データ基盤グループを支えるチームビルディング
データ基盤グループを支えるチームビルディングデータ基盤グループを支えるチームビルディング
データ基盤グループを支えるチームビルディング
 
Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...
Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...
Building a Knowledge Graph with Spark and NLP: How We Recommend Novel Drugs t...
 
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
 
Comparing three data ingestion approaches where Apache Kafka integrates with ...
Comparing three data ingestion approaches where Apache Kafka integrates with ...Comparing three data ingestion approaches where Apache Kafka integrates with ...
Comparing three data ingestion approaches where Apache Kafka integrates with ...
 
[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network
[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network
[DL Hacks]Model-Agnostic Meta-Learning for Fast Adaptation of Deep Network
 
[DL輪読会]Inverse Constrained Reinforcement Learning
[DL輪読会]Inverse Constrained Reinforcement Learning[DL輪読会]Inverse Constrained Reinforcement Learning
[DL輪読会]Inverse Constrained Reinforcement Learning
 
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
 
異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j
 
日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023
日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023
日本一やさしい マテリアルズ・インフォマティクスへの導き_柴田_nanotech2023
 
MongoDB概要:金融業界でのMongoDB
MongoDB概要:金融業界でのMongoDBMongoDB概要:金融業界でのMongoDB
MongoDB概要:金融業界でのMongoDB
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点
 
Mean Teacher
Mean TeacherMean Teacher
Mean Teacher
 
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
 
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
 
Matlantisに込められた 技術・思想_高本_Matlantis User Conference
Matlantisに込められた 技術・思想_高本_Matlantis User ConferenceMatlantisに込められた 技術・思想_高本_Matlantis User Conference
Matlantisに込められた 技術・思想_高本_Matlantis User Conference
 
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
 
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSSYahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
 

Similar a Introdução a web semântica e o case da globo.com

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Regis Magalhães
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisRosana Lanzelotte
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaNaira Michelle Alves Pereira
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLOtávio Calaça Xavier
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeElvis Fusco
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Luiz Adolfo de Andrade
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documentoAlex Martins
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Thiago de Azeredo
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partiturasRosana Lanzelotte
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de ConteúdoPatricia De Cia
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaLuciano Ramalho
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informaçãoHenrique Fonseca
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasHelio Henrique L. C. Monte-Alto
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasSociedade da Informação
 

Similar a Introdução a web semântica e o case da globo.com (20)

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicais
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomia
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQL
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na Rede
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documento
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
 
7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partituras
 
Saber avaliar a informação
Saber avaliar a informaçãoSaber avaliar a informação
Saber avaliar a informação
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de Conteúdo
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiência
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informação
 
Aula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.pptAula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.ppt
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologias
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e Ontologias
 
Palestra Introdução a Linked Data
Palestra Introdução a Linked DataPalestra Introdução a Linked Data
Palestra Introdução a Linked Data
 

Más de Renan Moreira de Oliveira

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServiceRenan Moreira de Oliveira
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCRenan Moreira de Oliveira
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Renan Moreira de Oliveira
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosRenan Moreira de Oliveira
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaRenan Moreira de Oliveira
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveRenan Moreira de Oliveira
 

Más de Renan Moreira de Oliveira (20)

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
AI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerceAI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerce
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
 
Data science Framework
Data science FrameworkData science Framework
Data science Framework
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
 
Sistemas de Recomendação
Sistemas de RecomendaçãoSistemas de Recomendação
Sistemas de Recomendação
 
Big data e Machine Learning na globo.com
Big data e Machine Learning na globo.comBig data e Machine Learning na globo.com
Big data e Machine Learning na globo.com
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
 
Machine Learning na globo-com
Machine Learning na globo-comMachine Learning na globo-com
Machine Learning na globo-com
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
 
Big data e a globo.com - 2017
Big data e a globo.com - 2017Big data e a globo.com - 2017
Big data e a globo.com - 2017
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
 
Big Data na globo.com
Big Data na globo.comBig Data na globo.com
Big Data na globo.com
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
 

Último

ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx2m Assessoria
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploDanilo Pinotti
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx2m Assessoria
 
Programação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdfProgramação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdfSamaraLunas
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx2m Assessoria
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsDanilo Pinotti
 
Luís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdfLuís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdfLuisKitota
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx2m Assessoria
 

Último (8)

ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
Programação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdfProgramação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdf
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 
Luís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdfLuís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdf
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 

Introdução a web semântica e o case da globo.com

  • 1. WEB SEMÂNTICA Renan Oliveira
  • 2. AGENDA • Web atual: hipertexto • Web semântica • Ontologias • Modelagem de dados • Linked Open Data
  • 3. WEB ATUAL • Apresentação do conteúdos • Formatação, não significado • Pouca ou nenhuma estruturação
  • 4. CONTEÚDO MULTIMÍDIA • Vários elementos na página • Fotos, vídeos e animações • Qual a relação entre eles? • Quem é mencionado no texto? • Quem, Quando, Onde...
  • 5. COMO ISSO AFETA ALGO COMUM? Busca por Gols do Roberto Carlos no Maracanã
  • 8. PROBLEMAS • Busca feita por palavras (dados, não informações) • Falta de contexto (como fotos e vídeos se relacionam com o texto?) • Ambiguidade (qual Roberto Carlos?) • Pouca relevância (gol???)
  • 9. MELHORIAS • Registrar de forma precisa • Organizar corretamente • Transmitir significado
  • 10. WEB SEMÂNTICA “I have a dream for the web in which computers become capable of analyzing all the data on the web - the content, links, and transactions between people and computers.” Tim Berners-Lee
  • 11. HOMEM + MÁQUINA • Cada um desempenha seu melhor papel • Homem - desambiguar, relacionar e definir regras • Máquina - organizar, indexar e inferir
  • 12. REGISTRAR INFORMAÇÃO • Produtor do conteúdo • Sabe o que, quem, quando, onde... • Resolve ambiguidade
  • 13. GOL DO ROBERTO CARLOS
  • 14. ONTOLOGIAS • “Uma ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre eles” - Wikipedia
  • 15. MONTAGEM • Identificar os indivíduos • Descrever seus atributos • Agrupar os indivíduos em classes • Enumerar as relações entre indivíduos • Definir regras sobre atributos e relações
  • 16. CONTRUÇÃO DE ONTOLOGIAS • Linguagens para definir ontologias • OWL (Web Ontology Language) • RDF (Resource description framework)
  • 18.
  • 19. VANTAGENS • Modelagem natural • muito próximo da orientação a objetos • Expressividade • representa qualquer relacionamento possível • restrições, cardinalidade • Capacidade de inferência • regras sobre as classes e relacionamentos
  • 20. EXIBIR INFORMAÇÃO • HTML e XML não são suficientes • Estrutura, mas não significado <document type="progressive rock"> <name>Another Brick in the Wall</name> <author>Roger Waters</author> </document>
  • 21. REPRESENTAÇÃO ESTRUTURADA • “Tags” com estrutura semântica • Padronização dos elementos <music type="rock"> <title>Another Brick in the Wall</title> <composer>Roger Waters</composer> </music>
  • 22. COMO PADRONIZAR? • Vocabulários controlados • Exemplo: Dublin Core Metadata Initiative (DCMI) • termos com significado bem definido: • title, creator, contributor, creator, ...
  • 23. OUTROS VOCABULÁRIOS • FOAF (Friend of a Friend) • informações sobre as pessoas • orginalmente usado para redes sociais • Core Ontology for Multimedia (COMM) • informações sobre arquivos de mídia • dimensões, encoding, histórico de produção
  • 24. XML USANDO DUBLIN CORE <music type="rock"> <dc:title> Another Brick in the Wall </dc:title> <dc:creator> Roger Waters </dc:creator> </music>
  • 25. HTML + RDFA <span property="foaf:name"> Roger Waters </span> nasceu em <span property="foaf:dateOfBirth" content="1943-09-06" datatype="xsd:date"> 6 de setembro de 1943 </span>
  • 26. SCHEMA.ORG • Iniciativa Google, Bing e Yahoo! • Gera Rich Snippet • Grande melhoria em SEO.
  • 27. BENEFÍCIOS • Significado explícito • Sem ambiguidades • Entendido por máquinas de busca
  • 28. LINKED DATA • Referências cruzadas globais • Embutidas em páginas HTML • RDFa, schema.org • Identificadores único (URIs) para conceitos • Bases de dados de referência
  • 29.
  • 30. LINKED OPEN DATA CLOUD • Repositório de uso geral • DBPedia (conceitos extraídos da Wikipedia) • FreeBase • Repositório sobre domínios específicos • GeoNames • MusicBrainz • Novos sites com autoridade sobre o domínio
  • 31. BUSCAS SEMÂNTICAS • Encontram e analisam meta-informação • tags com RDFa, microdata • repositório de triplas • Relacionam informações em sites diferentes • Exemplo: Sindice e Google*
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. CONHECIMENTO ÚNICO Menor risco de duplicidade dos dados Simplificação do uso e da manutenção dos dados Agilidade na recuperação dos dados
  • 49. cita a entidade Materia Pessoa ONTOLOGIA TRIPLA cita a entidade Matéria Romário
  • 50.
  • 51. CASES RELEVANTES Modelos de uso da Web Semântica
  • 52. Best Buy • BBC • New York Times
  • 53.
  • 54. AÇÕES REALIZADAS • Uso da ontologia GoodRelations • Adição de metadados: RDFa
  • 55.
  • 56.
  • 57. RESULTADOS ALCANÇADOS • Tráfego originado por motores de busca: + 30% • Taxa de cliques no Yahoo!: + 15% • Aumento significativo do Google PageRank
  • 58.
  • 59. AÇÕES REALIZADAS • Ontologias públicas • Interligação com repositórios de dados externos • Criação de categorias e agregadores úteis
  • 61. Ontologias públicas utilizadas
  • 63.
  • 64.
  • 65. RESULTADOS ALCANÇADOS • Proliferação de links relevantes: potencialização de SEO • Reuso das informações: menor desperdício de pessoal • Navegação interligada e escalável para toda a BBC
  • 66.
  • 67. AÇÕES REALIZADAS • Anotação e indexação do conteúdo baseado em indivíduos • Ontologia pública • Interligação com repositórios de dados externos • Adição de metadados: Open Graph
  • 68. NYT Index Abstract ✓ Assuntos: Livestock; Goats; Jenny Brown, owner of Amputation; Prosthesis; Legs Woodstock (NY) Farm Animal Sanctuary, forms special ✓ Organizações:Woodstock Farm bond with Albie, goat that Animal Sanctuary probably escaped from New ✓ Lugares:Woodstock (NY); New York City slaughterhouse; York City Albie injured leg in escape and it had to be amputated; ✓ Pessoas: Santos, Fernanda; Brown, Brown had leg amputated as
  • 69.
  • 70.
  • 71.

Notas del editor

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. UM ROM&amp;#xC1;RIO ---- DADO CONSISTENTE NA NOSSA BASE\nDADO F&amp;#xC1;CIL DE USADO E MANTIDO\n\n
  58. PREDICADO CONECTA DUAS CLASSES\n
  59. ATORES: TIMES, T&amp;#xC9;CNICO, ETC...\nEVENTO: PARTIDA\nN&amp;#xC3;O TEM O JUIZ\n
  60. \n
  61. \n
  62. - Grande empresa varejo de eletronicos\n- Artigo semtech\n- benef&amp;#xED;cios da web sem&amp;#xE2;ntica\n\n\n
  63. good relations\n --&gt; vocabulario profissional e-commerce\n --&gt; amig&amp;#xE1;vel m&amp;#xE1;quina busca, mobile, exten&amp;#xE7;&amp;#xF5;es browser\nrdfa\n --&gt; anotar XHTML com sem&amp;#xE2;ntica\n --&gt; utilizado por m&amp;#xE1;quinas de busca, machine readable\n
  64. \n
  65. \n
  66. \n
  67. \n
  68. \n
  69. \n
  70. MUSIC BRAINZ - IMDB DA M&amp;#xDA;SICA\n
  71. DOM&amp;#xCD;NIO QUE INTERESSA A GLOBO.COM\n
  72. ESTOU PROCURANDO SOBRE NOT&amp;#xCD;CIAS DA CHINA\n
  73. P&amp;#xC1;GINA DE T&amp;#xD3;PICOS SOBRE A CHINA\n
  74. \n
  75. \n
  76. \n
  77. \n
  78. \n
  79. \n
  80. \n
  81. \n