2. Qual o sentido da WEB?
• Pesquise no Google:
• “Minas”
• Você recebe respostas tão
variadas quanto a
bandeira de Minas Gerais,
o queijo minas e minas de
ouro e diamantes
• Mas você quer saber sobre
MINAS EXPLOSIVAS
3. Por que?
• Sistema não distingue o Estado,
o tipo de queijo e a mineração
da arma
• Técnica mais usada é combinar
palavras, de modo a aprimorar o
resultado da pesquisa
• Busca Avançada
• Mas resultado é sempre
desolador
• São dezenas (às vezes
centenas) de páginas que não
interessam, tornando difícil
separar o joio do trigo
• Por que isso ocorre?
4. Minas,
HTML é limitado Estado
• Crescimento exponencial da
WEB tornou difícil indexar as Minas,
informações Ouro
• A linguagem HTML, que
popularizou a WEB e é utilizada
pela maioria dos sites, não
possui recursos que permitam Minas,
atribuir significado à informação Queijo
• As tags HTML são muito
limitadas nesse sentido. Elas
apenas descrevem como a Minas,
página deve ser exibida e não Explosivas
oferecem nenhuma descrição
dos dados
5. Minas,
Como mudar? Estado
• Para melhorar a indexação são
necessárias categorias mais apuradas Minas,
que permitam triar com eficiência no
oceano de dados disponíveis Ouro
• Categorias já existem
• Para o usuário que visita as páginas da
Estado de Minas, do Queijo Minas, das Minas,
Minas de Ouro a diferença é evidente
• O problema é que essas diferenças só Queijo
são entendidas por nós: humanos
• Aspiração da Inteligência Artificial é
fazer com que a máquina reproduza os Minas,
mecanismos da inteligência humana
• Mas ainda estamos muito longe disso Explosivas
6. WEB Semântica
• A WEB Semântica é uma
tentativa inversa de
solução
• Ao invés de pensar na
informação para os
humanos, a idéia é pensar
na máquina
• quot;Machine-understandable
Informationquot;, esta é a
definição da WEB
Semântica, segundo o quot;pai
da WEBquot;, Tim Berners-Lee,
um dos comandantes desse
projeto
7. W3C
• A criação da WEB Semântica
é capitaneada pelo consórcio
W3C
• O W3C é um sucessor do
projeto Metadados, cujos
princípios são os mesmos:
incluir quot;informação sobre a
informaçãoquot; na WEB
• O projeto Metadados tentava
fazer isso via linguagem
HTML, o que se revelou
impossível porque o HTML
não permite criar categorias
semânticas.
8. Linguagem XML
• Componente central da WEB
Semântica é a linguagem XML
(Extended Markup Language),
que permite descrever
semanticamente os dados a
partir de categorias que o
próprio usuário pode definir
• Elemento XML pode ter dados
declarados como preço de
venda, título de livro,
quantidade de chuva ou
qualquer outro
• Uma vez que o dado é
encontrado, ele pode ser
distribuído pela rede e
apresentado em um browser de
várias formas possíveis
9. Por que XML?
• É uma linguagem extremamente flexível
• Mas criação de muitas categorias diferentes também
não é interessante
• É preciso definir categoria em conjunto
• Um exemplo é o da Unicamp e CNPq, que
estabeleceram um protocolo comum (criado por uma
equipe da Universidade Federal de Santa Catarina) para
poder trocar dados relativos aos currículos de seus
pesquisadores
10. Como criar XML?
• Para criar aplicações XML são
necessários quatro passos:
• DTD (Document Type Definition)
• Definir conjunto de tags e a
gramática da linguagem de
marcação
• Não sobrepor tags e não omitir
tags de finalização
• Usar os padrões DOM (Document
Object Model) e SAX (Simple API
for XML) para interpretá-las
• Transformar o arquivo para
folhas de estilo (CSS) porque
nem todo navegador lê XML
11. Categorias
• Processo ainda é complexo
• Há a necessidade de acordo
sobre que categorias a
utilizar, como os dados
devem ser relacionados,
como os usuários irão
interagir com eles
• Sem isso não há como montar
quot;banco de dadosquot;
• Este é, aliás, um dos maiores
desafios do futuro da WEB
• No comércio eletrônico as
empresas devem chegar a um
acordo, pois têm muito
interesse nessa tecnologia
12. Outros componentes
• Outros componentes da WEB
Semântica são:
• Universal Resource Identifier
• Como a URL especifica uma identidade
• Resource Description Framework
• Uma linguagem e uma gramática para Agentes
definir informação na WEB Programas robôs
• Ontologias que executam
• Conjuntos de asserções que definem as tarefas específicas
relações entre conceitos e estabelecem na WEB
regras lógicas de raciocínio
• Agentes
• Softwares que funcionam sem
necessidade de controle direto ou
supervisão
13. Premissa
• A WEB Semântica reside na
esperança de que as pessoas
comecem a publicar seus dados
em RDF (Resource Description
Framework)
• RDF é simplesmente um modelo
de dados que permite às pessoas
criarem dados legíveis pela
máquina
• A WEB Semântica será
construída baseada nestes dados
• Quando se publica algo em RDF
não se está criando
necessariamente uma parte da
WEB Semântica, apenas se está
colocando os dados à disposição
dos processadores semânticos
da WEB
14. Metas
• As metas da WEB Semântica são
mais ambiciosas do que
simplesmente permitir indexar
melhor a informação da WEB
• Interessam as aplicações que se
tornam possíveis com a
utilização de categorias
semânticas para descrever os
dados
• Você pode criar um agente
(programa robô), especificando
que tipo de emprego gostaria de
ter, qual a remuneração de seu
interesse, local de trabalho
ideal, benefícios de seu
interesse, entre outras
informações, fazendo com que
ele circule pela Internet
15. Sites e blogs
• Sites não comerciais
também se beneficiam da
utilização do XML e do
desenvolvimento da WEB
Semântica
• Seus conteúdos indexados
podem ser mais facilmente
localizados pelos sites de
busca como Google
• Este fenômeno explica o
boom dos Blogs
Corporativos
18. Onde a roda pega?
• É necessária uma nova política de
propriedade intelectual
• Os avanços da tecnologia de
informação e redes digitais
possibilitam que cada um de nós se
torne em um editor
• Roubo de propriedade intelectual é
difícil de vigiar em uma rede
distribuída
• Os proprietários de diretos autorais
(textos, músicas, filmes) perseguem e
combatem ferozmente as tecnologias
que possibilitam acesso dinâmico a
conteúdos protegidos por leis autorais
• O avanço da WEB Semântica vai exigir
repensar os direitos autorais
19. Como ser feliz?
• O segredo da WEB Semântica
está no conteúdo
• Definição de categorias é
fundamental
• Publicar documentos sem
categorias ou tags será o
O produtor de conteúdo
mesmo que jogar uma pedra
na web escreve, filma,
no rio
grava, edita e define
• Surge uma nova profissão? categorias
• O categorizador de web? Tem sentido falar ainda
em “jornalista”?
20. Obrigado!
• Armando Levy
• Formação em Comunicação Social pela FAAP
• Pós-Graduação em Gestão de Comunicação pela USP
• Especialização em Gestão de Informática pela FGV
• MBA em E-Business pela FGV
• Mestre em Teoria e Pesquisa em Comunicação pela ECA-USP
• Gerente de Comunicação e Internet da Credicard, Vésper e
Banco1.Net
• Diretor da e-Press Comunicações
• Consultor do Núcleo de Formação Profissional da Câmara Brasil
Alemanha
• armando@epress.com.br
• (11) 4082 4600