O documento discute o papel dos vocabulários semânticos na economia da internet. Apresenta diferentes tipos de vocabulários como folksonomias, taxonomias e ontologias e discute suas vantagens e desvantagens. Também aborda como empresas e instituições usam sites como o Flickr para compartilhar e organizar fotografias usando folksonomias.
Auditoria Eletrônica: Automatização de procedimentos de auditoria através do ...
Papel de los vocabularios semánticos en la economía en red - 12th CONTECSI
1. Papel de los vocabularios semánticos en la economía en red
12º CONTECSI-FEA-USP
1º Congresso Internacional em Tecnologia e Organização da
Informação
22 de Maio de 2015
José A. Moreiro-González
2. Vocabulários
Denominação genérica para as estruturas e os elementos
estandardizados que representam e organizam a informação, sobre
todo na Internet
Vocabulários
SOC (schemes que representam as matérias) +
Esquemas (schemas): formatos de metadados codificados numa
linguagem de marcado, como XML, legíveis por computador
3. A nova Web obrigou a se adaptar às linguagens preexistentes
Palavras-chave da linguagem livre → Folksonomias
Palavras + equivalência → Anéis de sinônimos
Termos da linguagem controlada + hierarquia → Taxonomias
Termos + hierarquia + associação → Tesauros
Termos + associação manifesta + mapa → Redes semânticas (Topic
maps)
E tem impulsionado novos sistemas conceituais sobre
esquemas: → web semântica
Ontologias: Semântica formalizada para que os conceitos sejam
interpretáveis pelas máquinas (Conceitos + hierarquia y associações
manifestas + lógica)
Esquemas de metadados codificados e legíveis pelo computador
4. Vocabulários livres
Codificação mínima dos conteúdos dos documentos
Palavras sem normalizar (linguagem natural) selecionadas
a partir do conteúdo dos documentos
A mais tradicional Lista lineal de palavras-chave
A mais recente Folksonomia (Web social)
Vocabulário preferido: linguagem livre
Expressado mediante folksonomias, palavras-chave em
etiquetas (etiquetado /tagging)
5. Vocabulários controlados
Termos normalizados e unívocos
Com notações específicas
Protótipo de vocabulário controlado: Tesauro
Outros vocabulários controlados: listas de termos, anéis de
sinônimos e taxonomias
Vantagens
Menor distorção
Servem tanto nos sistemas
manuais como nos automáticos
Inconvenientes
Necessitam de pessoal
especializado
Constante atualização
O usuário tem que conhecê-lo e
investir tempo na estratégia
6. Economia colaborativa-Folksonomias
Na consolidação da economia colaborativa tem sido decisivos:
O uso da tecnologia da informação.
As novas atividades para as quais produtos e serviços são
compartilhados.
A nova consciência de consumo com base na utilização e não na posse.
Algumas formas de intercâmbio têm surgido, particularmente em resposta
à crise económica e financeira.
Também na organização do conhecimento. Os sistemas controlados não
atendiam às necessidades de recuperação na web social.
7. Folksonomias
Thomas Vander Wal propôs o neologismo
Folk + sonomy =
Gente + taxonomia, classificação cooperativa
Modo de indexação cooperativa que adota palavras-
chave para representar a informação de maneira
espontânea e livre
Arquitetura da informação social (Web 2.0) em que
cada usuário escolhe o que mais se ajusta a seu
entendimento
8. Folksonomias
• Com sua ênfase na usabilidade, a Web incentiva
mecanismos sociais para a participação e cooperação
dos usuários na execução dos serviços ,
especialmente para descrever recursos
comunitariamente e melhorar a disponibilidade de
informações.
• Funciona a partir da ideia de que “O produto melhora
com o uso e com o crescimento da comunidade que
continua a fazer upload de conteúdos”.
9. Funcionamento das folksonomias
Para refinar as buscas, a inteligência organizativa
comum tem ideado aplicações como:
• A indexação por popularidade,
• A valoração da opinião dos leitores,
• A sindicação ou indexação mediante atribuição social
de etiquetas.
As folksonomías não tem uma autoridade central que
imponha sua visão; assim cada voz tem seu lugar.
Marcar com etiquetas de caráter social pode ser
considerado "uma ponte de baixa inversão entre a
indexação pessoal e a indexação compartilhada“
10. Vantagens das folksonomias
As folksonomías servem para extrair
vocabulário (datamining) com o qual elaborar
linguagens controladas depois de serem
normalizado
11. Debilidades das folksonomias
Carecem de controle
Não têm hierarquias nem associações, só é possível
utilizar clusters que se podem formar com os recursos
indexados pelos usuários com palavras-chave coincidentes
A ambiguidade é muito alta: para um usuário um termo
pode expressar uma realidade muito distinta da de outro
usuário
Não há guia nem limitações na hora de se etiquetar os
conteúdos
12. Debilidades das folksonomias
Falta de consistência por ausência de controle de
sinônimos: assim na hora de denominar um computador
Macintosh, pode empregar-se as etiquetas “mac”, “apple”,
“macintosh”
Imprecisão ao se utilizar etiquetas só com unitermos
Emprego indistinto de singulares e de plurais (assim é em
Flickr)
E, certamente, quanto se deriva da ausência de hierarquia
Gene Smith. Folksonomy: social classification,
http://atomiq.org/archives/2004/08/folksonomy_social_classification.ht
ml
13. Flickr
Site sobre fotografia
Qualquer usuário pode compartilhar fotos deixando-as à
disposição para consulta mediante o estabelecimento de
palavras-chave em um ambiente colaborativo
Cada usuário indexa as fotografias segundo o que seu
conteúdo sugere
14. Si se realiza uma busca na:
https://www.flickr.com/
Empregando a palavra -chave “Festas juninas”
encontramos na recuperação...
15. Muitos serviços de comunicação empresarial oferecem na
web corporativa:
Noticias de atualidade da empresa,
Também bibliotecas de fotografias e vídeos com os
produtos e serviços que ao longo da historia tem
fabricado ou distribuído,
Mas, pelo geral, a maior atenção é para o que está no
mercado atualmente.
Desde una perspectiva biblioteconômica, as consequências
de esta dupla finalidade são diferentes para as empresas e
instituições:
De uma parte, contribuem para a identidade visual
corporativa.
De outra, servem para hospedar arquivos de imagem
em servidores alheios.
16. Flickr oferece uma boa possibilidade de uso
corporativo.
Ajuda a distribuir as tarefas de gerenciamento entre
aqueles que trabalham em uma organização.
Tem atualidade e agilidade.
O acesso e a divulgação ficam acima da coleção e
custódia.
Muitos serviços de comunicação institucional gerem as
suas bibliotecas de fotografias via Flickr.
17. No caso de grandes instituições é continuo o processo
de entrada de fotos e álbuns que refletem a sua
atividade.
Mostram fotografias de cada uma das infraestruturas,
edifícios e dos locais importantes de cada instituição.
E as atividades diárias, profissionais e sociais mais
variadas.
Com forte presença dos eventos especiais que servem
para comunicar diretamente as circunstâncias de sua
presença humana e social.
18. A Universidade Carlos III de Madrid no Flickr:
• 300 álbuns com fotografias posteriores a 2010.
• Classificadas segundo critérios institucionais.
• Fotografias de cada um dos campus. Da vida diária:
panorâmicas, edifícios, salas, equipamentos, laboratórios,
bibliotecas, salas de aula, instalações esportivas,...
• Das diversas atividades acadêmicas: conferências,
seminários, workshops, fóruns, reuniões científicas,
apresentações de livros, homenagens, premiações, ...
• Comunicam-se direta e diariamente todas as
circunstâncias da vida acadêmica, humana e social.
19. Outro exemplo, empresa brasileira de alimentos Perdigão
no Flickr.
Muitas fotos de suas fábricas, produtos, publicidade,
promoções, logotipos ou caminhões de transporte que
firme.
Mesmo que a polissemia do termo Perdigão faz recuperar
simultaneamente fotos:
Rua Perdigão, no Porto,
Fotos tiradas por alguém de nome Perdigão: de um
intérprete ou um costureiro com esse nome.
Ao lado de fotos do animal Perdigão (Rhynchotus rufescens)
e da Quinta do Perdigão (vinhos).
20. O objetivo de ambos os exemplos é distribuir
imagens de natureza corporativa e torná-las
disponíveis para qualquer usuário ou seguidor
interessado.
Sem dúvida Flickr significou uma grande mudança
quando se trata de compartilhar, armazenar e
organizar fotos digitais. Facilitou a sua gestão, com a
vantagem adicional de ser capaz de tê-las onde quer
que se esteja.
21. As folksonomias são uma solução de baixo custo para a Web invisível e para
os recursos sem valor suficiente para serem descritos por serviços pagos
As melhorias na recuperação utilizando folksonomias acontecem por meio
de sua aproximação com a WS evitando problemas de sinonímia, polissemia
e melhorando a navegabilidade por meio de relações
Reflexão
22. Taxonomia
O termo taxonomia recobrou atualidade a partir dos pesquisadores
em organizações informáticas de objetos
Sempre atendeu a estruturar conceitos e termos em sistemas
classificados
Na ciência positivista as taxonomias representavam os princípios
gerais da classificação científica
Etimologia: conjunção das palavras gregas taxis (ordenação) e
nomos (método)
Ciência ou técnica de classificação: em Biologia, entende a descrição,
identificação e classificação dos organismos, individualmente ou em
grupo, de alcance global biotaxonomia, especializado em:
fitotaxonomia e zootaxonomia
23. Taxonomia
As taxonomias estabelecem relações hierárquicas entre os
objetos num espaço de informação integrada.
Eficácia como ferramentas para classificar: presencia nos
esquemas de metadados, vocabulários controlados, sinônimos,
modelos conceituais, Topic Maps e ontologias: permitem
classificar os dados e informações pelo uso da derivação
semântica.
Em muitas referências acadêmicas, taxonomia é usada como
sinônimo de SOC.
Sempre tem sido utilizadas pelos profissionais da CI. Agora o uso
e muito mais amplo.
25. Reino: Animalia
Phylum: Cordata
Subphylum: Vertebrata
Classe: Mammalia
Subclasse: Theria
Ordem: Primata
Subordem: Arthropoidea
Família: Hominidae
Gênero: Homo
Espécie: Sapiens
Exemplo de zootaxonomia
Taxonomia linneana dos seres vivos – classificação dos humanos
Fonte: Breitman.- Web Semântica, p.34
26. Características das taxonomias
Estrutura classificatória hierárquica: (contexto
conceitual) com determinados níveis de profundidade
Rótulos de entrada: lista de termos que dão nome aos
conceitos. São os elementos da estrutura, agrupados em
blocos temáticos
Admite facetas não hierárquicas: equivalências e até
alguma associação, pois dão dinamismo e pluralidade de
enfoques aos assuntos
27. Características das taxonomias
Em quanto vocabulário: a taxonomia é uma lista ordenada de
termos controlados segundo um esquema hierárquico.
A taxonomia reflete seu contexto de aplicação.
É dinâmica na adaptação às mudanças que ocorrem continuamente.
A presença, exclusão ou alteração de termos utilizados obriga a
taxonomia a ter facilidade de modificação.
28. Características das taxonomias
Tesauros → os termos têm justificação documentária e
disciplinar. Nas taxonomias o usuário os certifica
O conteúdo é representado mediante termos
autorizados pelo uso entre os usuários
Taxonomias = meios de acesso, pois atuam como mapas
conceituais dos assuntos solicitados em um serviço de
recuperação: buscando categorizá-las, folheá-las e navegar
por elas
29. As taxonomias sempre tem organizado recursos de
informação.
Agora aplicam-se aos recursos digitais que empresas e
instituições custodiam nos seus servidores Web para
categorizá-los e navegá-los.
Ajudam aos usuários e clientes a encontrar produtos e
serviços. E para melhor representar as suas necessidades
de informação.
As empresas, organizações e serviços da administração
pública as usam, cada vez mais, para sistematizar a gestão
de conteúdos e os SOC.
30. Ex. de esquema de relacionamento
Classe Subclasse Espécie
Carros
Camionetes MPV
4x4
van
Carros esportivos grande turismo
roadster
superesportivo
Turismos familiar
sedan
31. Ex. de organizações de caráter taxonômico na vida diária
Guia de restaurantes de Madrid por tipo de cozinha
• Africano (4)
• Etíope
• Habesha
• Fedra
• Gonder
• Senegalés
• Casamansa
• Alemán (1)
• Kruger
• Andaluz (18)
• Carmen
• La Quimera
• Surtopía
• …
• Arrocería (26)
• L’Albufera
• …
32. Taxonomia da OIT/ILO
Exemplo relevante por facilitar a navegação visual, o controle
terminológico e o uso prático.
Estrutura: reflete o programa de trabalho da OIT.
Uso: Departamentos da OIT. Escritórios exteriores.
Fim: descrever o conteúdo de suas páginas web e realizar pesquisas na
web da OIT.
Aplicação complementar: sistema de classificação por assunto para
organizar coleções em pequenas bibliotecas ou centros de informação
laboral.
Tamanho: 400 termos organizado em 25 macroclasses.
http://www.ilo.org/public/spanish/support/lib/tools/tax
onomy.htm
33. Taxonomias Law
Com amplo reconhecimento no setor jurídico, a taxonomia de
blogs de Direito “Law X.0” (Acima de 600 blogs classificados
em oito grandes categorias, alguma das quais alcança até
treze subdivisões:
http://3lepiphany.typepad.com/3l_epiphany/2006/03/taxonomy
_overfl_79.html
34. Progressão taxonomica
Uso pelas entidades públicas e privadas de taxonomias terminológicas,
mas agora expansivas e multinivel.
Benefícios
• Alta usabilidade pela simplicidade da estrutura hierárquica para
organizar seus recursos terminológicos.
• Conforto de navegação na web.
• Bom ajuste para os requisitos de cada tipo de entidade.
• Fácil atualização.
Requisitos
• Integração no programa informático de cada entidade para que os
dados sejam interativos.
• Que a segurança, interesse da aplicação e utilidade prática sejam
garantidos através da padronização por agências internacionais.
35. Progressão taxonômica
Possibilitam a gestão estratégica da informação corporativa.
Frente às taxonomias unicamente terminológicas:
• Têm uma estrutura mais simples.
• Menor número de etiquetas.
• Muito mais interoperáveis.
• Totalmente estandardizadas.
• Estão ligadas aos objetos de informação.
Claro, são corretas para a cooperação interagências na web semântica.
36. Representação da hierarquia numa taxonomia
Varias possibilidades de representar os níveis
hierárquicos:
Hierarquias multinível.
Estrutura arborescente.
Estrutura de macrotérminos.
Estrutura hierárquica bidirecional.
Categorias genéricas.
Facetada.
Redes semânticas.
39. Enlaces en la web semántica
Aunar distintos recursos que existen en diferentes sistemas o
servicios de información digital basados en Web (diccionarios,
taxonomías, tesauros, ontologías, esquemas de clasificación,
etc): NKOS (Network Knowledge Organization
Systems/Services).
La web semántica necesita:
Lenguajes formales como: (DAML+OIL), RDF, OWL, etc.
Metadatos y esquemas de metadatos.
Ontologías: tanto específicas de un dominio, como ontologías de
alto nivel de tal forma que se proporcionen relaciones entre
ontologías para la recuperación, el intercambio y la integración
de la información interdisciplinar en la Web.
40. Enlaces en la web semántica
Significados legiveis por máquina (codificar a
“semântica de mundo”).
XML (eXtended Markup Language):
Standard de representação, metalinguagem para ol
intercambio de dados/informação na web.
Desde o ponto de vista estritamente informático: XML
não aporta semântica.
Por isso precisa: metadados e ontologias (semântica).
41. Redes semânticas
Os nós de uma Rede Semântica estão unidos por
elos, que indicam a relação que existe entre eles
Nó Nó
come (elo)
-----------------------→
Agente Objeto
João Pipoca
42. Mapas conceituais
No são SOC, mas anteciparam a representação do
conhecimento em gráficas cognitivas → redes de conceitos
Baseamento: O conhecimento representa-se por frases
simples e estruturadas:
Sujeito - verbo – predicado;
Como uma associação:
conceito → relação → conceito
Conceito: nós (pontos / vértices)
Relação: união (elos / arcos / extremos / satélites)
43. RDF: modelo de grafo
Estrutura das sentencias em RDF: tripla de relação sujeito-predicado-objeto
Grafo: representação onde sujeitos e objetos > nodos
propriedades ou predicados > elo de relação
Expressão das triplas RDF: sujeito -> predicado -> objeto. O grafo é unidirecional
http://www.uc3m.es
Criador
Universidad Carlos III
Sujeito ObjetoSujeito
Predicado
44. Paralelismo = grafos de redes semânticas com a
criação de sentencias RDF
As partes da sentencia ou declaração chamam-se:
Sujeito: recurso ou cosa sobre o qual versa a declaração
Predicado: propriedade ou característica do sujeito que se
expressa mediante esta declaração (criador, idioma, data de
criação)
Objeto: valor da propriedade a qual refere-se o predicado
45. Taxonomias representativas
Existem muitas taxonomias relevantes para a prática financeira e contabilidade.
Em XBLR (eXtensible Business Reporting Language) intercâmbio, tratamento e
armazenamento de documentos financeiros standard. É uma aplicação XML.
Este formato incorpora as International Accounting Standards (IASs), e as NIIF para
PMS (Pequenas e medias empresas):
Taxonomias IAS-CI (desde 2003 com estandar IFRS), com versões.
Taxonomias IFRS.
Taxonomias nacionais.
CONTALOC
Codificação da taxonomia XBRL ao espanhol: http://www.ifrs.org/Use-
around-the-world/IFRS-translations/Pages/IFRS-Taxonomy-in-Spanish.aspx
46. Taxonomias representativas
IFRS: número de etiquetas é limitado → empresas podem expandir as suas próprias
etiquetas.
A taxonomia fixa as informações que devem mostrar os documentos
financeiros.
Tecnologia inclusiva com um alto nível de desenvolvimento tecnológico e a
concordância dos membros que as usam oficialmente.
Facilitam e simplificam a troca de informações dentro de uma empresa, com
outras organizações, com os usuários e com os reguladores
47. Taxonomias representativas. Setor da saúde
OMS → dicionário e taxonomia estandardizados de erros médicos e insuficiências
dos sistemas de cuidados de saúde.
Os conceitos sobre a segurança do paciente variam de um país para outro →
imprescindível facilitar a colaboração e troca de informações entre os países.
Resultado: Classificação Internacional para a Segurança do Paciente feita a partir de
Taxonomia da segurança do paciente (2004).
Importância do acordo linguístico e conceitual.
Agrupa os termos controlados em dez macroclasses e 48 macrodescritores.
Os termos preferidos formam um glossário com definições. Aparecem relacionados
hierarquicamente dentro de uma ontologia de domínio explícita.
Exemplo:
http://www.who.int/patientsafety/implementation/icps/icps_full_report_es.pdf
48. Taxonomias representativas. Setor da saúde
Taxonomias padronizados para que todos os profissionais de enfermagem
participem de uma linguagem comum e inequívoca.
Plano de cuidados segundo a taxonomia NANDA: os sete Diagnósticos de
Enfermagem selecionados desde os critérios de desempenho, intervenções e
atividades interdisciplinares.
As etiquetas diagnósticas de NANDA relacionasse com a taxonomia de Critérios de
resultados NOC e com a taxonomia NIC para classificar as intervenções de
enfermagem.
49. Taxonomias representativas. Setor da saúde
Exemplo do Listado de Diagnósticos Taxonomia NANDA
(http://enfermeriaactual.com/listado-de-diagnosticos-nanda/).
(00137) Aflicción crónica
La persona (familiar, cuidador o individuo con una enfermedad o discapacidad crónica)
presenta un patrón cíclico, recurrente y potencialmente progresivo de tristeza omnipresente
en respuesta a una pérdida continua en el curso de una enfermedad o discapacidad.
Factores relacionados:
- Muerte de un ser querido.
- La persona experimenta uno o más acontecimientos desencadenantes (crisis en el
manejo de la enfermedad, crisis relacionadas con edades de desarrollo y oportunidades
perdidas)….
(00071) Afrontamiento defensivo
(00074) Afrontamiento familiar comprometido…
50. Organização semântica de repositórios de objetos de aprendizagem
Ordenação de recursos em uma plataforma para associa-los com as
disciplinas e usá-los.
Integram as taxonomias tradicionais de aprendizagem (Bloom, ...).
Suportam objetos de aprendizagem para permitir a reutilização,
flexibilidade, acessibilidade e adaptabilidade (Taxonomia de tipos de
objetos de aprendizagem).
Agrupados conter metadados que facilitam a classificação de
materiais.
Atualizando a Taxonomia de Bloom, impulsionado por novas
atividades, aprendizagem e casos de comportamento que estão
aparecendo como digital é alargar a sua utilização (e Krathwohl
ANDERSON, 2001).
51. Comentários finais
A utilização institucional das folksonomias causa a contradição de
transitar desde as palavras-chave para as classificações.
No caso das taxonomias tem evoluído desde o caráter solo terminológico
e desde a representação plana para a representação semântica, então
ontológica.
Mucha gracias por su atención