1. Relembrando fundamentos
da representação temática
Universidade Federal do Rio Grande (FURG) Disciplina
Indexação: T & P (2013)
Profa. Gisele Dziekaniak
giseledziekaniak@yahoo.com.br
http://indexacaoteoriaepraticafurg.blogspot.com.br/
2. Classificação
Para James Duff Brown a classificação é umPara James Duff Brown a classificação é um
“processo mental” constantemente executado de“processo mental” constantemente executado de
forma consciente e inconsciente por qualquer serforma consciente e inconsciente por qualquer ser
humano, ainda que não reconhecido como tal.humano, ainda que não reconhecido como tal.
Para Piedade (1983, p. 16) “Classificar é dividir em
grupos ou classes, segundo as semelhanças e
diferenças.”
Para Ranganathan classificar era traduzir o nome
dos assuntos dos documentos da linguagem natural
para a linguagem artificial adotada pelos sistemas de
classificação bibliográfica. (PIEDADE, 1983)
3. Característica, classe e categoria
Característica
Qualidade ou atributo escolhido para servir de base à
classificação ou à divisão.
Pode-se classificar adotando características distintas
para o mesmo objeto. Exemplos:
Livros
- Tamanho
- Cor
- Língua
- Assunto
“Há tantas possibilidades de classificar quantas forem as
semelhanças e diferenças existentes entre os objetos
ou ideias a classificar.” (PIEDADE, 1983, p. 17)
■ Literatura
- Lugar
- Língua
- Período
4. Classificação cruzada
Pode-se classificar adotando várias
características, mas empregando uma de
cada vez e aplicando-a a todos os membros
da classe. Ex.: característica Sexo para
dividir animais racionais, não poderemos
empregar, ao mesmo tempo, a característica
faixa etária.
O emprego simultâneo de mais de uma
característica se chama Classificação
cruzada, quando as classes não são
mutuamente excludentes, gerando confusão.
6. Classificação cruzada
Exemplo incorreto: Se empregássemos, ao
mesmo tempo duas características (Língua e
lugar)
Literatura
____________________________________
Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.
portuguesa espanhola
7. Característica, classe, categoria
Classe
É o conjunto de coisas ou ideias que possuem
um ou vários atributos, predicados ou
qualidades em comum. Ex.: Mamíferos,
Vertebrados, Canários, Animais.
Categoria
São as maiores classes de fenômenos, as
classes mais gerais que podem ser formadas.
São as grandes classes. Ex: na categoria Lugar,
pode-se distinguir as facetas: Lugar físico,
Lugar político, Orientação (norte, sul etc.).
8. Aristóteles e a classificação
Aristóteles dividiu o conhecimento com base
em três critérios (NUNES, 2007):
Critério de ausência ou presença do homem
nos seres investigados;
critério de imutabilidade e
critério de modalidade prática.
Trata-se de uma hierarquização conceitual
que divide um tema geral em espécies a
partir de uma característica classificatória.
9. Aristóteles e a classificação
Aristóteles desenvolveu um sistema filosófico
baseado em uma concepção rigorosa do Universo.
Em seus tratados biológicos, apresentou o sistema
de classificação dos animais que não se encontrava
completo e que, originariamente em número de
quatro, foram os seguintes:
Gênero
Espécie
Diferença
Propriedade, e
Acidente.
11. Porfírio e a classificação
A partir de Aristóteles, Porfírio descreve como as
qualidades atribuídas às coisas
podem ser classificadas,
quebrando o conceito filosófico
da substância como um
genus/espécie do
relacionamento:
12. Bacon e a classificação
Na classificação baconiana, apesar de
algumas de suas classes e divisões se
tornarem imbricadas, este sistema foi
considerado um dos mais influentes nas
diversas tentativas feitas para classificar o
conhecimento. A classificação de Bacon está
baseada na figura abaixo:
13. Bacon e sua classificação
MIR (Memória, Imaginação e Razão)
Foi a base
para a criação
da CDD
15. Etapas do tratamento temático
Análise de assunto
Processo de ler um documento para extrair
conceitos que traduzam a essência do seu
conteúdo. (DIAS, NAVES, 2007, p. 9)
Envolve cultura do indexador, experiência,
conhecimento linguístico, cognitivo e lógico.
Também chamada de análise conceitual,
análise documentária, análise da informação e
subject analysis.
16. Etapas do tratamento temático
1) Fases da Análise de assunto
Leitura técnica do documento (leitura
documental)
Extração de conceitos que representam a obra
Atinência - termos em LN (do que trata a obra?)
Sugestão de leitura: Dias e Naves (2007)
17. Etapas do tratamento temático
2) Tradução
Passagem dos termos de linguagem natural
(LN) para linguagem artificial/documentária
(LA/LD).
Eleição descritores autorizados pela LD
(cabeçalhos de assunto, palavras-chave,
termos de indexação).
Sugestão de leitura: Lancaster (2004)
18. Análise documentária
“A análise documentária é definida como um
conjunto de procedimentos efetuados com o
fim de expressar o conteúdo dos
documentos, sob formas destinadas a
facilitar a recuperação da informação.” (DIAS,
NAVES, 2007, p. 11)
Metainformação (informação da informação)
19. Leitura do bibliotecário (LUCAS, 2000)
Questões ideológicas
Equívoco da neutralidade
Ilusão da completude
Sujeitos leitores
Organizam arquivos
Autorizados a ler, escrever e interpretar
Tipos de leitura
Como apreensão do documento (literal)
Como leitura interpretativa
Dica de leitura:
Lucas (2000)
22. Recuperação da Informação - RI
Information Retrieval: Termo cunhado por Calvin
Mooers (década de 1950) que engloba aspectos
intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer
sistemas, técnicas ou máquinas empregados para o
desempenho da operação.
É a responsável pela criação e desenvolvimento da
Ciência da Informação. (SARACEVIC, 1996)
O objetivo é recuperar informações através da busca
por alguma entrada catalogada a priori.
23. Sistema de Recuperação da
Informação - SRI
Um sistema de informação coleta, processa,
armazena, analisa e dissemina informações e é
constituído por um conjunto de componentes
relacionados entre si. (GROSSI, 2008).
São sistemas de operações interligadas para
identificar dentre um grande conjunto de
informações, aquelas que sejam úteis, de acordo
com a demanda expressa pelo usuário. (LOPES,
2002)
Objetivo de um SRI é permitir que um usuário
recupere documentos através de características
como: autor, título, assunto ou qualquer combinação
desses elementos.
24. Atividades em um SRI
Representação das informações contidas nos
documentos;
Armazenamento;
Gestão física e/ou lógica desses documentos
e de suas representações;
Recuperação da informação representada e
dos próprios documentos armazenados
(links).
Disseminação da informação.
25. Sistema de Recuperação da
Informação - SRI
“Localização de documentos e itens de
informação que tenham sido objeto de
armazenamento.” (ROWLEY, 2002, p. 114)
Para Cendón (2006) catálogos de bibliotecas,
bases de dados bibliográficas, e motores de
busca na internet são exemplos de SRI.
(GROSSI, 2008)
26. Subsistemas dos SRIs
Subsistemas de entrada:
Seleção/aquisição, descrição, representação,
organização de arquivos, armazenamento.
Subsistemas de saída:
Análise e negociação de questões, estratégia de
busca/recuperação, disseminação/acesso ao
documento.
Subsistema de avaliação:
Não se refere especificamente nem à entrada, nem à
saída, mas a ambos, ao sistema como um todo.
27. Avaliação dos SRI
Cobertura:
Representa quanto o sistema contém informações
relevantes.
Exaustividade:
Este conceito relaciona-se ao grau de profundidade
com que os assuntos dos documentos são
representados.
Precisão:
Relaciona-se com a proporção de itens recuperados
que são relevantes.
28. Avaliação dos SRI
Tempo de resposta:
É o intervalo médio entre o momento da consulta e a
apresentação do resultado.
Esforço do usuário:
É o esforço despendido para obter resultados na
busca.
Formato: como os resultados são apresentados. São
várias as características e tipologias comuns aos
diversos sistemas de recuperação da informação,
porém um módulo que todos devem possuir, por ser
fundamental, é o módulo de interface com o usuário.
(ARAUJO, 1994).
29.
30. Estratégias de busca em um SRI
Estratégia de busca é o conjunto de decisões
tomadas e de procedimentos adotados durante uma
busca.
É a técnica ou conjunto de regras para tornar
possível o encontro entre uma pergunta formulada e
a informação armazenada em uma base de dados.
(LOPES, 2002).
É a técnica ou conjunto de regras para tornar
possível o encontro entre uma pergunta formulada e
a informação armazenada em uma base de dados.
Uma boa estratégia de busca implica em conhecer a
base de dados, as fórmulas de busca, o assunto que
se busca e/ou a bibliografia que é objeto de busca.
Identificar a Necessidade de Informação (NI).
31. NI fórmula de busca = resultado SRI
Estratégia de busca
Resposta insatisfatória = RUÍDO
= Usuário insatisfeito
= Nova estratégia de busca
Resposta satisfatória = NI satisfeita
= Item recuperado
= usuário satisfeito
32. Objetivos da estratégia de busca
Recuperar um número suficiente de registros
relevantes e evitar que:
Sejam recuperados itens irrelevantes;
Sejam recuperados um número excessivo de
itens;
Sejam recuperados um número insignificante
de registros.
33. Problemas em recuperação da
informação
Os autores nem sempre usam as mesmas
palavras que os usuários para descrever o
mesmo conceito.
Má formulação da consulta.
34. Lógica de busca: Operadores
booleanos
AND E
OR OU
NOT NÃO
Os operadores booleanos tem por objetivo definir como será a combinação
feita entre os termos ou expressões de uma pesquisa.
35. Lógica de busca: Operadores
booleanos
OR/OU Amplia a pesquisa e tem a
intenção de buscar ou esse ou aquele
termo. Ou seja, qualquer uma das
palavras.
Exemplo:
A or B
A B
36. Lógica de busca: Operadores
booleanos
AND/E Restringe a pesquisa e
significa a expressão que tenha todas as
palavras. O resultado da busca deve
recuperar ambos os termos.
Exemplo:
A and B
37. Lógica de busca: Operadores
booleanos
NOT/NÃO Exclui um dos termos da
pesquisa. Equivale dizer: sem a seguinte
palavra.
Exemplo:
A not B
38. Lógica de busca: Operadores
booleanos
Podem ser usados em expressões mais
complexas, onde se adotam os parênteses.
Ex: (A or B) and C
A pesquisa será feita 1º combinando a OR b e o
resultado se combina com AND
40. Linguagem de indexação e de busca
Linguagem de indexação:
Termos ou códigos usados como pontos de acesso em
um índice.
Geralmente adota linguagem controlada (LC)
Linguagem de busca:
Termos que são usados por um consulente ao
especificar uma necessidade de busca.
Podem ser Linguagem natural (LN) ou LC, desde que o
usuário tenha acesso à linguagem documentária
adotada pelo sistema de recuperação da informação.
41. Linguagem natural e linguagem
artificial ou controlada (LOPES, 2002)
CONCEITUE LINGUAGEM NATURAL
É a linguagem usada habitualmente na fala e na escrita
representadas na base de dados pelos termos do título e
resumo.
CONCEITUE A LINGUAGEM CONTROLADA
É o conjunto de termos organizados de forma
hierarquizadas e/ou alfabética, com o objetivo de
possibilitar a recuperação de informação temáticas,
reduzindo substancialmente a diversidade de
terminologia.
Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informação
da área. Entrega: Próxima aula. (não esquecer de referenciar as fontes
adotadas).
42. Diferenças entre Linguagem natural
(LN) e linguagem controlada (LC, LC)
Linguagem natural ou livre
(LN)
Linguagem controlada (LC, LA,
LD)
Busca direta no texto Depende de uma LD
Usa linguagem comum do
usuário
Distancia-se da linguagem do
usuário
Oferece mais pontos de
acesso
Os pontos de acesso são
limitados pelo indexador
Oferece maior revocação Oferece menor revocação
Oferece menos precisão Oferece maior precisão
Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases
de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 e
CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.
43. Revocação e Relevância (Lancaster, 2004)
Revocação (recall)
Capacidade de um SRI em recuperar itens
existentes na base de dados.
Precisão mede quantos documentos
relevantes foram recuperados
Relevância (Precisão)
Capacidade de um SRI em recuperar itens
úteis ao usuário e minimizar a recuperação de
documentos inúteis.
44. Fórmulas para avaliar um SRI
(Revocação e Relevância)
Itens não
recuperados
Relevantes (D)
Itens não
recuperados
Relevantes (D)
Itens não
recuperados não
Relevantes (C)
Itens
recuperados
Relevantes (A)
Itens
recuperados não
Relevantes (B)
Revocação = relevantes recuperados/ total de itens relevantes
que existem no sistema
Precisão = relevantes recuperados/ total de itens recuperados
Revocação R= A / (A+D)
Relevância P = A / (A+B)
45. Revocação e Relevância
Esses dois parâmetros são inversamente
relacionados, significando que a melhoria de um
implica na piora do outro.
Tradicionalmente, existem dois fatores muito
importantes que governam a eficiência da indexação
de um documento e consequentemente, influenciam
na revocação e na precisão:
Exaustividade: Define o número de diferentes
conceitos (tópicos) que estão indexados.
Especificidade: Define o grau de precisão da
linguagem de indexação em descrever um dado
documento.
46. Referências
ARAUJO JUNIOR, R. H. Precisão no processo de busca e
recuperação da informação. Brasília: Thesaurus, 2004.
DIAS, M. M. L.; DIAS, E. W. Análise de assunto: teoria e
prática. Brasília: Briquet de Lemos, 2007.
GROSSI, M.G. R. Estudo das características de software e
implantação de um software livre para gerenciamento de
bibliotecas universitárias federais brasileiras. 2008. Tese
(Doutorado em Ciência da Informação) – UFMG, Belo
Horizonte, 2008.
LANCASTER, F. W. Indexação e resumos: teoria e prática.
2.ed. Brasília: Briquet de Lemos, 2004.
LOPES, I. L. Uso das linguagens controlada e natural em bases
de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-
52, jan./abr. 2002.
47. Referências
NUNES, L. Da Classificação das Ciências à
classificação da Informação: uma análise do acesso
ao conhecimento. 2007. Dissertação (Mestrado em
Ciência da Informação) - PUC de Campinas, 2007.
Disponível em <
http://www.bibliotecadigital.puc-campinas.edu.br/tde_busc
php?codArquivo=340 > Acesso em 22 nov. 2009
PIEDADE, M. A. R. Introdução à teoria da
classificação. Rio de Janeiro: Interciência, 1977.
ROWLEY, J. A biblioteca eletrônica. 2.ed. Brasília:
Briquet de Lemos, 2002.
SARACEVIC, T. Ciência da informação: origem,
evolução e relações. Perspec. Ci. Inf., Belo
Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.