Após a leitura do artigo de Regina Branski, Recuperação de Informações na Web, foi realizada a atividade de um resumo crítico. Este resumo é de autoria minha, baseado em informações secundárias, através de outras leituras realizadas por mim que se encontram disponíveis nas referências.
Produzido para disciplina de pesquisa bibliográfica.
1. BRANSKI, Regina Meyer. Recuperação de Informações na Web. Belo Horizonte:
Perspectivas em Ciência da Informação v.9, p.70-87, 2004.
O artigo Recuperação de Informações na Web, de Regina Branski destaca um
conjunto de procedimentos e relatos para orientar os membros da comunidade acadêmica
e leitores de forma geral no que diz respeito ao processo de busca de informações na
web.
Primeiramente, a autora relembra que com o advento da internet, a quantidade de
documentos cresceu exponencialmente de tal forma que ficou inviável a indexação de
todas as páginas da web manualmente. Foi então que os desenvolvedores viram a
necessidade de criar ferramentas para que melhorassem os mecanismos de busca e
ficassem acessível aos usuários, inclusive os inexperientes.
Em sua fundamentação, Branski (2004) explica ao leitor que as informações ficam
armazenadas em bases de dados e não, diretamente na internet.
O artigo consiste em dezessete páginas e está estruturado com os seguintes
elementos: resumo; palavras-chave; introdução; desenvolvimento, este por sua vez
possui dois tópicos gerais subdivididos em itens; conclusão e referências. O primeiro
tópico refere-se aos buscadores e como funcionam. Por conseguinte, a autora apresenta
outras formas de localizar informação na web.
A autora diz que existem duas abordagens de sistema de busca: por diretórios e por
programas de busca.
De acordo com Branski (2004, p.73) um diretório é configurado de modo que as
informações sejam organizadas e classificadas hierarquicamente em categorias (das mais
amplas para as mais específicas). Para Figuereido (2006) o método utilizado por
diretórios traz desvantagens. Segundo este mesmo autor:
Se o usuário deseja fazer uma busca de um determinado assunto que não se
enquadra dentro de nenhuma categoria pré-estabelecida, ou se o assunto é uma
combinação de categorias, o resultado obtido pode não ter a precisão desejada.
(FIGUEREIDO, 2006, p.26).
Os programas de busca utilizam três componentes: um programa de computador
(softwares), banco de dados (também conhecido como catálogo) e um programa de
busca. Para Figuereido (2006, apud YAMAOKA,2002, p.31) cada qual responsabiliza-se
por uma função, onde o software localiza os documentos, o banco de dados possui o
âmbito de indexar, ou seja, extrair a informação desses documentos e o programa de
busca, que faz a interface com usuário, assim sendo, oferece o resultado ao mesmo.
Branski (2004) reforça em sua fala que o resultado de uma pesquisa utilizando cada
um desses métodos será diferente. Ela ainda complementa, “a utilização de mais de uma
2. ferramenta garante uma maior cobertura e, possivelmente um resultado mais
satisfatório”(p.75).
Os mecanismos de busca possuem características próprias para a recuperação
da informação, variando de mecanismo para mecanismo. Entretanto, a maioria
utiliza dois níveis de especificação de expressão de busca: básico e avançado.
[...]Cada mecanismo de busca aceita um grupo de operadores lógicos específicos.
(FIGUEREIDO, 2006, p.48-49).
Logo, a familiaridade com as ferramentas é necessária para extrair todo seu potencial,
e consequentemente otimizar o tempo de pesquisa ou garantir um resultado de melhor
qualidade. Para isso, a autora traz algumas técnicas de refinamento de pesquisa que
encontram-se disponíveis (ver quadro I-refinamento e suas funções e quadro II-
refinamentos aceitos por buscadores selecionados, p. 76 -77).
O segundo tópico geral consiste em apresentar as outras formas de localizar as
informações na web; onde a autora sugere algumas opções: mecanismos de busca
especializados, bibliotecas virtuais, mecanismos de metabusca, web oculta.
Conforme Branski, os mecanismos de busca especializados ou temáticos restringem-
se a documentos de um campo específico apresentando assim resultados mais
relevantes num tempo de pesquisa menor. Silva, Santos e Ferneda (2013, p.40) definem
a relevância da seguinte maneira “[…] Sendo algo subjetivo e inerente ao julgamento do
usuário, dependerá da interação com o mesmo com o sistema e, principalmente, ao que
de fato ele espera recuperar em sua busca”. Para Souza (2006):
Um dos problemas centrais na recuperação de informações em SRIs é a
predição de quais são os documentos relevantes e quais devem ser descartados,
e essa tarefa de escolha, em sistemas automatizados é executada por algum tipo
de algoritmos, estes decidem a relevância do documento a ser recuperado a partir
de critérios estabelecidos. (SOUZA,2006, p.164).
Na opinião de Branski (2004), as bibliotecas virtuais são as melhores fontes por
oferecerem uma coleção de recursos (sejam estes, jornais, periódicos, livros e outras
publicações) que são organizados por indivíduos qualificados. De acordo com Silva,
Santos, Ferneda (2013, apud BREITMAN, ano, p.35) “A ideia central é categorizar a
informação de maneira padronizada, facilitando seu acesso […] na intenção de
estabelecer um modelo estruturado para organizar a desordem informacional da internet”.
E a biblioteca virtual vai de encontro com essa definição dada por Breitman.
Outra forma de pesquisar a informação é através de mecanismos de metabusca ou
metapesquisadores, também conhecidos por metabuscadores. A definição dada por
Figuereido (2006), também em consonância com a da autora, é que são sistemas que
permitem a execução de uma mesma busca em mais de uma ferramenta (mecanismos ou
diretórios), podendo exibir simultaneamente numa só lista todos os resultados
3. encontrados nos outros buscadores. Branski (2004) diz que estes, são agentes
intermediários. No entanto, cita os como deficiente pela forma como apresentam os
resultados e pela incapacidade de manipular pesquisas complexas. Segundo a mesma, a
principal vantagem é quando se deseja obter um número pequeno de resultados
relevantes; o que discordo, pois acredito que o usuário utilize das ferramentas para
melhorar sua qualidade de pesquisa, quanto mais informações relevantes, melhor;
localizar tópicos pouco explorados ou ter uma visão geral dos documentos disponíveis na
web sobre determinado assunto.
Branski (2004) ressalta que os conteúdos armazenados constituem apenas parte da
informação disponível na internet, muitos deles encontram-se na web oculta, e explica o
motivo dessa “invisibilidade” dando duas razões para estes sites estarem fora do banco
de dados de grande parte dos buscadores. A primeira, por questões técnicas que
impedem o acesso dos spiders alguns tipos de sites. E depois, por decisão dos
administradores dos mecanismos de busca. Por fim, as informações da web oculta
representam algumas das mais valiosas disponíveis na web. De acordo com Figuereido
(2006, apud ARAÚJO, 2001, p.54):
Boa parte da informação da web oculta ou profunda está em banco de dados
de organizações governamentais, instituições de ensino e pesquisa e constitui
fonte utilíssima e de qualidade para pesquisa bibliográfica. Além disso, essa
informação geralmente existem em banco de dados específicos para
determinadas áreas do conhecimento […] o que a torna mais relevante para
pesquisadores dessas áreas.(ARAÚJO,2001).
A proposta que a autora traz com a presente publicação se faz necessária na vida
acadêmica pois grande parte dos usuários da web são leigos no que diz respeito a saber
como localizar informações através de ferramentas de busca. E, principalmente no círculo
acadêmico essa compreensão e manipulação da informação torna-se fundamental para
trabalharmos com dados científicos. A autora trouxe algumas possibilidades para estes
usuários tendo por intuito demonstrar a gama de recursos oferecidos para otimizar o
tempo e elaborar uma estratégia de pesquisa. Em suma, concordo com a colocação de
Figuereido (2006, p.60) que a eficiência do tratamento de informações da web não
depende somente de tecnologias, mas do uso das mesmas por parte de indivíduos
capacitados.
Regina Meyer Branski é Professora Doutora no Departamento de Engenharia de
Minas e Petróleo (PMI) na Escola Politécnica (POLI) da Universidade de São Paulo (USP)
desde 2014. Possui Doutorado em Engenharia de Produção pela POLI/USP (2008), e
Mestrado em Economia (1992), Graduação em Ciências Econômicas (1982) e
Licenciatura em Matemática (1980) pela Universidade Estadual de Campinas. Trabalhou
4. como pesquisadora no Instituto de Economia (de 1988 a 2008) e no Laboratório de
Aprendizagem em Logística e Transporte da Faculdade de Engenharia Civil da UNICAMP
(de 2008 a 2013). A autora publicou várias obras, dentre as quais pode-se citar,
Tecnologia da informação e integração das redes logísticas, Localizações de informações
na internet: características e forma de funcionamento dos mecanismos de busca, entre
outras.
Sthéfany Cechinel, Acadêmica do Curso de Secretariado Executivo da Universidade
Federal de Santa Catarina (UFSC).
Referências:
BRANSKI, Regina Meyer. Recuperação de Informações na Web. Belo Horizonte:
Perspectivas em Ciência da Informação, v.9, p.70-87, 2004. Disponível em:
<http://www.brapci.inf.br/_repositorio/2010/11/pdf_7b0e618ad3_0012984.pdf> Acesso em:
21.Ago. 2015.
FIGUEREIDO, Dayana Ester Andrade. Recuperação da Informação: uma análise
sobre os sistemas de busca da web. Brasília:CID/UNB, 2006. Disponível em:
<http://www2.senado.leg.br/bdsf/bitstream/handle/id/70270/Monografia_.pdf?
sequence=5>. Acesso em: 21. Ago. 2015.
SOUZA, Renato Rocha. Sistemas de recuperação de informações e mecanismos de
busca na web: panorama atual e tendências. Perspect. ciênc. inf., Belo Horizonte, v. 11,
n. 2,p. 161-173, ago. 2006. Disponível em: <http://www.scielo.br/scielo.php?
script=sci_arttext&pid=S1413-99362006000200002&lng=en&nrm=iso>. Acesso em: 21
Ago. 2015. http://dx.doi.org/10.1590/S1413-99362006000200002.
SILVA, Renata Eleuterio da; SANTOS, Plácida Leopoldina Ventura Amorim da Costa;
FERNEDA, Edberto. Modelos de recuperação de informação e web semântica: a questão
da relevância. Informação & Informação, [S.l.], v. 18, n. 3, p. 27-44, out. 2013. ISSN
1981-8920. Disponível em:
<http://www.uel.br/revistas/uel/index.php/informacao/article/view/12822>. Acesso em: 21
Ago. 2015. doi:10.5433/1981-8920.2013v18n3p27.