Mais conteúdo relacionado
Semelhante a Melhores Praticas de Busca WebSphere Portal 8 (20)
Melhores Praticas de Busca WebSphere Portal 8
- 1. Melhores Práticas de Busca no
WebSphere Portal
Érick Waldstein
IT Specialist
IBM Certified Application Developer - Web Content Manager 8.0
© 2013 IBM Corporation
- 2. Agenda
•
•
•
•
•
1
Como funciona um mecanismo de busca
Serviços, Coleções e Escopos
O novo Centro de Procura
Melhorando seus resultados
Implementando uma busca local
© 2013 IBM Corporation
- 5. Busca por conteúdo - Crawlers
Crawlers são softwares criados para navegar
automaticamente por uma lista de endereços web e
adicionar seus conteúdos a um banco de dados.
4
© 2013 IBM Corporation
- 6. Indexação de conteúdo - Índice
Os motores de busca formam ligações entre palavrachave e conteúdo da página rastreada. Essas ligações
são chamadas de índices.
5
© 2013 IBM Corporation
- 7. Organização da informação
Todos os índices são agrupados por palavra-chave,
tonando mais fácil a entrega dos resultados.
Todo o conteúdo é indexado com sua
TAG HTML básica, isso ajuda na
formação da relevância.
6
© 2013 IBM Corporation
- 8. Devolução da informação
Todo motor de busca tem seu algoritmo de entrega.
Esse algoritmo é o responsável por ler os índices, ler as
urls e em cima de inúmeras variáveis, entre elas o
HTML base gravado, mostrar todos os
resultado encontrados por ordem
de relevância.
7
© 2013 IBM Corporation
- 11. Tipos de serviço
Para o WebSphere Portal, “serviços” são motores de
busca que podem executar uma ou mais coletas em
servidores locais ou remotos. O portal conta com
dois tipos de serviços, o Serviço Padrão
e o Serviço Customizado.
10
© 2013 IBM Corporation
- 14. Melhor tipo para seu projeto
Web Site é a melhor escolha para portal remoto. Este crawler consegue
indexar páginas e portlets em servidores remotos. Única opção que habilita a
utilização de roboots.txt pelo próprio portal.
Portal Site é a melhor opção para ambientes locais.
Indexa páginas e portlets em servidor local. Não
faz utilização de arquivo roboots.txt.
WCM Site é voltado para portais focados
na parte de conteúdo. Indexa conteúdo e
documentos das bibliotecas de conteúdo
inseridas na url de configuração da lista de
coleta.
13
© 2013 IBM Corporation
- 15. Melhor tipo para seu projeto
Seedlist é utilizado em casos onde o servidor recebe um arquivo de links para
ser seguido, os chamados seedlists. Usualmente são listas em formato feed
ou ATOM, gerado por aplicações em outros servidores.
Obs.: Caso o projeto tenha que fazer uso de uma
combinação de coleções em um mesmo serviço,
o administrador deve observar se não haverá
repetição de resultados.
14
© 2013 IBM Corporation
- 16. Escopos de procura
Os escopos de procura servem para que o usuário
possa definir um universo menor de coleções para sua
busca.
Esta opção fica disponível no novo
portlet Central de Busca.
15
© 2013 IBM Corporation
- 18. Oque é o Portlet Centro de Procura?
O portlet Centro de Procura veio para substituir o
“Procura e Navegação”. Ele agora é o responsável pela
exibição dos resultados de procura para o Portal 8.
Alguns recursos foram adicionados
como a busca por tag, relevância
do resultado, links sugeridos,
ordenação por data e relevância,
etc...
17
© 2013 IBM Corporation
- 23. Como melhorar meus resultados
1. Utilize URLs amigáveis;
2. Utilize nomenclatura para as páginas em vários
idiomas;
3. Tente utilizar uma descrição para
suas páginas do portal;
4. Você tem a opção de configurar
um campo diferente no seu “AT”
para servir como descrição.
22
© 2013 IBM Corporation