Criação de um motor de busca

DarkWolfXP

Power Member
Boas, eu pretendo criar um motor de busca para uma pequena lista de sites.
Basicamente gostaria de saber se conhecessem algum tutorial em que explique os passos e os conhecimentos necessários para a criação de um motor de busca (consequentemente spider/bots).
Alguma sugestão por onde começar? Eu ja andei a pesquisar no google para ver se encontro algum tutorial mas até agr nd, obtive foi bastante informação de como funciona.
Cumprimentos
 
EDIT:Bem fiz o upload do Lucene, mas no entanto acho que o meu servidor n está a correr aplicações java...
Encontro-me num alojamento partilhado (pago) gostaria de saber se alguem souber... o que preciso para correr as aplicações Java no meu servidor?

EDIT2: tb ja testei um projecto open source chamado Sphider feito em PHP, mas n gosto muito visto que o sempre que faço a indexação ele volta a percorrer todo o caminho e perde-se muito tempo :(
 
Última edição:
Penso que não vais encontrar mais nenhum projecto open source que esteja ao mesmo nível do Lucene.

Em relação às aplicações Java, vais ter que fazer deploy das mesmas para um contentor web, como por exemplo, o Tomcat.
 
Hm, deploy como assim?
Tomcat só posso instala-lo no meu PC, como tinha dito o alojamento é partilhado pelo que deduzo que n tenho permissão para instalar o Tomcat no servidor.
 
Última edição:
Pois no meu servidor n consigo instalar o tomcat, pk é partilhado... em principio vou arranjar um servidor VPS e testa-lo.
O lucene faz re-index automaticamente? ou preciso de executar um comando? Caso necessite de executar um comando n será pouco prático?
 
Tenho ideia de que só faz no startup. De qualquer forma, deve haver uma opção qualquer para melhorar esse processo. Penso que a Wikipedia usa o Lucene, portanto deve haver alguma forma de automatizar o que pretendes.
 
Back
Topo