1. Este site usa cookies. Ao continuar a usar este site está a concordar com o nosso uso de cookies. Saber Mais.

Criação de um motor de busca

Discussão em 'Web Development' iniciada por DarkWolfXP, 5 de Dezembro de 2008. (Respostas: 6; Visualizações: 822)

  1. DarkWolfXP

    DarkWolfXP Power Member

    Boas, eu pretendo criar um motor de busca para uma pequena lista de sites.
    Basicamente gostaria de saber se conhecessem algum tutorial em que explique os passos e os conhecimentos necessários para a criação de um motor de busca (consequentemente spider/bots).
    Alguma sugestão por onde começar? Eu ja andei a pesquisar no google para ver se encontro algum tutorial mas até agr nd, obtive foi bastante informação de como funciona.
    Cumprimentos
     
  2. AliFromCairo

    AliFromCairo Power Member

    Boas, dá uma vista de olhos no Apache Lucene.
     
  3. DarkWolfXP

    DarkWolfXP Power Member

    EDIT:Bem fiz o upload do Lucene, mas no entanto acho que o meu servidor n está a correr aplicações java...
    Encontro-me num alojamento partilhado (pago) gostaria de saber se alguem souber... o que preciso para correr as aplicações Java no meu servidor?

    EDIT2: tb ja testei um projecto open source chamado Sphider feito em PHP, mas n gosto muito visto que o sempre que faço a indexação ele volta a percorrer todo o caminho e perde-se muito tempo :(
     
    Última edição: 5 de Dezembro de 2008
  4. AliFromCairo

    AliFromCairo Power Member

    Penso que não vais encontrar mais nenhum projecto open source que esteja ao mesmo nível do Lucene.

    Em relação às aplicações Java, vais ter que fazer deploy das mesmas para um contentor web, como por exemplo, o Tomcat.
     
  5. DarkWolfXP

    DarkWolfXP Power Member

    Hm, deploy como assim?
    Tomcat só posso instala-lo no meu PC, como tinha dito o alojamento é partilhado pelo que deduzo que n tenho permissão para instalar o Tomcat no servidor.
     
    Última edição: 7 de Dezembro de 2008
  6. DarkWolfXP

    DarkWolfXP Power Member

    Pois no meu servidor n consigo instalar o tomcat, pk é partilhado... em principio vou arranjar um servidor VPS e testa-lo.
    O lucene faz re-index automaticamente? ou preciso de executar um comando? Caso necessite de executar um comando n será pouco prático?
     
  7. AliFromCairo

    AliFromCairo Power Member

    Tenho ideia de que só faz no startup. De qualquer forma, deve haver uma opção qualquer para melhorar esse processo. Penso que a Wikipedia usa o Lucene, portanto deve haver alguma forma de automatizar o que pretendes.
     

Partilhar esta Página