[bots, crawl e motores de pesquisa] =- largura de banda
Boas,
Para evitar surpresas no consumo excessivo de largura de banda no meu site {numa hora 1GB!} por parte de bots fiz um script em php que a partir de certos padrões bania o pedido feito ao servidor.
Qual não foi o meu espanto quando hoje fui ver se havia alguma coisa na "rede" e lá estava num ficheiro criado com esse propósito 38.100.41.107 7-12-2007 às 17:23:26.
Isto traduz-se em Performance Systems International e ao investigar no google encontrei mais queixas acerca deste bot.
Isto é um problema que pode afectar qualquer um, pretendia saber se alguém já se deparou com o problema, que soluções tem, etc...
Usando o .htaccess das duas uma:
Também há o robots.txt no entanto os bots só o respeitam se quiserem.
Para a solução 2, visto ser a mais radical (e a mais fácil), para além do msn, yahoo, e google que outros bots devo permitir o acesso?
Como detectar um bot/acesso_não_humano em PHP?
Boas,
Para evitar surpresas no consumo excessivo de largura de banda no meu site {numa hora 1GB!} por parte de bots fiz um script em php que a partir de certos padrões bania o pedido feito ao servidor.
Qual não foi o meu espanto quando hoje fui ver se havia alguma coisa na "rede" e lá estava num ficheiro criado com esse propósito 38.100.41.107 7-12-2007 às 17:23:26.
Isto traduz-se em Performance Systems International e ao investigar no google encontrei mais queixas acerca deste bot.
Isto é um problema que pode afectar qualquer um, pretendia saber se alguém já se deparou com o problema, que soluções tem, etc...
Usando o .htaccess das duas uma:
Também há o robots.txt no entanto os bots só o respeitam se quiserem.
- permito acesso a todos e tenho uma lista dos que devo excluir ou,
- Não permito acesso a nenhum e tenho lista das execepções
Para a solução 2, visto ser a mais radical (e a mais fácil), para além do msn, yahoo, e google que outros bots devo permitir o acesso?
Como detectar um bot/acesso_não_humano em PHP?
Última edição: