Buscadores são programas de serviço de busca para Internet. Este
tipo de programa foi projetado para ajudar a encontrar informação
armazenada em um sistema informatizado tal como o World Wide Web - WWW - dentro
de uma rede incorporada ou proprietária ou de um computador pessoal.
Os buscadores permitem obter critérios específicos na busca. Geralmente
aqueles que contêm uma palavra ou uma frase pontual encontram uma lista
de referências que combinam com aqueles critérios.
Buscadores usam índices regularmente atualizados para operar rápida
e eficientemente. Sem outra qualificação adicional, os buscadores
consultam geralmente a um outro buscador maior que procurará pela informação
na rede.
Outro tipo de buscadores são os de empresa, que procurarão em
intranets; e o buscador pessoal q procurará em computadores pessoais
individuais, e telefones móveis. Entretanto, quando critérios
diferentes de seleção e de relevância puderem se aplicar
em ambientes diferentes, o usuário perceberá provavelmente pouca
diferença entre estas operações.
Alguns buscadores minam também os dados disponíveis em grupos
de noticias ou bases de dados grandes, ou abrem diretórios como DMOZ.org.
Ao contrário dos diretórios de Internet que são mantidos
por editores humanos, os buscadores operam algorítmicas. A maioria dos
sites que se autodenominam de busca são em realidade fachadas de sites
de busca possuídos por outras companhias.
Os sites de busca trabalham armazenando a informação sobre um
grande número de páginas web que recuperam dados do próprio
WWW. Estas páginas são recuperadas pelo "spider", um
navegador web automatizado que segue cada ligação que vê;
as exclusões podem ser feitas pelo uso de robots.txt. Os índices
de cada página são analisados para determinar como deve estar
posicionado. Os dados sobre páginas web são armazenados em uma
base de dados do índice para o posterior uso.
Alguns buscadores, como Google armazenam todo ou uma parte da página
da fonte consultada, como também a informação sobre as
páginas web, outros armazenam cada palavra de cada página que
encontram, como o AltaVista. Esta página cachê guarda sempre o
texto real da busca desde que tenha sido posicionada realmente, assim que pode
ser muito útil quando o índice da página atual for atualizado
e os termos da busca não estejam mais nela.
A relevância da busca e do aumento faz com que estas páginas cachê
sejam muito úteis, embora possam conter dados que talvez não estejam
por muito mais tempo disponíveis em outro lugar.