Motores de Pesquisa

(algumas regras de utilização do AltaVista)


 Estabelecer os limites do pedido
Limitar a pesquisa nas páginas Web
Limitar a pesquisa na Usenet ( News)
 Palavras, Frases, Pontuação, Maiúsculas e minúsculas, Acentos
Palavras
Frases
Maiúsculas e minúsculas
Palavras relacionadas e asterisco *
 

O Alta Vista é um dos melhores motores de pesquisa, sendo de realçar a sua facilidade de uso, a sua enorme base de dados e a sua velocidade de resposta. Como introdução vejamos alguns exemplos de consulta:

programa "actividade física" saúde

Encontrará os documentos que contenham o maior número de palavras e frases semelhantes. Uma frase deve indicar-se entre aspas. Se escrevermos em minúsculas também serão encontradas as palavras em maiúsculas, contudo se escrevermos em maiúsculas só nos será devolvida informação que contenha maiúsculas.
educação +secundária -universitária
Este pedido devolverá os documentos que contenham secundária e não os que contenham universitária. E destes, aqueles em que se faz referência à educação.
bio* investigação europeia
Pesquisará quais as combinações possíveis com a palavra bio, por exemplo: bioquímica, biologia, biofísica, bioesfera, etc., além de investigação europeia. É apropriado para a pesquisa de famílias de palavras.
http://www.moncloa.es/
Os sinais de pontuação entre palavras convertem-nas em frase. A pontuação fará com que este motor de pesquisa manipule o pedido como se existisse um espaço em branco no local dos sinais; no exemplo exposto equivale a "http www moncloa es" (entre aspas).
title:"universidade de alicante"
title:UA
Este pedido recolherá as páginas com esses títulos. Qualquer maiúscula no pedido força a coincidência exacta na pesquisa.

Estabelecer os limites do pedido

Depois de realizar um pedido de pesquisa e observar que há muitas palavras e documentos (observar o valor de word count), usar as técnicas de limitação.
 
Limitar a pesquisa às páginas Web
anchor:índice
Encontrará páginas com a palavra índice no texto de uma hiperligação.
applet:anima
Encontrará páginas com a designação anima de um Java applet class.
image:touro
Encontrará páginas com a palavra touro no texto de um tag de imagem gráfica.
text:fortran77
Encontrará páginas com a palavra fortran77 no texto e não nos tags de imagens gráficas ou hiperligações.
title:educação
Encontrará páginas com a palavra educação no título.
title:"educação física"
Encontrará páginas com a frase educação física no título.
url:noticias.html
Encontrará páginas com as palavras noticias e html juntas no URL da página.
É equivalente ao url:"noticias html".
host:www.edu
Encontrará páginas com as palavras www e edu no nome do servidor de páginas Web.
link:europe.es
Encontrará páginas que contenham, pelo menos, uma das duas ligações na página e nos respectivos URL.
Limitar a pesquisa na Usenet (artigos das news)
from:vicent
Devolverá os artigos de news com a palavra vicent (en maiúsculas ou minúsculas) no campo From: do seu cabeçalho.
subject:"european culture"
Devolverá os artigos de news com a frase "european culture" no campo Subject: do seu cabeçalho.
newsgroups:rec.humor
Devolverá os artigos de news com rec.humor no nome do grupo.
summary:bio*
Devolverá os artigos de news com as palavras biologia, biology, bioquímica, etc., no campo summary.
keywords:ARIADNE
Devolverá os artigos de news com a palavra ARIADNE em maiúsculas na lista de palavras chave.

Palavras, Frases, Pontuação, Maiúsculas e minúsculas, Acentos.

Palavras
O Alta Vista trata cada página Web e cada artigo de news da Usenet como uma sequência de palavras. Uma palavra neste contexto significa qualquer cadeia de dígitos alfabéticos delimitada por algum sinal de pontuação ou outro caracter não alfabético (por exemplo: &, %, $, /, #, _, ~), ou por um espaço (espaço, tabulação, fim de linha, princípio ou fim de documento). Uma palavra não tem que ser pronunciável ou pertencer a algum dicionário. Só precisa que esteja escrita numa página Web ou artigo da Usenet. Assim, os seguintes conjuntos de caracteres são entendidos como palavras se aparecerem num documento: HAL5000, Gorbachevnik, 602e21, www, http, MaresEatOats, etc. As seguintes frases tratam-se como duas palavras por terem sinais de pontuação internos: digital.com, x-y, AT&T, 3.14159, U.S.. Para o Alta Vista só as palavras são significantes no documento. O Alta Vista não indexa sinais de pontuação ou espaços em branco.
 
Frases
Uma frase é uma cadeia de palavras que se apresentam de forma consecutiva num documento, ainda que estejam separadas por qualquer quantidade de espaços em branco ou pontuação. Não têm que estar gramaticalmente correctas em língua nenhuma, só têm que estar presentes num documento como uma sucessão de palavras. Alguns exemplos: Presidente da C.E.E. (frase de 5 palavras)
 

http://www.election.digital.com (frase de 5 palavras)

pontuação e os espaços em branco são insignificantes para o Alta Vista (apenas delimitam palavras); as frases anteriores são indistinguíveis das seguintes: Há duas convenções para digitar uma frase numa pergunta. A melhor forma, por ter menos ambiguidade, é digitar a frase como "uma sucessão de palavras separadas por espaços e limitada por aspas".. Contudo, como alternativa, pode digitar as palavras das frases com sinais de pontuação (e sem nenhum espaço em branco) entre as palavras. Por exemplo, todas estas são equivalentes como perguntas: A primeira e a última forma são as que geralmente recomendamos, pois alguns dos caracteres de pontuação têm significado no formulário de Advanced Queries, e podem produzir confusão.
 
Maiúsculas e minúsculas
Consideram-se distintas as maiúsculas das minúsculas.

Quando digita uma palavra como parte de uma pergunta é mais seguro, e geralmente recomendável, digitar tudo em minúsculas; pôr tudo em minúsculas numa palavra indica que será indiferente. Mas se digita qualquer maiúscula, força o emparelhamento exacto com a palavra digitada. Assim, a palavra portugal numa pergunta emparelha com qualquer ocorrência num documento como portugal, Portugal, PorTuGal ou PORTUGAL. Mas se escrever a palavra Portugal numa pergunta só encontrará Portugal no documento, e não qualquer das outras variantes.
 
 

Palavras relacionadas e asterisco *.
Frequentemente desejará pesquisar sobre uma família de palavras relacionadas, por exemplo canta, cantante, cantautor, cantador. Neste caso deve usar a abreviatura canta* na pergunta para encontrar os documentos que contenham qualquer uma dessas palavras. Como é óbvio, também encontrará documentos que contenham palavras parecidas, como cantabria: ignore-as.

O uso do * tem restrições. Use-o só no final de uma palavra na pergunta, e só se esta tiver pelo menos três letras.

(adaptado)