O GLOBO - Informática Etc. - Carlos Alberto Teixeira
Artigo: 461 - Escrito em: 2000-06-26 - Publicado em: 2000-07-03


Mistérios dum mecanismo de busca


AltaVista resolve qualquer parada quando o assunto é varrer a Web

Pode haver coisa mais irritante do que entrar num mecanismo de busca, digitar  uma palavra-chave e receber a informação de que existem 230 mil páginas sobre  o assunto que lhe interessa? Ninguém tem paciência nem tempo para visitar  tanto site. O negócio, num caso desses, é refinar a busca. Você precisa  reformular sua pergunta à máquina de busca, estabelecendo limites e  especificações, de modo a obter um número menor de "hits", ou seja, de  páginas encontradas na web. Para o feijão com arroz, uso mesmo o buscador  Raging <www.raging.com> mas, quando engrossa o caldo, apelo mesmo para o  primo mais velho dele, o AltaVista Advanced Search. E em modo texto, pois é  mais rápido de carregar. O endereço direto é <www.altavista.com/cgi-bin/query?pg=aq&what=web&enc=iso88591&text=yes>. Nesse modo avançado do  AltaVista, você pode usar e abusar dos parênteses e dos operadores lógicos  AND, OR, NOT e NEAR. Visite o "help" do site e vá fazendo seus testes de  refinamento de buscas. Não tenha medo de errar, pois nada de terrível pode  lhe acontecer se sair experimentando com operadores. 

Faça um pequeno teste. Entre no AltaVista avançado e digite a palavra  "agartha" no campo Boolean query. Clique em Search e verá que irão aparecer  uns 1.400 hits. Refine a busca, selecionando apenas sites em português,  clicando em "Portuguese" na caixinha Language e depois em Search novamente.  Melhorou bastante, não é? Apenas 94 hits. Você até poderia visitar um a um  mas, voltando à caixa da busca booleana, digite "agartha and henrique" e terá  37 hits. Tente "agartha and henrique and srinagar" e encontrará apenas oito.  Se quiser variar mais, volte para "any language" na caixa Language e  experimente "(agartha or shamballah) and (brasil or brazil)", recebendo 180  hits e depois refine novamente como bem entender. Bem, acho que você já pegou  a manha. 

Usar um mecanismo de busca é coisa muito pessoal. Tem gosto pra tudo. Já usei  Lycos, Yahoo!, HotBot, mas parei mesmo no AltaVista e no seu parente Raging.  Até que me apareça coisa melhor, vou ficando com neles. Quebram-me o maior  galho e já me tiraram de cada sufoco, que nem conto. 

O nome AltaVista pintou no meio de uma reunião em que os caras estavam  quebrando a cabeça justamente para batizar o site. Sentados numa salinha no  laboratório de pesquisa da DEC (Digital Equipment Corporation -- hoje parte  da Compaq), estavam eles diante de um quadro-negro desses modernos, que são  brancos e onde se escreve com canetas tipo hidrocor. O quadro estava mal  apagado e, na hora de decidir, alguém notou que estava escrito o nome da  cidade sede da empresa, Palo Alto, ao lado da palavra meio esmaecida "Vista".  Alguém gritou "AltaVista!" e o nome colou no ato. Um outro traduziu do  espanhol e os gringos gostaram da idéia -- uma vista do alto. 

Hoje com 651 funcionários, a empresa AltaVista, que é dona desta adorável e  poderosa máquina de busca, ou "search engine" segundo eles, foi fruto de uma  feliz conjunção de fatores: hardware poderoso, boa grana para bancar o  projeto, idéias criativas e uma compulsão meio estranha de manter controle  histórico sobre mensagens enviadas e recebidas via email. Em meados de 1995,  três funcionários da DEC, nos papos de hora do almoço, começaram a conversar  sobre os então novos computadores DEC Alpha 8400, conhecidos internamente na  época como TurboLasers. Essas engenhocas permitiam rodar software de banco de  dados quase 100 vezes mais rapidamente do que as máquinas da concorrência.  Papo vai, papo vem, e acabaram tendo o estalo de usar os TurboLasers pra  abrigar um parrudo sistema de banco de dados de busca completa em texto. E  que texto seria esse? Email. Os camaradas eram meio tarados por email.  Queriam sempre manter controle e saber a qualquer momento quem tinha mandado  o quê, pra quem e quando. 

Diante dessa obssessiva necessidade, um dos pesquisadores bolou um índice  automatizado espertíssimo capaz de rastrear TODAS as mensagens trocadas no  polpudo BBS interno da empresa, nos últimos dez anos. O índice era tão  porreta, que conseguia endereçar com exatidão fiapos de texto no meio do  database de acordo com queries (consultas) complexas. Em cima dessa  ferramenta, rolaram altos quebra-paus técnicos, que acabaram por aprimorá-la  mais e mais. Pois foi justamente esta belíssima peça de software, que acabou  se desdobrando em mais de 60 patentes relacionadas a técnicas de busca  rápida, que veio a se tornar o arcabouço do que hoje conhecemos como  AltaVista. Com o mais abrangente índice disponível na web -- 250 milhões de  tópicos -- esta fenomenal máquina de busca oferece a melhor performance da  rede, com um tempo médio de resposta entre 0,4 e 0,5 segundos, sem contar,  obviamente, com atrasos decorrentes de gargalos de transmissão e recepção. 

Foi a primeira web aranha a oferecer busca em multimídia e a oferecer  pesquisa em diversos idiomas. Recentemente incorporou imagens e clips de  áudio e vídeo ao seu banco pesquisável, formando um acervo de 50 milhões de  peças pesquisáveis. Um outro fator de peso é o frescor do banco de dados do  AltaVista. A cada 28 dias, o acervo inteiro é atualizado, o que confere ao  site uma reputação imaculada em termos de precisão, velocidade, lealdade dos  usuários e satisfação dessa massa de internautas. 

Portanto, apenas para deixar bem claro, não se está aqui dizendo que o AltaVista é a melhor máquina de busca da teia mundial. Mas numa coisa a leitora vai concordar comigo: ela não é nada má.


[ Voltar ]