Blog sobre SEO

Blog de SEO

Nuvenus Chovendus

segunda-feira, 1 de junho de 2009

[Crawlers, Spiders, Robôs e Algoritmos]

A interface de um motor de busca é a única parte que vemos realmente pois todas as outras partes que ficam por trás disso ficam fora da nossa visão, a não ser que você visualize o código fonte.
As partes desses elementos que ficam no back-end são as partes mais importantes dos motores ou mecanismos de busca onde os Crawlers, Spiders ou Robôs utilizam para catalogar.
Essas "criaturas" são programas que vasculham a web atrás de dados para serem catalogados onde serão disponibilizados para as buscas dos usuários. Basicamente dizendo os 3 programas Crawlers, Spiders e Robôs são a mesma coisa, todos vivem rastreando informações sobre todas as URLs existentes na internet.
As informações rastreadas são catalogadas de acordo com a URL e guardadas em um enorme banco de dados e assim quando um usuário faz uma consulta em um motor ou mecanismos de busca é feita uma verificação nas referências que estão neste banco de dados e os resultados são retornados ao usuário com muita velocidade.
Os bancos de dados que estão conectados a esses motores de busca alimentados por esses Crawlers, Spiders ou Robôs são enormes bases de armazenamentos com múltiplos pontos de dados sobre cada URL. A organização desses dados é feita de várias formas e o ranking é feito de acordo com um método de posicionamento e recuperação peculiar a cada empresadesenvolvedora de seu motor ou mecanismo de busca.

Algoritmos de Busca


O motor ou mecanismo de busca tem várias partes importantes, mas com certeza o algoritmo de busca é o responsável por fazer tudo funcionar, é o alicerce que sustenta todo o restante da estrutura. O funcionamento de cada motor de busca está no algoritmo de busca e na forma como os dados são obtidos por nós.
Em poucas palavras o algoritmo de busca é um processo de solução de um problema, ele avalia muitas respostas possíveis e em seguida retorna a solução para o problema em questão. Por exemplo, o motor recebe a consulta da palavra Pólo Industrial assim que o algoritmo recebe essa informação do usuário essa palavra é procurada em todo o banco de dados trazendo as URLs que se referem a esta palavra-chave e então retorna as páginas que contenha essa palavra-chave ou expressão ou no corpo da página ou em uma URL que aponte para a página.
Cada motor ou mecanismo de busca tem sua própria classificação para o algoritmo que faz o pequeno truque mencionado acima (risos) e é por isso que os resultados alcançados com a palavra-chave ou expressão digitada gera diferentes respostas. Alguns dos tipos mais comuns dos algoritmos usados são:
  • Busca por Lista - o algoritmo que realiza este processo procura por uma única chave e esses dados são vasculhados de uma forma bem linear. O resultado desta busca por lista é geralmente um único elemento o que significa uma operação demorada entre bilhões de resultados ficando assim um resultado restrito.
  • Busca por Árvore - neste caso imagine uma árvore, examine está árvore das raízes pra cima ou das folhas para baixo. É assim que a busca por árvore funciona, é procurado um conjunto de dados do mais importante ao peculiar ou vice-versa. A buscas por árvore são mais úteis, mas não são o único tipo que pode ter sucesso.
  • Busca SQL - uma dificuldade em se fazer uma busca por árvore é a maneira hierárquica que é conduzida ( de um ponto a outro) de acordo com o ranking dos dados que estão sendo pesquisados. A busca SQL permite o mesmo processo de uma maneira não-hierárquica o que significa que a pesquisa pode ser feita de qualquer subconjunto de dados.
  • Busca Informada - aqui o algoritmo da uma resposta específica para um problema específico no conjunto de dados com a estrutura arbórea. a busca informada não é a melhor opção para as buscas web devido as resposta naturais que estão sendo buscadas, mas é perfeita para buscas específicas em dados específicos.
  • Busca Adversarial - o algoritmo adversarial procura por todas as soluções possíveis para um certo problema e é difícil ser usado em buscas web devido ao fato que o número de soluções para uma palavra-chave ou expressão é praticamente infinito na web.
  • Busca por Satisfação de Restrição - quando procuramos por uma palavra-chave ou expressão em um motor ou mecanismo de busca este algoritmo de satisfação e restrição é o que irá encontrar o que desejamos. A solução no caso deste algoritmo é descoberta ao se atender a um conjunto de restrições, e os dados podem ser vasculhados de uma série de formas diferentes não precisando ser lineares. Essa busca por satisfação e restrição são bastantes úteis quando se trabalha com a web.
Bom esses são alguns dos vários tipos de algoritmos que são usados quando os motores ou mecanismos de buscas são criados e pode ter certeza que são usados mais de um algoritmo.
A chave para aumentar as suas chances de conseguir um ótimo resultado no motor de busca é basicamente entender como funciona cada motor que planeja usar, entendendo isso você irá maximizar sua consulta atendendo os requerimentos de busca para o mecanismo em questão.

Quero agradecer novamente as pessoas que estão visitando este blog e para o próximo post pretendo mencionar sobre Ranking, Características da Busca e mais algumas classificações dos motores de busca.

Até o próximo post.
Forte abraço a todos.

0 comentários:


share/bookmark