Indexação Semântica Latente

Em tempos de web 2.0 uma coisa me pareceu mais do que certa, com as mudanças correntes na web novas técnicas para indexação de páginas se farão necessárias e o profissional de SEO que não se adequar vai perder rapidamente o seu espaço, já falamos sobre isso quando comentei sobre a busca universal do Google.

Não quero ficar para trás!

Foi baseado nesta informação que saí pela web atrás de maiores detalhes sobre o novo modelo de buscas e quais as principais tendências e então me interessei por ISL - Indexação Semântica Latente.

Atualmente os usuários digitam termos, nos sites, e os mecanismos de busca recuperam uma lista de documentos ordenados por relevância. A maioria das consultas são curtas e imprecisas fazendo com que seja muito complicado estabelecer uma ordenação eficaz de documentos, como a grande maioria dos usuários não estão dispostos ou não sabem utilizar os filtros de busca para garantir um melhor resultado é necessário encontrar novos recursos para melhorar os resultados oferecidos.

A ordenação dos documentos por relevância é estabelecida de acordo com um modelo de recuperação de informação que determina como os documentos extraídos da WEB serão representados e selecionados durante o processamento de consultas.

Modelo de Recuperação de Informação - VETORIAL

O modelo mais utilizado, atualmente, para exibir os resultados de busca é o vetorial, onde a recuperação de documentos relevantes é feita através da comparação de termos entre os documentos da coleção e a consulta. Este modelo não considera as relações entre termos e o contexto em que estão inseridos, ora, se eu escrever sobre técnicas de resfriamento e em um dos meus exemplos eu utilizar a palavra “coca-cola” é capaz de aparecer em primeiro lugar para um usuário que esta a procura da “receita da coca-cola” pois o modelo vetorial não leva em conta o contexto em que a palavra foi inserida no meu texto em relação ao contexto, no caso a palavra receita traduz bem o contexto em que a palavra coca-cola deveria estar inserido, da busca.

Temos ainda o problema dos múltiplos significados que determinadas palavras possuem que também tornam possível casar, literalmente, as buscas com termos de um documento irrelevante.

Modelo de Recuperação de Informação - ISL

O modelo ISL - Indexação Semântica Latente realiza uma análise estatística do uso das palavras entre todos os documentos da coleção, permitindo que documentos relacionados semanticamente com uma consulta sejam recuperados, mesmo sem compartilhar os mesmos termos. Na análise de links, a importância de um documento é determinada em função do número de outros documentos que o referenciam e que são referenciados por ele.

A combinação do modelo de ISL com a análise dos links resolve a maioria dos problemas do modelo vetorial tornando mais relevante o resultado da busca e conseqüentemente a experiência do usuários.

Gostaria de convidar algumas pessoas para comentar o assunto: Celso Junior - blogueiro calda longa (nunca vou esquecer da dança dos bebês, ainda vou descontar), Professor, Paulo e quem mais tiver interesse.


Base Bibliografica

1 - Posicionamento Web 2.0, Revista 100% Marketing Online

2 - Combinando a Indexação Semântica Latente e Análise de Apontadores em Sistemas de Recuperação de Informação WEB, Cristiane A. MENDES (MESTRADO/CNPQ), Nivio ZIVIANI, Edleno S. de MOURA

3 - Categorização de Textos Usando Máquinas de Suporte Vetorial, Vanessa Cristina.

4 - Recuperação de Informação Através do Processo de Aproximações Sucessivas, Lívia Lopes Azevedo, Thiago Bortolo Ramiro, Valéria Monteiro, Sergio Teixeira e Elias Oliveira




Ofertas Submarino

Conheça os melhores produtos das categorias:, Pen Drives, Celulares Desbloqueados, GPS, Vivo, Gravadores de DVD


Pendrive 1GB U230 Branco - PQI
R$ 29,00 
Pendrive 1GB U230 Branco - PQI
R$ 29,00 
Samsung E215L Blue GSM c/ Câmera, MP3, Rádio FM, Cartão 512MB e Fone
R$ 349,00
12X sem juros de R$ 29,08 no cartão
Samsung E215L Blue GSM c/ Câmera, MP3, Rádio FM, Cartão 512MB e Fone
R$ 349,00
12X sem juros de R$ 29,08 no cartão
Navegador GPS MP3 MP4 USB e Slot de Cartão SD NAV730 Vídeo Seven
R$ 699,00
12X sem juros de R$ 58,25 no cartão


4 respostas para “Indexação Semântica Latente”

  1. Opa cara, tudo bom?
    Sobre o modelo vetorial eu dei uma explicação mais ou menos detalhada e comentei outras coisas neste post:
    http://www.blogdohummel.com/2007/11/como-funciona-uma-mquina-de-busca.html

    Com relação ao ISL, ele é um método de expansão de consultas. Algo que consiste basicamente de pegar a consulta original do usuário e inserir (ou remover) palavras de acordo com algum critério. Ah, o artigo foi publicado de 2002, já tem um tempinho.

    O Professor Edleno, orientador desse artigo é meu professor da matéria de Recuperação de Informação. Ele comentou pouco ainda sobre expansão de consultas, mas tenho certeza que não é nada REVOLUCIONÁRIO. Até por que é bem capaz de Google e outras máquinas de busca já usarem isso.

    Tive uma aula hoje, e ele falou muita coisa interessante e comentou
    sobre 2 áreas que as máquinas de buscas com certeza estão investindo para melhorar a relevância dos resultados.

    Devo fazer um post até amanha sobre estas coisas.

    Abraço!

  2. Felipe, muito bom o seu texto explicando o modelo vetorial, pelo que me pareceu ele foi escrito para o publico mais leigo e serve muito bem como base para iniciar estudos sobre mecanismos de busca e SEO.

    Com relação ao artigo, enviei até um e-mail para os autores para tentar um contato pois gostei da forma como abordaram o assunto se você dêr uma força lhe serei bastante grato.

    Desculpe a pergunta mas me diz que curso você faz?

    Vou ficar aguardando o post sobre os investimentos no sentido de melhorar a relevância dos resultados de busca e obrigado pela sua contribuição.

  3. Opa, realmente tentei usar uma linguagem mais leiga, e mais simples pra todo mundo entender.

    É, mandar e-mail é uma boa mas muitas vezes é difícil receber resposta. Infelizmente o meu professor vai viajar a próxima semana toda, mas quando eu puder pergunto dele mais sobre esse artigo. (e nem adianta mandar e-mail que professor é chato pra responder hehehe)

    Faço Ciência da Computação aqui na UFAM. 6o período! Você é da área ou apenas “curioso” hehehe?

    Abraço!

  4. Felipe, eu sou formado em informática mas a ênfase do meu curso foi muito mais voltada para Desenvolvimento de softwares, curto bastante SEO e tenho estudado muito sobre o assunto.

    Agradeço tua ajuda!

Deixe uma resposta