Stop Words

Conforme comentei ontem, rapidamente, o Google parece estar mesmo a testar a relevância das Stop Words na hora de realizar buscas. Em termos práticos, ao fazer uma pesquisa incluindo “a, de, o…” os motores de busca do Google ignoravam mas ao que tudo indica isso esta mudando.

Busca pelo termo: tecnicas seo

Tecnicas SEO

Busca pelo termo: tecnicas de seo

Tecnicas de SEO

A diferença é evidente não só na posição das páginas mas também na enorme diferença de resultados que retornam quando é levada em consideração as Stop Words.




Ofertas Submarino

Conheça os melhores produtos das categorias:, Perfumes Femininos, Kits, Perfumes Masculinos, Rock Internacional, Comédia


Kit de Miniaturas Carolina Herrera Feminino
R$ 129,90
10X sem juros de R$ 12,99 no cartão
212 Sexy Eau de Parfum Feminino 30ml
R$ 165,00
10X sem juros de R$ 16,50 no cartão
Silver Black Eau de Toilette Masculino 30ml
R$ 99,90
9X sem juros de R$ 11,10 no cartão
212 Sexy Men EDT Eau de Toilette Masculino
R$ 219,90
10X sem juros de R$ 21,99 no cartão
The Beatles Anthology 3- Duplo
R$ 39,90 


11 respostas para “Stop Words”

  1. Opa cara!
    Um professor meu disse uma vez que provavelmente as grandes maquinas de busca ja indexavam stopwords.

    E eu sempre achei que sim também.
    Na verdade indexar ou não stopwords provavelmente (teoricamente) não afeta muito os resultados, por que stopwords inerentemente tem IDF (importância) muito baixa, já que são extremamente comuns.

    O que ocorre é que na hora da consulta o google pega o texto da consulta e procura por textos similares dentro do corpo do documento. Se você nao colocar a stopword ele vai achar do mesmo jeito pq as 2 palavras da consulta são separadas por 1 posição no texto, consultando com a stopword no meio só fez o processador de consultas ter certeza que o texto da consulta bate exatamente com o do texto.

    Enfim… Creio eu que isso já ocorria, mas posso estar errado. Quem começou a falar nessa historia mesmo? =P hehee

  2. Hummel, isto não ocorria antes pois a pesquisa com stop words e sem stop words retornava a mesma ordem nos resultados bem como mesma quantidade de resultados encontrados. Não lembro muito bem quem falou primeiro.

  3. Poisé, eu fui verificar aqui no Yahoo Search e no Live Search e os 2 já fazem diferenca de com e sem stopwords.

    Como eu disse, as grandes maquinas de busca nao veem problema em indexar stopwords mesmo com o custo a mais, pq as pessoas buscam muito usando stopwords na consulta e elas são boas para comparar o texto da consulta com o do texto do documento (q eh oq causa diferença de resultados na maioria das vezes)

    Mas enfim… uehuheuhe

    Abraço!

  4. E ai Leo, blz?

    Eu já tinha reparado nisso, no meu caso, quando alguém pesquisa “planos de saude” e “planos de saúde” (sem as aspas, só o acento), o Google retorna resultados diferentes.

  5. Marcel, temos que começar a pensar em otimizar com e sem stopwords e acentos!

  6. Legal que eu estava em primeiro nos dois. =)

    Na verdade, quando comecei em SEO as stop words eram ignoradas em inglês e não em português. Depois eram ignoradas nos dois e agora elas passaram a ter importância, mas ainda tímida.

    É que tem tempo que isto tudo aconteceu. Acho que estou velho mesmo.

    Um grande abraço Leo

  7. Paulo, repare que o MB.com não aparece nos resultados quando fazemos a pesquisa sem o “de” mas quando colocamos “marketing DE busca” ele esta na posição #3.

  8. Eu ainda esotu cético com essa história.

    De qualquer modo, vale frisar que as stopwords SÓ têm importância para casamento da consulta com o texto da página. Como acontece muito com título da página.

    Casamento exato da consulta com o texto de uma página dá muita relevância pra mesma.

    É por isso que estou cético, isso que eu acabei de relatar, pra mim, já acontecia no Google e em outras máquinas de busca. Aliás façam estes testes de tirar e colocar stopwords no Yahoo e no Live. Todos consideram stopwords.
    Creio eu, justamente pelo fato do casamento do texto da consulta com o texto da página.

    As stopwords no modelo Vetorial (e em na maioria dos modelos de Recuperação de Informação) tem valor de importância (IDF) muito baixo, logo no processamento de consultas ele *praticamente* não muda os resultados. Mas com o casamento do texto da consulta isso muda um pouco.

    Abraço!

  9. Você tem razão Hummel, fiz uns testes aqui que comprovam a baixa relevância das stopwords e deveria ser assim mesmo!

  10. Hehehe. Já o MB com.br está em primeiro sem o “de”. =)

    Engraçado que para mim, o “.com” não aparece nem na primeira página.

    Um grande abraço

  11. Paulo, aqui continua aparecendo na posição #3 quando busco por marketing de busca (o MB.com).

    Teve um tempo (uns 6 meses atrás) que estava rolando alguns rumores de que os resultados eram apresentados de forma diferente quando estamos logados, ou não, no Google. Caso isso seja verdade mostra que existe a preocupação do google em traçar um perfil e fornecer resultados diferenciados, quero dizer, essa preocupação em traçar o perfil, para mim, é muito clara porém não me é concreto que os resultados sejam diferentes quando estou logado.

Deixe uma resposta