Wednesday, September 23, 2009

キーワードスパム / keywords spam



グーグルはメタタグを利用しないとのことです。メタタグは簡単にスパムされてしまうからです。
ページランクはそのスパムを削除するためにあるアルゴリズムです。

しかし、AMAZONのような制限されているデータベースでは、リンクで繋がっている構造はありません。その時に、どうすればキーワードスパムを戦えばいいのか?


自然言語の冗長性を利用することが一つの解決法です。何回も同じことをいろんなキーワードで入力し。。。
この解決法は本プロジェクトで利用しています。

Google does not use meta tags because those meta tags are spammed.
That's why they have PageRank.
But, in a limited database like Amazon, there is no linked structure.
How to fight spam in that case?
By using the redundancy of natural language.

You say several times the same thing by using different keywords...
We are using that method in Ascot project.

1 comment:

  1. Correct, another thing that current search engines do not exploit is the redundancy of natural languages;
    Google exploited the linked structure of the web;
    We will exploit the redundancy of the human language

    ReplyDelete