| 東京、大阪、兵庫、京都を中心にSEO対策サービスを展開中 |
 |
|
|
 |
Googleのページランクって?
現在のwww検索エンジンにおいて最も有名なページスコアリングアルゴリズムの一つ。
この手法はWebページが持つリンク構造に基づいてページのスコアリングが行われており、その基本的な考え方は、重要なページは重要なページにリンクされているという概念から成り立っています。
PageRankでは、多くのページからリンクされているページやランクの高いページからリンクされているページは非常に重要なページということになり、スコアも高くなるということです。
図1

図1を用いて計算方法を説明する。
まず、全てのWebページはそれぞれPageRankをもっている。そしてこの値はそのページがリンクしている先に均等に分配される。この場合100は50づつに9は3づつに分配される。すると、Aは53とBは3、Cは50のWebページと計算できる。ページランクは高いほど重要であるということを意味し、サイトの重要度を測る指標となっています。
YSTにおいても重要度をなんらかのアルゴリズムで計算していると考えられます。
ページランクをどのように計算するのか?
リンク関係を行列の形で表わしてみよう。
あるページ i から別のページ j へリンクが張られている場合にはその成分を 1 とし、そうでない場合を 0 とする。すなわち、行列 A の成分 aij は
aij = 1 if (ページ i からページ j へのリンクが「ある」場合)
|
| 0 if (ページ i からページ j へのリンクが「ない」場合) |
で表わされるとしよう。 文書数を N
とするとこの行列は N×N のN次正方行列になる。 これは、グラフ理論で「隣接行列」と呼ばれるものに相当する。
PageRank の計算は、この推移確率行列の最大固有値に属する固有ベクトル(優固有ベクトル)を求めることにほかならない。なぜなら、線形変換系の t →∞
での漸近挙動は、変換行列の絶対値最大の固有値とそれに属する固有ベクトルによって本質的に記述されることがわかっているからである。言い換えれば、推移確率行列で表わされる確率過程は、この行列の掛け算を繰り返したものを調べることで、行き着く先の状態の確率を計算できると言うことである。
R=cAR (c:定数 R:Aの固有ベクトル)を繰り返し計算することになる。
ここで思いませんか?どうしたら現状のPageRankで上位に表示させることができるのか?
これが一番大事なところです。
ただ、計算上ページランクを上げるような操作をする場合、アンカーテキストのペナルティーに注意が必要。また、この計算からわかることは、リンクを張り巡らせ、サイトのページをどんどん作成し、増やすことは有効であるというである。
|