鏈接關系計算也是預處理中很重要的一部分?,F在所有的主流搜索引擎排名因素中都包含網頁之間的鏈接流動信息。搜索引擎在抓取頁面內容后,必須事前計算出:頁面上有哪些鏈接指向哪些其他頁頁,每個頁面有哪些導入鏈接,鏈接使用了什么錨文字,這些復雜的鏈接指向關系形成了網站和頁面的鏈接權重。
怎么理解搜索引擎倒排索引呢?就在GOOGLE PR值就是這種鏈接關系的適合主要體現之一。其他搜索引擎也都進行類似計算,雖然它們并不稱之為PR。
由于頁面和鏈接數量巨大,網上的鏈接關系又時時處在更新中,因此鏈接關系及PR的計算要耗費很長時間。