本文詳細介紹了網頁收錄的四個階段和不同策略,為我們理解搜索引擎的工作原理提供了深入的分析。
在第一階段,作者提到了傳統的「大小通吃」策略,即機械性地將網頁中的鏈接加入待抓取URL中,這種方法雖然古老但效果很好,解釋了為何一些站長會感覺蜘蛛來訪但網頁未被收錄。
第二階段討論了PageRank算法對網頁重要性的評級作用,站長可以利用PageRank進行URL排序,這也解釋了為什么一些人會積極進行外鏈發布。
第三階段介紹了oCIP策略,將網頁的「現金」分配給包含的鏈接頁面,導出的鏈接越少,權重越高,這種策略比PageRank更快速,適合實時計算。
第四階段是大站優先策略,以網站為單位衡量網頁重要性,對包含最多待下載頁面的網站進行優先下載,因為大型網站通常包含更多頁面且質量較高。
本文還提到了一些SEO方法,如通過QQ群、搜索引擎、軟文、博客、媒體、手機、網摘和論壇等途階段和各種策略,對于想要了解搜索的資料。