佛山網(wǎng)站優(yōu)化公司搜索引擎超鏈分析算法
超鏈分析專利其實(shí)就是現(xiàn)實(shí)生活中類似于鏈接關(guān)系的應(yīng)用。要判斷哪個(gè)頁面最具權(quán)威性,不能光看頁面自己怎么說,還要看其他頁面怎么評價(jià)。李彥宏1997年就提交了一份名為“超鏈文件檢索系統(tǒng)和方法”的專利申請,這比GOOGLE創(chuàng)始人發(fā)明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法。這個(gè)系統(tǒng)除了索引頁面之外,還建立一個(gè)鏈接詞庫,記錄鏈接錨文字的一些相關(guān)信息,如錨文字中包含哪些關(guān)鍵詞,發(fā)出鏈接的頁面索引,包含特定錨文字的鏈接總數(shù),包含特定關(guān)鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關(guān)鍵詞原型,也包含同一個(gè)詞干的其他衍生關(guān)鍵詞。
根據(jù)這些鏈接數(shù)據(jù),尤其是錨文字,計(jì)算出基于鏈接的文件相關(guān)性。在用戶搜索時(shí),將得到的基于鏈接的相關(guān)性與基于關(guān)鍵詞匹配的傳統(tǒng)相關(guān)性綜合使用,得到更準(zhǔn)確的排名。
在今天看來,這種基于鏈接的相關(guān)性計(jì)算是搜索引擎的常態(tài),每個(gè)SEO人員都知道。但是在十三四年前,這無疑是非常創(chuàng)新的概念。當(dāng)然現(xiàn)在的搜索引擎算法對鏈接的考慮,已經(jīng)不僅僅是錨文字,實(shí)際上要復(fù)雜的多。一個(gè)與根據(jù)超鏈指向的查詢索引文檔相關(guān),用于檢索文檔的搜索引擎。它的索引器遍歷超文本數(shù)據(jù)庫并尋找包括超鏈指向的文檔地址與每個(gè)超鏈的錨文本在內(nèi)的超文本信息。超文本信息是貯存在一個(gè)倒排索引文件里,這個(gè)倒排索引文件亦可用于計(jì)算對于各超鏈指向的特定文檔鏈接向量。輸入查詢時(shí)候,搜索引擎找到錨文本里含有查詢詞的全部文檔的向量。此外計(jì)算了查詢向量,然后算出查詢向量跟每個(gè)文檔鏈接向量的點(diǎn)積。
深圳網(wǎng)絡(luò)推廣信息http://www.easthinks.com/industry/