1. 轉載網頁的識別:例如:對于網頁A,B,要判斷這兩個頁面是否互為轉載網頁,那么搜索引擎首先會把這兩個網頁的主體內容(如文章內容)劃分為若干個獨立的區域,再按順序對這些區域進行比較,如果這些區域的內容大部分都是相同,那么搜索引擎就認為這兩個頁面互為轉載頁面;然后,再根據網頁建立的時間等多方面的因素判斷哪個是原創頁面,哪個是轉載頁面。
2.鏡像頁面的識別:例如:對于網頁A,B,要判斷這兩個頁面是否互為鏡像網頁,那么搜索引擎首先會把這兩個網頁劃分為若干個獨立的區域,再按順序對這些區域進行比較,如果這些區域的內容完全相同,那么搜索引擎就認為這兩個頁面互為鏡像頁面;然后,再根據網頁建立的時間等多方面的因素判斷哪個是原創頁面,哪個是鏡像頁面。
從上面的內容里,我們得知了搜索引擎識別轉載頁面的原理。簡單地說,如要我們要讓搜索引擎認為我們的內容是原創內容,那么首要的條件就是我們的網頁跟另外一個網頁在主體內容(如文章內容)上存在明顯的差別。例如:一篇文章有四個段落,當有三個段落的內容存在差異時,會被認為是原創網頁,而兩個段落內容存在80%以上的差別上,才會被認為是不同的段落。