明白搜索引擎所看到的內(nèi)容
搜索引擎看到的同你通過瀏覽器看到的是不一樣的,要明白其中的道理需要知道頁面是怎樣被創(chuàng)建的。下面是這個過程:
1. 用戶在瀏覽器中輸入URL,或者點擊一個鏈接,瀏覽器向服務器發(fā)出信息請求特定的頁面。
2. web服務器抓取相關的頁面并且快速的閱讀看看在發(fā)送前還需要作怎樣的處理。
3. web服務器編譯頁面,如果需要的話。比如,在一些情況下,web服務器端需要運行asp或者是php scripts。
4. 在完成編譯后,發(fā)送到瀏覽器。
5. 當瀏覽器收到頁面后,會通讀頁面查看相關的指令,如果需要會進一步的編譯頁面。這里有一些例子是瀏覽器需要處理的指令:
l 發(fā)現(xiàn)<script>標簽,被告知需要從別的文件裝載一個文件,而他又需要從服務器讀取一個文件。
l 在文件中發(fā)現(xiàn)被包含的JavaScripts,需要運行該JavaScripts。
l 可能會發(fā)現(xiàn)包含了圖片、多媒體、css等等。
6. 但上述步驟完成后,瀏覽器就向用戶展示頁面。
這就是一個頁面呈現(xiàn)的一般的過程,但是,搜索引擎通過搜索程序索引頁面的工作過程是完全不同等的。當搜索引擎請求一個頁面的時候,服務器還是按照他的一般程序,按照指令創(chuàng)建頁面,發(fā)送給搜索程序。但是,搜索程序并不是完全按照頁面中的指令執(zhí)行,他只讀取頁面內(nèi)容,不會執(zhí)行其中的scripts指令。
Scripts指令有兩種:
l 基于瀏覽器端的。這是搜索引擎所不能執(zhí)行的,所以搜索引擎不可見。如用 javascripts創(chuàng)建的導航。一些人還用這種方法來故意對搜索引擎隱藏內(nèi)容。
l 基于服務器端的。如:SSI(server side include),這是搜索引擎可見的,因為服務器編譯完成后傳給搜索引擎的。