關于網(wǎng)站的原創(chuàng)內(nèi)容,相信很多人都不陌生。我們做SEO的都知道,網(wǎng)站內(nèi)容對于一個網(wǎng)站的排名影響是很大的,尤其是網(wǎng)站的原創(chuàng)內(nèi)容,那么搜索引擎究竟是怎樣來判斷是否原創(chuàng)內(nèi)容呢?筆者根據(jù)自己的SEO經(jīng)驗,總結了一下兩個因素:
一、那么搜索引擎對于原創(chuàng)的判斷是如何進行的呢 ?
一般來講有以下幾個方面的因素決定:
1 、快照日期。
2 、蜘蛛抓取日期。
3 、頁面外鏈的多少。
4 、文章修改的程度。
二、舉個例子如果你在 www.dantangjian4.cn 這個網(wǎng)站上發(fā)布了一片文章內(nèi)容。搜索引擎來到這個網(wǎng)站并且抓取到了這篇文章 , 放到數(shù)據(jù)庫 , 并且在收錄數(shù)據(jù)庫中沒有發(fā)現(xiàn)類似內(nèi)容 , 那么就會被認為是原創(chuàng)。
在這點上有個細節(jié)需要注意:
1 :文章必須被收錄
如果沒有被收錄,肯定是在搜索數(shù)據(jù)庫中石找不到的,搜索引擎根本就找不到這篇文章,更談不上什么原創(chuàng)了。
2 :文章被轉(zhuǎn)載
如果剛發(fā)表的一篇文章被其它轉(zhuǎn)載了,那么誰是原創(chuàng)呢 ? 那要看誰更先被搜索引擎抓取到,也就是更新周期的問題了。如果 a 站發(fā)表, b 站轉(zhuǎn)載,如果先抓取到 a 站,那么歸 a ,如果先抓取 b 站 , 那么原創(chuàng)就歸 b 站了 , 所以不是說你先發(fā)表了 , 原創(chuàng)就是你的 , 這個得看搜索引擎什么時間收錄了你的內(nèi)容。
3 、快照日期
快照日期顯示時間最早的,一般就是原創(chuàng)了吧 !
不一定 , 這個說法要在一個更新周期之內(nèi) , 比如說文章發(fā)表后一周內(nèi) , 快照時間越早的地址將越有被認可為原創(chuàng)的可能。但如果文章都發(fā)表了幾個月了 , 說不定搜索引擎已經(jīng)重新獲取過快照了 , 快照的日期就變了 !
還有其它的可能嗎 ?有 , 一般比如百度收錄 , 他可能會有一個收錄的數(shù)據(jù)庫 , 經(jīng)過過濾后 , 收錄的內(nèi)容才會到搜索結果里來。在這個期間就有一些問題了,比如 A 站首次發(fā)表, B 站轉(zhuǎn)載。蜘蛛先訪問 A站再訪問 B 站。而后可能先把 B 站的結果放出來了,而 A 站還在數(shù)據(jù)庫里。所以說搜索引擎沒有收錄并不表示搜索引擎蜘蛛沒有訪問過這些內(nèi)容 , 也許在搜索引擎的庫存里已經(jīng)有記錄了,只是你查的時間沒有放出來而已,就像 25 號才放出來的內(nèi)容,但是快照是 20 號的,這就是搜索引擎的庫存內(nèi)容,同時這也是檢驗原創(chuàng)的核心時間點。
4 、偽原創(chuàng)
偽原創(chuàng)也會被認為是原創(chuàng) ?
大多時候是這樣的 , 搜索引擎蜘蛛不能明確分別這些東西 , 因為它的思維太程式化了 。 如果你的標題改過 , 文章的段落改過 , 那么蜘蛛將很難確定這篇文章是否有過收錄 , 也許它可以確定有部分內(nèi)容是重復的,但它也不能因為這些而將這篇文章確認為是轉(zhuǎn)載 ! 當然,隨著搜索引擎程式設計的提高 , 應該會有一個相似度的東西出來 , 比如文字內(nèi)容相似度超過百分之幾就會被認為是轉(zhuǎn)載。