諾商資訊

首頁 - 新聞資訊 > 諾商資訊 >

為什么你搜索的結果和我搜索的結果不一樣?

來源:www.tourov.live   發布時間:2016-06-23      瀏覽次數:

    今天有位SEO的朋友告訴我,他在上個月接了個SEO單子,承諾三個月內將其客戶的關鍵詞優化到baidu自然排名前10,今天他例行檢查排名,發現其關鍵詞已經做到了一位,十分開心,立即通知客戶,叫客戶簽收,等著收除款,但客戶那邊說搜不到,并沒有像他說的那樣排在百度一 ,一頁根本沒有他們的關鍵字。朋友開始疑問了,明明自己看到關鍵了排在百度一,為何到了客戶那里結果就變了呢?相信大家都遇到過吧!

   導致以上的結果出現可能是百度有很多的服務器,存在這樣的更新不同步問題,導致地區的差異性。

    這樣就能解釋,為什么會有不同搜索結果的問題了。但為什么我的朋友跟客戶在同一城市里,也會存在搜索結果的不同呢?這里就涉及到一個IP定位的問題了,互聯網怎么劃分你是屬于什么區域呢?就是將IP進行分配,比如山東內的,就放220.***.***.***號段的IP,而浙江就放222.***.***.***,那么服務器能根據用戶IP來判斷你所在的區域了。但是問題又來了,現在的網絡服務商越來越多,不僅僅是電信一家獨門生意了,這樣導致很多的IP數據庫趕不上了IP的誕生速度,從而有了很多IP,被無法識別,被劃分錯區域。

    我這也遇到過類似的情況就是我這邊搜索的客戶的網站一直是在一頁,但是一段時間之后忽然客戶那邊搜不到了,但是我這邊還在,后跟客戶交流一下,應該確定是緩存問題。緩存是因為在一定的時間段內的搜索的關鍵詞集中在一定的范圍內,并且這些搜索相對穩定。例如每天搜索"美女"的人總有10萬,20萬,而結果在這段時間相對穩定, 因此沒有必要每次去檢索索引文件, 而將上一個人搜索的結果直接返回便可以了。

  搜索引擎緩存策略也同搜索引擎的算法密切相連,除了搜索緩存,索引緩存也是一個好方法。獨立或者分布一些權重較高的文檔也是一種提高效率的方法。例如我們有1000萬的網頁的權重(可以簡單的理解為pagerank)比較高,那么這些網頁上海國際男子醫院的排序相比另外一些權重較低的網頁相對較為穩定,就不妨獨立出來進行相對獨立的索引緩存。

  關于緩存的分布,一般的小型搜索引擎不會用到,但是如果每天處理上億次的搜索,緩存的分布就應當有一定的分布規劃,例如根據提交的關鍵詞構成hash table, 然后對應于不同的搜索服務器,實現緩存的分布。

  讓我們看看實際例子吧,我們拿百度,google, yisou, 中搜,tag.bokee.com 進行簡單的測試:

  因為測試, 要搜索一些在過去7天沒有人搜索過的關鍵詞, 或者組合詞。為了保證沒有人搜索過, 我選擇在各個網站優化在線咨詢搜索引擎里搜索"a s d f v g h" , 這是我在鍵盤上隨機打出的一些組合, 相信這世界上在7天沒有人相同搜索,這樣保證我的一次的搜索是 fresh search, 就是一定需要搜索引擎去檢索索引文件, 而不是通過緩存策略。

  以下是結果:

  百度: 0.279秒

  google: 0.24 秒

  一搜: 0.24 秒

  中搜: 0.001秒(無結果!!!!)

  博客搜索: 0.041 秒

  下面是第二次搜索的結果:

  百度: 0.001秒

  google: 0.05 秒

  一搜: 0.09 秒

  中搜: 0.002秒(無結果!!!!)

  博客搜索: 0.019 秒

  經過簡單的測試, 可以看出緩存機制只有在Baidu和google搜索引擎里都有, 但是各自效率不一樣, 如下是簡單的比例:

  百度: 100

  google: 5

  一搜: 沒有明顯的緩存

  中搜: 沒有明顯的緩存

  博客搜索: 沒有明顯的緩存

  而在緩存效率上百度要遠遠大于google, 這點大概是因為google的gfs本身的分布效率已經相當不錯, 因此進行緩存也不會有數量級的提升。

  而百度, 根據測試可能是集中方式的數據存儲, 但是根據搜索進行hash分布, 因此才會在緩存上有顯著的提升。(這個屬于猜測,大家要有更合理的解釋,也可以跟我們交流。)

免費獲取互聯網策劃方案
河南快3开奖号码今天