ZERO與多位百度人員溝通得到的內部信息

2015 年 6 月 26 日10:57:30SEO知識評論2,465

與多位百度人員溝通得到的內部信息
此貼記錄一些我曾和百度內部一些人員的溝通中,比較重要的幾部分,內容會比較散。
1. From 運營@百度空間

百度內部產品的網頁收錄,不是由百度爬蟲進行抓取,而是直接提交結構化數據。

百度產品也想要從其它搜索引擎獲取流量。
2. From PM@百度知道

百度的幾個流量產品,其流量的SEO占比極其高。

百度的產品也想方設法從百度搜索獲取更多流量。

之所以目前SERP上多數百度知道的結果下面都有相關問題鏈接,這和一些人想象當中相反,是百度在打壓百度知道。因為本來百度知道很多時候在SERP可以占據多條搜索結果,現在很多情況下被并為一條。
3. From RD@大搜索-基礎排序

百度判斷網頁的層級關系,主要依賴于面包屑導航。

競價與自然搜索是完全分開的兩塊,彼此拿不到對方的數據。

百度的流量產品想獲取更多百度SEO流量十分簡單,只要內部調整一下權重值。

在基礎排序的角度看來,多數頁面的相關性都一樣——標題有關鍵詞、內容有關鍵詞...所以在這種情況下會依賴于【站點的權重】、【用戶行為數據】來決定最終排名。
4. From RD@大搜索-反作弊

百度內部想讓一個站提升或者下降SEO流量十分簡單,且可以控制變化的流量量級。

反作弊規則有兩大類,上策略與上數據。上數據的話,會有一批作弊URL被處理,隔段時間可能下一批URL被處理;上策略的話,新的作弊URL一旦產生即被處理。
5. From RD@大搜索-爬蟲(通過他人間接溝通)

對于單IP多子域名,百度會提取一個子域名作為核心,重點抓取。其余均視為*.xxx.com,近似平均分配抓取。

抓取限制的策略比較復雜,總體而言抓取以抓取總量為上限。
6. From RD@大搜索-爬蟲(另一人)

哪怕總體而言抓取以抓取總量為上限,因為規則不是單一的,因此加快網頁加載速度讓每個頁面抓取更快的話,總抓取量還是會上升。

  • 本文由 發表于 2015 年 6 月 26 日10:57:30
  • 轉載請務必保留本文鏈接:http://www.pennhillsstar.com/seowz/123.html
匿名

發表評論

匿名網友 填寫信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: