seo 好文:百度工程師對於百度搜索引擎優化的建議

Robots 掉的網頁,如果互聯網上其他網頁鏈接並描述了這個網頁的內容,我們會把這些描述信息建入索引,但 Robots掉網頁我們不會抓取,網頁內容也不會收錄。
當你網站上的內容對用戶有用時,用戶會推薦給別人,推薦的形式可能多種多樣:IM軟件上推薦給自己的朋友、在論壇裏發帖推薦、寫博客介紹等。這些推薦,都會被搜索引擎用來判斷網頁/網站價值的高低。
不把 Meta Description 當做權值計算的因素,這個標籤存在與否不影響網頁權值,只是摘要的一個選擇目標。
如果想維護一個策略的生命週期的話,最好的方式是保守策略細節的祕密。但有一點可以確定,一個成熟的搜索引擎,不會輕易的通過一兩個要素來判斷一個網站的生死。
有一點可以肯定,索引結果數肯定不會是一個網站在搜索引擎中的站點評級指標。這是很容易理解的。舉個例子,site:www.126.com,就幾百條而已。從投票權角度,它的權重會低於大部分索引了成千上萬網頁的站點?所以站長若要搞搞友情鏈接,更重要的是用自己的經驗去做價值分析。
作爲站長,如果想深入的研究SEM,可以坦白的講,數據分析是必須的。在網絡上搜到的東鱗西爪的所謂SEO技巧,大多是別人嚼剩下的、沒什麼大用的、甚至有害的東西。站長要學會的首要事情之一,是對自己的網站日誌做深入解剖,並能針對問題做各種實驗和分析。
山賊入夥,還需要“投名狀”呢;入搜索引擎的夥,也得要點考察期吧。(對於新站內頁收錄慢的回答)
如果你在中關村,搜“銀行”,然後結果全是中關村周圍的銀行網點,按距離你的遠近排序,這聽上去不是一件很美妙的事情嗎?呵呵。我也希望那一天儘早到來。
判定頁面重複的算法很複雜。可以肯定的是,僅meta相同,是不會被判爲重複的。相同兩個帖子被收錄(URL可能不同),低權重的頁面會不被建索引,或者被高權重頁面類聚掉。
更換服務器對網站排名有影響嗎?如果有,影響有多大?百度說:原則上是不會的。除非...新換的服務器太糟糕,三天兩頭訪問失敗,或者服務器從國內換到國外,動輒被和諧,諸如此類的“硬件”問題。
很多人喜歡往標題裏塞很多關鍵詞,以爲那樣就全面開花,但很可能適得其反。這個原理同在一個頁面上設超鏈個數一樣。分一杯羹的人越多,每個人所得的羹越少。
一個普通用戶,如果用你的關鍵詞去搜,怎樣的結果是合理的?如果你不喜歡的結果,恰是用戶所喜歡的,那麼除非版權問題之類,否則很難得到解決;如果你不喜歡的結果,也是普通用戶所不喜歡的,那麼這是一個會被百度關注的問題。
成搜索結果中顯示標題與實際標題不一致的主要原因可能是tagtitle提取失敗,系統只好從其他地方取了一些文本作爲標題。這種提取失敗的原因,有網頁設計層面的(比如全是flash或者ajax),也有robots封禁層面的(某些重要網頁雖然不抓取,但會保留url本身)。
一個網頁導出的鏈接數這個暫時沒有具體的數值標準。一般情況下,鏈接數量,會影響到這些鏈接從該頁面上所獲得的權重;少就多分一些,多就少分一些。
從用戶體驗角度,有些轉載未必比原創差。比方一篇科技原創博文,被知名門戶網站的科技頻道轉載。如果這種轉載保留原創者姓名和出處鏈接,實際上對原創者是有利的,因爲起到了更好的傳播效果。只是國內的轉載,很多是掐頭去尾,使原創者比較受傷。
對於搜索引擎來說,雖然超大的頁面並不影響抓取和收錄,但畢竟搜索引擎不會爲頁面上的每一個字節都建立索引(那會造成極大的資源浪費和效率等問題)。爲了使頁面的主體內容都可被檢索到,我們建議應當將單個頁面的大小控制在合理範圍內,就目前而言,推薦不大於128KB。
Robots Meta標籤,我們支持nofollow和noarchive。
幾乎所有的大型網站都在用CDN,看看他們在搜索引擎中的表現就可以知道不會任何的負面影響了。但我們建議站長儘量選擇技術成熟的CDN服務商,某些CDN服務商會導致網站在某些地區訪問不穩定,可能會影響Baiduspider的抓取。
正常的301永久重定向,舊url上積累的各種投票信息會全部轉移到新url上。
正常情況下,Baiduspider對一個網站的抓取頻率決定於這個網站產出新內容的速度。一個小網站的抓取頻率遠高於新內容產出速度,通常會是下面這兩種問題有中的一個:1)有其他程序冒充Baiduspider抓取。2)網站程序有漏洞,
通常情況下,搜索引擎對https這類網頁並不做內容解析,而只是將url進行索引。IP地址的url被收錄,除了spider在機制上的不完善之外,通常站點設計上也有一些缺陷。一般情況下,這類問題是可以被規避的。
javascript的解析,是很多搜索引擎正在做的事情;同理,對flash的解析。畢竟有那麼多應用javascript或者flash的網站,並沒有意識到,他們的做法給搜索引擎的收錄和索引帶來的麻煩。所以,如果期望不被搜索引擎收錄的話,最直接的手段,還是寫robots文件。
過期域名也是域名,所以,適用於新域名的策略,也一樣適用於過期域名。只是過期域名在歷史上累積的與現有網站無關的權重,會被剝離掉,這也是很容易理解的。
:“僞原創”就是“非原創”。對非原創的策略,同樣適用於僞原創。歸根結底,這是一個技術實現程度問題,而不是策略思路問題。
網站改版首先要考慮的如何保證老用戶不流失,保證用戶在訪問他以前收藏的舊url時,能引導用戶到新網站上對應的內容。我們推薦的做法是將舊url301永久重定向到內容對應的新url,這樣搜索引擎會把舊網頁積累下來的權值完整的轉移到新網頁上。
淘客現在很氾濫,內容已經是高度重複,很多的類似網站將不會獲得競爭優勢。
一般來說,內容高度重複的情況下,往往拼的是站點權重。
搜索引擎的站點權重現在計算的都是各種途徑的投票,不僅僅只有超鏈。
度通過一個叫做Baiduspider的程序抓取互聯網上的網頁,經過處理後建入索引中,目前Baiduspider只能讀懂文本內容,flash、圖片等非文本內容暫時不能處理。
不少網站管理員反映百度對301重定向支持不徹底,新舊網頁信息轉換慢,這是事實。但是,請大家相信,百度在努力解決這個問題。
如果必須使用Flash等製作網頁,建議製作一個供搜索引擎收錄的文字版,並在首頁使用文本鏈接指向文字版。
已經強調過很多次了,百度site語法的結果數不準。而且這種不準的幅度甚至不是穩定的,可能今天比較接近真實值,明天就發生大波動了。
site語法設定的初衷,其實是期望用戶可以設定約束搜索範圍,實現更加精準的搜索。這同intitle,inurl,本質上是相同的。而在這些高級語法下的結果數,和常規搜索一樣,都是“估值”,而非精確值。因此,很有可能site下的“結果數”減少了,實際被索引數卻可能增加了。
們挺希望和正常的SEO做更多交流的,現在大把的高質量網站排不上來。國內的情況很尷尬,高質量的網站不重視SEO,垃圾站倒是挺重視。。。
不要使用frame和iframe框架結構,通過iframe顯示的內容可能會被百度丟棄。
重要的網頁不要使用https協議,如果非用不可,儘量將首頁和重要頁面做個http版,方面百度收錄。
網頁title是網頁上主要內容的概括,搜索引擎可以通過網頁標題迅速的判斷網頁的主題。每個網頁的內容都是不同的,每個網頁都應該有獨一無二的title。
決定網頁排名的因素有很多,title只是一部分而已。大家通過搜索結果應該發現合理的title撰寫的重要性。事實上,我們卻發現很多的網站,整個網站都在使用同一個title。
用戶在百度網頁搜索中搜索到你的網頁時,title會做爲最重要的內容顯示在摘要中,一個主題明確的title會幫助用戶更方便地從搜索結果中判斷你網頁上內容是否符合他需要。
通常網頁標題可以這樣描述 --- 首頁:網站名稱 或者 網站名稱_提供服務介紹or產品介紹 頻道頁:頻道名稱_網站名稱文章頁:文章title_頻道名稱_網站名稱
長期以來,百度和站長之間缺乏坦誠和有效的溝通渠道,導致很多不必要的誤會發生。主要原因是百度過去一直處於飛速發展中,百度網頁搜索工程師們真的很忙,乃至無暇抽身。
網頁標題要主題明確,包含這個網頁中最重要的內容;簡明精練,不羅列與網頁內容不相關的信息。
網站改版,如果是內容發生根本性變化,則理論上會被視爲一個全新網站,舊有超鏈失效。以前有商家在淘寶上用低價物品炒皇冠,炒成後再換其他高價值商品賣。這顯然是一個漏洞。過期超鏈無效,本質上也是如此,這是合乎一般邏輯的。
有不少站長反映百度只收錄不帶www的URL,不收錄帶www的。或者兩個都收錄,即使從domain.com做了301轉向到www.domain.com也如此。搜索時,兩個版本還可能同時出現在一個結果頁面上。這應該是系統缺陷問題,不合邏輯。我們會反饋給相關工程師追查。
網頁抓取和建立索引是不等同的。這些網頁會經過一些必要的chk過程之後纔會被建入索引。
百度對海外站點沒有歧視。但百度從國內爬出去的蜘蛛,會嚴格遵守國家的政策和法令,所以國內普通用戶訪問受限的內容,百度蜘蛛一樣會搞不定。
任何對站點價值分析有貢獻的要素,都有可能被搜索引擎使用。並且這些要素的使用方式,也不是一成不變的。至於具體有哪些要素已經被使用以及如何使用,這個無法詳述。
一個普通用戶,如果用你的關鍵詞去搜,怎樣的結果是合理的?如果你不喜歡的結果,恰是用戶所喜歡的,那麼除非版權問題之類,否則很難得到解決;如果你不喜歡的結果,也是普通用戶所不喜歡的,那麼這是一個會被百度關注的問題。其實百度沒啥神祕的,用這個邏輯可以解決一堆的猜想。
蜘蛛爬行和進入索引,這個是兩個事情。
搜索引擎的技術思路都是一樣的,找好內容的特徵,把它們排上來,找不好內容的特徵,把它們降下去。
URL:http://www.mintao.net/blog/154.html
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章