如何提升開放適配效果? | 
    
| 發(fā)布時(shí)間: 2012/9/18 11:19:50 | 
|  
  首先,對(duì)已有的對(duì)應(yīng)關(guān)系持續(xù)進(jìn)行適配,同時(shí)不斷建設(shè)新的對(duì)應(yīng)關(guān)系,增加適配覆蓋的范圍。 
其次,要確保已經(jīng)標(biāo)注/提交的對(duì)應(yīng)關(guān)系對(duì)應(yīng)準(zhǔn)確。以下是常見的對(duì)應(yīng)不準(zhǔn)確錯(cuò)誤,請(qǐng)網(wǎng)站進(jìn)行自查,并及時(shí)修改。 
手機(jī)頁不可用,比如死鏈。 
robots封禁。放開對(duì)百度spider的robots封禁和屏蔽,以便spider獲取您PC站與手機(jī)站之間的對(duì)應(yīng)關(guān)系。 
手機(jī)頁使用了ajax等異步加載的方法加載內(nèi)容主體。 
格式錯(cuò)誤。包括meta標(biāo)注的位置、格式錯(cuò)誤,對(duì)應(yīng)關(guān)系sitemap格式錯(cuò)誤等。 
對(duì)應(yīng)關(guān)系錯(cuò)誤 
當(dāng)PC頁為內(nèi)容頁時(shí),應(yīng)該適配到對(duì)應(yīng)的手機(jī)頁內(nèi)容頁,而實(shí)際卻適配到手機(jī)頁的首頁/列表頁。 
例如PC頁為http://www.qidian.com/Book/2083259.aspx,適配后的手機(jī)頁為http://qidian.cn/?from=web 
手機(jī)頁本身無主體內(nèi)容/主體內(nèi)容過少。 
手機(jī)頁需登錄才能瀏覽主體內(nèi)容。 
PC頁內(nèi)容與手機(jī)頁內(nèi)容不存在一一對(duì)應(yīng)關(guān)系。 
正確的對(duì)應(yīng)關(guān)系示例: 
PC頁http://sports.sina.com.cn/j/2012-08-13/23516189909.shtml 
手機(jī)頁http://sports.sina.cn/?sa=d4634022t24v4&cid=797&pos=10&vt=4 
如何制作對(duì)應(yīng)關(guān)系sitemap文件(url級(jí)別)? 
通過XML文件描述url級(jí)別的PC頁與手機(jī)頁的對(duì)應(yīng)關(guān)系,網(wǎng)站當(dāng)前有對(duì)應(yīng)關(guān)系的所有PC頁面url均需要給出。格式如下: 
<?xml version="1.0"encoding="UTF-8"?> 
<urlset>   
<url> 
<!--必填標(biāo)簽,表示PC頁的url地址 --> 
<loc><![CDATA[http://www.yoursite.html/yoursite.html]]></loc> 
<data> 
<display> 
<!—可選標(biāo)簽,表示該P(yáng)C頁對(duì)應(yīng)的html5版式的手機(jī)頁的url地址 --> 
<html5_url><![CDATA[http://html5.yoursite.html/yoursite.html]]></html5_url> 
<!—可選標(biāo)簽,表示該P(yáng)C頁對(duì)應(yīng)的wml版式的手機(jī)頁的url地址 --> 
<wml_url><![CDATA[http://wml.yoursite.html/yoursite.html]]></wml_url> 
<!—可選標(biāo)簽,表示該P(yáng)C頁對(duì)應(yīng)的xhtml版式的手機(jī)頁的url地址 --> 
<xhtml_url><![CDATA[http://xhtml.yoursite.html/yoursite.html]]></xhtml_url> 
</display> 
</data> 
</url> 
</urlset> 
例如: 
<?xmlversion="1.0" encoding="UTF-8"?> 
<urlset> 
<url> 
<loc><![CDATA[http://www.sina.com.cn/]]></loc> 
<data> 
<display> 
<html5_url><![CDATA[http://html5.sina.com.cn/]]></html5_url> 
<wml_url><![CDATA[http://wml.sina.com.cn/]]></wml_url> 
<xhtml_url><![CDATA[http://3g.sina.com.cn/]]></xhtml_url> 
</display> 
</data> 
</url> 
<url> 
<loc><![CDATA[http://www.sohu.com/]]></loc> 
<data> 
<display> 
<html5_url><![CDATA[http://html5.sohu.com/]]></html5_url> 
<wml_url><![CDATA[http://wml.sohu.com/]]></wml_url> 
<xhtml_url><![CDATA[http://3g.sohu.com/]]></xhtml_url> 
</display> 
</data> 
</url> 
</urlset> 
如何制作對(duì)應(yīng)關(guān)系sitemap文件(pattern級(jí)別)? 
1、格式 
Pattern級(jí)別對(duì)應(yīng)關(guān)系提交支持XML sitemap的形式,每個(gè)xml sitemap文件可包含1組或者多組pattern對(duì)應(yīng)關(guān)系。格式說明如下: 
標(biāo)簽名稱	標(biāo)簽說明	標(biāo)簽限制	標(biāo)簽路徑	可選/必選 
urlset	唯一的根節(jié)點(diǎn),標(biāo)記整個(gè)文檔的開頭和結(jié)尾	/	/	必選 
url	url標(biāo)記每組pattern的開始和結(jié)束	1個(gè)或多個(gè)	/urlset	必選 
loc	表示PC站點(diǎn)的網(wǎng)址首頁	最大長度256個(gè)字符,以"http://"開頭	/urlset/url	必選 
pc_url_pattern	表示該P(yáng)C頁的url pattern	最大長度256個(gè)字符,以"http://"開頭	/urlset/url/data/display	必選 
html5_url_pattern	表示PC頁對(duì)應(yīng)的html5版式的手機(jī)頁的url pattern	最大長度256個(gè)字符,以"http://"開頭	/urlset/url/data/display	可選 
wml_url_pattern	表示PC頁對(duì)應(yīng)的wml版式的手機(jī)頁的url pattern	最大長度256個(gè)字符,以"http://"開頭	/urlset/url/data/display	可選 
xhtml_url_pattern	表示PC頁對(duì)應(yīng)的xhtml版式的手機(jī)頁的url pattern	最大長度256個(gè)字符,以"http://"開頭	/urlset/url/data/display	可選 
各URL字段可以被CDATA標(biāo)記包含,如<![CDATA[url]]> 。 
示例: 
<?xml version="1.0"encoding="UTF-8"?> 
<urlset> 
<!-- 表示news.163.com下的一組pattern對(duì)應(yīng)關(guān)系--> 
<url> 
<loc><![CDATA[http://news.163.com/]]></loc>                                  
<data> 
<display> 
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern> 
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern> 
<wml_url_pattern ><![CDATA[http://wap.163.com/wml/page/ntes/${1}/${2}/${3}/${4}.wml]]></wml_url_pattern> 
</display> 
</data> 
</url> 
2、字段詳細(xì)說明 
pc_url_pattern: 表示PC頁pattern,在PC頁url的基礎(chǔ)上,首先確定url中哪些路徑或參數(shù)是可替換的。然后根據(jù)其類型,使用正則匹配符號(hào)(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示數(shù)字或字母組成的字符串。 
xhtml_url_pattern / html5_url_pattern/ wml_url_pattern:表示xhtml/html5/wml版式的手機(jī)頁pattern,在手機(jī)頁url的基礎(chǔ)上,根據(jù)可替換參數(shù)在對(duì)應(yīng)的PC頁pattern中出現(xiàn)的順序,依次用${1},${2},……表示該參數(shù)。 
3、舉例 
以網(wǎng)易的新聞頁“漫游接電話移動(dòng)也不要錢了”為例,其PC頁url地址為http://news.163.com/09/1001/07/5KH8DE1F000120GR.html, 其對(duì)應(yīng)的xhtml格式的手機(jī)頁url地址為http://3g.163.com/news/09/1001/07/5KH8DE1F000120GR.html。 
步驟一:確定PC頁中的可替換參數(shù)或者路徑,得到其位置序號(hào)和類型。 
根據(jù)網(wǎng)站自身url的層次結(jié)構(gòu),其中09,1001,07和5KH8DE1F000120GR為動(dòng)態(tài)可替換的路徑。除5KH8DE1F000120GR為字母和數(shù)字混合外,其余均為純數(shù)字。 
步驟二:根據(jù)可替換參數(shù)或路徑的類型,得到PC頁pattern (即sitemap中的pc_url_pattern)。 
使用正則匹配符號(hào)(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示數(shù)字或字母組成的字符串。 
步驟三:根據(jù)手機(jī)頁url,以及可替換參數(shù)在步驟一中的位置序號(hào),依次用${1},${2},……表示替換掉手機(jī)頁url中的可替換參數(shù)或路徑,得到手機(jī)頁pattern。 
例子中,依次用${1},${2},${3}和${4}替換掉09,1001,07和5KH8DE1F000120GR,得到手機(jī)頁pattern為http://3g.163.com/news/${1}/${2}/${3}/${4}.html。 
步驟四:根據(jù)手機(jī)頁的頁面類型,將手機(jī)頁pattern寫入對(duì)應(yīng)的字段。各字段可以用CDATA標(biāo)記包含,如<![CDATA[url]]>  。 
如示例中該pattern的手機(jī)頁面為xhtml版式,將pattern http://3g.163.com/news/${1}/${2}/${3}/${4}.html 寫入到xhtml_url_pattern字段中。 
最終得到sitemap文件如下: 
<?xml version="1.0"encoding="UTF-8"?> 
<urlset> 
<!—表示news.163.com下的一組pattern對(duì)應(yīng)關(guān)系--> 
<url> 
<loc><![CDATA[http://news.163.com/]]></loc> 
<data> 
<display> 
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern> 
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern> 
<!-- 一組PC pattern可能含有多個(gè)版式的手機(jī)頁pattern --> 
</display> 
</data> 
</url> 
<!-- 下一組pattern放在一個(gè)新的url節(jié)點(diǎn)內(nèi) --> 
</urlset> 
備注 
通過sitemap只能提交具有簡單對(duì)應(yīng)關(guān)系的pattern,也即,在PC頁url與手機(jī)頁路徑或參數(shù)之間存在直接的對(duì)應(yīng)關(guān)系,使得機(jī)器能根據(jù)PC頁url按照一定的正則pattern自動(dòng)計(jì)算出與其對(duì)應(yīng)的手機(jī)頁的url。如http://news.sina.com.cn/c/2012-05-27/235824487992.shtml和http://news.sina.cn/?sa=t124v71d6155414&pos=102&vt=4雖然是對(duì)應(yīng)的,但是從url本身很難找到聯(lián)系,就不屬于簡單對(duì)應(yīng)關(guān)系。 
正則匹配符號(hào)不可嵌套使用,如(d+(\w+))這種形式不合法。 
Pattern中,站長無需考慮特殊符號(hào)的正則轉(zhuǎn)義等問題,百度會(huì)幫您轉(zhuǎn)義成機(jī)器可以識(shí)別的正則表達(dá)式。 
本文出自:億恩科技【www.cmtents.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]  | 
    
       
       
       京公網(wǎng)安備41019702002023號(hào)