開放協議概述
使用此開放協議,將會為您的網站帶去更多流量!
《互聯網新聞開放協議》是百度新聞搜索制定的搜索引擎新聞源收錄標準,網站可將發布的新聞內容制作成遵循此開放協議的XML格式的網頁(獨立于原有的新聞發布形式)供搜索引擎索引,將網站發布的新聞信息主動、及時地告知百度搜索引擎。
采用了《互聯網新聞開放協議》,就相當于網站的新聞被搜索引擎訂閱,通過百度——全球最大的中文搜索引擎這個平臺,網民將有可能在更大范圍內更高頻率地訪問到您網站的新聞,進而為您的網站帶來潛在的流量。
開放協議非常簡單! 您可以在我們的幫助下輕松使用。
開放協議內容
下圖為遵照《互聯網新聞開放協議》制作的XML格式的網頁,網頁上按照標準格式列出了網站發布的新聞的相關信息。 XML網頁示例:

XML標簽說明: 其中帶星號標記的為必選項,未帶星號標記為可選項。 *<document>——標記整個XML文件內容的開始和結束。 *<webSite>——站點地址。 *<webMaster>——負責人員的Email。當有必要時,我們通過這個地址與您聯系。 *<updatePeri>——更新周期,以分鐘為單位。搜索引擎將遵照此周期訪問該頁面,使頁面上的新聞更及時地出現在百度新聞中。 *<item>——標記每篇新聞信息的開始和結束。標記內為單篇新聞信息,不包括新聞專題。 *<title>——新聞標題。 *<link>——新聞url地址,與單篇新聞一一對應;若分頁的新聞存在多個URL,相當于多篇新聞。 <description>——新聞內容簡介。 *<text>——完整的新聞正文(僅包含正文文字,不包含HTML語言等其它字符)。此項的目的是使該篇新聞更多、更準地出現在搜索結果中。 *<image>——新聞正文內相關圖片,采用絕對地址。若該篇新聞無相關圖片,可以為空;若含有多張圖片,請重復使用該標簽。此項的目的是使該篇新聞的相關圖片展現在搜索結果中。 <headlineImg>——為有可能成為頭條的新聞制作的頭條圖,采用絕對地址。 <keywords>——反映新聞主題內容的一個或多個關鍵詞,關鍵詞之間以空格隔開。此項僅作為參考,檢索結果不完全依賴于此標簽中的內容。 <category>——新聞分類, 可以遵循網站自身的分類體系,最好采用一級分類。 <author>——新聞作者,可以為機構或個人 。 <source>——新聞來源,即原創媒體或其它機構 。 *<pubDate>——新聞發布時間,與該篇新聞HTML頁面上的發布時間保持一致。請精確到分鐘;若您網站的發布時間未記錄小時分鐘,提供年月日即可。
推薦時間格式:年月日小時分鐘秒 如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 | 2005年11月09日10時37分00秒 | Fri, 09 Nov 2005 10:37:00 GMT
|