采集“帝國(guó)官方技術(shù)文檔”實(shí)例教程 帝國(guó)網(wǎng)站管理系統(tǒng)
電腦知識(shí) 由小雪供稿實(shí)例教你使用采集:本節(jié)通過(guò)采集“帝國(guó)官方技術(shù)文檔”作為采集教程實(shí)例 |
不同系統(tǒng)模型都有自己的采集表單,無(wú)論是內(nèi)置的還是用戶自定義的系統(tǒng)模型,新聞系統(tǒng)有新聞系統(tǒng)采集,下載系統(tǒng)有下載系統(tǒng)采集等等。 |
下面只是新聞系統(tǒng)模型的采集,其它系統(tǒng)模型采集基本雷同,用戶可舉一反三。 |
采集頁(yè)面地址:http://www.phome.net/document/java/ |
一、登陸后臺(tái)-》“管理欄目”-》“增加采集節(jié)點(diǎn)”。 |
二、“選擇要增加采集的欄目”(選擇終極欄目)后進(jìn)入增加節(jié)點(diǎn)表單: |
![]() |
三、由于前面許多選項(xiàng)是依實(shí)際需求而設(shè)定。我們下面主要講解正則的主要內(nèi)容: |
1、輸入“采集頁(yè)面地址”列表,如下圖:(每個(gè)列表用回車格開(kāi)) |
![]() |
2、由于采集列表頁(yè)的信息鏈接正則不包含域名,所以要設(shè)置地址前綴: |
![]() |
3、設(shè)置“信息頁(yè)鏈接正則”: |
說(shuō)明:由于此采集頁(yè)面不需要設(shè)置“信息鏈接區(qū)域正則”,所以直接設(shè)置“信息頁(yè)鏈接正則”即可。 |
![]() |
上面正則由下面得出的:(查看列表頁(yè)的源文件:http://www.phome.net/document/java/) |
說(shuō)明:因?yàn)橄旅骀溄拥刂窙](méi)有加上域名,所以我們上面要設(shè)置“內(nèi)容頁(yè)地址前綴”。 |
![]() |
4、設(shè)置“標(biāo)題正則”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁(yè)的源代碼:http://www.phome.net/document/java/200505/java111590843215168.html) |
![]() |
5、設(shè)置“作者正則”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁(yè)的源代碼) |
![]() |
6、設(shè)置“信息來(lái)源正則”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁(yè)的源代碼) |
![]() |
7、設(shè)置“新聞?wù)恼齽t”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁(yè)的源代碼) |
![]() |
![]() |
8、點(diǎn)擊“提交”按鈕即可增加完畢,整個(gè)表單最終效果如下: |
[點(diǎn)擊查看整個(gè)采集表單] |
其他說(shuō)明:關(guān)于采集測(cè)試、入庫(kù)等相關(guān)操作可以看“管理采集節(jié)點(diǎn)”教程 |
如果查看網(wǎng)頁(yè)源代碼?看下圖: |
![]() |
上一篇:藥蓮教你如何采集[小林教程解析版]
下一篇:插件管理 (一)、廣告系統(tǒng)