最新国产在线不卡AV,国产又爽又黄的视频免费看,精品综合久久久久久97,日韩欧美高清中文字幕免费一区二区

            科普

            采集管理 (四)、采集正則寫法 帝國網(wǎng)站管理系統(tǒng)

            電腦知識小雪供稿
            采集正則寫法
            帝國CMS采集正則介紹與寫法。
             
            帝國CMS的采集正則
            1、作用:通過設(shè)置采集正則以便使系統(tǒng)識別你要采集的內(nèi)容。
            2、帝國CMS的采集正則是什么樣的,下面我們用實例講解:
            (1)、假如我們要采集頁面的內(nèi)容頁為如下頁面:
            圖1:HTML頁面

            圖2:查看頁面源代碼為如下:
            (2)、由上圖的源代碼內(nèi)容我們可以得出帝國CMS的采集正則:
            新聞標題正則:
                <td>標題:<strong>[!--title--]</strong></td>
            新聞內(nèi)容正則: 
                <td>內(nèi)容:<font color="#FF0000">[!--newstext--]</font></td>

            上面中的“[!--title--]”與“[!--newstext--]”分別為“標題”字段與“內(nèi)容”字段的正則變量。用于指定我們要采集的內(nèi)容位置。
            (3)、由上面我們得出了,帝國CMS采集正則是把正則變量替換要采集內(nèi)容后的代碼內(nèi)容。格式:
            識別代碼頭部[!--變量名--]識別代碼尾部
            注意事項:上面的“識別代碼頭部”一定是要唯一的標記。
            3、帝國CMS正則還有表示任意內(nèi)容的字符:“*”
            如果“識別代碼頭部”中有內(nèi)容是變化的,那么我們可以用*代替它。如頁面源代碼為如下,我們要采集下面的鏈接地址:
            <a title="任意可變內(nèi)容" href="鏈接地址">標題</a>
            通過使用“*”任意內(nèi)容表示字符,我們可以用下面的正則忽略可變內(nèi)容,獲得鏈接地址:
            <a title="*" href="[!--newsurl--]">
            附加說明:[!--newsurl--]為頁面鏈接地址的正則變量。
            4、其他說明:

            (1)、正則要找出唯一性的開頭字符。有時候空格都會成為識別的依據(jù)。

            (2)、對于特殊字符請在前面加上“\\”,當然直接將特殊字符改為“*”最合適了。特殊字符如下:
            “ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。

             
              為你推薦