如題,藍天采集器要采集多層級的網(wǎng)頁(yè)時(shí),例如一些常見(jiàn)的模板站。模板站除了有列表頁(yè),詳情介紹頁(yè),然后還有一個(gè)展示演示地址的DEMO頁(yè)面,而DEMO頁(yè)面里面又是框架調用了外部的鏈接。這種情況下如何使用藍天集體器來(lái)采集呢?
其他的設置照常如采集普通網(wǎng)站一樣設置,然后到內容起始頁(yè)的時(shí)候我們這樣來(lái)設置。如圖:
首先,加多一個(gè)層級:
然后點(diǎn)開(kāi)這個(gè)層級進(jìn)行設置他的抓取列表內容。這里抓取的就是我們平時(shí)采集時(shí)的列表頁(yè),抓取有多少篇文章。
設置好之后,第二步:設置詳情頁(yè)中點(diǎn)擊打開(kāi)的DEMO網(wǎng)址獲取地址。也就是詳情頁(yè)中的跳轉地址。
列表設置就設置完了?,F在是設置內容頁(yè)。選擇你想要獲取的字段,可以從剛才的列表中獲取,也可以說(shuō)跳轉后的內容頁(yè)中獲取。
設置完成,并保存,就可以進(jìn)入采集發(fā)布了。是不是很簡(jiǎn)單呢?希望對您有所幫助。