複製鏈接
請複製以下鏈接發送給好友

網絡採集

鎖定
網絡採集器是指利用採集工具批量採集網頁中的內容,其中包括論壇、貼吧、競爭對手網站等的內容,直接保存到數據庫或發佈到網站的一個流程,是一個從目標網頁中摘取某些數據形成統一的本地數據庫的一個過程。
中文名
網絡採集
外文名
Network acquisition
1.將CTRL+C CTRL+V 程序化,系統化,自動化,智能化。
2.程序按照指定的規則定向獲取其他網站數據的一種方式。 網絡採集器是用來批量採集網頁,論壇等的內容,直接保存到數據庫或發佈到網站的一種工具,是一個從目標網頁中摘取某些數據形成統一的本地數據庫的一個過程。
這些數據本來只是在可見的網頁中以文本形式存在。這個過程所需要的不僅僅是網頁爬行器與網頁包裝器。一個複雜的數據抽取過程需要應付種種障礙,例如會話識別,HTML表單,客户端Java腳本,以及數據整合問題例如與數據集與單詞集不一致的情況,以及缺失和衝突的數據。可以根據用户設定的規則自動採集原網頁,獲取格式網頁中需要的內容。