什么叫爬蟲數據采集 什么叫爬蟲技術


爬蟲技術就是網絡爬蟲 。(又被稱為網頁蜘蛛 , 網絡機器人 , 在FOAF社區中間 , 更經常的稱為網頁追逐者) , 是一種按照一定的規則 , 自動地抓取萬維網信息的程序或者腳本 。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲 。
1、網絡爬蟲就是為其提供信息來源的程序 , 網絡爬蟲(又被稱為網頁蜘蛛 , 網絡機器人 , 在FOAF社區中間 , 更經常被稱為網頁追逐者) , 是一種按照一定的規則 , 自動的抓取萬維網信息的程序或者腳本 , 已被廣泛應用于互聯網領域 。
2、搜索引擎使用網絡爬蟲抓取Web網頁、文檔甚至圖片、音頻、視頻等資源 , 通過相應的索引技術組織這些信息 , 提供給搜索用戶進行查詢 。
【什么叫爬蟲數據采集 什么叫爬蟲技術】

    推薦閱讀