站內(nèi)搜索
電腦軟件
編輯推薦
本類下載榜
總下載排行
軟件簡介
后羿網(wǎng)頁采集器下載是一款非常實用的網(wǎng)頁數(shù)據(jù)采集軟件。你是否還在尋找好用的網(wǎng)頁數(shù)據(jù)采集干凈?后羿網(wǎng)頁采集器就是您找的采集干凈。該工具軟件是由原Google技術(shù)團(tuán)隊傾力打造的網(wǎng)頁數(shù)據(jù)采集軟件??梢暬c選,一鍵采集網(wǎng)頁數(shù)據(jù),全平臺,Win/Mac/Linux都可用,采集和導(dǎo)出全,制放心用,可后臺運行,速度實時顯示。需要的朋友快來jz5u下載使用吧!
1、可視化自定義采集流程
全程問答式引導(dǎo)、可視化操作、自定義采集流程
自動記錄和模擬網(wǎng)頁操作順序
高級設(shè)置滿足更多采集需求
2、點選抽取網(wǎng)頁數(shù)據(jù)
鼠標(biāo)點擊選擇要爬取的網(wǎng)頁內(nèi)容、操作簡單
可選擇抽取文本、鏈接、屬性、html標(biāo)簽等
3、運行批量采集數(shù)據(jù)
軟件按照采集流程和抽取規(guī)則自動批量采集
快速穩(wěn)定,實時顯示采集速度和過程
可切換軟件后臺運行,不打擾前臺工作
4、導(dǎo)出和發(fā)布采集的數(shù)據(jù)
采集的數(shù)據(jù)自動表格化,自由配置字段
支持?jǐn)?shù)據(jù)導(dǎo)出到Excel等本地文件
和一鍵發(fā)布到CMS網(wǎng)站/數(shù)據(jù)庫/微信公眾號等媒體使用說明
使用方法
步驟1:創(chuàng)建采集任務(wù)
1)啟動后羿采集器,進(jìn)入主界面,選擇自定義采集并點擊創(chuàng)建任務(wù)按鈕創(chuàng)建 "自定義采集任務(wù)"
2)輸入百度搜索的URL,包括三種方式
1、手動輸入:在輸入框中直接輸入URL,多個URL時須要換行分割
2、點擊從文件中讀取方式:用戶選擇一個存放URL的文件,文件中可以有多個URL地址,地址須要換行分割。
3、批量添加方式:通過添加并調(diào)整地址參數(shù)生成多個有規(guī)律的地址
步驟2:自定義采集流程
1)點擊創(chuàng)建后自動打開第一個URL進(jìn)而進(jìn)入自定義設(shè)置頁面,默認(rèn)已經(jīng)創(chuàng)建了開始、打開網(wǎng)頁、結(jié)束的流程塊。底部模板區(qū)用于拖拽到畫布中生成新的流程塊;點擊打開網(wǎng)頁中的屬性按鈕,可修改打開的網(wǎng)址
2)添加輸入文字流程塊:在底部模板區(qū)中拖拽輸入文字塊到打開網(wǎng)頁塊后面附近,當(dāng)出現(xiàn)陰影區(qū)域的時候可以松開鼠標(biāo),此時會自動連接,添加完成
3)生成完整流程圖:仿照上面添加輸入文字流程塊的拖拽流程添加新塊:如下圖所示:
關(guān)鍵步驟塊設(shè)置介紹
步驟2:定時等待用于等待前面打開網(wǎng)頁完成
步驟3:點擊輸入框Xpath屬性按鈕,在屬性菜單中點擊圖標(biāo)進(jìn)行點選網(wǎng)頁中的輸入框,點擊輸入文本屬性按鈕,在菜單中輸入要搜索的文本。
步驟4:用于設(shè)置點擊開始搜索按鈕,點擊元素的xpath屬性按鈕,在菜單中點擊點選圖標(biāo),然后點擊網(wǎng)頁中的百度一下按鈕即可。
步驟5:用于設(shè)置循環(huán)加載下一列表頁。在循環(huán)塊內(nèi)部的循環(huán)條件塊中設(shè)置詳細(xì)條件,此處點擊操作按鈕,選擇單個元素,然后在屬性菜單中點擊元素的xpath屬性按鈕,同上進(jìn)行點選網(wǎng)頁中的下一頁按鈕。循環(huán)次數(shù)屬性按鈕可默認(rèn)為0,即不限制點擊下一頁的次數(shù)。
步驟6:用于設(shè)置循環(huán)抽取列表頁中的數(shù)據(jù)。在循環(huán)塊內(nèi)部的循環(huán)條件塊中設(shè)置詳細(xì)條件,此處點擊操作按鈕,選擇不固定元素列表,然后在屬性菜單中點擊元素的xpath屬性按鈕,然后在網(wǎng)頁中連續(xù)點選兩次抽取第一塊和第二塊元素。循環(huán)次數(shù)屬性按鈕可默認(rèn)為0,即不限制列表中收取字段的數(shù)量。
步驟7:用于執(zhí)行點擊下一頁按鈕操作,點擊元素xpath屬性按鈕,選擇使用當(dāng)前循環(huán)中元素的xpath選項。
步驟8:同理用于設(shè)置網(wǎng)頁加載等待時間。
步驟9:用于設(shè)置在列表頁抽取的字段規(guī)則,點擊屬性按鈕中使用循環(huán)中的元素按鈕,選擇使用循環(huán)中的元素選項。點擊元素模板屬性按鈕在字段表格中點擊加減進(jìn)行添加刪除字段,添加字段使用點選操作,即點擊加號后鼠標(biāo)移動到網(wǎng)頁元素上點擊選擇。
4)點擊開始采集,啟動采集
步驟3:數(shù)據(jù)采集及導(dǎo)出
1)采集任務(wù)運行中
2)采集完成后,選擇導(dǎo)出數(shù)據(jù)可以把數(shù)據(jù)都導(dǎo)出到本地文件
3)選擇導(dǎo)出方式,將采集好的數(shù)據(jù)導(dǎo)出,這里可以選擇excel作為導(dǎo)出為格式
4)采集數(shù)據(jù)導(dǎo)出后如下圖
后羿采集器是是原Google技術(shù)團(tuán)隊傾力打造的一款網(wǎng)頁數(shù)據(jù)采集軟件,可視化點選,一鍵采集網(wǎng)頁數(shù)據(jù),全平臺,Win/Mac/Linux都可用,采集和導(dǎo)出全,制放心用,可后臺運行,速度實時顯示。
都客網(wǎng)頁抓手 v2.5綠色版[仿站必備工具]
刷網(wǎng)頁訪問量工具1.45綠色注冊版_刷高博客和網(wǎng)站訪問量
多任務(wù)網(wǎng)頁刷新器v3.0綠色版_可定時刷新網(wǎng)頁
網(wǎng)頁爬蟲工具[PClawer] V1.1綠色版_網(wǎng)頁抓取工具
UUmeFLVSpy(Flash文件抓取器+播放器])1.0簡體中文綠色版
網(wǎng)頁源文件查看分析器v1.30綠色版_分析網(wǎng)頁的HTML源代碼
Editortools(無人值守自動采集助手)2.6.13綠色版
松鼠HTML編輯器(純代碼式的HTML編輯器) 綠色版
CYY網(wǎng)頁提取助手v2.9綠色版_從網(wǎng)頁提取圖片F(xiàn)lash動畫等
IETester (IE瀏覽器兼容性測試) 0.5.4 純凈安裝版
網(wǎng)站地圖生成工具_(dá)小爬蟲2.0簡體中文版
火車采集器v3.2 SP5 VIP版特別文件
web表單編輯器CoffeeCup Flash Form Builder V7.2綠色特別版
石青偽原創(chuàng)工具 2.3.9.11 綠色免費版
HTML to EXE Converter(將HTML轉(zhuǎn)為EXE文件)v1.0英文綠色版
網(wǎng)頁媒體探測器v1.0綠色版(探測出網(wǎng)頁上的媒體文件)