捕獲和轉換Web的工具

使GrabzIt的Web抓取工具更易於訪問

04-2017-XNUMX
改進之前的網頁蒐集

我們的 刮板機 是一個非常強大的工具,但是非技術用戶可能很難使用。 正如您在2016的入門視頻中看到的那樣。

為解決此問題,除非明確要求,否則我們現在隱藏原始的刮刮指令,“刮擦指令”選項卡現在默認情況下以純英語顯示刮刮指令。 實際上,現在可以完全添加和刪除抓取指令,而無需編寫任何代碼。

我們還簡化了網頁抓取工具嚮導, int通過合併四個獨立的嚮導來實現 int一位 現在,新嚮導可以執行多個操作,每個操作僅在適用於網頁時顯示。 它還旨在為用戶提供更多 int基於要抓取的網頁的通用選項。

但是,如果您要為幾種不同類型的網頁編寫剪貼簿,該怎麼辦? 為了解決這個問題,我們創建了一個新的 模板系統 允許您定義應針對哪些網頁和操作執行哪些刮取指令,並且無需編寫手動刮除指令就可以使用所有這些新功能。

改進後的網頁抓取

另一個常見的抱怨int 是很難分辨刮板是否按預期工作,以解決此刮板結果,現在還可以實時獲取日誌。 因此,您知道刮擦在結束之前是否仍在工作,如果需要,您可以選擇中止刮擦。

所有這些更改都帶來了更加用戶友好的體驗,如左側最新的抓取教程所示。

但是,我們還沒有通過這些更改來完善我們的網絡刮板的可用性,因此,如果有人對如何進一步改進它有任何想法,請 請聯繫我們!

查看最新的博客文章