捕獲和轉換Web的工具

2019的大型Web刮板改進

08年2019月XNUMX日

除了重新設計和大量錯誤修復之外,我們還對 GrabzIt 的網絡抓取工具進行了大幅改進,其中包括:

  • 支援提取CSS樣式中包含的內容
  • 現在您可以選擇執行抓取的國家。 目前的選擇是美國或英國。
  • 現在您可以選擇是否遵守 robots.txt 規則。 預設情況下,會進行刮擦。
  • 相對資料現在可以自動關聯在一起,當您擁有針對某些 HTML 元素而不是其他 HTML 元素存在的資料時,這非常有用。 透過將這些項目關聯在一起,這些值將根據結果資料集中的正確資料項目顯示。
  • 建立資料集時,不同的列可以屬於不同的模板,這表示某些列可以從一種類型的頁面填充,而其他列可以從不同類型的頁面填充。 其中一個範例是產品清單頁面和產品詳細資訊頁面。 這將允許您從列表頁面獲取廣泛的詳細信息,然後從產品詳細資訊頁面獲取詳細資訊。
  • 改進資料集產生器的另一種方法是允許將操作(例如包含、小於等)的效果套用於所有或某些列。
  • 現在有幾個 新命令 可從抓取精靈中取得。
    • 刪除 - 您現在可以刪除元素,這在某些情況下非常有用,可以阻止多次讀取相同的元素。
    • 捲動 – 網頁抓取工具現在可以捲動支援它的 HTML 元素。
    • 懸停 - 此命令將滑鼠懸停在指定元素上方,這對於顯示資訊很有用。
    • 分頁 – 這是點選操作的新功能,允許在選取的分頁連結上自動執行分頁。 這意味著,即使抓取器點擊了分頁資料中的某個位置,作為抓取的一部分,它也會找到返回目前分頁頁面以繼續抓取的方式。
  • Grabz 最好的部分是 網頁刮板 是你每個月都可以免費使用它。 那麼,您還在等什麼,試試吧,請將您的任何回饋回饋給我們,我們很樂意讓我們的網站成為最好的線上網路抓取工具!

查看最新的博客文章