捕獲和轉換Web的工具
GrabzIt的在線社區

新手需要幫助(最初發佈在錯誤的區域)

詢問有關如何使用GrabzIt的屏幕截圖工具的問題。

你好社區,

請原諒我的無知。我是業務人員,而不是技術人員。我相信它會在我的問題中脫穎而出。

是否可以在 Web Scrape 工具中使用更強大的選擇和控制參數,例如 URL 模式(最關鍵)和螢幕截圖工具的跟隨行控制設定。我想要的只是抓取基本 URL 和來自該 URL 的擴展域,並限制抓取的深度。我的目標只是從某些領域集中獲取新聞文章。我寧願只將文字作為輸出,但我可以接受以 docx 形式提供的圖像。螢幕截圖工具的輸出非常適合我的基本要求,但選擇和控制功能太有限。我必須知道所有子域和文章名稱才能使用該工具的標準輸入,這是不切實際的。

我認為刮刀會很棒,我開始使用它,但後來我很快就發現該工具的定價和限制非常大!根據這種成本結構對我來說使用它是不可行的。

請注意,我有一位編寫python 的編碼員,她正在使用API​​,但她對這個工具並不了解,而且我們在就我的期望進行清楚地溝通時遇到了挑戰,所以我擔心她的工作正在朝著一個方向發展對我來說不是最佳的。具體來說,我告訴她我希望擁有與網頁抓取工具相同的輸入控件,但螢幕截圖工具除外。但我認為她不理解或欣賞我的問題。是否可以使用 API 來利用強大的選擇標準,而無需為 webscrapter 支付瘋狂的高價

任何指導將不勝感激。

先感謝您!!!
1年2024月XNUMX日匿名提問

1年2024月XNUMX日匿名提問

嗨,

沒問題,我會盡力回答你的問題。

一般來說,網頁抓取僅限於網站或 URL 模式,否則由於內容的性質 internet 追蹤連結將導致網頁抓取永遠不會結束。

螢幕截圖工具會按計劃或在網頁發生變更時對指定 URL 進行一次螢幕截圖。如果您有要擷取的 URL 列表,則可以匯入該列表 into 截圖工具。

透過 API,您可以使用自己的邏輯來觸發螢幕截圖。因此,對於您正在做的事情,我認為您需要某種自訂網頁抓取工具,它會觸發 API。 

希望這可以幫助。

GrabzIt 支持人員於 1 年 2024 月 XNUMX 日回复