捕獲和轉換Web的工具

如何將整個網站轉換為PDF以供離線查看?

©

有時,擁有網站的PDF版本很重要。 這可能是出於法律原因,例如證明有人盜用了您受版權保護的材料。 通過定期存儲您網站的物理副本int的時間。

另一個常見原因是在關閉網站或博客之前保留所有辛勤工作的副本。 通常可能已經寫了多年的材料。 因此,您可以下載整個PDF格式的網站以供後代使用,而不是丟失所有這些內容。

GrabzIt可以使用我們易於使用的網頁抓取工具輕鬆地將您的整個網站轉換為一組PDF文件,這是一種可以從網站中解析網站的專業軟件。 int以太網 為此,您必須首先為我們的在線網絡刮板創建刮板。 然後,我們的網絡抓取工具將使用此抓取工具來抓取您網站的鏈接結構,並從找到的每個網頁中創建PDF。

抓取完成後,您將收到一封電子郵件,其中包含指向您整個網站的ZIP下載鏈接。 如果您已轉換大型網站,請耐心等待,這可能需要一些時間才能下載。 然後可以是 saved到您的本地硬盤驅動器,這將使您可以離線查看您的網站,並且仍然可以int 友好,如果需要的話。

如何創建您的Scrape

為了完成創建刮擦的工作 save 您的網站轉為PDF更加簡單。 我們創建了一個模板來為您完成所有艱苦的工作。

開始 加載此模板.

然後輸入 目標網址,然後會自動檢查該URL是否有錯誤以及是否進行了任何必要的更改。 保持 自動開始抓取 複選框被打勾,您的抓取工具將自動開始。

如果您希望網站的脫機版本具有指向該網頁的正確PDF文檔的鏈接,請使用下面的“抓取模板”。 該模板將用連接所有轉換後的網頁的特殊本地鏈接替換PDF中的鏈接。

將您的PDF文檔鏈接在一起 使用這個模板.

自定義刮板

如果要更改模板,請取消選中 自動開始抓取 複選框。 一種更改是按規定的時間表運行抓取,例如,創建網站的常規副本。 在 時間表刮 標籤,只需點擊 重複刮擦 複選框,然後選擇要重複抓取的頻率。 然後點擊 提交 開始抓取。

作為附帶說明,用於證明侵犯版權。 雖然每個PDF文件都有一個通過文件菜單可見的創建日期,但是要證明文件的創建時間,可以對其進行操作。 因此,作為附加保護,您還可以使用 時間戳記 watermark,這會將創建PDF的時間和日期添加到文檔中。 現在有一個基本的 複製保護模板 為您做到這一點。

現在開始抓取。 您可以在 管理您的拼湊 頁。 它會告訴您當前已轉換為PDF的網頁數量,如果您擴展抓取功能,則可以看到正在被轉換的當前網頁。 saved為PDF。 您還可以下載到目前為止已轉換為PDF的頁面的快照。

請記住,某些瀏覽器例如 Internet Explorer,可能不允許您本地查看PDF文件。 因此,您可能需要安裝類似 使用Adobe Acrobat Reader 您可以先查看PDF文件。

您也可以全部轉換整個網站 into DOCX通過使用此 模板.