捕獲和轉換Web的工具

從網站抓取電子郵件地址

以下兩個示例是同一示例的一部分 模板.

網頁抓取工具 提供了幾種特殊的實用程序方法,使從網站提取電子郵件地址變得容易。 以下示例從網頁獲取所有HTML內容,然後將其傳遞給 Utility.Text.extractAddresses 保存地址之前查找所有有效電子郵件地址的方法 intoa數據集,然後將其發送給用戶。

或者,可以使用來提取第一個匹配的電子郵件地址 Utility.Text.extractAddress 方法。

Data.save(Utility.Text.extractAddresses(Page.getHtml()));

從PDF文檔中刪除電子郵件地址

PDF文件也可以刮 用於電子郵件地址的方式類似於在上面抓取網頁的方式。 正如您在以下示例中看到的那樣,除了 PDF.getText() 方法代替 Page.getHtml() 方法。

Data.save(Utility.Text.extractAddresses(PDF.getText()));

從圖片中抓取電子郵件地址

Grabz它有能力 從圖像中提取文本 這意味著也可以利用此功能從圖像中提取電子郵件地址。 下面的示例從網頁上的所有圖像中提取所有電子郵件地址。

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));

雖然下面的抓取說明會從PDF文檔中的圖像中提取所有電子郵件地址。

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));