捕獲和轉換Web的工具

定位HTML元素時確定PDF頁面的大小

20 2019月

最初,在我們最近對PDF中的HTML元素進行定位之前,生成的PDF頁面大小與目標HTML元素相同。 這是因為除了裁剪HTML元素以外的其他所有內容外,我們找不到從PDF中僅提取目標的可靠方法。

但是,經過大量工作,我們設法提供了目標HTML元素,並在其周圍留有空白,同時還與我們的模板系統兼容。 使用此功能時,允許用戶首次指定頁眉和頁腳。

不幸的是,很快就清楚了使用目標功能時還有另一個不一致之處。 與方向和頁面大小相關的參數被忽略。 這是因為,實際上,PDF使用了新的特殊頁面大小,而目標功能在圖像捕獲API中的工作方式相同,因為它是基於文檔的,所以與目標HTML可能應該與我們的DOCX API一致元素出現在結果文檔的頂部。

因此,我們更改了此功能的工作方式,以創建具有所需大小和方向的PDF頁面,目標內容顯示在左上角,與DOCX API一致。

查看最新的博客文章