掃描識別工具Dynamic Web TWAIN使用教程:PDF光柵化
使用PDF Rasterizer快速將PDF轉(zhuǎn)換為圖像
介紹
PDF是市場上最流行的格式之一。在大多數(shù)情況下,PDF文件是可讀的,這意味著它們在內(nèi)部包含文本內(nèi)容。將其轉(zhuǎn)換為圖像的一種方法是截取頁面的屏幕截圖。但是,這種方式是非常低效的。通過使用PDF Rasterizer,你可以快速完成將PDF轉(zhuǎn)換為圖像。
環(huán)境
注意:PDF Rasterizer本身不依賴Node.js,本文中需要它只是因為我們使用其包管理器(npm)來獲取所需文件的速度更快。
步驟
1.創(chuàng)建一個新目錄,打開命令行工具(快捷方式Ctrl+Shift+right click)。通過npm下載本文中使用的核心控件。
npm install dwt@14.2.0
然后,你可以在此目錄中看到以下內(nèi)容
2.打開以下目錄
node_modules\dwt\sample
在這你可以看到
3.在本文中,我們將檢查PDFRasterizer.html。雙擊它打開。如果相關控件尚不可用,請按照提示進行安裝。
正常情況下,可以在C:\Windows\SysWOW64\Dynamsoft\DynamsoftService目錄中找到已安裝的文件。這里的核心文件主要是
DynamsoftService.exe
dwt_trial_14.1.0.0828.dll
DynamicPdf_10.3.0.0712.dll
4.安裝完成后,刷新頁面,單擊第二個按鈕并打開本地PDF文件。很快,該PDF文件將在頁面上的圖像查看器中顯示為圖像。
此時,你可以打開瀏覽器的開發(fā)人員界面(F12)并嘗試執(zhí)行以下代碼,該代碼允許你一次查看多個圖像。
DWObject.SetViewMode(3,3);
你還可以保存這些圖片到本地磁盤(格式如JPEG,BMP,PNG,TIF等)
DWObject.IfShowFileDialog = true; DWObject.SaveAsJPEG('');
接下來按照以下步驟操作
在文本編輯器中打開PDFRasterizer.html
引用Core JavaScript文件
<script type="text/javascript" src="../dist/dynamsoft.webtwain.initiate.js"></script> <script type="text/javascript" src="../dist/dynamsoft.webtwain.config.js"></script> <script type="text/javascript" src="../dist/addon/dynamsoft.webtwain.addon.pdf.js"></script>
這里引用的文件是
JS庫為核心SDK Dynamic Web TWAIN
node_modules\dwt\dist\dynamsoft.webtwain.initiate.js
node_modules\dwt\dist\dynamsoft.webtwain.config.js
JS庫為 PDF Rasterizer addon
node_modules\dwt\dist\addon\dynamsoft.webtwain.addon.pdf.js
如果以前在本地安裝了Dynamic Web TWAIN,則相同的文件位于以下目錄中。
C:\Program Files (x86)\Dynamsoft\Dynamic Web TWAIN SDK {version number} {Trial}\Resources
運行時安裝必要的文件
打開頁面時,JavaScript文件會嘗試設置運行時環(huán)境。如果缺少本地Dynamsoft服務和包含Dynamic Web TWAIN和PDF Rasterizer的庫文件,代碼將顯示提示(步驟3),以便你可以下載和安裝文件。
使用插件
if (DWObject.Addon && DWObject.Addon.PDF) { DWObject.Addon.PDF.SetResolution(300); DWObject.Addon.PDF.SetConvertMode(EnumDWT_ConvertMode.CM_RENDERALL); } DWObject.LoadImageEx('', 5, function () { }, function (errorCode, errorString) { alert('Load Image:' + errorString); } );
核心代碼是
DWObject.Addon.PDF.SetResolution(300); //Set the resolution for the conversion DWObject.Addon.PDF.SetConvertMode(EnumDWT_ConvertMode.CM_RENDERALL);//Set the conversion mode, generally just set it to CM_RENDERALL
完成上述設置后,通過調(diào)用LoadImage,LoadImageEx,HTTPDownload等方法之一導入的PDF文件,PDF Rasterizer會自動地將文件光柵化為圖像。