掃描識別工具Dynamic Web TWAIN使用教程:OCR(上)
Dynamic Web TWAIN是一個專為Web應用程序設計的TWAIN掃描識別控件。你只需在TWAIN接口寫幾行代碼,就可以用兼容TWAIN的掃描儀掃描文檔或從數(shù)碼相機/采集卡中獲取圖像。然后用戶可以編輯圖像并將圖像保存為多種格式, 用戶可保存圖像到遠程數(shù)據(jù)庫或者SharePoint。這個TWAIN控件還支持上傳和處理本地圖像。
在Web應用程序中快速實現(xiàn)文本識別
介紹
在文檔數(shù)字化的過程中,經(jīng)常需要從所獲取的圖像中提取所需的信息。光學字符識別(OCR)是可以實現(xiàn)此需求的技術。在本文中,我們將探討如何使用Dynamic Web TWAIN及其OCR加載項在瀏覽器中快速掃描和識別文本。
請注意:在本文我們只討論基礎的OCR引擎,我們將在客戶端使用它。引擎也可以在服務器端使用。
環(huán)境
OCR模塊本身不依賴于Node.js,本文中需要它只是因為使用其包管理器(npm)獲取所需文件的速度更快。
步驟
步驟1 創(chuàng)建一個新目錄,打開命令行工具(快捷鍵是Ctrl + Shift +右鍵單擊)。通過npm下載本文中使用的核心控件
npm install dwt@14.2.0
然后,你可以在此目錄中看到以下內(nèi)容
步驟2 打開以下目錄
node_modules\dwt\sample
在此你可以看到
步驟3 在本文中,我們將檢查OCRADocument.html。雙擊它打開。如果相關控件尚不可用,請按照提示進行安裝
在正常情況下,可以在C:\Windows\SysWOW64\Dynamsoft\DynamsoftService目錄中找到已安裝的文件。這里的核心文件主要是:
- DynamsoftService.exe
- dwt_trial_14.1.0.0828.dll
- DynamicOCR.dll
- /DynamicOCR/
步驟4 安裝完成后,刷新頁面,單擊Scan Documents(本地需要掃描儀)或Load Images or PDFs以掃描或加載帶有英文文本的本地圖像文件。然后單擊OCR An Image with English。 然后,圖像的識別結果將顯示在右側的結果框中
下一篇文章將與大家分享如何實現(xiàn)上述功能,敬請期待~