文檔首頁>>TX Text Control for Winform用戶指南>>導(dǎo)入Adobe PDF格式文檔
導(dǎo)入Adobe PDF格式文檔
TX Text Control .NET for WinForm - 導(dǎo)入Adobe PDF格式文檔
對于您過去存留的PDF文檔,即使沒有當(dāng)時(shí)用于導(dǎo)出該P(yáng)DF的原文件,您仍然可以將該P(yáng)DF文件導(dǎo)入到TX Text Control .NET 中并自由地進(jìn)行編輯,并將編輯過的文檔保存成控件支持的各類格式文件。
從導(dǎo)入的PDF文件中計(jì)算頁面布局是個(gè)技術(shù)活,PDF文件中包含大量的關(guān)于頁面外觀的信息,但不一定會有關(guān)于字體和嵌入其中的圖片的相關(guān)信息,這又是讓布局計(jì)算變得棘手。
另外,PDF文件中沒有關(guān)于文本順序,文本流的信息,連一段文字屬于標(biāo)題還是表格元素都沒有進(jìn)行標(biāo)注。當(dāng)然,最新的PDF規(guī)范中添加了這方面的內(nèi)容(帶段落標(biāo)記PDF),但是這種PDF文件還沒得到廣泛使用。
TX Text Control .NET把能夠查找的到的文本都進(jìn)行提取和整理,添加缺失的空格和換行符并重排相應(yīng)的文本與圖片的次序,以確保文檔排版符合其邏輯順序。
控件提供以下三個(gè)參數(shù)向負(fù)責(zé)導(dǎo)入PDF文件的相應(yīng)過濾器傳遞命令:
GenerateLines:該參數(shù)表示被導(dǎo)入文檔是基于單行文本的,每行末尾有換行符。該參數(shù)適合大多數(shù)情況,除非您需要處理的PDF文檔的文本內(nèi)容中包含更多信息需要進(jìn)一步處理。
GenerateParagraphs:該參數(shù)表示文檔中由多個(gè)行組成各個(gè)段落。使用該參數(shù)可以免去導(dǎo)入后很多的細(xì)節(jié)調(diào)整工作,在導(dǎo)入像法律合同之類的大文件時(shí)尤其適用。
GenerateTextFrames:該參數(shù)表示將導(dǎo)入的文本及圖片保持其在PDF文件中的原排版效果。使用該參數(shù)能產(chǎn)生與原始PDF文件最接近的效果。
功能支持
以下 TX Text Control .NET for Windows Forms 控件產(chǎn)品中對該功能提供了支持:
- TX Text Control .NET for Windows Forms Professional
- TX Text Control .NET for Windows Forms Enterprise