文檔首頁>>Spire.PDF教程>>Spire.PDF 提取和讀取教程:C# 從 PDF 頁面的指定區(qū)域內(nèi)提取文本
Spire.PDF 提取和讀取教程:C# 從 PDF 頁面的指定區(qū)域內(nèi)提取文本
Spire.PDF是一個(gè)專業(yè)的PDF組件,能夠獨(dú)立地創(chuàng)建、編寫、編輯、操作和閱讀PDF文件,支持 .NET、Java、WPF和Silverlight。
有時(shí)我們可能需要獲取PDF頁面中某個(gè)區(qū)域內(nèi)的文本而不是全部的文本。本文將介紹如何使用Spire.PDF組件提取PDF頁面中指定矩形區(qū)域內(nèi)的文本。
以下是我們所使用的示例文檔截圖,紅色矩形區(qū)域是即將提取文本的區(qū)域。
代碼段:
//創(chuàng)建PdfDocument實(shí)例 PdfDocument pdf = new PdfDocument(); //加載PDF文檔 pdf.LoadFromFile("Input.pdf"); //獲取第一頁 PdfPageBase page = pdf.Pages[0]; //從第一頁的指定矩形區(qū)域內(nèi)提取文本 string text = page.ExtractText(new RectangleF(50, 50, 500, 100) ); //將文本寫入.txt文件 StringBuilder sb = new StringBuilder(); sb.AppendLine(text); File.WriteAllText("Extract.txt", sb.ToString());
效果圖:
Spire.PDF還有一套完整的視頻教程:《Spire.PDF通用基礎(chǔ)教學(xué)視頻》,免費(fèi)學(xué)習(xí)~
查看冰藍(lán)更多產(chǎn)品教程,為你推薦: