• <menu id="w2i4a"></menu>
  • logo Spire.PDF教程

    文檔首頁>>Spire.PDF教程>>Spire.PDF 提取和讀取教程:C# 如何提取 PDF 文檔中的文本和圖片

    Spire.PDF 提取和讀取教程:C# 如何提取 PDF 文檔中的文本和圖片


    Spire.PDF是一個專業(yè)的PDF組件,能夠獨立地創(chuàng)建、編寫、編輯、操作和閱讀PDF文件,支持 .NET、Java、WPF和Silverlight。

    下載Spire.PDF最新試用版

    文本和圖片是PDF文檔的重要組成部分。本文將介紹如何通過編程的方式使用Spire.PDF C#獲取PDF文檔中的文本和圖片并保存到本地路徑。

    提取PDF文檔中的文本

    //實例化一個PdfDocument對象
    PdfDocument doc = new PdfDocument();
    
    //加載PDF文檔
    doc.LoadFromFile("測試文檔.pdf");
    
    //實例化一個StringBuilder 對象
    StringBuilder content = new StringBuilder();
    
    //提取PDF所有頁面的文本
    foreach (PdfPageBase page in doc.Pages)
    {
        content.Append(page.ExtractText());
    }
    
    //將提取到的文本寫為.txt格式并保存到本地路徑
    String fileName = "獲取文本.txt";
    File.WriteAllText(fileName, content.ToString());

    提取 PDF 文檔中的圖片

    //加載PDF文檔
    PdfDocument doc = new PdfDocument();
    doc.LoadFromFile("測試文檔.pdf");
    
    ListListImage = new List();
    
    for (int i = 0; i < doc.Pages.Count; i++)
    {
        // 實例化一個Spire.Pdf.PdfPageBase對象
    PdfPageBase page = doc.Pages[i];
    
        // 獲取所有pages里面的圖片
        Image[] images = page.ExtractImages();
        if (images != null && images.Length > 0)
        {
            ListImage.AddRange(images);
        }
    
    }
    
    // 將提取到的圖片保存到本地路徑
    if (ListImage.Count > 0)
    {
        for (int i = 0; i < ListImage.Count; i++)
        {
            Image image = ListImage[i];
            image.Save("image" + (i + 1).ToString() + ".png", System.Drawing.Imaging.ImageFormat.Png);
        }
      
    }

    效果圖:

    提取PDF文檔中的文本和圖片

    Spire.PDF還有一套完整的視頻教程:《Spire.PDF通用基礎(chǔ)教學(xué)視頻》,免費學(xué)習(xí)~

    查看冰藍更多產(chǎn)品教程,為你推薦:

    Spire.Doc系列教程>>

    Spire.XLS系列教程>>


    想要購買正版授權(quán),或者獲取更多Spire.PDF相關(guān)信息的朋友可以點擊" 咨詢在線客服 "~

    掃碼咨詢


    添加微信 立即咨詢

    電話咨詢

    客服熱線
    023-68661681

    TOP
    三级成人熟女影院,欧美午夜成人精品视频,亚洲国产成人乱色在线观看,色中色成人论坛 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();