• <menu id="w2i4a"></menu>
  • logo E-iceblue中文文檔

    文檔首頁(yè)>>E-iceblue中文文檔>>從 Word 文檔中提取文本

    從 Word 文檔中提取文本


    Word 文本可以從文檔中提取并保存在其他文件(例如 TXT 文件)中以供其他用途。本指南將提供一種在 C# 和 VB.NET 中提取 Word 文本的便捷解決方案。

    Spire.Doc for.NET 最新下載

    一般來說,一個(gè)Word文檔必須包含很多內(nèi)容,比如文本、圖片、表格等,其中一些內(nèi)容可以提取出來用于其他文檔或文件中。以下指南重點(diǎn)介紹如何通過 Spire.Doc for .NET 從 Word 文檔中提取文本并保存在 C# 和 VB.NET 中的 TXT 文件中。以下屏幕截圖顯示了從 Word 中提取的部分文本。

    提取文字

    文本全部保存在 .NET 提供的 Section 類 Spire.Doc 的 Paragraph 中。因此,您必須先獲取文檔的部分和段落,然后再獲取要提取的文本。以下步驟介紹了有關(guān)如何提取文本的詳細(xì)信息。

    首先,使用參數(shù)字符串fileName調(diào)用Document類的LoadFromFile方法來加載文檔。其次,初始化一個(gè) StringBuilder 類實(shí)例來保存接下來要提取的文本。第三,使用 foreach 語句獲取文檔中每個(gè)部分的每個(gè)段落,并調(diào)用StringBuilder 類的AppendLine(Paragraph.Text)方法將所有提取的字符串(所有段落中的文本)的副本附加到 StringBuilder 實(shí)例中。最后,使用參數(shù)字符串路徑、字符串內(nèi)容調(diào)用 File.WriteAllText 方法來創(chuàng)建一個(gè)新文件以保存提取的文本。請(qǐng)使用代碼。

    [C#]
    using Spire.Doc;
    using Spire.Doc.Documents;
    using System.Text;
    using System.IO;
    
    namespace ExtractTextfromWord
    {
    class ExtractText
    {
    static void Main(string[] args)
    {
    //Load Document
    Document document = new Document();
    document.LoadFromFile(@"E:\Work\Documents\WordDocuments\Spire.Doc for .NET.docx");
    
    //Initialzie StringBuilder Instance
    StringBuilder sb = new StringBuilder();
    
    //Extract Text from Word and Save to StringBuilder Instance
    foreach (Section section in document.Sections)
    {
    foreach (Paragraph paragraph in section.Paragraphs)
    {
    sb.AppendLine(paragraph.Text);
    }
    }
    
    //Create a New TXT File to Save Extracted Text
    File.WriteAllText("Extract.txt", sb.ToString());
    System.Diagnostics.Process.Start("ExtractText.txt");
    }
    }
    }

    [VB]

    Imports Spire.Doc
    Imports Spire.Doc.Documents
    Imports System.Text
    Imports System.IO
    
    Namespace ExtractTextfromWord
    Friend Class ExtractText
    Shared Sub Main(ByVal args() As String)
    'Load Document
    Dim document As New Document()
    document.LoadFromFile("E:\Work\Documents\WordDocuments\Spire.Doc for .NET.docx")
    
    'Initialzie StringBuilder Instance
    Dim sb As New StringBuilder()
    
    'Extract Text from Word and Save to StringBuilder Instance
    For Each section As Section In document.Sections
    For Each paragraph As Paragraph In section.Paragraphs
    sb.AppendLine(paragraph.Text)
    Next paragraph
    Next section
    
    'Create a New TXT File to Save Extracted Text
    File.WriteAllText("Extract.txt", sb.ToString())
    System.Diagnostics.Process.Start("ExtractText.txt")
    End Sub
    End Class
    End Namespace

    Spire.Doc 是無需自動(dòng)化即可操作 MS Word 文檔的專業(yè)獨(dú)立組件,使開發(fā)人員能夠在其 .NET、WPF 和 Silverlight 應(yīng)用程序上生成、讀取、寫入、修改 Word 文檔。

    掃碼咨詢


    添加微信 立即咨詢

    電話咨詢

    客服熱線
    023-68661681

    TOP
    三级成人熟女影院,欧美午夜成人精品视频,亚洲国产成人乱色在线观看,色中色成人论坛 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();