將 HTML 轉(zhuǎn)換為 XML
Office Open 成為在 Web 上交付結(jié)構(gòu)化數(shù)據(jù)的首選技術(shù),與 HTML 攜手并進(jìn)并完全補(bǔ)充 HTML。因此,我們需要在工作的某個(gè)時(shí)間點(diǎn)將 HTML 轉(zhuǎn)換為 Office OpenXML。本文主要通過一個(gè)專業(yè)的Word .NET 庫(kù)Spire.Doc來講述轉(zhuǎn)換過程。
這篇文章仍然專注于將word從/到HTML,而主要是關(guān)于在word文檔和HTML中嵌入圖像的支持。隨著Spire.Doc的改進(jìn)(從Spire.Doc V. 4.9.32開始),現(xiàn)在它支持ImageEmbedded的新功能。
首先我們需要完成程序前的準(zhǔn)備工作:
- 下載 Spire.Doc并將其安裝在您的機(jī)器上。
- 添加 Spire.Doc.dll 文件作為參考。
- 打開bin文件夾,選擇.NET 4.0下的三個(gè)dll文件。
- 右鍵單擊屬性并在其菜單中選擇屬性。
- 將目標(biāo)框架設(shè)置為 .NET 4。
-
添加 Spire.Doc 作為命名空間。
以下步驟將向您展示如何輕松做到這一點(diǎn):
第 1 步:創(chuàng)建一個(gè) Word 文檔。[C#]
Document doc = new Document();
第 2 步:加載 HTML 文件。
[C#]
doc.LoadFromFile("Sample.html");
第 3 步:將 HTML 保存為 XML 文件。
[C#]
doc.SaveToFile("test.xml", FileFormat.Xml);
這是完整的 C# 和 VB.NET 代碼
[C#]
using Spire.Doc; namespace HTMLXML { class Program { static void Main(string[] args) { Document doc = new Document(); doc.LoadFromFile("Sample.html"); doc.SaveToFile("test.xml", FileFormat.Xml); } } }
[VB.NET]
Imports Spire.Doc Namespace HTMLXML Class Program Private Shared Sub Main(args As String()) Dim doc As New Document() doc.LoadFromFile("Sample.html") doc.SaveToFile("test.xml", FileFormat.Xml) End Sub End Class End Namespace
原始 HTML 文件的預(yù)覽。
生成的 Office OpenXML 文件的預(yù)覽。