本文介绍使用spire.pdf for .net 将pdf转为html的方法。将html转为pdf可参考这篇文章。
c#
using spire.pdf;
namespace pdftohtml
{
class program
{
static void main(string[] args)
{
//加载pdf文档
pdfdocument pdf = new pdfdocument();
pdf.loadfromfile("sample.pdf");
//调用方法将文件保存为html
pdf.savetofile("tohtml.html", fileformat.html);
system.diagnostics.process.start("tohtml.html");
}
}
}
vb.net
imports spire.pdf
namespace pdftohtml
class program
private shared sub main(args as string())
'加载pdf文档
dim pdf as new pdfdocument()
pdf.loadfromfile("sample.pdf")
'调用方法将文件保存为html
pdf.savetofile("tohtml.html", fileformat.html)
system.diagnostics.process.start("tohtml.html")
end sub
end class
end namespace
转换结果: