分享

关于 c#把word文档转换成html后取出html文件中的内容的问题【中国IT软件知识库...

 素行 2007-04-01
有人通过下面这种方法将word转为html,
private void Page_Load(object sender, System.EventArgs e)
 {
  // 在此处放置用户代码以初始化页面
    Word.ApplicationClass word = new Word.ApplicationClass();
    Type wordType = word.GetType();
    Word.Documents docs = word.Documents;
    // 打开文件
    Type docsType = docs.GetType();
    object fileName = "d:\\tmp\\aaa.doc";
    Word.Document doc = (Word.Document)docsType.InvokeMember("Open",
    System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] {fileName, true, true});
         
    // 转换格式,另存为
    Type docType = doc.GetType();
    object saveFileName = "d:\\tmp\\aaa.html";
    //下面是Microsoft Word 9 Object Library的写法,如果是10,可能写成:
    //docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,
     null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML});
    ///其它格式:
    ///wdFormatHTML
    ///wdFormatDocument
    ///wdFormatDOSText
    ///wdFormatDOSTextLineBreaks
    ///wdFormatEncodedText
    ///wdFormatRTF
    ///wdFormatTemplate
    ///wdFormatText
    ///wdFormatTextLineBreaks
    ///wdFormatUnicodeText
    docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,
     null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatHTML});
    // 退出 Word
    wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod,
     null, word, null);
}
 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多