分享

C#去除字符串中的HTML,效果就像将HTML复制到记事本一样

 NaturalWill 2014-04-18
  1. /// <summary>  
  2.         /// 去除字符串中的HTML,效果就像将HTML复制到记事本一样  
  3.         /// </summary>  
  4.         /// <param name="Htmlstring"></param>  
  5.         /// <returns></returns>  
  6.         public static string DelHTML(string Htmlstring)//将HTML去除  
  7.         {  
  8.             #region  
  9.             //删除脚本  
  10.   
  11.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  12.   
  13.             //删除HTML  
  14.   
  15.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  16.   
  17.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"([/r/n])[/s]+", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  18.   
  19.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"-->", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  20.   
  21.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"<!--.*", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  22.   
  23.             //Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<A>.*</A>","");  
  24.   
  25.             //Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<[a-zA-Z]*=/.[a-zA-Z]*/?[a-zA-Z]+=/d&/w=%[a-zA-Z]*|[A-Z0-9]","");  
  26.   
  27.   
  28.   
  29.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(quot|#34);", "/"", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  30.   
  31.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(amp|#38);", "&", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  32.   
  33.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(lt|#60);", "<", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  34.   
  35.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(gt|#62);", ">", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  36.   
  37.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  38.   
  39.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(iexcl|#161);", "/xa1", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  40.   
  41.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(cent|#162);", "/xa2", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  42.   
  43.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(pound|#163);", "/xa3", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  44.   
  45.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&(copy|#169);", "/xa9", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  46.   
  47.             Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring, @"&#(/d+);", "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);  
  48.   
  49.   
  50.             Htmlstring.Replace("<", "");  
  51.   
  52.             Htmlstring.Replace(">", "");  
  53.   
  54.             Htmlstring.Replace("/r/n", "");  
  55.   
  56.             //Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();  
  57.             #endregion  
  58.   
  59.   
  60.             return Htmlstring;  
  61.   
  62.         }  

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约