使用RegularExpressions去除HTML标签的字符串

悟静 2012-09-22

展开全文

网友要求做一个文章摘要，由于文章包含有Html标签，在截取文章头200个字符串时，得到的字符串将是一些意想不到的结果。因此让Insus.NET为他解决去除html标签，然后再从去除Html标签之后的结果截取200个字符串。

实现这个功能，可以使用RegularExpressions正则表达式：

. 匹配除 "\n" 之外的任何单个字符。

* 匹配前面的子表达式零次或多次。

匹配前面的子表达式零次或一次。

因此只要把文章的"<.*?>"替换为String.Empty即可。

接下来，Insus.NET写一个函数，在写函数之前，先引用一个命名空间：

using System.Text.RegularExpressions;

函数：

public static string RemoveHtmlTag(string articleString)
    {
        return Regex.Replace(articleString, "<.*?>", string.Empty);
    }

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：悟静 > 《.net和asp.net》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

悟静

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换