C#从HTML代码中提取文本内容

发布于:2014年10月07日    浏览:8123 次    属于:软件开发 > C#程序开发 原创作者:张晓栋

 

从HTML代码中提取文本内容,常用作截取文章内容做摘要,本方法只要传入string类型的HTML编码即可处理并返回HTML中的文本内容,筛选掉所有的HTML标记。


    public static string NoHTML(string Htmlstring)
    {

        //删除脚本

        Htmlstring = Regex.Replace(Htmlstring, @"