用户登录  |  傲看软件园 用户注册
文章中心广告代码ASP源码PHP源码JSP源码.NET源码源码相关傲看留言板繁體中文
当前位置:傲看软件园文章中心编程开发网络编程

提取Html内容中的所有图片信息代码

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-01-16 11:13:49

很有意思的一段代码,代码实现对HTML内容中所有图片信息的提取,大家有时间的可以研究一下,完善一下程序。 protected ArrayList GetAList(string HtmlContent)
{
try
{
ArrayList arr = new ArrayList();
HtmlContent = content.Replace(\"\\r\\n\",\"\");
HtmlContent = content.Trim();

string partern = @\"\\<img(.*?)\\>\";//@\"<a (.*)>.*</a> \";//\"<a.*(?=Headline)(.|\\n)*?</a>\";//@\"/<a (.*)>.*<\\/\\a>/ \";


System.Text.RegularExpressions.Regex regex = new System.Text.RegularExpressions.Regex(partern, System.Text.RegularExpressions.RegexOptions.IgnoreCase);


System.Text.RegularExpressions.MatchCollection mc = regex.Matches(HtmlContent);

if(mc.Count <= 0)
return arr;
System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@\"(\'|\"\"|/)?[\\w_()]*(.jpg|.bmp|.gif|.png|.jpeg)\",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

foreach(Match m in mc)
{
System.Text.RegularExpressions.MatchCollection m2 = regex2.Matches(m.ToString());
if( m2.Count > 0 )
{
arr.Add( m2[0].ToString().Substring(1) );
}
}
return arr;

}
catch(Exception ex)
{
throw ex;
}

}
 

Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论

精品栏目导航

关于本站 | 网站帮助 | 广告合作 | 下载声明 | 友情连接 | 网站地图
冀ICP备08004437号 | 客服Q:354766721 | 交流群83228313
傲看软件园 - 绿色软件,破解软件下载站! 源码网 源码之家 绿软之家
Copyright © 2003-2010 OkHan.Net. All Rights Reserved .
页面执行时间:6,093.75000 毫秒
Powered by:OkHan CMS Version 4.0.0 SP2