在webForm中WebRequest/WebClient/WebBrowser获

系统 1752 0

一个小需求,获取远程页面的源码,主要用于抓数据。原来用的好好的,最近突然不能获取页面源码了,但是仍然可以用浏览器正常浏览。(文后附源码下载。^_^)

  经过分析,原来用的代码如下:



查了下资料,原来需要加参数。




修正后的代码如下:



问题是解决了,后来再想了想,可以用WebClient先把页面download到本地临时文件,再读取文本内容。

代码如下:





结果不能获取源码。错误如下:

再想想,还有Webbrowser控件可以用啊。在WinFrom下只要在主线程前加[STAThread]即可。




在WebForm就麻烦些了,出现错误, 线程不在单线程单元中,故无法实例化ActiveX控件“8856f961-340a-11d0-a96b-00c04fd705a2”



代码如下:

后来搜索N小时(N>=5)后,终于找到可行解决方案,在WebPage页面头部加入 AspCompat="true"

即<%@ Page Language="C#" AspCompat="true" ******/>

MSDN给出的解释是:
在 ASP .NET 网页的 <%@Page> 标记中包含兼容性属性 aspcompat=true,如 <%@Page aspcompat=true Language=VB%>。使用此属性将强制网页以 STA 模式执行,从而确保您的组件可以继续正确运行。如果试图使用 STA 组件但没有指定此标记,运行时将会发生异常情况。

将此属性的值设置为 true 时,将允许网页调用 COM+ 1.0 组件,该组件需要访问非管理的 ASP 内置对象。可以通过 ObjectContext 对象进行访问。

如果将此标记的值设为 true,性能会稍微有些下降。建议只在确实需要时才这样做。


终于可以了! 不知道有没有更好的方法??







附: 源码下载。

邀月注:

如果不能测试,请注意是否在域(AD)环境下,如果是! 请注意设置代理和防火墙
请参考:
http://dev.csdn.net/article/83914.shtm

http://blog.csdn.net/downmoon/archive/2006/04/14/663337.aspx

http://www.cnblogs.com/downmoon/archive/2007/12/29/1019701.html

在webForm中WebRequest/WebClient/WebBrowser获取远程页面源码的三种方式(downmoon)


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论