Excel精英培训网

 找回密码
 注册
数据透视表40+个常用小技巧,让你一次学会!
查看: 330715|回复: 1010

[分享] VBA提取网页数据的四种方法

  [复制链接]
发表于 2008-2-25 04:49 | 显示全部楼层 |阅读模式
本帖最后由 爱疯 于 2019-4-12 18:25 编辑

<>嗯,是398部长交给我的一个小练习,发上来共享一下,之后就等398部长来解说吧。 <>一共做了4个方法,期间多谢八月梦游的帮助和提点。 <>题目是提取以下网页里的店铺名称和地址:(没做提取多页的,偷懒[em04]) <>http://bendi.koubei.com/search/searchstore.html?option.cityname=%CE%C2%D6%DD&option.category=4&option.distance=2000&pageNo=1 <>1. XMLHTTP对象,速度不错,受网页源代码改变影响,但是处理网页源文件最方便自由。 <>2. InternetExplorer对象,速度一般,受网页源代码改变影响,还需要激活IE,不喜欢。 <>3. QueryTables对象,平均速度最快,而且基本不受网页源代码改变影响,就是想获取多页数据的时候麻烦,而且多了一个web查询区域需要删除。 <>4. WebBrowser对象,第一次速度次于XMLHTTP,之后就很快,受网页源代码改变影响,原理同InternetExplorer,就是多了个控件在工作表上不好看,只能靠缩小控件来隐藏。 <>4种方法各有优劣,看实际情况来选取合适的方法了。 <>个人觉得网页提取数据,没有什么技巧可言,归根到底,原理基本都是提取网页的源代码然后进行分析处理。 在VBA里,可能用字符串处理的办法更容易理解,其实也可以用获取网页元素的办法,例如第2和第4种方法,就用了一些这样的技巧,但由于对网页的元素不太熟悉,因此如果要方便的方法,还需要多了解网页的结构和代码才行了。 PS:记得看我家耗子写的火狐浏览器脚本,似乎也只能用枚举办法列出不同网页其源码的共同地方来写,想100%通用似乎很难啊。 第一次附件: 8yEsMVej.rar (25.12 KB, 下载次数: 3388) ===================================== 由于网页源码有所改变,08-7-14日重新修改后上传。 8yEsMVej.rar (25.12 KB, 下载次数: 3777)

评分

参与人数 4 +10 学分 +3 收起 理由
liguolin + 3
hjg8822 + 1
catluna + 1 很给力
sunjing-zxl + 8 学习了

查看全部评分

excel精英培训的微信平台,每天都会发送excel学习教程和资料。扫一扫明天就可以收到新教程
发表于 2008-2-25 04:52 | 显示全部楼层
回复

使用道具 举报

发表于 2008-2-25 07:55 | 显示全部楼层
回复

使用道具 举报

发表于 2008-2-25 08:06 | 显示全部楼层

下载看看,能学多少就学多少!

学不了多少,就QOPY多少!

回复

使用道具 举报

发表于 2008-2-25 08:13 | 显示全部楼层

第一种方法出错,是什么原因?

 

[分享]VBA提取网页数据(4种方法)

[分享]VBA提取网页数据(4种方法)


[分享]VBA提取网页数据(4种方法)

[分享]VBA提取网页数据(4种方法)

回复

使用道具 举报

发表于 2008-2-25 08:47 | 显示全部楼层

雨版的动作好快啊!就试用出问题来了! [em17]

我也遇到同样的问题?!  

[此贴子已经被作者于2008-2-25 9:16:26编辑过]
回复

使用道具 举报

发表于 2008-2-25 09:19 | 显示全部楼层

学习了。
回复

使用道具 举报

发表于 2008-2-25 09:21 | 显示全部楼层

只有第1种方法出现那种错误,其他的都很正常,好好消化一下。
回复

使用道具 举报

 楼主| 发表于 2008-2-25 10:42 | 显示全部楼层

问题很奇怪啊,我之前运行得好好的。。。

修改了一下,重新上传了一个附件,应该没问题了。

回复

使用道具 举报

发表于 2008-2-25 11:19 | 显示全部楼层

学习一下,比较有实用价值啊

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|Excel精英培训 ( 豫ICP备11015029号 )

GMT+8, 2024-4-26 16:33 , Processed in 0.414259 second(s), 9 queries , Gzip On, Yac On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表