目录
excel%20%E7%88%AC%E8%99%AB-toc" style="margin-left:0px;">1 什么是excel 爬虫
2 EXCEL爬虫
excel%20%E7%88%AC%E8%99%AB%E7%9A%84%E5%85%A5%E5%8F%A3-toc" style="margin-left:40px;">2.1 excel 爬虫的入口
2.2 需要配置的信息
2.2.1 如何获得 ua信息
2.3 获取的信息
2.3.1 获取信息的基本内容
2.3.2 获取过程
2.3.3 我们只用关注“表视图 ” 即可
excel%E9%87%8C-toc" style="margin-left:40px;">2.4 EXCEL获得的爬虫数据 加载到excel里
excel%E8%A1%A8%E5%90%8E%E5%8F%AF%E4%BB%A5%E5%8A%A0%E5%B7%A5-toc" style="margin-left:40px;">2.5 数据到了excel表后可以加工
excel%E9%87%8C%E7%9A%84%20%E7%88%AC%E8%99%ABtable%E6%95%B0%E6%8D%AE%E5%91%A2%EF%BC%9F-toc" style="margin-left:40px;">2.6 如何处理已经下载到excel里的 爬虫table数据呢?
2.6.1 点击 “查询和连接” 或者 “现有链接” 可以重新呼出 table0 等原始的下载数据表和链接(右键呼出属性)
2.6.2 右键table对应区域,选择 “从表格/区域 获取数据” 可以重新打开 power query来处理数据
2.7 设置table表自动更新
2.7.1 设置自动更新
2.7.2 自动更新作用
excel%20%E7%88%AC%E8%99%AB">1 什么是excel 爬虫
好处:
2 EXCEL爬虫
excel%20%E7%88%AC%E8%99%AB%E7%9A%84%E5%85%A5%E5%8F%A3">2.1 excel 爬虫的入口
2.2 需要配置的信息
- url
- 网页请求相关,比如 ua,cookies 等 headers信息
- 然后点击确定即可
2.2.1 如何获得 ua信息
- 网页检查
- 刷新网页
- 网页url对应的选项
- networks /request headers 可以找到 UA信息 User-Agent:
2.3 获取的信息
2.3.1 获取信息的基本内容
2.3.2 获取过程
- 快的网页一瞬间就完成了
- 如果反映慢则可能看到如下过程
- 正在连接url
- 获取数据
- 数据下载完成
2.3.3 我们只用关注“表视图 ” 即可
- 表视图
- web视图,没啥用
excel%E9%87%8C">2.4 EXCEL获得的爬虫数据 加载到excel里
excel%E8%A1%A8%E5%90%8E%E5%8F%AF%E4%BB%A5%E5%8A%A0%E5%B7%A5">2.5 数据到了excel表后可以加工
- 数据到了excel表后可以加工
- 也可以使用 power query 加工(暂时不熟悉,留白)
excel%E9%87%8C%E7%9A%84%20%E7%88%AC%E8%99%ABtable%E6%95%B0%E6%8D%AE%E5%91%A2%EF%BC%9F">2.6 如何处理已经下载到excel里的 爬虫table数据呢?
2.6.1 点击 “查询和连接” 或者 “现有链接” 可以重新呼出 table0 等原始的下载数据表和链接(右键呼出属性)
2.6.2 右键table对应区域,选择 “从表格/区域 获取数据” 可以重新打开 power query来处理数据
- 入口:右键table对应区域,选择 “从表格/区域 获取数据” 可以重新打开 power query来处理数据
- 左上角 侧边栏 会显示多个爬取的table0 表(默认下载的表名)
- 右下角会显示 爬取的时间
2.7 设置table表自动更新
2.7.1 设置自动更新
-
点击 “查询和连接” 或者 “现有链接” 可以重新呼出 table0
-
然后,点击右边侧边栏的table0 右键呼出属性
-
属性窗口里的设置
2.7.2 自动更新作用
- 可以定时,循环监控网页内容,爬取下来