Python爬虫-爬取当日中药材价格数据

news/2024/7/19 11:46:05 标签: python, 爬虫, 开发语言

🎈 博主:一只程序猿子

🎈 博客主页:一只程序猿子 博客主页

🎈 个人介绍:爱好(bushi)编程!

🎈 创作不易:喜欢的话麻烦您点个👍和

🎈 欢迎访问我的主页(点我直达)

🎈 除此之外您还可以通过个人名片联系我

额滴名片儿

 

目录

1.介绍

2.分析

(1)数据来源

(2)找到对应的数据包

(3)查看请求信息

3.爬取流程

4.源码

5.效果展示


1.介绍

        本文将介绍如何编写python爬虫,爬取药通网的中药材市场价格!数据集结合pandas,echarts进行处理分析和可视化,用作学年设计太合适不过了!

2.分析

(1)数据来源

(2)找到对应的数据包

(3)查看请求信息

 

 请求的参数中,只需要修改pageIndex的值,即可实现换页!

3.爬取流程

逐页发送请求,获取服务器返回的数据,然后把数据稍加处理后保存到CSV表格中.

注意:需控制爬取到速度,爬取过快会导致服务器连接超时!

4.源码

python">import csv
import time

import requests
from yaotongwang_zhongyao_price.settings import cookies, headers
from lxml import etree
import pandas as pd


# 1.获取当前页面中的所有中药材价格
def get_zhongyao_price(page):
	# 定义请求参数
	global data
	params = {
		'random': '0.35934104418089574',
		'ycnam': '',
		'market': '1',
		'leibie': '',
		'istoday': '0',
		'spices': '',
		'tea': '',
		'logo_flg': '',
		'paramName': '',
		'paramValue': '',
		'pageIndex': page,
		'pageSize': '20',
	}

	response = requests.get(
		'https://www.yt1998.com/price/nowDayPriceQ!getPriceList.do',
		params=params,
		cookies=cookies,
		headers=headers,
	)

	if response.json()['msg'] == '获取成功':
		items = response.json()['data']
		# 定义空列表存放中药材信息
		data = []
			zhongyao_info_dict['月对比'] = item['yueduibi']
			zhongyao_info_dict['市场'] = item['shichang']
			zhongyao_info_dict['统计时间'] = item['dtm']

			data.append(zhongyao_info_dict)

	else:
		print('暂未获取到当前页面的内容!')

	return data


def save_to_csv(data):
	# 定义文件路径
	file_path = './data/今日中药材价格1.csv'

	with open(file_path, 'a', encoding='utf-8', newline='') as csvfile:
		fieldnames = ['名称', '规格', '产地', '价格(元/kg)', '走势', '月对比', '市场', '统计时间']  # 列名
		writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

		# 写入数据
		writer.writerows(data)


# 主程序
def main():
	for i in range(4):
		save_to_csv(get_zhongyao_price(i))
		if i < 3:
			print(f'第 {i} 页已保存, 休息2秒后继续...')
			time.sleep(2)
		else:
			print(f'第 {i} 页已保存, 爬虫运行完成...')


# 主控制程序
if __name__ == '__main__':
	main()

setting.py:

python"># 定义cookie
cookies = {
    '换成你自己的'
}

# 定义请求头
headers = {
	'authority': 'www.yt1998.com',
	'accept': 'application/json, text/javascript, */*; q=0.01',
	'accept-language': 'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6',
	'content-type': 'application/Json',
	'referer': 'https://www.yt1998.com/priceInfo.html',
	'sec-ch-ua': '"Not_A Brand";v="8", "Chromium";v="120", "Microsoft Edge";v="120"',
	'sec-ch-ua-mobile': '?0',
	'sec-ch-ua-platform': '"Windows"',
	'sec-fetch-dest': 'empty',
	'sec-fetch-mode': 'cors',
	'sec-fetch-site': 'same-origin',
	'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0',
	'x-requested-with': 'XMLHttpRequest',
}

        篇幅有限,仅提供部分源码,完整源码请通过我的个人名片联系我获取!

5.效果展示

         这么一套操作下来,数据就被保存到本地了!打完收工!

 


http://www.niftyadmin.cn/n/5300903.html

相关文章

centos 安装 qtCreator

centos 安装 qtCreator 可以源码编译安装也可以在线安装&#xff0c;建议是在线安装&#xff0c;比较简单。编译安装可能会遇到很多依赖库没有的问题&#xff0c;还要安装依赖。   程序员可以试试源码安装&#xff0c;对 centos 多一些了解 1. 源码编译安装 源码安装的版本…

Redis(二)数据类型

文章目录 官网备注十大数据类型StringListHashSetZSetBitmapHyperLogLog&#xff1a;GEOStreamBitfield 官网 英文&#xff1a;https://redis.io/commands/ 中文&#xff1a;http://www.redis.cn/commands.html 备注 命令不区分大小写&#xff0c;key区分大小写帮助命令help…

一个人能不能快速搭建一套微服务环境

一、背景 大型软件系统的开发现在往往需要多人的协助&#xff0c;特别是前后端分离的情况下下&#xff0c;分工越来越细&#xff0c;那么一个人是否也能快速搭建一套微服务系统呢&#xff1f; 答案是能的。看我是怎么操作的吧。 二、搭建过程 1、首先需要一套逆向代码生成工…

Router 面试题及答案

Router 面试题及答案 什么是前端路由&#xff08;Front-End Router&#xff09;&#xff1f;它的作用是什么&#xff1f; 答案&#xff1a; 前端路由是指在单页面应用&#xff08;SPA&#xff09;中&#xff0c;通过 JavaScript 在浏览器端实现的一种页面跳转方式。它通过监听 …

Text visualization : pipeline,wordle,phrase net,word tree

Text visualization&#xff08;文本可视化&#xff09;是一种将文本数据转换为可视形式的技术&#xff0c;以便更好地理解和分析文本内容。以下是可能会涉及的几个知识点&#xff1a; 1. Pipeline&#xff08;流程图&#xff09;&#xff1a;Pipeline是指将文本可视化的过程划…

centos 编译安装 git

centos 编译安装 git 需要的依赖 一定要先安装 zlib-devel, 不知道为什么一定要 zlib-devel, 我手动编译安装了 zlib, 并配置好了路径。但是没有用&#xff0c;还是提示找不到 <zlib.h>&#xff0c;最后没办法&#xff0c;还是安装 zlib-devel yum install zlib-devel编…

【docker】安装 Redis

查看可用的 redis版本 docker search redis拉取 redis最新镜像 docker pull redis:latest查看本地镜像 docker images创建挂在文件 mkdir -pv /test1/docker_volume/redis/datamkdir -pv /test1/docker_volume/redis/confcd /test1/docker_volume/redis/conf/touch redis.con…

开源数据可视化分析工具DataEase本地部署并实现远程访问

目录 前言 1. 安装DataEase 2. 本地访问测试 3. 安装 cpolar内网穿透软件 4. 配置DataEase公网访问地址 5. 公网远程访问Data Ease 6. 固定Data Ease公网地址 结语 作者简介&#xff1a; 懒大王敲代码&#xff0c;计算机专业应届生 今天给大家聊聊开源数据可视化分析工…