Python爬虫抓取煎蛋(jandan.net)无聊图

news/2024/7/19 9:45:42 标签: python, 爬虫
 1 #!/usr/bin/python
 2 #encoding:utf-8
 3 '''
 4 @python 3.6.1
 5 @author: 1109159477@qq.com
 6 @create date: 20170611
 7 
 8 '''
 9 import requests
10 import urllib
11 import re
12 import os
13 
14 #当前最大页数
15 url='http://jandan.net/pic'
16 data=urllib.request.urlopen(url).read().decode('utf-8')
17 max_page_num=re.findall(r'<span class.*current-comment-page.*?>\[(.*?)\]</span>',data)[1]
18 
19 def download_pic(start_page,stop_page,download_file):
20     for num in range(start_page,stop_page):
21         os.chdir(download_file)#图片保存目录
22         url='http://jandan.net/pic/page-%s' % num
23         data=urllib.request.urlopen(url).read().decode('utf-8')
24         pics=re.findall(r'<a href="//(.*?)" target.*?</a><br />',data, re.I|re.S|re.M)
25         for i in pics:
26             i='http://'+i
27             r=requests.get(i)
28             pic_name=i[28:100]
29             with open(pic_name,'wb') as f:
30                 f.write(r.content)
31                 f.close()
32 
33 if __name__=='__main__':
34     print('当前最大页数为:  %s' % max_page_num)
35     page1,page2=input('请输入要下载页数范围,例如     500,513 :').split(',')  
36     download_pic(int(page1),int(page2),r'C:\Users\samsung\Desktop\jd_pics')
37     

 

转载于:https://www.cnblogs.com/stay-hungry/p/6983341.html


http://www.niftyadmin.cn/n/756096.html

相关文章

使用奥比中光Orbbec Astra Pro在ROS下跑orb_slam2

使用奥比中光Orbbec Astra Pro在ROS下跑orb_slam2一、奥比中光摄像头驱动1. Install ROS&#xff11;) Create a ROS Workspace(if you dont have one)2) Create a .sh documentation2. Install dependences3. Pull the repository into your ROS workspace4.Create astra udev…

计算机语言echo off什么意思,批处理文件的@echo off是什么意思?

echo off关闭回显echo on打开回显echo off并不是DOS程序中的&#xff0c;而是DOS批处理中的。当年的DOS&#xff0c;所有操作都用键盘命令来完成&#xff0c;当你每次都要输入相同的命令时&#xff0c;可以把这么多命令存为一个批处理&#xff0c;从此以后&#xff0c;只要运行…

为布尔方法命名

概念&#xff1a;本文中的”为布尔方法命名”是指假设一个方法带有大量的bool 參数时&#xff0c;能够依据bool 參数的数量。提取出若干个独立的方法来简化參数。正文&#xff1a;我们如今要说的重构并非普通字面意义上的重构&#xff0c;它有非常多值得讨论的地方。当一个方法…

小米科学计算机开立方,小米计算器安卓版_小米计算器怎么开立方_小米科学计算器_易玩网...

软件简介网提供小米计算器app&#xff0c;小米计算器是一款非常好用的安卓手机计算器&#xff0c;小米计算器集普通计算、科学计算、房贷计算、汇率计算、个税计算及单位换算为一体&#xff0c;功能非常强大&#xff0c;感兴趣的朋友快来吧&#xff01;功能介绍【计算过程可编辑…

hdu 2094 产生冠军

本题链接&#xff1a;点击打开链接 本题大意&#xff1a; 有n名队员。已知每名队员打比赛的输赢&#xff0c;问&#xff0c;是否能据此确定冠军。 解题思路&#xff1a; 就是将全部比赛中失败过的做标记&#xff0c;据题知&#xff1a;失败过的就不可能再成为冠军&#xff0c;所…

计算机中丢失PBVM90dll,PB程序“无法启动此程序,因为计算机中丢失PBvm90.dll。尝试重新安装该程序以解决此问题”的解决方法...

因为有计算机自考科目&#xff0c;要求使用PB程序做一个管理系统。昨天刚安装好了PB程序&#xff0c;今天使用的时候&#xff0c;当我打开一个PB程序时&#xff0c;出现了“无法启动此程序&#xff0c;因为计算机中丢失PBvm90.dll。尝试重新安装该程序以解决此问题”的提示&…

视觉SLAM学习笔记(一)——SLAM系统的概述

通过思维导图的形式将《视觉SLAM十四讲》的内容进行整理&#xff0c;以下为SLAM系统的概述的部分。

如何把数据库的properties文件内容读取到Java中

首先在数据库中有properties文件 里面的内容以键值对的方式出现 例如 drivercom.mysql.jdbc.Driver urljdbc:mysql://localhost:3306/test userroot pwd950218 然后设置一个类进行读取里面的driver,url等 例如: public class MasterUtil {private static String url;private st…